Prerequisite 导数与函数极值
,方向导数
1类似一元函数,二元函数的极值与其偏导数密切相关.以下讨论中,我们假设在某区域内二元函数的一阶偏导处处存在(即函数曲面处处光滑).如果二元函数 $f(x,y)$ 在某点 $(x_i, y_i)$ 处对 $x, y$ 的偏导数都为零,那么 $(x_i, y_i)$ 就叫做函数 $f(x,y)$ 的驻点.根据eq. 9 ,驻点处各个方向的方向导数也都为零.
我们先来定义二元函数的极值点,以驻点为圆心在 $xy$ 平面上作一个圆形区域,若当半径足够小时,$f(x_i, y_i)$ 是该圆形区域的最大值或最小值,那么该驻点就是极大值点或极小值点.与一元函数类似,驻点不一定是极值点.例如 $f(x,y) = xy$ 在坐标原点的两个一阶偏导都为零,但原点并不是极值点.为了判断驻点是不是极值点,也需要用到二阶偏导(假设驻点处的各个二阶偏导都存在).如果满足
\begin{equation}
\frac{\partial^{2}{f}}{\partial{x}^{2}} \frac{\partial^{2}{f}}{\partial{y}^{2}} - \left( \frac{\partial^2 f}{\partial x \partial y} \right) ^2 > 0
\end{equation}
则驻点是极值点.如果 $ \partial^{2} f/\partial {x}^{2} $ 和 $ \partial^{2} f/\partial {y}^{2} $ 都大于零
2,则极值为极小值,若都小于零,则极值为极大值.
注意eq. 1 只是存在极值的充分非必要条件.也就是说存在一些极值点不满足eq. 1 .例如 $f(x, y) = x^4 + y^4$ 在原点处的极值点.当eq. 1 左边小于零时,必定不是极值点,等于零时可能是也可能不是,需要用高阶导数进一步判断,这里暂时不讨论.
证明
类比一元函数的证明,要证明二元函数的某点是极值点,就要证明该点的任意二阶方向导数都大于零或都小于零3.令某方向为 $ \hat{\boldsymbol{\mathbf{n}}} = \hat{\boldsymbol{\mathbf{x}}} \cos\theta + \hat{\boldsymbol{\mathbf{y}}} \sin\theta$,由eq. 9 得该方向的方向导数为
\begin{equation}
\left(\cos\theta \frac{\partial}{\partial{x}} + \sin\theta \frac{\partial}{\partial{y}} \right) f
\end{equation}
再次求方向导数得二阶方向导数为
\begin{equation}
\left(\cos\theta \frac{\partial}{\partial{x}} + \sin\theta \frac{\partial}{\partial{y}} \right) ^2 f
= \frac{\partial^{2}{f}}{\partial{x}^{2}} \cos^2\theta + 2 \frac{\partial^2 f}{\partial x \partial y} \sin\theta\cos\theta + \frac{\partial^{2}{f}}{\partial{y}^{2}} \sin^2\theta
\end{equation}
如果你还不习惯看算符的平方,可以把上式的括号项平方看做两个括号项,依次作用在函数上.以极小值为例,令上式恒大于零,并除以 $\cos^2\theta$ 得
\begin{equation}
\frac{\partial^{2}{f}}{\partial{y}^{2}} \tan^2\theta + 2 \frac{\partial^2 f}{\partial x \partial y} \tan\theta + \frac{\partial^{2}{f}}{\partial{x}^{2}} > 0
\end{equation}
上式左边是关于 $\tan\theta$ 的二次函数,若要恒大于零,则二次项系数要大于零,且判别式需小于零,立即可得
eq. 1 .同理可得极大值条件.
当判别式小于零时,必然存在不同方向的二阶方向导数具有相反的符号,所以必定不是极值点.而当判别式等于零时,存在某些方向的二阶导数为零,无法判断是否为极值点.
1. ^ 本文参考: [2] 下册的 “多元函数的极值及其求法” 一节.
2. ^ 根据eq. 1 ,$ \partial^{2} f/\partial {x}^{2} $ 和 $ \partial^{2} f/\partial {y}^{2} $ 的乘积大于零,所以只需要任意一个大于零,另外一个就必定大于零.一个小于零,另一个也必小于零.
3. ^ 否则延一个方向前进函数值会越来越大,而延另一个方向前进函数值会越来越小,这个点就不是极值点