图

梯度 梯度定理

预备知识 方向导数

   在方向导数中, 我们推出方向导数为

\begin{equation} \frac{\partial f}{\partial n} = \boldsymbol\nabla f \boldsymbol\cdot \hat{\boldsymbol{\mathbf{n}}} \end{equation}

   其中 $ \boldsymbol\nabla f$ 就叫标量函数 $f$ 的梯度1. 要注意当且仅当 Del 算符 $ \boldsymbol\nabla $ 作用在标量函数(即函数值是一个数而不是矢量)上时, 可以称其为梯度算符. 这里的 $f$ 叫做势函数.对于 $N$ 维直角坐标系中的 $N$ 元函数 $f(x_1,x_2\dots x_N)$, 其梯度是一个矢量函数

\begin{equation} \boldsymbol\nabla f = \sum_{i=1}^{N} \frac{\partial f}{\partial x_i} \hat{\boldsymbol{\mathbf{x}}} _i \end{equation}
其中所有的 $ \hat{\boldsymbol{\mathbf{x}}} _i$ 组成直角坐标系的正交归一基, 现在来看全微分 关系
\begin{equation} \,\mathrm{d}{f} = \sum_{i = 1}^N \frac{\partial f}{\partial x_i} \,\mathrm{d}{x_i} \end{equation}
若定义微位移矢量为
\begin{equation} \,\mathrm{d}{ \boldsymbol{\mathbf{r}} } = \sum_{i=1}^{N} \,\mathrm{d}{x_i} \hat{\boldsymbol{\mathbf{x}}} _i \end{equation}
式 3 可用势函数的梯度和微位移矢量的内积表示
\begin{equation} \,\mathrm{d}{f} = \boldsymbol\nabla f \boldsymbol\cdot \,\mathrm{d}{ \boldsymbol{\mathbf{r}} } \end{equation}
由内积的几何定义可知,从某点出发,若微位移 $ \,\mathrm{d}{ \boldsymbol{\mathbf{r}} } $ 的大小不变,那么当其方向与梯度方向相同时函数增量 $ \,\mathrm{d}{f} $ 最大;二者方向垂直时,函数增量为零;二者夹角为 $\theta$ 时,函数增量等于最大值乘以 $\cos \theta$. 所以梯度矢量的方向是函数 $f$ 增加最快的方向, 梯度的大小等于该方向的方向导数.注意式 5 式 1 的关系可以类比一元函数的导数和微分 的关系, 当函数可微时, 二者等效.

   现在我们也可以把全微分近似(“ 全微分式 6 ) 记为矢量的形式

\begin{equation} \Delta f \approx \boldsymbol\nabla f \boldsymbol\cdot \Delta \boldsymbol{\mathbf{r}} \end{equation}

用梯度计算曲线(面)的法向量

   先以 $xy$ 平面的曲线为例,任意曲线可以用函数 $f(x,y)$ 的等值线来表示,即 $f(x,y) = C$( $C$ 为常数).若从曲线上的某点出发,沿曲线的切线方向取一个微位移 $ \,\mathrm{d}{ \boldsymbol{\mathbf{r}} } = \,\mathrm{d}{x} \hat{\boldsymbol{\mathbf{x}}} + \,\mathrm{d}{y} \hat{\boldsymbol{\mathbf{y}}} $,由于 $(x+ \,\mathrm{d}{x} , y+ \,\mathrm{d}{y} )$ 仍然在等值线上,函数增量 $ \,\mathrm{d}{f} = 0$. 代入式 5

\begin{equation} \boldsymbol\nabla f \boldsymbol\cdot \,\mathrm{d}{ \boldsymbol{\mathbf{r}} } = 0 \end{equation}
即 $f(x,y)$ 的梯度与 $ \,\mathrm{d}{ \boldsymbol{\mathbf{r}} } $ 垂直. 所以 $ \boldsymbol\nabla f(x,y)$ 必定是 $(x,y)$ 点所在等值线的法向量,且指向函数值 $C$ 更大的等值线(因为函数值在梯度方向增加最快).

极坐标,柱坐标和球坐标中的梯度算符

预备知识 正交曲线坐标系

   我们先写出极坐标中函数 $f(r,\theta)$ 的全微分为

\begin{equation} \,\mathrm{d}{f} = \frac{\partial f}{\partial r} \,\mathrm{d}{r} + \frac{\partial f}{\partial \theta} \,\mathrm{d}{\theta} \end{equation}
再写出极坐标中的微位移为
\begin{equation} \,\mathrm{d}{ \boldsymbol{\mathbf{r}} } = \,\mathrm{d}{r} \hat{\boldsymbol{\mathbf{r}}} + r \,\mathrm{d}{\theta} \hat{\boldsymbol{\mathbf{\theta}}} \end{equation}
所以为了满足梯度的定义式 5 , 我们可以把式 8 写为
\begin{equation} \,\mathrm{d}{f} = \frac{\partial f}{\partial r} \,\mathrm{d}{r} + \frac1r \frac{\partial f}{\partial \theta} \cdot r \,\mathrm{d}{\theta} \end{equation}
对比式 5 式 9 式 10 可以得出极坐标中的梯度算符
\begin{equation} \boldsymbol\nabla = \hat{\boldsymbol{\mathbf{r}}} \frac{\partial}{\partial{r}} + \hat{\boldsymbol{\mathbf{\theta}}} \frac1r \frac{\partial}{\partial{\theta}} \end{equation}

   同理, 柱坐标中的微位移(式 7 ) 与函数 $f(r,\theta, z)$ 的全微分可以分别表示为

\begin{equation} \,\mathrm{d}{ \boldsymbol{\mathbf{r}} } = \,\mathrm{d}{r} \hat{\boldsymbol{\mathbf{r}}} + r \,\mathrm{d}{\theta} \hat{\boldsymbol{\mathbf{\theta}}} + \,\mathrm{d}{z} \hat{\boldsymbol{\mathbf{z}}} \end{equation}
\begin{equation} \,\mathrm{d}{f} = \frac{\partial f}{\partial r} \,\mathrm{d}{r} + \frac1r \frac{\partial f}{\partial \theta} \cdot r \,\mathrm{d}{\theta} + \frac{\partial f}{\partial z} \,\mathrm{d}{z} \end{equation}
所以柱坐标中的梯度算符
\begin{equation} \boldsymbol\nabla = \hat{\boldsymbol{\mathbf{r}}} \frac{\partial}{\partial{r}} + \hat{\boldsymbol{\mathbf{\theta}}} \frac1r \frac{\partial}{\partial{\theta}} + \hat{\boldsymbol{\mathbf{z}}} \frac{\partial}{\partial{z}} \end{equation}

   球坐标也类似, 球坐标中的微位移(式 12 ) 与 $f(r,\theta,\phi)$ 的全微分可以分别表示为

\begin{equation} \,\mathrm{d}{ \boldsymbol{\mathbf{r}} } = \,\mathrm{d}{r} \hat{\boldsymbol{\mathbf{r}}} + r \,\mathrm{d}{\theta} \hat{\boldsymbol{\mathbf{\theta}}} + r\sin\theta \,\mathrm{d}{\phi} \hat{\boldsymbol{\mathbf{\phi}}} \end{equation}
\begin{equation} \,\mathrm{d}{f} = \frac{\partial f}{\partial r} \,\mathrm{d}{r} + \frac1r \frac{\partial f}{\partial \theta} \cdot r \,\mathrm{d}{\theta} + \frac{1}{ r\sin\theta} \frac{\partial f}{\partial \phi} \cdot r\sin\theta \,\mathrm{d}{\phi} \end{equation}
所以球坐标中的梯度算符
\begin{equation} \boldsymbol\nabla = \hat{\boldsymbol{\mathbf{r}}} \frac{\partial}{\partial{r}} + \hat{\boldsymbol{\mathbf{\theta}}} \frac1r \frac{\partial}{\partial{\theta}} + \hat{\boldsymbol{\mathbf{\phi}}} \frac{1}{ r\sin\theta} \frac{\partial}{\partial{\phi}} \end{equation}

梯度定理

预备知识 线积分, 牛顿—莱布尼兹公式

   梯度定理 :一个标量函数 $f( \boldsymbol{\mathbf{r}} )$ 的梯度延任何路径从起点 $ \boldsymbol{\mathbf{r}} _i$ 到终点 $ \boldsymbol{\mathbf{r}} _f$(角标 $i$ 表示 initial, $f$ 表示 final) 线积分的结果等于该函数在末位置的函数值减去初位置的函数值.可以用下式表示

\begin{equation} \int_{ \boldsymbol{\mathbf{r}} _i}^{ \boldsymbol{\mathbf{r}} _f} \boldsymbol\nabla f( \boldsymbol{\mathbf{r}} ) \boldsymbol\cdot \,\mathrm{d}{ \boldsymbol{\mathbf{r}} } = f( \boldsymbol{\mathbf{r}} _f) - f( \boldsymbol{\mathbf{r}} _i) \end{equation}
梯度定理可以看做是牛顿—莱布尼兹公式
\begin{equation} \int_a^b f'(x) \,\mathrm{d}{x} = f(b) - f(a) \end{equation}
的拓展, 即把一元函数拓展为多元函数,把导函数拓展为梯度函数(在一维情况下,式 18 变为式 19 ).所以前者的证明也可以类比后者的证明.

梯度定理的证明

   我们先把式 18 路径分为许多首尾相接的小段曲线, 则整段曲线的线积分等于所有小曲线的线积分之和.假设曲线处处光滑, 如果每段小曲线都足够短,就可以把它们近似看做线段,且梯度值在上面近似为常矢量.令第 $i$ 小段的起点和终点分别为 $ \boldsymbol{\mathbf{r}} _{i0}, \boldsymbol{\mathbf{r}} _{i1}$, 则第 $i$ 段的线积分可近似为

\begin{equation} \int_{ \boldsymbol{\mathbf{r}} _{i0}}^{ \boldsymbol{\mathbf{r}} _{i1}} \boldsymbol\nabla f( \boldsymbol{\mathbf{r}} ) \boldsymbol\cdot \,\mathrm{d}{ \boldsymbol{\mathbf{r}} } \approx \boldsymbol\nabla f( \boldsymbol{\mathbf{r}} _i) \boldsymbol\cdot \Delta \boldsymbol{\mathbf{r}} _i \end{equation}
再利用全微分近似( 式 6 ),上式等于
\begin{equation} \int_{ \boldsymbol{\mathbf{r}} _{i0}}^{ \boldsymbol{\mathbf{r}} _{i1}} \boldsymbol\nabla f( \boldsymbol{\mathbf{r}} ) \boldsymbol\cdot \,\mathrm{d}{ \boldsymbol{\mathbf{r}} } \approx f( \boldsymbol{\mathbf{r}} _{i1}) - f( \boldsymbol{\mathbf{r}} _{i0}) \end{equation}
将所有小段的线积分求和得到总的线积分得( 注意 $ \boldsymbol{\mathbf{r}} _{i1} = \boldsymbol{\mathbf{r}} _{(i+1)0}$)
\begin{equation} \begin{aligned} \int_{C} \boldsymbol\nabla f( \boldsymbol{\mathbf{r}} ) \boldsymbol\cdot \,\mathrm{d}{ \boldsymbol{\mathbf{r}} } &= \sum_{i=1}^n \int_{ \boldsymbol{\mathbf{r}} _{i0}}^{ \boldsymbol{\mathbf{r}} _{i1}} \boldsymbol\nabla f( \boldsymbol{\mathbf{r}} ) \boldsymbol\cdot \,\mathrm{d}{ \boldsymbol{\mathbf{r}} } \\ &\approx \sum_{i=1}^n [f( \boldsymbol{\mathbf{r}} _{i1}) - f( \boldsymbol{\mathbf{r}} _{i0})] = f( \boldsymbol{\mathbf{r}} _f) - f( \boldsymbol{\mathbf{r}} _i) \end{aligned} \end{equation}
最后取极限 $n\to \infty$, 可使上式精确成立.证毕.

由梯度求势函数

   我们通常把上面的标量函数 $f( \boldsymbol{\mathbf{r}} )$ 叫做势函数, 其地位相当于牛顿—莱布尼兹公式中的原函数. 在这个类比中, 既然 “对原函数求导” 对应 “对势函数求梯度”, 那么不定积分对应的 “通过梯度函数求势函数” 又该如何实现呢?

   以二维的情况为例, 我们可以先指定势函数在某点 $ \boldsymbol{\mathbf{r}} _0 (x_0,y_0)$ 的值, 然后根据式 18 , 要求势函数任意一点 $ \boldsymbol{\mathbf{r}} (x,y)$ 的值, 只需从 $ \boldsymbol{\mathbf{r}} _0$ 点出发由任意路径线积分到点 $ \boldsymbol{\mathbf{r}} $ 即可得到势函数 $f( \boldsymbol{\mathbf{r}} )$.

\begin{equation} f( \boldsymbol{\mathbf{r}} ) = f( \boldsymbol{\mathbf{r}} _0) + \int_{ \boldsymbol{\mathbf{r}} _0}^{ \boldsymbol{\mathbf{r}} } \boldsymbol\nabla f( \boldsymbol{\mathbf{r}} ) \boldsymbol\cdot \,\mathrm{d}{ \boldsymbol{\mathbf{r}} } \end{equation}
计算该线积分一般选取一种简单的路径:即先延从 $ \boldsymbol{\mathbf{r}} _0(x_0,y_0)$ 到 $ \boldsymbol{\mathbf{r}} _1(x, y_0)$ 的水平线段, 再延从 $ \boldsymbol{\mathbf{r}} _1(x, y_0)$ 到 $ \boldsymbol{\mathbf{r}} (x,y)$ 的竖直线段(当然也可以取中间点为 $(x_0,y)$). 若把 $ \boldsymbol\nabla f$ 的两个分量 $ \partial f/\partial x , \partial f/\partial y $ 简写为 $f_x(x,y), f_y(x,y)$, 分关于 $x$ 和 $y$ 的不定积分记为 $F_x(x,y), F_y(x,y)$, 延两个线段的线积分(分别把 $x$ 和 $y$ 作为线积分的参数)分别为
\begin{equation} \int_{ \boldsymbol{\mathbf{r}} _0}^{ \boldsymbol{\mathbf{r}} _1} \boldsymbol\nabla f( \boldsymbol{\mathbf{r}} ) \boldsymbol\cdot \,\mathrm{d}{ \boldsymbol{\mathbf{r}} } = \int_{x_0}^{x} f_x(x,y_0) \,\mathrm{d}{x} + 0 = F_x(x,y_0) - F_x(x_0,y_0) \end{equation}
\begin{equation} \int_{ \boldsymbol{\mathbf{r}} _1}^{ \boldsymbol{\mathbf{r}} } \boldsymbol\nabla f( \boldsymbol{\mathbf{r}} ) \boldsymbol\cdot \,\mathrm{d}{ \boldsymbol{\mathbf{r}} } = \int_{y_0}^{y} f_y(x,y) \,\mathrm{d}{y} + 0 = F_y(x,y) - F_y(x,y_0) \end{equation}
代回式 23 得势函数为
\begin{equation} \begin{aligned} f(x,y) &= f(x_0,y_0) + F_x(x,y_0) - F_x(x_0,y_0) + F_y(x,y) - F_y(x,y_0) \\ &= F_y(x,y) - F_y(x,y_0) + F_x(x,y_0) + C \end{aligned} \end{equation}
其中 $C$ 为待定常数.

   \eentry{势能}


1. 这里假设 $f$ 在某区域内处处光滑,即所有一阶偏导数处处连续. 这个性质也叫可微

致读者: 小时物理百科一直以来坚持所有内容免费无广告,这导致我们处于日渐严重的亏损状态。长此以往很可能会最终导致我们不得不选择商业化,例如大量广告,内容付费, 甚至被收购。 因此,我们鼓起勇气在此请求广大读者热心捐款,使网站得以健康发展。如果看到这条信息的每位读者能慷慨捐助 10 元,我们一个星期内就能脱离亏损状态,并保证网站能在接下来的一整年里向所有读者继续免费提供优质内容。 但遗憾的是只有不到 1% 的读者愿意捐款, 他们的付出帮助了 99% 的读者免费获得知识, 我们在此表示感谢。

编辑词条(需要权限) 返回目录 返回主页 捐助项目 © 小时物理百科 保留一切权利