复合函数的偏导 链式法则

             

预备知识 全微分,复合函数求导

   先来看一个二元函数的例子:若已知二元函数 $z = f(u,v)$,$z$ 是 $u, v$ 的函数,但若 $u$ 和 $v$ 都又是 $x$ 和 $y$ 的函数,则 $z$ 最终是 $x$ 和 $y$ 的函数,即

\begin{equation} z(x,y) = f[u(x,y),v(x,y)] \end{equation}
那如何求 $z(x,y)$ 的偏导数呢?我们先来看全微分关系
\begin{equation} \,\mathrm{d}{z} = \frac{\partial f}{\partial u} \,\mathrm{d}{u} + \frac{\partial f}{\partial v} \,\mathrm{d}{v} \end{equation}
而 $u$ 和 $v$ 作为 $x, y$ 的函数,它们的微小变化又都是由 $x$ 和 $y$ 的微小变化引起的,所以有全微分
\begin{equation} \,\mathrm{d}{u} = \frac{\partial u}{\partial x} \,\mathrm{d}{x} + \frac{\partial u}{\partial y} \,\mathrm{d}{y} \quad \,\mathrm{d}{v} = \frac{\partial v}{\partial x} \,\mathrm{d}{x} + \frac{\partial v}{\partial y} \,\mathrm{d}{y} \end{equation}
代入上式得
\begin{equation} \begin{aligned} \,\mathrm{d}{z} &= \frac{\partial f}{\partial u} \left( \frac{\partial u}{\partial x} \,\mathrm{d}{x} + \frac{\partial u}{\partial y} \,\mathrm{d}{y} \right) + \frac{\partial f}{\partial v} \left( \frac{\partial v}{\partial x} \,\mathrm{d}{x} + \frac{\partial v}{\partial y} \,\mathrm{d}{y} \right) \\ &= \left( \frac{\partial f}{\partial u} \frac{\partial u}{\partial x} + \frac{\partial f}{\partial v} \frac{\partial v}{\partial x} \right) \,\mathrm{d}{x} + \left( \frac{\partial f}{\partial u} \frac{\partial u}{\partial y} + \frac{\partial f}{\partial v} \frac{\partial v}{\partial y} \right) \,\mathrm{d}{y} \end{aligned} \end{equation}
这就是 $z$ 关于 $x$ 和 $y$ 的全微分关系.根据偏导数的定义
\begin{equation} \frac{\partial z}{\partial x} = \frac{\partial f}{\partial u} \frac{\partial u}{\partial x} + \frac{\partial f}{\partial v} \frac{\partial v}{\partial x} \end{equation}
\begin{equation} \frac{\partial z}{\partial y} = \frac{\partial f}{\partial u} \frac{\partial u}{\partial y} + \frac{\partial f}{\partial v} \frac{\partial v}{\partial y} \end{equation}
这也叫偏导的链式法则.为了方便我们也会把 $ \partial z/\partial x $ 和 $ \partial z/\partial y $ 分别记为 $ \partial f/\partial x $ 和 $ \partial f/\partial y $,但有可能产生歧义.

   我们可以把以上的例子拓展到任意多个变量的情况,即令

\begin{equation} z(x_1, \dots, x_N) = f[u_1(x_1, \dots, x_N), \dots, u_M(x_1, \dots, x_N)] \end{equation}
这时链式法则可以记为
\begin{equation} \frac{\partial z}{\partial x_i} = \sum_j \frac{\partial f}{\partial u_j} \frac{\partial u_j}{\partial x_i} \end{equation}

例 1 

   令 $u(x,y) = x + y$,$v(x,y) = x - y$,$f(u, v) = u^2 + v^2$,求 $ \partial f/\partial x $ 和 $ \partial f/\partial y $.

   解:直接套用式 1

\begin{equation} \frac{\partial f}{\partial x} = 2u \cdot 1 + 2v \cdot 1 = 4x \end{equation}
\begin{equation} \frac{\partial f}{\partial y} = 2u \cdot 1 + 2v \cdot (-1) = 4y \end{equation}

   为了验证,我们也可以直接写出

\begin{equation} f(x, y) = (x+y)^2 + (x-y)^2 = 2x^2 + 2y^2 \end{equation}
再直接求偏导得 $ \partial f/\partial x = 4x$,$ \partial f/\partial y = 4y$,可见结果也是相同的.

1. 通用函数名

   物理中常常会出现一种容易混淆的情况,就是当一个因变量可以有几套自变量(例如上面的 $z(u,v)$ 和 $z(x,y)$)时,通常直接用因变量($z$)作为函数名而另外不定义函数名($f$).然而 $z(u,v)$ 与 $z(x,y)$ 中的 $z$ 并不是同一个函数.以下举例说明

例 2 

   在二维直角坐标系中,定义势能函数为

\begin{equation} V=f(x,y)=x^2+y^2+2x \end{equation}
而若用极坐标描述该势能,则函数变为
\begin{equation} V = g(r,\theta) = f(r\cos \theta , r\sin \theta ) = r^2 + 2r\cos \theta \end{equation}
但许多物理书为了表述方便并不用 $f$ 和 $g$ 区分两个不同的函数,而是使用 $V(x,y)$ 表示式 12 和 $V(r,\theta)$ 表示式 13 .这样后者就有可能被误解为
\begin{equation} V(r,\theta) = r^2+\theta^2+2r \quad \text{(错)} \end{equation}
这就需要从语境中判断是否使用了通用函数名1

   使用通用函数名时,要注意判断偏导数使用的是哪一套变量,例如 $ \partial V/\partial x $ 默认使用 $V(x,y)$ 求偏导,即把 $y$ 看成常数;$ \partial V/\partial r $ 默认使用 $V(r,\theta)$ 求偏导,即把 $\theta$ 看成常数.一种更复杂的情况如 $( \partial V/\partial x )_\theta$.按照定义2,应该是仅用 $x$ 和 $\theta$ 表示 $V$,然后求偏导.考虑极坐标的定义,$\theta$ 不变意味着 $y$ 与 $x$ 成正比即 $y=x\tan\theta$,代入式 12

\begin{equation} V(x,\theta)=x^2(1+\tan^2 \theta) + 2x \end{equation}
现在再对 $x$ 求偏导即可(略).

2. 显含

   在物理中,尤其在分析力学中,我们通常会遇见显含(explicitly depends on)的概念.当

\begin{equation} f(u_1, \dots, u_M) \end{equation}
中的某个 $u_i$ 满足 $ \partial f/\partial u_i $ 不恒为零时,我们说 $f$ 显含 $u_i$.特殊地,当某个 $u_i(x_1, \dots, x_N) = x_j$ 时,我们就说函数 $f$ 显含 $x_j$,否则就说 $f$ 不显含 $x_j$.

   若 $f$ 不显含 $x_j$,但某个 $u_i$ 满足 $ \partial u_i/\partial x_j $ 不恒为零,我们就说 $f$ 隐含(implicitly depends on) $x_j$.

例 3 

   一个质点延着一条静止轨道 $y = 0$ 运动,它的动能为 $E(v_x) = m v_x^2$.虽然速度 $v_x$ 是时间 $t$ 的函数,但我们说 $E(v_x)$ 不显含时间.

   若轨道在 $y$ 方向具有随时间变化的速度 $v_y(t) = a t^2$,如果把动能记为 $E(v_x, v_y) = m(v_x^2 + v_y^2)$,那么该函数仍然不显含 $t$.

   仍然令 $v_y(t) = a t^2$,但把动能记为 $E(v_x, t) = m v_x^2 + m (a t^2)^2$,那么该函数就显含 $t$.

   虽然在后两种情况中物理情景都是一样的,但 $E(v_x, v_y)$ 和 $E(v_x, t)$ 在数学上却是两个不同的函数,使用了通用函数名 $E$.这两个函数分别是 $f(x, y) = m(x^2 + y^2)$ 和 $g(x, y) = mx^2 + ma^2 y^4$,显然不是同一个函数.它们都显含 $x, y$,不显含其他任何变量.

全导数

   特殊地,当所有的 $u_i$ 都只是一个变量 $x$ 的函数时,我们可以求全导数 $ \mathrm{d}{f}/\mathrm{d}{x} $.这时可以分为 $f$ 隐含 $x$ 和显含 $x$ 来讨论.


1. ^ “通用函数名” 是笔者起的名字,不清楚是否有其他叫法.
2. ^ 见偏导数中的式 1

致读者: 小时百科一直以来坚持所有内容免费无广告,这导致我们处于严重的亏损状态。 长此以往很可能会最终导致我们不得不选择会员制,大量广告,内容付费等。 因此,我们请求广大读者热心打赏 ,使网站得以健康发展。 如果看到这条信息的每位读者能慷慨打赏 10 元,我们一个星期内就能脱离亏损, 并保证网站能在接下来的一整年里向所有读者继续免费提供优质内容。 但遗憾的是只有不到 1% 的读者愿意捐款, 他们的付出帮助了 99% 的读者免费获取知识, 我们在此表示感谢。

广告位

投放详情

         

© 小时科技 保留一切权利