复合函数的偏导、链式法则(多元微积分)

                     

贡献者: addis

预备知识 全微分,复合函数求导

   先来看一个二元函数的例子:若已知二元函数 $z = f(u,v)$,$z$ 是 $u, v$ 的函数,但若 $u$ 和 $v$ 都又是 $x$ 和 $y$ 的函数,则 $z$ 最终是 $x$ 和 $y$ 的函数,即

\begin{equation} z(x,y) = f[u(x,y),v(x,y)]~. \end{equation}
那如何求 $z(x,y)$ 的偏导数呢?我们先来看全微分关系
\begin{equation} \,\mathrm{d}{z} = \frac{\partial f}{\partial u} \,\mathrm{d}{u} + \frac{\partial f}{\partial v} \,\mathrm{d}{v} ~. \end{equation}
而 $u$ 和 $v$ 作为 $x, y$ 的函数,它们的微小变化又都是由 $x$ 和 $y$ 的微小变化引起的,所以有全微分
\begin{equation} \,\mathrm{d}{u} = \frac{\partial u}{\partial x} \,\mathrm{d}{x} + \frac{\partial u}{\partial y} \,\mathrm{d}{y} ~, \quad \,\mathrm{d}{v} = \frac{\partial v}{\partial x} \,\mathrm{d}{x} + \frac{\partial v}{\partial y} \,\mathrm{d}{y} ~. \end{equation}
代入上式得
\begin{equation} \begin{aligned} \,\mathrm{d}{z} &= \frac{\partial f}{\partial u} \left( \frac{\partial u}{\partial x} \,\mathrm{d}{x} + \frac{\partial u}{\partial y} \,\mathrm{d}{y} \right) + \frac{\partial f}{\partial v} \left( \frac{\partial v}{\partial x} \,\mathrm{d}{x} + \frac{\partial v}{\partial y} \,\mathrm{d}{y} \right) \\ &= \left( \frac{\partial f}{\partial u} \frac{\partial u}{\partial x} + \frac{\partial f}{\partial v} \frac{\partial v}{\partial x} \right) \,\mathrm{d}{x} + \left( \frac{\partial f}{\partial u} \frac{\partial u}{\partial y} + \frac{\partial f}{\partial v} \frac{\partial v}{\partial y} \right) \,\mathrm{d}{y} ~, \end{aligned} \end{equation}
这就是 $z$ 关于 $x$ 和 $y$ 的全微分关系。根据偏导数的定义
\begin{equation} \frac{\partial z}{\partial x} = \frac{\partial f}{\partial u} \frac{\partial u}{\partial x} + \frac{\partial f}{\partial v} \frac{\partial v}{\partial x} ~, \end{equation}
\begin{equation} \frac{\partial z}{\partial y} = \frac{\partial f}{\partial u} \frac{\partial u}{\partial y} + \frac{\partial f}{\partial v} \frac{\partial v}{\partial y} ~. \end{equation}
这也叫偏导的链式法则。为了方便我们也会把 $ \partial z/\partial x $ 和 $ \partial z/\partial y $ 分别记为 $ \partial f/\partial x $ 和 $ \partial f/\partial y $,但有可能产生歧义。

   我们可以把以上的例子拓展到任意多个变量的情况,即令

\begin{equation} z(x_1, \dots, x_N) = f[u_1(x_1, \dots, x_N), \dots, u_M(x_1, \dots, x_N)]~. \end{equation}
这时链式法则可以记为
\begin{equation} \frac{\partial z}{\partial x_i} = \sum_j \frac{\partial f}{\partial u_j} \frac{\partial u_j}{\partial x_i} ~. \end{equation}

例 1 

   令 $u(x,y) = x + y$,$v(x,y) = x - y$,$f(u, v) = u^2 + v^2$,求 $ \partial f/\partial x $ 和 $ \partial f/\partial y $。

   解:直接套用式 1

\begin{equation} \frac{\partial f}{\partial x} = 2u \cdot 1 + 2v \cdot 1 = 4x~, \end{equation}
\begin{equation} \frac{\partial f}{\partial y} = 2u \cdot 1 + 2v \cdot (-1) = 4y~. \end{equation}

   为了验证,我们也可以直接写出

\begin{equation} f(x, y) = (x+y)^2 + (x-y)^2 = 2x^2 + 2y^2~. \end{equation}
再直接求偏导得 $ \partial f/\partial x = 4x$,$ \partial f/\partial y = 4y$,可见结果也是相同的。

1. 显含

   在物理中,尤其在分析力学中,我们通常会遇见显含(explicitly depends on)的概念。当

\begin{equation} f(u_1, \dots, u_M)~ \end{equation}
中的某个 $u_i$ 满足 $ \partial f/\partial u_i $ 不恒为零时,我们说 $f$ 显含 $u_i$。特殊地,当某个 $u_i(x_1, \dots, x_N) = x_j$ 时,我们就说函数 $f$ 显含 $x_j$,否则就说 $f$ 不显含 $x_j$。

   若 $f$ 不显含 $x_j$,但某个 $u_i$ 满足 $ \partial u_i/\partial x_j $ 不恒为零,我们就说 $f$ 隐含(implicitly depends on) $x_j$。

例 2 

   一个质点延着一条静止轨道 $y = 0$ 运动,它的动能为 $E(v_x) = m v_x^2$。虽然速度 $v_x$ 是时间 $t$ 的函数,但我们说 $E(v_x)$ 不显含时间。

   若轨道在 $y$ 方向具有随时间变化的速度 $v_y(t) = a t^2$,如果把动能记为 $E(v_x, v_y) = m(v_x^2 + v_y^2)$,那么该函数仍然不显含 $t$。

   仍然令 $v_y(t) = a t^2$,但把动能记为 $E(v_x, t) = m v_x^2 + m (a t^2)^2$,那么该函数就显含 $t$。

   虽然在后两种情况中物理情景都是一样的,但 $E(v_x, v_y)$ 和 $E(v_x, t)$ 在数学上却是两个不同的函数,使用了通用函数名 $E$。这两个函数分别是 $f(x, y) = m(x^2 + y^2)$ 和 $g(x, y) = mx^2 + ma^2 y^4$,显然不是同一个函数。它们都显含 $x, y$,不显含其他任何变量。

全导数

   特殊地,当所有的 $u_i$ 都只是一个变量 $x$ 的函数时,我们可以求全导数 $ \mathrm{d}{f}/\mathrm{d}{x} $。这时可以分为 $f$ 隐含 $x$ 和显含 $x$ 来讨论。

                     

© 小时科技 保留一切权利