复合函数的偏导、链式法则（多元微积分）

贡献者： addis

预备知识　全微分，复合函数求导

　　先来看一个二元函数的例子：若已知二元函数 $z = f(u,v)$，$z$ 是 $u, v$ 的函数，但若 $u$ 和 $v$ 都又是 $x$ 和 $y$ 的函数，则 $z$ 最终是 $x$ 和 $y$ 的函数，即

\begin{equation} z(x,y) = f[u(x,y),v(x,y)]~. \end{equation}

那如何求 $z(x,y)$ 的偏导数呢？我们先来看全微分关系

\begin{equation} \,\mathrm{d}{z} = \frac{\partial f}{\partial u} \,\mathrm{d}{u} + \frac{\partial f}{\partial v} \,\mathrm{d}{v} ~. \end{equation}

而 $u$ 和 $v$ 作为 $x, y$ 的函数，它们的微小变化又都是由 $x$ 和 $y$ 的微小变化引起的，所以有全微分

\begin{equation} \,\mathrm{d}{u} = \frac{\partial u}{\partial x} \,\mathrm{d}{x} + \frac{\partial u}{\partial y} \,\mathrm{d}{y} ~, \quad \,\mathrm{d}{v} = \frac{\partial v}{\partial x} \,\mathrm{d}{x} + \frac{\partial v}{\partial y} \,\mathrm{d}{y} ~. \end{equation}

代入上式得

\begin{equation} \begin{aligned} \,\mathrm{d}{z} &= \frac{\partial f}{\partial u} \left( \frac{\partial u}{\partial x} \,\mathrm{d}{x} + \frac{\partial u}{\partial y} \,\mathrm{d}{y} \right) + \frac{\partial f}{\partial v} \left( \frac{\partial v}{\partial x} \,\mathrm{d}{x} + \frac{\partial v}{\partial y} \,\mathrm{d}{y} \right) \\ &= \left( \frac{\partial f}{\partial u} \frac{\partial u}{\partial x} + \frac{\partial f}{\partial v} \frac{\partial v}{\partial x} \right) \,\mathrm{d}{x} + \left( \frac{\partial f}{\partial u} \frac{\partial u}{\partial y} + \frac{\partial f}{\partial v} \frac{\partial v}{\partial y} \right) \,\mathrm{d}{y} ~, \end{aligned} \end{equation}

这就是 $z$ 关于 $x$ 和 $y$ 的全微分关系。根据偏导数的定义

\begin{equation} \frac{\partial z}{\partial x} = \frac{\partial f}{\partial u} \frac{\partial u}{\partial x} + \frac{\partial f}{\partial v} \frac{\partial v}{\partial x} ~, \end{equation}

\begin{equation} \frac{\partial z}{\partial y} = \frac{\partial f}{\partial u} \frac{\partial u}{\partial y} + \frac{\partial f}{\partial v} \frac{\partial v}{\partial y} ~. \end{equation}

这也叫偏导的链式法则。为了方便我们也会把 $ \partial z/\partial x $ 和 $ \partial z/\partial y $ 分别记为 $ \partial f/\partial x $ 和 $ \partial f/\partial y $，但有可能产生歧义。

　　我们可以把以上的例子拓展到任意多个变量的情况，即令

\begin{equation} z(x_1, \dots, x_N) = f[u_1(x_1, \dots, x_N), \dots, u_M(x_1, \dots, x_N)]~. \end{equation}

这时链式法则可以记为

\begin{equation} \frac{\partial z}{\partial x_i} = \sum_j \frac{\partial f}{\partial u_j} \frac{\partial u_j}{\partial x_i} ~. \end{equation}

例 1　

　　令 $u(x,y) = x + y$，$v(x,y) = x - y$，$f(u, v) = u^2 + v^2$，求 $ \partial f/\partial x $ 和 $ \partial f/\partial y $。

　　解：直接套用式 1 得

\begin{equation} \frac{\partial f}{\partial x} = 2u \cdot 1 + 2v \cdot 1 = 4x~, \end{equation}

\begin{equation} \frac{\partial f}{\partial y} = 2u \cdot 1 + 2v \cdot (-1) = 4y~. \end{equation}

　　为了验证，我们也可以直接写出

\begin{equation} f(x, y) = (x+y)^2 + (x-y)^2 = 2x^2 + 2y^2~. \end{equation}

再直接求偏导得 $ \partial f/\partial x = 4x$，$ \partial f/\partial y = 4y$，可见结果也是相同的。

1. 显含

　　在物理中，尤其在分析力学中，我们通常会遇见显含（explicitly depends on）的概念。当

\begin{equation} f(u_1, \dots, u_M)~ \end{equation}

中的某个 $u_i$ 满足 $ \partial f/\partial u_i $ 不恒为零时，我们说 $f$ 显含 $u_i$。特殊地，当某个 $u_i(x_1, \dots, x_N) = x_j$ 时，我们就说函数 $f$ 显含 $x_j$，否则就说 $f$ 不显含 $x_j$。

　　若 $f$ 不显含 $x_j$，但某个 $u_i$ 满足 $ \partial u_i/\partial x_j $ 不恒为零，我们就说 $f$ 隐含（implicitly depends on） $x_j$。

例 2　

　　一个质点延着一条静止轨道 $y = 0$ 运动，它的动能为 $E(v_x) = m v_x^2$。虽然速度 $v_x$ 是时间 $t$ 的函数，但我们说 $E(v_x)$ 不显含时间。

　　若轨道在 $y$ 方向具有随时间变化的速度 $v_y(t) = a t^2$，如果把动能记为 $E(v_x, v_y) = m(v_x^2 + v_y^2)$，那么该函数仍然不显含 $t$。

　　仍然令 $v_y(t) = a t^2$，但把动能记为 $E(v_x, t) = m v_x^2 + m (a t^2)^2$，那么该函数就显含 $t$。

　　虽然在后两种情况中物理情景都是一样的，但 $E(v_x, v_y)$ 和 $E(v_x, t)$ 在数学上却是两个不同的函数，使用了通用函数名 $E$。这两个函数分别是 $f(x, y) = m(x^2 + y^2)$ 和 $g(x, y) = mx^2 + ma^2 y^4$，显然不是同一个函数。它们都显含 $x, y$，不显含其他任何变量。

全导数

　　特殊地，当所有的 $u_i$ 都只是一个变量 $x$ 的函数时，我们可以求全导数 $ \mathrm{d}{f}/\mathrm{d}{x} $。这时可以分为 $f$ 隐含 $x$ 和显含 $x$ 来讨论。

致读者：小时百科一直以来坚持所有内容免费无广告，这导致我们处于严重的亏损状态。长此以往很可能会最终导致我们不得不选择大量广告以及内容付费等。因此，我们请求广大读者热心打赏 ，使网站得以健康发展。如果看到这条信息的每位读者能慷慨打赏 20 元，我们一周就能脱离亏损，并在接下来的一年里向所有读者继续免费提供优质内容。但遗憾的是只有不到 1% 的读者愿意捐款，他们的付出帮助了 99% 的读者免费获取知识，我们在此表示感谢。