贡献者: _Eden_
1. 从导数到偏导数
导数的几何意义是一元函数在某一点处的斜率,而我们可以将这个概念推广到多元函数。$n$ 元实函数是指从 $\mathbb{R} ^n$ 的一个子集 $U$ 到 $\mathbb{R}$ 的映射:
\begin{equation}
\begin{aligned}
f:U\subset \mathbb{R} ^n&\rightarrow \mathbb{R}~,\\
(x_1,x_2,\cdots,x_n)&\mapsto f(x_1,x_2,\cdots,x_n)~.
\end{aligned}
\end{equation}
我们定义 $f$ 对 $x_i$ 的
偏导数为
\begin{equation}
\lim\limits_{x'_i\rightarrow x_{i}}\frac{f(x_1,\cdots,x'_i,\cdots,x_n)-f(x_1,\cdots,x_i,\cdots,x_n)}{x'_i-x_i}~.
\end{equation}
如果该极限存在,那么函数在 $ \boldsymbol{\mathbf{x}} _0=(x_1,\cdots,x_n)$ 处对 $x_i$ 的偏导数存在,记为
\begin{equation}
\frac{\partial f(x_1,\cdots,x_n)}{\partial x_i}=\left.\frac{\partial f}{\partial x_i}\right|_{(x_1,\cdots,x_n)}=f'_{x_i}(x_1,\cdots,x_n)~.
\end{equation}
在讨论多元函数时,我们约定用粗体字(例如 $ \boldsymbol{\mathbf{x}} $)来表示 $\mathbb{R}^n$ 中的一个向量。对于给定的 $ \boldsymbol{\mathbf{x}} _0=(x_1,\cdots,x_n)$,如果构造一元函数 $g(x)=f(x_1,\cdots,x_{i-1},x,x_{i+1},\cdots,x_n)$,那么根据一元函数导数的定义,容易发现
\begin{equation}
\left.\frac{\partial f}{\partial x_i}\right|_{ \boldsymbol{\mathbf{x}} _0}=\left.\frac{ \,\mathrm{d}{g} }{ \,\mathrm{d}{x} }\right|_{x_i}~,
\end{equation}
因此我们可以使用一元函数的求导公式来进行偏导数的计算。固定其他 $x_j(j\neq i)$ 不动,对 $x_i$ 求导,得到的结果就是我们要求的偏导数。
如果多元函数 $f( \boldsymbol{\mathbf{x}} )$ 在开集 $U$ 上有定义,且在 $U$ 上每一点处都有对 $x_i$ 的偏导数,那么偏导数就是一个新的 $n$ 元函数:
\begin{equation}
\begin{aligned}
\frac{\partial f}{\partial x_i}: U&\rightarrow \mathbb{R}~,\\
\boldsymbol{\mathbf{x}} &\mapsto \frac{\partial f( \boldsymbol{\mathbf{x}} )}{\partial x_i}~.
\end{aligned}
\end{equation}
因此我们可以定义二阶偏导数(如果存在的话),甚至更高阶的偏导数。例如,如果再对 $\partial f/\partial x_i$ 求对 $x_j$ 的偏导数,则可以记为
\begin{equation}
\left.\frac{\partial}{\partial x_j} \frac{\partial f( \boldsymbol{\mathbf{x}} )}{\partial x_i}\right|_{ \boldsymbol{\mathbf{x}} _0}=\left.\frac{\partial^2 f}{\partial x_j\partial x_i }\right|_{ \boldsymbol{\mathbf{x}} _0}~.
\end{equation}
有时对于性质较好的函数 $f( \boldsymbol{\mathbf{x}} )$(例如 $f$ 是 $n$ 元连续函数),可以将它想象成欧几里德空间 $\mathbb{R}^{n+1}$ 中的一个曲面,曲面上的点 $(x_1,\cdots,x_n,x_{n+1})$ 意味着 $x_{n+1}=f(x_1,\cdots,x_n)$。那么偏导数的几何意义就是曲面在某一个方向上的斜率 $ \,\mathrm{d}{x} _{n+1}/ \,\mathrm{d}{x} _i$。$n$ 个偏导数 $\partial f/\partial x_1,\cdots,\partial f/\partial x_n$ 代表了曲面在 $n$ 个平行于坐标轴的方向上的斜率。
2. 方向导数
偏导数的几何意义是在 $n$ 个平行于坐标轴的方向上的斜率,可以将它推广至任意方向上的斜率。从原点出发的一条射线与 $n$ 维球面 $S_n=\{(x_1,\cdots,x_n):x_1^2+\cdots+x_n^2=1\}$ 的交点可以代表一个方向,设 $ \boldsymbol{\mathbf{v}} =(\cos \theta_1,\cos\theta_2,\cdots,\cos\theta_n)$ 为球面上一点,那么该方向与 $x_i$ 轴的夹角为 $\theta_i$。
定义 1 方向导数
设函数 $f( \boldsymbol{\mathbf{x}} )$ 在区域 $D$ 上有定义,$x_0\in D$,$ \boldsymbol{\mathbf{v}} =(\cos \theta_1,\cdots,\cos\theta_n)$ 为某一个方向。如果极限
\begin{equation}
\lim\limits_{t\rightarrow 0^+}\frac{f( \boldsymbol{\mathbf{x}} _0+t \boldsymbol{\mathbf{v}} )-f( \boldsymbol{\mathbf{x}} _0)}{t}~
\end{equation}
存在
1,那么称该极限为 $f( \boldsymbol{\mathbf{x}} )$ 在 $ \boldsymbol{\mathbf{x}} _0$ 处沿 $ \boldsymbol{\mathbf{v}} $ 的方向导数。记为
\begin{equation}
\left.\frac{\partial f( \boldsymbol{\mathbf{x}} )}{\partial \boldsymbol{\mathbf{v}} }\right|_{ \boldsymbol{\mathbf{x}} _0}~.
\end{equation}
方向导数的几何意义明显,可以证明它不依赖于坐标系的选取。要注意的是,函数 $f( \boldsymbol{\mathbf{x}} )$ 在 $ \boldsymbol{\mathbf{x}} _0$ 处,沿 $ \boldsymbol{\mathbf{v}} $ 的方向导数不一定是沿 $- \boldsymbol{\mathbf{v}} $ 的方向导数的相反数。以函数 $f(x,y)=\sqrt{x^2+y^2}$ 为例,它在原点 $(0,0)$ 处沿 $ \boldsymbol{\mathbf{v}} =(1,0)$ 的方向导数为 $1$,沿 $- \boldsymbol{\mathbf{v}} =(-1,0)$ 的方向导数也为 $1$,两者并不互为相反数。事实上 $f(x,y)$ 在 $(0,0)$ 处并不存在偏导数,但它沿任意方向都有方向导数。
下面我们将看到,对于连续可微函数,只要知道它的所有偏导数,就能计算出它的所有方向导数。
3. 可微性与偏导数
定义 2 多元函数的可微
设函数 $f( \boldsymbol{\mathbf{x}} )$ 在区域 $D$ 上有定义,$ \boldsymbol{\mathbf{x}} _0=(x_1,\cdots,x_n)\in D$。记 $\Delta \boldsymbol{\mathbf{x}} =(\Delta x_1,\cdots,\Delta x_n)$ 为函数的自变量的全增量,且 $ \boldsymbol{\mathbf{x}} _0+\Delta \boldsymbol{\mathbf{x}} \in D$。如果存在常数 $A_1,\cdots,A_n$(这些常数只与 $ \boldsymbol{\mathbf{x}} _0$ 有关,不与全增量有关),
满足
\begin{equation}
\Delta f=f( \boldsymbol{\mathbf{x}} _0+\Delta \boldsymbol{\mathbf{x}} )-f( \boldsymbol{\mathbf{x}} _0)=\sum_{i=1}^n A_i \Delta x_i+o(|\Delta \boldsymbol{\mathbf{x}} |),\ |\Delta \boldsymbol{\mathbf{x}} |\rightarrow 0~.
\end{equation}
那么称 $f( \boldsymbol{\mathbf{x}} )$ 在 $ \boldsymbol{\mathbf{x}} _0$ 处
可微,并称 $\sum_{i=1}^n A_i \Delta x_i$ 为 $f( \boldsymbol{\mathbf{x}} )$ 在 $ \boldsymbol{\mathbf{x}} _0$ 处的全微分,记为:
\begin{equation}
\,\mathrm{d}{f} ( \boldsymbol{\mathbf{x}} _0)=\sum_{i=0}^n A_i \,\mathrm{d}{x} _i~,
\end{equation}
如果 $f( \boldsymbol{\mathbf{x}} )$ 在 $D$ 内每一个点处都可微,就称 $f( \boldsymbol{\mathbf{x}} )$ 为 $D$ 上的
可微函数。
1. ^ 注意这里 $t\rightarrow 0^+$,表示关于 $t$ 的函数的右极限,即在 $t>0$ 的情况下趋于 $0$。
致读者: 小时百科一直以来坚持所有内容免费无广告,这导致我们处于严重的亏损状态。 长此以往很可能会最终导致我们不得不选择大量广告以及内容付费等。 因此,我们请求广大读者
热心打赏 ,使网站得以健康发展。 如果看到这条信息的每位读者能慷慨打赏 20 元,我们一周就能脱离亏损, 并在接下来的一年里向所有读者继续免费提供优质内容。 但遗憾的是只有不到 1% 的读者愿意捐款, 他们的付出帮助了 99% 的读者免费获取知识, 我们在此表示感谢。