导数(数学分析)

                     

贡献者: JierPeter

预备知识 极限

   切线的几何描述并不严谨和完整,初学者可能会有很多疑问,比如割线的两个点靠近切点的时候,如果其中一个点到切点的距离始终是另一个点到切点距离的两倍,那它们还算同时达到切点吗?

   实际上,在极限中我们强调过,极限的概念并不是简单地等同,而是趋近的性质。用割线去接近切线也是一种极限,不存在 “达到切点” 的情况,只能是越来越接近切点。

   和其它类型的极限一样,割线趋近的过程强调 “任意性”。为了方便描述,我们需要把一根切线表示为数字。最直接的办法就是用切线的斜率来表示。

定义 1 斜率

   对于用 $f(x)=ax+b$ 描述的直线,定义其斜率为 $a$。

   由于我们给定了切点,因此割线接近切线的过程中,肯定也会接近切点,相当于确定了割线的极限是要经过切点的,于是我们只需要考察割线的斜率是不是收敛就行。由于斜率是一个数字,这就使得我们又获得了一个数列,而我们对于数列的极限是很熟悉的了。

定义 2 导数

   考虑实函数 $f(x)$,给定实数 $x_0$。对于一对数列 $\{a_n\}$、$\{b_n\}$,令 $\lim\limits_{n\to\infty}a_n=x_0$、$\lim\limits_{n\to\infty}b_n=x_0$,且各 $a_n\not=b_n$1。这样,每一对点 $(a_n, f(a_n))$、$ (b_n, f(b_n))$ 都能唯一确定一条割线,也就确定了割线的斜率 $d_n$。

   对于任意的上述数列对 $\{a_n\}$、$\{b_n\}$,如果其生成的 $d_n$ 都收敛到同一个实数 $A$ 上,那么该实数 $A$ 就是 $f(x)$ 在 $x_0$ 处的切线斜率,也称导数(derivative)

   我们来看几个例子,加深理解。

例 1 

   考虑函数 $f(x)=2x+1$。容易验证,无论怎么选一对数列,它们生成的割线斜率都是 $2$。因此由定义,$f(x)$ 在任何一个点处的导数值都是 $2$。

例 2 

   考虑函数 $f(x)=x^2$,尝试计算其在 $x=2$ 处的导数值2

   取数列 $a_n=2+g_n$ 和 $b_n=2+h_n$,其中 $g_n$ 和 $h_n$ 都趋近于 $0$,且各 $g_n\not=h_n$。那么 $a_n$ 和 $b_n$ 所确定的割线就通过点 $(2+g_n, 4+4g_n+g_n^2)$ 和点 $(2+h_n, 4+4h_n+h_n^2)$,因此割线斜率是

\begin{equation} \begin{aligned} d_n&=\frac{4+4g_n+g_n^2-4-4h_n-h_n^2}{g_n-h_n}\\ &=\frac{4(g_n-h_n)+(g_n+h_n)(g_n-h_n)}{g_n-h_n}\\ &=4+g_n+h_n~. \end{aligned} \end{equation}
由于随着 $n$ 的增大,$g_n$ 和 $h_n$ 都趋于零,因此 $d_n$ 趋于 $4$。

   又由于我们没有具体约束 $g_n$ 和 $h_n$,使得上述讨论适用于一切可用于构造趋近于给定点割线的数列 $a_n$ 和 $b_n$,因此满足任意性,因此 $f(x)=x^2$ 在 $x=2$ 处的导数值就是 $4$。

习题 1 

   考虑函数 $f(x)= \left\lvert x \right\rvert $,画出这个函数的图像,并证明其在 $x=0$ 处没有导数。

习题 2 

   考虑函数 $f(x)=[x]$,定义为 $[x]$ 是小于等于 $x$ 的、最接近 $x$ 的整数。比如,$[\pi]=3$,$[e]=2$,$[4.99]=4$,$[-4.99]=-5$。

   画出这个函数的图像,并证明其在横坐标为整数的点处没有导数。

1. 导函数及其计算

   我们上面讨论的是对于函数 $f(x)$,在给定点求其导数。但是如果我们把所有点的导数都求出来(“不存在导数” 也是一种结果),那么我们就得到了一个新的函数,就叫做 $f(x)$ 的导函数,记为 $f'(x)$。

   如果我们能把导函数的表达式计算出来,那么就可以直接代值去计算各处的导数,没必要挨个像例 2 那样进行一番冗长的运算了。

   为了方便计算,我们要先把导数的定义简化成如下形式:

定义 3 导数

   考虑实函数 $f(x)$,给定实数 $x_0$。如果对于任意趋近于 $x_0$ 的数列 $x_n$,都有数列 $\frac{f(x_n)-f(x_0)}{x_n-x_0}$ 收敛,且所有这样的数列都收敛于实数 $A$。那么 $A$ 就是 $f(x)$ 在 $x_0$ 处的导数

   换句话说,$f(x)$ 在 $x_0$ 处的导数是 $\lim\limits_{h\to 0}\frac{f(x_0+h)-f(x_0)}{h}$。

习题 3 两个定义的等价性

   证明定义 2 定义 3 是等价的。

   提示:定义 2 显然是蕴含了定义 3 的,因为前者描述的是 “所有数列对” 的情况,后者则是限定了其中一个数列恒为 $x_0$ 的特殊情况。所以你只需要证明定义 3 蕴含了定义 2 。提示:单独用 $a_n$ 和 $b_n$ 套进定义 3 中 $x_n$ 的位置能得到两条割线,而 $a_n$ 和 $b_n$ 在定义 2 中又构成第三条割线。这三条割线是可以构成一个三角形的。根据定义 3 ,前两条割线的斜率都趋于 $A$,那么作为三角形第三边的第三条割线,其斜率也不得不跟着趋于 $A$,这样就从定义 3 推出定义 2 了。

   定义 3 的表述可以理解为,我们在 $(x_0, f(x_0))$ 处出发,改变自变量的取值(正向负向的改变均可),算出由此带来的函数值改变,再计算二者的商。这个改变越接近 $0$,计算出来的商就越接近导数值 $f'(x_0)$。

定义 4 导函数

   给定实函数 $f(x)$。如果另一个函数 $f'(x)$ 的取值范围是 $f(x)$ 的全体可求导数的点,且在这些点上 $f'$ 的值就是 $f$ 的导数值,那么我们称 $f'(x)$ 是 $f(x)$ 的导函数。

Leibniz 表示法

   我们还可以用 Leibniz 的符号,将 $f(x)$ 的导函数 $\lim\limits_{x\to x_0}\frac{f(x)-f(x_0)}{x-x_0}$ 表示成 $\frac{ \,\mathrm{d}{f} (x)}{ \,\mathrm{d}{x} }$。这里,$\mathrm{d}$ 不是一个量,而是一个符号,表示 “取变化量,然后让这个变化量趋于零但不等于零”。$ \,\mathrm{d}{x} $ 的含义就是 $x-x_0$,然后取一个极限过程 $\lim\limits_{x-x_0\to 0}$3

   要注意的是,$ \,\mathrm{d}{f} (x_0)$ 是取决于 $ \,\mathrm{d}{x} $ 的,即 $ \,\mathrm{d}{f} (x_0)=f(x_0+ \,\mathrm{d}{x} )-f(x_0)$。也就是说,只有 $x$ 是自由变化的,而 $f(x)$ 变化的量是被动的。所以 $ \,\mathrm{d}{f} (x)$ 可能不会跟着 $ \,\mathrm{d}{x} $ 一起趋于零。一个例子就是习题 2 中的符号函数,在 $x=0$ 的地方,$ \,\mathrm{d}{f} (x)$ 的取值只有 $\pm 1$ 两种(别忘了 $ \,\mathrm{d}{x} $ 不等于零),导致 $ \,\mathrm{d}{x} $ 趋于零的过程中,$\frac{ \,\mathrm{d}{f} (x)}{ \,\mathrm{d}{x} }$ 越来越趋近于无穷。

   由于 $ \,\mathrm{d}{x} $ 表示的是任意接近 $0$ 的数列,因此,如果两个自变量彼此独立、不相互影响,比如 $x$ 和 $y$,那么 $ \,\mathrm{d}{x} $ 和 $ \,\mathrm{d}{y} $ 的关系是不确定的,$\frac{ \,\mathrm{d}{y} }{ \,\mathrm{d}{x} }$ 也是无法定义的值。但是如果两个变量之间有关系,比如 $y=f(x)$,那么 $\frac{ \,\mathrm{d}{y} }{ \,\mathrm{d}{x} }$ 就是有意义的了。

   举个例子。单给出无关的 $x$ 和 $y$,那么可以让 $ \,\mathrm{d}{x} $ 对应 $x_n=1/2^n$,$ \,\mathrm{d}{y} $ 对应 $y_n=1/3^n$,这样 $\frac{ \,\mathrm{d}{y} }{ \,\mathrm{d}{x} }=\lim\limits_{n\to\infty}(\frac{2}{3})^n=0$。但是我们也可以让 $ \,\mathrm{d}{x} $ 对应 $x_n=1/2^n$,$ \,\mathrm{d}{y} $ 对应 $y_n=1/2^n$,这样算出来的 $\frac{ \,\mathrm{d}{y} }{ \,\mathrm{d}{x} }$ 就是 $1$。到底哪个才是真正的 $\frac{ \,\mathrm{d}{y} }{ \,\mathrm{d}{x} }$ 呢?这没法讨论了。但是呢,如果限定了二者之间的关系,比如 $y=x^2$,那么 $ \,\mathrm{d}{y} $ 对应的 $y_n$ 就不能随意取了,必须用 $ \,\mathrm{d}{x} $ 对应的 $x_n$ 结合 $y=x^2$ 计算出来,而且无论怎么取 $x_n$,$\frac{ \,\mathrm{d}{y} }{ \,\mathrm{d}{x} }$ 在 $x=x_0$ 处的结果都会是 $2x_0$。

   为了方便,我们也可以把 $\frac{ \,\mathrm{d}{f} (x)}{ \,\mathrm{d}{x} }$ 表示为 $\frac{ \,\mathrm{d}{}} { \,\mathrm{d}{x} }f(x)$。这里,我们将 $\frac{ \,\mathrm{d}{}} { \,\mathrm{d}{x} }$ 视为一个操作,它把 $f(x)$ 变成其导函数 $f'(x)$。更进一步,我们还可以写出 $f'=\frac{ \,\mathrm{d}{}} { \,\mathrm{d}{x} }f$。

两个重要的性质

定理 1 导数的线性性

   假设 $f(x)$ 和 $g(x)$ 是两个处处可导4的函数,那么 $\frac{ \,\mathrm{d}{}} { \,\mathrm{d}{x} }(f(x)+g(x))=\frac{ \,\mathrm{d}{}} { \,\mathrm{d}{x} }f(x)+\frac{ \,\mathrm{d}{}} { \,\mathrm{d}{x} }g(x)$。

   证明很简单,留作习题。

定理 2 Leibniz 律

   假设 $f(x)$ 和 $g(x)$ 是两个处处可导的函数,那么 $\frac{ \,\mathrm{d}{}} { \,\mathrm{d}{x} }(f(x)g(x))=f(x)\frac{ \,\mathrm{d}{}} { \,\mathrm{d}{x} }g(x)+g(x)\frac{ \,\mathrm{d}{}} { \,\mathrm{d}{x} }f(x)$

   证明

   我们从定义 3 出发。

\begin{equation} \begin{aligned} \frac{ \,\mathrm{d}{}} { \,\mathrm{d}{x} }(f(x)g(x))=&\lim\limits_{h\to 0}\frac{f(x+h)g(x+h)-f(x)g(x)}{h}\\ =&\lim\limits_{h\to 0}\frac{f(x+h)g(x+h)-f(x+h)g(x)+f(x+h)g(x)-f(x)g(x)}{h}\\ =&\lim\limits_{h\to 0}\frac{f(x+h)g(x+h)-f(x+h)g(x)}{h}+\\&\lim\limits_{h\to 0}\frac{f(x+h)g(x)-f(x)g(x)}{h}\\ =&\lim\limits_{h\to 0}f(x+h)\frac{ \,\mathrm{d}{}} { \,\mathrm{d}{x} }g(x)+g(x)\frac{ \,\mathrm{d}{}} { \,\mathrm{d}{x} }f(x)\\ =&f(x)\frac{ \,\mathrm{d}{}} { \,\mathrm{d}{x} }g(x)+g(x)\frac{ \,\mathrm{d}{}} { \,\mathrm{d}{x} }f(x)~. \end{aligned} \end{equation}

   证毕

   有了这两条性质,我们足以计算很多常见函数的导函数了。

例 3 多项式函数

   多项式是形如 $f(x)=a_0+a_1x+a_2x^2+\cdots+a_nx^n$ 的函数。为了计算其导函数,我们首先要考虑最简单的多项式,$x^n$。

   $f(x)=x$ 的导函数很容易计算,就是处处等于 1。现在,把 $x^2$ 表示为 $f(x)f(x)$,那么根据定理 2 ,其导函数就是 $1\cdot f(x)+1\cdot f(x)=2f(x)=2x$。

   一般地,对于正整数 $n$,$x^n$ 的导函数是 $nx^{n-1}$。这可以通过已知 $x^{n-1}$ 的导函数是 $(n-1)x^{n-2}$ 一步步利用定理 2 归纳得到。

   结合定理 1 ,即可计算出任意多项式函数的导函数了。

2. 链式法则


1. ^ 这一条是保证总能画出割线,因为两点确定一条直线嘛,$a_n=b_n$ 的话这条割线就画不出来了。
2. ^ $x=2$ 处即点 $(2, 4)$。也可以说 $y=4$ 且 $x>0$ 处,但肯定是 $x=2$ 处的说法更方便。
3. ^ 取极限过程就是指,取一系列这样的 $x$ 构成一个数列 $\{x-x_0\}$,且这个数列趋于 $0$。$\lim\limits_{x-x_0\to 0}$ 等价于 $\lim\limits_{x\to x_0}$。
4. ^ 即每一个点上都有导数。

                     

© 小时科技 保留一切权利