贡献者: Relo Stern; addis; Giacomo
在本页中,我们将所有 $m$ 行 $n$ 列的实矩阵组成的集合记为 $\mathbb{R}^{m\times n}$,并记从 $\mathbb{R}^{n}$ 到 $\mathbb{R}^{m}$ 的一切线性变换全体构成的空间为 $L(\mathbb{R}^{n},\mathbb{R}^{m}).$
$\mathbb{R}^{m\times n}$ 中的矩阵与 $L(\mathbb{R}^{n},\mathbb{R}^{m})$
中的线性变换是代数同构的关系。矩阵可以看成线性变换,线性变换在取定一组基底后,可以表示为矩阵。
为明确起见,本页所说的线性变换都是指有限维空间之间的线性变换,即 $L(\mathbb{R}^{n},\mathbb{R}^{m})$ 中的映射。
1. 矩阵的秩与线性变换的联系
定义 1 矩阵的秩
矩阵的秩 既可以定义为其行向量组的秩(称为行秩), 也可以定义为其列向量组的秩(称为 列秩),
这是因为矩阵的行秩和列秩被证明是相等的。
注:矩阵行向量组形成的空间称为 行空间, 行向量组的秩也正是行空间的维数;
列向量组形成的空间称为 列空间, 列向量组的秩也正是列空间的维数。
定义 2 线性变换的秩
线性变换的秩 定义为其像空间的维数。
下面的定理表明,矩阵与线性变换的秩在某种意义下是等同的。
定理 1 像空间 $=$ 列空间
如果将矩阵看成线性变换,那么该变换的像空间的维数,恰是矩阵的列空间的维数。
证明:设 $A\in\mathbb{R}^{m\times n}$, $A$ 也可以看成从 $\mathbb{R}^{n}$ 到 $\mathbb{R}^{m}$
的线性变换,那么取定 $\mathbb{R}^{n}$ 的标准基 $(e_{1},e_{2},\ldots,e_{n})$ 后,
$A$ 的像空间就由 $\{Ae_{1},Ae_{2},\ldots,Ae_{n}\}$ 张成,因此像空间的维数就是 $\{Ae_{1},Ae_{2},\ldots,Ae_{n}\}$
的极大无关组的个数,也就是 $\{Ae_{1},Ae_{2},\ldots,Ae_{n}\}$ 的秩; 而每个 $Ae_{i}$
正好又是矩阵 $A$ 的第 $i$ 列,这就说明了 $A$ 的像空间的维数等于它的列空间的维数。$\square$
注:上述证明过程表明,对于看成线性变换的矩阵来说,其像空间正好就是其列空间。
- 矩阵是行满秩的,当且仅当其线性变换是满射。(行秩等于列秩,列空间等于像空间)
- 矩阵是列满秩的,当且仅当其线性变换是单射。(列空间等于像空间,维数定理,核空间为零)
- 方阵是满秩的,当且仅当它是可逆的,当且仅当其线性变换是双射。
在介绍线性方程组的解的结构性定理时,很多书是采用初等行变换来证明的,这显然是有利于初学者接受的,但是不够优雅. 这里我们仅需巧妙地运用 定理 1 就能导出线性方程组的解的结构,
并且能对齐次和非齐次线性方程组做统一的处理。
定理 2 线性方程组的解的结构性定理
设 $A\in\mathbb{R}^{m\times n},$ $b\in\mathbb{R}^{n\times1}$ 且 $b\neq0$.
① $Ax=0$ 有唯一解(即零解)$\Leftrightarrow$ $\ker A=\{0\}$ $\Leftrightarrow$
$A$ 是单射 $\Leftrightarrow$ $A$ 列满秩 $\Leftrightarrow$ $\mathrm{rank}$
$A=n.$
② $Ax=0$ 有无穷个解(即有非零解)$\Leftrightarrow$ $A$ 不是单射 $\Leftrightarrow$
$A$ 列不满秩 $\Leftrightarrow\mathrm{rank}$ $A< n.$
③ $Ax=b$ 无解 $\Leftrightarrow$ $b\notin\mathrm{Im}A$ $\Leftrightarrow$
$b\notin${$A$ 的列空间} $\Leftrightarrow$ $b$ 无法被 $A$ 的列向量组线性表出
$\Leftrightarrow$ $\mathrm{rank}$ $A<$ $\mathrm{rank}$ $(A:b).$
④ $Ax=b$ 有解 $\Leftrightarrow$ $b\in\mathrm{Im}A$ $\Leftrightarrow$
$b\in${$A$ 的列空间} $\Leftrightarrow$ $b$ 可以被 $A$ 的列向量组线性表出 $\Leftrightarrow$
$\mathrm{rank}$ $A=$ $\mathrm{rank}$ $(A:b).$
⑤ $Ax=b$ 有唯一解 $\Leftrightarrow$ $b\in\mathrm{Im}A$ 且 $A$ 是单射 $\Leftrightarrow$
$\mathrm{rank}$ $A=$ $\mathrm{rank}$ $(A:b)=n$ (结合 ①、④)
⑥ $Ax=b$ 有无穷多解 $\Leftrightarrow$ $b\in\mathrm{Im}A$ 且 $A$ 不是单射
$\Leftrightarrow$ $\mathrm{rank}$ $A=$ $\mathrm{rank}$ $(A:b)< n$
(结合 ②、④)
注:以上结果展示了将矩阵和线性变换视作 代数同构 的强大作用。
习题 1
对非齐次线性方程组 $A_{m\times n}x=b$, 设 $\mathrm{rank}A=r$, 则($\quad$)
$(\mathrm{A})$ $r=m$ 时,方程组 $Ax=b$ 有解
$(\mathrm{B})$ $r=n$ 时,方程组 $Ax=b$ 有唯一解
$(\mathrm{C})$ $n=m$ 时,方程组 $Ax=b$ 有唯一解
$(\mathrm{D})$ $r< n$ 时,方程组 $Ax=b$ 有无穷多解
答案:见末尾1
定理 3
若 $A\in\mathbb{R}^{n\times m}$, $B\in\mathbb{R}^{m\times n}$, 且 $AB=I_n$, 则 $A$ 作为线性算子是满射,$B$ 作为线性算子是单射。
证明:先证 $A$ 是满射。由已知得 $B\in L(\mathbb{R}^{n},\mathbb{R}^{m})$, $A\in L(\mathbb{R}^{m},\mathbb{R}^{n})$.
若 $A$ 不满,$\mathrm{Im}A$ 真包含于 $\mathbb{R}^{n}$ 中,但是 $AB=I_{n}$
说明 $\dim(\mathrm{Im}A)=n$, 矛盾。
再证 $B$ 是单射。若 $Bx=0$, 则 $x=I_{n}x=(AB)x=A(Bx)=A0=0$, 说明 $\mathrm{Ker}B=\{0\}$.
$\square$
上面的定理有如下两个推论:
2. 矩阵与线性变换的范数
线性空间上的范数是指其上的一个满足 非负正定性、正齐次性、三角不等式 的实值函数,记作 $\left\Vert \cdot\right\Vert ~~$
(参见 “范数、赋范空间” 的 定义 1 ). 对 $\mathbb{R}^n$ 中的一个向量 $x$, 我们一般将其看成列向量,并用 $|x|$ 来表示它的 欧氏范数 (也称为 模), 即
$$ |x|=\sqrt{x_1^2+x^2_2+\cdots+x_n^2}, \qquad\forall \,x\in \mathbb{R}^n~.
$$
定义 3 线性变换的范数
设 $A\in L(\mathbb{R}^{n},\mathbb{R}^{m})$, 定义
\[
\left\Vert A\right\Vert =\max_{|x|=1}|A(x)|=\max_{x\neq0}{\displaystyle \frac{|A(x)|}{x}}~.
\]
注:可以证明 $L(\mathbb{R}^{n},\mathbb{R}^{m})$ 中的这个范数不仅满足非负正定性、正齐次性、三角不等式,
还满足
$(\mathrm{iv})$ 向量范数相容性:$\left\Vert A(x)\right\Vert \leqslant\left\Vert A\right\Vert \left|x\right|$;
$(\mathrm{v})$ 复合运算相容性:$\left\Vert B\circ A\right\Vert \leqslant\left\Vert B\right\Vert \left\Vert A\right\Vert $.
定义 4 矩阵的范数
设 $A\in\mathbb{R}^{m\times n}$, 定义
\begin{equation}
\left\Vert A\right\Vert =\max_{|x|=1}|Ax|=\max_{x\neq0}{\displaystyle \frac{|Ax|}{x}}~.
\end{equation}
注:可以证明矩阵的这个范数不仅满足非负正定性、正齐次性、三角不等式,还满足
$(\mathrm{iv})$ 向量范数相容性:$\left\Vert Ax\right\Vert \leqslant\left\Vert A\right\Vert \left|x\right|$;
$(\mathrm{v})$ 乘法运算相容性:$\left\Vert BA\right\Vert \leqslant\left\Vert B\right\Vert \left\Vert A\right\Vert $.
定理 4
矩阵 $A$ 的范数 $\left\Vert A\right\Vert $ 可由以下公式计算:
\[
\left\Vert A\right\Vert =\sqrt{\mu_{1}}~,
\]
其中 $\mu_{1}$ 为矩阵 $A^{T}A$ 的最大本征值。
注:矩阵按 定义 4 所定义的范数称为 矩阵的标准范数. 除此之外,矩阵 $A\in\mathbb{R}^{m\times n}$ 还常用以下范数:
矩阵按(式 1 ) 定义的范数称为矩阵的标准范数。除此之外,矩阵 $A\in\mathbb{R}^{m\times n}$ 常用以下范数:
\[
\left\Vert A\right\Vert _{1}=\max_{1\leqslant j\leqslant m}\{\sum_{i=1}^{n}|a_{ij}|\},\quad\left\Vert A\right\Vert _{\infty}=\max_{1\leqslant i\leqslant n}\{\sum_{j=1}^{n}|a_{ij}|\},\quad\left\Vert A\right\Vert _{F}=\left(\sum_{i,j=1}^{n}|a_{ij}|^{2}\right)^{\frac{1}{2}}~
\]
分别称为矩阵的 列和范数、行和范数、Frobenius 范数 (简称 F 范数).
可以证明,矩阵的范数自然会满足(也应该满足)非负正定性、正齐次性、三角不等式,但是却不一定要满足 $(\mathrm{iv})$ 和 $(\mathrm{v})$。比如,矩阵的列和范数与行和范数都不满足 $(\mathrm{iv})$,但满足 $(\mathrm{v})$;而矩阵的 F 范数则既满足 $(\mathrm{iv})$, 也满足 $(\mathrm{v})$.
定理 5
任意两个矩阵的范数是相互等价的。
注:等价范数的定义参见《范数、赋范空间》一节。
定理 6
设 $A$ 是 $n\times n$ 方阵,且 $\left\Vert A\right\Vert <1$, 则矩阵 $I-A$
可逆,且
\[
I-A=\sum_{k=0}^{\infty}A^{k}~,
\]
即 ${\displaystyle \lim_{k\rightarrow\infty}}\left\Vert I-A-{\displaystyle \sum_{i=0}^{k}A^{i}}\right\Vert =0.$
并且此时成立不等式
\[
\left\Vert (I-A)^{-1}\right\Vert \leqslant{\displaystyle \frac{1}{1-\left\Vert A\right\Vert }~.}
\]
注:这在形式上与等比级数非常像,比如
\[
{\displaystyle \frac{1}{1-x}=1+x+x^{2}+\cdots+x^{k}+\cdots=\sum_{k=0}^{\infty}A^{k}\quad\quad|x|<1}~,\]
推论 1
可逆矩阵的小扰动仍是可逆矩阵;等价地,可逆线性变换的小扰动仍是可逆线性变换。
注: 若矩阵 $A\in\mathbb{R}^{n\times n}$ 可逆,取矩阵 $P\in\mathbb{R}^{n\times n}$
使其范数小于 $\frac{1}{\left\Vert A^{-1}\right\Vert }$, 则
\[
\left\Vert A^{-1}P\right\Vert \leqslant\left\Vert A^{-1}\right\Vert \left\Vert P\right\Vert <\left\Vert A^{-1}\right\Vert \cdot{\displaystyle \frac{1}{\left\Vert A^{-1}\right\Vert }=1~,}
\]
那么根据定理 1 知 $I+A^{-1}P$ 可逆,从而
\[
A+P=A(I+A^{-1}P)~
\]
也可逆。
1. ^ 选 $\mathrm{A}$
致读者: 小时百科一直以来坚持所有内容免费无广告,这导致我们处于严重的亏损状态。 长此以往很可能会最终导致我们不得不选择大量广告以及内容付费等。 因此,我们请求广大读者
热心打赏 ,使网站得以健康发展。 如果看到这条信息的每位读者能慷慨打赏 20 元,我们一周就能脱离亏损, 并在接下来的一年里向所有读者继续免费提供优质内容。 但遗憾的是只有不到 1% 的读者愿意捐款, 他们的付出帮助了 99% 的读者免费获取知识, 我们在此表示感谢。