线性方程组的解

                     

贡献者: ACertainUser; addis; Giacomo

  • 本文处于草稿阶段。
预备知识 线性方程组与增广矩阵,秩—零化度定理(矩阵)

   线性方程组

\begin{equation} \begin{cases} A_{11} x_1 + A_{12} x_2 + \cdots + A_{1N} x_N &= b_1 \\ A_{21} x_1 + A_{22} x_2 + \cdots + A_{2N} x_N &= b_2 \\ &\vdots \\ A_{M1} x_1 + A_{M2} x_2 + \cdots + A_{MN} x_N &= b_M \end{cases} ~ \end{equation}
可以记为
\begin{equation} \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{b}} ~, \end{equation}
或者增广矩阵 $ \begin{pmatrix} \boldsymbol{\mathbf{A}} \mid \boldsymbol{\mathbf{b}} \end{pmatrix} $;其中 $ \boldsymbol{\mathbf{A}} $ 是 $M \times N$ 的矩阵,$ \boldsymbol{\mathbf{x}} $ 是 $N$ 维列矢量,$ \boldsymbol{\mathbf{b}} $ 是 $M$ 维列矢量,$ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} $ 表示矩阵与列矢量相乘(式 8 )。$ \boldsymbol{\mathbf{A}} $ 和 $ \boldsymbol{\mathbf{b}} $ 是已知的,$ \boldsymbol{\mathbf{x}} $ 是未知的,被称为方程组的解(solution)

   线性方程组可以有零个解(无解)、一个解(唯一解)或无数解;但不可能只有 $2,3,4,\dots$ 个解。

1. 线性方程组的几何含义

   可以分别从行与列的角度来理解线性方程组的几何含义。1更深刻、数学的表示可以见线性方程组的仿射解释

行视角

   线性方程组

\begin{equation} \begin{cases} A_{11} x_1 + A_{12} x_2 + \cdots + A_{1N} x_N &= b_1 \\ A_{21} x_1 + A_{22} x_2 + \cdots + A_{2N} x_N &= b_2 \\ &\vdots \\ A_{M1} x_1 + A_{M2} x_2 + \cdots + A_{MN} x_N &= b_M \end{cases} ~ \end{equation}
的每一行方程的解集是 $N$ 维空间中的 $N-1$ 维子空间,称为超平面(比如二维空间中的超平面就是直线,三维空间中的超平面是通常的平面等),方程组的解就是这些超平面的交集。

例 1 

   例如,求解 $$ \begin{cases} 2x_1-x_2=0 \\ -x_1+2_2=3~. \\ \end{cases} $$

图
图 1:行视角下的线性方程组。解可以理解为直线的交点。仿自 Strang 的《线性代数》

   从这个角度可以很直观的理解 “无解”、“无数解”。很显然,一组直线不能仅有两个交点,所以线性方程组也不可能只有两个解。

图
图 2:“无解(没有交点)”、“唯一解(有唯一交点)”、“无数解(有无数交点)”

   另一方面,从用分块矩阵的视角,我们可以将 $ \boldsymbol{\mathbf{A}} $ 划分为 $M$ 个 $N$ 维行向量 $ \boldsymbol{\mathbf{\alpha}} _1, \boldsymbol{\mathbf{\alpha}} _2, \cdots, \boldsymbol{\mathbf{\alpha}} _M$, $$ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{b}} \Leftrightarrow \begin{pmatrix} \boldsymbol{\mathbf{\alpha}} _1 \\ \boldsymbol{\mathbf{\alpha}} _2 \\ \vdots \\ \boldsymbol{\mathbf{\alpha}} _M \end{pmatrix} \boldsymbol{\mathbf{x}} = \begin{pmatrix} b_1 \\ b_2 \\ \vdots \\ b_M \end{pmatrix} \Leftrightarrow \begin{cases} b_1 &= \boldsymbol{\mathbf{\alpha}} _1 \boldsymbol{\mathbf{x}} \\ b_2 &= \boldsymbol{\mathbf{\alpha}} _2 \boldsymbol{\mathbf{x}} \\ &\vdots \\ b_M &= \boldsymbol{\mathbf{\alpha}} _M \boldsymbol{\mathbf{x}} \end{cases}~ $$ 这样表述更加简洁。

列视角

   运用分块矩阵的视角,将 $ \boldsymbol{\mathbf{A}} $ 划分为 $N$ 个 $M$ 维列向量 $ \boldsymbol{\mathbf{\alpha}} _1, \boldsymbol{\mathbf{\alpha}} _2, \cdots \boldsymbol{\mathbf{\alpha}} _N$, $$ \begin{aligned} \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{b}} &\Leftrightarrow \begin{pmatrix} \boldsymbol{\mathbf{\alpha}} _1 & \boldsymbol{\mathbf{\alpha}} _2 & \cdots & \boldsymbol{\mathbf{\alpha}} _N \end{pmatrix} \begin{pmatrix} x_{1} \\ x_{2} \\ \vdots \\ x_{N} \end{pmatrix} = \boldsymbol{\mathbf{b}} \\ &\Leftrightarrow \boldsymbol{\mathbf{\alpha}} _1 x_1 + \boldsymbol{\mathbf{\alpha}} _2 x_2 + \cdots + \boldsymbol{\mathbf{\alpha}} _N x_N = \boldsymbol{\mathbf{b}} \end{aligned} ~ $$ 此时,$ \boldsymbol{\mathbf{b}} $ 可以看作是一系列 $ \boldsymbol{\mathbf{\alpha}} _i$ 的线性组合,而解 $ \boldsymbol{\mathbf{x}} $ 是各个列向量的 “系数”。方程组无解的含义即为 “$ \boldsymbol{\mathbf{b}} $ 不能由 $ \boldsymbol{\mathbf{\alpha}} _i$ 线性组合得到”,无数解的含义即为 “有无数种方法线性组合 $ \boldsymbol{\mathbf{\alpha}} _i$ 以得到 $ \boldsymbol{\mathbf{b}} $”,这暗示了这一系列 $ \boldsymbol{\mathbf{\alpha}} _i$ 中存在线性相关的项。

例 2 

   还是例如求解 $$ \begin{pmatrix}2 & -1 \\ -1 & 2\end{pmatrix} \begin{pmatrix}x_1 \\ x_2\end{pmatrix} = \begin{pmatrix}0 \\ 3\end{pmatrix} ~, $$ 即 $$ \begin{pmatrix}2 \\ -1\end{pmatrix} x_1 + \begin{pmatrix}-1 \\ 2\end{pmatrix} x_2 = \begin{pmatrix}0 \\ 3\end{pmatrix} ~. $$

图
图 3:列视角下的线性方程组。解可理解为各列向量的“系数”。仿自 Strang 的《线性代数》

   可见任意向量都能由 $ \begin{pmatrix}2 \\ -1\end{pmatrix} $ 和 $ \begin{pmatrix}-1 \\ 2\end{pmatrix} $ 的线性组合得到,包括了 $ \begin{pmatrix}0 \\ 3\end{pmatrix} $。

   看起来,在线性方程组中,矩阵 $ \boldsymbol{\mathbf{A}} $ 的行向量与列向量存在一种微妙的关联。

2. 判断线性方程组解的个数

图
图 4:$Ax=b$ 的解

  

未完成:需要引用《秩—零化度定理(矩阵)》

   关于线性方程组的解,我们有如下定理。记 m 为 $ \boldsymbol{\mathbf{A}} $ 的行数,n 为 $ \boldsymbol{\mathbf{A}} $ 的列数,r 为 $ \boldsymbol{\mathbf{A}} $ 的矩阵的秩。可参考图 4 的分类。

定理 1 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{b}} $ 解的唯一性

   若 $n-r=0$,若解存在,则解唯一。

   若 $n-r>0$,若解存在,则解不唯一。

   n-r 事实上是 $ \boldsymbol{\mathbf{A}} $ 的零空间的基个数 $ \operatorname {dim}( \operatorname {Nul}( \boldsymbol{\mathbf{A}} ))=n-r$。

定理 2 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{b}} $ 解的存在性

   若 $m-r=0$,则解一定存在。

   若 $m-r>0$,则解可能不存在。

   m-r 事实上是 $ \boldsymbol{\mathbf{A}} $ 的左零空间的基个数 $dim(Nul( \boldsymbol{\mathbf{A}} ^T))=m-r$。

定理 3 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{b}} $ 解的存在性 2

   若 $ \boldsymbol{\mathbf{b}} $ 是 $ \boldsymbol{\mathbf{A}} $ 的列向量的线性组合($ \boldsymbol{\mathbf{b}} \in Col( \boldsymbol{\mathbf{A}} )$),则 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{b}} $ 一定存在解;否则无解。

   由列视角(子节 1 )看,这是显然的。

推论 1 

   设 $\overline{ \boldsymbol{\mathbf{A}} } = [ \boldsymbol{\mathbf{A}} | \boldsymbol{\mathbf{b}} ] $ 为 A 的增广矩阵。

   $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{b}} $ 无解:$ \operatorname {rank}(\overline{ \boldsymbol{\mathbf{A}} })= \operatorname {rank}( \boldsymbol{\mathbf{A}} )+1$

   唯一解:$ \operatorname {rank}(\overline{ \boldsymbol{\mathbf{A}} })= \operatorname {rank}( \boldsymbol{\mathbf{A}} )=n$

   无数解:$ \operatorname {rank}(\overline{ \boldsymbol{\mathbf{A}} })= \operatorname {rank}( \boldsymbol{\mathbf{A}} )< n$

   考虑到秩的含义,结合上述定理,也容易理解该推论。

定理 4 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{0}} $ 解的唯一性

   若 $n-r=0$,则只有一个解 $ \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{0}} $.

   若 $n-r>0$,则解不唯一,且存在(n-r)个线性无关的解。

   这(n-r)个解即为零空间的(n-r)个基。

定理 5 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} =0$ 解的存在性

   一定存在平凡解 $ \boldsymbol{\mathbf{x}} =0$

定理 6 解的结构

   $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{b}} $ 的通解等于 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{b}} $ 的一个特解加上 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} =0$ 的各个线性无关的解的线性组合,即 $ \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{x}} _p +k_1 \boldsymbol{\mathbf{x}} _{n1}+k_2 \boldsymbol{\mathbf{x}} _{n2}+\cdots$

   因此,通常的解题套路是先求解 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{b}} $ 的一个特解,再求解 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} =0$ 的各个线性无关的解。

   (若 n-r=0,则 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} =0$ 仅有解 $ \boldsymbol{\mathbf{x}} _n=0$,$ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{b}} $ 自然只有一个解 $ \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{x}} _p$)

   更深入的探讨详见下文:

   从矢量空间的角度来看,$ \boldsymbol{\mathbf{x}} $ 是一个 $N$ 维矢量空间(以下称为 $X$ 空间)中一个矢量关于某组基底的坐标,$ \boldsymbol{\mathbf{b}} $ 是一个 $M$ 维矢量空间(以下称为 $Y$ 空间)中一个矢量关于某组基底的坐标。矩阵 $ \boldsymbol{\mathbf{A}} $ 可以将 $X$ 空间中的任意矢量映射到 $Y$ 后的坐标。

   我们知道 $ \boldsymbol{\mathbf{A}} $ 的第 $i$ 列代表的矢量就是 $X$ 空间中的第 $i$ 个基底映射到 $Y$ 空间的对应矢量。我们把 $A$ 的 $N$ 列对应的 $N$ 个矢量记为 $\{ \boldsymbol{\mathbf{\alpha}} _i\}$。先来看一个定理

3. 满秩方阵

   我们知道矩阵的秩 $R$ 等于线性无关的行数或列数,下面来根据秩来分类讨论方程组的解空间结构。最简单的情况是 $ \boldsymbol{\mathbf{A}} $ 为满秩,即 $R = M = N$。这时由于 $\{ \boldsymbol{\mathbf{\alpha}} _i\}$ 两两线性无关,它们可以作为 $Y$ 空间的一组基底,与 $X$ 空间的基底一一对应。那么这个映射既是单射又是满射。对于 $Y$ 空间的任意矢量 $ \boldsymbol{\mathbf{b}} $,$X$ 空间都存在唯一的解 $ \boldsymbol{\mathbf{x}} $。特殊地,当 $ \boldsymbol{\mathbf{b}} = \boldsymbol{\mathbf{0}} $ 时(即方程是齐次的),唯一解就是 $ \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{0}} $。

4. $R = M < N$

   当 $ \boldsymbol{\mathbf{A}} $ 的秩等于 $M$ 且小于 $N$ 时,映射变为从 $N$ 维空间到更小的 $M$ 维空间。即非单射:虽然任意的 $ \boldsymbol{\mathbf{x}} $ 仍然映射到唯一的 $ \boldsymbol{\mathbf{b}} $,但任意的 $ \boldsymbol{\mathbf{b}} $ 却对应无穷多个 $ \boldsymbol{\mathbf{x}} $。

  

未完成:引用矩阵版本的零空间
当方程是齐次的时候,零空间 $X_0$ 是 $N- M$ 维的(为什么?)。这种情况下,我们希望能解出零空间的 $N - M$ 个基底,使得这组基底的任意线性组合都是齐次方程的解。

   对于非齐次方程,我们可以先求对应的齐次方程组的零空间的一组基底,再求出非齐次方程的任意一个解(特解),那么非齐次方程组的解集(所有解的集合)就等于零空间中的所有矢量与特解相加。注意非齐次方程的解集并不构成一个矢量空间,因为它不包含零矢量($ \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{0}} $ 总是对应 $ \boldsymbol{\mathbf{b}} = \boldsymbol{\mathbf{0}} $,所以不可能是非齐次方程组的解),解集中若干矢量的线性组合也不一定仍然属于解集。

未完成:证明

5. $R < M$

   当 $R < M$ 时,$\{ \boldsymbol{\mathbf{\alpha}} _i\}$ 中只有 $R$ 个线性无关,它们在 $Y$ 空间中张成一个 $R$ 维子空间 $Y_0$。如果 $ \boldsymbol{\mathbf{b}} $ 在 $Y_0$ 中(可以通过 $ \boldsymbol{\mathbf{b}} $ 是否与 $\{ \boldsymbol{\mathbf{\alpha}} _i\}$ 线性无关来判断),方程组就存在解,如果落在子空间外,方程组就无解。

  2


1. ^ 本文参考了 Gilbert Strang 的《线性代数》课程,J. Leon 的 Linear Algebra with Applications,以及李永乐等的线代考研课程
2. ^ 另见 “线性变换与矩阵的代数关系” 的 定理 2

                     

© 小时科技 保留一切权利