线性方程组解的结构

                     

贡献者: ACertainUser; addis

  • 本词条处于草稿阶段.
预备知识 矩阵与线性变换,高斯消元法,矩阵的秩

   线性方程组可以记为

\begin{equation} \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{y}} \end{equation}
其中 $ \boldsymbol{\mathbf{A}} $ 是 $M \times N$ 的矩阵,$ \boldsymbol{\mathbf{x}} $ 是 $N$ 维列矢量,$ \boldsymbol{\mathbf{y}} $ 是 $M$ 维列矢量,$ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} $ 表示矩阵与列矢量相乘(式 4 ).$ \boldsymbol{\mathbf{A}} $ 和 $ \boldsymbol{\mathbf{y}} $ 是已知的,$ \boldsymbol{\mathbf{x}} $ 是未知的,被称为方程组的解(solution)

   正如你所知道的那样,线性方程组 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{y}} $ 可以有零个解(无解)、一个解(唯一解)或无数解;但不能有只有两个解,等等.

1. 线性方程组的几何含义

   可以分别从行与列的角度来理解线性方程组的几何含义.1更深刻、数学的表示可以见线性方程组的仿射解释

行视角

   $$ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{y}} \Leftrightarrow \begin{pmatrix} A_{11}&A_{12}&A_{13}&...\\ A_{11}&A_{12}&A_{13}&...\\ A_{11}&A_{12}&A_{13}&...\\ ... \end{pmatrix} \begin{pmatrix} x_{1}\\ x_{2}\\ x_{3}\\ ...\\ \end{pmatrix} = \begin{pmatrix} y_{1}\\ y_{2}\\ y_{3}\\ ...\\ \end{pmatrix} \Leftrightarrow \begin{cases} y_1&=A_{11}x_1+A_{12}x_2+A_{13}x_3+...\\ y_2&=A_{21}x_1+A_{22}x_2+A_{23}x_3+...\\ y_3&=A_{31}x_1+A_{32}x_2+A_{33}x_3+...\\ ...&\\ \end{cases} $$

   这相当于求解一组线性方程.其中每一条方程可以看作某种(高维)直线,方程组的解就是这些直线的交点.

例 1 

   例如,求解 $$ \begin{pmatrix} 2&-1\\ -1&2\\ \end{pmatrix} \begin{pmatrix} x_1\\ x_2\\ \end{pmatrix} = \begin{pmatrix} 0\\ 3\\ \end{pmatrix} $$ 即 $$ \begin{cases} 2x_1-x_2=0\\ -x_1+2_2=3\\ \end{cases} $$

图
图 1:行视角下的线性方程组.解可以理解为直线的交点.仿自 Strang 的《线性代数》

   从这个角度可以很直观的理解 “无解”、“无数解”.很显然,一组直线不能仅有两个交点,所以线性方程组也不可能只有两个解.

图
图 2:“无解(没有交点)”、“唯一解(有唯一交点)”、“无数解(有无数交点)”

   或者用分块矩阵的视角,将 $ \boldsymbol{\mathbf{A}} $ 划分为若干行向量 $ \boldsymbol{\mathbf{\alpha}} _1, \boldsymbol{\mathbf{\alpha}} _2, \boldsymbol{\mathbf{\alpha}} _3...$,让表述变得更加简洁. $$ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{y}} \Leftrightarrow \begin{pmatrix} \boldsymbol{\mathbf{\alpha}} _1\\ \boldsymbol{\mathbf{\alpha}} _2\\ \boldsymbol{\mathbf{\alpha}} _3\\ ... \end{pmatrix} \boldsymbol{\mathbf{x}} = \begin{pmatrix} y_{1}\\ y_{2}\\ y_{3}\\ ...\\ \end{pmatrix} \Leftrightarrow \begin{cases} y_1&= \boldsymbol{\mathbf{\alpha}} _1 \boldsymbol{\mathbf{x}} \\ y_2&= \boldsymbol{\mathbf{\alpha}} _2 \boldsymbol{\mathbf{x}} \\ y_3&= \boldsymbol{\mathbf{\alpha}} _3 \boldsymbol{\mathbf{x}} \\ ...&\\ \end{cases} $$

列视角

   运用分块矩阵的视角,将 $ \boldsymbol{\mathbf{A}} $ 划分为若干列向量 $ \boldsymbol{\mathbf{\alpha}} _1, \boldsymbol{\mathbf{\alpha}} _2, \boldsymbol{\mathbf{\alpha}} _3...$ $$ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{y}} \Leftrightarrow \begin{pmatrix} \boldsymbol{\mathbf{\alpha}} _1& \boldsymbol{\mathbf{\alpha}} _2& \boldsymbol{\mathbf{\alpha}} _3&... \end{pmatrix} \begin{pmatrix} x_{1}\\ x_{2}\\ x_{3}\\ ...\\ \end{pmatrix} = \boldsymbol{\mathbf{y}} \Leftrightarrow \boldsymbol{\mathbf{y}} = \boldsymbol{\mathbf{\alpha}} _1 x_1+ \boldsymbol{\mathbf{\alpha}} _2 x_2+ \boldsymbol{\mathbf{\alpha}} _3 x_3+... $$ 此时,$ \boldsymbol{\mathbf{y}} $ 可以看作是一系列 $ \boldsymbol{\mathbf{\alpha}} _i$ 的线性组合,而解 $ \boldsymbol{\mathbf{x}} $ 是各个列向量的 “系数”.方程组无解的含义即为 “$ \boldsymbol{\mathbf{y}} $ 不能由 $ \boldsymbol{\mathbf{\alpha}} _i$ 线性组合得到”,无数解的含义即为 “有无数种方法线性组合 $ \boldsymbol{\mathbf{\alpha}} _i$ 以得到 $ \boldsymbol{\mathbf{y}} $”,这暗示了这一系列 $ \boldsymbol{\mathbf{\alpha}} _i$ 中存在线性相关的项.

例 2 

   还是例如求解 $$ \begin{pmatrix} 2&-1\\ -1&2\\ \end{pmatrix} \begin{pmatrix} x_1\\ x_2\\ \end{pmatrix} = \begin{pmatrix} 0\\ 3\\ \end{pmatrix} $$ 即 $$ \begin{pmatrix} 2\\ -1\\ \end{pmatrix} x_1 + \begin{pmatrix} -1\\ 2\\ \end{pmatrix} x_2 = \begin{pmatrix} 0\\ 3\\ \end{pmatrix} $$

图
图 3:列视角下的线性方程组.解可理解为各列向量的“系数”.仿自 Strang 的《线性代数》

   看起来,在线性方程组中,矩阵 $ \boldsymbol{\mathbf{A}} $ 的行向量与列向量存在一种微妙的关联.

2. 线性方程组的解的结构

图
图 4:$Ax=b$ 的解

  

未完成:需要补充证明

   关于线性方程组的解,我们有如下定理.记 m 为 $ \boldsymbol{\mathbf{A}} $ 的行数,n 为 $ \boldsymbol{\mathbf{A}} $ 的列数,r 为 $ \boldsymbol{\mathbf{A}} $ 的矩阵的秩.可参考图 4 的分类.

定理 1 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{y}} $ 解的唯一性

   若 $n-r=0$,若解存在,则解唯一.

   若 $n-r > 0$,若解存在,则解不唯一.

   n-r 事实上是 $ \boldsymbol{\mathbf{A}} $ 的零空间的基个数 $dim(Nul( \boldsymbol{\mathbf{A}} ))=n-r$.

定理 2 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{y}} $ 解的存在性

   若 $m-r=0$,则解一定存在.

   若 $m-r > 0$,则解可能不存在.

   m-r 事实上是 $ \boldsymbol{\mathbf{A}} $ 的左零空间的基个数 $dim(Nul( \boldsymbol{\mathbf{A}} ^T))=m-r$.

定理 3 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{y}} $ 解的存在性 2

   若 $ \boldsymbol{\mathbf{y}} $ 是 $ \boldsymbol{\mathbf{A}} $ 的列向量的线性组合($ \boldsymbol{\mathbf{y}} \in Col( \boldsymbol{\mathbf{A}} )$),则 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{y}} $ 一定存在解;否则无解.

   由列视角(子节 1 )看,这是显然的.

推论 1 

   设 $\overline{ \boldsymbol{\mathbf{A}} } = [ \boldsymbol{\mathbf{A}} | \boldsymbol{\mathbf{y}} ] $ 为 A 的增广矩阵.

   $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{y}} $ 无解:$rank(\overline{ \boldsymbol{\mathbf{A}} })=rank( \boldsymbol{\mathbf{A}} )+1$

   唯一解:$rank(\overline{ \boldsymbol{\mathbf{A}} })=rank( \boldsymbol{\mathbf{A}} )=n$

   无数解:$rank(\overline{ \boldsymbol{\mathbf{A}} })=rank( \boldsymbol{\mathbf{A}} ) < n$

   考虑到秩的含义,结合上述定理,也容易理解该推论.

定理 4 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{0}} $ 解的唯一性

   若 $n-r=0$,则只有一个解 $ \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{0}} $.

   若 $n-r > 0$,则解不唯一,且存在(n-r)个线性无关的解.

   这(n-r)个解即为零空间的(n-r)个基.

定理 5 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} =0$ 解的存在性

   一定存在平凡解 $ \boldsymbol{\mathbf{x}} =0$

定理 6 解的结构

   $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{y}} $ 的通解等于 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{y}} $ 的一个特解加上 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} =0$ 的各个线性无关的解的线性组合,即 $ \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{x}} _p +k_1 \boldsymbol{\mathbf{x}} _{n1}+k_2 \boldsymbol{\mathbf{x}} _{n2}+...$

   因此,通常的解题套路是先求解 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{y}} $ 的一个特解,再求解 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} =0$ 的各个线性无关的解.

   (若 n-r=0,则 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} =0$ 仅有解 $ \boldsymbol{\mathbf{x}} _n=0$,$ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{y}} $ 自然只有一个解 $ \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{x}} _p$)

   更深入的探讨详见下文:

   从矢量空间的角度来看,$ \boldsymbol{\mathbf{x}} $ 是一个 $N$ 维矢量空间(以下称为 $X$ 空间)中一个矢量关于某组基底的坐标,$ \boldsymbol{\mathbf{y}} $ 是一个 $M$ 维矢量空间(以下称为 $Y$ 空间)中一个矢量关于某组基底的坐标.矩阵 $ \boldsymbol{\mathbf{A}} $ 可以将 $X$ 空间中的任意矢量映射到 $Y$ 后的坐标.

   我们知道 $ \boldsymbol{\mathbf{A}} $ 的第 $i$ 列代表的矢量就是 $X$ 空间中的第 $i$ 个基底映射到 $Y$ 空间的对应矢量.我们把 $A$ 的 $N$ 列对应的 $N$ 个矢量记为 $\{ \boldsymbol{\mathbf{\alpha}} _i\}$.先来看一个定理

3. 满秩方阵

   我们知道矩阵的秩 $R$ 等于线性无关的行数或列数,下面来根据秩来分类讨论方程组的解空间结构.最简单的情况是 $ \boldsymbol{\mathbf{A}} $ 为满秩,即 $R = M = N$.这时由于 $\{ \boldsymbol{\mathbf{\alpha}} _i\}$ 两两线性无关,它们可以作为 $Y$ 空间的一组基底,与 $X$ 空间的基底一一对应.那么这个映射既是单射又是满射.对于 $Y$ 空间的任意矢量 $ \boldsymbol{\mathbf{y}} $,$X$ 空间都存在唯一的解 $ \boldsymbol{\mathbf{x}} $.特殊地,当 $ \boldsymbol{\mathbf{y}} = \boldsymbol{\mathbf{0}} $ 时(即方程是齐次的),唯一解就是 $ \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{0}} $.

4. $R = M < N$

   当 $ \boldsymbol{\mathbf{A}} $ 的秩等于 $M$ 且小于 $N$ 时,映射变为从 $N$ 维空间到更小的 $M$ 维空间.即非单射:虽然任意的 $ \boldsymbol{\mathbf{x}} $ 仍然映射到唯一的 $ \boldsymbol{\mathbf{y}} $,但任意的 $ \boldsymbol{\mathbf{y}} $ 却对应无穷多个 $ \boldsymbol{\mathbf{x}} $.

   当方程是齐次的时候,零空间(定理 2 )$X_0$ 是 $N- M$ 维的(为什么?).这种情况下,我们希望能解出零空间的 $N - M$ 个基底,使得这组基底的任意线性组合都是齐次方程的解.

   对于非齐次方程,我们可以先求对应的齐次方程组的零空间的一组基底,再求出非齐次方程的任意一个解(特解),那么非齐次方程组的解集(所有解的集合)就等于零空间中的所有矢量与特解相加.注意非齐次方程的解集并不构成一个矢量空间,因为它不包含零矢量($ \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{0}} $ 总是对应 $ \boldsymbol{\mathbf{y}} = \boldsymbol{\mathbf{0}} $,所以不可能是非齐次方程组的解),解集中若干矢量的线性组合也不一定仍然属于解集.

未完成:证明

5. $R < M$

   当 $R < M$ 时,$\{ \boldsymbol{\mathbf{\alpha}} _i\}$ 中只有 $R$ 个线性无关,它们在 $Y$ 空间中张成一个 $R$ 维子空间 $Y_0$.如果 $ \boldsymbol{\mathbf{y}} $ 在 $Y_0$ 中(可以通过 $ \boldsymbol{\mathbf{y}} $ 是否与 $\{ \boldsymbol{\mathbf{\alpha}} _i\}$ 线性无关来判断),方程组就存在解,如果落在子空间外,方程组就无解.

  2


1. ^ 本文参考了 Gilbert Strang 的《线性代数》课程,J. Leon 的 Linear Algebra with Applications,以及李永乐等的线代考研课程
2. ^ see also 《线性变换与矩阵的代数关系》一节的 定理 2


致读者: 小时百科一直以来坚持所有内容免费,这导致我们处于严重的亏损状态。 长此以往很可能会最终导致我们不得不选择大量广告以及内容付费等。 因此,我们请求广大读者热心打赏 ,使网站得以健康发展。 如果看到这条信息的每位读者能慷慨打赏 10 元,我们一个星期内就能脱离亏损, 并保证在接下来的一整年里向所有读者继续免费提供优质内容。 但遗憾的是只有不到 1% 的读者愿意捐款, 他们的付出帮助了 99% 的读者免费获取知识, 我们在此表示感谢。

                     

友情链接: 超理论坛 | ©小时科技 保留一切权利