线性映射

                     

贡献者: addis; Giacomo; JierPeter

  • 重整中:线性变换和线性映射改为同义词
预备知识 子空间

1. 概念的引入

   线性空间是一种集合,自然可以考虑其上各种各样的映射。比如在几何向量空间中,向量 $ \boldsymbol{\mathbf{v}} $ 有长度,表示为 $\lVert \boldsymbol{\mathbf{v}} \rVert$,我们可以定义映射 $f( \boldsymbol{\mathbf{v}} )=\lVert \boldsymbol{\mathbf{v}} \rVert \boldsymbol{\mathbf{v}} $,也就是把每个向量都伸长,伸长倍数恰为自己的长度。

   可线性空间又不仅仅是个集合,它还有线性结构,即数乘和加法运算。上述 $f$ 并不能体现线性结构的威力,因为它不能保持线性结构——所谓保持线性结构,就是 “线性组合与映射可交换”。

   比如说,考虑三维几何向量的投影变换,记为 $\pi$。任取若干向量 $ \boldsymbol{\mathbf{v}} _i$,它们的线性组合 $\sum_{i}a_i \boldsymbol{\mathbf{v}} _i$ 也是一个向量。你可以先将 $ \boldsymbol{\mathbf{v}} _i$ 组合起来,再将结果用 $\pi$ 投影,得到 $\pi \left(\sum_{i}a_i \boldsymbol{\mathbf{v}} _i \right) $;也可以先将每个 $ \boldsymbol{\mathbf{v}} _i$ 投影为 $\pi( \boldsymbol{\mathbf{v}} _i)$,再用同一组系数 $a_i$ 做组合,得到 $\sum_{i}a_i\pi( \boldsymbol{\mathbf{v}} _i)$。验算一下,两条路是不是殊途同归?这就叫保持线性结构。

   保持线性结构的映射体现了线性性的威力,也是线性代数的核心之一。

2. 线性映射

定义 1 线性映射

   给定域 $\mathbb F$(通常取实数域 $\mathbb R$ 或复数域 $\mathbb C$)上的线性空间 $V$ 和 $U$。如果有映射 $f:V\rightarrow U$ 满足:对于任意的向量 ${v}_1, {v}_2\in V$ 和标量 $c_1, c_2 \in \mathbb{F}$,都有

\begin{equation} f(c_1 {v}_1+c_2 {v}_2)=c_1f({v}_1)+c_2f({v}_2)~. \end{equation}
则称 $f$ 是 $V$ 到 $U$ 的一个线性映射(linear map),也叫线性变换(linear transform)

   特殊地,把 $f:V\to V$ 称为线性算子(linear operator),“算子” 也叫 “算符”。

   注意一些材料中只把 $f:V\to V$ 称为线性变换,小时百科以定义 1 为准。

   定义 1 的内涵比看上去广一些,不仅仅是对 $V$ 中两个向量的线性组合成立。容易证明对于任意的一组有限个向量 $\{v_i\}\subseteq V$ 和一组对应的标量 $\{c_i\}\subseteq\mathbb{F}$,都有

\begin{equation} f \left(\sum_i c_i v_i \right) =\sum_i c_i f(v_i)~. \end{equation}
特殊地,若令所有 $c_i = 0$ 可得

推论 1 

   线性映射 $f:V\to U$ 总把 $0 \in V$ 映射到 $0 \in U$。

习题 1 几何矢量的线性变换

   请证明 $N$ 维几何线性空间 $V_N$ 中,以下变换 $f:V\to V$ 都是线性变换:

  • 缩放:把矢量乘以一个固定标量 $\lambda$。
  • 旋转:把矢量绕任意固定轴逆时针旋转固定角度 $\theta$。
  • 镜像:把矢量关于某条过原点的固定直线做镜像对称。
  • 投影:把二维矢量垂直投影到过原点的固定直线,或者把三维矢量垂直投影到过原点的平面(也可以拓展到 $N$ 维空间中的矢量投影到 $N-1$ 维平面)。
  • 以上几种变换的任意组合。

   注意在以上映射中,除了投影外都是双射,且都把零向量映射到零向量。多对一映射也会把一些非零向量映射到零向量。

习题 2 

   请证明两个线性映射 $f, g$ 的复合映射 $f \circ g$ 仍然是线性映射。注意 $f$ 的值域必须是 $g$ 的定义域的子集。

   在映射中,我们把一个映射的像定义为值域中所有被映射到的元素的集合。

定义 2 值空间

   线性映射 $f:V\to U$ 的像 $M = f(V) \subseteq U$ 是一个线性空间,即 $U$ 的子空间。称为 $f$ 的值空间(range space)。在不造成歧义的情况下我们也可以把该映射记为 $f: V\to M \subseteq U$。

   我们把值空间的维度称为线性映射 $f$ 的,记做 $ \operatorname {rank}(f)$。

   证明留作习题,使用线性空间的定义即可。

   反过来,我们可以定义所有映射到零向量的元素的集合。

定义 3 零空间

   给定线性映射 $f:V\to U$,$V$ 中被变映射到 $U$ 中零向量的全体向量所构成的集合 $\{v\in V|f(v)= 0\}$ 构成 $V$ 的子空间,称为 $f$ 的零空间(null space),也称为零化子空间零化子,记做 $ \operatorname {null} (f)$ 或 $\ker{f}$。

   我们把零空间的维度($ \operatorname {dim}( \operatorname {null}(f))$)称为线性映射 $f$ 的零化度,记做 $ \operatorname {nullity}(f)$。

   证明留做习题:只需要根据定义证明 $\{v\in V|f(v)= 0\}$ 是一个线性空间即可。

  

未完成:这两段应该放到后面展开讲解,太浓缩
如果 $\{{e}_i\}_{i=1}^n$ 是 $V$ 的一组基底,那么任意 $v\in V$ 都可以唯一地表示为 $v=\sum_i c_i {e}_i$ 的形式,其中 $c_i\in\mathbb{F}$。这样,由于线性性,$f(v)=\sum_ic_if({e}_i)$。也就是说,只需要知道了基向量被 $f$ 映射到哪里,也就可以计算出任意向量映射到哪里。于是,和线性函数一样,确定一个线性映射的时候,我们最多只能自由选择基向量映射到哪里,只不过这里的函数值不再是数字,而是 $U$ 中的向量。

   在向量空间的表示中我们还会看到,选定两个空间的基以后,一个线性映射也可以看成是多个线性函数的排列,因此线性映射和线性函数性质很相似。线性函数是一种特殊的线性映射,$V$ 上的所有线性函数组成的向量空间叫做对偶空间

3. 线性方程的解

定义 4 线性方程

   对给定的线性映射 $A:X\to Y$ 和 $b \in Y$,线性方程为 $A (x) = b$;所有满足该式的 $x \in X$ 的集合 $X_s$ 叫做方程的解集

   首先注意 $A$ 未必把 $Y$ 中的每个元素都射中,即值空间 $A(X) \subseteq Y$ 只是 $Y$ 的一个子空间。所以只有 $b \in A(X)$ 时方程有解,否则无解(解集为空集)。用映射的语言,解集 $X_s$ 就是集合 $ \left\{b \right\} $ 的逆像 $A^{-1}( \left\{b \right\} )$。

   当 $b = 0$ 时方程叫做算符 $A$ 的齐次方程。齐次方程的解就是映射的零空间(定义 3 )。1

定理 1 

   线性方程 $A (x) = b$ 的解集可以表示为

\begin{equation} X_s = X_0 + x_1~. \end{equation}
其中 $x_1$ 为 $X_s$ 中的任意元素, $X_0$ 为映射的零空间。

   说明:$X_0 + x_1 = \{x \in x_1 \mid x \in X_0\}$ 表示把 $X_0$ 中的每一个向量与 $x_1$ 相加得到的集合。易证当 $x_1 \ne 0$ 时解集 $X_s$ 不是一向量个子空间(因为不包含零向量)。

   首先证明集合 $X_0 + x_1$ 中的元素满足 $Ax = b$。令任意 $x_0 \in X_0$

\begin{equation} A(x_0 + x_1) = Ax_0 + Ax_1 = 0 + b = b~, \end{equation}
证毕。再来证明解集中不存在 $X_0 + x_1$ 之外的向量。令 $x_2 \in X_S$ 且 $x_2 \ne x_1$,那么
\begin{equation} A(x_2 - x_1) = Ax_2 - Ax_1 = b - b = 0~, \end{equation}
即 $x_2 - x_1 \in X_0$,即 $x_2 \in x_1 + X_0$。证毕。

   到此为止我们就可以非常清晰地勾画出多对一线性映射的结构了 $A: X \to Y$。我们先找到定理 1 中的零空间 $X_0$ 和它的补空间 $X_1$,其中 $X_1$ 的元素和值域空间 $A(X)$ 一一对应。那么对每个 $x_1 \in X_1$,线性映射就会把集合 $x_1 + X_0$ 所有元素映射到 $A(X)$ 中的同一个元素 $y_1 = Ax_1$ 上。

  

未完成:需要一个 3 维几何向量空间的真实例子,零空间 1 维,补空间 2 维

4. 线性映射空间

  

未完成:\mapsto 第一次出现,解释一下用法

   从向量空间 $V$ 到向量空间 $W$ 有很多线性映射,全体线性映射的集合记做 $L(V, W)$,它也构成一个向量空间:对标量 $a \in \mathbb{F}$,线性映射 $f \in L(V, W)$,我们定义数乘为

\begin{equation} \begin{aligned} a \cdot f: V &\to W, \\ v &\mapsto a \cdot (f(v))~, \end{aligned} \end{equation}
对于线性映射 $f, f \in L(V, W)$,我们定义加法为
\begin{equation} \begin{aligned} f + f': V &\to W, \\ v &\mapsto f(v) + f(v')~. \end{aligned} \end{equation}

   特别的,零函数 $v \mapsto 0_W$ 是向量空间 $L(V, W)$ 的零向量。

5. 矩阵表示线性变换

  2给定实向量空间 $V$,并指定它的一组基 $\{ \boldsymbol{\mathbf{v}} _i\}_{i=1}^n$,这样就可以把每个向量都表示为一个 $n\times 1$ 的列矩阵,而每个线性变换也可以表示为一个 $n\times n$ 的方阵

   如果一个线性变换 $f$ 将各基向量 $ \boldsymbol{\mathbf{v}} _i$ 变换成 $a_{i1} \boldsymbol{\mathbf{v}} _2+a_{i2} \boldsymbol{\mathbf{v}} _1+\cdots+a_{in} \boldsymbol{\mathbf{v}} _n$,那么我们可以把这个线性变换表示为矩阵:

\begin{equation} \begin{pmatrix} a_{11}&a_{12}&a_{13}&\cdots&a_{1n}\\ a_{21}&a_{22}&a_{23}&\cdots&a_{2n}\\ a_{31}&a_{32}&a_{33}&\cdots&a_{1n}\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ a_{n1}&a_{n2}&a_{n3}&\cdots&a_{nn}\\ \end{pmatrix}~. \end{equation}

   这样,任何向量 $b_1 \boldsymbol{\mathbf{v_1}} +b_2 \boldsymbol{\mathbf{v}} _2+\cdots+b_n \boldsymbol{\mathbf{v}} _n$ 变换为 $c_1 \boldsymbol{\mathbf{v}} _1+c_2 \boldsymbol{\mathbf{v}} _2+\cdots+c_n \boldsymbol{\mathbf{v}} _n$ 的过程,就可以用矩阵表示为:

\begin{equation} \begin{pmatrix} c_1\\c_2\\c_3\\\vdots\\c_n \end{pmatrix} = \begin{pmatrix} a_{11}&a_{12}&a_{13}&\cdots&a_{1n}\\ a_{21}&a_{22}&a_{23}&\cdots&a_{2n}\\ a_{31}&a_{32}&a_{33}&\cdots&a_{1n}\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ a_{n1}&a_{n2}&a_{n3}&\cdots&a_{nn}\\ \end{pmatrix} \begin{pmatrix} b_1\\b_2\\b_3\\\vdots\\b_n \end{pmatrix}~. \end{equation}

   注意,这个矩阵的第 $j$ 列单独拿出来看的话,正好就是第 $j$ 个基向量变换后的结果 $f( \boldsymbol{\mathbf{v}} _j)$。这一点很容易验证,只要把第 $j$ 个基向量的坐标代入计算就可以了。这一点使得我们可以很容易写出给定基下线性变换的矩阵,只需要把第 $j$ 个基向量变换后所得向量的坐标填入变换矩阵的第 $j$ 列就可以了。

   最简单的矩阵对应的也就是最简单的线性变换:恒等变换,其矩阵是

\begin{equation} \begin{pmatrix} 1&0&0&\cdots&0\\ 0&1&0&\cdots&0\\ 0&0&1&\cdots&0\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ 0&0&0&\cdots&1\\ \end{pmatrix}~. \end{equation}

6. 总结与拓展

   到目前为止,我们对于向量的描述依然是抽象的,并未涉及许多具体的性质,如向量垂直、向量长度、向量坐标等概念。

   在将来的词条中,我们会看到如何在给定了具体的基时用矩阵来描述向量和线性变换,以及当基的选择变化时,这些矩阵该如何变化。


1. ^ 参考 Wikipedia 相关页面
2. ^ 节选自小时百科《代数学》。


致读者: 小时百科一直以来坚持所有内容免费,这导致我们处于严重的亏损状态。 长此以往很可能会最终导致我们不得不选择大量广告以及内容付费等。 因此,我们请求广大读者热心打赏 ,使网站得以健康发展。 如果看到这条信息的每位读者能慷慨打赏 10 元,我们一个星期内就能脱离亏损, 并保证在接下来的一整年里向所有读者继续免费提供优质内容。 但遗憾的是只有不到 1% 的读者愿意捐款, 他们的付出帮助了 99% 的读者免费获取知识, 我们在此表示感谢。

                     

友情链接: 超理论坛 | ©小时科技 保留一切权利