线性映射

                     

贡献者: addis; JierPeter

  • 重整中:线性变换和线性映射改为同义词
预备知识 子空间

1. 概念的引入

   线性空间是一种集合,自然可以考虑其上各种各样的映射。比如在几何向量空间中,向量 $ \boldsymbol{\mathbf{v}} $ 有长度,表示为 $\lVert \boldsymbol{\mathbf{v}} \rVert$,我们可以定义映射 $f( \boldsymbol{\mathbf{v}} )=\lVert \boldsymbol{\mathbf{v}} \rVert \boldsymbol{\mathbf{v}} $,也就是把每个向量都伸长,伸长倍数恰为自己的长度。

   可线性空间又不仅仅是个集合,它还有线性结构,即数乘和加法运算。上述 $f$ 并不能体现线性结构的威力,因为它不能保持线性结构——所谓保持线性结构,就是 “线性组合与映射可交换”。

   比如说,考虑三维几何向量的投影变换,记为 $\pi$。任取若干向量 $ \boldsymbol{\mathbf{v}} _i$,它们的线性组合 $\sum_{i}a_i \boldsymbol{\mathbf{v}} _i$ 也是一个向量。你可以先将 $ \boldsymbol{\mathbf{v}} _i$ 组合起来,再将结果用 $\pi$ 投影,得到 $\pi \left(\sum_{i}a_i \boldsymbol{\mathbf{v}} _i \right) $;也可以先将每个 $ \boldsymbol{\mathbf{v}} _i$ 投影为 $\pi( \boldsymbol{\mathbf{v}} _i)$,再用同一组系数 $a_i$ 做组合,得到 $\sum_{i}a_i\pi( \boldsymbol{\mathbf{v}} _i)$。验算一下,两条路是不是殊途同归?这就叫保持线性结构。

   保持线性结构的映射体现了线性性的威力,也是线性代数的核心之一。

2. 线性映射

定义 1 线性映射

   给定域 $\mathbb F$(通常取实数域 $\mathbb R$ 或复数域 $\mathbb C$)上的线性空间 $V$ 和 $U$。如果有映射 $f:V\rightarrow U$ 满足:对于任意的向量 ${v}_1, {v}_2\in V$ 和标量 $c_1, c_2 \in \mathbb{F}$,都有

\begin{equation} f(c_1 {v}_1+c_2 {v}_2)=c_1f({v}_1)+c_2f({v}_2)~. \end{equation}
则称 $f$ 是 $V$ 到 $U$ 的一个线性映射(linear map),也叫线性变换(linear transform),或者线性算符(linear operator)。“算符” 也译作 “算子”。

   一些材料中只把定义域和值域相同的线性映射 $f:V\to V$ 称为线性变换,小时百科中不做这种区分。

   定义 1 的内涵比看上去广一些,不仅仅是对 $V$ 中两个向量的线性组合成立。容易证明对于任意的一组有限个向量 $\{v_i\}\subseteq V$ 和一组对应的标量 $\{c_i\}\subseteq\mathbb{F}$,都有

\begin{equation} f \left(\sum_i c_i v_i \right) =\sum_i c_i f(v_i)~. \end{equation}
特殊地,若令所有 $c_i = 0$ 可得

推论 1 

   线性映射 $f:V\to U$ 总把 $0 \in V$ 映射到 $0 \in U$。

习题 1 几何矢量的线性变换

   请证明 $N$ 维几何线性空间 $V_N$ 中,以下变换 $f:V\to V$ 都是线性变换:

  • 缩放:把矢量乘以一个固定标量 $\lambda$。
  • 旋转:把矢量绕任意固定轴逆时针旋转固定角度 $\theta$。
  • 镜像:把矢量关于某条过原点的固定直线做镜像对称。
  • 投影:把二维矢量垂直投影到过原点的固定直线,或者把三维矢量垂直投影到过原点的平面(也可以拓展到 $N$ 维空间中的矢量投影到 $N-1$ 维平面)。
  • 以上几种变换的任意组合。

   注意在以上映射中,除了投影外都是双射,且都把零向量映射到零向量。多对一映射也会把一些非零向量映射到零向量。

习题 2 

   请证明两个线性映射 $f, g$ 的复合映射 $f \circ g$ 仍然是线性映射。注意 $f$ 的值域必须是 $g$ 的定义域的子集。

   在映射中,我们把一个映射的像定义为值域中所有被映射到的元素的集合。

定理 1 值空间

   线性映射 $f:V\to U$ 的像 $M = f(V) \subseteq U$ 是一个线性空间,即 $U$ 的子空间。称为 $f$ 的值空间(range space)。为了方便我们也可以把该映射记为 $f: V\to M \subseteq U$。

   证明留作习题,使用线性空间的定义即可。

  

未完成:这两段应该放到后面展开讲解,太浓缩
如果 $\{{e}_i\}_{i=1}^n$ 是 $V$ 的一组基底,那么任意 $v\in V$ 都可以唯一地表示为 $v=\sum_i c_i {e}_i$ 的形式,其中 $c_i\in\mathbb{F}$。这样,由于线性性,$f(v)=\sum_ic_if({e}_i)$。也就是说,只需要知道了基向量被 $f$ 映射到哪里,也就可以计算出任意向量映射到哪里。于是,和线性函数一样,确定一个线性映射的时候,我们最多只能自由选择基向量映射到哪里,只不过这里的函数值不再是数字,而是 $U$ 中的向量。

   在向量空间的表示中我们还会看到,选定两个空间的基以后,一个线性映射也可以看成是多个线性函数的排列,因此线性映射和线性函数性质很相似。线性函数是一种特殊的线性映射,$V$ 上的所有线性函数组成的向量空间叫做对偶空间

3. 线性变换

  

未完成:以下需要改:线性变换和映射是同义词!
要知道一个具体的线性变换的性质,我们只需要知道它把基向量都映射到哪里去了。我们知道,基向量张成线性空间 $V$ 本身,而任意一组基向量变换后所得到的向量组,张成了线性变换的像空间(image space),即 $V$ 中全体向量变换后的结果之集合。如果基向量变换后的向量组还是线性无关的,那么这个向量组也是一组基,从而像空间就是 $V$ 本身;但有的时候变换后的向量组线性相关了,这时候的像空间就是 $V$ 的一个真子集了。极端情况下甚至把所有向量都变换为零向量,这样的线性变换的像空间就只有零向量了。

   如果一个线性变换的像空间是 $V$ 的一个真子集,那么这个真子集一定是 $V$ 中的一个 “过原点的平面”,我们把这种线性变换称为退化(degenerate)的。反过来,$V$ 中的一个 “过原点的平面” 可以是某线性变换的像空间。一个线性变换唯一对应一个像空间,但是一个像空间总是对应无穷多个线性变换。

   如果 $v\in V$ 在基 $\{{e}_i\}$ 中表示为 $\sum c_i {e}_i$,那么它变换后的向量就是 $T v=T\sum c_i {e}_i=\sum c_iT {e}_i$。如果向量组 $\{T {e}_i\}$ 是线性相关的,那么就意味着存在并非全为零的 $\{c_i\}$ 使得 $T v=\sum c_iT {e}_i=0$;而 $\{c_i\}$ 并非全为零意味着 $v$ 不是零向量。这就是说,退化的线性变换会把一些非零向量变换成零向量。

习题 3 

   如果线性变换非退化,那么非零向量有可能被变换为零向量吗?提示:退化和非退化的区别在于基做了线性变换后得到的向量组还是不是线性无关的,或者说还是不是一组基。

   退化的线性变换会把非零向量变成零向量这一事实,引申出了零化子的概念:

定理 2 零空间

   给定线性映射 $f:V\to U$,$V$ 中被变映射到 $U$ 中零向量的全体向量所构成的集合 $\{v\in V|f(v)= 0\}$ 构成 $V$ 的子空间,称为 $f$ 的零空间(null space),也称为零化子空间零化子

   证明留做习题:只需要根据定义证明 $\{v\in V|f(v)= 0\}$ 是一个线性空间即可。

4. 矩阵表示线性变换

  1给定实向量空间 $V$,并指定它的一组基 $\{ \boldsymbol{\mathbf{v}} _i\}_{i=1}^n$,这样就可以把每个向量都表示为一个 $n\times 1$ 的列矩阵,而每个线性变换也可以表示为一个 $n\times n$ 的方阵

   如果一个线性变换 $f$ 将各基向量 $ \boldsymbol{\mathbf{v}} _i$ 变换成 $a_{i1} \boldsymbol{\mathbf{v}} _2+a_{i2} \boldsymbol{\mathbf{v}} _1+\cdots+a_{in} \boldsymbol{\mathbf{v}} _n$,那么我们可以把这个线性变换表示为矩阵:

\begin{equation} \begin{pmatrix} a_{11}&a_{12}&a_{13}&\cdots&a_{1n}\\ a_{21}&a_{22}&a_{23}&\cdots&a_{2n}\\ a_{31}&a_{32}&a_{33}&\cdots&a_{1n}\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ a_{n1}&a_{n2}&a_{n3}&\cdots&a_{nn}\\ \end{pmatrix}~. \end{equation}

   这样,任何向量 $b_1 \boldsymbol{\mathbf{v_1}} +b_2 \boldsymbol{\mathbf{v}} _2+\cdots+b_n \boldsymbol{\mathbf{v}} _n$ 变换为 $c_1 \boldsymbol{\mathbf{v}} _1+c_2 \boldsymbol{\mathbf{v}} _2+\cdots+c_n \boldsymbol{\mathbf{v}} _n$ 的过程,就可以用矩阵表示为:

\begin{equation} \begin{pmatrix} c_1\\c_2\\c_3\\\vdots\\c_n \end{pmatrix} = \begin{pmatrix} a_{11}&a_{12}&a_{13}&\cdots&a_{1n}\\ a_{21}&a_{22}&a_{23}&\cdots&a_{2n}\\ a_{31}&a_{32}&a_{33}&\cdots&a_{1n}\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ a_{n1}&a_{n2}&a_{n3}&\cdots&a_{nn}\\ \end{pmatrix} \begin{pmatrix} b_1\\b_2\\b_3\\\vdots\\b_n \end{pmatrix}~. \end{equation}

   注意,这个矩阵的第 $j$ 列单独拿出来看的话,正好就是第 $j$ 个基向量变换后的结果 $f( \boldsymbol{\mathbf{v}} _j)$。这一点很容易验证,只要把第 $j$ 个基向量的坐标代入计算就可以了。这一点使得我们可以很容易写出给定基下线性变换的矩阵,只需要把第 $j$ 个基向量变换后所得向量的坐标填入变换矩阵的第 $j$ 列就可以了。

   最简单的矩阵对应的也就是最简单的线性变换:恒等变换,其矩阵是

\begin{equation} \begin{pmatrix} 1&0&0&\cdots&0\\ 0&1&0&\cdots&0\\ 0&0&1&\cdots&0\\ \vdots&\vdots&\vdots&\ddots&\vdots\\ 0&0&0&\cdots&1\\ \end{pmatrix}~. \end{equation}

5. 总结与拓展

   到目前为止,我们对于向量的描述依然是抽象的,并未涉及许多具体的性质,如向量垂直、向量长度、向量坐标等概念。

   在将来的词条中,我们会看到如何在给定了具体的基时用矩阵来描述向量和线性变换,以及当基的选择变化时,这些矩阵该如何变化。

   零化子空间是一种子空间,而我们也会在将来的词条中解释子空间的概念。


1. ^ 节选自小时百科《代数学》。


致读者: 小时百科一直以来坚持所有内容免费,这导致我们处于严重的亏损状态。 长此以往很可能会最终导致我们不得不选择大量广告以及内容付费等。 因此,我们请求广大读者热心打赏 ,使网站得以健康发展。 如果看到这条信息的每位读者能慷慨打赏 10 元,我们一个星期内就能脱离亏损, 并保证在接下来的一整年里向所有读者继续免费提供优质内容。 但遗憾的是只有不到 1% 的读者愿意捐款, 他们的付出帮助了 99% 的读者免费获取知识, 我们在此表示感谢。

                     

友情链接: 超理论坛 | ©小时科技 保留一切权利