贡献者: addis; JierPeter
线性空间是一种集合,自然可以考虑其上各种各样的映射。比如在几何向量空间中,向量 $ \boldsymbol{\mathbf{v}} $ 有长度,表示为 $\lVert \boldsymbol{\mathbf{v}} \rVert$,我们可以定义映射 $f( \boldsymbol{\mathbf{v}} )=\lVert \boldsymbol{\mathbf{v}} \rVert \boldsymbol{\mathbf{v}} $,也就是把每个向量都伸长,伸长倍数恰为自己的长度。
可线性空间又不仅仅是个集合,它还有线性结构,即数乘和加法运算。上述 $f$ 并不能体现线性结构的威力,因为它不能保持线性结构——所谓保持线性结构,就是 “线性组合与映射可交换”。
比如说,考虑三维几何向量的投影变换,记为 $\pi$。任取若干向量 $ \boldsymbol{\mathbf{v}} _i$,它们的线性组合 $\sum_{i}a_i \boldsymbol{\mathbf{v}} _i$ 也是一个向量。你可以先将 $ \boldsymbol{\mathbf{v}} _i$ 组合起来,再将结果用 $\pi$ 投影,得到 $\pi \left(\sum_{i}a_i \boldsymbol{\mathbf{v}} _i \right) $;也可以先将每个 $ \boldsymbol{\mathbf{v}} _i$ 投影为 $\pi( \boldsymbol{\mathbf{v}} _i)$,再用同一组系数 $a_i$ 做组合,得到 $\sum_{i}a_i\pi( \boldsymbol{\mathbf{v}} _i)$。验算一下,两条路是不是殊途同归?这就叫保持线性结构。
保持线性结构的映射体现了线性性的威力,也是线性代数的核心之一。
一些材料中只把定义域和值域相同的线性映射 $f:V\to V$ 称为线性变换,小时百科中不做这种区分。
定义 1 的内涵比看上去广一些,不仅仅是对 $V$ 中两个向量的线性组合成立。容易证明对于任意的一组有限个向量 $\{v_i\}\subseteq V$ 和一组对应的标量 $\{c_i\}\subseteq\mathbb{F}$,都有
注意在以上映射中,除了投影外都是双射,且都把零向量映射到零向量。多对一映射也会把一些非零向量映射到零向量。
在映射中,我们把一个映射的像定义为值域中所有被映射到的元素的集合。
在向量空间的表示中我们还会看到,选定两个空间的基以后,一个线性映射也可以看成是多个线性函数的排列,因此线性映射和线性函数性质很相似。线性函数是一种特殊的线性映射,$V$ 上的所有线性函数组成的向量空间叫做对偶空间。
如果一个线性变换的像空间是 $V$ 的一个真子集,那么这个真子集一定是 $V$ 中的一个 “过原点的平面”,我们把这种线性变换称为退化(degenerate)的。反过来,$V$ 中的一个 “过原点的平面” 可以是某线性变换的像空间。一个线性变换唯一对应一个像空间,但是一个像空间总是对应无穷多个线性变换。
如果 $v\in V$ 在基 $\{{e}_i\}$ 中表示为 $\sum c_i {e}_i$,那么它变换后的向量就是 $T v=T\sum c_i {e}_i=\sum c_iT {e}_i$。如果向量组 $\{T {e}_i\}$ 是线性相关的,那么就意味着存在并非全为零的 $\{c_i\}$ 使得 $T v=\sum c_iT {e}_i=0$;而 $\{c_i\}$ 并非全为零意味着 $v$ 不是零向量。这就是说,退化的线性变换会把一些非零向量变换成零向量。
退化的线性变换会把非零向量变成零向量这一事实,引申出了零化子的概念:
证明留做习题:只需要根据定义证明 $\{v\in V|f(v)= 0\}$ 是一个线性空间即可。
1给定实向量空间 $V$,并指定它的一组基 $\{ \boldsymbol{\mathbf{v}} _i\}_{i=1}^n$,这样就可以把每个向量都表示为一个 $n\times 1$ 的列矩阵,而每个线性变换也可以表示为一个 $n\times n$ 的方阵。
如果一个线性变换 $f$ 将各基向量 $ \boldsymbol{\mathbf{v}} _i$ 变换成 $a_{i1} \boldsymbol{\mathbf{v}} _2+a_{i2} \boldsymbol{\mathbf{v}} _1+\cdots+a_{in} \boldsymbol{\mathbf{v}} _n$,那么我们可以把这个线性变换表示为矩阵:
这样,任何向量 $b_1 \boldsymbol{\mathbf{v_1}} +b_2 \boldsymbol{\mathbf{v}} _2+\cdots+b_n \boldsymbol{\mathbf{v}} _n$ 变换为 $c_1 \boldsymbol{\mathbf{v}} _1+c_2 \boldsymbol{\mathbf{v}} _2+\cdots+c_n \boldsymbol{\mathbf{v}} _n$ 的过程,就可以用矩阵表示为:
注意,这个矩阵的第 $j$ 列单独拿出来看的话,正好就是第 $j$ 个基向量变换后的结果 $f( \boldsymbol{\mathbf{v}} _j)$。这一点很容易验证,只要把第 $j$ 个基向量的坐标代入计算就可以了。这一点使得我们可以很容易写出给定基下线性变换的矩阵,只需要把第 $j$ 个基向量变换后所得向量的坐标填入变换矩阵的第 $j$ 列就可以了。
最简单的矩阵对应的也就是最简单的线性变换:恒等变换,其矩阵是
到目前为止,我们对于向量的描述依然是抽象的,并未涉及许多具体的性质,如向量垂直、向量长度、向量坐标等概念。
在将来的词条中,我们会看到如何在给定了具体的基时用矩阵来描述向量和线性变换,以及当基的选择变化时,这些矩阵该如何变化。
零化子空间是一种子空间,而我们也会在将来的词条中解释子空间的概念。
1. ^ 节选自小时百科《代数学》。
 
 
 
 
 
 
 
 
 
 
 
友情链接: 超理论坛 | ©小时科技 保留一切权利