贡献者: 叶月2_; addis
本文用 “$( \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} )$” 表示对任意两个向量作内积。本文的 “内积” 是狭义上的正定性对称双线性函数。实际上,正交变换的概念可以拓展至配备任意非退化二次型的线性空间,可见正交矩阵一节定义 1 。
1. 正交变换
定义 1
定义实内积空间 $V$ 上的满射 $\mathcal A$。对于任意 $ \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} \in V$,若有:
\begin{equation}
( \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} )=(\mathcal A \boldsymbol{\mathbf{x}} ,\mathcal A \boldsymbol{\mathbf{y}} )~,
\end{equation}
则称 $\mathcal A$ 是 $V$ 上的
正交变换。也就是说,正交变换是保内积不变的满射,从而保向量长度和向量之间的夹角不变。
实际上,正交变换是线性变换。
定理 1
实内积空间 $V$ 上的正交变换 $\mathcal A$ 一定是线性映射。
证明:
\begin{equation}
\begin{aligned}
|\mathcal A( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} )-(\mathcal A \boldsymbol{\mathbf{x}} +\mathcal A \boldsymbol{\mathbf{y}} )|^2&=( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} )^2+ \boldsymbol{\mathbf{x}} ^2+ \boldsymbol{\mathbf{y}} ^2-2\left(\mathcal A( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} ),\mathcal A \boldsymbol{\mathbf{x}} +\mathcal A \boldsymbol{\mathbf{y}} \right)\\
&=( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} )^2+ \boldsymbol{\mathbf{x}} ^2+ \boldsymbol{\mathbf{y}} ^2-2( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} , \boldsymbol{\mathbf{x}} )-2( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} , \boldsymbol{\mathbf{y}} )\\
&=0
\end{aligned}
~,\end{equation}
因而 $\mathcal A( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} )=\mathcal A \boldsymbol{\mathbf{x}} +\mathcal A \boldsymbol{\mathbf{y}} $。同理可得 $\mathcal A(k \boldsymbol{\mathbf{x}} )=k\mathcal A( \boldsymbol{\mathbf{x}} )$。
定理 2
实内积空间 $V$ 上的正交变换 $\mathcal A$ 一定是双射。
证明:由于正交变换是满射,所以只需要利用线性证明其是单射即可。
设存在 $\mathcal A \boldsymbol{\mathbf{x}} =\mathcal A \boldsymbol{\mathbf{y}} $,则 $\mathcal A \boldsymbol{\mathbf{x}} -\mathcal A \boldsymbol{\mathbf{y}} =A( \boldsymbol{\mathbf{x}} - \boldsymbol{\mathbf{y}} )= \boldsymbol{\mathbf{0}} $。又因为 $( \boldsymbol{\mathbf{x}} - \boldsymbol{\mathbf{y}} , \boldsymbol{\mathbf{x}} - \boldsymbol{\mathbf{y}} )=(A( \boldsymbol{\mathbf{x}} - \boldsymbol{\mathbf{y}} ),A( \boldsymbol{\mathbf{x}} - \boldsymbol{\mathbf{y}} ))= \boldsymbol{\mathbf{0}} $,由正定性可得 $ \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{y}} $,得证。
设 $\{ \boldsymbol{\mathbf{e}} _i\}$ 是 $V$ 上的一组标准正交基。由正交变换保内积可知,该基映射后依然是标准正交的。又因为正交变换是单射,所以映射后的向量组是线性无关的,所以正交变换$\mathcal A$把标准正交基映射为标准正交基。
也就是说:$\mathcal A$ 是正交变换 $\Longleftrightarrow \mathcal A$把标准正交基映射为标准正交基。后者是正交矩阵的定义,可见正交矩阵是正交变换的矩阵表示。正交矩阵保二次型不变的性质等价于正交变换的内积定义,1或者说——
$\mathcal A$ 是正交变换 $\Longleftrightarrow $ 对任意 $ \boldsymbol{\mathbf{x}} \in V$,线性变换 $\mathcal A$ 满足 $|\mathcal A \boldsymbol{\mathbf{x}} |=| \boldsymbol{\mathbf{x}} |$。2
令 $O(n)$ 表示 $n$ 维线性空间 $V$ 上全体正交变换的集合。由定义可知,该集合具有如下性质:
- 封闭性。若 $A,B\in O(n)$,则 $AB\in O(n)$;
- 结合性。若 $A,B,C\in O(n)$,则 $A(BC)=(AB)C$;
- 单位元存在性。$I\in O(n)$;
- 逆元存在性。若 $A\in O(n)$,则 $A^{-1}\in O(n)$;
所以,正交变换构成一个群。
在欧几里得空间中,正交矩阵的行列式为 $1$ 或者 $-1$,常称行列式为 $1$ 的正交变换为第一类的(旋转),用 $SO(n)$ 表示;称行列式为 $-1$ 的正交变换为第二类的正交变换。
正交变换的本征值
由上述讨论可知,正交变换若有本征向量,则本征值的模长为 $1$,从而保证向量的模长不变。又因为 $O(3)$ 定义在实数域的线性空间上,因此本征值必为实数。
推论 1
设 $\lambda$ 为正交变换 $A$ 的本征值,则 $\lambda=\pm 1$。
推论 2
若 $V$ 是奇数维线性空间,$A\in SO(3)$ 必有本征值 $1$。
证明:
我们知道,在复数域上,矩阵行列式等于特征值的连乘。由于一元多项式方程里复根成对出现(若 $\lambda_0$ 为本征值,则 $\lambda_0^{*}$ 也为本征值),所以复根部分的本征值连乘结果必为 $1$。于是剩下的奇数个实本征值连乘结果必为 $1$,所以至少有一个本征值为 $1$,得证。
正交变换的块对角形式
为了简化正交矩阵的形式,我们先来证明两个常用结论。
引理 1
设 $f$ 为实线性空间$V$ 上的线性映射,存在 $f$ 的不变子空间 $W\subseteq V$,且 $ \operatorname {dim}W\in\{1,2\}$。
证明:3
若 $f$ 有若干个实本征值,则其对应的本征向量是 $V$ 上的一维不变子空间。
将 $n$ 维 $V$ 复化为 $U$。若 $\{ \boldsymbol{\mathbf{e}} _i\}$ 为 $V$ 上的一组基,则任意 $ \boldsymbol{\mathbf{x}} \in U$ 可表示为:
\begin{equation}
\boldsymbol{\mathbf{x}} =a^i \boldsymbol{\mathbf{e}} _i+\mathrm i b^j \boldsymbol{\mathbf{e}} _j= \boldsymbol{\mathbf{u}} +\mathrm i \boldsymbol{\mathbf{v}} ~.
\end{equation}
其中 $a^i,b^i\in \mathbb R, \boldsymbol{\mathbf{u}} , \boldsymbol{\mathbf{v}} \in V$。显然 $U\supseteq V$。
在复数域上,$f$ 有 $n$ 个本征值。设有 $k$ 个实本征值,则对应的本征向量是 $V$ 上的一维不变子空间。设复本征值表示为 $a+\mathrm ib$,对应本征向量表示为 $ \boldsymbol{\mathbf{x}} +\mathrm i \boldsymbol{\mathbf{y}} \,( \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} \in V)$。利用 $f$ 的线性可得:
\begin{equation}
\begin{aligned}
f( \boldsymbol{\mathbf{x}} +\mathrm i \boldsymbol{\mathbf{y}} )&=(a+\mathrm i b)( \boldsymbol{\mathbf{x}} +\mathrm i \boldsymbol{\mathbf{y}} )\\
&=(a \boldsymbol{\mathbf{x}} -b \boldsymbol{\mathbf{y}} )+\mathrm i(a \boldsymbol{\mathbf{y}} +b \boldsymbol{\mathbf{x}} )\\
&=f( \boldsymbol{\mathbf{x}} )+\mathrm if( \boldsymbol{\mathbf{y}} )
\end{aligned}~.
\end{equation}
即:
\begin{equation}
\begin{aligned}
f( \boldsymbol{\mathbf{x}} )&=a \boldsymbol{\mathbf{x}} -b \boldsymbol{\mathbf{y}} \\
f( \boldsymbol{\mathbf{y}} )&=a \boldsymbol{\mathbf{y}} +b \boldsymbol{\mathbf{x}}
\end{aligned}~,
\end{equation}
所以 $ \operatorname {Span}\{ \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} \}$ 为 $f$ 在 $V$ 上的一个二维不变子空间。
引理 2
若正交变换 $A$ 有复根,对应本征向量 $ \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{u}} +\mathrm i \boldsymbol{\mathbf{v}} $。则 $ \boldsymbol{\mathbf{u}} , \boldsymbol{\mathbf{v}} $ 是相互正交的本征向量。令 $W= \operatorname {Span}\{ \boldsymbol{\mathbf{u}} , \boldsymbol{\mathbf{v}} \}$,则有:
\begin{equation}
A|_W=\left[\begin{array}{rr}
\cos \phi & \sin \phi \\
-\sin \phi & \cos \phi
\end{array}\right]~.
\end{equation}
证明:
设复本征值 $\lambda=a+b\mathrm i= \operatorname {cos}\phi+\mathrm i \operatorname {sin}\phi$,代入式 5 便可得形式为式 6 的 $A|_W$。接下来只需要证明实部和虚部分量是标准正交即可。为方便计,把转置操作表示为'。
由于 $k \boldsymbol{\mathbf{x}} $ 依然是 $A$ 的本征向量,我们可以归一化其实部分量,使得 $ \boldsymbol{\mathbf{u}} ^2=1$。则归一化后的
\begin{equation}
\begin{aligned}
\boldsymbol{\mathbf{x}} ^2&=( \boldsymbol{\mathbf{u}} +\mathrm i \boldsymbol{\mathbf{v}} )^2\\
&=1- \boldsymbol{\mathbf{v}} ^2+2\mathrm i \boldsymbol{\mathbf{u}} \cdot \boldsymbol{\mathbf{v}}
\end{aligned}~.
\end{equation}
由于 $A'=A^{-1}$ 且 $A \boldsymbol{\mathbf{x}} =\lambda \boldsymbol{\mathbf{x}} $,左乘 $A'$ 后得 $ \boldsymbol{\mathbf{x}} =\lambda A' \boldsymbol{\mathbf{x}} $,利用正交变换不改变向量模长,即 $|\lambda|^2=1$,得 $A' \boldsymbol{\mathbf{x}} =\lambda^* \boldsymbol{\mathbf{x}} $。所以
\begin{equation}
\boldsymbol{\mathbf{x}} 'A' \boldsymbol{\mathbf{x}} =\lambda^* \boldsymbol{\mathbf{x}} ' \boldsymbol{\mathbf{x}} =(Ax)' \boldsymbol{\mathbf{x}} =\lambda \boldsymbol{\mathbf{x}} ' \boldsymbol{\mathbf{x}} ~,
\end{equation}
因此 $ \boldsymbol{\mathbf{x}} ^2= \boldsymbol{\mathbf{x}} ' \boldsymbol{\mathbf{x}} =0$。代入
式 7 可得:
\begin{equation}
\boldsymbol{\mathbf{v}} ^2=1,\, \boldsymbol{\mathbf{u}} \cdot \boldsymbol{\mathbf{v}} =0~,
\end{equation}
得证。
这两条引理说明,正交变换 $A$ 的每个复本征值都对应一个实数域上的二维不变子空间,且 $A$ 限制在该子空间上的形式总如
式 6 所示。若 $A$ 为二阶矩阵且实数域上无特征根,则 $A$ 唯一表示为该形式,乘以任意向量相当于旋转该向量。
引理 3
设 $A$ 为 $V$ 上的正交变换,若 $W$ 为其不变子空间,则 $W^{\bot}$ 也是其不变子空间。
设 $\{ \boldsymbol{\mathbf{e}} _i\}$ 为 $W$ 上的一组标准正交基,并扩展到全空间,使得 $ \operatorname {Span}\{ \boldsymbol{\mathbf{\theta}} _i\}$ 张成 $W^{\bot}$。由题设知 $\{A \boldsymbol{\mathbf{e}} _i\}$ 依然张成 $W$,由于 $(A \boldsymbol{\mathbf{\theta}} _i,A \boldsymbol{\mathbf{e}} _i)=0$,因此 $A \boldsymbol{\mathbf{\theta}} _i\in W^{\bot}$,得证。
由定理 3 可知,在 $\{ \boldsymbol{\mathbf{e}} _i\}\cup\{ \boldsymbol{\mathbf{\theta}} _i\}$ 下,$A$ 有块对角形式:$A=A|_W\oplus A|_{W^{\bot}}$。实际上,该块对角形式可以进一步 “细化”。
定理 3
设 $A$ 为 n 维实线性空间$V$ 上的正交变换。则在 $V$ 内存在一组标准正交基,使得 $A$ 具有如下块对角形式:
\begin{equation}
A=\left[\begin{array}{lllllll}
\lambda_1 & & & & & & \\
& \lambda_2 & & & & & \\
& & \ddots & & & 0 & \\
& & & \lambda_k & & & \\
& & & & S_1 & & \\
& & 0 & & & \ddots & \\
& & & & & & S_l
\end{array}\right]~,
\end{equation}
其中 $\lambda_i=\pm 1(i=1,2...k)$,$S_i$ 为
式 6 ,$\phi$ 由 $\phi_i$ 代替。
证明:
若 $n=1$,矩阵为一实数,设为 a。由 $(a \boldsymbol{\mathbf{x}} ,a \boldsymbol{\mathbf{x}} )= \boldsymbol{\mathbf{x}} ^2$ 可得,$a=\pm 1$。
若 $n=2$ 且 $A$ 没有本征值,由引理 1 可知,$A$ 在 $V$ 上必有一二维不变子空间,$A$ 的形式就是旋转矩阵。
如果 $A$ 有一本征值 $\lambda_1$ 且 $Ax=\lambda_1 \boldsymbol{\mathbf{x}} $,设单位向量 $ \boldsymbol{\mathbf{y}} \cdot \boldsymbol{\mathbf{x}} =0$,由引理 3 知,$ \boldsymbol{\mathbf{y}} $ 也是 $A$ 的本征向量。设 $Ay=\lambda_2 \boldsymbol{\mathbf{y}} $,则
\begin{equation}
A=\left[\begin{array}{rr}
\lambda_1&0\\
0&\lambda_2
\end{array}
\right]~.
\end{equation}
若 $A$ 无本征值,由引理 2 知其形式即二阶旋转矩阵,对应复根 $\cos\phi- \mathrm{i} \sin\phi$。
接下来设 $n>2$,用数学归纳法即可证明。若 $A$ 无本征值,则必有一二维不变子空间,设为 $S$,$A|_{S}$ 为式 6 。$A|_{S^{\bot}}$ 为正交矩阵,若 $\lambda_1$ 为其本征值,则必定有一维不变子空间,设对应的本征向量为 $ \boldsymbol{\mathbf{x}} _1$,则可以扩展为 $S^{\bot}$ 上的标准正交基,设 $ \boldsymbol{\mathbf{x}} _2$ 的正交补为 $S_1$,则
\begin{equation}
\left[\begin{array}{rrr}
A|_{S}&0&0\\
0&\lambda_1&0\\
0&0&A|_{S_1}
\end{array}
\right]~.
\end{equation}
则 $\lambda_1$ 也是 $A$ 的本征值,矛盾。故 $A$ 由若干个形式如
式 6 的二阶矩阵直和而成。
若 $A$ 有本征值,令其为 $\lambda'_1$,则其本征向量可以扩展为全空间的标准正交基。在该本征向量的正交补空间讨论,若可以找到另一本征值 $\lambda'_2$,则对应的本征向量又可以扩展为该正交补上的基矢组,经过相似变换得到 $A$ 的新形式,$\lambda'_1$ 和 $\lambda'_2$ 为对角元。以此类推,最后得到该定理的形式,$k$ 为 $A$ 的实本征值数量。
2. 对称变换
定义 2
设 $\mathcal B$ 为实线性空间上的线性变换,若对于任意 $ \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} \in V$ 有
\begin{equation}
( \boldsymbol{\mathbf{x}} ,\mathcal B \boldsymbol{\mathbf{y}} )=(\mathcal B \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} )~,
\end{equation}
则称 $B$ 为对称变换。
若 $V$ 为 n 维实线性空间,$B$ 为对称变换的矩阵表示。任选一组标准正交基,由式 13 得:
\begin{equation}
\boldsymbol{\mathbf{x}} ^TB \boldsymbol{\mathbf{y}} = \boldsymbol{\mathbf{x}} ^TB^T \boldsymbol{\mathbf{y}} ~.
\end{equation}
左乘 $ \boldsymbol{\mathbf{x}} $ 可得,
\begin{equation}
B \boldsymbol{\mathbf{y}} =B^T \boldsymbol{\mathbf{y}} ~.
\end{equation}
因此,$B=B^T$,对称变换的矩阵表示是对称矩阵。
定理 4
$n$ 维欧式空间上的线性变换 $\mathcal B$ 是对称变换当且仅当 $\mathcal B$ 在任意标准正交基下的矩阵表示为对称矩阵。
前文的推导只要求基矢标准正交,因此该定理成立。
对称变换有类似正交变换的结论:
定理 5
若 $U$ 是 $B$ 的不变子空间,则 $U^{\bot}$ 也是 $B$ 的不变子空间。
证明:
任选 $ \boldsymbol{\mathbf{x}} \in U, \boldsymbol{\mathbf{y}} \in U^{\bot}$,则
\begin{equation}
(B \boldsymbol{\mathbf{y}} , \boldsymbol{\mathbf{x}} )=( \boldsymbol{\mathbf{y}} ,B \boldsymbol{\mathbf{x}} )=0~,
\end{equation}
因而 $B \boldsymbol{\mathbf{y}} \in U^{\bot}$,$ U^{\bot}$ 是 $B$ 的不变子空间。
习题 2
设 $\mathcal B$ 为 $n$ 维欧式空间上的线性变换,则 $\mathcal B$ 是正交变换 $\Longleftrightarrow$ 存在一组标准正交基,使得 $\mathcal B$ 在该基下的表示为对角矩阵。
下面罗列一些对称矩阵常见结论,$A$ 表示任一对称矩阵,证明略。
定理 7
若 $a,b$ 是 $A$ 的不同特征值,则对应的特征向量相互正交。
定理 8
$A$ 一定可以正交对角化。即欧式空间必定存在一组标准正交基,使得 $A$ 在这组基下是对角矩阵。
对于基域不为 $2$ 的实线性空间,其上的二次型总可以写为对称矩阵的形式。因此定理 8 相当于说:
任一二次型都可以经正交合同变换变为标准二次型。
上述常见定理的证明见定理 1 。
1. ^ 广义内积即二次型决定的对称双线性函数:$( \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} )\equiv \frac{1}{2}(q( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} )-q( \boldsymbol{\mathbf{x}} )-q( \boldsymbol{\mathbf{y}} ))$,利用该性质可证明保二次型不变等价于内积不变。
2. ^ 该充要条件并不能推广至广义内积空间。因为对于退化的二次型,保内积不变无法推出 “将线性无关组映射为线性无关组”。
3. ^ 参考 Jier Peter 的《代数学基础》