贡献者: 叶月2_; addis
本文用 “$( \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} )$” 表示对任意两个向量作内积。本文的 “内积” 是狭义上的正定性对称双线性函数。实际上,正交变换的概念可以拓展至配备任意非退化二次型的线性空间,可见正交矩阵一节定义 1 。
1. 正交变换
定义 1
定义实内积空间 $V$ 上的满射 $\mathcal A$。对于任意 $ \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} \in V$,若有:
\begin{equation}
( \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} )=(\mathcal A \boldsymbol{\mathbf{x}} ,\mathcal A \boldsymbol{\mathbf{y}} )~,
\end{equation}
则称 $\mathcal A$ 是 $V$ 上的
正交变换。也就是说,正交变换是保内积不变的满射,从而保向量长度和向量之间的夹角不变。
实际上,正交变换是线性变换。
定理 1
实内积空间 $V$ 上的正交变换 $\mathcal A$ 一定是线性映射。
证明:
\begin{equation}
\begin{aligned}
|\mathcal A( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} )-(\mathcal A \boldsymbol{\mathbf{x}} +\mathcal A \boldsymbol{\mathbf{y}} )|^2&=( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} )^2+ \boldsymbol{\mathbf{x}} ^2+ \boldsymbol{\mathbf{y}} ^2-2\left(\mathcal A( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} ),\mathcal A \boldsymbol{\mathbf{x}} +\mathcal A \boldsymbol{\mathbf{y}} \right)\\
&=( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} )^2+ \boldsymbol{\mathbf{x}} ^2+ \boldsymbol{\mathbf{y}} ^2-2( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} , \boldsymbol{\mathbf{x}} )-2( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} , \boldsymbol{\mathbf{y}} )\\
&=0
\end{aligned}
~,\end{equation}
因而 $\mathcal A( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} )=\mathcal A \boldsymbol{\mathbf{x}} +\mathcal A \boldsymbol{\mathbf{y}} $。同理可得 $\mathcal A(k \boldsymbol{\mathbf{x}} )=k\mathcal A( \boldsymbol{\mathbf{x}} )$。
定理 2
实内积空间 $V$ 上的正交变换 $\mathcal A$ 一定是双射。
证明:由于正交变换是满射,所以只需要利用线性证明其是单射即可。
设存在 $\mathcal A \boldsymbol{\mathbf{x}} =\mathcal A \boldsymbol{\mathbf{y}} $,则 $\mathcal A \boldsymbol{\mathbf{x}} -\mathcal A \boldsymbol{\mathbf{y}} =A( \boldsymbol{\mathbf{x}} - \boldsymbol{\mathbf{y}} )= \boldsymbol{\mathbf{0}} $。又因为 $( \boldsymbol{\mathbf{x}} - \boldsymbol{\mathbf{y}} , \boldsymbol{\mathbf{x}} - \boldsymbol{\mathbf{y}} )=(A( \boldsymbol{\mathbf{x}} - \boldsymbol{\mathbf{y}} ),A( \boldsymbol{\mathbf{x}} - \boldsymbol{\mathbf{y}} ))= \boldsymbol{\mathbf{0}} $,由正定性可得 $ \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{y}} $,得证。
设 $\{ \boldsymbol{\mathbf{e}} _i\}$ 是 $V$ 上的一组标准正交基。由正交变换保内积可知,该基映射后依然是标准正交的。又因为正交变换是单射,所以映射后的向量组是线性无关的,所以正交变换$\mathcal A$把标准正交基映射为标准正交基。
也就是说:$\mathcal A$ 是正交变换 $\Longleftrightarrow \mathcal A$把标准正交基映射为标准正交基。后者是正交矩阵的定义,可见正交矩阵是正交变换的矩阵表示。正交矩阵保二次型不变的性质等价于正交变换的内积定义,1或者说——
$\mathcal A$ 是正交变换 $\Longleftrightarrow $ 对任意 $ \boldsymbol{\mathbf{x}} \in V$,线性变换 $\mathcal A$ 满足 $|\mathcal A \boldsymbol{\mathbf{x}} |=| \boldsymbol{\mathbf{x}} |$。2
令 $O(n)$ 表示 $n$ 维线性空间 $V$ 上全体正交变换的集合。由定义可知,该集合具有如下性质:
- 封闭性。若 $A,B\in O(n)$,则 $AB\in O(n)$;
- 结合性。若 $A,B,C\in O(n)$,则 $A(BC)=(AB)C$;
- 单位元存在性。$I\in O(n)$;
- 逆元存在性。若 $A\in O(n)$,则 $A^{-1}\in O(n)$;
所以,正交变换构成一个群。
在欧几里得空间中,正交矩阵的行列式为 $1$ 或者 $-1$,常称行列式为 $1$ 的正交变换为第一类的(旋转);行列式为 $-1$ 的正交变换则是第二类的。
正交变换的本征值
由上述讨论可知,正交变换若有本征向量,则本征值的模长为 $1$,从而保证向量的模长不变。
推论 1
设 $\lambda$ 为正交变换 $A$ 的本征值,则 $|\lambda|=1$。若 $V$ 定义在实数域上,$\lambda=\pm 1$。
推论 2
若 $V$ 是奇数维线性空间,$A$ 必有本征值 $1$。
证明:
实数域上易证推论 2,下面讨论复数域的情况。由于本征值是本征多项式的根,且一元多项式方程里复根成对出现(若 $\lambda_0$ 为本征值,则 $\lambda_0^{*}$ 也为本征值),所以 $A$ 有偶数个模为 $1$ 的复根,这些本征值连乘为 $1$。结合行列式等于本征值连乘这一定理 4 ,可知剩下奇数个连乘结果为 1 的实本征值,得证。
正交变换的块对角形式
为了简化正交矩阵的形式,我们先来证明两个常用结论。
引理 1
设 $f$ 为实线性空间$V$ 上的线性映射,存在 $f$ 的不变子空间 $W\subseteq V$,且 $ \operatorname {dim}W\in\{1,2\}$。
证明:3
若 $f$ 有若干个实本征值,则其对应的本征向量是 $V$ 上的一维不变子空间。
将 $n$ 维 $V$ 复化为 $U$。若 $\{ \boldsymbol{\mathbf{e}} _i\}$ 为 $V$ 上的一组基,则任意 $ \boldsymbol{\mathbf{x}} \in U$ 可表示为:
\begin{equation}
\boldsymbol{\mathbf{x}} =a^i \boldsymbol{\mathbf{e}} _i+\mathrm i b^j \boldsymbol{\mathbf{e}} _j= \boldsymbol{\mathbf{u}} +\mathrm i \boldsymbol{\mathbf{v}} ~.
\end{equation}
其中 $a^i,b^i\in \mathbb R, \boldsymbol{\mathbf{u}} , \boldsymbol{\mathbf{v}} \in V$。显然 $U\supseteq V$。
在复数域上,$f$ 有 $n$ 个本征值。设有 $k$ 个实本征值,则对应的本征向量是 $V$ 上的一维不变子空间。设复本征值表示为 $a+\mathrm ib$,对应本征向量表示为 $ \boldsymbol{\mathbf{x}} +\mathrm i \boldsymbol{\mathbf{y}} \,( \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} \in V)$。利用 $f$ 的线性可得:
\begin{equation}
\begin{aligned}
f( \boldsymbol{\mathbf{x}} +\mathrm i \boldsymbol{\mathbf{y}} )&=(a+\mathrm i b)( \boldsymbol{\mathbf{x}} +\mathrm i \boldsymbol{\mathbf{y}} )\\
&=(a \boldsymbol{\mathbf{x}} -b \boldsymbol{\mathbf{y}} )+\mathrm i(a \boldsymbol{\mathbf{y}} +b \boldsymbol{\mathbf{x}} )\\
&=f( \boldsymbol{\mathbf{x}} )+\mathrm if( \boldsymbol{\mathbf{y}} )
\end{aligned}~.
\end{equation}
即:
\begin{equation}
\begin{aligned}
f( \boldsymbol{\mathbf{x}} )&=a \boldsymbol{\mathbf{x}} -b \boldsymbol{\mathbf{y}} \\
f( \boldsymbol{\mathbf{y}} )&=a \boldsymbol{\mathbf{y}} +b \boldsymbol{\mathbf{x}}
\end{aligned}~,
\end{equation}
所以 $ \operatorname {Span}\{ \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} \}$ 为 $f$ 在 $V$ 上的一个二维不变子空间。
引理 2
若正交变换 $A$ 有复根,对应本征向量 $ \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{u}} +\mathrm i \boldsymbol{\mathbf{v}} $。则 $ \boldsymbol{\mathbf{u}} , \boldsymbol{\mathbf{v}} $ 是相互正交的本征向量。令 $W= \operatorname {Span}\{ \boldsymbol{\mathbf{u}} , \boldsymbol{\mathbf{v}} \}$,则有:
\begin{equation}
A|_W=\left[\begin{array}{rr}
\cos \phi & \sin \phi \\
-\sin \phi & \cos \phi
\end{array}\right]~.
\end{equation}
证明:
设复本征值 $\lambda=a+b\mathrm i= \operatorname {cos}\phi+\mathrm i \operatorname {sin}\phi$,代入式 5 便可得形式为式 6 的 $A|_W$。接下来只需要证明实部和虚部分量是标准正交即可。为方便计,把转置操作表示为'。
由于 $k \boldsymbol{\mathbf{x}} $ 依然是 $A$ 的本征向量,我们可以归一化其实部分量,使得 $ \boldsymbol{\mathbf{u}} ^2=1$。则归一化后的
\begin{equation}
\begin{aligned}
\boldsymbol{\mathbf{x}} ^2&=( \boldsymbol{\mathbf{u}} +\mathrm i \boldsymbol{\mathbf{v}} )^2\\
&=1- \boldsymbol{\mathbf{v}} ^2+2\mathrm i \boldsymbol{\mathbf{u}} \cdot \boldsymbol{\mathbf{v}}
\end{aligned}~.
\end{equation}
由于 $A'=A^{-1}$ 且 $A \boldsymbol{\mathbf{x}} =\lambda \boldsymbol{\mathbf{x}} $,左乘 $A'$ 后得 $ \boldsymbol{\mathbf{x}} =\lambda A' \boldsymbol{\mathbf{x}} $,利用正交变换不改变向量模长,即 $|\lambda|^2=1$,得 $A' \boldsymbol{\mathbf{x}} =\lambda^* \boldsymbol{\mathbf{x}} $。所以
\begin{equation}
\boldsymbol{\mathbf{x}} 'A' \boldsymbol{\mathbf{x}} =\lambda^* \boldsymbol{\mathbf{x}} ' \boldsymbol{\mathbf{x}} =(Ax)' \boldsymbol{\mathbf{x}} =\lambda \boldsymbol{\mathbf{x}} ' \boldsymbol{\mathbf{x}} ~,
\end{equation}
因此 $ \boldsymbol{\mathbf{x}} ^2= \boldsymbol{\mathbf{x}} ' \boldsymbol{\mathbf{x}} =0$。代入
式 7 可得:
\begin{equation}
\boldsymbol{\mathbf{v}} ^2=1,\, \boldsymbol{\mathbf{u}} \cdot \boldsymbol{\mathbf{v}} =0~,
\end{equation}
得证。
这两条引理说明,正交变换 $A$ 的每个复本征值都对应一个实数域上的二维不变子空间,且 $A$ 限制在该子空间上的形式总如
式 6 所示。若 $A$ 为二阶矩阵且实数域上无特征根,则 $A$ 唯一表示为该形式,乘以任意向量相当于旋转该向量。
引理 3
设 $A$ 为 $V$ 上的正交变换,若 $W$ 为其不变子空间,则 $W^{\bot}$ 也是其不变子空间。
设 $\{ \boldsymbol{\mathbf{e}} _i\}$ 为 $W$ 上的一组标准正交基,并扩展到全空间,使得 $ \operatorname {Span}\{ \boldsymbol{\mathbf{\theta}} _i\}$ 张成 $W^{\bot}$。由题设知 $\{A \boldsymbol{\mathbf{e}} _i\}$ 依然张成 $W$,由于 $(A \boldsymbol{\mathbf{\theta}} _i,A \boldsymbol{\mathbf{e}} _i)=0$,因此 $A \boldsymbol{\mathbf{\theta}} _i\in W^{\bot}$,得证。
由定理 3 可知,在 $\{ \boldsymbol{\mathbf{e}} _i\}\cup\{ \boldsymbol{\mathbf{\theta}} _i\}$ 下,$A$ 有块对角形式:$A=A|_W\oplus A|_{W^{\bot}}$。实际上,该块对角形式可以进一步 “细化”。
定理 3
设 $A$ 为 n 维实线性空间$V$ 上的正交变换。则在 $V$ 内存在一组标准正交基,使得 $A$ 具有如下块对角形式:
\begin{equation}
A=\left[\begin{array}{lllllll}
\lambda_1 & & & & & & \\
& \lambda_2 & & & & & \\
& & \ddots & & & 0 & \\
& & & \lambda_k & & & \\
& & & & S_1 & & \\
& & 0 & & & \ddots & \\
& & & & & & S_l
\end{array}\right]~,
\end{equation}
其中 $\lambda_i=\pm 1(i=1,2...k)$,$S_i$ 为
式 6 ,$\phi$ 由 $\phi_i$ 代替。
证明:
若 $n=1$,矩阵为一实数,设为 a。由 $(a \boldsymbol{\mathbf{x}} ,a \boldsymbol{\mathbf{x}} )= \boldsymbol{\mathbf{x}} ^2$ 可得,$a=\pm 1$。
若 $n=2$ 且 $A$ 没有本征值,由引理 1 可知,$A$ 在 $V$ 上必有一二维不变子空间,$A$ 的形式就是旋转矩阵。
如果 $A$ 有一本征值 $\lambda_1$ 且 $Ax=\lambda_1 \boldsymbol{\mathbf{x}} $,设单位向量 $ \boldsymbol{\mathbf{y}} \cdot \boldsymbol{\mathbf{x}} =0$,由引理 3 知,$ \boldsymbol{\mathbf{y}} $ 也是 $A$ 的本征向量。设 $Ay=\lambda_2 \boldsymbol{\mathbf{y}} $,则
\begin{equation}
A=\left[\begin{array}{rr}
\lambda_1&0\\
0&\lambda_2
\end{array}
\right]~.
\end{equation}
若 $A$ 无本征值,由引理 2 知其形式即二阶旋转矩阵,对应复根 $\cos\phi- \mathrm{i} \sin\phi$。
接下来设 $n>2$,用数学归纳法即可证明。若 $A$ 无本征值,则必有一二维不变子空间,设为 $S$,$A|_{S}$ 为式 6 。$A|_{S^{\bot}}$ 为正交矩阵,若 $\lambda_1$ 为其本征值,则必定有一维不变子空间,设对应的本征向量为 $ \boldsymbol{\mathbf{x}} _1$,则可以扩展为 $S^{\bot}$ 上的标准正交基,设 $ \boldsymbol{\mathbf{x}} _2$ 的正交补为 $S_1$,则
\begin{equation}
\left[\begin{array}{rrr}
A|_{S}&0&0\\
0&\lambda_1&0\\
0&0&A|_{S_1}
\end{array}
\right]~.
\end{equation}
则 $\lambda_1$ 也是 $A$ 的本征值,矛盾。故 $A$ 由若干个形式如
式 6 的二阶矩阵直和而成。
若 $A$ 有本征值,令其为 $\lambda'_1$,则其本征向量可以扩展为全空间的标准正交基。在该本征向量的正交补空间讨论,若可以找到另一本征值 $\lambda'_2$,则对应的本征向量又可以扩展为该正交补上的基矢组,经过相似变换得到 $A$ 的新形式,$\lambda'_1$ 和 $\lambda'_2$ 为对角元。以此类推,最后得到该定理的形式,$k$ 为 $A$ 的实本征值数量。
2. 对称变换
定义 2
设 $\mathcal B$ 为实线性空间上的线性变换,若对于任意 $ \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} \in V$ 有
\begin{equation}
( \boldsymbol{\mathbf{x}} ,\mathcal B \boldsymbol{\mathbf{y}} )=(\mathcal B \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} )~,
\end{equation}
则称 $B$ 为对称变换。
若 $V$ 为 n 维实线性空间,$B$ 为对称变换的矩阵表示。任选一组标准正交基,由式 13 得:
\begin{equation}
\boldsymbol{\mathbf{x}} ^TB \boldsymbol{\mathbf{y}} = \boldsymbol{\mathbf{x}} ^TB^T \boldsymbol{\mathbf{y}} ~.
\end{equation}
左乘 $ \boldsymbol{\mathbf{x}} $ 可得,
\begin{equation}
B \boldsymbol{\mathbf{y}} =B^T \boldsymbol{\mathbf{y}} ~.
\end{equation}
因此,$B=B^T$,对称变换的矩阵表示是对称矩阵。
定理 4
$n$ 维欧式空间上的线性变换 $\mathcal B$ 是对称变换当且仅当 $\mathcal B$ 在任意标准正交基下的矩阵表示为对称矩阵。
前文的推导只要求基矢标准正交,因此该定理成立。
对称变换有类似正交变换的结论:
定理 5
若 $U$ 是 $B$ 的不变子空间,则 $U^{\bot}$ 也是 $B$ 的不变子空间。
证明:
任选 $ \boldsymbol{\mathbf{x}} \in U, \boldsymbol{\mathbf{y}} \in U^{\bot}$,则
\begin{equation}
(B \boldsymbol{\mathbf{y}} , \boldsymbol{\mathbf{x}} )=( \boldsymbol{\mathbf{y}} ,B \boldsymbol{\mathbf{x}} )=0~,
\end{equation}
因而 $B \boldsymbol{\mathbf{y}} \in U^{\bot}$,$ U^{\bot}$ 是 $B$ 的不变子空间。
习题 2
设 $\mathcal B$ 为 $n$ 维欧式空间上的线性变换,则 $\mathcal B$ 是正交变换 $\Longleftrightarrow$ 存在一组标准正交基,使得 $\mathcal B$ 在该基下的表示为对角矩阵。
下面罗列一些对称矩阵常见结论,$A$ 表示任一对称矩阵,证明略。
定理 7
若 $a,b$ 是 $A$ 的不同特征值,则对应的特征向量相互正交。
定理 8
$A$ 一定可以正交对角化。即欧式空间必定存在一组标准正交基,使得 $A$ 在这组基下是对角矩阵。
对于基域不为 $2$ 的实线性空间,其上的二次型总可以写为对称矩阵的形式。因此定理 8 相当于说:
任一二次型都可以经正交合同变换变为标准二次型。
上述常见定理的证明见定理 1 。
1. ^ 广义内积即二次型决定的对称双线性函数:$( \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} )\equiv \frac{1}{2}(q( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} )-q( \boldsymbol{\mathbf{x}} )-q( \boldsymbol{\mathbf{y}} ))$,利用该性质可证明保二次型不变等价于内积不变。
2. ^ 该充要条件并不能推广至广义内积空间。因为对于退化的二次型,保内积不变无法推出 “将线性无关组映射为线性无关组”。
3. ^ 参考 Jier Peter 的《代数学基础》
致读者: 小时百科一直以来坚持所有内容免费无广告,这导致我们处于严重的亏损状态。 长此以往很可能会最终导致我们不得不选择大量广告以及内容付费等。 因此,我们请求广大读者
热心打赏 ,使网站得以健康发展。 如果看到这条信息的每位读者能慷慨打赏 20 元,我们一周就能脱离亏损, 并在接下来的一年里向所有读者继续免费提供优质内容。 但遗憾的是只有不到 1% 的读者愿意捐款, 他们的付出帮助了 99% 的读者免费获取知识, 我们在此表示感谢。