正交变换与对称变换

                     

贡献者: 叶月2_; addis

   本文用 “$( \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} )$” 表示对任意两个向量作内积。本文的 “内积” 是狭义上的正定性对称双线性函数。实际上,正交变换的概念可以拓展至配备任意非退化二次型的线性空间,可见正交矩阵一节定义 1

1. 正交变换

定义 1 

   定义实内积空间 $V$ 上的满射 $\mathcal A$。对于任意 $ \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} \in V$,若有:

\begin{equation} ( \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} )=(\mathcal A \boldsymbol{\mathbf{x}} ,\mathcal A \boldsymbol{\mathbf{y}} )~, \end{equation}
则称 $\mathcal A$ 是 $V$ 上的正交变换。也就是说,正交变换是保内积不变的满射,从而保向量长度和向量之间的夹角不变。

   实际上,正交变换是线性变换。

定理 1 

   实内积空间 $V$ 上的正交变换 $\mathcal A$ 一定是线性映射。

   证明:

\begin{equation} \begin{aligned} |\mathcal A( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} )-(\mathcal A \boldsymbol{\mathbf{x}} +\mathcal A \boldsymbol{\mathbf{y}} )|^2&=( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} )^2+ \boldsymbol{\mathbf{x}} ^2+ \boldsymbol{\mathbf{y}} ^2-2\left(\mathcal A( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} ),\mathcal A \boldsymbol{\mathbf{x}} +\mathcal A \boldsymbol{\mathbf{y}} \right)\\ &=( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} )^2+ \boldsymbol{\mathbf{x}} ^2+ \boldsymbol{\mathbf{y}} ^2-2( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} , \boldsymbol{\mathbf{x}} )-2( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} , \boldsymbol{\mathbf{y}} )\\ &=0 \end{aligned} ~,\end{equation}

   因而 $\mathcal A( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} )=\mathcal A \boldsymbol{\mathbf{x}} +\mathcal A \boldsymbol{\mathbf{y}} $。同理可得 $\mathcal A(k \boldsymbol{\mathbf{x}} )=k\mathcal A( \boldsymbol{\mathbf{x}} )$。

定理 2 

   实内积空间 $V$ 上的正交变换 $\mathcal A$ 一定是双射。

   证明:由于正交变换是满射,所以只需要利用线性证明其是单射即可。 设存在 $\mathcal A \boldsymbol{\mathbf{x}} =\mathcal A \boldsymbol{\mathbf{y}} $,则 $\mathcal A \boldsymbol{\mathbf{x}} -\mathcal A \boldsymbol{\mathbf{y}} =A( \boldsymbol{\mathbf{x}} - \boldsymbol{\mathbf{y}} )= \boldsymbol{\mathbf{0}} $。又因为 $( \boldsymbol{\mathbf{x}} - \boldsymbol{\mathbf{y}} , \boldsymbol{\mathbf{x}} - \boldsymbol{\mathbf{y}} )=(A( \boldsymbol{\mathbf{x}} - \boldsymbol{\mathbf{y}} ),A( \boldsymbol{\mathbf{x}} - \boldsymbol{\mathbf{y}} ))= \boldsymbol{\mathbf{0}} $,由正定性可得 $ \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{y}} $,得证。

   设 $\{ \boldsymbol{\mathbf{e}} _i\}$ 是 $V$ 上的一组标准正交基。由正交变换保内积可知,该基映射后依然是标准正交的。又因为正交变换是单射,所以映射后的向量组是线性无关的,所以正交变换$\mathcal A$把标准正交基映射为标准正交基。

   也就是说:$\mathcal A$ 是正交变换 $\Longleftrightarrow \mathcal A$把标准正交基映射为标准正交基。后者是正交矩阵的定义,可见正交矩阵是正交变换的矩阵表示。正交矩阵保二次型不变的性质等价于正交变换的内积定义,1或者说——

   $\mathcal A$ 是正交变换 $\Longleftrightarrow $ 对任意 $ \boldsymbol{\mathbf{x}} \in V$,线性变换 $\mathcal A$ 满足 $|\mathcal A \boldsymbol{\mathbf{x}} |=| \boldsymbol{\mathbf{x}} |$。2

   令 $O(n)$ 表示 $n$ 维线性空间 $V$ 上全体正交变换的集合。由定义可知,该集合具有如下性质:

  1. 封闭性。若 $A,B\in O(n)$,则 $AB\in O(n)$;
  2. 结合性。若 $A,B,C\in O(n)$,则 $A(BC)=(AB)C$;
  3. 单位元存在性。$I\in O(n)$;
  4. 逆元存在性。若 $A\in O(n)$,则 $A^{-1}\in O(n)$;

   所以,正交变换构成一个群。

   在欧几里得空间中,正交矩阵的行列式为 $1$ 或者 $-1$,常称行列式为 $1$ 的正交变换为第一类的(旋转),用 $SO(n)$ 表示;称行列式为 $-1$ 的正交变换为第二类的正交变换。

正交变换的本征值

   由上述讨论可知,正交变换若有本征向量,则本征值的模长为 $1$,从而保证向量的模长不变。又因为 $O(3)$ 定义在实数域的线性空间上,因此本征值必为实数。

推论 1 

   设 $\lambda$ 为正交变换 $A$ 的本征值,则 $\lambda=\pm 1$。

推论 2 

   若 $V$ 是奇数维线性空间,$A\in SO(3)$ 必有本征值 $1$。

   证明: 我们知道,在复数域上,矩阵行列式等于特征值的连乘。由于一元多项式方程里复根成对出现(若 $\lambda_0$ 为本征值,则 $\lambda_0^{*}$ 也为本征值),所以复根部分的本征值连乘结果必为 $1$。于是剩下的奇数个实本征值连乘结果必为 $1$,所以至少有一个本征值为 $1$,得证。

正交变换的块对角形式

   为了简化正交矩阵的形式,我们先来证明两个常用结论。

引理 1 

   设 $f$ 为实线性空间$V$ 上的线性映射,存在 $f$ 的不变子空间 $W\subseteq V$,且 $ \operatorname {dim}W\in\{1,2\}$。

   证明:3

   若 $f$ 有若干个实本征值,则其对应的本征向量是 $V$ 上的一维不变子空间。

   将 $n$ 维 $V$ 复化为 $U$。若 $\{ \boldsymbol{\mathbf{e}} _i\}$ 为 $V$ 上的一组基,则任意 $ \boldsymbol{\mathbf{x}} \in U$ 可表示为:

\begin{equation} \boldsymbol{\mathbf{x}} =a^i \boldsymbol{\mathbf{e}} _i+\mathrm i b^j \boldsymbol{\mathbf{e}} _j= \boldsymbol{\mathbf{u}} +\mathrm i \boldsymbol{\mathbf{v}} ~. \end{equation}
其中 $a^i,b^i\in \mathbb R, \boldsymbol{\mathbf{u}} , \boldsymbol{\mathbf{v}} \in V$。显然 $U\supseteq V$。 在复数域上,$f$ 有 $n$ 个本征值。设有 $k$ 个实本征值,则对应的本征向量是 $V$ 上的一维不变子空间。设复本征值表示为 $a+\mathrm ib$,对应本征向量表示为 $ \boldsymbol{\mathbf{x}} +\mathrm i \boldsymbol{\mathbf{y}} \,( \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} \in V)$。利用 $f$ 的线性可得:
\begin{equation} \begin{aligned} f( \boldsymbol{\mathbf{x}} +\mathrm i \boldsymbol{\mathbf{y}} )&=(a+\mathrm i b)( \boldsymbol{\mathbf{x}} +\mathrm i \boldsymbol{\mathbf{y}} )\\ &=(a \boldsymbol{\mathbf{x}} -b \boldsymbol{\mathbf{y}} )+\mathrm i(a \boldsymbol{\mathbf{y}} +b \boldsymbol{\mathbf{x}} )\\ &=f( \boldsymbol{\mathbf{x}} )+\mathrm if( \boldsymbol{\mathbf{y}} ) \end{aligned}~. \end{equation}
即:
\begin{equation} \begin{aligned} f( \boldsymbol{\mathbf{x}} )&=a \boldsymbol{\mathbf{x}} -b \boldsymbol{\mathbf{y}} \\ f( \boldsymbol{\mathbf{y}} )&=a \boldsymbol{\mathbf{y}} +b \boldsymbol{\mathbf{x}} \end{aligned}~, \end{equation}
所以 $ \operatorname {Span}\{ \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} \}$ 为 $f$ 在 $V$ 上的一个二维不变子空间。

引理 2 

   若正交变换 $A$ 有复根,对应本征向量 $ \boldsymbol{\mathbf{x}} = \boldsymbol{\mathbf{u}} +\mathrm i \boldsymbol{\mathbf{v}} $。则 $ \boldsymbol{\mathbf{u}} , \boldsymbol{\mathbf{v}} $ 是相互正交的本征向量。令 $W= \operatorname {Span}\{ \boldsymbol{\mathbf{u}} , \boldsymbol{\mathbf{v}} \}$,则有:

\begin{equation} A|_W=\left[\begin{array}{rr} \cos \phi & \sin \phi \\ -\sin \phi & \cos \phi \end{array}\right]~. \end{equation}

   证明: 设复本征值 $\lambda=a+b\mathrm i= \operatorname {cos}\phi+\mathrm i \operatorname {sin}\phi$,代入式 5 便可得形式为式 6 的 $A|_W$。接下来只需要证明实部和虚部分量是标准正交即可。为方便计,把转置操作表示为'。

   由于 $k \boldsymbol{\mathbf{x}} $ 依然是 $A$ 的本征向量,我们可以归一化其实部分量,使得 $ \boldsymbol{\mathbf{u}} ^2=1$。则归一化后的

\begin{equation} \begin{aligned} \boldsymbol{\mathbf{x}} ^2&=( \boldsymbol{\mathbf{u}} +\mathrm i \boldsymbol{\mathbf{v}} )^2\\ &=1- \boldsymbol{\mathbf{v}} ^2+2\mathrm i \boldsymbol{\mathbf{u}} \cdot \boldsymbol{\mathbf{v}} \end{aligned}~. \end{equation}

   由于 $A'=A^{-1}$ 且 $A \boldsymbol{\mathbf{x}} =\lambda \boldsymbol{\mathbf{x}} $,左乘 $A'$ 后得 $ \boldsymbol{\mathbf{x}} =\lambda A' \boldsymbol{\mathbf{x}} $,利用正交变换不改变向量模长,即 $|\lambda|^2=1$,得 $A' \boldsymbol{\mathbf{x}} =\lambda^* \boldsymbol{\mathbf{x}} $。所以

\begin{equation} \boldsymbol{\mathbf{x}} 'A' \boldsymbol{\mathbf{x}} =\lambda^* \boldsymbol{\mathbf{x}} ' \boldsymbol{\mathbf{x}} =(Ax)' \boldsymbol{\mathbf{x}} =\lambda \boldsymbol{\mathbf{x}} ' \boldsymbol{\mathbf{x}} ~, \end{equation}
因此 $ \boldsymbol{\mathbf{x}} ^2= \boldsymbol{\mathbf{x}} ' \boldsymbol{\mathbf{x}} =0$。代入式 7 可得:
\begin{equation} \boldsymbol{\mathbf{v}} ^2=1,\, \boldsymbol{\mathbf{u}} \cdot \boldsymbol{\mathbf{v}} =0~, \end{equation}
得证。 这两条引理说明,正交变换 $A$ 的每个复本征值都对应一个实数域上的二维不变子空间,且 $A$ 限制在该子空间上的形式总如式 6 所示。若 $A$ 为二阶矩阵且实数域上无特征根,则 $A$ 唯一表示为该形式,乘以任意向量相当于旋转该向量。

习题 1 

   写出二阶正交矩阵的所有可能形式。

引理 3 

   设 $A$ 为 $V$ 上的正交变换,若 $W$ 为其不变子空间,则 $W^{\bot}$ 也是其不变子空间。

   设 $\{ \boldsymbol{\mathbf{e}} _i\}$ 为 $W$ 上的一组标准正交基,并扩展到全空间,使得 $ \operatorname {Span}\{ \boldsymbol{\mathbf{\theta}} _i\}$ 张成 $W^{\bot}$。由题设知 $\{A \boldsymbol{\mathbf{e}} _i\}$ 依然张成 $W$,由于 $(A \boldsymbol{\mathbf{\theta}} _i,A \boldsymbol{\mathbf{e}} _i)=0$,因此 $A \boldsymbol{\mathbf{\theta}} _i\in W^{\bot}$,得证。

   由定理 3 可知,在 $\{ \boldsymbol{\mathbf{e}} _i\}\cup\{ \boldsymbol{\mathbf{\theta}} _i\}$ 下,$A$ 有块对角形式:$A=A|_W\oplus A|_{W^{\bot}}$。实际上,该块对角形式可以进一步 “细化”。

定理 3 

   设 $A$ 为 n 维实线性空间$V$ 上的正交变换。则在 $V$ 内存在一组标准正交基,使得 $A$ 具有如下块对角形式:

\begin{equation} A=\left[\begin{array}{lllllll} \lambda_1 & & & & & & \\ & \lambda_2 & & & & & \\ & & \ddots & & & 0 & \\ & & & \lambda_k & & & \\ & & & & S_1 & & \\ & & 0 & & & \ddots & \\ & & & & & & S_l \end{array}\right]~, \end{equation}
其中 $\lambda_i=\pm 1(i=1,2...k)$,$S_i$ 为式 6 ,$\phi$ 由 $\phi_i$ 代替。

   证明: 若 $n=1$,矩阵为一实数,设为 a。由 $(a \boldsymbol{\mathbf{x}} ,a \boldsymbol{\mathbf{x}} )= \boldsymbol{\mathbf{x}} ^2$ 可得,$a=\pm 1$。

   若 $n=2$ 且 $A$ 没有本征值,由引理 1 可知,$A$ 在 $V$ 上必有一二维不变子空间,$A$ 的形式就是旋转矩阵。 如果 $A$ 有一本征值 $\lambda_1$ 且 $Ax=\lambda_1 \boldsymbol{\mathbf{x}} $,设单位向量 $ \boldsymbol{\mathbf{y}} \cdot \boldsymbol{\mathbf{x}} =0$,由引理 3 知,$ \boldsymbol{\mathbf{y}} $ 也是 $A$ 的本征向量。设 $Ay=\lambda_2 \boldsymbol{\mathbf{y}} $,则

\begin{equation} A=\left[\begin{array}{rr} \lambda_1&0\\ 0&\lambda_2 \end{array} \right]~. \end{equation}

   若 $A$ 无本征值,由引理 2 知其形式即二阶旋转矩阵,对应复根 $\cos\phi- \mathrm{i} \sin\phi$。

   接下来设 $n>2$,用数学归纳法即可证明。若 $A$ 无本征值,则必有一二维不变子空间,设为 $S$,$A|_{S}$ 为式 6 。$A|_{S^{\bot}}$ 为正交矩阵,若 $\lambda_1$ 为其本征值,则必定有一维不变子空间,设对应的本征向量为 $ \boldsymbol{\mathbf{x}} _1$,则可以扩展为 $S^{\bot}$ 上的标准正交基,设 $ \boldsymbol{\mathbf{x}} _2$ 的正交补为 $S_1$,则

\begin{equation} \left[\begin{array}{rrr} A|_{S}&0&0\\ 0&\lambda_1&0\\ 0&0&A|_{S_1} \end{array} \right]~. \end{equation}
则 $\lambda_1$ 也是 $A$ 的本征值,矛盾。故 $A$ 由若干个形式如式 6 的二阶矩阵直和而成。

   若 $A$ 有本征值,令其为 $\lambda'_1$,则其本征向量可以扩展为全空间的标准正交基。在该本征向量的正交补空间讨论,若可以找到另一本征值 $\lambda'_2$,则对应的本征向量又可以扩展为该正交补上的基矢组,经过相似变换得到 $A$ 的新形式,$\lambda'_1$ 和 $\lambda'_2$ 为对角元。以此类推,最后得到该定理的形式,$k$ 为 $A$ 的实本征值数量。

2. 对称变换

定义 2 

   设 $\mathcal B$ 为实线性空间上的线性变换,若对于任意 $ \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} \in V$ 有

\begin{equation} ( \boldsymbol{\mathbf{x}} ,\mathcal B \boldsymbol{\mathbf{y}} )=(\mathcal B \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} )~, \end{equation}
则称 $B$ 为对称变换。

   若 $V$ 为 n 维实线性空间,$B$ 为对称变换的矩阵表示。任选一组标准正交基,由式 13 得:

\begin{equation} \boldsymbol{\mathbf{x}} ^TB \boldsymbol{\mathbf{y}} = \boldsymbol{\mathbf{x}} ^TB^T \boldsymbol{\mathbf{y}} ~. \end{equation}
左乘 $ \boldsymbol{\mathbf{x}} $ 可得,
\begin{equation} B \boldsymbol{\mathbf{y}} =B^T \boldsymbol{\mathbf{y}} ~. \end{equation}
因此,$B=B^T$,对称变换的矩阵表示是对称矩阵。

定理 4 

   $n$ 维欧式空间上的线性变换 $\mathcal B$ 是对称变换当且仅当 $\mathcal B$ 在任意标准正交基下的矩阵表示为对称矩阵。

   前文的推导只要求基矢标准正交,因此该定理成立。

   对称变换有类似正交变换的结论:

定理 5 

   若 $U$ 是 $B$ 的不变子空间,则 $U^{\bot}$ 也是 $B$ 的不变子空间。

   证明:

   任选 $ \boldsymbol{\mathbf{x}} \in U, \boldsymbol{\mathbf{y}} \in U^{\bot}$,则

\begin{equation} (B \boldsymbol{\mathbf{y}} , \boldsymbol{\mathbf{x}} )=( \boldsymbol{\mathbf{y}} ,B \boldsymbol{\mathbf{x}} )=0~, \end{equation}
因而 $B \boldsymbol{\mathbf{y}} \in U^{\bot}$,$ U^{\bot}$ 是 $B$ 的不变子空间。

习题 2 

   设 $\mathcal B$ 为 $n$ 维欧式空间上的线性变换,则 $\mathcal B$ 是正交变换 $\Longleftrightarrow$ 存在一组标准正交基,使得 $\mathcal B$ 在该基下的表示为对角矩阵。

   下面罗列一些对称矩阵常见结论,$A$ 表示任一对称矩阵,证明略。

定理 6 

   $A$ 的特征值都为实数。

定理 7 

   若 $a,b$ 是 $A$ 的不同特征值,则对应的特征向量相互正交。

定理 8 

   $A$ 一定可以正交对角化。即欧式空间必定存在一组标准正交基,使得 $A$ 在这组基下是对角矩阵。

   对于基域不为 $2$ 的实线性空间,其上的二次型总可以写为对称矩阵的形式。因此定理 8 相当于说:

   任一二次型都可以经正交合同变换变为标准二次型。

   上述常见定理的证明见定理 1


1. ^ 广义内积即二次型决定的对称双线性函数:$( \boldsymbol{\mathbf{x}} , \boldsymbol{\mathbf{y}} )\equiv \frac{1}{2}(q( \boldsymbol{\mathbf{x}} + \boldsymbol{\mathbf{y}} )-q( \boldsymbol{\mathbf{x}} )-q( \boldsymbol{\mathbf{y}} ))$,利用该性质可证明保二次型不变等价于内积不变。
2. ^ 该充要条件并不能推广至广义内积空间。因为对于退化的二次型,保内积不变无法推出 “将线性无关组映射为线性无关组”。
3. ^ 参考 Jier Peter 的《代数学基础》

                     

© 小时科技 保留一切权利