Prerequisite 正交矩阵
酉矩阵(unitary matrix)也叫幺正矩阵.当矩阵元为实数时也叫正交矩阵(orthogonal matrix),是正交矩阵的复数拓展,即矩阵元可以是复数.酉矩阵 $ \boldsymbol{\mathbf{U}} $ 的定义同样为
\begin{equation}
\sum_k U_{ki}^* U_{kj} = \delta_{ij}
\end{equation}
但由于复数的列矢量没有对应的几何矢量
,所以这里的正交完全是复线性空间中的广义正交.
单位正交矩阵的回收内容
若一个实数方阵的每一列的模长都等于 $1$,且任意两列都正交,那么这个矩阵就是一个单位正交阵.若 $ \boldsymbol{\mathbf{U}} $ 为单位正交阵,则其矩阵元满足
\begin{equation}
\sum_k U_{ki} U_{kj} = \delta_{ij}
\end{equation}
其中 $\delta_{ij}$ 是克罗内克 $\delta$ 函数.所以若把 $N$ 阶单位正交阵的每一列看做 $N$ 维空间中的一个单位矢量的直角坐标,那么这些单位矢量就组成该空间的一组正交归一基底.
eq. 2 也可以用矩阵转置和矩阵乘法表示为
\begin{equation}
\boldsymbol{\mathbf{U}} ^{\mathrm{T}} \boldsymbol{\mathbf{U}} = \boldsymbol{\mathbf{I}}
\end{equation}
其中 $ \boldsymbol{\mathbf{I}} $ 是单位矩阵.根据逆矩阵的定义,我们得到单位正交矩阵的一个重要性质,即其逆矩阵等于转置矩阵.
\begin{equation}
\boldsymbol{\mathbf{U}} ^{-1} = \boldsymbol{\mathbf{U}} ^{\mathrm{T}}
\end{equation}
由逆矩阵的性质(
eq. 2 )得
\begin{equation}
\boldsymbol{\mathbf{U}} \boldsymbol{\mathbf{U}} ^{\mathrm{T}} = \boldsymbol{\mathbf{U}} \boldsymbol{\mathbf{U}} ^{-1} = \boldsymbol{\mathbf{I}}
\end{equation}
表示为矩阵元的运算就是
\begin{equation}
\sum_k U_{ik} U_{jk} = \delta_{ij}
\end{equation}
所以单位正交矩阵的所有行同样正交归一.易证
eq. 2 和
eq. 6 互为充分必要条件,都可以作为单位正交阵的定义.
几何理解
为了更形象地理解单位正交阵的上述性质,我们以二维几何矢量和二维实数方阵为例讨论,三维的情况同理可得.
任意的二维实数方阵可以看做是两个单位几何矢量 $ \hat{\boldsymbol{\mathbf{u}}} , \hat{\boldsymbol{\mathbf{v}}} $ 在正交归一基底 $ \hat{\boldsymbol{\mathbf{x}}} , \hat{\boldsymbol{\mathbf{y}}} $ 上的坐标(即内积).
\begin{equation}
\boldsymbol{\mathbf{U}} = \begin{pmatrix} \hat{\boldsymbol{\mathbf{u}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{x}}} & \hat{\boldsymbol{\mathbf{v}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{x}}} \\
\hat{\boldsymbol{\mathbf{u}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{y}}} & \hat{\boldsymbol{\mathbf{v}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{y}}} \end{pmatrix}
\end{equation}
显然矩阵的两个列矢量满足正交归一.由内积的交换律,我们同样可以把矩阵的两行分别看做单位矢量 $ \hat{\boldsymbol{\mathbf{x}}} , \hat{\boldsymbol{\mathbf{y}}} $ 在正交归一基底 $ \hat{\boldsymbol{\mathbf{u}}} , \hat{\boldsymbol{\mathbf{v}}} $ 上的坐标,所以矩阵的两个行矢量同样正交归一.
现在我们令任意几何矢量以 $ \hat{\boldsymbol{\mathbf{x}}} , \hat{\boldsymbol{\mathbf{y}}} $ 为基底的坐标为 $(x, y)$,以 $ \hat{\boldsymbol{\mathbf{u}}} , \hat{\boldsymbol{\mathbf{v}}} $ 为基底的坐标为 $(u, v)$,即
\begin{equation}
\hat{\boldsymbol{\mathbf{v}}} = u \hat{\boldsymbol{\mathbf{u}}} + v \hat{\boldsymbol{\mathbf{v}}} = x \hat{\boldsymbol{\mathbf{x}}} + y \hat{\boldsymbol{\mathbf{y}}}
\end{equation}
由正交归一基底的性质,
\begin{equation}
\begin{cases}
x = (u \hat{\boldsymbol{\mathbf{u}}} + v \hat{\boldsymbol{\mathbf{v}}} ) \boldsymbol\cdot \hat{\boldsymbol{\mathbf{x}}} \\
y = (u \hat{\boldsymbol{\mathbf{u}}} + v \hat{\boldsymbol{\mathbf{v}}} ) \boldsymbol\cdot \hat{\boldsymbol{\mathbf{y}}}
\end{cases}
\qquad
\begin{cases}
u = (x \hat{\boldsymbol{\mathbf{x}}} + y \hat{\boldsymbol{\mathbf{y}}} ) \boldsymbol\cdot \hat{\boldsymbol{\mathbf{u}}} \\
v = (x \hat{\boldsymbol{\mathbf{x}}} + y \hat{\boldsymbol{\mathbf{y}}} ) \boldsymbol\cdot \hat{\boldsymbol{\mathbf{v}}}
\end{cases}
\end{equation}
写成矩阵的形式,就是
\begin{equation}
\begin{pmatrix}x\\y\end{pmatrix} = \begin{pmatrix} \hat{\boldsymbol{\mathbf{u}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{x}}} & \hat{\boldsymbol{\mathbf{v}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{x}}} \\
\hat{\boldsymbol{\mathbf{u}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{y}}} & \hat{\boldsymbol{\mathbf{v}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{y}}} \end{pmatrix} \begin{pmatrix}u\\v\end{pmatrix}
\qquad
\begin{pmatrix}u\\v\end{pmatrix} = \begin{pmatrix} \hat{\boldsymbol{\mathbf{x}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{u}}} & \hat{\boldsymbol{\mathbf{y}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{u}}} \\
\hat{\boldsymbol{\mathbf{x}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{v}}} & \hat{\boldsymbol{\mathbf{y}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{v}}} \end{pmatrix} \begin{pmatrix}x\\y\end{pmatrix}
\end{equation}
注意上式左边的矩阵是 $ \boldsymbol{\mathbf{U}} $,右边的矩阵是 $ \boldsymbol{\mathbf{U}} ^{\mathrm{T}} $,而右边的变换是左边的逆变换,所以 $ \boldsymbol{\mathbf{U}} ^{\mathrm{T}} = \boldsymbol{\mathbf{U}} ^{-1}$.