贡献者: addis
酉矩阵(unitary matrix)也叫幺正矩阵。当矩阵元为实数时也叫正交矩阵(orthogonal matrix),是正交矩阵的复数拓展,即矩阵元可以是复数。酉矩阵 $ \boldsymbol{\mathbf{U}} $ 的定义同样为
\begin{equation}
\sum_k U_{ki}^* U_{kj} = \delta_{ij}~.
\end{equation}
但由于复数的列矢量没有对应的
几何矢量,所以这里的正交完全是复线性空间中的广义正交。
1. 实数的情况
若一个实数方阵的每一列的模长都等于 $1$,且任意两列都正交,那么这个矩阵就是一个单位正交阵。若 $ \boldsymbol{\mathbf{U}} $ 为单位正交阵,则其矩阵元满足
\begin{equation}
\sum_k U_{ki} U_{kj} = \delta_{ij}~,
\end{equation}
其中 $\delta_{ij}$ 是克罗内克 $\delta$ 函数。所以若把 $N$ 阶单位正交阵的每一列看做 $N$ 维空间中的一个单位矢量的直角坐标,那么这些单位矢量就组成该空间的一组正交归一基底。
式 2 也可以用矩阵转置和矩阵乘法表示为
\begin{equation}
\boldsymbol{\mathbf{U}} ^{\mathrm{T}} \boldsymbol{\mathbf{U}} = \boldsymbol{\mathbf{I}} ~,
\end{equation}
其中 $ \boldsymbol{\mathbf{I}} $ 是单位矩阵。根据逆矩阵的定义,我们得到单位正交矩阵的一个重要性质,即其
逆矩阵等于转置矩阵。
\begin{equation}
\boldsymbol{\mathbf{U}} ^{-1} = \boldsymbol{\mathbf{U}} ^{\mathrm{T}} ~.
\end{equation}
由逆矩阵的性质(
式 2 )得
\begin{equation}
\boldsymbol{\mathbf{U}} \boldsymbol{\mathbf{U}} ^{\mathrm{T}} = \boldsymbol{\mathbf{U}} \boldsymbol{\mathbf{U}} ^{-1} = \boldsymbol{\mathbf{I}} ~.
\end{equation}
表示为矩阵元的运算就是
\begin{equation}
\sum_k U_{ik} U_{jk} = \delta_{ij}~.
\end{equation}
所以单位正交矩阵的所有行同样正交归一。易证
式 2 和
式 6 互为充分必要条件,都可以作为单位正交阵的定义。
2. 几何理解
为了更形象地理解单位正交阵的上述性质,我们以二维几何矢量和二维实数方阵为例讨论,三维的情况同理可得。
任意的二维实数酉矩阵可以看做是两组正交归一基底 $ \hat{\boldsymbol{\mathbf{x}}} , \hat{\boldsymbol{\mathbf{y}}} $ 和 $ \hat{\boldsymbol{\mathbf{u}}} , \hat{\boldsymbol{\mathbf{v}}} $ 之间的变换(“见平面旋转矩阵” 中的 “被动理解”)。
\begin{equation}
\boldsymbol{\mathbf{U}} = \begin{pmatrix} \hat{\boldsymbol{\mathbf{u}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{x}}} & \hat{\boldsymbol{\mathbf{v}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{x}}} \\
\hat{\boldsymbol{\mathbf{u}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{y}}} & \hat{\boldsymbol{\mathbf{v}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{y}}} \end{pmatrix} ~,
\end{equation}
显然矩阵的两个列矢量满足正交归一。由内积的交换律,我们同样可以把矩阵的两行分别看做单位矢量 $ \hat{\boldsymbol{\mathbf{x}}} , \hat{\boldsymbol{\mathbf{y}}} $ 在正交归一基底 $ \hat{\boldsymbol{\mathbf{u}}} , \hat{\boldsymbol{\mathbf{v}}} $ 上的坐标,所以矩阵的两个行矢量同样正交归一。
现在我们令任意几何矢量以 $ \hat{\boldsymbol{\mathbf{x}}} , \hat{\boldsymbol{\mathbf{y}}} $ 为基底的坐标为 $(x, y)$,以 $ \hat{\boldsymbol{\mathbf{u}}} , \hat{\boldsymbol{\mathbf{v}}} $ 为基底的坐标为 $(u, v)$,即
\begin{equation}
\hat{\boldsymbol{\mathbf{v}}} = u \hat{\boldsymbol{\mathbf{u}}} + v \hat{\boldsymbol{\mathbf{v}}} = x \hat{\boldsymbol{\mathbf{x}}} + y \hat{\boldsymbol{\mathbf{y}}} ~.
\end{equation}
由正交归一基底的性质,
\begin{equation}
\begin{cases}
x = (u \hat{\boldsymbol{\mathbf{u}}} + v \hat{\boldsymbol{\mathbf{v}}} ) \boldsymbol\cdot \hat{\boldsymbol{\mathbf{x}}} \\
y = (u \hat{\boldsymbol{\mathbf{u}}} + v \hat{\boldsymbol{\mathbf{v}}} ) \boldsymbol\cdot \hat{\boldsymbol{\mathbf{y}}}
\end{cases}~,
\qquad
\begin{cases}
u = (x \hat{\boldsymbol{\mathbf{x}}} + y \hat{\boldsymbol{\mathbf{y}}} ) \boldsymbol\cdot \hat{\boldsymbol{\mathbf{u}}} \\
v = (x \hat{\boldsymbol{\mathbf{x}}} + y \hat{\boldsymbol{\mathbf{y}}} ) \boldsymbol\cdot \hat{\boldsymbol{\mathbf{v}}}
\end{cases}~.
\end{equation}
写成矩阵的形式,就是
\begin{equation}
\begin{pmatrix}x\\y\end{pmatrix} = \begin{pmatrix} \hat{\boldsymbol{\mathbf{u}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{x}}} & \hat{\boldsymbol{\mathbf{v}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{x}}} \\
\hat{\boldsymbol{\mathbf{u}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{y}}} & \hat{\boldsymbol{\mathbf{v}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{y}}} \end{pmatrix} \begin{pmatrix}u\\v\end{pmatrix} ~,
\qquad
\begin{pmatrix}u\\v\end{pmatrix} = \begin{pmatrix} \hat{\boldsymbol{\mathbf{x}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{u}}} & \hat{\boldsymbol{\mathbf{y}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{u}}} \\
\hat{\boldsymbol{\mathbf{x}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{v}}} & \hat{\boldsymbol{\mathbf{y}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{v}}} \end{pmatrix} \begin{pmatrix}x\\y\end{pmatrix} ~.
\end{equation}
注意上式左边的矩阵是 $ \boldsymbol{\mathbf{U}} $,右边的矩阵是 $ \boldsymbol{\mathbf{U}} ^{\mathrm{T}} $,而右边的变换是左边的逆变换,所以 $ \boldsymbol{\mathbf{U}} ^{\mathrm{T}} = \boldsymbol{\mathbf{U}} ^{-1}$。