正交矩阵、酉矩阵

                     

贡献者: addis

  • 本文处于草稿阶段。
  • 需要整合

   酉矩阵(unitary matrix)也叫幺正矩阵。当矩阵元为实数时也叫正交矩阵(orthogonal matrix),是正交矩阵的复数拓展,即矩阵元可以是复数。酉矩阵 $ \boldsymbol{\mathbf{U}} $ 的定义同样为

\begin{equation} \sum_k U_{ki}^* U_{kj} = \delta_{ij}~. \end{equation}
但由于复数的列矢量没有对应的几何矢量,所以这里的正交完全是复线性空间中的广义正交。

1. 实数的情况

预备知识 正交归一基底,逆矩阵

   若一个实数方阵的每一列的模长都等于 $1$,且任意两列都正交,那么这个矩阵就是一个单位正交阵。若 $ \boldsymbol{\mathbf{U}} $ 为单位正交阵,则其矩阵元满足

\begin{equation} \sum_k U_{ki} U_{kj} = \delta_{ij}~, \end{equation}
其中 $\delta_{ij}$ 是克罗内克 $\delta$ 函数。所以若把 $N$ 阶单位正交阵的每一列看做 $N$ 维空间中的一个单位矢量的直角坐标,那么这些单位矢量就组成该空间的一组正交归一基底。

   式 2 也可以用矩阵转置和矩阵乘法表示为

\begin{equation} \boldsymbol{\mathbf{U}} ^{\mathrm{T}} \boldsymbol{\mathbf{U}} = \boldsymbol{\mathbf{I}} ~, \end{equation}
其中 $ \boldsymbol{\mathbf{I}} $ 是单位矩阵。根据逆矩阵的定义,我们得到单位正交矩阵的一个重要性质,即其逆矩阵等于转置矩阵
\begin{equation} \boldsymbol{\mathbf{U}} ^{-1} = \boldsymbol{\mathbf{U}} ^{\mathrm{T}} ~. \end{equation}
由逆矩阵的性质(式 2 )得
\begin{equation} \boldsymbol{\mathbf{U}} \boldsymbol{\mathbf{U}} ^{\mathrm{T}} = \boldsymbol{\mathbf{U}} \boldsymbol{\mathbf{U}} ^{-1} = \boldsymbol{\mathbf{I}} ~. \end{equation}
表示为矩阵元的运算就是
\begin{equation} \sum_k U_{ik} U_{jk} = \delta_{ij}~. \end{equation}
所以单位正交矩阵的所有行同样正交归一。易证式 2 式 6 互为充分必要条件,都可以作为单位正交阵的定义。

2. 几何理解

   为了更形象地理解单位正交阵的上述性质,我们以二维几何矢量和二维实数方阵为例讨论,三维的情况同理可得。

   任意的二维实数酉矩阵可以看做是两组正交归一基底 $ \hat{\boldsymbol{\mathbf{x}}} , \hat{\boldsymbol{\mathbf{y}}} $ 和 $ \hat{\boldsymbol{\mathbf{u}}} , \hat{\boldsymbol{\mathbf{v}}} $ 之间的变换(“见平面旋转矩阵” 中的 “被动理解”)。

\begin{equation} \boldsymbol{\mathbf{U}} = \begin{pmatrix} \hat{\boldsymbol{\mathbf{u}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{x}}} & \hat{\boldsymbol{\mathbf{v}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{x}}} \\ \hat{\boldsymbol{\mathbf{u}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{y}}} & \hat{\boldsymbol{\mathbf{v}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{y}}} \end{pmatrix} ~, \end{equation}
显然矩阵的两个列矢量满足正交归一。由内积的交换律,我们同样可以把矩阵的两行分别看做单位矢量 $ \hat{\boldsymbol{\mathbf{x}}} , \hat{\boldsymbol{\mathbf{y}}} $ 在正交归一基底 $ \hat{\boldsymbol{\mathbf{u}}} , \hat{\boldsymbol{\mathbf{v}}} $ 上的坐标,所以矩阵的两个行矢量同样正交归一。

   现在我们令任意几何矢量以 $ \hat{\boldsymbol{\mathbf{x}}} , \hat{\boldsymbol{\mathbf{y}}} $ 为基底的坐标为 $(x, y)$,以 $ \hat{\boldsymbol{\mathbf{u}}} , \hat{\boldsymbol{\mathbf{v}}} $ 为基底的坐标为 $(u, v)$,即

\begin{equation} \hat{\boldsymbol{\mathbf{v}}} = u \hat{\boldsymbol{\mathbf{u}}} + v \hat{\boldsymbol{\mathbf{v}}} = x \hat{\boldsymbol{\mathbf{x}}} + y \hat{\boldsymbol{\mathbf{y}}} ~. \end{equation}

   由正交归一基底的性质,

\begin{equation} \begin{cases} x = (u \hat{\boldsymbol{\mathbf{u}}} + v \hat{\boldsymbol{\mathbf{v}}} ) \boldsymbol\cdot \hat{\boldsymbol{\mathbf{x}}} \\ y = (u \hat{\boldsymbol{\mathbf{u}}} + v \hat{\boldsymbol{\mathbf{v}}} ) \boldsymbol\cdot \hat{\boldsymbol{\mathbf{y}}} \end{cases}~, \qquad \begin{cases} u = (x \hat{\boldsymbol{\mathbf{x}}} + y \hat{\boldsymbol{\mathbf{y}}} ) \boldsymbol\cdot \hat{\boldsymbol{\mathbf{u}}} \\ v = (x \hat{\boldsymbol{\mathbf{x}}} + y \hat{\boldsymbol{\mathbf{y}}} ) \boldsymbol\cdot \hat{\boldsymbol{\mathbf{v}}} \end{cases}~. \end{equation}
写成矩阵的形式,就是
\begin{equation} \begin{pmatrix}x\\y\end{pmatrix} = \begin{pmatrix} \hat{\boldsymbol{\mathbf{u}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{x}}} & \hat{\boldsymbol{\mathbf{v}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{x}}} \\ \hat{\boldsymbol{\mathbf{u}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{y}}} & \hat{\boldsymbol{\mathbf{v}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{y}}} \end{pmatrix} \begin{pmatrix}u\\v\end{pmatrix} ~, \qquad \begin{pmatrix}u\\v\end{pmatrix} = \begin{pmatrix} \hat{\boldsymbol{\mathbf{x}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{u}}} & \hat{\boldsymbol{\mathbf{y}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{u}}} \\ \hat{\boldsymbol{\mathbf{x}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{v}}} & \hat{\boldsymbol{\mathbf{y}}} \boldsymbol\cdot \hat{\boldsymbol{\mathbf{v}}} \end{pmatrix} \begin{pmatrix}x\\y\end{pmatrix} ~. \end{equation}
注意上式左边的矩阵是 $ \boldsymbol{\mathbf{U}} $,右边的矩阵是 $ \boldsymbol{\mathbf{U}} ^{\mathrm{T}} $,而右边的变换是左边的逆变换,所以 $ \boldsymbol{\mathbf{U}} ^{\mathrm{T}} = \boldsymbol{\mathbf{U}} ^{-1}$。

                     

© 小时科技 保留一切权利