若已知矩阵 $ \boldsymbol{\mathbf{A}} $,我们把线性方程组
\begin{equation}
\boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{v}} = \lambda \boldsymbol{\mathbf{v}}
\end{equation}
称为矩阵 $ \boldsymbol{\mathbf{A}} $ 的
本征方程.式中 $ \boldsymbol{\mathbf{A}} $ 是已知的,而 $\lambda$ 和 $ \boldsymbol{\mathbf{v}} $ 是未知的.显然,当 $ \boldsymbol{\mathbf{v}} = \boldsymbol{\mathbf{0}} $ 时方程恒成立,所以我们通常只对非零解感兴趣.也就是说,我们希望找到一些非零矢量 $ \boldsymbol{\mathbf{v}} $,使得矩阵 $ \boldsymbol{\mathbf{A}} $ 乘以该矢量以后方向不变
1.对于每个这样的矢量,我们用一个标量 $\lambda$ 来描述其模长的改变.我们把这些矢量叫做
本征矢(eigen vector),把对应的 $\lambda$ 叫做
本征值(eigen value).
若令 $ \boldsymbol{\mathbf{I}} $ 为 $N\times N$ 的单位矩阵2,则本征方程本质上是一个齐次方程组
\begin{equation}
( \boldsymbol{\mathbf{A}} - \lambda \boldsymbol{\mathbf{I}} ) \boldsymbol{\mathbf{v}} = \boldsymbol{\mathbf{0}}
\end{equation}
括号中的矩阵相当于把矩阵 $ \boldsymbol{\mathbf{A}} $ 的对角线上的元都减去 $\lambda$ 得到的方阵.要确保方程有非零解,只需令系数矩阵 $ \boldsymbol{\mathbf{A}} - \lambda \boldsymbol{\mathbf{I}} $ 不是满秩的,即行列式为零
\begin{equation}
\left\lvert \boldsymbol{\mathbf{A}} - \lambda \boldsymbol{\mathbf{I}} \right\rvert = 0
\end{equation}
这是一个关于 $\lambda$ 的 $N$ 阶多项式,称为
特征多项式(characteristic polynomial).特征多项式必存在 $N$ 个复数根(包括重根),记为 $\lambda_i$($i = 1, 2\dots N$).将它们依次代入
eq. 2 ,就可以分别解出对应的本征矢.考虑到
eq. 2 是一个齐次方程,所以 $ \boldsymbol{\mathbf{A}} - \lambda_i \boldsymbol{\mathbf{I}} $ 的零空间中所有矢量都是本征矢,且零空间至少是一维的.我们把这个空间叫做 $\lambda_i$ 的
本征矢空间,是 $ \boldsymbol{\mathbf{v}} $ 所在的矢量空间的子空间.
令 $\lambda_i$ 的本征矢空间的维度是 $n_i$,若 $n_i = 1$,我们说 $\lambda_i$ 是非简并(non-degenerate)的,若 $n_i > 1$ 就说 $\lambda_i$ 是 $n_i$ 重简并(degenerate)的,把 $n_i$ 叫做简并数(degeneracy).
未完成:简并子空间应该写到哪里?
对角化与相似变换
求解矩阵的本征方程有时候也称为矩阵的对角化,原因如下:若我们把矩阵 $ \boldsymbol{\mathbf{A}} $ 的 $i$ 个本征值和本征列矢量记为 $\lambda_i$ 和 $ \boldsymbol{\mathbf{v}} _i$.如果把本征值按顺序组成对角矩阵 $ \boldsymbol{\mathbf{\Lambda}} $,把本征矢从按顺序从左到右组成方阵 $ \boldsymbol{\mathbf{P}} $,那么根据矩阵乘法的定义 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{P}} $ 相当于分别计算 $ \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{v}} _i$ 再从左到右排列.而 $ \boldsymbol{\mathbf{P}} \boldsymbol{\mathbf{\Lambda}} $ 相当于把 $\lambda_i \boldsymbol{\mathbf{v}} _i$ 从左到右排成方阵.二者应该相等,所有
\begin{equation}
\boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{P}} = \boldsymbol{\mathbf{P}} \boldsymbol{\mathbf{\Lambda}}
\end{equation}
由于方阵 $ \boldsymbol{\mathbf{P}} $ 是满秩
的(每列线性无关),必定存在逆矩阵 $ \boldsymbol{\mathbf{P}} ^{-1}$.两边右乘 $ \boldsymbol{\mathbf{P}} ^{-1}$ 得
\begin{equation}
\boldsymbol{\mathbf{A}} = \boldsymbol{\mathbf{P}} \boldsymbol{\mathbf{\Lambda}} \boldsymbol{\mathbf{P}} ^{-1}
\end{equation}
这种从 $ \boldsymbol{\mathbf{A}} $ 到 $ \boldsymbol{\mathbf{\Lambda}} $ 的变换被称为
相似变换(similarity transform).如果能找到使 $ \boldsymbol{\mathbf{\Lambda}} $ 为对角矩阵的 $ \boldsymbol{\mathbf{P}} $ 就相当于解出了本征方程
eq. 1 ,这就是 “对角化” 名字的由来.
1. ^ “方向” 只是从几何矢量中沿用过来的一个习惯说法,注意eq. 1 中的所有量都可以是复数.两个矢量方向相同意味着一个矢量乘以标量(包括复数)可以得到另一个.
2. ^ 即对角线上的元为 1,其他元为 0,见 “矩阵”