矩阵的本征问题

                     

贡献者: 叶月2_; addis; Giacomo; int256

预备知识 线性方程组与向量空间,矩阵的本征值,不变子空间

   若已知矩阵 A,我们把线性方程组

(1)Av=λv .
称为矩阵 A本征方程(eigen equation)。式中 A 是已知的,而 λv 是未知的。显然,当 v=0 时方程恒成立,所以我们通常只对非零解感兴趣。也就是说,我们希望找到一些非零向量 v,使得矩阵 A 乘以该向量以后方向不变1。对于每个这样的向量,我们用一个标量 λ 来描述其模长的改变。我们把这些向量叫做本征矢(eigen vector),把对应的 λ 叫做本征值(eigen value)。一些教材也翻译成特征矢特征值。小时百科中,eigen 译作 “本征”,而 characteristic 译作 “特征”。

几何意义

   几何上来讲,实数矩阵对应的线性变换相当于把坐标网格做旋转、拉伸、翻折等操作。所以一般而言,一个非零向量在变换后长度和方向都会改变。但也可能存在一些特殊的非零向量,使得变换后只可能改变长度而不改变方向。这些向量就是本征方程的解。注意这种几何理解仅适用于实数矩阵以及实数本征值和本征矢的解。

1. 求解本征方程

   若令 IN×N 的单位矩阵2,则本征方程式 1 移项后得到一个齐次线性方程组

(2)(AλI)v=0 .
括号中的矩阵相当于把矩阵 A 的对角线上的元都减去 λ 得到的方阵。要确保方程有非零解,只需令系数矩阵 AλI 不是满的,即行列式为零
(3)|AλI|=0 .
这是一个关于 λN 阶多项式,称为特征多项式(characteristic polynomial)。并不是所有矩阵都有本征向量和相应本征值,比如非特殊角的旋转变换并不能把任意向量旋转到与原向量平行。但是根据代数学基本定理,复数域上的特征多项式(一元 n 次方程)必有 n 个根(重根的重数包括在内),即有 n 个本征值。对于 n 阶矩阵 A,如果 λ 为特征方程的单根,称 λA单本征值;如果 λk 重根,称之为 Ak 重本征值,并称 kλ 的代数重数。

   把本征值记为 λii=1,2N)。将它们依次代入式 2 ,就可以分别解出对应的本征矢。通常把式 2 的解空间称为矩阵 A 对应于本征值 λ本征子空间,记为 Vλ,称该子空间的维数为几何重数,即线性无关的本征向量。根据方程的线性可知,本征子空间的任意向量都是本征矢。

   在物理上,如果本征子空间维度是 1,我们称相应的本征值是非简并(non-degenerate)的,若几何重数 ni 大于 1,则称 λini简并(degenerate)的,把 几何重数 ni 叫做简并数(degeneracy)。 可以证明,任意本征值的几何重数不大于代数重数。

例 1 二维矩阵的本征方程

   给出任意二维实数矩阵

(4)A=(abcd) .
要求它的本征值和本征矢,其特征多项式(式 3 )为
(5)|aλbcdλ|=(λa)(λd)bc=0 .
解二次方程得两个本征值为
(6)λ±=(a+d)±(ad)2+4bc2 .
复数域中必定存在两个根,包括重根。若要求本征值为实数,则需要另判别式(根号中的式子)大于零,否则本征方程无解。

   本征矢为

(7)v±=C(bλ±a)=C(λ±dc) ,
其中 C 是任意非零常数。若两本征值相同,则只存在一个一维的本征矢空间,即一条直线。

   下面列举与本征值相关的常用结论。

定理 1 

   设 λ1,λ2...λm 是方阵 Am 个互不相同的本征值,分别对应本征向量 x1,x2...xm。则 x1,x2...xm 线性无关。

   证明: 用数学归纳法证明。 m=1 显然成立。设 i=m1 成立,需要证明 i=m 成立。用反证法,假设 i=m 时,x1,x2...xm 线性相关,设有若干不全部为 0 的系数使得:

(8)xm=a1x1+a2x2+...am1xm1 ,
则有:
(9)Axm=a1λ1x1+a2λ2x2+...am1λxm1=λmxm .
由于式 8 中的 ai(i=1,2...m1) 不全为 0。所以至少有部分本征值满足 λi=λm,这与题设矛盾,因而定理成立。

   上述定理可以推广为几何重数大于 1 的情况,即:

推论 1 

   设 λ1,λ2...λm 是方阵 Am 个互不相同的本征值,分别对应本征向量组 {x1i},{x1i}...{xmi}i 的最大值取遍几何重数。则 {x1i},{x1i}...{xmi} 线性无关。

   证明思路一致。

定理 2 

   设 λ 是方阵 A 的一个本征值,x 是对应的本征向量。则有:

  1. A 可逆时,1λA1 的本征值;
  2. A 可逆时,|A|λ 是伴随矩阵 A 的本征值;
  3. f(x)x 的一元多项式,则 f(λ)f(A) 的一个本征值,并且 x 依然是矩阵 A1,A,f(A) 的分别对应于本征值 1λ,|A|λ,f(λ) 的本征向量。

   Proof. 现证第一点。由于 AA1x=A1Ax=λA1x=x,因此 x 依然是 A1 的本征向量,且本征值为 λ1。从线性变换的角度上看,A 使得 x“伸长” 为原来的 λ 倍,其逆操作必定是缩小为原来的 λ1,才能保证本征向量不变。

   第二点易证,留作习题。下证第三点,为证明方便,使用爱因斯坦求和约定。

   设 f(x)=anxn,则 f(A)=aiAi,f(λ)=anλn。显然我们有 f(A)x=aiAix=aiλix=f(λ)x,得证。

2. 对角化与相似变换

   求解矩阵的本征方程的过程有时候也叫做矩阵的对角化(diagonalization),因为方阵可对角化的充要条件是 An 个线性无关的本征向量。

定理 3 

   n 阶方阵 A 可对角化的充要条件是 An 个线性无关的本征向量。

   Proof. 设 Q=(x1,x2...xn) 是实现该相似变换的过渡矩阵,相似变换为:

(10)AQ=QBA(x1,x2...xn)=Qdiag(λ1,λ2...λn)(Ax1,Ax2...Axn)=(λ1x1,λ2x2...λnxn) .
必要性的证明同理。

   因此,过渡矩阵的每一列都是 A 的本征向量。由于过渡矩阵可逆,因而这 n 个本征向量线性无关。 如果能找到使 A 为对角矩阵的 Q 就相当于解出了本征方程式 1 ,这就是 “对角化” 名字的由来。

3. 相似不变量

   相似变换不改变矩阵的本征值和本征向量,因为这仅仅是改变线性映射和向量的 “表示”,f(x)=λx 这个关系是不随基的改变而改变的。当然,你也可以利用相似变换后矩阵和向量坐标关系的变化来证明这一点。由此我们可以进一步总结基本的相似不变量:矩阵的秩、行列式、本征值

   实际上,矩阵的迹也是相似不变量。设过渡矩阵为 S,则有 Tr(S1AS)=Tr(SS1A)=TrA

习题 1 

   用其他方式证明迹是相似不变量。(提示:用指标表示法。)

   实际上,还有两个常见的相似不变量,可以让我们明晰矩阵元和本征值的关系。

定理 4 

   设 n 阶方阵 A=(aji)n 个本征值为 λ1,λ2,...λn,则

  1. i=1nλi=|A|
  2. λ1+λ2+...λn=TrA=a11+a22+...ann

   Proof.

   关键是展开矩阵的特征多项式。

(11)|λIA|=|λa11a21an1a12λa22an2a1na2nλann|=aiλi=(λλ1)(λλ2)...(λλn)=0 .
在第二种展开方式里,i=1nλi 的系数为 (1)n,因此我们只需要在第一种展开方式里找不含有 λ 的项即可。首先想到的是对角元连乘,里面有一项 (1)ni=1naii。在其他的展开项里,总含有 i=1k(λaii),其中 kn2。可以进一步展开多项式,选取不含有 λ 的项。由于保留了矩阵元前的系数 1,所以最终得到的是 (1)n|A|,第一点得证。

   现在证明第二点。同样的,在第二种展开方式里我们可以看到这一项实际上是 (λ)n1(λ1+λ2...+λn)。由于除了对角元连乘以外的项里连乘数目 kn2,因此这一项只在对角元连乘项里,展开这一项便可得证。

推论 2 

   设 An 阶矩阵,则 |A|=0 的充要条件是数 0 为矩阵 A 的本征值。

习题 2 

  1. 证明三角矩阵(上三角或下三角)的对角元为本征值。
  2. 证明严格上三角矩阵为幂零矩阵,即矩阵自乘若干次后为零矩阵。提示:用 Hamilton-Cayley 定理。

定理 5 

   设 A 为复数域上的矩阵,任意本征值的几何重数都小于或等于对应的代数重数。

   证明:An 维线性空间上的任意矩阵,λ 为其某个特征值,对应有 r 维特征子空间。又设 {e^i}i=1m 为特征子空间的基,扩充到全空间,使得 V 的基为

(12){e^i}i=1r{θ^i}i=r+1m ,

   则在这组基下,A 表示为

(13)(A11A120A22) ,
其中 A11Aλ0 特征子空间上的限制,A12,A22 的列向量给出了 f(θi)

   因为复数域上的矩阵必然可以上三角化,所以在选择恰当特征基后,A11 的形式为主对角线是 λ0 的上三角矩阵。于是

(14)det(AλE)=det(A11λE)det(A22λE)=(λ0λ)rdet(A22λE) ,
因此代数重数大于或等于 r,得证。

   读者亦可利用定理 1 A 化作 Jordan 标准形。在这种形式下,λ 的代数重数是出现在主对角线的次数,倘若 λ 对应 r 阶 Jordan 块,那么出现 r 次。然而一个 Jordan 只对应一个特征向量,因此几何重数必然是小于或等于代数重数的。


1. ^ “方向” 只是从几何向量中沿用过来的一个习惯说法,注意式 1 中的所有量都可以是复数。两个向量方向相同意味着一个向量乘以标量(包括复数)可以得到另一个。
2. ^ 即对角线上的元为 1,其他元为 0,见 “矩阵

                     

© 小时科技 保留一切权利