贡献者: 叶月2_
可以验证,若 $f$ 是线性变换 $A$ 的零化多项式,那么也是其任意基下矩阵所对应的零化多项式,即无论选取什么基底,代入多项式的最终结果为零矩阵。这是因为若 $A=Q^{-1}BQ$,我们有 $f(A)=Q^{-1}f(B)Q$。所以若 $f(A)=0$,必有 $f(B)=0$。
下面一条定理及其推论表明了寻找零化多项式的重要意义。
Proof.
首先证明 $ \operatorname {ker}f\cap \operatorname {ker}g=0$。由互素得,存在多项式 $u,v$ 使得 $uf+vg=I$。设 $ \boldsymbol{\mathbf{x}} \in \operatorname {ker}f\cap \operatorname {ker}g$,则 $(uf+vg) \boldsymbol{\mathbf{x}} =0= \boldsymbol{\mathbf{x}} $。矛盾,因而 $f,g$ 无交集,和为直和。
下证 $ \operatorname {ker}h= \operatorname {ker}f\oplus \operatorname {ker}g$。 第一步,先证 $ \operatorname {ker}h\subset \operatorname {ker}f\oplus \operatorname {ker}g$。设 $\{ \boldsymbol{\mathbf{x}} _i\}$ 和 $\{ \boldsymbol{\mathbf{y}} _i\}$ 分别是 $ \operatorname {ker}f$ 和 $ \operatorname {ker}g$ 的基,则 $fg(a^i \boldsymbol{\mathbf{x}} _i+b^i \boldsymbol{\mathbf{y}} _i)=a^igf( \boldsymbol{\mathbf{x}} _i)+b^ifg( \boldsymbol{\mathbf{y}} _i)=0$,第一步得证。
第二步证明 $ \operatorname {ker}h\supset \operatorname {ker}f\oplus \operatorname {ker}g= \operatorname {ker}f+ \operatorname {ker}g$。设 $ \boldsymbol{\mathbf{x}} \in \operatorname {ker}h$,由之前的证明过程知:$ \boldsymbol{\mathbf{x}} =(uf+vg) \boldsymbol{\mathbf{x}} $,只要把这两项分配给 $f,g$ 的核即可。显然,$g(uf \boldsymbol{\mathbf{x}} )=f(vg \boldsymbol{\mathbf{x}} ) =0$,得证。
维度定理告诉我们,$\dim \ker h(A)=\dim V-\dim \operatorname{Im} h(A)$。因此,若 $h(A)=0$,则 $ \operatorname {ker} h=V$。所以这条推论意味着若我们找到任意线性变换 $A$ 的零化多项式,便可以把线性空间分解为互素多项式的核。
若 $f$ 是 $A$ 的多项式,且 $ \boldsymbol{\mathbf{x}} \in \operatorname {ker}f(A)$,则 $f(A)A x=0$,即任意多项式的核都是对应线性变换的不变子空间。综合前文,这意味着如果任意线性变换都有零化多项式,那么我们可以把 $A$ 分解为块对角矩阵,此时线性空间是 $A$ 的不变子空间之直和。 为了达到这个目的,我们还需要两个准备工作:找到一条路径能让我们快速确定任意线性变换对应的零化多项式,以及把多项式分解为互素项的简便方法。
Cayley-Hamilton 定理告诉我们,线性变换的特征多项式就是一个零化多项式。
证明思路是利用复线性空间的任意矩阵都可相似于上三角矩阵,上三角矩阵的零化多项式即特征多项式,以及零化多项式不随基的改变而改变(若 $A,B$ 相似则 $f(A)=Q^{-1}f(B)Q=0$)。现在只证明第二点,其余读者可自证。
设线性变换 $\mathcal A$ 在基向量组 $\{ \boldsymbol{\mathbf{e}} _1, \boldsymbol{\mathbf{e}} _2,..., \boldsymbol{\mathbf{e}} _n\}$ 下的表示为 $n$ 阶上三角矩阵 $A=(a^i_j)$,由矩阵表示可知:$\mathcal A( \boldsymbol{\mathbf{e}} _k)= \operatorname {span}( \boldsymbol{\mathbf{e}} _1, \boldsymbol{\mathbf{e}} _2... \boldsymbol{\mathbf{e}} _k)$。具体来说是:
Proof.
由于 $f_i$ 的 $\lambda_i$ 彼此不同,因此互素,由推论 1 得:
总结一下,任意线性变换的特征多项式都是其零化多项式,由于特征多项式可以分解为互素项,因此任意线性空间都可以分解为任意线性变换的不变子空间之直和,此时线性变换是分块对角矩阵。
1. ^ 上三角矩阵的对角元为其本征值