零化多项式

                     

贡献者: 叶月2_

定义 1 

   设 $f(x)$ 是以域 $\mathbb F$ 中元素为系数的一元多项式,$A$ 是线性空间 $V$ 上的线性变换。若 $f(A)=0$(即零变换),则称 $f$ 是 $A$ 的一个零化多项式(null polynomial)。

   可以验证,若 $f$ 是线性变换 $A$ 的零化多项式,那么也是其任意基下矩阵所对应的零化多项式,即无论选取什么基底,代入多项式的最终结果为零矩阵。这是因为若 $A=Q^{-1}BQ$,我们有 $f(A)=Q^{-1}f(B)Q$。所以若 $f(A)=0$,必有 $f(B)=0$。

   下面一条定理及其推论表明了寻找零化多项式的重要意义。

定理 1 

   给定域 $\mathbb F$ 上的线性空间 $V$,域上的多项式 $h$ 可以分解为互素多项式:$h=fg$。对于定义在该线性空间的线性变换 $A$,我们有:

\begin{equation} \operatorname {ker}h(A)= \operatorname {ker}f(A)\oplus \operatorname {ker}g(A)~. \end{equation}

   Proof.

   首先证明 $ \operatorname {ker}f\cap \operatorname {ker}g=0$。由互素得,存在多项式 $u,v$ 使得 $uf+vg=I$。设 $ \boldsymbol{\mathbf{x}} \in \operatorname {ker}f\cap \operatorname {ker}g$,则 $(uf+vg) \boldsymbol{\mathbf{x}} =0= \boldsymbol{\mathbf{x}} $。矛盾,因而 $f,g$ 无交集,和为直和。

   下证 $ \operatorname {ker}h= \operatorname {ker}f\oplus \operatorname {ker}g$。 第一步,先证 $ \operatorname {ker}h\subset \operatorname {ker}f\oplus \operatorname {ker}g$。设 $\{ \boldsymbol{\mathbf{x}} _i\}$ 和 $\{ \boldsymbol{\mathbf{y}} _i\}$ 分别是 $ \operatorname {ker}f$ 和 $ \operatorname {ker}g$ 的基,则 $fg(a^i \boldsymbol{\mathbf{x}} _i+b^i \boldsymbol{\mathbf{y}} _i)=a^igf( \boldsymbol{\mathbf{x}} _i)+b^ifg( \boldsymbol{\mathbf{y}} _i)=0$,第一步得证。

   第二步证明 $ \operatorname {ker}h\supset \operatorname {ker}f\oplus \operatorname {ker}g= \operatorname {ker}f+ \operatorname {ker}g$。设 $ \boldsymbol{\mathbf{x}} \in \operatorname {ker}h$,由之前的证明过程知:$ \boldsymbol{\mathbf{x}} =(uf+vg) \boldsymbol{\mathbf{x}} $,只要把这两项分配给 $f,g$ 的核即可。显然,$g(uf \boldsymbol{\mathbf{x}} )=f(vg \boldsymbol{\mathbf{x}} ) =0$,得证。

推论 1 

   $\mathbb F,V,A,h$ 同上设。$h$ 可以分解为两两互素的多项式乘积:$h=h_1h_2...h_n$,则:

\begin{equation} \operatorname {ker}h(A)= \operatorname {ker}h_1(A)\oplus \operatorname {ker}h_2(A)\oplus...\oplus \operatorname {ker}h_n(A)~. \end{equation}

   维度定理告诉我们,$\dim \ker h(A)=\dim V-\dim \operatorname{Im} h(A)$。因此,若 $h(A)=0$,则 $ \operatorname {ker} h=V$。所以这条推论意味着若我们找到任意线性变换 $A$ 的零化多项式,便可以把线性空间分解为互素多项式的核。

   若 $f$ 是 $A$ 的多项式,且 $ \boldsymbol{\mathbf{x}} \in \operatorname {ker}f(A)$,则 $f(A)A x=0$,即任意多项式的核都是对应线性变换的不变子空间。综合前文,这意味着如果任意线性变换都有零化多项式,那么我们可以把 $A$ 分解为块对角矩阵,此时线性空间是 $A$ 的不变子空间之直和。 为了达到这个目的,我们还需要两个准备工作:找到一条路径能让我们快速确定任意线性变换对应的零化多项式,以及把多项式分解为互素项的简便方法。

   Cayley-Hamilton 定理告诉我们,线性变换的特征多项式就是一个零化多项式。

定理 2 Cayley-Hamilton 定理

   给定复线性空间 $V$ 上的线性变换 $A$,若 $f(\lambda)= \operatorname {det}(A-\lambda I)$ 为其特征多项式,则 $f(A)=0$

   证明思路是利用复线性空间的任意矩阵都可相似于上三角矩阵,上三角矩阵的零化多项式即特征多项式,以及零化多项式不随基的改变而改变(若 $A,B$ 相似则 $f(A)=Q^{-1}f(B)Q=0$)。现在只证明第二点,其余读者可自证。

   设线性变换 $\mathcal A$ 在基向量组 $\{ \boldsymbol{\mathbf{e}} _1, \boldsymbol{\mathbf{e}} _2,..., \boldsymbol{\mathbf{e}} _n\}$ 下的表示为 $n$ 阶上三角矩阵 $A=(a^i_j)$,由矩阵表示可知:$\mathcal A( \boldsymbol{\mathbf{e}} _k)= \operatorname {span}( \boldsymbol{\mathbf{e}} _1, \boldsymbol{\mathbf{e}} _2... \boldsymbol{\mathbf{e}} _k)$。具体来说是:

\begin{equation} \begin{aligned} \mathcal A( \boldsymbol{\mathbf{e}} _1)&=a^1_1 \boldsymbol{\mathbf{e}} _1,\\ \mathcal A( \boldsymbol{\mathbf{e}} _2)&=a^1_2 \boldsymbol{\mathbf{e}} _1+a^2_2 \boldsymbol{\mathbf{e}} _2,\\ &...\\ \mathcal A( \boldsymbol{\mathbf{e}} _n)&=a^1_n \boldsymbol{\mathbf{e}} _1+a^2_n \boldsymbol{\mathbf{e}} _2+...a^n_n \boldsymbol{\mathbf{e}} _n,\\ \end{aligned}~ \end{equation}
因此,对于 $A$ 的特征多项式,代入 $A$ 后 $f(A)=(A-\lambda_1)(A-\lambda_2)...(A-\lambda_n)=(A-a^1_1)(A-a^2_2)...(A-a^n_n)$1,利用多项式对易,可证该线性空间中的任意矢量被该多项式作用后结果都为 $0$。因此,上三角矩阵的特征多项式为其零化多项式。

定理 3 线性空间第一分解定理

   设 $V$ 为复数域上的线性空间,$A$ 为该空间中的线性变换,且特征多项式可以写为:

\begin{equation} f(\lambda)=(\lambda-\lambda_1)^{k_1}(\lambda-\lambda_2)^{k_2}...(\lambda-\lambda_m)^{k_m}~, \end{equation}
若设 $f_i(A)=(A-\lambda_iI)^{k_i}$,则有:
\begin{equation} V= \operatorname {ker}f(A)= \operatorname {ker}f_1(A)\oplus \operatorname {ker}f_2(A)...\oplus \operatorname {ker}f_m(A)~. \end{equation}

   Proof.

   由于 $f_i$ 的 $\lambda_i$ 彼此不同,因此互素,由推论 1 得:

\begin{equation} \operatorname {ker}f_i(A)\oplus \operatorname {ker}f_j(A)= \operatorname {ker}(f_i(A)f_j(A))~. \end{equation}
所以
\begin{equation} \begin{aligned} \operatorname {ker}f_1(A)\oplus \operatorname {ker}f_2(A)...\oplus \operatorname {ker}f_m(A)&= \operatorname {ker}(f_1(A)f_2(A))..\oplus \operatorname {ker}f_m(A)\\ &= \operatorname {ker}(f_1(A)f_2(A)f_3(A))..\oplus \operatorname {ker}f_m(A)\\ &= \operatorname {ker}f(A)=V \end{aligned} ~. \end{equation}
称 $ \operatorname {ker}f_i(A)$ 是 $A$ 的属于对应本征值的根子空间,该分解方式称为 $A$ 的根子空间分解。

   总结一下,任意线性变换的特征多项式都是其零化多项式,由于特征多项式可以分解为互素项,因此任意线性空间都可以分解为任意线性变换的不变子空间之直和,此时线性变换是分块对角矩阵。


1. ^ 上三角矩阵的对角元为其本征值

                     

© 小时科技 保留一切权利