零化多项式

                     

贡献者: 叶月2_

定义 1 

   设 $f(x)$ 是以域 $\mathbb F$ 中元素为系数的一元多项式,$A$ 是线性空间 $V$ 上的线性变换。若 $f(A)=0$(即零变换),则称 $f$ 是 $A$ 的一个零化多项式(null polynomial)。

   可以验证,若 $f$ 是线性变换 $A$ 的零化多项式,那么也是其任意基下矩阵所对应的零化多项式,即无论选取什么基底,代入多项式的最终结果为零矩阵。这是因为若 $A=Q^{-1}BQ$,我们有 $f(A)=Q^{-1}f(B)Q$。所以若 $f(A)=0$,必有 $f(B)=0$。

   下面一条定理及其推论表明了寻找零化多项式的重要意义。

定理 1 

   给定域 $\mathbb F$ 上的线性空间 $V$,域上的多项式 $h$ 可以分解为互素多项式:$h=fg$。对于定义在该线性空间的线性变换 $A$,我们有:

\begin{equation} \operatorname {ker}h(A)= \operatorname {ker}f(A)\oplus \operatorname {ker}g(A)~. \end{equation}

   Proof.

   首先证明 $ \operatorname {ker}f\cap \operatorname {ker}g=0$。由互素得,存在多项式 $u,v$ 使得 $uf+vg=I$。设 $ \boldsymbol{\mathbf{x}} \in \operatorname {ker}f\cap \operatorname {ker}g$,则 $(uf+vg) \boldsymbol{\mathbf{x}} =0= \boldsymbol{\mathbf{x}} $。矛盾,因而 $f,g$ 无交集,和为直和。

   下证 $ \operatorname {ker}h= \operatorname {ker}f\oplus \operatorname {ker}g$。 第一步,先证 $ \operatorname {ker}h\subset \operatorname {ker}f\oplus \operatorname {ker}g$。设 $\{ \boldsymbol{\mathbf{x}} _i\}$ 和 $\{ \boldsymbol{\mathbf{y}} _i\}$ 分别是 $ \operatorname {ker}f$ 和 $ \operatorname {ker}g$ 的基,则 $fg(a^i \boldsymbol{\mathbf{x}} _i+b^i \boldsymbol{\mathbf{y}} _i)=a^igf( \boldsymbol{\mathbf{x}} _i)+b^ifg( \boldsymbol{\mathbf{y}} _i)=0$,第一步得证。

   第二步证明 $ \operatorname {ker}h\supset \operatorname {ker}f\oplus \operatorname {ker}g= \operatorname {ker}f+ \operatorname {ker}g$。设 $ \boldsymbol{\mathbf{x}} \in \operatorname {ker}h$,由之前的证明过程知:$ \boldsymbol{\mathbf{x}} =(uf+vg) \boldsymbol{\mathbf{x}} $,只要把这两项分配给 $f,g$ 的核即可。显然,$g(uf \boldsymbol{\mathbf{x}} )=f(vg \boldsymbol{\mathbf{x}} ) =0$,得证。

推论 1 

   $\mathbb F,V,A,h$ 同上设。$h$ 可以分解为两两互素的多项式乘积:$h=h_1h_2...h_n$,则:

\begin{equation} \operatorname {ker}h(A)= \operatorname {ker}h_1(A)\oplus \operatorname {ker}h_2(A)\oplus...\oplus \operatorname {ker}h_n(A)~. \end{equation}

   维度定理告诉我们,$\dim \ker h(A)=\dim V-\dim \operatorname{Im} h(A)$。因此,若 $h(A)=0$,则 $ \operatorname {ker} h=V$。所以这条推论意味着若我们找到任意线性变换 $A$ 的零化多项式,便可以把线性空间分解为互素多项式的核。

   若 $f$ 是 $A$ 的多项式,且 $ \boldsymbol{\mathbf{x}} \in \operatorname {ker}f(A)$,则 $f(A)A x=0$,即任意多项式的核都是对应线性变换的不变子空间。综合前文,这意味着如果任意线性变换都有零化多项式,那么我们可以把 $A$ 分解为块对角矩阵,此时线性空间是 $A$ 的不变子空间之直和。 为了达到这个目的,我们还需要两个准备工作:找到一条路径能让我们快速确定任意线性变换对应的零化多项式,以及把多项式分解为互素项的简便方法。

   Cayley-Hamilton 定理告诉我们,线性变换的特征多项式就是一个零化多项式。

定理 2 Cayley-Hamilton 定理

   给定复线性空间 $V$ 上的线性变换 $A$,若 $f(\lambda)= \operatorname {det}(A-\lambda I)$ 为其特征多项式,则 $f(A)=0$

   证明思路是利用复线性空间的任意矩阵都可相似于上三角矩阵,上三角矩阵的零化多项式即特征多项式,以及零化多项式不随基的改变而改变(若 $A,B$ 相似则 $f(A)=Q^{-1}f(B)Q=0$)。现在只证明第二点,其余读者可自证。

   设线性变换 $\mathcal A$ 在基向量组 $\{ \boldsymbol{\mathbf{e}} _1, \boldsymbol{\mathbf{e}} _2,..., \boldsymbol{\mathbf{e}} _n\}$ 下的表示为 $n$ 阶上三角矩阵 $A=(a^i_j)$,由矩阵表示可知:$\mathcal A( \boldsymbol{\mathbf{e}} _k)= \operatorname {span}( \boldsymbol{\mathbf{e}} _1, \boldsymbol{\mathbf{e}} _2... \boldsymbol{\mathbf{e}} _k)$。具体来说是:

\begin{equation} \begin{aligned} \mathcal A( \boldsymbol{\mathbf{e}} _1)&=a^1_1 \boldsymbol{\mathbf{e}} _1,\\ \mathcal A( \boldsymbol{\mathbf{e}} _2)&=a^1_2 \boldsymbol{\mathbf{e}} _1+a^2_2 \boldsymbol{\mathbf{e}} _2,\\ &...\\ \mathcal A( \boldsymbol{\mathbf{e}} _n)&=a^1_n \boldsymbol{\mathbf{e}} _1+a^2_n \boldsymbol{\mathbf{e}} _2+...a^n_n \boldsymbol{\mathbf{e}} _n,\\ \end{aligned}~ \end{equation}
因此,对于 $A$ 的特征多项式,代入 $A$ 后 $f(A)=(A-\lambda_1)(A-\lambda_2)...(A-\lambda_n)=(A-a^1_1)(A-a^2_2)...(A-a^n_n)$1,利用多项式对易,可证该线性空间中的任意矢量被该多项式作用后结果都为 $0$。因此,上三角矩阵的特征多项式为其零化多项式。

定理 3 线性空间第一分解定理

   设 $V$ 为复数域上的线性空间,$A$ 为该空间中的线性变换,且特征多项式可以写为:

\begin{equation} f(\lambda)=(\lambda-\lambda_1)^{k_1}(\lambda-\lambda_2)^{k_2}...(\lambda-\lambda_m)^{k_m}~, \end{equation}
若设 $f_i(A)=(A-\lambda_iI)^{k_i}$,则有:
\begin{equation} V= \operatorname {ker}f(A)= \operatorname {ker}f_1(A)\oplus \operatorname {ker}f_2(A)...\oplus \operatorname {ker}f_m(A)~. \end{equation}

   Proof.

   由于 $f_i$ 的 $\lambda_i$ 彼此不同,因此互素,由推论 1 得:

\begin{equation} \operatorname {ker}f_i(A)\oplus \operatorname {ker}f_j(A)= \operatorname {ker}(f_i(A)f_j(A))~. \end{equation}
所以
\begin{equation} \begin{aligned} \operatorname {ker}f_1(A)\oplus \operatorname {ker}f_2(A)...\oplus \operatorname {ker}f_m(A)&= \operatorname {ker}(f_1(A)f_2(A))..\oplus \operatorname {ker}f_m(A)\\ &= \operatorname {ker}(f_1(A)f_2(A)f_3(A))..\oplus \operatorname {ker}f_m(A)\\ &= \operatorname {ker}f(A)=V \end{aligned} ~. \end{equation}
称 $ \operatorname {ker}f_i(A)$ 是 $A$ 的属于对应本征值的根子空间,该分解方式称为 $A$ 的根子空间分解。

   总结一下,任意线性变换的特征多项式都是其零化多项式,由于特征多项式可以分解为互素项,因此任意线性空间都可以分解为任意线性变换的不变子空间之直和,此时线性变换是分块对角矩阵。


1. ^ 上三角矩阵的对角元为其本征值


致读者: 小时百科一直以来坚持所有内容免费无广告,这导致我们处于严重的亏损状态。 长此以往很可能会最终导致我们不得不选择大量广告以及内容付费等。 因此,我们请求广大读者热心打赏 ,使网站得以健康发展。 如果看到这条信息的每位读者能慷慨打赏 20 元,我们一周就能脱离亏损, 并在接下来的一年里向所有读者继续免费提供优质内容。 但遗憾的是只有不到 1% 的读者愿意捐款, 他们的付出帮助了 99% 的读者免费获取知识, 我们在此表示感谢。

                     

友情链接: 超理论坛 | ©小时科技 保留一切权利