奇异值分解(SVD)

                     

贡献者: 叶月2_; addis

预备知识 正规算子,相似变换和相似矩阵

   本节默认在复数域及酉空间下讨论。

1. 定理陈述

定理 1 SVD

   给定复数域 $\mathbb{C}$ 上的矩阵 $ \boldsymbol{\mathbf{M}} $,则存在同样尺寸的对角矩阵 $ \boldsymbol{\mathbf{D}} $ 和酉矩阵 $ \boldsymbol{\mathbf{P}} $、$ \boldsymbol{\mathbf{Q}} $,使得

\begin{equation} \boldsymbol{\mathbf{M}} = \boldsymbol{\mathbf{P ^\dagger DQ}} ~. \end{equation}
称 $ \boldsymbol{\mathbf{D}} $ 的对角元为 $ \boldsymbol{\mathbf{M}} $ 的奇异值(singular value),$ \boldsymbol{\mathbf{P ^\dagger DQ}} $ 为 $ \boldsymbol{\mathbf{M}} $ 的奇异值分解(singular value decomposition),简称为 SVD

2. 证明过程

   我们先从可逆方阵证起,然后再过渡到不要求可逆的任意复矩阵

定理 2 

   对于 $n$ 阶可逆方阵$ \boldsymbol{\mathbf{M}} $,存在酉方阵$ \boldsymbol{\mathbf{P}} , \boldsymbol{\mathbf{Q}} $ 和可逆对角矩阵$ \boldsymbol{\mathbf{D}} $ 使得

\begin{equation} \boldsymbol{\mathbf{M}} = \boldsymbol{\mathbf{P}} ^\dagger \boldsymbol{\mathbf{D}} \boldsymbol{\mathbf{Q}} ~. \end{equation}

   证明:因为 $ \boldsymbol{\mathbf{M}} ^\dagger \boldsymbol{\mathbf{M}} $ 是半正定厄米矩阵,必存在一组标准正交基使之对角化,设为 $ \boldsymbol{\mathbf{A}} $,对应的过渡矩阵为酉方阵 $ \boldsymbol{\mathbf{Q}} $,则该过程表示为 $ \boldsymbol{\mathbf{Q}} \boldsymbol{\mathbf{M}} ^\dagger \boldsymbol{\mathbf{MQ}} ^\dagger = \boldsymbol{\mathbf{A}} $。左右取行列式可证 $ \boldsymbol{\mathbf{A}} $ 是可逆矩阵。在这组基下,对对角元计算后,我们可以得到 $ \boldsymbol{\mathbf{A}} ^{\frac{1}{2}}, \boldsymbol{\mathbf{A}} ^{-\frac{1}{2}}$,显然互逆。

   我们可以把 $ \boldsymbol{\mathbf{M}} $ 表示为 $ \boldsymbol{\mathbf{MQ}} ^\dagger \boldsymbol{\mathbf{A}} ^{-\frac{1}{2}} \boldsymbol{\mathbf{A}} ^{\frac{1}{2}}Q$,和式 2 比较,我们需要验证 $ \boldsymbol{\mathbf{MQ}} ^\dagger \boldsymbol{\mathbf{A}} ^{-\frac{1}{2}}$ 是酉方阵。

   设 $ \boldsymbol{\mathbf{P}} ^\dagger = \boldsymbol{\mathbf{M}} \boldsymbol{\mathbf{Q}} ^\dagger \boldsymbol{\mathbf{A}} ^{-\frac{1}{2}}$,则 $ \boldsymbol{\mathbf{P}} = \boldsymbol{\mathbf{A}} ^{-\frac{1}{2}} \boldsymbol{\mathbf{Q}} \boldsymbol{\mathbf{M}} ^\dagger $,则

\begin{equation} \begin{aligned} \boldsymbol{\mathbf{P}} ^\dagger \boldsymbol{\mathbf{P}} &= \boldsymbol{\mathbf{MQ}} ^\dagger \boldsymbol{\mathbf{A}} ^{-\frac{1}{2}} \boldsymbol{\mathbf{A}} ^{-\frac{1}{2}} \boldsymbol{\mathbf{Q}} \boldsymbol{\mathbf{M}} ^\dagger \\ &= \boldsymbol{\mathbf{M}} \boldsymbol{\mathbf{Q}} ^\dagger ( \boldsymbol{\mathbf{Q}} ^\dagger )^{-1}( \boldsymbol{\mathbf{M}} )^{-1}( \boldsymbol{\mathbf{M}} ^\dagger )^{-1} \boldsymbol{\mathbf{Q}} ^{-1} \boldsymbol{\mathbf{Q}} \boldsymbol{\mathbf{M}} ^\dagger \\ &= \boldsymbol{\mathbf{E}} ~, \end{aligned} ~. \end{equation}
定理得证。

   在定理 2 的陈述里 $ \boldsymbol{\mathbf{D}} $ 也是可逆矩阵,这并非偶然。考虑到 $ \boldsymbol{\mathbf{P}} ^{-1}= \boldsymbol{\mathbf{P}} ^\dagger $,该定理实际上是 $ \boldsymbol{\mathbf{M}} $ 的广义相似变换。如下图所示,线性映射 $f:V\rightarrow W$ 在不同基下有不同表示。设 $\{ \boldsymbol{\mathbf{e}} _i\},\{ \boldsymbol{\mathbf{\theta}} _i\}$ 是 $V,W$ 的旧基,且 $f$ 在该基下的表示为 $ \boldsymbol{\mathbf{M}} $。$ \boldsymbol{\mathbf{P}} , \boldsymbol{\mathbf{Q}} $ 是对应 $W,V$ 的从旧基到新基的过渡矩阵,则 $ \boldsymbol{\mathbf{D}} $ 就自然是 $f$ 在新基下的表示了。作为 $f$ 的不同表示,$ \boldsymbol{\mathbf{M}} $ 与 $ \boldsymbol{\mathbf{N}} $ 的行列数相同,秩也相同。

图
图 1

   如此一来,我们似乎可以拓展该定理至 $ \boldsymbol{\mathbf{M}} $ 不可逆的情况。

引理 1 

   对于任意矩阵 $ \boldsymbol{\mathbf{M}} $,存在酉矩阵 $ \boldsymbol{\mathbf{Q}} ', \boldsymbol{\mathbf{S}} $ 和满秩矩阵 $ \boldsymbol{\mathbf{N}} $,使得

\begin{equation} \boldsymbol{\mathbf{M}} = \boldsymbol{\mathbf{S}} ^\dagger \left(\begin{array}{cc} N & 0 \\ 0 & 0 \end{array}\right) \boldsymbol{\mathbf{Q}} '~. \end{equation}

  

未完成:引用定理 “非退化情况下,子空间的标准正交基可拓展到全空间”。

   换一个方式表述,引理 1 实际上是在说对于酉空间的任意线性映射 $f$,原像和像空间存在一组标准正交基,使得 $f$ 在该基下是式 4 所示的块对角形式。

   考虑到 $ \operatorname {dim}V= \operatorname {dim} \operatorname {ker}f+ \operatorname {dim} \operatorname {Im}f$,我们可以在 $ \operatorname {ker}f$ 内选一组标准正交基,然后扩展到全空间。设 $k= \operatorname {dim} \operatorname {ker}f,s= \operatorname {dim} \operatorname {Im}f$。则在该组基下,$f$ 的后 $k$ 列必为 $0$。

   同理,$ \operatorname {Im}f$ 作为 $W$ 的子空间,也可以找到一组标准正交基,并拓展到其正交补。因而除去前 $s$ 行,其他行都为 $0$。如此我们就证明了 $f$ 具有式 4 所示的块对角形式,其中 $ \boldsymbol{\mathbf{N}} $ 必为满秩的 $s\times s$方阵,即其可逆。如若不然,$ \operatorname {Im}f\cap \operatorname {ker}f\neq\{ \boldsymbol{\mathbf{0}} \}$。

   现在我们来证明奇异值分解定理。 对于任意复矩阵$ \boldsymbol{\mathbf{M}} $,我们可以分解为引理 1 的形式。那么对于满秩$ \boldsymbol{\mathbf{N}} $ 矩阵,自然而然的,我们可以利用定理 2 进行进一步的分解。设该分解表示为 $ \boldsymbol{\mathbf{N}} = \boldsymbol{\mathbf{T}} ^\dagger \boldsymbol{\mathbf{D}} ' \boldsymbol{\mathbf{F}} $,其中 $ \boldsymbol{\mathbf{D}} '$ 为可逆对角矩阵。

   构造复矩阵 $ \boldsymbol{\mathbf{T}} _1, \boldsymbol{\mathbf{S}} _1$,其中 $ \boldsymbol{\mathbf{E}} _1, \boldsymbol{\mathbf{E}} _2$ 是用作填充的单位矩阵,比如 $ \boldsymbol{\mathbf{E}} _1$ 使得 $ \boldsymbol{\mathbf{T}} _1$ 的行数等于 $ \boldsymbol{\mathbf{S}} ^\dagger $ 的列数。

\begin{equation} \boldsymbol{\mathbf{T}} _1 ^\dagger = \begin{pmatrix} \boldsymbol{\mathbf{T}} ^\dagger &0\\0& \boldsymbol{\mathbf{E}} _1\end{pmatrix} ,\quad \boldsymbol{\mathbf{F}} _1= \begin{pmatrix} \boldsymbol{\mathbf{F}} &0\\0& \boldsymbol{\mathbf{E}} _2\end{pmatrix} ~. \end{equation}
该定义是合理的,因为
\begin{equation} \begin{pmatrix} \boldsymbol{\mathbf{N}} &0\\0&0\end{pmatrix} = \begin{pmatrix} \boldsymbol{\mathbf{T}} ^\dagger &0\\0& \boldsymbol{\mathbf{E}} _1\end{pmatrix} \begin{pmatrix} \boldsymbol{\mathbf{D}} '&0\\0&0\end{pmatrix} \begin{pmatrix} \boldsymbol{\mathbf{S}} &0\\0& \boldsymbol{\mathbf{E}} _2\end{pmatrix} \equiv \boldsymbol{\mathbf{T}} _1 ^\dagger \boldsymbol{\mathbf{D}} \boldsymbol{\mathbf{F}} _1~. \end{equation}

   易证 $ \boldsymbol{\mathbf{T}} _1 ^\dagger , \boldsymbol{\mathbf{F}} _1$ 是酉矩阵,可见 $ \boldsymbol{\mathbf{D}} $ 便是定理里要求的对角矩阵,$ \boldsymbol{\mathbf{P}} ^\dagger = \boldsymbol{\mathbf{S}} ^\dagger \boldsymbol{\mathbf{T}} _1 ^\dagger , \boldsymbol{\mathbf{Q}} = \boldsymbol{\mathbf{F}} _1 \boldsymbol{\mathbf{Q}} '$。


致读者: 小时百科一直以来坚持所有内容免费无广告,这导致我们处于严重的亏损状态。 长此以往很可能会最终导致我们不得不选择大量广告以及内容付费等。 因此,我们请求广大读者热心打赏 ,使网站得以健康发展。 如果看到这条信息的每位读者能慷慨打赏 20 元,我们一周就能脱离亏损, 并在接下来的一年里向所有读者继续免费提供优质内容。 但遗憾的是只有不到 1% 的读者愿意捐款, 他们的付出帮助了 99% 的读者免费获取知识, 我们在此表示感谢。

                     

友情链接: 超理论坛 | ©小时科技 保留一切权利