分块矩阵

                     

贡献者: addis; ACertainUser

  • 本文处于草稿阶段。

1. 分块矩阵

  1有时候,把一个大矩阵 $ \boldsymbol{\mathbf{M}} $ 分割为若干小矩阵可以帮助简化问题。分割后的大矩阵叫做分块矩阵(Partitioned Matrices)。例如:

\begin{equation} \boldsymbol{\mathbf{M}} = \begin{pmatrix} \boldsymbol{\mathbf{A}} & \boldsymbol{\mathbf{B}} \\ \boldsymbol{\mathbf{C}} & \boldsymbol{\mathbf{D}} \\ \end{pmatrix}~. \end{equation}
其中 $ \boldsymbol{\mathbf{A}} , \boldsymbol{\mathbf{B}} , \boldsymbol{\mathbf{C}} , \boldsymbol{\mathbf{D}} $ 都是矩阵。大矩阵和子矩阵都不必是方阵,子矩阵的大小也不必相同,但分割后子矩阵必须对齐,在该例中就是:$ \boldsymbol{\mathbf{A}} $ 与 $ \boldsymbol{\mathbf{B}} $ 行数相同、$ \boldsymbol{\mathbf{B}} $ 与 $ \boldsymbol{\mathbf{D}} $ 行数相同、$ \boldsymbol{\mathbf{A}} $ 与 $ \boldsymbol{\mathbf{C}} $ 的列数相同、$ \boldsymbol{\mathbf{B}} $ 与 $ \boldsymbol{\mathbf{D}} $ 的列数相同。

分块矩阵的加法、乘法

   若相应的计算都有定义,那么分块矩阵的加法、乘法法则与普通矩阵形式上完全类似,也就是可以把分割后的每个块看成一个 “矩阵元” 进行计算。例如:

\begin{equation} \begin{pmatrix} \boldsymbol{\mathbf{A}} & \boldsymbol{\mathbf{B}} \\ \boldsymbol{\mathbf{C}} & \boldsymbol{\mathbf{D}} \\ \end{pmatrix} + \begin{pmatrix} \boldsymbol{\mathbf{E}} & \boldsymbol{\mathbf{F}} \\ \boldsymbol{\mathbf{G}} & \boldsymbol{\mathbf{H}} \\ \end{pmatrix} = \begin{pmatrix} \boldsymbol{\mathbf{A}} + \boldsymbol{\mathbf{E}} & \boldsymbol{\mathbf{B}} + \boldsymbol{\mathbf{F}} \\ \boldsymbol{\mathbf{C}} + \boldsymbol{\mathbf{G}} & \boldsymbol{\mathbf{D}} + \boldsymbol{\mathbf{H}} \\ \end{pmatrix}~. \end{equation}
\begin{equation} \begin{pmatrix} \boldsymbol{\mathbf{A}} & \boldsymbol{\mathbf{B}} \\ \boldsymbol{\mathbf{C}} & \boldsymbol{\mathbf{D}} \\ \end{pmatrix} \begin{pmatrix} \boldsymbol{\mathbf{E}} & \boldsymbol{\mathbf{F}} \\ \boldsymbol{\mathbf{G}} & \boldsymbol{\mathbf{H}} \\ \end{pmatrix} = \begin{pmatrix} \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{E}} + \boldsymbol{\mathbf{B}} \boldsymbol{\mathbf{G}} & \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{F}} + \boldsymbol{\mathbf{B}} \boldsymbol{\mathbf{H}} \\ \boldsymbol{\mathbf{C}} \boldsymbol{\mathbf{E}} + \boldsymbol{\mathbf{D}} \boldsymbol{\mathbf{G}} & \boldsymbol{\mathbf{C}} \boldsymbol{\mathbf{F}} + \boldsymbol{\mathbf{D}} \boldsymbol{\mathbf{H}} \\ \end{pmatrix}~. \end{equation}
\begin{equation} \boldsymbol{\mathbf{M}} \begin{pmatrix} \boldsymbol{\mathbf{A}} & \boldsymbol{\mathbf{B}} \\ \boldsymbol{\mathbf{C}} & \boldsymbol{\mathbf{D}} \\ \end{pmatrix} = \begin{pmatrix} \boldsymbol{\mathbf{M}} \boldsymbol{\mathbf{A}} & \boldsymbol{\mathbf{M}} \boldsymbol{\mathbf{B}} \\ \boldsymbol{\mathbf{M}} \boldsymbol{\mathbf{C}} & \boldsymbol{\mathbf{M}} \boldsymbol{\mathbf{D}} \\ \end{pmatrix}~. \end{equation}

定理 1 分块矩阵的乘法

   在数域 $K$ 上,设矩阵 $A\in{M_{s\times{n}}(K)},B\in{M_{n\times{m}}(K)}$。分别对两个矩阵分块,如果满足下面两个条件

  1. $ \boldsymbol{\mathbf{A}} $ 分块的列组数等于 $ \boldsymbol{\mathbf{B}} $ 分块的行组数(块数).
  2. $ \boldsymbol{\mathbf{A}} $ 的每个列组所含的列数对应等于 $ \boldsymbol{\mathbf{B}} $ 的每个行组所含的行数。

   则分块矩阵的乘法类似地满足矩阵乘法运算规律。

\begin{equation} \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{B}} = \begin{pmatrix} \boldsymbol{\mathbf{A}} _{11} & \boldsymbol{\mathbf{A}} _{12}\\ \boldsymbol{\mathbf{A}} _{21} & \boldsymbol{\mathbf{A}} _{22} \end{pmatrix} \begin{pmatrix} \boldsymbol{\mathbf{B}} _{11} & \boldsymbol{\mathbf{B}} _{12}\\ \boldsymbol{\mathbf{B}} _{21} & \boldsymbol{\mathbf{B}} _{22} \end{pmatrix} = \begin{pmatrix} \boldsymbol{\mathbf{A}} _{11} \boldsymbol{\mathbf{B}} _{11}+ \boldsymbol{\mathbf{A}} _{12} \boldsymbol{\mathbf{B}} _{21} & \boldsymbol{\mathbf{A}} _{11} \boldsymbol{\mathbf{B}} _{12}+ \boldsymbol{\mathbf{A}} _{12} \boldsymbol{\mathbf{B}} _{22}\\ \boldsymbol{\mathbf{A}} _{21} \boldsymbol{\mathbf{B}} _{11}+ \boldsymbol{\mathbf{A}} _{22} \boldsymbol{\mathbf{B}} _{21} & \boldsymbol{\mathbf{A}} _{21} \boldsymbol{\mathbf{B}} _{12}+ \boldsymbol{\mathbf{A}} _{22} \boldsymbol{\mathbf{B}} _{22} \end{pmatrix}~. \end{equation}

   和矩阵乘法规则的区别在于矩阵乘法的相对顺序不能改变,因为矩阵乘法没有交换律

   证明: 设 $ \boldsymbol{\mathbf{C}} = \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{B}} $,则 $ \boldsymbol{\mathbf{C}} $ 的行数和列数分别为 $s$ 和 $m$。设矩阵 $ \boldsymbol{\mathbf{A}} $ 的分块的行数为 $s_1,s_2$,列数为 $n_1,n_2$,矩阵 $ \boldsymbol{\mathbf{B}} $ 的分块的行数为 $n_1,n_2$,列数为 $m_1,m_2$。分块矩阵的乘积的行数为 $s=s_1+s_2$,$m=m_1+m_2$,和 $ \boldsymbol{\mathbf{C}} $ 的行数和列数相等。于是得到证明思路:证明任意 $ \boldsymbol{\mathbf{C}} $ 的 $(i,j)$ 元等于分块矩阵乘积的 $(i,j)$ 元。

   设 $ \boldsymbol{\mathbf{C}} $ 的 $(i,j)$ 处于 $s_p\times{m_q}$ 部分,则该元素就在分块矩阵乘法结果的 $(i,j)$ 元,即 \[\sum_{k=1}^{2} \boldsymbol{\mathbf{A}} _{pk} \boldsymbol{\mathbf{B}} _{kq}(i;j)~.\] 根据矩阵的乘法,可以展开每两块矩阵第 $i,j$ 项的乘法,等于 \[=\sum_{k=1}^{2}\sum_{l=1}^{n_k} \boldsymbol{\mathbf{A}} _{pk}(i;l) \boldsymbol{\mathbf{B}} _{kq}(l;j)~.\] \[=\sum_{l=1}^{n_1} \boldsymbol{\mathbf{A}} _{p1}(i;l) \boldsymbol{\mathbf{B}} _{1q}(l;j)+\sum_{l=1}^{n_2} \boldsymbol{\mathbf{A}} _{p2}(i;l) \boldsymbol{\mathbf{B}} _{2q}(l;j)~.\] 可以将 $l$ 用在 $ \boldsymbol{\mathbf{A}} , \boldsymbol{\mathbf{B}} $ 中的绝对位置来表示,而不是 $ \boldsymbol{\mathbf{A}} _{pk}, \boldsymbol{\mathbf{B}} _{kq}$ 中的相对位置来表示,得到 \[=\sum_{l=1}^{n_1} \boldsymbol{\mathbf{A}} (i;l) \boldsymbol{\mathbf{B}} (r;j)+\sum_{l=n_1+1}^{n_1+n_2} \boldsymbol{\mathbf{A}} (i;l) \boldsymbol{\mathbf{B}} (l;j)~.\] 注意到求和的上下限恰好可以合并,得到 \[\sum_{l=1}^{n} \boldsymbol{\mathbf{A}} (i;l) \boldsymbol{\mathbf{B}} (l;j)~,\] 这正是 $C$ 的 $(i,j)$ 元。得证。

   证明 2 阶情况是出于简便起见,其思路是可以推广到更加一般的情况

2. 块对角矩阵

   定义块对角矩阵:只有对角块可能不为零的矩阵,例如:

\begin{equation} \boldsymbol{\mathbf{M}} = \begin{pmatrix} \boldsymbol{\mathbf{A}} & \boldsymbol{\mathbf{O}} \\ \boldsymbol{\mathbf{O}} & \boldsymbol{\mathbf{B}} \\ \end{pmatrix}~. \end{equation}
其中 $ \boldsymbol{\mathbf{O}} $ 代表元素全为零的矩阵,$ \boldsymbol{\mathbf{A}} $ 和 $ \boldsymbol{\mathbf{B}} $ 可能有元素不为零。更详细的讨论见块对角矩阵

块对角矩阵的特殊性质

   块对角矩阵有一些特别的性质,包括:


1. ^ 本文参考了 Steven J. Leon 的 Linear Algebra with Applications。

                     

© 小时科技 保留一切权利