数据结构:密矩阵

                     

贡献者: addis

预备知识 矩阵

   一般来说,矩阵的每个元在计算机内存中逐个储存,这种数据结构通常叫做密矩阵(dense matrix)。由于在计算机内存中所有数据都是按顺序排成一行,所以在储存矩阵时我们就有两种选择,一是把矩阵所有行首尾相接,叫做行主序(row-major),二是把矩阵所有列首尾相接,叫列主序(column-major)。例如对于 $2 \times 2$ 的矩阵 $ \boldsymbol{\mathbf{A}} $,列主序下,矩阵元在内存中的顺序依次 $A_{11}, A_{21}, A_{12}, A_{22}$,而在行主序下顺序为 $A_{11},A_{12},A_{21},A_{22}$。

   在 Fortran 和 Matlab 中1,语言自带的矩阵都是列主序。但 C++ 并没有自带的矩阵类型,由于 C++ 的灵活性,我们完全可以创造行主序和列主序两种不同的矩阵类。由于 C++ 的数组的指标从 0 开始,那么矩阵的行标和列表也习惯从 0 开始。

   注意有一些代码中为了省事直接用两个 std::vector 嵌套来表示矩阵,例如 vector<vector<int>> a,这样矩阵元就可以用 a[i][j] 表示。但这样得到的并不是密矩阵(小时百科中我们只把上面描述的数据结构叫做密矩阵),因为矩阵每一行都独立进行内存分配,使得每一行第一个元素在内存中并不是紧接着上一行最后一个元素。我们不推荐这种做法,主要是因为普遍使用的 BLASLapack 以及很多科学计算库只支持上面介绍的数据结构。

1. 单索引和双索引的转换

   在我们用双索引寻找矩阵元时,我们需要先将其转换为单索引。假设矩阵尺寸为 $N_1 \times N_2$,那么

\begin{equation} \begin{aligned} &\begin{cases} n = i + N_1 j &\text{(列主序)}\\ n = N_2 i + j &\text{(行主序)} \end{cases}\\ &(i = 0, \dots, N_1-1,\quad j = 0, \dots, N_2-1)~. \end{aligned} \end{equation}

   行主序和列主序也可以延申至高维矩阵,如果使用列主序,那么当我们在内存中按顺序读取数据的时候,第 1 个索引(index)将变化得最快,第 2 个索引变化得第二快,最后得索引变化得最慢。行主序则相反,最后的索引变化得最快,而第一个最慢。例如 4 维数组的多索引变为单索引的公式为

\begin{equation} \begin{cases} n = i_1 + N_1 i_2 + N_1 N_2 i_3 + N_1 N_2 N_3 i_4 &\text{(列主序)}\\ n = N_2 N_3 N_4 i_1 + N_3 N_4 i_2 + N_4 i_3 + i_4 &\text{(行主序)} ~. \end{cases} \end{equation}
从性能角度来看,单索引要比多个索引要快。

   若要由单索引计算多索引,我们可以用整数除法(向下取整)/ 和求余运算 %,例如对列主序的矩阵有

\begin{equation} \begin{cases} i = n \% N\\ j = n / N~. \end{cases} \end{equation}

   小时百科的 SLISC 库中提供了 C++ 的密矩阵类,详见 “SLISC 的密矩阵类”。

2. 密矩阵的切割

   有时候我们希望仅对密矩阵的一个子矩阵进行操作,但为了提高性能又不希望把它重新复制到一个新的密矩阵中。

未完成:图未完成
需要指定第一个矩阵元的指针,矩阵的尺寸,以及 leading dimension 的长度(LDA)。
未完成:如何转换双索引和原矩阵的单索引?

   列主序:

\begin{equation} n = n_0 + i + N_{lda} j~. \end{equation}
行主序:
\begin{equation} n = n_0 + N_{lda} i + j~. \end{equation}

   当子矩阵就是大矩阵本身时,$N_{lda}$ 就是行数(列主序)或者列数(行主序)。


1. ^ Matlab 最初就是由 fortran 编写的。

                     

© 小时科技 保留一切权利