指标与求和约定

贡献者： JierPeter

预备知识　矩阵

1. 引入的动机

　　 指标表示和爱因斯坦求和约定是传统矩阵和矩阵乘法运算的替代表示。

　　矩阵本质上是对线性性质¹的表示，而凡能用到矩阵和矩阵乘法的地方都可以应用爱因斯坦求和约定，不仅能大大简化几乎所有表达，而且也易于推广到在传统矩阵表示法看来非常复杂的情况。

　　本节仅讨论矩阵及其指标表示，并不讨论各矩阵会被赋予什么意义（用于表示向量的坐标、线性变换的坐标、内积的坐标等）。在不同的语境下，矩阵可能用来表示向量的坐标，线性映射的坐标，内积的坐标，乃至更多情况，具体问题应具体分析。

2. 矩阵的指标表示法

　　 指标（index）表示法用于表示矩阵。具体来说，对于二维的矩阵，上标表示行数，下标表示列数，比如 $a^1_2$ 就表示 “第 $1$ 行第 $2$ 列的 $a$”。进一步，我们也可以直接用指标不定的 $a^i_j$ 来表示一个二维矩阵。类似地，$a^i$ 是列矩阵，$a_i$ 是行矩阵。

　　 $a^i_j$ 中，矩阵元素是各不同的 $a$。任何东西都可以用作矩阵元素，包括矩阵本身。因此，$a^{i}_{\phantom{1}j}$ 表示以 $a^i$ 作矩阵元构成的行矩阵，而 $a^i$ 本身是一个列矩阵——也就是说 $a^i_{\phantom{1}j}$ 是一个 “列矩阵的行矩阵”。同理，$a^{\phantom{1}i}_j$ 是一个 “行矩阵的列矩阵”。谁套谁取决于指标的先后顺序。不过，在不至于混淆的情况下，可以把 $a^i_j, a^i_{\phantom{1}j}, a^{\phantom{1}i}_j$ 都视为等价，即无视上下指标之间的先后顺序；但是这种情况下通常也要区分上指标之间或者下指标之间的先后顺序，比如 $T_{ijk}$ 中，$i$ 就是最靠前的下指标。

　　在 “张量” 文章的式 5 中我们引入了 “行矩阵的行矩阵” 这一类套娃概念来描述二阶张量，而指标表示法可以极为简洁地表达 “套娃矩阵”——比如说，一个 “列矩阵的列矩阵” 就可以表示为 $a^{ij}$，各 $a^{ij}$ 就表示这个矩阵中 “第 $i$列的矩阵的第 $j$列的元素”。

　　由此可见，张量文章中想方设法进行的复杂表示，都可以简洁地用上下指标来描述。“行矩阵的行矩阵” 这样套娃的表达，用指标来表示其实就是 $m_{ij}$，两个下标。在这里，$m_{ij}$ 中的 $i$ 表示第 $i$ 个行矩阵，而 $j$ 表示这个行矩阵里的第 $j$ 个元素——由此可见，两个下标的地位是不一样的，先后次序很重要。因此在现代数学和物理的文献中，为了减少歧义，也通常明确地写出两个坐标的次序，比如 $m^{i\phantom{1}k}_{\phantom{1}j}$ 就表示三个指标的优先顺序分别是 $i$、$j$、$k$。

3. 矩阵乘法与求和约定

　　为了把矩阵乘法的规则推广到上下指标的描述法，我们有了爱因斯坦求和约定。

　　设有两个矩阵 $ \boldsymbol{\mathbf{A}} =A^i_j$ 和 $ \boldsymbol{\mathbf{B}} =B^i_j$，如果 $ \boldsymbol{\mathbf{AB}} = \boldsymbol{\mathbf{C}} =C^i_j$，那么 $C^i_j$ 应该等于多少？按照指标表示法的定义，$C^i_j$ 就是 $ \boldsymbol{\mathbf{C}} $ 的第 $i$ 行、第 $j$ 列的元素；按照矩阵乘法的定义，它是 $ \boldsymbol{\mathbf{A}} $ 的第 $i$ 行和 $ \boldsymbol{\mathbf{B}} $ 的第 $j$ 列的元素对应相乘再求和的结果，也就是

\begin{equation} C^i_j = \sum_k A^i_k B^k_j~. \end{equation}

反过来，如果 $ \boldsymbol{\mathbf{BA}} = \boldsymbol{\mathbf{D}} =D^i_j$，那么应有

\begin{equation} D^i_j = \sum_k B^i_k A^k_j~. \end{equation}

　　我们发现，计算矩阵乘法的时候，总是有一个指标出现了两次，并且总是一次出现在上标、一次出现在下标，而这个重复出现的指标要求和，导致没有出现在最终结果里。

　　由此，我们引入爱因斯坦求和约定：就是：当式子中任何一个指标出现了两次，并且一次是上标、一次是下标时，那么该式表示的实际上是对这个角标一切可能值的求和。换言之，如果角标 $i$ 作为上标和下标各出现了一次，那么式子相当于添加了一个关于 $i$ 的求和符号 $\sum_i$。

　　同时，由于重复的指标没有出现在最终结果里，它不承担 “表达行数、列数” 的功能，因此被称为赝指标（pseudo index）或哑指标（dummy index）²，也可以叫伪指标、假指标等。相对应地，没有重复求和的指标表达了列数或行数，因此被称为真指标（real index）。

　　伪指标可以用任意字母代替，如 $A^i_kB^k_j$ 也可以写作 $A^i_sB^s_j$，但真指标不能随意替换，如 $A^i_k$ 和 $A^i_s$ 就是不同的对象，前者表达的是 “第 $i$ 行第 $k$ 列的元素”，后者则表达了 “第 $i$ 行第 $s$ 列的元素”。

　　求和的伪指标不一定是遍历 $1, 2, 3$，也可能是对更多或者更少的指标求和，甚至是无穷集合。指标的范围要根据具体情境来决定。

例 1　矩阵运算

　　对于矩阵 $ \boldsymbol{\mathbf{A}} $，我们把其第 $i$ 行第 $j$ 列的元素表示为 $A^i_j$。

矩阵乘法表示为：如果 $ \boldsymbol{\mathbf{A}} = \boldsymbol{\mathbf{B}} \boldsymbol{\mathbf{C}} $，那么 $A^i_j=B^i_k C^k_j$。
矩阵 $ \boldsymbol{\mathbf{A}} $ 的迹为 $A^i_i$。

例 2　内积

　　在欧几里得空间中，我们常把向量写作矩阵，而两个矩阵 $v^i$ 和 $u^i$ 所表示的向量之间的内积常写作 $\sum_i v^iu^i$。看起来，这不符合求和约定，因为重复指标都是上标了；但实际上这是因为我们漏写了内积的坐标矩阵。

　　上述表达中，我们默认使用了直角坐标系，或者说选择的基是标准正交基。但如果采用斜坐标系，或者非标准正交的基，那么两个向量的内积就不再是 $\sum_i v^iu^i$，而是 $\sum_{i, j} v^iu^j g_{ij}$，其中 $g_{ij}$ 由内积决定，随着选择的基变化而变化，因此被称为内积的坐标。

　　在直角坐标系中，或者说标准正交基下，

\begin{equation} g_{ij}= \left\{ \begin{aligned} &1, \quad i=j;\\ &0, \quad i\not= j. \end{aligned} \right. ~ \end{equation}

此时恰好有 $\sum_{i, j} v^iu^j g_{ij}=\sum_i v^iu^i$，仅此而已。

　　爱因斯坦求和约定的表示方法脱胎于矩阵乘法的要求，但是却不依赖于矩阵行和列的形式，转而关注指标间的配合，相比传统的矩阵表达，能更方便地推广到高阶张量的情形中。

4. 若干约定俗成的表示

向量的坐标分量用上标表示，对偶向量的坐标分量用下标表示，这对应于对偶空间文章中说的 “向量坐标表示为列矩阵，对偶向量坐标表示为行矩阵”。用物理学中更常用的术语来说，逆变向量分量用上标表示，协变向量分量用下标表示。
在闵可夫斯基时空中，$x^0$ 表示时间坐标 $t$，而 $x^1$，$x^2$ 和 $x^3$ 分别表示空间坐标 $x$，$y$ 和 $z$。有时候还会使用 $x^4$ 来表示虚时间分量³ $ \mathrm{i} t$。注意这里取了光速 $c=1$。

5. 抽象指标

　　在涉及微分几何时我们常使用抽象指标，这是爱因斯坦求和约定的延伸，请参见抽象指标文章。

未完成：如有约定俗成的补充，请继续添加。

1. ^ 所谓线性性质，可以简单理解为给定的 “乘法” 和 “加法” 的 “分配性”。比如考虑实数的乘法和加法，那么实函数 $f(x)=kx$ 就具有线性性，因为对于任何实数 $a, b, x, y$ 都有 $f(ax+by)=af(x)+bf(y)$。但 $g(x)=kx+1$ 和 $h(x)=x^2$ 就不具有线性性。
2. ^ 对于 $A^i_k$，$k$ 确实表达了 “第 $k$ 列” 的含义，但是对于 $A^i_kB^k_j$，$k$ 并没有表达这个对象的行数或列数。因此对于 $A^i_k$，$k$ 是真指标；对于 $A^i_kB^k_j$，$k$ 是赝指标。
3. ^ 给时间分量加虚数单位，是因为所用的度规是 $+2$ 度规，但这个度规作为实代数不同于真正的时空代数 $\mathcal{Cl}(1, 3)$，而给时间分量加上虚数单位以后就相当于讨论的是 $\mathcal{Cl}(4, 0)$，这个代数恰好同构于时空代数。