狄拉克方程（综述）

贡献者：待更新

　　本文根据 CC-BY-SA 协议转载翻译自维基百科相关文章。

　　在粒子物理学中，狄拉克方程是由英国物理学家保罗·狄拉克于 1928 年推导出的相对论波动方程。在其自由形式或包括电磁相互作用的情况下，它描述了所有自旋为 1/2 的有质量粒子，被称为 “狄拉克粒子”，例如电子和夸克，这些粒子具有宇称对称性。它与量子力学原理和相对论的特殊理论一致，[1]并且是第一个在量子力学中完全考虑特殊相对论的理论。通过严格地解释氢谱的精细结构，它得到了验证。它在标准模型的构建中变得至关重要。[2]

　　该方程还暗示了一种新的物质形式——反物质，之前未曾被怀疑或观察到，几年的实验验证了这一点。它还为保罗的自旋现象学理论中引入多个分量波函数提供了理论依据。狄拉克理论中的波函数是四个复数值的向量（称为双自旋数），其中两个在非相对论极限下类似于保罗波函数，而与描述单一复数值波函数的薛定谔方程不同。此外，在零质量极限下，狄拉克方程简化为魏尔方程。

　　在量子场论的背景下，狄拉克方程被重新解释为描述与自旋 1/2 粒子相对应的量子场。

　　狄拉克没有完全意识到自己结果的重要性；然而，他关于自旋的解释——作为量子力学和相对论结合的结果——以及最终发现正电子，代表了理论物理学的伟大胜利之一。这一成就被认为与牛顿、麦克斯韦和爱因斯坦的工作相提并论。[3] 有些物理学家认为这方程是 “现代物理学的真正种子”。[4] 该方程还被描述为 “相对论量子力学的核心”，并且有人说 “这方程可能是所有量子力学中最重要的方程”。[5]

　　狄拉克方程被刻在威斯敏斯特大教堂的地板上的一块纪念牌上。该纪念牌于 1995 年 11 月 13 日揭幕，纪念狄拉克的一生。[6]

1. 历史

　　狄拉克方程在狄拉克最初提出的形式是：[7]:291 [8] \[ \left( \beta mc^{2} + c \sum_{n=1}^{3} \alpha_{n} p_{n} \right) \psi(x,t) = i\hbar \frac{\partial \psi(x,t)}{\partial t}~ \] 其中，\(\psi(x,t)\) 是具有静止质量 \(m\) 的电子的波函数，\(x\) 和 \(t\) 为时空坐标，\(p_1, p_2, p_3\) 是动量的分量，被理解为薛定谔方程中的动量算符。\(c\) 是光速，\(\hbar\) 是约化普朗克常数；这些基本物理常数分别反映了特殊相对论和量子力学。

　　狄拉克提出此方程的目的是解释相对论性运动电子的行为，从而使得原子可以以与相对论一致的方式进行处理。他希望通过这种方式引入的修正可能对原子光谱的问题有所帮助。

　　在此之前，试图使旧量子理论与相对论理论兼容的努力——这些努力基于将电子在原子核周围可能非圆形轨道中存储的角动量离散化——都失败了，而海森堡、保利、约旦、薛定谔和狄拉克自己提出的新量子力学还未充分发展以处理这一问题。尽管狄拉克最初的目的已得到满足，但他的方程对物质结构有着更深远的影响，并引入了新的数学对象类，这些对象现在是基础物理学的重要元素。

　　方程中的新元素是四个 4 × 4 矩阵 \(\alpha_1, \alpha_2, \alpha_3\) 和 \(\beta\)，以及四分量波函数 \(\psi\)。\(\psi\) 有四个分量，因为在配置空间中的任意一点处对其求值是一个双自旋数。它被解释为自旋向上的电子、自旋向下的电子、自旋向上的正电子和自旋向下的正电子的叠加。

　　这四个 4 × 4 矩阵 \(\alpha_k\) 和 \(\beta\) 都是厄米矩阵，并且是自反的： \[ \alpha_i^2 = \beta^2 = I_4~ \] 它们互相反对易： \[ \alpha_i \alpha_j + \alpha_j \alpha_i = 0 \quad (i \neq j)~ \] \[ \alpha_i \beta + \beta \alpha_i = 0~ \] 这些矩阵及波函数的形式具有深刻的数学意义。伽马矩阵所表示的代数结构早在 50 年前由英国数学家 W. K. Clifford 创造。反过来，Clifford 的思想源于 19 世纪中期德国数学家赫尔曼·格拉斯曼在其《线性展开理论》（Lineare Ausdehnungslehre）中的工作。

使薛定谔方程相对论化

　　狄拉克方程在表面上与描述自由粒子的薛定谔方程相似： \[ - \frac{\hbar^2}{2m} \nabla^2 \phi = i\hbar \frac{\partial}{\partial t} \phi~ \] 左侧表示动量算符的平方除以两倍的质量，这是非相对论性动能。因为相对论将空间和时间视为一个整体，因此这一方程的相对论性推广要求空间和时间的导数必须对称地出现，就像麦克斯韦方程中描述光的行为一样——方程在空间和时间上的微分阶数必须相同。在相对论中，动量和能量是时空四矢量的空间和时间部分，称为四动量，它们通过相对论不变关系相互关联： \[ E^2 = m^2 c^4 + p^2 c^2~ \] 这表示该四矢量的长度与静质量 \(m\) 成正比。将薛定谔理论中能量和动量的算符替代进入后，得到描述波动传播的克莱因–戈尔登方程，构建于相对论不变的物体基础之上： \[ \left( -\frac{1}{c^2} \frac{\partial^2}{\partial t^2} + \nabla^2 \right) \phi = \frac{m^2 c^2}{\hbar^2} \phi~ \] 其中波函数 \(\phi\) 是相对论标量：它是一个复数，在所有参考系中具有相同的数值。空间和时间的导数都以二阶形式出现。这对方程的解释有重要影响。由于方程在时间导数上是二阶的，必须指定波函数本身和其一阶时间导数的初始值，才能求解具体问题。由于这两个初始值可以或多或少任意选择，波函数无法再像在薛定谔理论中那样，保持其决定电子在给定运动状态下的概率密度的作用。

　　在薛定谔理论中，概率密度由正定的表达式给出： \[ \rho = \phi^* \phi~ \] 该密度根据概率流向量进行对流： \[ J = - \frac{i \hbar}{2m} (\phi^* \nabla \phi - \phi \nabla \phi^*)~ \] 并且概率流和密度的守恒来自于连续方程： \[ \nabla \cdot J + \frac{\partial \rho}{\partial t} = 0~ \] 密度为正定并且根据这个连续方程进行对流，意味着可以在某个区域内对密度积分并将总和设为 1，这个条件将由守恒定律保持。具有概率密度流的正确相对论性理论也必须具备这一特性。为了保持对流密度的概念，必须将薛定谔的密度和电流表达式推广，使得空间和时间的导数再次以对称的方式进入标量波函数的关系。薛定谔的表达式可以保留在电流中，但概率密度必须替换为对称形成的表达式（需要进一步解释）： \[ \rho = \frac{i \hbar}{2m c^2} \left( \psi^* \partial_t \psi - \psi \partial_t \psi^* \right)~ \] 这个表达式现在成为了时空四矢量的第四分量，整个概率四流密度具有相对论协变的表达式： \[ J^\mu = \frac{i \hbar}{2m} \left( \psi^* \partial^\mu \psi - \psi \partial^\mu \psi^* \right)~ \] 连续方程依旧成立。现在，一切都与相对论兼容，但密度的表达式不再是正定的；\(\psi\) 和 \(\partial_t \psi\) 的初始值可以自由选择，因此密度可能变为负值，这对于合法的概率密度来说是不可能的。因此，在简单地假设波函数是相对论标量，并且它满足一个时间二阶方程的情况下，无法得到薛定谔方程的简单相对论性推广。

　　尽管它不是薛定谔方程的成功相对论性推广，这个方程在量子场论的背景下复兴，并被称为克莱因–戈尔登方程，用来描述无自旋粒子场（例如 \(\pi\) 介子或希格斯玻色子）。历史上，薛定谔本人在他的名字所命名的方程之前就得到了这个方程，但很快就放弃了它。在量子场论的背景下，这种不确定的密度被理解为对应于电荷密度，可以为正或负，而不是概率密度。

狄拉克的突破

　　因此，狄拉克想尝试一个在空间和时间上都一阶的方程。他假设了一个形式为： \[ E\psi = (\vec{\alpha} \cdot \vec{p} + \beta m) \psi~ \] 其中，算符 \((\vec{\alpha}, \beta)\) 必须与 \((\vec{p}, t)\) 独立，以保证方程的线性性，并且与 \((\vec{x}, t)\) 独立，以保证时空均匀性。这些约束意味着 \((\vec{\alpha}, \beta)\) 算符将依赖于额外的动力学变量；根据这一要求，狄拉克得出结论，算符将依赖于与泡利矩阵相关的 4×4 矩阵。

　　例如，可以形式化地（即通过滥用符号）取相对论性的能量表达式： \[ E = c \sqrt{p^2 + m^2 c^2}~ \] 将动量 \(p\) 替换为它的算符等价物，展开平方根为一个无限级数的导数算符，建立特征值问题，然后通过迭代法形式上解出方程。即使这种过程在技术上可能可行，大多数物理学家对这种方法并不抱有信心。

　　故事是这样的：狄拉克在剑桥大学盯着壁炉，思考这个问题时，突然想到取波动算符的平方根（参见半导数）来处理，形式如下： \[ \nabla^2 - \frac{1}{c^2} \frac{\partial^2}{\partial t^2} = \left(A \partial_x + B \partial_y + C \partial_z + \frac{i}{c} D \partial_t \right) \left(A \partial_x + B \partial_y + C \partial_z + \frac{i}{c} D \partial_t \right)~ \] 展开右边可以看出，为了让所有交叉项（如 \(\partial_x \partial_y\)）消失，必须假设： \[ AB + BA = 0, \ldots~ \] 并且： \[ A^2 = B^2 = \dots = 1~ \] 狄拉克当时刚刚专注于研究海森堡矩阵力学的基础，他立即理解到这些条件可以通过将 \(A\)、\(B\)、\(C\) 和 \(D\) 设为矩阵来满足，这意味着波函数有多个分量。这立刻解释了泡利的现象学自旋理论中出现的二维波函数，这在当时甚至对泡利本人来说也曾是个谜。然而，为了建立具有所需性质的系统，至少需要 4×4 矩阵——因此，波函数有四个分量，而不像泡利理论中的两个分量，或像薛定谔理论中的一个分量。这个四分量波函数代表了一类新的数学对象，这在物理理论中首次出现。

　　考虑到这种因子化，可以立即写出一个方程： \[ \left(A \partial_x + B \partial_y + C \partial_z + \frac{i}{c} D \partial_t \right) \psi = \kappa \psi~ \] 其中 \(\kappa\) 待定。再将矩阵算符作用于方程两边，得到： \[ \left( \nabla^2 - \frac{1}{c^2} \partial_t^2 \right) \psi = \kappa^2 \psi~ \] 令 \(\kappa = \frac{mc}{\hbar}\) 可得，波函数的所有分量都单独满足相对论的能量-动量关系。因此，寻求的方程，既在空间又在时间上是一阶的，最终是： \[ \left( A \partial_x + B \partial_y + C \partial_z + \frac{i}{c} D \partial_t - \frac{mc}{\hbar} \right) \psi = 0~ \] 设： \[ A = i \beta \alpha_1, \quad B = i \beta \alpha_2, \quad C = i \beta \alpha_3, \quad D = \beta~ \] 由于 \(D^2 = \beta^2 = I_4\)，最终得到了上面写出的狄拉克方程。

协变形式与相对论不变性

　　为了证明方程的相对论不变性，将其转换成空间和时间导数处于平等地位的形式是有利的。为此，引入了新的矩阵，如下所示： \[ D = \gamma^0, \quad A = i\gamma^1, \quad B = i\gamma^2, \quad C = i\gamma^3~ \] 此时方程的形式为（记住协变四梯度的定义，特别是 \(\partial_0 = \frac{1}{c} \partial_t\)）： \[ (i\hbar \gamma^\mu \partial_\mu - mc) \psi = 0~ \] 其中，\(\mu = 0, 1, 2, 3\) 是两次重复的指标，\(\partial_\mu\) 是四梯度。在实践中，常常将伽马矩阵表示为泡利矩阵和 2×2 单位矩阵的子矩阵。显式地，标准表示为： \[ \gamma^0 = \begin{pmatrix} I_2 & 0 \\ 0 & -I_2 \end{pmatrix}, \quad \gamma^1 = \begin{pmatrix} 0 & \sigma_x \\ -\sigma_x & 0 \end{pmatrix}, \quad \gamma^2 = \begin{pmatrix} 0 & \sigma_y \\ -\sigma_y & 0 \end{pmatrix}, \quad \gamma^3 = \begin{pmatrix} 0 & \sigma_z \\ -\sigma_z & 0 \end{pmatrix}~ \] 整个系统使用时空上的闵可夫斯基度量（Minkowski metric）总结为： \[ \{ \gamma^\mu, \gamma^\nu \} = 2 \eta^{\mu \nu} I_4~ \] 其中，括号表达式 \(\{ a, b \} = ab + ba\) 表示反对易子。这个关系是伪正交四维空间上克利福德代数（Clifford algebra）的定义关系，具有度量签名（+ − − −）。在狄拉克方程中使用的克利福德代数今天被称为狄拉克代数。尽管狄拉克在方程提出时并没有将其视为如此，但事后来看，这种几何代数的引入代表了量子理论发展的巨大进步。

　　现在，狄拉克方程可以被解释为特征值方程，其中静质量与四动量算符的特征值成正比，比例常数为光速： \[ \operatorname{P}_{\mathsf{op}} \psi = m c \psi~ \] 使用 Feynman 划线符号定义的 \(\partial/\)（即 \(\partial/\mathrel{\stackrel{\mathrm{def}}{=}} \gamma^\mu \partial_\mu\)）后，狄拉克方程变为： \[ i\hbar \partial/\psi - mc \psi = 0~ \] 这里的 \(\partial/\) 被称为 “d-斜线”，按照费曼斜线记法。

　　在实际应用中，物理学家常常使用自然单位，使得 \(\hbar = c = 1\)。此时，方程变为简单的形式：

　　 狄拉克方程（自然单位） \[ (i \partial / - m) \psi = 0~ \] 一个基础定理[哪个？]表明，如果给定两个不同的矩阵集合，它们都满足 Clifford 关系，那么它们通过相似变换相互连接： \[ \gamma^{\mu \prime} = S^{-1} \gamma^{\mu} S~ \] 如果这些矩阵都是单位矩阵，正如狄拉克矩阵集所示，那么 \( S \) 本身也是单位的： \[ \gamma^{\mu \prime} = U^{\dagger} \gamma^{\mu} U~ \] 变换 \( U \) 是唯一的，只会有一个绝对值为 1 的乘法因子。现在，假设空间和时间坐标以及导数算符（它们形成一个协变矢量）已经经历了洛伦兹变换。为了使算符 \(\gamma^{\mu} \partial_{\mu}\) 不变，\(\gamma\) 矩阵必须相对于它们的时空指标作为一个逆变矢量进行变换。由于洛伦兹变换的正交性，这些新的 \(\gamma\) 矩阵仍然会满足 Clifford 关系。根据之前提到的基础定理[哪个？]，可以通过单位变换将新的矩阵集替换为旧的矩阵集。在新的参考系中，记住休止质量是一个相对论标量，狄拉克方程将呈现以下形式： \[ \left( iU^{\dagger} \gamma^{\mu} U \partial_{\mu}^{\prime} - m \right) \psi (x^{\prime}, t^{\prime}) = 0~ \] \[ U^{\dagger} (i \gamma^{\mu} \partial_{\mu}^{\prime} - m) U \psi (x^{\prime}, t^{\prime}) = 0~ \] 如果定义变换后的自旋量子比为 \[ \psi^{\prime} = U \psi~ \] 则变换后的狄拉克方程表现出显式的相对论不变性： \[ \left( i \gamma^{\mu} \partial_{\mu}^{\prime} - m \right) \psi^{\prime} (x^{\prime}, t^{\prime}) = 0~ \] 因此，选择 \(\gamma\) 矩阵的任何单位表示都是最终确定的，前提是自旋量子比根据与给定洛伦兹变换相对应的单位变换进行变换。

　　不同的狄拉克矩阵表示将聚焦于狄拉克波函数中的特定物理内容。这里展示的表示法称为标准表示法——在此表示法中，波函数的前两个分量在低能量和小速度的极限下，变为保利自旋波函数。

　　以上的考虑揭示了 \(\gamma\) 矩阵在几何中的起源，回溯到格拉斯曼最初的动机；它们代表了时空中的一个固定单位向量基。同样，像 \(\gamma^{\mu} \gamma^{\nu}\) 这样的矩阵积代表了有向的面元，等等。考虑到这一点，我们可以找到时空中的单位体积元素的 \(\gamma\) 矩阵形式，如下所示。根据定义，它是： \[ V = \frac{1}{4!} \epsilon_{\mu \nu \alpha \beta} \gamma^{\mu} \gamma^{\nu} \gamma^{\alpha} \gamma^{\beta}~ \] 为了保持不变性，\(\epsilon\) 符号必须是一个张量，因此它必须包含一个 \(\sqrt{g}\) 的因子，其中 \(g\) 是度规张量的行列式。由于这个因子是负的，因此该因子是虚数。因此： \[ V = i \gamma^{0} \gamma^{1} \gamma^{2} \gamma^{3}~ \] 这个矩阵被赋予了特殊的符号 \(\gamma_5\)，因为它在考虑时空不正当变换时（即那些改变基向量方向的变换）非常重要。在标准表示法中，它是： \[ \gamma_5 = \begin{pmatrix} 0 & I_2 \\ I_2 & 0 \end{pmatrix}~ \] 这个矩阵还会与其他四个狄拉克矩阵反交换： \[ \gamma_5 \gamma^{\mu} + \gamma^{\mu} \gamma_5 = 0~ \] 当涉及到宇称问题时，\(\gamma_5\) 作为一个有向大小的体积元素起到重要作用，因为它在时空反射下会改变符号。因此，上面取正平方根相当于在时空上选择一种手性约定。

2. 与相关理论的比较

保利理论

　　引入半整数自旋的必要性可以追溯到斯特恩-格尔拉赫实验的实验结果。在实验中，一束原子通过一个强的不均匀磁场，这束原子会根据原子的内在角动量分裂成 N 个部分。研究发现，对于银原子，光束分裂成两部分；因此，基态不可能是整数的，因为即使原子的内在角动量最小为 1，光束也应该分裂成三部分，分别对应于 \(L_z = -1, 0, +1\) 的原子。结论是，银原子的内在角动量为 \( \frac{1}{2} \)。保利建立了一个理论，通过引入一个二分量波函数，并在哈密顿量中加入相应的修正项，解释了这种分裂现象，该修正项表示波函数与施加的磁场之间的半经典耦合。其在国际单位制中的形式为： \[ H = \frac{1}{2m} \left( \boldsymbol{\sigma} \cdot (\mathbf{p} - e\mathbf{A}) \right)^2 + e \phi~ \] 这里，\(\mathbf{A}\) 和 \(\phi\) 分别表示电磁四势的分量（标准国际单位制），三个 \(\sigma\) 是保利矩阵。展开第一项后，会发现一个与磁场的残余相互作用，以及经典哈密顿量的常见项，描述带电粒子与施加磁场的相互作用： \[ H = \frac{1}{2m} (\mathbf{p} - e \mathbf{A})^2 + e \phi - \frac{e \hbar}{2m} \boldsymbol{\sigma} \cdot \mathbf{B}~ \] 这个哈密顿量是一个 \(2 \times 2\) 矩阵，因此基于它的薛定谔方程必须使用二分量波函数。在类似地引入外部电磁四势到狄拉克方程中，称为最小耦合，方程形式为： \[ \left( \gamma^\mu \left( i\hbar \partial_\mu - e A_\mu \right) - mc \right) \psi = 0~ \] 再应用一次狄拉克算符，将会精确地再现保利项，因为空间的狄拉克矩阵乘以 \(i\) 后，具有与保利矩阵相同的平方和对易性质。而且，电子的旋磁比值，位于保利新项前面，可以从第一原理推导出来。这是狄拉克方程的一个重大成就，并且让物理学家对它的整体正确性充满信心。

　　然而，还有更多内容。保利理论可以被看作是狄拉克理论在低能量极限下的表现。首先，方程可以写成如下形式，表示二自旋子耦合的方程（恢复国际单位制）： \[ \begin{pmatrix} m c^2 - E + e \phi & + c \boldsymbol{\sigma} \cdot (\mathbf{p} - e \mathbf{A}) \\ - c \boldsymbol{\sigma} \cdot (\mathbf{p} - e \mathbf{A}) & m c^2 + E - e \phi \end{pmatrix} \begin{pmatrix} \psi_+ \\ \psi_- \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \end{pmatrix}~ \] 因此： \[ \begin{aligned} (E - e \phi) \psi_+ - c \boldsymbol{\sigma} \cdot (\mathbf{p} - e \mathbf{A}) \psi_- &= m c^2 \psi_+ \\ c \boldsymbol{\sigma} \cdot (\mathbf{p} - e \mathbf{A}) \psi_+ - (E - e \phi) \psi_- &= m c^2 \psi_- \end{aligned}~ \] 假设磁场较弱，并且电子的运动是非相对论性的，电子的总能量大致等于其静止能量，动量趋近于经典值： \[ E - e \phi \approx m c^2, \quad \mathbf{p} \approx m \mathbf{v}~ \] 因此，第二个方程可以写成： \[ \psi_- \approx \frac{1}{2m c} \boldsymbol{\sigma} \cdot (\mathbf{p} - e \mathbf{A}) \psi_+~ \] 该表达式是按 \( \frac{v}{c} \) 级别来估计的。这样，在典型的能量和速度下，标准表示中的狄拉克自旋子的底部分量相较于顶部分量被极大抑制。将此表达式代入第一个方程，通过一些整理后，得到： \[ (E - m c^2) \psi_+ = \frac{1}{2m} \left[ \boldsymbol{\sigma} \cdot (\mathbf{p} - e \mathbf{A}) \right]^2 \psi_+ + e \phi \psi_+~ \] 左侧的算符表示粒子的总能量减去静止能量，即其经典动能，因此可以通过识别保利的二自旋子与狄拉克自旋子的顶部分量来恢复保利理论，前提是采用非相对论近似。进一步近似给出保利理论的薛定谔方程极限。

　　因此，薛定谔方程可以被视为狄拉克方程的非相对论极限，当忽略自旋并仅在低能量和低速度下工作时。这也是新方程的一个重大胜利，因为它追溯了方程中出现的神秘 \(i\) 以及复杂波函数的必要性，通过狄拉克代数联系到时空的几何。这还凸显了为什么薛定谔方程，尽管表面上看起来像是扩散方程，实际上代表的是波动传播。

　　需要强调的是，整个狄拉克自旋子表示的是一个不可约的整体。此处所做的将狄拉克自旋子分为大分量和小分量的做法依赖于低能量近似的有效性。上文中忽略的分量是必要的，它们产生了在相对论性范围内观察到的新现象——其中包括反物质以及粒子的创生与湮灭。

韦尔理论

　　在无质量的情况下 (\(m = 0\))，狄拉克方程简化为韦尔方程，描述了相对论性无质量的自旋-1/2 粒子。

　　该理论获得了第二个 \( U(1) \) 对称性：见下文。

3. 物理解释

可观察量的识别

　　量子理论中的一个关键物理问题是：该理论所定义的物理可观察量是什么？根据量子力学的公设，这些量是由自伴算符定义的，这些算符作用于系统可能状态的希尔伯特空间。这些算符的本征值则是测量相应物理量时可能得到的结果。

　　在薛定谔理论中，最简单的此类对象是整体哈密顿量，它代表系统的总能量。为了在狄拉克理论中保持这种解释，哈密顿量必须被取为： \[ H = \gamma^{0}\left[ mc^{2} + c \gamma^{k}\left(p_k - qA_k\right)\right] + cqA^{0}~ \] 其中，像往常一样，有一个隐含的对重复两次的索引 \( k = 1, 2, 3 \) 求和。这个式子看起来很有希望，因为通过检查可以看到粒子的静能，并且在 \( A = 0 \) 的情况下，能量就是一个电荷在电势 \( cqA^{0} \) 中的能量。那么，涉及向量势的项呢？在经典电动力学中，一个电荷在施加电势中运动的能量是： \[ H = c\sqrt{\left(\mathbf{p} - q\mathbf{A}\right)^{2} + m^{2}c^{2}} + qA^{0}~ \] 因此，狄拉克哈密顿量与其经典对应物在本质上有所区别，在识别此理论中的可观察量时必须小心。狄拉克方程所暗示的许多看似悖论的行为，其实是由于对这些可观察量的误识别所致。

孔理论

　　方程的负能量解存在问题，因为假设粒子具有正能量。然而，从数学角度来看，我们似乎没有理由排除负能量解。由于负能量解是存在的，它们不能简单地被忽视，因为一旦考虑到电子与电磁场之间的相互作用，任何处于正能量本征态的电子都会衰变到负能量本征态，并且能量会逐渐降低。显然，真实的电子并不以这种方式表现，否则它们会通过辐射光子而消失。

　　为了解决这个问题，狄拉克提出了孔理论的假设，认为真空是一个多体量子态，其中所有负能量的电子本征态都已被占据。这种将真空描述为电子 “海洋” 的观点被称为狄拉克海。由于泡利不相容原理禁止电子占据相同的态，因此任何额外的电子都会被迫占据正能量本征态，而正能量电子则不可能衰变为负能量本征态。

　　狄拉克进一步推测，如果负能量本征态没有完全填满，每一个未被占据的本征态——被称为孔——会像带正电的粒子一样表现。孔具有正能量，因为从真空中创造一个粒子-孔对需要能量。如上所述，狄拉克最初认为孔可能是质子，但赫尔曼·外尔指出，孔应该表现得像具有与电子相同质量的粒子，而质子则重约电子的 1800 倍。最终，孔被识别为正电子，正电子在 1932 年由卡尔·安德森实验发现。[12]

　　然而，使用无限的负能量电子海洋来描述 “真空” 并不完全令人满意。来自负能量电子海洋的无限负贡献必须通过一个无限大的正 “裸” 能量来抵消，同时，来自负能量电子海洋的电荷密度和电流的贡献也被一个无限大的正 “果冻” 背景完全抵消，以使得真空的净电荷密度为零。在量子场论中，布戈柳博夫变换（将占据的负能量电子态转变为未占据的正能量正电子态，而将未占据的负能量电子态转变为占据的正能量正电子态）使得我们能够绕过狄拉克海的形式主义，尽管从形式上讲，它与狄拉克海是等价的。

　　然而，在凝聚态物理的某些应用中，“孔理论” 的基本概念是有效的。电导体中的导电电子海洋，称为费米海，包含能量直到系统的化学势的电子。费米海中的未填充态表现得像带正电的电子，虽然它也被称为 “电子孔”，但它与正电子是不同的。费米海的负电荷通过材料的带正电的离子晶格得以平衡。

在量子场论中的应用

　　在量子场论中，例如量子电动力学，狄拉克场会经过二次量化的过程，这解决了方程中的一些悖论特性。

4. 数学表述

　　在场论的现代表述中，狄拉克方程被写为一个狄拉克自旋场 \( \psi \) 的方程，该场取值于一个复向量空间 \( \mathbb{C}^4 \)，并定义在平坦时空（闵可夫斯基空间）\( \mathbb{R}^{1,3} \) 上。其表达式还包含伽马矩阵和一个参数 \( m > 0 \)，该参数被解释为质量，以及其他物理常数。狄拉克最初通过对爱因斯坦的能量-动量-质量等价关系进行因式分解得到他的方程，假设动量向量的标量积由度量张量确定，并通过将动量与相应的算符关联来量子化得到的关系。

　　用场 \( \psi : \mathbb{R}^{1,3} \rightarrow \mathbb{C}^4 \) 表示，狄拉克方程可以写为：

　　 狄拉克方程 \[ (i\hbar \gamma^\mu \partial_\mu - mc)\psi(x) = 0~ \] 在自然单位制下，使用费曼斜体符号，狄拉克方程为：

　　 狄拉克方程（自然单位制） \[ (i \partial \!\!\!/- m)\psi(x) = 0~ \] 伽玛矩阵是一组四个 \( 4 \times 4 \) 复数矩阵（属于 \( \text{Mat}_{4 \times 4}(\mathbb{C}) \)），它们满足以下反对易关系： \[ \{\gamma^\mu, \gamma^\nu\} = 2 \eta^{\mu \nu} I_4~ \] 其中 \( \eta^{\mu \nu} \) 是闵可夫斯基度规元素，索引 \( \mu, \nu \) 取值为 0, 1, 2, 和 3。这些矩阵可以在选择不同表示下显式实现。常见的两种表示是狄拉克表示和手征表示。

　　在狄拉克表示下， \[ \gamma^0 = \begin{pmatrix} I_2 & 0 \\ 0 & -I_2 \end{pmatrix}, \quad \gamma^i = \begin{pmatrix} 0 & \sigma^i \\ -\sigma^i & 0 \end{pmatrix}~ \] 其中 \( \sigma^i \) 是泡利矩阵。

　　在手征表示下，\( \gamma^i \) 与狄拉克表示相同，但 \(\gamma^0 = \begin{pmatrix} 0 & I_2 \\ I_2 & 0 \end{pmatrix}\)

　　斜体符号是一种紧凑的表示方法， \[ A\!\!\!/ := \gamma^\mu A_\mu~ \] 其中 \( A \) 是四矢量（通常是四维微分算符 \( \partial_\mu \)）。对索引 \( \mu \) 进行求和是隐含的。

　　或者，构成波函数的四个量的四个耦合一阶偏微分方程可以写成一个向量。在普朗克单位下，方程变为： \[ i \partial_x \begin{bmatrix} +\psi_4 \\ +\psi_3 \\ -\psi_2 \\ -\psi_1 \end{bmatrix} + \partial_y \begin{bmatrix} +\psi_4 \\ -\psi_3 \\ -\psi_2 \\ +\psi_1 \end{bmatrix} + i \partial_z \begin{bmatrix} +\psi_3 \\ -\psi_4 \\ -\psi_1 \\ +\psi_2 \end{bmatrix} - m \begin{bmatrix} +\psi_1 \\ +\psi_2 \\ +\psi_3 \\ +\psi_4 \end{bmatrix} = i \partial_t \begin{bmatrix} -\psi_1 \\ -\psi_2 \\ +\psi_3 \\ +\psi_4 \end{bmatrix}~ \] 这使得它更清晰地展示为四个偏微分方程组，包含四个未知函数。（注意 \(\partial_y \) 项前没有 \( i \)，因为 \( \sigma_y \) 是虚数。）

狄拉克共轭和共轭方程

　　狄拉克旋量场 \( \psi(x) \) 的共轭旋量定义为： \[ \bar{\psi}(x) = \psi(x)^\dagger \gamma^0~ \] 利用伽玛矩阵的性质（这直接来自于 \( \gamma^\mu \) 的厄米性），即： \[ (\gamma^\mu)^\dagger = \gamma^0 \gamma^\mu \gamma^0~ \] 可以通过对狄拉克方程取厄米共轭并右乘 \( \gamma^0 \) 来推导出共轭狄拉克方程： \[ \bar{\psi}(x)(-i \gamma^\mu {\overleftarrow \partial}_\mu - m) = 0~ \] 其中，偏导数 \( {\overleftarrow \partial}_\mu \) 从右边作用于 \( \bar{\psi}(x) \)。用常规的左作用表示偏导数时，我们得到： \[ -i \partial_\mu \bar{\psi}(x) \gamma^\mu - m \bar{\psi}(x) = 0~ \]

克莱因–戈尔登方程

　　将 \( i\partial \!\!\!/+m \) 作用于狄拉克方程得到： \[ (\partial_\mu \partial^\mu + m^2)\psi(x) = 0~ \] 也就是说，狄拉克旋量场的每个分量都满足克莱因–戈尔登方程。

守恒电流

　　该理论的守恒电流为： \[ J^\mu = \bar{\psi} \gamma^\mu \psi~ \] 从迪拉克方程的守恒性证明

　　将迪拉克方程和伴随迪拉克方程相加得到： \[ i\left((\partial_{\mu} \bar{\psi}) \gamma^{\mu} \psi + \bar{\psi} \gamma^{\mu} \partial_{\mu} \psi \right) = 0~ \] 因此，应用莱布尼茨法则，有： \[ i \partial_{\mu} (\bar{\psi} \gamma^{\mu} \psi) = 0~ \] 另一种推导这个表达式的方法是通过变分法，应用诺特定理（Noether's theorem）来推导全局 \( U(1) \) 对称性下的守恒电流 \( J^{\mu} \)。

　　 从诺特定理推导守恒性

　　回顾拉格朗日量是： \[ \mathcal{L} = {\bar {\psi }}(i\gamma^{\mu} \partial_{\mu} - m)\psi~ \] 在 \( U(1) \) 对称性下，\( \psi \) 和 \( \bar{\psi} \) 的变换为： \[ \psi \mapsto e^{i\alpha} \psi, \quad {\bar {\psi}} \mapsto e^{-i\alpha} {\bar {\psi}},~ \] 我们可以发现拉格朗日量在此变换下是不变的。

　　现在，考虑变换参数 \( \alpha \) 为无穷小量，我们首先在 \( \alpha \) 的一阶近似下工作，并忽略 \( \mathcal{O}(\alpha^2) \) 项。从之前的讨论可以立即看到，由于 \( \alpha \) 的变化，拉格朗日量的显式变化是零，即在变换下， \[ \mathcal{L} \mapsto \mathcal{L} + \delta \mathcal{L}, \quad \delta \mathcal{L} = 0.~ \] 根据诺特定理，我们可以找出拉格朗日量由于场的变动所引起的隐式变化。如果 \( \psi \) 和 \( {\bar {\psi}} \) 满足运动方程，那么有： \[ \delta \mathcal{L} = \partial_{\mu} \left( \frac{\partial \mathcal{L}}{\partial (\partial_{\mu} \psi)} \delta \psi + \frac{\partial \mathcal{L}}{\partial (\partial_{\mu} {\bar {\psi}})} \delta {\bar {\psi}} \right).~ \] 这一式子立即简化，因为拉格朗日量中没有 \( {\bar {\psi}} \) 的偏导数。\( \delta \psi(x) = i\alpha \psi(x) \) 是无穷小变化。我们计算： \[ \frac{\partial \mathcal{L}}{\partial (\partial_{\mu} \psi)} = i{\bar {\psi}} \gamma^{\mu}.~ \] 最终得到： \[ 0 = -\alpha \partial_{\mu} ({\bar {\psi}} \gamma^{\mu} \psi).~ \]

解

　　由于 Dirac 算符作用于平方可积函数的 4 元组，因此它的解应该属于相同的希尔伯特空间。解的能量没有下界这一事实是出乎意料的。

　　 平面波解

　　平面波解是通过假设得到的解： \[ \psi (x) = u(\mathbf {p} )e^{-ip\cdot x}~ \] 该解表示具有确定四动量 \( p = (E_{\mathbf {p} }, \mathbf {p}) \) 的粒子，其中 \( E_{\mathbf {p}} = \sqrt{m^{2} + |\mathbf{p}|^{2}} \)。

　　对于这个假设，Dirac 方程变为关于 \( u(\mathbf {p}) \) 的方程： \[ (\gamma^{\mu} p_{\mu} - m) u(\mathbf {p}) = 0~ \] 在选择了伽马矩阵 \( \gamma^\mu \) 的表示后，求解这个方程实际上是求解一组线性方程。伽马矩阵的一个表示无关性质是，解空间是二维的（见此处）。

　　例如，在螺旋表示下，解空间由一个 \( \mathbb{C}^2 \) 向量 \( \xi \) 参数化，其中： \[ u(\mathbf {p}) = \begin{pmatrix} {\sqrt{\sigma^{\mu} p_{\mu}}} \xi \\ {\sqrt{\bar{\sigma}^{\mu} p_{\mu}}} \xi \end{pmatrix}~ \] 其中 \( \sigma^{\mu} = (I_2, \sigma^i) \)，\( \bar{\sigma}^{\mu} = (I_2, -\sigma^i) \)，并且 \( \sqrt{\cdot} \) 表示厄米矩阵的平方根。

　　这些平面波解为经典量子化提供了起点。

5. 拉格朗日形式

　　 Dirac 方程和伴随 Dirac 方程都可以通过（变分）一个特定的拉格朗日密度得到，该拉格朗日密度为： \[ \mathcal{L} = i\hbar c \overline{\psi} \gamma^{\mu} \partial_{\mu} \psi - mc^2 \overline{\psi} \psi~ \] 如果对 \( \psi \) 变分，将得到伴随 Dirac 方程。与此同时，如果对 \( \overline{\psi} \) 变分，将得到 Dirac 方程。

　　在自然单位制下，采用斜线符号表示，作用量为：

　　 Dirac 作用量 \[ S = \int d^4 x \, {\bar {\psi}} \, (i \partial \!\!\! / - m) \, \psi~ \] 对于这个作用量，上述的守恒电流 \( J^{\mu} \) 作为与全局 \( U(1) \) 对称性对应的守恒电流，通过诺特定理在场论中得到。通过将对称性更改为局部的、时空点相关的对称性，对该场论进行规范化（即引入规范冗余）得到规范对称性。由此产生的理论是量子电动力学（QED）。详尽的讨论请见下文。

6. 洛伦兹不变性

　　狄拉克方程在洛伦兹变换下是不变的，也就是说，它在洛伦兹群 \( \text{SO}(1,3) \) 或严格的 \( \text{SO}(1,3)^{+} \)（与恒等变换相连的部分）作用下保持不变。

　　对于一个被具体视为取值于 \( \mathbb{C}^4 \) 的狄拉克自旋子，洛伦兹变换 \( \Lambda \) 下的变换由一个 \( 4 \times 4 \) 复矩阵 \( S[\Lambda] \) 给出。在定义对应的 \( S[\Lambda] \) 时有一些细节问题，并且通常会有符号上的滥用。

　　大多数讨论发生在李代数的层面上。更详细的讨论请见此处。洛伦兹群的 \( 4 \times 4 \) 实矩阵作用在 \( \mathbb{R}^{1,3} \) 上，由六个矩阵 \( \{M^{\mu \nu}\} \) 生成，组件为： \[ (M^{\mu \nu})^{\rho}{}_{\sigma} = \eta^{\mu \rho} \delta^{\nu}{}_{\sigma} - \eta^{\nu \rho} \delta^{\mu}{}_{\sigma}.~ \] 当 \( \rho, \sigma \) 的指标被升降时，这些矩阵只是反对称矩阵的 “标准基”。

　　这些矩阵满足洛伦兹代数的交换关系： \[ [M^{\mu \nu}, M^{\rho \sigma}] = M^{\mu \sigma} \eta^{\nu \rho} - M^{\nu \sigma} \eta^{\mu \rho} + M^{\nu \rho} \eta^{\mu \sigma} - M^{\mu \rho} \eta^{\nu \sigma}.~ \] 在狄拉克代数的讨论中，还可以发现自旋生成元 \[ S^{\mu \nu} = \frac{1}{4} [\gamma^{\mu}, \gamma^{\nu}]~ \] 也满足洛伦兹代数的交换关系。

　　洛伦兹变换 \( \Lambda \) 可以写成： \[ \Lambda = \exp\left(\frac{1}{2} \omega_{\mu \nu} M^{\mu \nu}\right)~ \] 其中，组件 \( \omega_{\mu \nu} \) 在 \( \mu, \nu \) 上是反对称的。

　　对应于自旋空间的变换是： \[ S[\Lambda] = \exp\left(\frac{1}{2} \omega_{\mu \nu} S^{\mu \nu}\right).~ \] 这是一种符号上的滥用，但它是标准的。原因在于 \( S[\Lambda] \) 不是 \( \Lambda \) 的一个良定义的函数，因为有两组不同的组件 \( \omega_{\mu \nu} \)（等价的情况下）给出相同的 \( \Lambda \)，但得到不同的 \( S[\Lambda] \)。在实际操作中，我们通常隐含地选择其中的一组 \( \omega_{\mu \nu} \)，然后 \( S[\Lambda] \) 就可以在这个基础上得到良定义。

　　在洛伦兹变换下，狄拉克方程： \[ i \gamma^\mu \partial_\mu \psi(x) - m \psi(x) = 0~ \] 变为： \[ i \gamma^\mu \left( (\Lambda^{-1})_{\mu}{}^{\nu} \partial_\nu \right) S[\Lambda] \psi(\Lambda^{-1} x) - m S[\Lambda] \psi(\Lambda^{-1} x) = 0.~ \] 洛伦兹不变性证明的其余部分

　　将两边从左乘以 \( S^{-1}[\Lambda] \) 并将虚变量变回 \( x \) 后，得到： \[ S[\Lambda]^{-1} \gamma^\mu S[\Lambda] \left( (\Lambda^{-1})_{\mu}{}^{\nu} \partial_\nu \right) \psi(x) - m \psi(x) = 0.~ \] 如果能证明： \[ S[\Lambda]^{-1} \gamma^\mu S[\Lambda] (\Lambda^{-1})^{\nu}{}_{\mu} = \gamma^\nu,~ \] 或者等效地， \[ S[\Lambda]^{-1} \gamma^\mu S[\Lambda] = \Lambda^{\mu}{}_{\nu} \gamma^\nu,~ \] 则可以证明不变性。这通常在代数层面上证明最为简便。假设变换由无穷小分量 \( \omega_{\mu \nu} \) 参数化，那么在 \( \omega \) 的一阶近似下，左边得到： \[ \frac{1}{2} \omega_{\rho \sigma} (M^{\rho \sigma})^{\mu}{}_{\nu} \gamma^\nu,~ \] 而右边得到： \[ \left[ \frac{1}{2} \omega_{\rho \sigma} S^{\rho \sigma}, \gamma^\mu \right] = \frac{1}{2} \omega_{\rho \sigma} \left[ S^{\rho \sigma}, \gamma^\mu \right].~ \] 计算左边的对易子是一个标准的练习。通过将 \( M^{\rho \sigma} \) 写成分量形式，完成证明。

　　与洛伦兹不变性相关的是一个守恒的诺特电流，或者更确切地说，是一组守恒的诺特电流张量 \( ({\mathcal {J}}^{\rho \sigma})^{\mu} \)。类似地，由于方程在平移下不变，因此也存在一组守恒的诺特电流张量 \( T^{\mu \nu} \)，它可以被识别为理论的应力-能量张量。洛伦兹电流 \( ({\mathcal {J}}^{\rho \sigma})^{\mu} \) 可以通过应力-能量张量以及一个表示内禀角动量的张量来表示。

　　 关于狄拉克方程的洛伦兹协变性进一步讨论

　　狄拉克方程是洛伦兹协变的。阐明这一点有助于理解狄拉克方程，同时也有助于理解马约拉纳自旋子（Majorana spinor）和埃尔科自旋子（Elko spinor），虽然它们密切相关，但存在微妙且重要的差异。

　　理解洛伦兹协变性可以通过保持对过程几何性质的理解来简化。[14] 设 \( a \) 为时空流形中的一个固定点。这个点的位置可以在多个坐标系中表达。在物理文献中，这些坐标通常表示为 \( x \) 和 \( x' \)，理解为 \( x \) 和 \( x' \) 描述的是同一个点 \( a \)，但在不同的局部参考系中（即在一个小的时空区域内的参考系）。我们可以把 \( a \) 看作是拥有多个不同坐标系的 “纤维”。从几何角度来看，可以说时空可以被描述为一个纤维丛，特别地，它是帧丛（frame bundle）。同一纤维中两个点 \( x \) 和 \( x' \) 的差异是旋转和洛伦兹增强（Lorentz boost）的组合。选择一个坐标系就是在该丛上的（局部）截面。

　　与帧丛耦合的是第二个丛，称为自旋子丛（spinor bundle）。穿过自旋子丛的截面就是粒子场（在当前情况下是狄拉克自旋子）。自旋子纤维中的不同点对应于相同的物理对象（费米子），但在不同的洛伦兹框架中表示。显然，为了得到一致的结果，帧丛和自旋子丛必须以一致的方式联系在一起；从形式上讲，我们说自旋子丛是关联丛（associated bundle），它与一个主丛（在当前情况下是帧丛）关联。纤维上点之间的差异对应于系统的对称性。自旋子丛有两个不同的对称性生成元：总角动量和内禀角动量。它们都对应于洛伦兹变换，但以不同的方式。

　　这里的介绍遵循了 Itzykson 和 Zuber 的内容。[15] 它与 Bjorken 和 Drell 的介绍非常相似。[16] 在广义相对论的框架下，可以在 Weinberg 的著作中找到类似的推导。[17] 在这里，我们假设时空是平坦的，也就是说，我们的时空是闵可夫斯基空间。

　　在洛伦兹变换 \( x \mapsto x' \) 下，狄拉克自旋子变换为 \[ \psi'(x') = S \psi(x)~ \] 可以证明，\( S \) 的显式表达式为 \[ S = \exp \left( \frac{-i}{4} \omega^{\mu \nu} \sigma_{\mu \nu} \right)~ \] 其中，\( \omega^{\mu \nu} \) 参数化了洛伦兹变换，\( \sigma_{\mu \nu} \) 是六个 \( 4 \times 4 \) 矩阵，满足： \[ \sigma^{\mu \nu} = \frac{i}{2} [\gamma^\mu, \gamma^\nu]~ \] 这个矩阵可以解释为狄拉克场的内禀角动量。它之所以有这种解释，可以通过与洛伦兹变换生成元 \( J_{\mu \nu} \) 进行对比，后者的形式为 \[ J_{\mu \nu} = \frac{1}{2} \sigma_{\mu \nu} + i \left( x_\mu \partial_\nu - x_\nu \partial_\mu \right)~ \] 这个生成元可以解释为总角动量。它作用在自旋子场上，形式为 \[ \psi'(x) = \exp \left( \frac{-i}{2} \omega^{\mu \nu} J_{\mu \nu} \right) \psi(x)~ \] 请注意，以上公式中的 \( x \) 没有加上撇号：这是通过将 \( x \mapsto x' \) 变换后，得到自旋子 \( \psi(x) \mapsto \psi'(x) \)，然后返回到原始坐标系 \( x' \mapsto x \) 的结果。

　　上述内容的几何解释是：框架场是仿射的，没有优先的原点。生成元 \( J_{\mu \nu} \) 生成了该空间的对称性：它提供了一个固定点 \( x \) 的重新标定。生成元 \( \sigma_{\mu \nu} \) 则生成从纤维中的一个点到另一个点的运动：即从 \( x \mapsto x' \) 的运动，其中 \( x \) 和 \( x' \) 仍然对应于同一个时空点 \( a \)。这些可能晦涩的评论可以通过明确的代数推导加以阐明。

　　设 \( x' = \Lambda x \) 为洛伦兹变换。狄拉克方程为 \[ i\gamma^{\mu} \frac{\partial}{\partial x^{\mu}} \psi(x) - m \psi(x) = 0~ \] 如果狄拉克方程要保持协变性，则它在所有洛伦兹框架中应具有完全相同的形式： \[ i\gamma^{\mu} \frac{\partial}{\partial x^{\prime \mu}} \psi'(x') - m \psi'(x') = 0~ \] 两个自旋子 \( \psi \) 和 \( \psi' \) 应该描述同一个物理场，因此它们应该通过一个变换联系起来，该变换不会改变任何物理观测量（如电荷、电流、质量等）。该变换应该仅仅编码坐标框架的变化。可以证明，这样的变换是一个 \( 4 \times 4 \) 的单位矩阵。因此，可以假设这两个框架之间的关系可以写为 \[ \psi'(x') = S(\Lambda) \psi(x)~ \] 将其代入变换后的方程，结果是 \[ i\gamma^{\mu} \frac{\partial x^{\nu}}{\partial x^{\prime \mu}} \frac{\partial}{\partial x^{\nu}} S(\Lambda) \psi(x) - m S(\Lambda) \psi(x) = 0~ \] 通过洛伦兹变换相关的坐标满足： \[ \frac{\partial x^{\nu}}{\partial x^{\prime \mu}} = \left(\Lambda^{-1}\right)^{\nu}_{\mu}~ \] 如果满足 \[ S(\Lambda) \gamma^{\mu} S^{-1}(\Lambda) = \left(\Lambda^{-1}\right)^{\mu}_{\nu} \gamma^{\nu}~ \] 则恢复了原始的狄拉克方程。

　　通过考虑靠近恒等变换的洛伦兹变换的无穷小旋转，可以获得 \( S(\Lambda) \) 的显式表达式（与上面给出的表达式相同）： \[ \Lambda^\mu_{\nu} = g^\mu_{\nu} + \omega^\mu_{\nu}, \quad (\Lambda^{-1})^\mu_{\nu} = g^\mu_{\nu} - \omega^\mu_{\nu}~ \] 其中 \( g^\mu_{\nu} \) 是度量张量： \[ g^\mu_{\nu} = g^{\mu \nu'} g_{\nu' \nu} = \delta^\mu_{\nu}~ \] 且 \( \omega_{\mu \nu} = \omega^\alpha_\nu g_{\alpha \mu} \) 是反对称的。通过插入和计算，得到 \[ S(\Lambda) = I + \frac{-i}{4} \omega^{\mu \nu} \sigma_{\mu \nu} + \mathcal{O}(\Lambda^2)~ \] 这是 \( S \) 的（无穷小）形式，并且得到了关系 \[ \sigma^{\mu \nu} = \frac{i}{2} [\gamma^\mu, \gamma^\nu].~ \]

　　为了获得仿射的重新标定，写出 \[ \psi'(x') = \left(I + \frac{-i}{4} \omega^{\mu \nu} \sigma_{\mu \nu}\right) \psi(x)~ \] \[ = \left(I + \frac{-i}{4} \omega^{\mu \nu} \sigma_{\mu \nu}\right) \psi(x' + \omega^\mu_\nu x'^\nu)~ \] \[ = \left(I + \frac{-i}{4} \omega^{\mu \nu} \sigma_{\mu \nu} - x'_\mu \omega^{\mu \nu} \partial_\nu \right) \psi(x')~ \] \[ = \left(I + \frac{-i}{2} \omega^{\mu \nu} J_{\mu \nu} \right) \psi(x')~ \]

　　经过适当的反对称化后，得到前面提到的对称性生成元 \( J_{\mu \nu} \)。因此，\( J_{\mu \nu} \) 和 \( \sigma_{\mu \nu} \) 都可以被称为 “洛伦兹变换的生成元”，但有一个微妙的区别：第一个对应于仿射框架束上点的重新标定，它强制沿自旋束的纤维进行平移；而第二个对应于沿自旋束的纤维的平移（当做沿框架束的运动 \( x \mapsto x' \)，以及沿自旋束的运动 \( \psi \mapsto \psi' \)）。Weinberg 提出了更多的论据来阐明这些是总角动量和内在角动量的物理解释。[18]

7. 其他形式

　　狄拉克方程可以以多种方式表述。

弯曲时空

　　本文根据狭义相对论在平直时空中推导了狄拉克方程。也可以在弯曲时空中推导出狄拉克方程。

物理空间的代数

　　本文使用四维向量和薛定谔算符推导了狄拉克方程。在物理空间的代数中，狄拉克方程使用了实数上的克利福德代数，这是一种几何代数。

耦合的魏尔自旋子

　　如上所述，无质量的狄拉克方程立即简化为齐次的魏尔方程。通过使用伽马矩阵的手征表示，无质量方程也可以分解成一对耦合的非齐次魏尔方程，这些方程作用于原始四分量自旋子的第一个和最后一对指标，即 \(\psi = \begin{pmatrix} \psi_L \\ \psi_R \end{pmatrix}\) 其中 \(\psi_L\) 和 \(\psi_R\) 是各自的两分量魏尔自旋子。这是因为手征伽马矩阵的斜块形式意味着它们交换 \(\psi_L\) 和 \(\psi_R\)，并将二阶保利矩阵应用于每个自旋子： \[ \gamma^\mu \begin{pmatrix} \psi_L \\ \psi_R \end{pmatrix} = \begin{pmatrix} \sigma^\mu \psi_R \\ \overline{\sigma}^\mu \psi_L \end{pmatrix}~ \] 因此，狄拉克方程 \[ (i \gamma^\mu \partial_\mu - m) \begin{pmatrix} \psi_L \\ \psi_R \end{pmatrix} = 0~ \] 变为 \[ i \begin{pmatrix} \sigma^\mu \partial_\mu \psi_R \\ \overline{\sigma}^\mu \partial_\mu \psi_L \end{pmatrix} = m \begin{pmatrix} \psi_L \\ \psi_R \end{pmatrix}~ \] 这又等价于一对无质量左旋和右旋自旋子的非齐次魏尔方程，其中耦合强度与质量成正比： \[ i \sigma^\mu \partial_\mu \psi_R = m \psi_L~ \] \[ i \overline{\sigma}^\mu \partial_\mu \psi_L = m \psi_R~ \] 这一点被提出作为对 “颤动运动”（Zitterbewegung）的直观解释，因为这些无质量分量将以光速传播并朝相反方向运动，因为自旋的螺旋度是自旋沿运动方向的投影。在这里，“质量”\(m\) 的作用不是使速度小于光速，而是控制这些反转发生的平均速率；具体而言，这些反转可以被建模为泊松过程。[20]

8. \( U(1) \) 对称性

　　本节使用自然单位。耦合常数通常用 \( e \) 表示：这个参数也可以看作是电子电荷的模型。

矢量对称性

　　狄拉克方程和作用量具有 \( U(1) \) 对称性，其中场 \( \psi, \overline{\psi} \) 的变换形式为： \[ \psi(x) \mapsto e^{i\alpha} \psi(x), \quad \overline{\psi}(x) \mapsto e^{-i\alpha} \overline{\psi}(x).~ \] 这是一个全局对称性，称为 \( U(1) \) 矢量对称性（与 \( U(1) \) 轴对称性相对：见下文）。根据诺特定理，存在一个相应的守恒电流：这个电流之前已经提到过： \[ J^{\mu}(x) = \overline{\psi}(x) \gamma^{\mu} \psi(x).~ \]

规范化对称性

　　如果我们将由常数 \( \alpha \) 参数化的全局对称性提升为局部对称性，并用函数 \( \alpha : \mathbb{R}^{1,3} \to \mathbb{R} \) 或等效地 \( e^{i\alpha} : \mathbb{R}^{1,3} \to U(1) \) 来表示，狄拉克方程将不再保持不变：此时会有关于 \( \alpha(x) \) 的额外导数。

　　这个问题的解决方法类似于标量电动力学：将偏导数提升为协变导数 \( D_{\mu} \)： \[ D_{\mu} \psi = \partial_{\mu} \psi + ieA_{\mu} \psi, \quad D_{\mu} \overline{\psi} = \partial_{\mu} \overline{\psi} - ieA_{\mu} \overline{\psi}.~ \] 其中 \( A_{\mu} \) 是电动力学中的四维势，也可以看作是 \( U(1) \) 规范场或 \( U(1) \) 连接。

　　在规范变换下，\( A_{\mu} \) 的变换法则为： \[ A_{\mu}(x) \mapsto A_{\mu}(x) + \frac{1}{e} \partial_{\mu} \alpha(x),~ \] 但是，也可以通过要求协变导数在规范变换下变换的方式得到： \[ D_{\mu} \psi(x) \mapsto e^{i\alpha(x)} D_{\mu} \psi(x), \quad D_{\mu} \overline{\psi}(x) \mapsto e^{-i\alpha(x)} D_{\mu} \overline{\psi}(x).~ \] 这样，我们通过将偏导数提升为协变导数，得到一个规范不变的狄拉克作用量： \[ S = \int d^4x \, \overline{\psi} \left( i D\!\!\!\!\big/ - m \right) \psi = \int d^4x \, \overline{\psi} \left( i \gamma^{\mu} D_{\mu} - m \right) \psi.~ \] 为了写出规范不变的拉格朗日量，最后一步是加入麦克斯韦拉格朗日项： \[ S_{\text{Maxwell}} = \int d^4x \, \left[ -\frac{1}{4} F^{\mu \nu} F_{\mu \nu} \right].~ \] 将这些结合在一起得到

　　 量子电动力学作用量 \[ S_{\text{QED}} = \int d^4x \, \left[-\frac{1}{4} F^{\mu \nu} F_{\mu \nu} + \overline{\psi} \left( iD\!\!\!\!\big/ - m \right) \psi \right]~ \] 展开协变导数后，作用量可以写成第二种有用的形式： \[ S_{\text{QED}} = \int d^4x \, \left[ -\frac{1}{4} F^{\mu \nu} F_{\mu \nu} + \overline{\psi} \left( i\partial \!\!\!{\big /} - m \right) \psi - e J^{\mu} A_{\mu} \right]~ \]

轴对称性

　　无质量的狄拉克费米子，即满足狄拉克方程且质量 \( m = 0 \) 的场 \(\psi(x)\)，拥有第二种不等价的 \( U(1) \) 对称性。

　　这一点可以通过将四分量的狄拉克费米子 \(\psi(x)\) 写成一对两分量的向量场来最直观地看到： \[ \psi(x) = \begin{pmatrix} \psi_1(x) \\ \psi_2(x) \end{pmatrix}~ \] 并采用伽马矩阵的手征表示，使得 \( i\gamma^\mu \partial_\mu \) 可以写成： \[ i\gamma^\mu \partial_\mu = \begin{pmatrix} 0 & i\sigma^\mu \partial_\mu \\ i\bar{\sigma}^\mu \partial_\mu & 0 \end{pmatrix}~ \] 其中，\(\sigma^\mu\) 的分量是 \((I_2, \sigma^i)\)，而 \(\bar{\sigma}^\mu\) 的分量是 \((I_2, -\sigma^i)\)。

　　于是，狄拉克作用量变为： \[ S = \int d^4x \, \left[ \psi_1^\dagger (i\sigma^\mu \partial_\mu) \psi_1 + \psi_2^\dagger (i\bar{\sigma}^\mu \partial_\mu) \psi_2 \right]~ \] 也就是说，它解耦成了两个 Weyl 自旋子或 Weyl 费米子的理论。

　　先前的矢量对称性依然存在，其中 \(\psi_1\) 和 \(\psi_2\) 同时旋转。这种作用量形式使得第二种不等价的 \( U(1) \) 对称性显现出来： \[ \psi_1(x) \mapsto e^{i\beta} \psi_1(x), \quad \psi_2(x) \mapsto e^{-i\beta} \psi_2(x)~ \] 这一变换也可以在狄拉克费米子的层次上表达为： \[ \psi(x) \mapsto \exp\left(i\beta \gamma^5\right) \psi(x)~ \] 其中 \(\exp\) 是矩阵的指数映射。

　　这并不是唯一可能的 \( U(1) \) 对称性，但它是常规的。矢量对称性与轴对称性的任意 “线性组合” 也是一种 \( U(1) \) 对称性。

　　在经典理论中，轴对称性允许有一个良好定义的规范理论。然而，在量子层面上，存在一个异常，也就是对规范化的障碍。

颜色对称性的扩展

　　我们可以将这个讨论从一个阿贝尔 \( U(1) \) 对称性扩展到一般的非阿贝尔对称性，使用一个规范群 \( G \)，即理论中的颜色对称群。

　　为了具体化，我们设定 \( G = \text{SU}(N) \)，即作用在 \( \mathbb{C}^N \) 上的特殊酉群。

　　在本节之前，\(\psi(x)\) 可以被视为一个闵可夫斯基空间中的自旋子场，换句话说，是一个函数： \[ \psi : \mathbb{R}^{1,3} \to \mathbb{C}^4~ \] 其在 \( \mathbb{C}^4 \) 中的分量由自旋指标标记，通常使用希腊字母（如 \( \alpha, \beta, \gamma, \dots \)）表示。

　　将该理论提升为规范理论后，非正式地说，\(\psi\) 获得了一个像 \( \mathbb{C}^N \) 一样变换的部分，并且这些部分由颜色指标标记，通常使用拉丁字母（如 \( i, j, k, \dots \)）表示。总的来说，\(\psi(x)\) 有 \( 4N \) 个分量，用指标表示为 \( \psi^{i,\alpha}(x) \)。这里，“自旋子” 标签仅指明了场在时空变换下的变换方式。

　　正式地说，\(\psi(x)\) 的值在一个张量积空间中，即它是一个函数：\(\psi : \mathbb{R}^{1,3} \to \mathbb{C}^4 \otimes \mathbb{C}^N\) 规范化过程类似于阿贝尔 \( U(1) \) 情况，但有所不同。在规范变换 \( U : \mathbb{R}^{1,3} \to \text{SU}(N) \) 下，自旋子场的变换为： \[ \psi(x) \mapsto U(x) \psi(x)~ \] 而共轭场 \( \bar{\psi}(x) \) 变换为： \[ \bar{\psi}(x) \mapsto \bar{\psi}(x) U^{\dagger}(x)~ \] 矩阵值的规范场 \( A_{\mu} \) 或 \( \text{SU}(N) \) 连接变换为： \[ A_{\mu}(x) \mapsto U(x) A_{\mu}(x) U(x)^{-1} + \frac{1}{g} (\partial_\mu U(x)) U(x)^{-1}~ \] 定义的协变导数变为： \[ D_{\mu} \psi = \partial_\mu \psi + ig A_{\mu} \psi~ \] \[ D_{\mu} \bar{\psi} = \partial_\mu \bar{\psi} - ig \bar{\psi} A_{\mu}^{\dagger}~ \] 它们在规范变换下变为： \[ D_{\mu} \psi(x) \mapsto U(x) D_{\mu} \psi(x)~ \] \[ D_{\mu} \bar{\psi}(x) \mapsto (D_{\mu} \bar{\psi}(x)) U(x)^{\dagger}~ \] 编写规范不变的作用量与 \( U(1) \) 情况完全相同，只是将麦克斯韦拉格朗日替换为杨-米尔斯拉格朗日： \[ S_{\text{Y-M}} = \int d^{4}x \, -\frac{1}{4} \text{Tr}(F^{\mu \nu} F_{\mu \nu})~ \] 其中，杨-米尔斯场强或曲率定义为： \[ F_{\mu \nu} = \partial_\mu A_\nu - \partial_\nu A_\mu - ig [A_\mu, A_\nu]~ \] 而 \([ \cdot , \cdot ]\) 是矩阵的对易子。

　　作用量为： \[ S_{\text{QCD}} = \int d^{4}x \, \left[ -\frac{1}{4} \text{Tr}(F^{\mu \nu} F_{\mu \nu}) + {\bar {\psi}} \, (iD\!\!\!\!{\big /} - m) \, \psi \right]~ \] 物理应用

　　对于物理应用，\( N = 3 \) 描述了标准模型中的夸克部分，模型化强相互作用。夸克被建模为狄拉克自旋子；规范场是胶子场。\( N = 2 \) 描述了标准模型中电弱部分的一部分。电子和中微子等轻子是狄拉克自旋子；规范场是 \( W \) 规范玻色子。

　　推广

　　这个表达式可以推广到任意李群 \( G \)，其中有连接 \( A_{\mu} \) 和表示 \( (\rho, G, V) \)，其中 \( \psi \) 的颜色部分取值于 \( V \)。形式上，狄拉克场是一个函数： \[ \psi : \mathbb{R}^{1,3} \to \mathbb{C}^4 \otimes V.~ \] 然后，\( \psi \) 在规范变换 \( g : \mathbb{R}^{1,3} \to G \) 下变换为： \[ \psi(x) \mapsto \rho(g(x)) \psi(x)~ \] 协变导数定义为： \[ D_{\mu} \psi = \partial_{\mu} \psi + \rho(A_{\mu}) \psi~ \] 这里我们将 \( \rho \) 看作李代数 \( \mathfrak{g} = \text{L}(G) \) 的表示，该李代数与 \( G \) 关联。

　　该理论可以推广到弯曲时空，但在一般时空（或更一般地，流形）上进行规范理论时会出现一些微妙之处，而在平坦时空下这些问题可以忽略。这最终是由于平坦时空的契约性，使我们能够将规范场和规范变换视为在 \( \mathbb{R}^{1,3} \) 上全局定义的。

9. 另见

关于狄拉克方程的文章：

狄拉克场
狄拉克自旋子
戈登分解
克莱因悖论
非线性狄拉克方程

其他方程

布雷特方程
狄拉克-凯勒方程
克莱因-戈登方程
拉里塔-施温格方程
双体狄拉克方程
韦尔方程
马约拉纳方程

其他主题

费米子场
费曼棋盘
福尔迪–沃图森变换
量子电动力学
量子色动力学
ELKO 理论

10. 参考文献

引用

P.W. Atkins (1974). *Quanta: A Handbook of Concepts*. Oxford University Press. p. 52. ISBN 978-0-19-855493-6.
Gorbar, Eduard V.; Miranskij, Vladimir A.; Shovkovy, Igor A.; Sukhachov, Pavlo O. (2021). *Electronic Properties of Dirac and Weyl Semimetals*. World Scientific Publishing. p. 1. ISBN 978-981-12-0736-5.
T. Hey, P. Walters (2009). *The New Quantum Universe*. Cambridge University Press. p. 228. ISBN 978-0-521-56457-1.
Zichichi, Antonino (2 March 2000). "Dirac, Einstein and Physics". *Physics World*. Retrieved 22 October 2023.
Han, Moo-Young (2014). *From Photons to Higgs: A Story of Light* (2nd ed.). World Scientific Publishing. p. 32. doi:10.1142/9071. ISBN 978-981-4579-95-7.
Gisela Dirac-Wahrenburg. "Paul Dirac". Dirac.ch. Retrieved 12 July 2013.
Pais, Abraham (2002). *Inward Bound: Of Matter and Forces in the Physical World* (Reprint ed.). Oxford: Clarendon Press [u.a.] ISBN 978-0-19-851997-3.
Dirac, Paul A.M. (1982) [1958]. *Principles of Quantum Mechanics*. International Series of Monographs on Physics (4th ed.). Oxford University Press. p. 255. ISBN 978-0-19-852011-5.
Duck, Ian; Sudarshan, E C G (1998). *Pauli and the Spin-Statistics Theorem*. WORLD SCIENTIFIC. doi:10.1142/3457. ISBN 978-981-02-3114-9.
Pendleton, Brian (2012–2013). *Quantum Theory* (PDF). section 4.3 "The Dirac Equation". Archived (PDF) from the original on 9 October 2022.
Ohlsson, Tommy (22 September 2011). *Relativistic Quantum Physics: From Advanced Quantum Mechanics to Introductory Quantum Field Theory*. Cambridge University Press. p. 86. ISBN 978-1-139-50432-4.
Penrose, Roger (2004). *The Road to Reality*. Jonathan Cape. p. 625. ISBN 0-224-04447-8.
Collas, Peter; Klein, David (2019). *The Dirac Equation in Curved Spacetime: A Guide for Calculations*. Springer. ISBN 978-3-030-14825-6.
Jost, Jurgen (2002). *Riemannian Geometry and Geometric Analysis* (3rd Edition). Springer Universitext. (See chapter 1 for spin structures and chapter 3 for connections on spin structures).
Itzykson, Claude; Zuber, Jean-Bernard (1980). *Quantum Field Theory*. McGraw-Hill. (See Chapter 2).
Bjorken, James D.; Drell, Sidney D. (1964). *Relativistic Quantum Mechanics*. McGraw-Hill. (See Chapter 2).
Weinberg, Steven (1972). *Gravitation and Cosmology: Principles and Applications of the General Theory of Relativity*. Wiley & Sons. (See chapter 12.5, "Tetrad Formalism", pages 367ff.).
Weinberg, Steven. *Gravitation*, op. cit. (See chapter 2.9, "Spin", pages 46-47).
Penrose, Roger (2004). *The Road to Reality* (Sixth Printing ed.). Alfred A. Knopf. pp. 628–632. ISBN 0-224-04447-8.
Gaveau, B.; Jacobson, T.; Kac, M.; Schulman, L. S. (30 July 1984). "Relativistic Extension of the Analogy Between Quantum Mechanics and Brownian Motion". *Physical Review Letters*. 53 (5): 419–422. Bibcode:1984PhRvL..53..419G. doi:10.1103/PhysRevLett.53.419.

精选论文

Anderson, Carl (1933). "The Positive Electron". *Physical Review*, 43 (6): 491. Bibcode:1933PhRv...43..491A. doi:10.1103/PhysRev.43.491.
Arminjon, M.; F. Reifler (2013). "Equivalent Forms of Dirac Equations in Curved Spacetimes and Generalized de Broglie Relations". *Brazilian Journal of Physics*, 43 (1–2): 64–77. arXiv:1103.3201. Bibcode:2013BrJPh..43...64A. doi:10.1007/s13538-012-0111-0. S2CID 38235437.
Dirac, P. A. M. (1928). "The Quantum Theory of the Electron" (PDF). *Proceedings of the Royal Society A: Mathematical, Physical and Engineering Sciences*, 117 (778): 610–624. Bibcode:1928RSPSA.117..610D. doi:10.1098/rspa.1928.0023. JSTOR 94981. Archived (PDF) from the original on 2 January 2015.
Dirac, P. A. M. (1930). "A Theory of Electrons and Protons". *Proceedings of the Royal Society A: Mathematical, Physical and Engineering Sciences*, 126 (801): 360–365. Bibcode:1930RSPSA.126..360D. doi:10.1098/rspa.1930.0013. JSTOR 95359.
Frisch, R.; Stern, O. (1933). "Über die magnetische Ablenkung von Wasserstoffmolekülen und das magnetische Moment des Protons. I". *Zeitschrift für Physik*, 85 (1–2): 4. Bibcode:1933ZPhy...85....4F. doi:10.1007/BF01330773. S2CID 120793548.

教材

Bjorken, J D; Drell, S (1964). *Relativistic Quantum Mechanics*. New York, McGraw-Hill.
Halzen, Francis; Martin, Alan (1984). *Quarks & Leptons: An Introductory Course in Modern Particle Physics*. John Wiley & Sons. ISBN 9780471887416.
Griffiths, D.J. (2008). *Introduction to Elementary Particles* (2nd ed.). Wiley-VCH. ISBN 978-3-527-40601-2.
Rae, Alastair I. M.; Jim Napolitano (2015). *Quantum Mechanics* (6th ed.). Routledge. ISBN 978-1482299182.
Schiff, L.I. (1968). *Quantum Mechanics* (3rd ed.). McGraw-Hill.
Shankar, R. (1994). *Principles of Quantum Mechanics* (2nd ed.). Plenum.
Thaller, B. (1992). *The Dirac Equation*. Texts and Monographs in Physics. Springer.

11. 外部链接

正电子的历史 1975 年 Dirac 的讲座
Dirac 方程 MathPages 上的 Dirac 方程
自旋 1/2 粒子的 Dirac 方程

致读者：小时百科一直以来坚持所有内容免费无广告，这导致我们处于严重的亏损状态。长此以往很可能会最终导致我们不得不选择大量广告以及内容付费等。因此，我们请求广大读者热心打赏 ，使网站得以健康发展。如果看到这条信息的每位读者能慷慨打赏 20 元，我们一周就能脱离亏损，并在接下来的一年里向所有读者继续免费提供优质内容。但遗憾的是只有不到 1% 的读者愿意捐款，他们的付出帮助了 99% 的读者免费获取知识，我们在此表示感谢。