贡献者: 零穹; addis
预备知识 作用量原理
[1] 本节将从作用量的视角介绍牛顿力学到相对论的自然过渡,最终给出适用于物质粒子和光的作用量。阅读本节需带着 “民主” 的思想:时间和空间、粒子和光应当被平等对待。
1. Newton 力学到狭义相对论
缘起
首先看 Newton 力学中物质粒子的 Euler-Lagrange 作用量:
\begin{equation}
S=\int \,\mathrm{d}{t} \left[\frac{1}{2}m \left( \frac{\mathrm{d}{ \boldsymbol{\mathbf{x}} }}{\mathrm{d}{t}} \right) ^2-V(x) \right] ~.
\end{equation}
这一作用量是相当 “笨重” 的。在这里,让我们只考虑自由粒子,把势 $V(x)$ 给丢掉。那么上式可写为
\begin{equation}
S=\int \,\mathrm{d}{t} \frac{1}{2}m \left( \frac{\mathrm{d}{ \boldsymbol{\mathbf{x}} }}{\mathrm{d}{t}} \right) ^2=m\int \,\mathrm{d}{t} \frac{( \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } )^2}{2 \,\mathrm{d}{t} }~.
\end{equation}
上式对待 $ \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } $ 和 $ \,\mathrm{d}{t} $ 的方式是不平等的,$ \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } $ 平方的出现来自于旋转不变性,但是为什么 $ \,\mathrm{d}{t} $ 只值得 1 次幂?多么奇怪的组合呀,$\frac{( \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } )^2}{ \,\mathrm{d}{t} }$,一个东西的平方除以另一个东西。这冒犯了我们自由主义的思想,因此,我们需要进行改变。
平方根
让我们回想一下初次学习平方根概念的情景。我们知道,25 的平方根是 5,36 的平方根是 6,等等。但是,对一个不是整数的平方的数,它的平方根是什么?比如 24。使用古老的试错方法:计算 $4.9^2,4.8^2,\ldots.$ 很快就能很好的估计这个平方根了。在学会了用字母代表数值的想法后,我们就可以得到我们想要的公式:
\begin{equation}
\sqrt{a^2-\epsilon^2}\approx a-\frac{\epsilon^2}{2a}+\cdots.~
\end{equation}
验证一下右边,$ \left(a-\frac{\epsilon^2}{2a} \right) ^2=a^2-\epsilon^2+\frac{\epsilon^4}{4a^2}$,即:
式 3 的误差是高阶的。
写出相对论的作用量
比较式 2 和式 3 ,我们改写式 3 为
$
\frac{\epsilon^2}{2a}\approx-\sqrt{a^2-\epsilon^2}+ a+\cdots
$。因此
\begin{equation}
\frac{( \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } )^2}{2 \,\mathrm{d}{t} }=c\frac{( \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } )^2}{2c \,\mathrm{d}{t} }\approx-c\sqrt{(c \,\mathrm{d}{t} )^2- \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } ^2}+c^2 \,\mathrm{d}{t} ~.
\end{equation}
上面第一个等式中添加 $c$ 是为了保持量纲一致,可知 $c$ 具有速度的量纲。注意到唯一具有本征意义的速度是光速,因此 $c$ 代表着光速。因此,我们将自由点粒子的作用量改写为
\begin{equation}
S=-mc\int \sqrt{(c \,\mathrm{d}{t} )^2- \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } ^2}+\int mc^2 \,\mathrm{d}{t} .~
\end{equation}
项 $\int mc^2 \,\mathrm{d}{t} =m c^2(t_{\mathrm{final}}-t_{\mathrm{intial}})$ 对待 $ \,\mathrm{d}{t} , \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } $ 的方式不一样,但幸运的是,它们的变分消失,因此作用量原理允许我们丢掉这一项。令 $c=1$,现在我们得到如下作用量
\begin{equation}
S=-m\int \sqrt{( \,\mathrm{d}{t} )^2- \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } ^2}.~
\end{equation}
这一作用量对待时间和空间的方式相当的 “民主”。然而,积分往往写为 $\int \,\mathrm{d}{t} $ 的形式,这很简单:
\begin{equation}
S=-m\int \,\mathrm{d}{t} \sqrt{1- \left( \frac{\mathrm{d}{ \boldsymbol{\mathbf{x}} }}{\mathrm{d}{t}} \right) ^2}.~
\end{equation}
这便得到了相对论自由粒子的作用量。
著名的公式
为了回到 Newton 力学,将式 7 展开
\begin{equation}
S=-m\int \,\mathrm{d}{t} \left\{\frac{m}{2} \left( \frac{\mathrm{d}{ \boldsymbol{\mathbf{x}} }}{\mathrm{d}{t}} \right) ^2-m+\cdots \right\} .~
\end{equation}
我们不知道如何结合势能,像
式 1 一样,仅仅在
式 6 中加入 $-\int \,\mathrm{d}{t} V(x)$,则会在此得到因子 $ \,\mathrm{d}{t} $。但若我们有
式 1 一样的势能,那么在非相对论极限
式 8 下,$m$ 应该归属于 $V(x)$ 中,即
式 8 中的项 $m$ 是一类特殊的势能项。这表明,即使是一个静止的粒子也有能量。若我们恢复 $c$,则
\begin{equation}
S=-mc\int \sqrt{(c \,\mathrm{d}{t} )^2- \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } ^2}=\int \,\mathrm{d}{t} \left\{\frac{m}{2} \left( \frac{\mathrm{d}{ \boldsymbol{\mathbf{x}} }}{\mathrm{d}{t}} \right) ^2-mc^2+\cdots \right\} .~
\end{equation}
因此,对静止的粒子,其具有能量
\begin{equation}
E=mc^2.~
\end{equation}
2. 更对称的形式
定义对角元为 $(-1,1,1,1)$ 的对角矩阵 $\eta_{\mu\nu}$,我们可将相对论自由粒子的作用量写为
\begin{equation}
S=-m\int \sqrt{-\eta_{\mu\nu} \,\mathrm{d}{x} ^\mu \,\mathrm{d}{x} ^\nu}.~
\end{equation}
注意到 $\eta_{\mu\nu} \,\mathrm{d}{x} ^\mu \,\mathrm{d}{x} ^\nu$ 是两邻近点的 Minkowskian 距离的平方,因此粒子的作用量(忽略整体常数因子)是它在时空中所穿越的距离。事实上,我们所能做出的坐标不变的量只能是代表粒子轨迹的世界线的 “长度” 或本征时间,即 $\int \,\mathrm{d}{\tau} =\int \sqrt{-\eta_{\mu\nu} \,\mathrm{d}{x} ^\mu \,\mathrm{d}{x} ^\nu}$。我们称比例因子是粒子的质量。因此,质量可定义为几何(世界线的长度)和物理(作用量)之间的转化因子。
需要注意的是,作用量式 11 中的记号 $x^\mu$ 代表的是粒子的时空坐标,而不是时空本身。这可以通过考虑多个粒子(用指标 $a$ 标记)的作用量看到:$S=-\sum_a m_a\int \sqrt{-\eta_{\mu\nu} \,\mathrm{d}{x} _a^\mu \,\mathrm{d}{x} _a^\nu}$。为了避免记号的混乱,更好的办法是用 $X^\mu$ 代表粒子的时空坐标,作用量则写为
\begin{equation}
S=-m\int \sqrt{-\eta_{\mu\nu} \,\mathrm{d}{X} ^\mu \,\mathrm{d}{X} ^\nu}.~
\end{equation}
3. 无质量粒子的作用量
由于作用量式 12 对无质量粒子恒为 0,因此对无质量粒子而言这一作用量是无效的。为了公平的对待粒子和光,我们只需要将式 12 改写为下面的形式
\begin{equation}
\tilde S=-\frac{1}{2}\int \,\mathrm{d}{\zeta} \left(\sigma(\zeta) \left( \frac{\mathrm{d}{X}}{\mathrm{d}{\zeta}} \right) ^2+\frac{m^2}{\sigma(\zeta)} \right) ~.
\end{equation}
其中,$ \left( \frac{\mathrm{d}{X}}{\mathrm{d}{\zeta}} \right) ^2=-\eta_{\mu\nu} \frac{\mathrm{d}{X^\mu}}{\mathrm{d}{\zeta}} \frac{\mathrm{d}{X^\nu}}{\mathrm{d}{\zeta}} $。这一作用量在 $m=0$ 时是有效的。因此我们,只需要验证
式 12 和
式 13 等价即可。注意
式 13 的动力学变量不光是 $X^\mu$,也包含 $\sigma(\zeta)$。而 $ \frac{\mathrm{d}{\sigma}}{\mathrm{d}{\zeta}} $ 不在作用量中出现,因此由 Euler-Lagrange 方程,得 $\sigma$ 满足方程
\begin{equation}
\frac{m^2}{\sigma(\zeta)^2}= \left( \frac{\mathrm{d}{X}}{\mathrm{d}{\zeta}} \right) ^2.~
\end{equation}
这是代数方程,不是微分方程。因此,$\sigma$ 并不具有动力学而仅仅与 $X^\mu(\zeta)$ 相结合。
利用
式 14 消去 $\tilde S$ 中的 $\sigma(\zeta)$,便回到了 $S$。因此,在产生粒子的运动方程的意义上,两作用量是等价的。
现在,令 $m=0$,就得到了无质量粒子适用的作用量
\begin{equation}
S_{\mathrm{massless}}=\frac{1}{2}\int \,\mathrm{d}{\zeta} \left(\sigma(\zeta)\eta_{\mu\nu} \frac{\mathrm{d}{X^\mu}}{\mathrm{d}{\zeta}} \frac{\mathrm{d}{X^\nu}}{\mathrm{d}{\zeta}} \right) .~
\end{equation}
对 $\sigma$ 变分,可以获得 $\eta_{\mu\nu} \frac{\mathrm{d}{X^\mu}}{\mathrm{d}{\zeta}} \frac{\mathrm{d}{X^\nu}}{\mathrm{d}{\zeta}} =0$。换句话说 $( \,\mathrm{d}{ \boldsymbol{\mathbf{X}} } )^2=( \,\mathrm{d}{X} ^0)^2$,即无质量粒子以光速运动。
[1] ^ A.Zee Einstein Gravity in a Nutshell