贡献者: 零穹
预备知识 作用量原理
[1] 本节将从作用量的视角介绍牛顿力学到相对论的自然过渡,最终给出适用于物质粒子和光的作用量。阅读本节需带着 “民主” 的思想:时间和空间、粒子和光应当被平等对待。
1. Newton 力学到狭义相对论
缘起
首先看 Newton 力学中物质粒子的 Euler-Lagrange 作用量:
\begin{equation}
S=\int \,\mathrm{d}{t} \left[\frac{1}{2}m \left( \frac{\mathrm{d}{ \boldsymbol{\mathbf{x}} }}{\mathrm{d}{t}} \right) ^2-V(x) \right] ~.
\end{equation}
这一作用量是相当 “笨重” 的。在这里,让我们只考虑自由粒子,把势 $V(x)$ 给丢掉。那么上式可写为
\begin{equation}
S=\int \,\mathrm{d}{t} \frac{1}{2}m \left( \frac{\mathrm{d}{ \boldsymbol{\mathbf{x}} }}{\mathrm{d}{t}} \right) ^2=m\int \,\mathrm{d}{t} \frac{( \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } )^2}{2 \,\mathrm{d}{t} }~.
\end{equation}
上式对待 $ \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } $ 和 $ \,\mathrm{d}{t} $ 的方式是不平等的,$ \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } $ 平方的出现来自于旋转不变性,但是为什么 $ \,\mathrm{d}{t} $ 只值得 1 次幂?多么奇怪的组合呀,$\frac{( \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } )^2}{ \,\mathrm{d}{t} }$,一个东西的平方除以另一个东西。这冒犯了我们自由主义的思想,因此,我们需要进行改变。
平方根
让我们回想一下初次学习平方根概念的情景。我们知道,25 的平方根是 5,36 的平方根是 6,等等。但是,对一个不是整数的平方的数,它的平方根是什么?比如 24。使用古老的试错方法:计算 $4.9^2,4.8^2,\ldots.$ 很快就能很好的估计这个平方根了。在学会了用字母代表数值的想法后,我们就可以得到我们想要的公式:
\begin{equation}
\sqrt{a^2-\epsilon^2}\approx a-\frac{\epsilon^2}{2a}+\cdots.~
\end{equation}
验证一下右边,$ \left(a-\frac{\epsilon^2}{2a} \right) ^2=a^2-\epsilon^2+\frac{\epsilon^4}{4a^2}$,即:
式 3 的误差是高阶的。
写出相对论的作用量
比较式 2 和式 3 ,我们改写式 3 为
$
\frac{\epsilon^2}{2a}\approx-\sqrt{a^2-\epsilon^2}+ a+\cdots
$。因此
\begin{equation}
\frac{( \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } )^2}{2 \,\mathrm{d}{t} }=c\frac{( \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } )^2}{2c \,\mathrm{d}{t} }\approx-c\sqrt{(c \,\mathrm{d}{t} )^2- \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } ^2}+c^2 \,\mathrm{d}{t} ~.
\end{equation}
上面第一个等式中添加 $c$ 是为了保持量纲一致,可知 $c$ 具有速度的量纲。注意到唯一具有本征意义的速度是光速,因此 $c$ 代表着光速。因此,我们将自由点粒子的作用量改写为
\begin{equation}
S=-mc\int \sqrt{(c \,\mathrm{d}{t} )^2- \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } ^2}+\int mc^2 \,\mathrm{d}{t} .~
\end{equation}
项 $\int mc^2 \,\mathrm{d}{t} =m c^2(t_{\mathrm{final}}-t_{\mathrm{intial}})$ 对待 $ \,\mathrm{d}{t} , \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } $ 的方式不一样,但幸运的是,它们的变分消失,因此作用量原理允许我们丢掉这一项。令 $c=1$,现在我们得到如下作用量
\begin{equation}
S=-m\int \sqrt{( \,\mathrm{d}{t} )^2- \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } ^2}.~
\end{equation}
这一作用量对待时间和空间的方式相当的 “民主”。然而,积分往往写为 $\int \,\mathrm{d}{t} $ 的形式,这很简单:
\begin{equation}
S=-m\int \,\mathrm{d}{t} \sqrt{1- \left( \frac{\mathrm{d}{ \boldsymbol{\mathbf{x}} }}{\mathrm{d}{t}} \right) ^2}.~
\end{equation}
这便得到了相对论自由粒子的作用量。
著名的公式
为了回到 Newton 力学,将式 7 展开
\begin{equation}
S=-m\int \,\mathrm{d}{t} \left\{\frac{m}{2} \left( \frac{\mathrm{d}{ \boldsymbol{\mathbf{x}} }}{\mathrm{d}{t}} \right) ^2-m+\cdots \right\} .~
\end{equation}
我们不知道如何结合势能,像
式 1 一样,仅仅在
式 6 中加入 $-\int \,\mathrm{d}{t} V(x)$,则会在此得到因子 $ \,\mathrm{d}{t} $。但若我们有
式 1 一样的势能,那么在非相对论极限
式 8 下,$m$ 应该归属于 $V(x)$ 中,即
式 8 中的项 $m$ 是一类特殊的势能项。这表明,即使是一个静止的粒子也有能量。若我们恢复 $c$,则
\begin{equation}
S=-mc\int \sqrt{(c \,\mathrm{d}{t} )^2- \,\mathrm{d}{ \boldsymbol{\mathbf{x}} } ^2}=\int \,\mathrm{d}{t} \left\{\frac{m}{2} \left( \frac{\mathrm{d}{ \boldsymbol{\mathbf{x}} }}{\mathrm{d}{t}} \right) ^2-mc^2+\cdots \right\} .~
\end{equation}
因此,对静止的粒子,其具有能量
\begin{equation}
E=mc^2.~
\end{equation}
2. 更对称的形式
定义对角元为 $(-1,1,1,1)$ 的对角矩阵 $\eta_{\mu\nu}$,我们可将相对论自由粒子的作用量写为
\begin{equation}
S=-m\int \sqrt{-\eta_{\mu\nu} \,\mathrm{d}{x} ^\mu \,\mathrm{d}{x} ^\nu}.~
\end{equation}
注意到 $\eta_{\mu\nu} \,\mathrm{d}{x} ^\mu \,\mathrm{d}{x} ^\nu$ 是两邻近点的 Minkowskian 距离的平方,因此粒子的作用量(忽略整体常数因子)是它在时空中所穿越的距离。事实上,我们所能做出的坐标不变的量只能是代表粒子轨迹的世界线的 “长度” 或本征时间,即 $\int \,\mathrm{d}{\tau} =\int \sqrt{-\eta_{\mu\nu} \,\mathrm{d}{x} ^\mu \,\mathrm{d}{x} ^\nu}$。我们称比例因子是粒子的质量。因此,质量可定义为几何(世界线的长度)和物理(作用量)之间的转化因子。
需要注意的是,作用量式 11 中的记号 $x^\mu$ 代表的是粒子的时空坐标,而不是时空本身。这可以通过考虑多个粒子(用指标 $a$ 标记)的作用量看到:$S=-\sum_a m_a\int \sqrt{-\eta_{\mu\nu} \,\mathrm{d}{x} _a^\mu \,\mathrm{d}{x} _a^\nu}$。为了避免记号的混乱,更好的办法是用 $X^\mu$ 代表粒子的时空坐标,作用量则写为
\begin{equation}
S=-m\int \sqrt{-\eta_{\mu\nu} \,\mathrm{d}{X} ^\mu \,\mathrm{d}{X} ^\nu}.~
\end{equation}
3. 无质量粒子的作用量
由于作用量式 12 对无质量粒子恒为 0,因此对无质量粒子而言这一作用量是无效的。为了公平的对待粒子和光,我们只需要将式 12 改写为下面的形式
\begin{equation}
\tilde S=-\frac{1}{2}\int \,\mathrm{d}{\zeta} \left(\sigma(\zeta) \left( \frac{\mathrm{d}{X}}{\mathrm{d}{\zeta}} \right) ^2+\frac{m^2}{\sigma(\zeta)} \right) ~.
\end{equation}
其中,$ \left( \frac{\mathrm{d}{X}}{\mathrm{d}{\zeta}} \right) ^2=-\eta_{\mu\nu} \frac{\mathrm{d}{X^\mu}}{\mathrm{d}{\zeta}} \frac{\mathrm{d}{X^\nu}}{\mathrm{d}{\zeta}} $。这一作用量在 $m=0$ 时是有效的。因此我们,只需要验证
式 12 和
式 13 等价即可。注意
式 13 的动力学变量不光是 $X^\mu$,也包含 $\sigma(\zeta)$。而 $ \frac{\mathrm{d}{\sigma}}{\mathrm{d}{\zeta}} $ 不在作用量中出现,因此由 Euler-Lagrange 方程,得 $\sigma$ 满足方程
\begin{equation}
\frac{m^2}{\sigma(\zeta)^2}= \left( \frac{\mathrm{d}{X}}{\mathrm{d}{\zeta}} \right) ^2.~
\end{equation}
这是代数方程,不是微分方程。因此,$\sigma$ 并不具有动力学而仅仅与 $X^\mu(\zeta)$ 相结合。
利用
式 14 消去 $\tilde S$ 中的 $\sigma(\zeta)$,便回到了 $S$。因此,在产生粒子的运动方程的意义上,两作用量是等价的。
现在,令 $m=0$,就得到了无质量粒子适用的作用量
\begin{equation}
S_{\mathrm{massless}}=\frac{1}{2}\int \,\mathrm{d}{\zeta} \left(\sigma(\zeta)\eta_{\mu\nu} \frac{\mathrm{d}{X^\mu}}{\mathrm{d}{\zeta}} \frac{\mathrm{d}{X^\nu}}{\mathrm{d}{\zeta}} \right) .~
\end{equation}
对 $\sigma$ 变分,可以获得 $\eta_{\mu\nu} \frac{\mathrm{d}{X^\mu}}{\mathrm{d}{\zeta}} \frac{\mathrm{d}{X^\nu}}{\mathrm{d}{\zeta}} =0$。换句话说 $( \,\mathrm{d}{ \boldsymbol{\mathbf{X}} } )^2=( \,\mathrm{d}{X} ^0)^2$,即无质量粒子以光速运动。
[1] ^ A.Zee Einstein Gravity in a Nutshell
致读者: 小时百科一直以来坚持所有内容免费无广告,这导致我们处于严重的亏损状态。 长此以往很可能会最终导致我们不得不选择大量广告以及内容付费等。 因此,我们请求广大读者
热心打赏 ,使网站得以健康发展。 如果看到这条信息的每位读者能慷慨打赏 20 元,我们一周就能脱离亏损, 并在接下来的一年里向所有读者继续免费提供优质内容。 但遗憾的是只有不到 1% 的读者愿意捐款, 他们的付出帮助了 99% 的读者免费获取知识, 我们在此表示感谢。