贡献者: addis
狭义相对论有两个基本假设:
下文我们会详细解释它们的含义,注意这仅仅是两个假设,就像牛顿三定律一样。不幸的是由于技术限制我们并没有能力创造一个速度足够快的(例如光速的 5%)飞船在上面直接测量光速以及其他相对论实验,但我们有大量间接的方法可以实验验证。光速不变常被民间科学家用于攻击相对论,关于光速不变假设的历史背景和一些误解见 “光速不变假设的一些误解和历史”。
我们知道经典力学中速度是可以相加的,如果一个人在火车上向前射击,那么地面上看来子弹的速度等于火车的速度加上子弹相对枪口或者火车的速度。所以如果有人告诉你说子弹的速度无论相对于火车还是相对于地面都一样快,那你肯定会觉得他在胡说。而爱因斯坦提出的光速不变假设恰恰就是说无论使用哪个参考系(本文的参考系都是指惯性参考系,即满足牛顿第一定律的参考系),任何光相对于该参考系的速度都是一样的,无论这个光是从哪里发出如何发出的。可见狭义相对论推翻了经典力学的根基——时空观。但在讨论时空观之前我们要首先了解相对性原理。
什么是惯性参考系?不严谨地说,惯性参考系(简称惯性系)就是做匀速直线运动的参考系,也就是没有任何加速、减速、旋转等运动。任何惯性系相对其他惯性系也都做匀速直线运动。我们在考虑日常问题时,通常把地面近似为一个惯性系。虽然地球的自转和公转导致地面不可能是一个严格的惯性系,但由于这两个转动都比较缓慢,所以我们一般不会察觉到。在经典力学中,惯性系的定义是使牛顿第一定律成立的参考系。也就是说不受力(或者受外力之和为零)的物体在任何惯性系中都会沿直线做匀速运动或者静止不动。一个非惯性系的例子就是当车加速或转弯时,车内的人会明显感觉到受到了一个无形的惯性力,如果此时有一颗弹珠在车内的光滑桌面上静止或者运动,它不可能继续保持原先的速度大小和方向不变,这就说明牛顿第一定律在与车固定的参考系不成立,所以该参考系不是一个惯性系。所以显然惯性系和非惯性系是有明显的区别的,可以通过一些很简单的实验(例如弹珠)来把二者区分开。
相对性原理说的是,任何惯性系都是等价的。也就是说如果你在一个与外界隔绝的惯性系中做物理实验,你没有任何办法可以判断自己所处的是哪一个惯性系。事实上相对性原理的提出的远比狭义相对论要早,甚至比牛顿三定律(1687 发表于《自然哲学的数学原理》)要早。伽利略(G.Galilei)在 1632 年出版的《关于托勒密和哥白尼两大世界体系的对话》中作了如下的生动描述:
“船停着不动时,你留神观察,小虫都以等速向舱内各方向飞行,鱼向各个方向随便游动,水滴滴进下面的罐子中,你把任何东西扔给你的朋友时,只要距离相等,向这一方向不必比向另一方向用更多的力……。再使船以任何速度前进,只要运动是匀速的、也不忽左忽右地摆动,你将发现,所有上述现象丝毫没有变化,你也无法从其中任何一个现象来确定,船是在运动还是停着不动。……水滴将像先前一样,滴进下面的罐子,一滴也不会滴向船尾,虽然水滴在空中时,船已行驶了很多距离。……蝴蝶和苍蝇将继续随便地到处飞行,它们也绝不会向船尾集中,并不因为它们可能长时间留在空中,脱离了船的运动,为赶上船的运动显出累的样子。如果点香冒烟,则将看到烟像一朵云一样向上升起,不向任何一边移动。”
伽利略做的这个类比是为了解决当时日心说给人们带来的困惑。在伽利略和哥白尼的时代之前,人们认为大地是绝对静止不动的,日月星辰都相对大地在转动。相对于地面运动的物体如果没有力的维持,那么这种相对运动将很快消失,物体变为绝对静止。所以当听说地球在高速自转和公转时,许多人会奇怪为什么当我们跳起来的时候不会被快速移动的地面落下。所以在以上大船的例子中,伽利略想说明如果地球是那艘大船,那么身处船上的人无法凭船内的实验判断船是否在运动。
其实不允许观察其他参考系中静止的物体(上例中不允许观察船的外部)并不是相对性原理的什么先决条件。这只是为了让你放下固有成见的一个辅助办法而已。因为当你看到船外的陆地在运动时,你又会根据直觉想到是你在做 “绝对运动”,如果船把动力关掉又会 “绝对静止”。其实你完全可以认为是陆地和水在匀速运动而船是不动的——船的动力只是为了避免船被运动的海水拖拽走而已(就像你在跑步机上不用力就会被拖走),当船的动力停下来,他就真的被冲走了(和水一起运动了)。你可能很难这么去想,因为船太小了而周围的环境太大了,但谁说大小就决定了谁静止谁运动呢?如果把你的视野从地球放大到整个太阳系,如果相对于地球运动的船实际上恰好相对于太阳静止1,可能你会更容易把地球看作是运动的而船看作是不动的,也就不需要限制你观察的事物了。
既然相对性原理早已存在,那为什么狭义相对论又再次把它作为基本假设呢?这是因为在电磁学(也就是电动力学)发展起来之前,人们了解的物理定律仅限于牛顿力学。麦克斯韦通过以他命名的方程组求解出电磁波以及光速(也就是电磁波的速度)后,人们为了避免光速不变的 “谬论”,规定该方程组只能在某一个假想的惯性系中使用,也就是相对于以太静止的那个(详见 “光速不变假设的一些误解和历史”)。所以爱因斯坦在狭义相对论的相对性原理中主要是想强调麦克斯韦方程组并不是相对性原理的例外。为了区分,伽利略提出的相对性原理有时也叫力学相对性原理。
为了方便讨论时间的概念,我们不妨认为每个参考系中,空间中的每一点都挂满了和这个参考系相对静止的时钟,且这些时钟制作精良没有误差,不受外界因素干扰,也不取决于特定的原理(水滴、摆锤、电路等等)。经典力学的绝对时空观认为,我们可以一劳永逸地一次让这些钟全部彼此校准,那么它们就会永远保持绝对的同步,使得无论从什么角度来看,只要两个事件发生时,它们所在位置的时钟读数相同,那么这两个事件就是同时发生的,毫无歧义。
绝对的空间也可以类似理解。每个参考系中的长度都是一样的,火车上的一截棍子无论朝向如何,如果你在某个时刻把它贴近地面,同时把它的两端的位置在地面做一个标记,那么地面上这两个标记之间的长度测量出来也等于在火车上测量的棍子的长度。注意这个概念需要建立在上面对同时的定义的基础上。做这两个标记就可以看成两个事件,如果我们无法在所有参考系都对两个事件是否同时达成一致,那么我们也无法得出火车上测量的长度和地面上测量的一致。可见时间和空间的概念往往是纠缠在一起的,这也是为什么经常把它们统称为时空。
由于绝对时空观在相对论提出以前根深蒂固,所以在当时的人看来光速不变是荒谬的。因为速度的定义是绝对的距离除以绝对的时间间隔,那么在一段绝对的时间 $\Delta t = t_2 - t_1$ 内(上文的钟表读数相减),光在火车上走过的距离 $s_1$ 地上的人不会有歧义,而火车在这段时间内相对地面还走过了一段距离 $s_0$,那么由于地面上的距离可以相加(即使在狭义相对论中,同一个参考系中的距离也是可以相加的),所以光相对于地面走过的距离为 $s_2 = s_0 + s_1$,所以把 $s_1, s_2$ 分别除以时长 $\Delta t$,得到光相对于两个参考系的速度必定是不同的,任何物体的运动也都一样,光没有理由例外。
所以如果一定要假设光速不变,那么就必须要改变时空观。光并不特殊,它只是用于揭示时空性质的一个工具,如果有一个别的粒子以光速运动,那么它的速度同样不变。我们尽量保守地改变上面关于时空的假设,不多不少,直到新的时空观能容纳光速不变这个现象为止。首先是关于同时性的问题,在一个参考系中,我们如何确定两个不同位置的时钟同步呢?既然我们假设光速不变,那最直接的方法就是从这两个时钟的中点同时向它们各发射一道光,如果当光到达两个时钟时,它们的读数相同,那我们就说它们在当前参考系中同步。注意我们在使用文字时必须非常谨慎,因为我们在推翻根植于常识中的认知。我们还没开始讨论别的参考系中观察到的东西,所以要强调只是在当前参考系中同时。另外这个过程中我们还假设了同一个参考系中长度是绝对的,可以用一把尺子测量任何地方的长度,否则我们无法确定两个钟的中点在什么位置。
所以在同一个参考系中,相对论时空观和绝对时空观的区别并不大,处于不同位置的观察者仍然对两个事件的同时性和空间的长度么有任何争议。所以要建立相对时空观,我们需要从具有相对运动的不同参考系的观察者之间如何看待对方入手,所以还是回到火车的问题。注意即使在绝对时空观中,也不存在这两个参考系哪个更优越的问题——地面上的人可以认为自己静止火车在动,火车上的人也完全可以认为自己静止而火车外的所有物体都在运动(从太阳的参考系看地球也的确如此)。在相对论时空观中,我们已经知道两个参考系分别已经把属于自己的时钟都分别校准了,但还没有对不同参考系之间的时钟做出任何比较。
在进一步讨论之前,我们还要把事件这个概念也做一个抽象。在给定的参考系中,一个事件就可以抽象为一个空间位置和该位置的时钟的一个读数,例如使用三维直角坐标就有 $(x, y, z, t)$,也就是时间在四维时空中的坐标。本文只讨论一个直线方向上的运动,只需要一个空间坐标 $x$,所以给定参考系中一个事件可以简化为两个坐标 $(x, t)$。为了区分两个参考系,我们把火车参考系的时空坐标后面都加一撇,如 $(x', t')$ 而地面参考系的坐标则不加。
在绝对时空观中,同一个事件在不同的参考系中一般也会具有不同的空间坐标,但时间坐标是与参考系无关的,两个空间坐标之间的距离也与参考系无关。为了避免回到绝对时空观,我们需要假设同一事件在不同参考系中的每个坐标都可能是不同的,两个事件的各个坐标之间的差值也可能不同。
来看如何测量长度。如果要在地面参考系测量运动棍子的长度,那么可以把棍子贴近地面,然后地面上的观察者在同一时刻(使用地面的钟)在地面上标记棍子两端的位置。两个标记事件的时空坐标分别记为 $(x_1, t_1)$ 以及 $(x_2, t_2)$ 并有 $t_1 = t_2$,$x_2 > x_1$。那么测量的结果就是 $L = x_2 - x_1$。在火车参考系中,测量相对地面静止的棍子也可以用相同的方法。如果要在火车上测量静止的棍子的长度,那么可以直接把棍子两端在任意时刻的坐标相减即可,$L' = x_2' - x_1'$,因为棍子是静止的,两端的坐标不会随时间变化。
如果要测量一根静止在地面上的棍子的长度也同理,火车上的人必须用火车系的时钟同时标记棍子两端的位置,再把坐标相减,而地面上的人不需要同时测量直接相减即可。
现在回到测量速度的问题中。在两个参考系中测量任何物体(视为质点)匀速运动的速度都可以简化成测量两个事件,事件 1 是某时刻物体从某一点出发,用火车参考系的坐标记为 $(x_1', t_1')$,事件 2 是该物体做匀速运动一段时间后到达了空间中某个位置,记为 $(x_2', t_2')$。那么在火车中测量该物体的速度为
有一种低级的误解是,相对论的各种效应(例如尺缩短和钟变慢,见下文)是因为光从物体发出到传到观测者眼中需要一段时间,导致运动的物体看起来发生了某种扭曲。这是错误的。在讨论相对论时,为了避免歧义,规定每个观测者或者测量装置只能观测它所在的位置发生的事件而不能直接观测别处的事件。例如上面在测量运动棍子的长度时,我们不能在远方用一个相机直接拍摄棍子,而只能在地面装一排局部传感器,并把棍子无限贴近它们,当棍子的两个端点经过每个传感器,传感器就会记录下该事件的时空坐标 $(x_i, t_i)$。另外在比较不同参考系的两个时钟的读数时,也只能比较恰好经过同一位置的两个时钟,这点非常重要。
事实上我们可以假设每个参考系的空间中的每一点除了有一个固定的钟,还有一个固定的局部传感器,它只能记录它所在的位置发生的事件和时钟读数,即事件的时空坐标 $(x_i, t_i)$,而对别处发生的事件无能为力。除此之外它也可以在事件发生时与恰好经过该位置的,固定在其他参考系中的传感器交换坐标信息, 即得到同一事件在其他参考系的时空坐标 $(x_i', t_i')$。这些条件对理解下文的尺缩短和钟变慢至关重要。
要从光速不变的假设建立相对论时空观,就是在不同参考系中的时空坐标之间建立一种转换关系,使得无论两个事件的坐标怎么取都能满足光速不变条件。也就是无论光从什么位置发射,向什么方向发射,传播时间多长,都有 $v = v' = \pm c$。可以用数学证明对于任意给定的两个不同的惯性系,满足这个要求的变换是存在且唯一的,它有一个大名鼎鼎的名字叫做洛伦兹变换(Lorenz transform)。虽然我们可以给出详细的推导,但这有点超出了这篇科普对数学的要求。那么我们不妨在余下的篇幅对洛伦兹变换做一些半定量的描述。
洛伦兹变换其实就是中学数学的映射,把任何 $(x_i, t_i)$ 通过一组公式映射到 $(x_i', t_i')$。可以安全地假设这个映射是一对一映射的或者称为双射,不可能说一个参考系中两个不同的事件的坐标变换到另一个参考系中后具有相同的时空坐标(反之也不可能)。这是因为我们通常对两个点的接触事件不会发生歧义,不可能说在一个参考系中两个物体发生了接触另一个参考系中没有接触。例如一个坐在火车上的乘客用把笔尖伸出窗外不动,在火车匀速经过固定在地面的电线杆时,笔尖和电线杆发生了一瞬间的接触,那么任何参考系的人都会同意笔尖被接触和柱子被接触发生在同一位置以及同一时刻,可以认为是同一事件。
关于该映射的另一个假设是,两个惯性参考系看对方的相对速度没有歧义:它们等大,方向相反且恒定不变。也就是火车上任意标记一点,在地面参考系用式 2 测量出该点的速度都是一样的。同理在地面任意取一点,在火车参考系中用式 1 测速也会得到相同的速度大小,但方向相反。这其实使用了第一个基本假设,即两个惯性系是等价的,不可能我看你快你看我慢。
我们再来像子节 2 一样,把光相对于地面行走的距离划分为两部分,第一部分是火车相对地面的移动,第二部分是光相对火车的移动。所以我们假设我们事先在火车上标记了光的出发点,然后在地面参考系的 $t_2$ 时刻除了记录光的终点位置 $x_2$ 还记录下该标记在地面系的坐标 $x_a$。那么我们在地面参考系就可以定义第三个事件 $(x_a, t_a)$(其中 $t_a = t_2$),在火车参考系中的坐标照例记为 $(x_a', t_a')$(其中 $x_a' = x_1'$)。于是光在地面参考系走过的路程就可以拆分成火车的标记点在这段时间内走的路程 $x_a - x_1$ 以及从地面参考系看来光相对于火车的标记点多走的路程 $x_2 - x_a$。再次强调移动物体的长度必须同时测量,这就是规定 $t_a = t_2$ 的原因2。而火车上的时间也可以分为两个部分,即 $t_2' - t_1' = (t_2' - t_a') + (t_a' - t_1')$。注意虽然事件 $a$ 和 2 在地面参考系中同时,但在火车参考系却未必同时,所以不能假设 $t_2' - t_a' = 0$ 甚至暂时还不能确定它的正负(留到下文讨论)。
所以要让光速不变,就是要求下面关系成立3:
洛伦兹变换之所以可以满足式 3 ,是因为它有两个著名的效应:尺缩短和钟变慢。尺缩短效应使得火车上的一段车厢在地面上测量起来变短了(测量长度按照子节 5 的方法),或者说火车上测量的静止木棍的长度比地面上测量该木棍的长度要长,所以有
既然所有参考系都是等价的,那么从火车参考系来看,相对于地面静止的木棍和钟同样会有尺缩短和钟变慢效应。这乍看之下是矛盾的,它们怎么可能互相看对方的木棍都比自己的短,看对方的钟都比自己慢呢?如果在火车上放置一根木棍,在轨道旁放置一根同样长度的木棍,当它们经过彼此是不就可以比较哪个更长了吗?注意这里说的同样长度是指火车和地面各自测自己的静止木棍的结果,这样测出的长度叫做固有长度(proper length),而静止的钟的两个读数之差叫做固有时间(proper time)。笔者觉得翻译成固有时长会更合适,因为我们对时间的绝对读数没有兴趣,只对一段时间的长度有兴趣。
谷仓棍子佯谬(barn and pole paradox)所描述的基本就是上面把两把尺子比较的情景。这个佯谬描述一个运动的杆子和一个静止的谷仓,它们的固有长度相同。根据狭义相对论,当杆子匀速运动时,从谷仓的参考系看,杆子的长度会出现尺缩现象。这时,杆子足够短,可以让杆子进去后谷仓前后两扇门同时关闭再同时打开。然而从杆子的参考系看,谷仓是在高速运动的,因此谷仓的长度会出现尺缩,导致谷仓看上去更短。从这个角度看,杆子似乎太长而无法允许两扇门同时关闭。而解决的方法就是利用同时的相对性,在谷仓参考系来看同时关上再打开的两扇门,在杆子的参考系中实际上是先后关上打开的,这样一来就不会产生任何矛盾了。如果我们在两扇仓门上分别安装一个钟,并在谷仓的参考系使它们同步,那么谷仓参考系同时关门就意味着关门时两个钟的读数都相同。但从杆子参考系看来,虽然两扇门关闭时,门上的钟读数仍然相同,但是这两个钟却是不同步的,所以两次关门不同时。在杆子参考系的同一时刻,杆子进入的那扇门(前门)上的钟读数总是比出去时那扇门(后门)上钟的读数要大,这就导致后门关闭时前门仍然开着允许一段杆子留在外面,而后门打开让杆子出去一段后,前门的钟才走到该关门的读数。
还是回到火车的场景,为了对同时性如何转换有一个更好的了解,我们可以在地面参考系和火车参考系中各放置一排静止的钟,并且用本文开始给出的方法在两参考系钟各自进行校准。从上面的悖论可以知道(当然也可以从洛伦兹变换直接算出),地面参考系的观测者如果在某时刻给火车上的那排钟拍一张快照,那么越靠近车头方向的钟读数就越大。注意这里所说的拍快照只是一种习惯性的说法,根据子节 7 的规定,严谨的做法是给地面的每一个钟也安装一个局部传感器,每个传感器都在自己的钟达到某个读数时读取该位置处火车上的钟的读数,然后后期再把这些记录收集起来,绘制成一张 “快照”。同理,火车上的人如果给地面上的那排钟拍快照,会发现地面上的钟越靠近火车尾部的读数越大,因为地面是在朝火车尾部运动,两参考系都认为对方的钟沿前进方向读数越来越大。所以现在我们可以知道式 3 中的 $t_a' > t_2'$,因为 $x_2' > x_a' = x_1'$,也就是火车上的观察者认为地面先测量了光的终点位置再测量起点位置(“难怪他们觉得我们缩短了!”)。由此我们也可以得到,在一个参考系中(延运动方向)不同位置的 “同时” 在另一个参考系中必不同时。
所以回到火车和两根木棍的情景,如果两根木棍经过彼此时,火车上测量地面的木棍必须根据火车上的时钟同时测量其两端的坐标,而地面上的人看来,火车上的这两个测量并不是同时发生的,于是他们要用自己参考系的时钟重新测量两根木棍,测出的结果当然就不同了。
至于钟变慢,我们根据上文的定义,同样可以说明两个参考系中测量的是完全不同的东西。地面参考系上的人认为自己的钟都是同步的,而火车上的钟都不同步。所以地面上的观测者不能把火车上的一排钟和地面的一排钟直接比较,只能选定火车上的某个特定的钟进行观测,记录下它经过地面上每个钟时的事件坐标,从而得到这个钟走得比地面慢的结论。如果让火车上的人也把自己的某个钟和地面一排钟做对比,那么的确也能得到自己这个钟慢的结论。但对火车上的人来说,地面的那排钟并不是同步的,所以他们觉得这么对比的结果意义不大,他们也想要以自己的那排在他们看来同步的钟和地面的某一个钟对比,这样做也的确会得到地面的那个钟走得慢的结论。但由于现在两个参考系做的已经是不是同一个实验,互相觉得慢也就不矛盾了。
双生子佯谬(twin paradox)说,如果两个双胞胎中一个留在地面,另一个坐飞船去旅游一圈回来,那么当他们相见时坐飞船的双胞胎会发现自己比较年轻。这转换成我们上面的语言就是,如果出发时固定在飞船上的一个钟与地面的钟读数相同,那么两钟再次相遇时,飞船上的钟的读数会更小。事实上在以上的语境中是不能讨论双胞胎佯谬的,因为如果地面参考系是惯性系,而飞船有来有回,那么飞船参考系就不可能是也一个惯性系,所以两参考系的地位并不平等。事实上双胞胎佯谬是 “半个” 广义相对论问题4。广义相对论告诉我们,这个问题中地面参考系观测到的飞船中的钟变慢仍然可以用狭义相对论的方式去计算,但飞船参考系中观测到的地面上的钟却不能用狭义相对论。也就是这两个参考系并不是等价的,牛顿第一定律在地面系仍然成立(不受力的物体仍然匀速直线运动),但由于飞船需要转向或者变速,飞船中会出现可观测的惯性力。所以当两人再次相见时,他们一致同意坐飞船的那个比较年轻,不会得出互相觉得对方年轻的结论。从逻辑上这也不可能,因为上文已经说了同一位置的两个钟比较不会发生歧义。
为了加深理解,我们不妨在本文的火车的场景中设计一个双生子实验。如果地面和火车上各有一个双胞胎,且假设当他们相遇时确认了互相的年龄相同,那么火车行驶一段时间后应该如何比较双方年龄呢?稍加思考后我们会发现这是一个麻烦的问题,因为我们说了只能比较两参考系中同一位置的时间读数而不发生歧义,而当两人分离后火车就再也不会掉头,他们也就再也不可能相遇。那么虽然安装在铁轨上的传感器仍然可以不停地测量火车上的人经过时的年龄(反之也可以),但由于他们位置不同,无法对如何 “同时测量年龄” 这件事情达成一致。
那么他们能不能打个电话互相确认呢?这里就要引出狭义相对论的另一个结论:光速是信息传播速度的极限,所以无论他们的电话使用什么原理,都会有一定的延迟。如果他们的通话没有任何延迟,那么的确可以同时报一下年龄然后双方都达成一致。但这就违反了同时的相对性——他们不可能对如何 “同时报年龄” 达成一致!
1. ^ 当然这对普通的船不太可能。
2. ^ 但计算 $x_a-x_1$ 时并不需要令 $t_a = t_1$,这是因为这个减法不是在测量移动物体的长度,而是测量移动物体上同一点移动的距离,就像式 2 的分子那样。
3. ^ 当然我们也可以把式中的 $x_2' - x_1'$ 写成 $(x_2'-x_a') + (x_a'-x_1')$,但我们已经知道 $x_a'=x_1'$,所以就没必要了。$t_2-t_1$ 的拆分也同理。
4. ^ 虽然广义相对论学家可能会告诉你这本质上还是一个狭义相对论问题,但我劝你暂时只信一半。