量子力学

Prerequisite　动量和能量

　　我们试图在科普部分以通俗易懂的语言简单介绍量子力学的基本假设，有了这些基本假设，一切其他结论都可以被推导出来．注意这里介绍的是非相对论量子力学，只适用于低速微观粒子．另外量子力学中有不同的诠释，本书使用常见的哥本哈根诠释．

波函数

Fig. 1：蓝线是一维波函数/绳子的形状，橙线是振幅．某个位置的振幅越大，粒子就越有可能出现在该位置（与振幅平方成正比）．图中的形状叫做波包，一般来说波函数可以是几乎任何形状．

　　这里只讨论一维的情况，即粒子沿直线运动．经典力学中用位置关于时间的函数 $x(t)$ 描述一个粒子的运动，而量子力学中用波函数描述．波函数是一个关于位置和时间的函数，一般记为 $\Psi(x, t)$，例如一条紧绷的橡皮绳（或弦）上的波动，绳子的高度 $y$ 是关于位置 $x$ 和时间 $t$ 的函数¹．某个位置振动的幅度的平方就是粒子在这个位置出现的概率²．经典力学中，给出粒子初始的位置和速度和势能，它将按照牛顿第二定律运动．量子力学中，给出粒子的初始波函数，波函数将按照含时薛定谔方程变化，把势能和某个时刻的波函数代入薛定谔方程，就可以解出任意时刻的波函数（这类方程并不是数的方程，而是函数的方程，所以解出的是函数，而不是数）．薛定谔方程是量子力学的公设之一，就像牛顿三定律是牛顿力学的公设．

　　量子力学用波函数表示粒子的状态是因为许多实验发现微观粒子（如电子，质子，中子）在运动时具有一些经典物理中波的性质（例如声波，水波，光波），这就是著名的波粒二象性．

波包

　　即使粒子的位置一般不能精确确定，我们往往也能确定其大致范围（例如实验物理学家往往知道某粒子在实验室而不在月球），所以波函数往往只有在一定范围内不为零（我们只能在一定空间范围内测到检测到粒子）．将振幅关于位置的函数画出来，其形状往往像一个包（越靠近中间，检测到粒子的概率越大），我们称为波包（fig. 1 ）．

自由粒子

Fig. 2：对应自由粒子的波包．注意图中波包仅画出了fig. 1 中的振幅，没画出波函数．

　　先看不受力的粒子（叫自由粒子），在经典力学中，粒子不受力时静止或者做匀速运动．量子力学中，若粒子不受力（势能处处为常数）且初始时波函数为波包且具有初速度，波包中心就会匀速运动，但同时波包会扩散（越变越宽，越变越矮）．想象一根紧绷的绳子的一端突然迅速上下抖了几下又停下来，那么将产生一个波包将从绳的一段传到另一端（不同的是绳子上的波包形状不会变化）．如果波包开始是静止，那么波包只会在原地扩散（这也与绳子的运动方式不同）³．

　　在一般问题中，波包的长度非常小（原子尺度）．当我们回到宏观中，波包的大小就可以忽略不计，把波包近似成质点，那波包的位置就是质点的位置，速度就是质点的速度，这样就得到了匀速运动的宏观质点．

一维势能

　　以下通过几个例子来定性说明在一些特定势能曲线下粒子如何运动（即非自由粒子）．

散射

Fig. 3：波包遇到方势垒后的散射．

　　经典力学中，若粒子匀速入射到如fig. 3 所示的势能 $V(x)$（叫做势垒）上，如果粒子的初始动能小于势垒的最大值，则粒子将会原路返回，若粒子初始动能大于势垒的最大值，则粒子将继续前进．在量子力学中，无论波包以什么初速度入射，波包都会被分为两个不同方向运动的波包，但两个波包的相对大小取决于初始波包的形状和动能．定性来说，入射波包的能量越大，粒子就越有可能穿过势垒，所以向右运动的波包就相对越大．反之，如果入射波包的能量越小，粒子就越有可能被反弹，所以向左运动的波包就越大．

　　这个问题中最不可思议的地方在于当粒子的初始动能小于势垒的最大值时，它仍会有一定的概率穿过势垒，这在经典力学中时不可能的．顾名思义，我们把这种量子力学中特有的现象叫做隧道效应．隧道效应带给我们的一个显而易见的疑惑是：如果我们在势垒内部检测到粒子，那它的动能岂不是小于零？如果再求速度或动量（需要开方），岂不是会得到虚数？毫无疑问，虚数是没有物理意义的，但思考一下可以发现在这个问题隐藏了一个假设就是我们可以同时准确地测量粒子的位置和动能，也就是同时准确测量位置和动量．而根据下面将要介绍的不确定性原理，这是不可能的．

　　定性来说，粒子进入或穿过势垒的概率与两个因素有关：势垒的高度和宽度．势垒比动能大得越多，概率就越小，势垒越宽，概率也越小（波函数的振幅呈指数下降）．

有限深势阱

　　经典力学中的有限深势阱见 “动量和能量”．在量子力学中，被困在势阱中的波包在有限深势阱中同样一边来回碰撞一边扩散．但由于隧道效应，波函数会稍微渗透到势阱的外部

　　对经典的粒子（经典力学中的粒子）来说，当粒子被困在势阱内时，两种势阱带来的效果是一样的．

未完成：无限深势阱并没有提到！

波的叠加

　　为什么要用波函数来描述粒子？因为波的一个重要特点就是具有空间分布且可以叠加．如果一个波包 $\Psi_1(x, t)$ 是薛定谔方程的解，且另一个波包 $\Psi_2(x, t)$ 也是薛定谔方程的解，那这两个波包叠加（即把两个波函数相加）后 $\Psi(x, t) = \Psi_1(x, t) + \Psi_2(x, t)$ 仍然是薛定谔方程的解．例如，两个不同方向运动的波包相遇然后远离．注意这里两个波包并不代表两个粒子，而是代表一个粒子有可能在一个波包的位置被观测到也有可能在另一个波包的位置被观测到．

　　另一个关于波的可叠加性的经典实验就是双缝干涉，当两个点状波源各自发出相同频率的圆形波时，在远处放一个观测屏，就可以观测到干涉条纹（见fig. 4 和fig. 5 ）．这类干涉现象在量子物理被发现很久以前就已经有了详细的研究．然而当物质波的概念提出后，物理学家竟然也观测到了微观粒子产生的干涉（如电子的双缝干涉），进而产生了类似波函数和波动方程（即薛定谔方程）这类的数学工具．

Fig. 4：水波的干涉

Fig. 5：光波的干涉

能量本征态

　　在经典力学中，要测量一个粒子的能量，我们只需要先观测其速度，则能量等于动能（$mv^2/2$）加上该位置的势能．量子力学中，测量波包的能量会得到什么结果呢？这时候我们需要薛定谔方程的另一个用途：对某个势能，我们能解出一些（往往是无穷多个）特殊的波函数，称为能量的本征函数或者本征态．这些波函数特殊在哪里呢？一般来说，我们对一个粒子测某个物理量（位置，动量，能量），测得的值都是不确定的（这与仪器的误差无关，而是本质上的不确定），但如果粒子的波函数恰好是一个能量本征态，那么测量其能量会得到唯一确定的值（先不讨论用什么方法测）叫能量的本征值．每个本征态对应唯一一个本征值．

　　要测量任意波包（波函数）的能量，我们可以想办法用不同的能量本征态叠加来凑出所需波函数，例如第一个本征态乘以常数 $C_1$ 加上第二个本征态乘以常数 $C_2$ 等，这叫波函数的线性叠加．如果对这个波包测量能量，测到第 $i$ 个能量本征值的概率等于 $ \left\lvert C_i \right\rvert ^2$（之前提到波函数一般是复数，这里的系数事实上也同样是复数，而这里的绝对值符号代表复数的模长）．也就是说，某个能量本征态占总波函数的比例越多，越有可能测出对应的能量本征值．

Fig. 6：无限深势阱的一些波函数能量本征态，每个能量 $E_i$ 叫做一个能级，共有无穷多个能级，将这些本征态叠加就能获得任何波函数例如波包．

测量理论

　　我们介绍量子力学的另一组重要公设：这里将其统称为测量理论．这里的测量是一个抽象的概念，我们先不讨论用什么仪器进行测量，也不讨论现实中这种测量可不可行，只是假设存在 “ 测量某个物理量” 这种操作．

　　上面介绍的能量测量的步骤就是测量理论的一个特例．量子力学中的任何物理量的测量都可以由类似的方法求出，只是不同的物理量都有各自的一组本征态，可以通过物理量对应的本征方程求出．以下我们先不讨论如何列出本征方程以及解出本征态，而是直接给出本征态．如果要对一个粒子测量某物理量，就先计算出这个物理量的各个本征态，再计算它们占波包的比例 $C_i$，测量到第 $i$ 个本征值的可能性就是 $ \left\lvert C_i \right\rvert ^2$．

　　这里有一个条件是任何可能存在的波包都可以由任何测量量的本征态叠加而成，这叫做本征态的完备性．

Example 1　位置和动量的本征态

　　位置的本征态是一个无穷窄无限高的波包，称为 $\delta$ 函数．$\delta$ 函数描述的粒子只可能出现在某点．

Fig. 7：$\delta$ 函数示意图．注意其宽度为无穷窄．$\delta(x)$ 的中心在坐标原点，如果需要任意 $x_0$ 处的 $\delta$ 函数，可以使用 $\delta(x - x_0)$．

　　动量的本征态是一个无限长的波，即某个频率的 $\sin$ 函数，称为平面波（区别于波包），见fig. 8 ．在量子力学中，波也叫德布罗意波．

Fig. 8：一维平面波 $ \sin\left(kx\right) $，由负无穷延伸至正无穷．

　　注意图中画出的是波动关于位置 $x$ 的函数，而不是关于时间 $t$ 的函数，所以我们把 $k$ 叫做空间频率⁴（或者波数），与波长⁵（即空间周期）$\lambda$ 的关系是 $k = 2\pi/\lambda$．动量的本征值为

\begin{equation} p = \hbar k = \frac{h}{\lambda} \end{equation}

其中 $\hbar = h / (2\pi)$ 是约化普朗克常数，$h$ 是普朗克常数．所以和空间频率成正比，和波长成反比．

测量改变粒子状态

　　在经典力学中，我们完全可以假设测量不会对粒子的状态产生影响（例如给粒子拍照不会改变它的运动状态）．而在量子力学中，由于考虑的粒子质量非常小，测量会不可避免地改变粒子的状态．

　　测量理论假设，在对某个物理量进行测量后，如果得到第 $i$ 个本征值，粒子的状态会立即坍缩为这个本征值对应的本征态，然后继续按照薛定谔方程演化．

　　那么我们应该如何理解测到某个本征值的概率 $ \left\lvert C_i \right\rvert ^2$ 呢？这里显然不是指对处于某状态的粒子连续测量 $N$ 次，就大概有 $ \left\lvert C_i \right\rvert ^2 N$ 次会测到本征值．因为由于测量带来的坍缩，只有第一次测量的概率是 $ \left\lvert C_i \right\rvert ^2$，之后由于波函数会坍缩到第 $i$ 个本征态并继续按薛定谔方程继续演化，再次测量时，我们就要根据新的波函数重新计算每个 $C_i$，而不是使用第一次测量前波函数．

　　正确的理解应该是，如果我们有 $N$ 个处于同样状态（具有相同波函数）的相同粒子，对这些粒子进行测量，大概会有 $ \left\lvert C_i \right\rvert ^2 N$ 个次测量得到第 $i$ 个本征值．或者是，我们把同一个粒子测量 $N$ 次，但每次测量后都进行某种操作，将其恢复到测量前的状态，再进行下一次测量．

　　这就意味着，除非粒子在测量前就已经处于该本征态，测量操作必定会改变粒子的状态．例如粒子的波函数如为fig. 1 中的波包，当我们测量其位置，如果得到的值为 $x_0$，那么波函数将会马上变为 $x_0$ 处的一个无限窄的波包（$\delta$ 函数）．

连续本征值与离散本征值

　　上面我们提到一个物理量往往有无穷多个本征波函数．一些情况下我们求出的本征波函数对应的值是不连续的（如无限深势阱中的能量本征态），而另一些情况下则是连续的（如位置和动量的本征值总是连续的，即它们可以取任意实数）．经典物理世界中这些物理量都是连续的，而量子中的物理量会出现离散的情况，这就是量子这个词的来源（表示一份一份的）．

　　离散本征值的情况在数学上是容易处理的，我们上面使用的符号 $C_i$ 就是假设了本征值是离散的（因为这里 $i$ 是整数），连续的情况有类似的理解，但数学形式有所不同（比如求和变为积分）．我们这里再举一个例子．

Example 2　角动量

　　量子力学中，另一个著名的具有离散本征值的物理量就是角动量．例如一个电子围绕固定的原子核旋转，它就可能具任意方向的角动量．注意这是一个三维空间中的问题，在直角坐标系中，我们可以将角动量的三个分量看作三个不同的物理量分别为 $L_x$，$L_y$ 和 $L_z$．为了简单起见我们假设这三个量各自只有两个本征值，即⁶ $L_x = -1/2$ 或 $+1/2$，$L_y = -1/2$ 或 $+1/2$，$L_z = -1/2$ 或 $+1/2$．对应的 6 个状态记为⁷ $ \left\lvert x- \right\rangle $，$ \left\lvert x+ \right\rangle $， $ \left\lvert y- \right\rangle $，$ \left\lvert y+ \right\rangle $， $ \left\lvert z- \right\rangle $，$ \left\lvert z+ \right\rangle $．三维空间中的波函数具有 $\Psi(x, y, z, t)$ 的形式，由于波函数的数学形式比较复杂，这里不具体给出．

　　为了简单起见，我们下面只讨论 $x$ 和 $z$ 两个方向．$L_x$ 本征态与 $L_z$ 本征态之间的关系为

\begin{equation} \left\{\begin{aligned} \left\lvert x+ \right\rangle = \frac{1}{\sqrt{2}} \left\lvert z+ \right\rangle + \frac{1}{\sqrt{2}} \left\lvert z- \right\rangle \\ \left\lvert x- \right\rangle = \frac{1}{\sqrt{2}} \left\lvert z+ \right\rangle - \frac{1}{\sqrt{2}} \left\lvert z- \right\rangle \end{aligned}\right. \end{equation}

　　现在，如果我们对处于 $ \left\lvert x+ \right\rangle $ 态的粒子测量 $x$ 方向的角动量，根据测量理论中对本征态的定义，得到的只可能是其对应的本征值 $L_x = 1/2$．同理，如果对 $ \left\lvert z- \right\rangle $ 态的粒子测量 $z$ 方向的角动量，只可能得到 $L_z = -1/2$．

　　但如果我们对 $ \left\lvert x+ \right\rangle $ 态的粒子测量 $z$ 方向的角动量会发生什么呢？根据测量理论，我们首先需要将 $ \left\lvert x+ \right\rangle $ 表示成 $ \left\lvert z+ \right\rangle $ 和 $ \left\lvert z- \right\rangle $ 的线性组合，而eq. 2 中的第一条已经给出了这个关系．于是我们马上得到 $C_1 = 1/\sqrt{2}$，$C_2 = -1/\sqrt{2}$．所以测得 $L_z = -1/2$ 和 $L_z = 1/2$ 的概率分别是 $ \left\lvert C_1 \right\rvert ^2 = 1/2$，$ \left\lvert C_2 \right\rvert ^2 = 1/2$，即二者概率相同．

　　根据同样的过程，我们也从eq. 2 中的第二条得出，若粒子处于 $ \left\lvert x- \right\rangle $ 态，测量 $z$ 方向角动量得到 $L_z = 1/2$ 和 $L_z = -1/2$ 的概率同样也都是 $1/2$．

薛定谔的猫

　　注意我们在测量理论中并没有指明什么样的事件会构成测量．还是用上面的例子，假设一个粒子的波函数是两个反方向运动的波包，且两个波包的形状相同．我们在一个方向放一个屏幕用于测量位置，检测到粒子后，屏幕会发光．那么根据测量理论，这个粒子有 $1/2$ 的概率会落到屏幕上（朝着屏幕方向运动的波包）．按照通常的理解，这似乎就对粒子构成了测量．

　　但是这并不严谨，因为屏幕也是由微观粒子（质子，电子等）构成的，也可以由波函数描述．如果将屏幕与粒子作为考察的系统，我们可以用一个多粒子的波函数来描述这整个系统（多粒子的波函数这里作不介绍）．当一个波包传播到屏幕的位置时，波函数描述下的屏幕的也变为包含发光的本征态与不发光的本征态的叠加，正如粒子的初始状态是向左传播的波函数和向右传播的波函数的叠加．

　　如果假设 “人眼看屏幕” 这个操作对屏幕的波函数进行了测量，那么只有当实验者去看屏幕的瞬间，波函数才会坍缩到屏幕发光或不发光的本征态．

　　这个论述可以一直进行下去，人眼也是由微观粒子构成的，那么如果也纳入考察的系统（用波函数描述），那人眼的状态就会是 “看到发光屏幕的人眼” 和 “没有看到发光屏幕” 的人眼这两种本征态的叠加，直到人脑对人眼进行测量后才会得到确定的结果．实验者最终也会处于 “看到发光屏幕的人” 和 “没看到发光屏幕的人” 这两种本征态的叠加态．

　　 薛定谔的猫就是这类佯谬中的一个具体例子．在这个假想实验中，一瓶放射性物质旁边放有一个粒子检测器（盖革计数器），当检测器检测到放射性出的粒子时，就会触发一个释放毒药的开关，将箱子里的猫毒死．由于放射出的粒子是由波函数描述的，对这个实验的理解取决于这一系列过程中的哪一步构成测量．如果我们认为检测器对放射粒子构成了测量，那么从测量到结果的那一刻，一切都是确定的，也就不存在佯谬．但如果我们认为只有当人打开箱子看到猫的那一刻才构成测量，那么在打开箱子前猫都处于死和活两个本征态的叠加态．更不可思议的理解是，根本不存在测量，当人打开箱子检查后，人也成了 “看到活猫” 的人和 “看到死猫” 的人的叠加态．

　　关于什么构成测量这个问题至今仍然没有公认的解释，但在现实中研究者往往假设测量仪器对粒子构成了测量⁸，且得到了实验与计算的高度吻合．

不确定性原理

Fig. 9：波包越短，频率就变得越模糊，波包越长，频率就变得更精确．

　　首先注意不确定原理并不是量子力学的基本假设，而是从测量理论推导出的一些结论．最常见的一个不确定性原理说的是，我们无法既准确测量粒子的位置又准确测量粒子的动量，还有一种指的是无法既准确测量能量又准确测量时间．这里只讨论前者．

　　对不确定原理的一个理解是，我们准备许多处于相同状态的粒子，将其分为两组，第一组测量位置，第二组测量动量．然后计算所有测得位置的不确定度（例如标准差）$\Delta x$，以及所有测得动量的不确定度 $\Delta p$．然后我们会发现，无论初始时粒子处于什么状态，二者的乘积 $\Delta x \Delta p$ 总会大于一个常数．

\begin{equation} \Delta x \Delta p \geqslant \frac{\hbar}{2} \approx 5.3\times 10^{-35} \,\mathrm{Js} \end{equation}

　　上文提到位置的本征态是一个 $\delta$ 函数，对应本征值为该波包的位置（坐标）．动量的本征态恰恰相反，是平面波．动量的本征值为平面波的空间频率乘以一个常数．如果粒子的波包很窄（但不是无限窄），那么要测量位置，我们只需要使用波包中心附近的一些 $\delta$ 函数就可以叠加出待测的波包，所以测量结果也只可能离波包中心较近．但在测量动量时，由于这个波包和平面波一点都不像，我们需要许多不同频率的平面波叠加才能得到这个波包（为什么无限长的平面波相加能得到有限长的波包？这是数学上一个非常有趣的结果，叫做傅里叶变换）．

　　另一种情况是，如果波包很长但不是无限长（想象绳子的一段连续上下抖了许多下才停下来），那么将波包看起来与某个频率的平面波十分相似．在测量位置时，我们需要将许多不同坐标的位置本征函数叠加得到波包，那测得的坐标就可能在很大的范围内出现．而测量动量时，我们只需要使用某个频率附近的一些平面波，所以测得的动量（与频率成正比）也都很接近中心频率对应的动量．

　　对不确定性原理的另一种理解来自测量理论中的波函数坍缩．假设我们先对处于某个状态的粒子准确地测量位置，那么根据测量理论，无论测到什么值，测量完后波函数都会坍缩为该位置的本征态，即 $\delta$ 函数．如果这时再马上测量动量，我们测到的就不是粒子原来状态的动量了，所以即使测到一个精确的动量值也并没有意义．反之如果我们先精确地测量某状态下的粒子的动量，那么测量完后波函数将会坍缩为某空间频率的平面波，再马上测量其位置，得到的值也同样没有意义了．

　　事实上对不确定性原理的这种理解对任何两个本征函数不相同的物理量都适用，因为当测量完第一个物理量后，波函数发生坍缩，再测量第二个物理量就没有意义了．但幸运的是有一些物理量有一组相同的本征函数（例如动量和动能的本征函数都是平面波），这样我们只需要测量其中一个，无需再次测量就可以直接计算出另一个物理量的值．

1. ^ 波函数和绳子的运动方式相似但不完全相同
2. ^ 量子力学中的波函数的值可以是复数，粒子出现在某点的概率是复数模长的平方．这里为了简单暂时使用实数，可以看做是复数的实部
3. ^ 小时百科的图标就是自由高斯波包，详见 “小时百科图标”
4. ^ 严格来说应该是角频率 而不是频率
5. ^ 也叫德布罗意波长
6. ^ 以后我们会知道这个例子描述的是自旋为 1/2 的粒子的自旋角动量，这里为了书写方便使用约化普朗克常数 $\hbar$ 作为角动量的单位
7. ^ 这里我们使用 $ \left\lvert \dots \right\rangle $ 来表示波函数，这种符号叫做狄拉克符号，如果你不习惯，完全可以把它们记为 $\Psi_{x+}(\dots)$，$\Psi_{x-}(\dots)$ 等形式．事实上，本例讨论的自旋态，并不能用波函数表示，但为了方便理解，我们姑且假设它们可以．
8. ^ 这一方面也是由于多粒子波函数的计算极其复杂，目前我们还无法精确计算多于两个粒子的波函数的薛定谔方程，即使是用超级计算机做数值解．量子力学中所有涉及多粒子波函数的理论几乎都是用了不同程度的近似．