量子力学的基本原理（量子力学）

贡献者： JierPeter; addis

预备知识　线性代数，微积分，经典力学，量子力学的基本原理（科普）

　　在介绍量子力学的基本原理之前，我们要对 “什么是物理理论” 做一个简单分析。这是因为量子力学常因 “反直觉” 而让初学者迷惘，我希望以下讨论能帮助初学者理清概念，从而自然地接受量子力学的语言。这些讨论归入子节 1 （从牛顿理论到量子理论），但读者可以跳过。

　　量子力学中基本算符的导出，请参见量子力学中的基本算符。算符间的对易关系，请参见算符对易性（量子力学）。

1. 从牛顿理论到量子理论

　　从现代科学哲学的视角看，一个物理理论是一个数学模型，模型中有一些概念有现实对应。这就是说，一个物理理论首先是一个数学理论，而使它区分于数学、成为物理的因素即是 “实验”，可以直观理解为 “有能在仪器上看到、用感官观测到” 的量，通常称之为 “可观测量”。

　　以牛顿力学为例。牛顿力学可以认为是四维空间中的几何学，其中 “点的坐标” 这一概念就是可观测量，它可以显示为尺子上的数值。更准确地说，考虑到牛顿力学中时间的绝对性，该理论应该是一维空间上处处沾了一片三维空间的 “纤维丛” 上的几何学，不同的观察者眼中会有不同的三维空间坐标，但是时间坐标不变。

　　光是几何学，那就不是物理理论了，因此牛顿力学还规定了质点运动的三大定律，相当于限定哪些几何轨迹是 “合法” 的。这三大定律定义了一个概念，“力”。力本身不是可观测量，但我们可以借助此概念来描述物体运动的规律。试举一例：质量为 $m$ 的物体被劲度系数为 $k$、原长为 $l$ 的弹簧拉着，做角速度为 $\omega$ 的匀速圆周运动，则规律预言，弹簧的伸长量是 $\frac{l\omega^2m}{k-m\omega^2}$。伸长量是可观测量，所以我们可以做实验，看看测出来的伸长量是否是这个值，以此来判断牛顿理论的准确性。

　　牛顿力学怎么定义质点的状态？时间坐标、空间坐标以及空间坐标对时间的导数等。这种定义方式很直观，但我们要跳出直觉，理解牛顿力学的 “数学结构”，才能平滑地过渡到量子理论的数学结构。

　　量子理论则用了截然不同的数学模型，它可以被认为是希尔伯特空间中的线性代数理论。它讨论系统的量子态，并将量子态定义为一个希尔伯特空间中的矢量，这些矢量可以表示为波函数。和力一样，态矢量、波函数等概念都是不可观测的。和牛顿三定律一样，态矢量也不是任意变化的，约束态矢量变化的就是著名的薛定谔方程。因此，许多课本中会告诉你，薛定谔方程在量子力学中的地位，就和三定律在牛顿力学中的地位一样。

　　牛顿力学中，质点的坐标是可观测量；量子力学中，厄米算符的本征值¹是可观测量。这些厄米算符对应的是一次观测，观测所得到的值总是对应算符的某个本征值，并且量子态还有一个神奇规律：被观测后，会变成对应本征值的一个本征态，这个过程被称作坍缩。

2. 量子力学的基本假设

　　本小节定义的概念有：

量子态（波函数）-定义 1
量子态（狄拉克符号）-定义 2
量子态的等价-定义 3
内积-定义 4
态矢量的坐标表示（列矩阵和行矩阵之分）-定义 5
算符-定义 6
算符的加减法和乘法-定义 7
单位算符-定义 8
零算符-定义 9
线性算符-定义 10
共轭算符-定义 11
厄米算符²-定义 12
反厄米算符-定义 13
简并-定义 14
可观测量-定义 15
得到特定测量值的概率-式 20
得到测量值的期望-定义 17

　　讨论的定理有：

算符运算的简单性质-定理 2
算符的矩阵表示-定理 3
算符的 Jacobi 恒等式-式 4
算符用本征矢展开-推论 2
厄米算符的本征值必为实数-定理 5
不同本征值的本征态相互正交-定理 6

波函数

定义 1　量子态（波函数）

　　一个系统所处的量子态被表示为一个复值函数，称为态函数（state function）。

　　如果该函数的自变量是空间位置，则称之为在位置表象下的表示；如自变量是动量，则为动量表象下的表示。

　　量子态的演化规律满足薛定谔方程，参见薛定谔方程（单粒子一维）、定态薛定谔方程（单粒子一维）、薛定谔方程（单粒子多维）、薛定谔方程 2（单粒子多维）和多体薛定谔方程等文章，或在百科中搜索关键词 “薛定谔方程”。

　　在继续引出新概念之前，我们要对离散和连续的数学进行一点简单铺垫。

　　连续情况下的积分，是离散情况下求和的推广。离散情况下，矢量的线性组合表示为

\begin{equation} \sum c_i \boldsymbol{\mathbf{v}} _i = \sum c_i \boldsymbol{\mathbf{v}} _i \Delta i~. \end{equation}

其中 $\Delta i$ 表示指标 $i$ 的变化，恒为 $1$。

　　而到了连续情况，即指标取值是连续的，如全体实数，则线性组合表示为

\begin{equation} \lim\limits_{\Delta i\to 0}\sum c_x \boldsymbol{\mathbf{v}} _x \Delta i=\int c_x \boldsymbol{\mathbf{v}} _x \,\mathrm{d}{x} ~. \end{equation}

左矢和右矢

　　表示量子态的态函数全体构成了一个线性空间，因此量子态也有等价的代数诠释。位置表象和动量表象的态函数的不同，相当于选择了不同的基矢量后矢量坐标不同。

　　以一维单粒子的连续情况为例：位置表象下的波函数 $\psi(x)$，可以视为取位置算符的本征矢量（在位置表象下的波函数表示为 $\delta(x-x_0)$³，在动量表象下则为 $ \exp\left(x_0p/ \mathrm{i} \hbar\right) $。）线性组合而成；动量表象下的波函数 $\phi(p)$，可以视为取动量算符的本征矢量（在位置表象下表为 $\exp{( \mathrm{i} p_0 x/\hbar)}$，在动量表象下则为 $\delta(p-p_0)$。）线性组合而成。

　　你可以理解为，$\psi(x_0)$ 就是线性组合中基向量 $\delta(x-x_0)$ 的系数，即

\begin{equation} \psi(x) = \int \psi(x_0)\delta(x-x_0) \,\mathrm{d}{x} _0~. \end{equation}

这也确实符合狄拉克 delta 函数的性质，以及离散到连续的推广。

定义 2　量子态（狄拉克符号）

　　一个系统所处的量子态是复希尔伯特空间上的一个矢量，用狄拉克符号⁴表示。

　　每个量子态都有两个矢量表示，数学上可以理解为这两个 “表示矢量” 来自两个同构的复希尔伯特空间，这两个空间之间给定了一个同构 $\sigma$，使得 $ \boldsymbol{\mathbf{v}} $ 和 $\sigma( \boldsymbol{\mathbf{v}} )$ 表示同一个量子态。

　　量子态的两个 “表示空间” 中的矢量分别被称为左矢和右矢，分别用 $ \left\langle * \right\rvert $ 和 $ \left\lvert * \right\rangle $ 表示。$*$ 号处填表示这个量子态的符号。

　　如果一个量子态的右矢表示为 $ \left\lvert s \right\rangle $，那其左矢表示应为 $ \left\langle s \right\rvert =\sigma( \left\lvert s \right\rangle )$，这里的 $\sigma$ 就是定义 2 中提到的两个希尔伯特空间（左矢空间和右矢空间）之间的同构，从右矢空间到左矢空间。

　　如果你了解线性代数中对偶空间的概念，可能会猜想这两个希尔伯特空间之间是不是对偶关系，同一个量子态的对偶表示是不是就是对偶矢量。这种理解是不恰当的。对偶矢量是指互为对方的线性函数，单给一个矢量是无法确定其对偶矢量的。量子态的对偶表示则如定义 2 所说，是规定了一个同构，用这个同构来联系两个空间的矢量。在术语的使用上，应注意 “对偶矢量” 和 “量子态的对偶表示” 的区别，后者我们尽量避免使用，以尽可能减少理解负担。

　　给定量子态，如何求它的波函数呢？见以下定理：

定理 1　波函数公式

　　设 $ \left\lvert k \right\rangle $ 是位置本征态，$ \left\lvert p \right\rangle $ 是动量本征态，任取一量子态 $ \left\lvert s \right\rangle $，设其对应的位置表象波函数为 $\psi(x)$，动量表象波函数为 $\tilde{\psi}(p)$，则

\begin{equation} \left\{\begin{aligned} \psi(x) &= \left\langle x \middle| s \right\rangle \\ \tilde{\psi}(p) &= \left\langle p \middle| s \right\rangle \end{aligned}\right. ~, \end{equation}

　　证明用式 3 即可。

定义 3　

　　若已知态 $ \left\lvert s \right\rangle $，则对于任意复数 $c\in\mathbb{C}$，定义 $c \left\lvert s \right\rangle $ 和 $ \left\lvert s \right\rangle $ 是同一个态，$c \left\lvert s \right\rangle $ 也可表示为 $ \left\lvert cs \right\rangle $。态 $ \left\lvert s \right\rangle $ 的对偶矢量表示为 $ \left\langle s \right\rvert $。

　　对于复数 $a$，规定 $a \left\lvert s \right\rangle $ 的对偶是 $a^* \left\langle s \right\rvert $。

内积

定义 4　内积

　　一个左矢 $ \left\langle a \right\rvert $ 和一个右矢 $ \left\lvert b \right\rangle $ 可以相乘得到一个复数，记为 $ \left\langle a \middle| b \right\rangle $。该运算称为 “内积（inner product）”，定义为 “满足埃尔米特矢量空间（酉空间）内积的性质⁵” 的运算，即

\begin{equation} \left\{\begin{aligned} \left\langle a \middle| b \right\rangle &= \left\langle b \middle| a \right\rangle ^*\\ \left\langle a \middle| c_1b_1+c_2b_2 \right\rangle &=c_1 \left\langle a \middle| b_1 \right\rangle +c_2 \left\langle a \middle| b_2 \right\rangle \\ \left\langle a \middle| a \right\rangle &\geq 0, \quad\text{等号仅在} \left\lvert a \right\rangle = \boldsymbol{\mathbf{0}} \text{时成立} \end{aligned}\right. ~. \end{equation}

　　如果 $ \left\lvert a \right\rangle $ 和 $ \left\lvert b \right\rangle $ 代表的态函数分别是 $f$ 和 $g$，则 $ \left\langle a \middle| b \right\rangle =\int f^* g \,\mathrm{d}{x} $。

　　有了内积的概念后，我们就有了矢量的模长和矢量间正交的概念。为了方便，可以规定仅使用模长为 $1$ 的矢量来表示量子态。

例 1　态矢量归一化

　　任取量子态 $ \left\lvert s \right\rangle $，则总可以取其等价态

\begin{equation} \left\lvert \tilde{s} \right\rangle = \frac{ \left\lvert s \right\rangle }{\sqrt{ \left\langle s \middle| s \right\rangle }}~. \end{equation}

　　显然，$ \left\langle \tilde{s} \middle| \tilde{s} \right\rangle =1$，因此这是取出模长为 $1$ 的量子态的简单方法。称 $ \left\lvert \tilde{s} \right\rangle $ 是 $ \left\lvert s \right\rangle $ 的归一化表示。

　　如果取右矢空间的标准正交基 $\{ \left\lvert s_\alpha \right\rangle \}$，则由已有的同构关系 $\sigma$，可以得到左矢空间的标准正交基 $\{\sigma( \left\lvert s_\alpha \right\rangle )\}$。在这两个基下，任意左矢和右矢都可以用坐标来表示。

定义 5　态矢量的坐标表示

　　态的右矢 $ \left\lvert s \right\rangle $ 的坐标用列矩阵表示，左矢 $ \left\langle s \right\rvert $ 用行矩阵表示。

　　按照定义 3 ，态左矢的坐标矩阵，是态右矢的坐标矩阵之转置、取共轭⁶。再结合定义 4 和定义 5 ，分量离散的态矢量的内积可以用矩阵乘法表示。

　　如果一个量子态的矢量表示是 $ \left\lvert s_i \right\rangle $，态函数表示是 $\psi_i$，且态函数取值连续（即态矢量的分量是连续的），那么内积对应态函数的积分：

\begin{equation} \left\langle s_2 \middle| s_1 \right\rangle = \int_{\text{整个态空间}}\psi_2^*\psi_1 \,\mathrm{d}{ \boldsymbol{\mathbf{}}} {x}~, \end{equation}

这里 $x$ 表示态空间上的坐标。

　　 $ \left\lvert s_i \right\rangle $ 可以和 $\psi_i$ 视为等价，有时也可以把这个态表示为 $ \left\lvert \psi_i \right\rangle $。

算符

定义 6　算符

　　 算符（operator）是把一个态变为另一个态的映射。

　　注意，这里的 “变为” 并不是说物理上把态改变了，而是指 “映射到了” 的意思。

　　从代数角度来说，量子力学中的算符大都是线性空间上的线性变换，非线性算符包括时间反演算符。对于线性算符，我们关心的是这个变换本身的性质。

未完成：有了讨论时间反演算符的文章或相关内容后，在此引用。

　　给定右矢空间的基以后，算符对量子态的作用可以表示为方阵乘在量子态的右矢或左矢矩阵上，该方阵称为该算符的坐标。如果用波函数表示一个量子态，那么算符也可能是求导算符或者其与其它算符相结合的形式。由于规定右矢坐标是列矩阵，因此为了与矩阵乘法配合，算符 $X$ 应从左边作用在右矢$ \left\lvert s \right\rangle $ 上，得到另一个右矢 $X \left\lvert s \right\rangle $，而从右边作用在左矢 $ \left\langle s \right\rvert $ 上，得到另一个左矢 $ \left\langle s \right\rvert X$。

定义 7　算符的运算

　　算符之间的加减法，由矢量的加减法导出：

\begin{equation} (X+Y) \left\lvert s \right\rangle = X \left\lvert x \right\rangle +Y \left\lvert s \right\rangle ~. \end{equation}

　　算符之间的乘法，由映射的复合导出：

\begin{equation} (XY) \left\lvert s \right\rangle = X(Y \left\lvert s \right\rangle )~. \end{equation}

定理 2　算符运算的简单性质

　　由矢量加法的结合性，容易证明算符加法具有结合性：

\begin{equation} (X+Y)+Z=X+(Y+Z)~. \end{equation}

　　算符乘法和映射复合一样，通常不可交换：

\begin{equation} XY\neq YX~, \end{equation}

却可复合：

\begin{equation} (XY)Z=X(YZ)~. \end{equation}

定义 8　单位算符

　　如果对于任意态右矢 $ \left\lvert s \right\rangle $ 都有

\begin{equation} I \left\lvert s \right\rangle = \left\lvert s \right\rangle ~, \end{equation}

则称 $I$ 为一个单位算符（indentity operator）。有时将单位算符记为 $\mathbb{1}$。

定义 9　零算符与相等

　　如果对于任意态右矢 $ \left\lvert s \right\rangle $ 都有

\begin{equation} X \left\lvert s \right\rangle = 0~. \end{equation}

则称 $X$ 为一个零算符（null operator），记为 $X=0$。

　　如果 $X-Y=0$，称算符 $X$ 与 $Y$相等，记为 $X=Y$。

定义 10　线性算符

　　如果算符 $X$ 对于任意的复数 $a, b$ 和量子态 $ \left\lvert s_a \right\rangle , \left\lvert s_b \right\rangle $，都有

\begin{equation} X(a \left\lvert s_a \right\rangle +b \left\lvert s_b \right\rangle ) = aX \left\lvert s_a \right\rangle +bX \left\lvert s_b \right\rangle ~, \end{equation}

则称 $X$ 是一个线性算符（linear operator）。

　　一般地，$X \left\lvert s \right\rangle $ 和 $ \left\langle s \right\rvert X$并不是同一个量子态的表示。比如，对于复数 $a$，$a \left\lvert s \right\rangle $ 的对偶表示应该是 $ \left\langle s \right\rvert a^*$。这提示我们应该做出以下定义：

定义 11　共轭算符

　　对于算符 $X$，若存在算符 $X^\dagger$ 使得对于任意量子态 $ \left\lvert s \right\rangle $，$X \left\lvert s \right\rangle $ 都和 $ \left\langle s \right\rvert X^\dagger$ 互为对偶表示，则称 $X^\dagger$ 为 $X$ 的共轭算符（conjugate operator），或厄米共轭（hermitian conjugate）。

未完成：共轭算符在分析语言下的定义。

定理 3　算符的矩阵表示

　　设 $\{ \left\lvert s_i \right\rangle \}_{i=1}^n$ 构成了态空间的一组离散基，那么算符 $X$ 在这组基下的坐标为

\begin{equation} \begin{pmatrix} \left\langle s_1 \right\rvert X \left\lvert s_1 \right\rangle & \left\langle s_1 \right\rvert X \left\lvert s_2 \right\rangle &\cdots\\ \left\langle s_2 \right\rvert X \left\lvert s_1 \right\rangle & \left\langle s_2 \right\rvert X \left\lvert s_2 \right\rangle &\cdots\\ \vdots & \vdots& \ddots \end{pmatrix} ~. \end{equation}

　　证明：

　　在给定基下，$ \left\langle s_i \right\rvert $ 的坐标是一个行矩阵 $\mathcal{C}$，除了第 $i$ 列为 $1$，其它列都为 $0$；类似地，$ \left\lvert s_j \right\rangle $ 的坐标是一个列矩阵 $\mathcal{R}$，除了第 $j$ 行为 $1$，其它行都为 $0$。设 $X$ 的坐标是 $\mathcal{M}$，其第 $i$ 行 $j$ 列的坐标为 $m^i_j$。则有

\begin{equation} \left\langle s_i \right\rvert X \left\lvert s_j \right\rangle = \mathcal{CMR} = m^i_j~. \end{equation}

定理 4　Jacobi 恒等式

　　对于任意算符 $X, Y$ 和 $Z$，有：

\begin{equation} [X, [Y, Z]]+[Y, [Z, X]]+[Z, [X, Y]]=0~. \end{equation}

　　 Jacobi 恒等式建议自行证明，也可直接参考李代数文章中李代数的定义（要求 Jacobi 恒等式成立）以及定理 1 （该定理适用于对易子）。

　　由定理 3 可知，若 $X$ 在某个基下的坐标是矩阵 $\mathcal{M}$，则 $X^\dagger$ 的坐标 $\mathcal{M}^\dagger$ 是 $\mathcal{M}$ 的共轭转置，即元素全部取共轭后进行转置，或者反过来先转置再共轭。这一点和右矢、左矢之间互为厄米共轭是一致的。

引理 1　

　　如果 $ \left\lvert s \right\rangle $ 是 $X$ 的本征矢量，本征值为 $a$，即 $X \left\lvert s \right\rangle =a \left\lvert s \right\rangle $，那么 $ \left\langle s \right\rvert X=a \left\langle s \right\rvert $。

　　证明：

　　由定义 11 ，$X^\dagger \left\lvert s \right\rangle $ 与 $ \left\langle s \right\rvert X$ 互为共轭。因此，如果 $ \left\lvert s \right\rangle $ 是 $X$ 的本征矢量，本征值为 $a$，即 $X \left\lvert s \right\rangle =a \left\lvert s \right\rangle $，那么 $X^\dagger \left\lvert s \right\rangle =a^* \left\lvert s \right\rangle $⁷，从而推知 $ \left\langle s \right\rvert X=a \left\langle s \right\rvert $。

　　证毕。

　　注意

\begin{equation} (XY)^\dagger = Y^\dagger X^\dagger~. \end{equation}

定义 12　厄米算符

　　若 $X=X^\dagger$，则称 $X$ 是一个厄米算符（hermitian operator）。

定义 13　反厄米算符

　　若 $X=-X^\dagger$，则称 $X$ 是一个反厄米算符（anti-hermitian operator）。

定理 5　

　　厄米算符的本征值必为实数。

　　证明：

　　取 $ \left\lvert s \right\rangle $ 为 $X$ 的任意本征矢量，其本征值为 $a$，若 $X$ 是厄米的，则据定义 11 和式 22 知，$ \left\langle s \right\rvert X$ 与 $X \left\lvert s \right\rangle $ 互为对偶表示，即 $X \left\lvert s \right\rangle =a \left\lvert s \right\rangle $，$ \left\langle s \right\rvert X=a^* \left\langle s \right\rvert $⁸。

　　于是

\begin{equation} \begin{aligned} a&= \left\langle s \right\rvert a \left\lvert s \right\rangle \\ &= \left\langle s \right\rvert (X \left\lvert s \right\rangle )\\ &=( \left\langle s \right\rvert X) \left\lvert s \right\rangle \\ &=a^* \left\langle s \middle| s \right\rangle \\ &=a^*~, \end{aligned} \end{equation}

　　从而 $a=a^*\implies a$ 为实数。

　　证毕。

定理 6　不同本征值的本征态相互正交

　　任取算符 $X$，若 $ \left\lvert s_a \right\rangle $ 和 $ \left\lvert s_b \right\rangle $ 都是 $X$ 的本征矢量，其本征值分别为 $a,b$，且 $a\neq b$。则 $ \left\langle s_a \middle| s_b \right\rangle =0$。

　　证明：

\begin{equation} \begin{aligned} a \left\langle s_a \middle| s_b \right\rangle &=( \left\langle s_a \right\rvert X) \left\lvert s_b \right\rangle \\ &= \left\langle s_a \right\rvert (X \left\lvert s_b \right\rangle )\\ &=b \left\langle s_a \middle| s_b \right\rangle ~. \end{aligned} \end{equation}

　　而 $a\neq b$，因此必有 $ \left\langle s_a \middle| s_b \right\rangle =0$。

　　证毕。

定义 14　简并

　　若对于算符 $X$，存在两个线性无关的本征右矢 $ \left\lvert s_1 \right\rangle $ 和 $ \left\lvert s_2 \right\rangle $，使得 $X \left\lvert s_1 \right\rangle =a \left\lvert s_1 \right\rangle $，$X \left\lvert s_2 \right\rangle =a \left\lvert s_2 \right\rangle $，则称 $a$ 是一个简并（degenerate）的本征值。

　　要指出一点，矢量算符可以理解为普通的算符和基矢量的结合。如 $\nabla$ 算符将标量值函数变成一个矢量值函数，但其实也可以说 $\nabla=x\hat{ \boldsymbol{\mathbf{x}} }+y\hat{ \boldsymbol{\mathbf{y}} }+z\hat{ \boldsymbol{\mathbf{z}} }$，即由三个算符 $x, y, z$ 和单位矢量结合而得。

　　以下几个例子给出的是重要的算符。其中，动量算符和能量算符可由德布罗意关系得出，因为 $E=h\nu$ 和 $p=h/\lambda$ 意味着一个简谐波应写为 $\exp{(\frac{ \mathrm{i} \boldsymbol{\mathbf{p}} }{\hbar}\cdot \boldsymbol{\mathbf{x}} - \mathrm{i} Et)}$。角动量算符继承经典力学中的关系：$ \boldsymbol{\mathbf{L}} = \boldsymbol{\mathbf{r}} \times \boldsymbol{\mathbf{p}} $。注意 $\hbar=h/2\pi$。

例 2　位置表象下的算符

　　 位置表象下，单粒子态函数的

位置算符为 $\hat{x}=x$（一维情况）或 $ \hat{\boldsymbol{\mathbf{r}}} =x \hat{\boldsymbol{\mathbf{x}}} +y \hat{\boldsymbol{\mathbf{y}}} +z \hat{\boldsymbol{\mathbf{z}}} $（三维情况）；
动量算符为 $\hat{p}=- \mathrm{i} \hbar\frac{\partial}{\partial x}$（一维情况）或 $ \hat{\boldsymbol{\mathbf{p}}} =- \mathrm{i} \hbar\nabla=- \mathrm{i} \hbar( \hat{\boldsymbol{\mathbf{x}}} \frac{\partial}{\partial x}+ \hat{\boldsymbol{\mathbf{y}}} \frac{\partial}{\partial y}+ \hat{\boldsymbol{\mathbf{z}}} \frac{\partial}{\partial z})$（三维情况）；
能量算符为 $\hat{E}= \mathrm{i} \frac{\partial}{\partial t}$；
角动量算符为 $ \hat{\boldsymbol{\mathbf{L}}} = \hat{\boldsymbol{\mathbf{r}}} \times \hat{\boldsymbol{\mathbf{p}}} $，展开后得
\begin{equation} \hat{ \boldsymbol{\mathbf{L}} }= - \mathrm{i} \hbar \begin{pmatrix} y\frac{\partial}{\partial_z}-z\frac{\partial}{\partial_y}\\ z\frac{\partial}{\partial_x}-x\frac{\partial}{\partial_z}\\ x\frac{\partial}{\partial_y}-y\frac{\partial}{\partial_x} \end{pmatrix} ~. \end{equation}

例 3　动量表象下的算符

　　 动量表象下，单粒子态函数的

位置算符为 $\hat{x}= \mathrm{i} \hbar\frac{\partial}{\partial p}$（一维情况）或 $ \hat{\boldsymbol{\mathbf{r}}} = \mathrm{i} \hbar ( \hat{\boldsymbol{\mathbf{p}}} _{x}\frac{\partial}{\partial p_x}+ \hat{\boldsymbol{\mathbf{p}}} _{y}\frac{\partial}{\partial p_y}+ \hat{\boldsymbol{\mathbf{p}}} _{z}\frac{\partial}{\partial p_z})$（三维情况）；
动量算符为 $\hat{p}=p$（一维情况）或 $ \hat{\boldsymbol{\mathbf{p}}} =p_x \hat{\boldsymbol{\mathbf{p}}} _x+p_y \hat{\boldsymbol{\mathbf{p}}} _y+p_z \hat{\boldsymbol{\mathbf{p}}} _z$（三维情况）；
能量算符为 $\hat{E}= \mathrm{i} \frac{\partial}{\partial t}$；
角动量算符为 $ \hat{\boldsymbol{\mathbf{L}}} = \hat{\boldsymbol{\mathbf{r}}} \times \hat{\boldsymbol{\mathbf{p}}} $，展开后得
\begin{equation} \hat{ \boldsymbol{\mathbf{L}} }= \mathrm{i} \hbar \begin{pmatrix} p_y\frac{\partial}{\partial p_z}-p_z\frac{\partial}{\partial p_y}\\ p_z\frac{\partial}{\partial p_x}-p_x\frac{\partial}{\partial p_z}\\ p_x\frac{\partial}{\partial p_y}-p_y\frac{\partial}{\partial p_x} \end{pmatrix} ~. \end{equation}

　　其中角动量要特别注意，算符相乘不是数字相乘，而是函数复合。所以位置算符和动量算符做叉乘的时候，应代入一个 “辅助函数”$\psi$，根据复合的定义得 $[(\frac{\partial}{\partial_x})(p_y)]\psi=\frac{\partial}{\partial_x}(p_y\psi)=p_y\frac{\partial}{\partial_x}\psi$。

未完成：动量表象的正确性有待核验，特别是角动量算符。核验后删除此 “未完成”。

例 4　投影算符

　　设选定了态空间的一组基矢量 $\{ \left\lvert s_\alpha \right\rangle \}_{\alpha\in \Gamma}$，其中指标集 $\Gamma$ 可以是离散的，也可以是连续的。任意态矢量 $ \left\lvert a \right\rangle $ 的下标为 $\alpha$ 的坐标分量称之为其在基矢量 $ \left\lvert s_\alpha \right\rangle $ 方向上的投影（projectiong），容易证明该投影是

\begin{equation} \left\lvert s_\alpha \right\rangle \left\langle s_\alpha \middle| a \right\rangle ~. \end{equation}

因此 $ \left\lvert s_\alpha \right\rangle \left\langle s_\alpha \right\rvert $ 是一个算符，称之为投影算符（projection operator）。

　　思考：列矩阵左乘行矩阵得到什么样的矩阵？这和 $ \left\lvert a \right\rangle \left\langle b \right\rvert $ 有什么关系？

推论 1　

　　如果 $\{ \left\lvert s_\alpha \right\rangle \}$ 构成了态空间的一组基，那么

\begin{equation} \sum_\alpha \left\lvert s_\alpha \right\rangle \left\langle s_\alpha \right\rvert = \mathbb{1}~. \end{equation}

其中 $\mathbb{1}$ 是单位算符，它作用在任何态矢量和算符上都不会改变对方。

　　该推论由投影算符的概念直接可得。

推论 2　可对角化算符用本征矢展开

　　设 $X$ 是一个可对角化的算符，有一个由本征矢量 $\{ \left\lvert s_i \right\rangle \}$ 构成的离散基，且 $X \left\lvert s_i \right\rangle =\alpha_i \left\lvert s_i \right\rangle $。则在这组基下有

\begin{equation} X=\sum_{i}\alpha_i \left\lvert s_i \right\rangle \left\langle s_i \right\rvert ~. \end{equation}

　　证明：

　　利用推论 1 ，

\begin{equation} X=\sum_{i}\sum_{j} \left\lvert s_i \right\rangle \left\langle s_i \right\rvert X \left\lvert s_j \right\rangle \left\langle s_j \right\rvert ~. \end{equation}

　　由定理 3 ，$ \left\langle s_i \right\rvert X \left\lvert s_j \right\rangle $ 是 $X$ 在其本征矢构成的基下第 $i$ 行 $j$ 列的坐标值，而此时 $X$ 的坐标应该是对角矩阵，且对角元是对应的本征值。于是，$ \left\langle s_i \right\rvert X \left\lvert s_j \right\rangle =\delta_{ij}\alpha_i$。

　　于是式 27 变为

\begin{equation} \begin{aligned} X&=\sum_{i, j}\alpha_i\delta_{ij} \left\lvert s_i \right\rangle \left\langle s_j \right\rvert \\ &=\sum_i\alpha_i \left\lvert s_i \right\rangle \left\langle s_i \right\rvert ~, \end{aligned} \end{equation}

　　证毕。

测量

　　每一个测量行为被表示为一个算符。测量假设认为，进行测量后，量子态会坍缩成该测量算符的一个本征矢量，称为其本征态（eigenstate），同时返回该本征态的本征值作为测量值。

定义 15　可观测量

　　厄米算符所代表的测量行为称为可观测量（observable）⁹，如位置、动量、能量等。

例 5　

　　用位置算符表示的测量，测量值被认为是粒子的位置，测量后粒子坍缩为位置算符的本征态。

　　如果一个量子态 $ \left\lvert a \right\rangle $ 不是测量算符 $X$ 的本征态，那么它是本征值不同的本征态的线性组合：

\begin{equation} \left\lvert a \right\rangle = \sum_{i=1}^{n} c_i \left\lvert s_i \right\rangle ~, \end{equation}

或

\begin{equation} \left\lvert a \right\rangle = \int c(x) \left\lvert s_x \right\rangle \,\mathrm{d}{x} ~. \end{equation}

其中式 29 是离散情况，式 30 是连续情况，$ \left\lvert s_i \right\rangle $ 和 $ \left\lvert s_x \right\rangle $ 都表示 $X$ 的本征态，$c_i$ 和 $c(x)$ 表示各本征态的本征值。

定义 16　概率

　　设可观测量 $X$ 有一个本征矢构成的基 $\{ \left\lvert s_\alpha \right\rangle \}$。离散情况下，指标 $\alpha$ 只有最多可数个¹⁰可能性，此时设 $ \left\lvert a \right\rangle =\sum_{\alpha} \left\lvert s_\alpha \right\rangle $；连续情况下，指标 $\alpha$ 的取值范围是一个实数区间。

　　离散情况下，对 $ \left\lvert a \right\rangle $ 进行 $X$ 测量后，得到测量值 $c_\alpha$ 且 $ \left\lvert a \right\rangle $ 坍缩为 $ \left\lvert s_\alpha \right\rangle $ 的概率为 $ \left\lvert c_\alpha \right\rvert ^2$。

　　连续情况下，对 $ \left\lvert a \right\rangle $ 进行 $X$ 测量后，得到测量值在 $s_{\alpha}$ 附近、$\alpha$ 的取值范围为 $ \,\mathrm{d}{x} $ 的概率为 $ \left\lvert c_\alpha \right\rvert ^2 \,\mathrm{d}{x} $。

　　有了概率的定义，我们就可以给出算符期望的定义，即进行对应测量时所得结果的期望：

定义 17　期望

　　设有量子态 $ \left\lvert s \right\rangle $ 和可观测量 $X$，则队 $ \left\lvert s \right\rangle $ 进行 $X$ 测量，所得结果的期望（expectation）是

\begin{equation} \langle X \rangle = \left\langle s \right\rvert X \left\lvert s \right\rangle ~. \end{equation}

　　若 $ \left\lvert s \right\rangle $ 的波函数是 $\psi$，则期望为

\begin{equation} \langle X \rangle = \int \psi^* X \psi \,\mathrm{d}{x} ~. \end{equation}

定理 7　

　　给定可观测量，则任何量子态都是由该可观测量的本征矢线性组合而成，即可观测量的全体本征矢张成了整个态空间。

未完成：定理名称应该怎么叫？本征矢完备性？另，取了名字以后要把这个列在小节开头的 “目录” 里。

　　证明：

　　由线性代数知识知，一个线性变换的全体本征矢能张成整个空间，当且仅当这个线性变换可对角化。

　　由厄米算符的定义，其矩阵表示必为共轭对称的，即对称位置的矩阵元互为共轭。由线性代数知识，任何矩阵都相似于一个上三角矩阵，而相似矩阵是同一个线性变换在不同基下的表示，因此可以选择一组基，使得算符的矩阵表示是上三角的。但这个上三角矩阵仍是共轭对称的，因此其非对角线元素必须为零。

　　因此厄米算符总能对角化。

　　证毕。

　　定理 6 （本征矢的正交性）和定理 7 （本征矢的完备性）可以综合起来，表述为 “可观测量的本征右矢构成了一个完备正交集”。因此，可观测量是可对角化的算符，适用推论 2 。

例 6　光的偏振态

　　考虑光的偏振实验。

　　把光的量子态定义为偏振态，即沿着偏振角度的一个矢量¹¹，构成一个态空间。取水平方向的偏振，表示为 $ \left\lvert h \right\rangle $，和竖直方向的偏振，表示为 $ \left\lvert v \right\rangle $，则 $\{ \left\lvert h \right\rangle , \left\lvert v \right\rangle \}$ 构成一组基。

　　易证，与水平方向成 $\theta$ 角的偏振态被表示为 $\cos\theta \left\lvert h \right\rangle +\sin\theta \left\lvert v \right\rangle $。

　　现在设置一个检偏器，其与水平面的角度为 $0$。“让光通过检偏器” 就是一个测量行为，如果定义 “光成功通过” 用测量值 $1$ 代表，“光未通过” 用测量值 $0$ 代表，那么这个测量行为的算符在给定的基下表示为

\begin{equation} \begin{pmatrix} 1&0\\0&0 \end{pmatrix} ~, \end{equation}

该测量算符的本征值为 $1$ 和 $0$，分别对应本征态 $ \left\lvert h \right\rangle $ 和 $ \left\lvert v \right\rangle $。

　　再设置一个检偏器，其与水平面的角度为 $\pi/2$。则该测量行为的算符表示为

\begin{equation} \begin{pmatrix} 0&0\\0&1 \end{pmatrix} ~, \end{equation}

该测量算符的本征值为 $0$ 和 $1$，分别对应本征态 $ \left\lvert h \right\rangle $ 和 $ \left\lvert v \right\rangle $。

　　现在让一个初始态为 $\cos\theta \left\lvert h \right\rangle +\sin\theta \left\lvert v \right\rangle $ 的光子依次通过这两个检偏器。光子有 $\cos^2\theta$ 的概率成功通过第一个检偏器，并坍缩为 $ \left\lvert h \right\rangle $ 态；有 $\sin^2\theta$ 的概率不通过。考虑通过的光子，它有 $0$ 的概率成功通过第二个检偏器。因此，这两个检偏器在理想情况下能完全阻绝光。

　　现在在两个检偏器中间插入一个与水平面成 $\pi/4$ 角的检偏器，它的本征值为 $1$ 和 $0$，分别对应本征态 $\frac{\sqrt{2}}{2} \left\lvert h \right\rangle +\frac{\sqrt{2}}{2} \left\lvert v \right\rangle $ 和 $\frac{\sqrt{2}}{2} \left\lvert h \right\rangle -\frac{\sqrt{2}}{2} \left\lvert v \right\rangle $，因此这个检偏器的测量算符表示为

\begin{equation} \begin{pmatrix} \frac{1}{2}&\frac{1}{2}\\\frac{1}{2}&\frac{1}{2} \end{pmatrix} ~, \end{equation}

　　让一个初始态为 $\cos\theta \left\lvert h \right\rangle +\sin\theta \left\lvert v \right\rangle $ 的光子依次通过这三个检偏器。光子有 $\cos^2\theta$ 的概率成功通过第一个检偏器，并坍缩为 $ \left\lvert h \right\rangle $ 态；由于

\begin{equation} \left\lvert h \right\rangle =\frac{\sqrt{2}}{2} \left(\frac{\sqrt{2}}{2} \left\lvert h \right\rangle +\frac{\sqrt{2}}{2} \left\lvert v \right\rangle \right) +\frac{\sqrt{2}}{2} \left(\frac{\sqrt{2}}{2} \left\lvert h \right\rangle -\frac{\sqrt{2}}{2} \left\lvert v \right\rangle \right) ~. \end{equation}

因此光子有 $(\sqrt{2}/2)^2=1/2$ 的概率通过第二个检偏器，并坍缩为 $\frac{\sqrt{2}}{2} \left\lvert h \right\rangle +\frac{\sqrt{2}}{2} \left\lvert v \right\rangle $ 态；接下来，光子有 $(\sqrt{2}/2)^2=1/2$ 的概率通过第三个检偏器。于是可以计算出光子成功通过三个检偏器的概率为 $\cos^2\theta\cdot\frac{1}{2}\cdot\frac{1}{2}=\frac{\cos^2\theta}{4}$。

1. ^ 也称特征值。
2. ^ 也有译名为埃米尔特算符、厄密算符的。
3. ^ 这是狄拉克 delta 函数。
4. ^ 见狄拉克符号或对偶空间子节 3 。
5. ^ 注意埃尔米特矢量空间（酉空间）中描述的是同一个空间中的两个矢量相乘，而左矢和右矢是在不同的空间中。
6. ^ 取共轭即把矩阵元素都换成共轭元素。显然，反过来先取共轭再转置，结果是一样的。矩阵转置、取共轭后的结果，就是它的厄米共轭。
7. ^ 用 $ \left\lvert s \right\rangle $ 作为第一个基向量，则 $X$ 的第一行第一列的元素即为 $a$，于是 $X^\dagger$ 的第一行第一列为 $a^*$。
8. ^ 其实到这一步已经证毕了，引用引理 1 即可。
9. ^ 这里的 observable 是名词，复数为 observables。
10. ^ “可数” 的概念见子节 2 。
11. ^ 注意，根据前面的规定，$\pm \left\lvert s \right\rangle $ 表示同一个态，因此无所谓正负、大小。不过默认使用模为 $1$ 的归一化矢量。

致读者：小时百科一直以来坚持所有内容免费无广告，这导致我们处于严重的亏损状态。长此以往很可能会最终导致我们不得不选择大量广告以及内容付费等。因此，我们请求广大读者热心打赏 ，使网站得以健康发展。如果看到这条信息的每位读者能慷慨打赏 20 元，我们一周就能脱离亏损，并在接下来的一年里向所有读者继续免费提供优质内容。但遗憾的是只有不到 1% 的读者愿意捐款，他们的付出帮助了 99% 的读者免费获取知识，我们在此表示感谢。

量子力学的基本原理（量子力学）

1. 从牛顿理论到量子理论

2. 量子力学的基本假设

波函数

定义 1 量子态（波函数）

左矢和右矢

定义 2 量子态（狄拉克符号）

定理 1 波函数公式

定义 3

内积

定义 4 内积

例 1 态矢量归一化

定义 5 态矢量的坐标表示

算符

定义 6 算符

定义 7 算符的运算

定理 2 算符运算的简单性质

定义 8 单位算符

定义 9 零算符与相等

定义 10 线性算符

定义 11 共轭算符

定理 3 算符的矩阵表示

定理 4 Jacobi 恒等式

引理 1

定义 12 厄米算符

定义 13 反厄米算符

定理 5

定理 6 不同本征值的本征态相互正交

定义 14 简并

例 2 位置表象下的算符

例 3 动量表象下的算符

例 4 投影算符

推论 1

推论 2 可对角化算符用本征矢展开

测量

定义 15 可观测量

例 5

定义 16 概率

定义 17 期望

定理 7

例 6 光的偏振态

定义 1　量子态（波函数）

定义 2　量子态（狄拉克符号）

定理 1　波函数公式

定义 3　

定义 4　内积

例 1　态矢量归一化

定义 5　态矢量的坐标表示

定义 6　算符

定义 7　算符的运算

定理 2　算符运算的简单性质

定义 8　单位算符

定义 9　零算符与相等

定义 10　线性算符

定义 11　共轭算符

定理 3　算符的矩阵表示

定理 4　Jacobi 恒等式

引理 1　

定义 12　厄米算符

定义 13　反厄米算符

定理 5　

定理 6　不同本征值的本征态相互正交

定义 14　简并

例 2　位置表象下的算符

例 3　动量表象下的算符

例 4　投影算符

推论 1　

推论 2　可对角化算符用本征矢展开

定义 15　可观测量

例 5　

定义 16　概率

定义 17　期望

定理 7　

例 6　光的偏振态