基本概念

贡献者： addis; 钱昭霖

1. 描述一个态

　　我们用如下记号：$|\alpha\rangle$ 来描述一个态，这种描述也称为 “右矢”。从某种程度上，它可以理解为我们线性代数里面学过的列矢量：

\begin{equation} |\alpha\rangle = \left(\begin{matrix}x_1\\x_2\\ \vdots\\ x_n\end{matrix}\right)~. \end{equation}

　　当然，这么写出来的话，肯定要指明我们是在怎样的一组坐标下面来进行这个描述的。一旦清楚的说明坐标了之后，这个态的意义也就明确了起来。在量子力学的课程中，一个很容易造成困扰的概念就是 “叠加态”。请大家一定记住，叠加态并不是什么奇怪的事情。比如，你在三维直角坐标系中，有一个点 $(1, 1, 1)/\sqrt3$，你会觉得 “不可思议！竟然可以同时处于 $x$ 轴、$y$ 轴、$z$ 轴的混合态” 吗？不会吧。所以，在量子力学里面，你也不必对此大惊小怪——大家其实是同样的数学结构。

　　有右矢自然就有左矢——从代数学的角度来讲，一个右矢对应的左矢，即是它的 Hermitian 共轭¹，通常会用 $h. c$ 来表示（Hermitian Conjugation）。共轭大家肯定知道，就是复数里面把辐角取反即可了，但是如果在此基础上再做一个转置的话，就构成了 Hermitian 共轭，形成了左矢，也就是一个行向量。

\begin{equation} \langle\alpha| = (x_1^*\ x_2^*\ \cdots\ x_n^*)~. \end{equation}

　　举一个简单的例子，

例 1　

　　如果规定

\begin{equation} |\alpha\rangle = \frac{1}{\sqrt{2}}\left(\begin{matrix} \mathrm{i} \\1\end{matrix}\right) ~, \end{equation}

那么

\begin{equation} \langle\alpha| = \frac{1}{\sqrt{2}}(- \mathrm{i} , 1)~. \end{equation}

　　左矢和右矢之间可以做内积，就像一个行矢量和列矢量做内积（乘法）一样，得到一个数 $\langle\alpha|\beta\rangle = x \in \mathbb{C}$。还是刚才那个例子，

例 2　

\begin{equation} \langle\alpha|\alpha\rangle = 1~. \end{equation}

　　这样一组对应的左矢和右矢内积得 1 的称为单位向量，也叫归一的向量，归一的态，等等很多叫法。如果一个态没有归一，对它进行归一化的过程为

\begin{equation} |\beta\rangle\rightarrow\frac{|\beta\rangle}{\sqrt{\langle\beta|\beta\rangle}}~. \end{equation}

　　这里面其实用到了内积的一个小性质：$\langle\alpha|\beta\rangle = (\langle\beta|\alpha\rangle)^*$。读者可以验证一下。

　　我们说了这么久的态，但是我们知道在波动力学里面，我们描述一个态是利用它的波函数，一般是坐标的函数 $\psi(x)$。这个和我们的态有什么关系呢？

　　其实很有关系的。我先不着急透露，我们先想想内积的几何意义。$\langle\alpha|\beta\rangle$ 是不是相当于求出 $|\beta\rangle$ 是有多少成分在 $|\alpha\rangle$ 上么？也就是说，

\begin{equation} |\beta\rangle = \langle\alpha|\beta\rangle|\alpha\rangle + \text{ 与}|\alpha\rangle\text{垂直的成分}~. \end{equation}

　　那我们考虑这么一组态²，$|x\rangle$，它们代表一个态被完全的限制在了 $x$ 处无法移动。那么，一个归一的态 $|\psi\rangle$ 如果能写成坐标空间的波函数形式的话，其最有可能的样子就是

\begin{equation} \psi(x) = \langle x|\psi\rangle~. \end{equation}

　　由于无论是波函数还是态矢量（右矢），差一个复数相位都是不会有什么区别的，所以我们的粒子在 $x\rightarrow x'+\Delta x'$ 找到的概率，就像一般的量子力学问题里面说的那样，是

\begin{equation} \int_{x'}^{x'+\Delta x'}|\psi(x)|^2 \,\mathrm{d}{x} = \int_{x'}^{x'+\Delta x'} \langle\psi|x\rangle\langle x|\psi\rangle~. \end{equation}

　　如果对全空间积分，这个概率是 1，也就是说

\begin{equation} \int_{-\infty}^{\infty}\langle\psi|x\rangle\langle x|\psi\rangle = 1~. \end{equation}

　　这是一个平凡的结论，但是实际上这很有一点深意的，本章中间的部分可以看到。

　　捎带说一句，像 $\langle x|\alpha\rangle$ 这样，可以叫 $|\alpha \rangle$ 的 $x$ 表象。类似的还有动量表象等。不同表象之间的变换等问题随后会讲。

2. 算符

　　首先介绍一个很重要的算符：单位算符。别急，这个是很无聊，但是却有很重要的作用。而且，我们介绍的并不是那么无聊的形式。

　　考虑一组完备正交归一的态 $|\lambda_i\rangle$。单位算符 $I$ 就可以写成

\begin{equation} I = \sum_i |\lambda_i\rangle\langle\lambda_i|~, \end{equation}

　　这就被称为 resolution of identity。为了便于理解，我们来举一个例子。

例 3　

　　三维空间一个矢量

\begin{equation} \boldsymbol{\mathbf{v}} = v_x \boldsymbol{\mathbf{i}} + v_y \boldsymbol{\mathbf{j}} + v_z \boldsymbol{\mathbf{k}} ~. \end{equation}

其中，$v_x, v_y, v_z$ 可以通过 $\langle i\ (or\ j, k)|v\rangle$ 得到。

　　也就是说，

\begin{equation} \begin{split} |v\rangle &= v_x|i\rangle + v_y|j\rangle + v_z|k\rangle = |i\rangle\langle i|v\rangle + |j\rangle\langle j|v\rangle + |k\rangle\langle k|v\rangle\\ &= (|i\rangle\langle i|+|j\rangle\langle j|+|k\rangle\langle k|)|v\rangle~. \end{split} \end{equation}

　　正如式 11 ，我们有

\begin{equation} |\alpha\rangle = \sum_i |\lambda_i\rangle\langle\lambda_i|\alpha\rangle~, \end{equation}

　　还有很多一般的关于算符的理论。相信通过前面的理解，我们知道算符在某一组特定的正交完备归一基 $|\lambda_i\rangle$ 下可以表示为矩阵，而矩阵元

\begin{equation} A_{ij} = \langle\lambda_i|A|\lambda_j\rangle~. \end{equation}

一个物理量显然是一个实数，这实际上要求了它对应的算符是 Hermitian 算符，即

\begin{equation} \hat{A} = \hat{A} ^\dagger ,\quad i.e.,\quad A_{ij} = A_{ji}^*~. \end{equation}

（实际上，在满足 $\mathcal{PT}$ 对称性下这两件事情并不完全一致，不是 Hermitian 算符也可以得到全部实数的本征值，在章中不考虑这种事情）而不是物理量的算符并不非要是 Hermitian 的，如

\begin{equation} \left(\begin{matrix}0 & 1\\0 & 0\end{matrix}\right) \quad \& \quad \left(\begin{matrix}0 & 0\\1 & 0\end{matrix}\right)~. \end{equation}

介绍几个重要的二维 Hermitian：

\begin{equation} \sigma_0 = \left(\begin{matrix}1 & 0\\0 & 1\end{matrix}\right)~, \quad\sigma_1 = \left(\begin{matrix} 0 & 1\\1 & 0\end{matrix}\right)~, \quad\sigma_2 = \left(\begin{matrix} 0 & - \mathrm{i} \\ \mathrm{i} & 0\end{matrix}\right)~, \quad\sigma_3 = \left(\begin{matrix} 1 & 0\\0 & -1\end{matrix}\right)~. \end{equation}

上面四个矩阵被称为 Pauli 矩阵，有的时候也会写成四维（矩阵）矢量的形式，$ \boldsymbol{\mathbf{\sigma}} $。

　　这四个矩阵十分重要，尤其是在研究自旋 $1/2$ 体系的时候。这部分内容在后面讲角动量的时候你会时常见到。

　　关于算符还有很多内容，考虑到这是一个启发性的讲义，这里就不赘述了。我们可以从 Exercise 里面逐步学习：

习题 1　

　　定义

\begin{equation} \hat{A} = \left( \begin{matrix} 0 & 0 & 0 & \cdots \\ 1 & 0 & 0 & \cdots \\ 0 & \sqrt{2} & 0 & \cdots\\ 0 & 0 & \sqrt{3} & \cdots\\ & & & \ddots \end{matrix} \right)~. \end{equation}

求出下面算符的本征态和对应的本征值：

\begin{equation} \hat{H} = \hat{A} ^\dagger \hat{A} + \frac{1}{2}~. \end{equation}

　　接下来我们看一下算符的对易关系，其实与其相关的矩阵的对易关系想必你们都学过：

\begin{equation} \begin{split} [\hat{A},\hat{B}] \overset{def}{\equiv}\hat{A}\hat{B} - \hat{B}\hat{A}~,\\ \{\hat{A},\hat{B}\} \overset{def}{\equiv}\hat{A}\hat{B} + \hat{B}\hat{A}~.\\ \end{split} \end{equation}

这里不仅介绍了对易，也介绍了反对易。这两者同样常见，不同的是，前者经常出现于玻色体系，而后者经常出现于费米体系。

习题 2　

　　在习题 1 中，我们定义了算符 $\hat{A}$。那么，请计算

\begin{equation} [\hat{A},\hat{A} ^\dagger ] = ?~. \end{equation}

习题 3　

　　试证明，对于 $\forall \hat{A}, \hat{B}, \hat{C}$

\begin{equation} [\hat{A},[\hat{B},\hat{C}]] + [\hat{B},[\hat{C},\hat{A}]] + [\hat{C},[\hat{A},\hat{B}]] = 0~. \end{equation}

　　接下来简要介绍一下算符的完备性，证明暂时略去。可以证明的是，存在逆的 Hermitian 算符，即存在 $\hat{B}\hat{A} = I$ 的时候，如果这个 Hermitian 算符的本征态维数有限，那么这个本征态是完备的。如果无限维，这件事情不一定成立。至于有人问为什么无限维会带来 bug 呢？举个简单的例子证明无限维的时候好多概念都用不了。

例 4　

　　定义³一个无限维的完备正交归一解为 $|i\rangle, i = 0, 1, \cdots \infty$，那么考虑算符

\begin{equation} A = \sum_{i = 0}^{\infty} |i\rangle\langle i+1|,\quad B = \sum_{i = 1}^{\infty}|i\rangle\langle i-1|~. \end{equation}

那么，显然有

\begin{equation} AB = I,\quad BA = I - |0\rangle\langle0|~. \end{equation}

也就是说，逆矩阵这件事情实际上在无限维的时候定义有一定困难。

　　以上就是关于算符的一些一般性质。

3. 特殊的算符

　　我们知道，大多数情况下，一个粒子的哈密顿量都会包含动能部分，而动能的表示又是依靠动量的。很常见的，我们就会考虑动量算符 $\hat p$。这个算符的本征态和对应的本征值为

\begin{equation} \hat p|p_0\rangle = p_0 |p_0\rangle~. \end{equation}

而由于是连续的谱，归一化条件将是利用 delta 函数的

\begin{equation} \langle p_1|p_2\rangle = \delta(p_1-p_2)~, \end{equation}

　　这种连续的谱也会发生在坐标算符 $\hat x$ 上。类似的有

\begin{equation} \hat x|x_0\rangle = x_0 |x_0\rangle~, \end{equation}

\begin{equation} \langle x_1|x_2\rangle = \delta(x_1-x_2)~. \end{equation}

　　我们前面介绍过的 resolution of identity，这里的形式也需要改变：

\begin{equation} \int \,\mathrm{d}{p} |p\rangle\langle p| = I~, \end{equation}

\begin{equation} \int \,\mathrm{d}{x} |x\rangle\langle x| = I~. \end{equation}

不过这些都是小变化，仔细想想的话，其实很容易理解。

　　我们接下来要考虑的实际上是一个非常奇怪的问题：$\langle p|x\rangle = ?$。答案很简单，形式为

\begin{equation} \langle p|x\rangle = \frac{1}{\sqrt{2\pi \hbar}} \mathrm{e} ^{- \mathrm{i} px/\hbar}~. \end{equation}

但是具体怎么做的呢？我们先看一个貌似与这个问题并不是很相关的问题：平移问题。

　　让我们考虑沿着 $x$ 方向的平移算符 $\hat{\mathcal J}$:

\begin{equation} \hat{\mathcal{J}}( \,\mathrm{d}{x'} )|x'\rangle = |x'+ \,\mathrm{d}{x'} \rangle~. \end{equation}

有了这组性质之后我们实际上可以得到任何态 $|\alpha\rangle$ 是如何在这样一个平移下变换的，因为我们可以把它展开成坐标本征态的线性组合

\begin{equation} \hat{\mathcal{J}}( \,\mathrm{d}{x'} )|\alpha\rangle = \int\hat{\mathcal{J}}( \,\mathrm{d}{x'} )|x'\rangle\langle x'|\alpha\rangle \,\mathrm{d}{x'} = \int|x'+ \,\mathrm{d}{x'} \rangle\langle x'|\alpha\rangle \,\mathrm{d}{x'} ~. \end{equation}

有几点值得注意：这个算符满足很多性质，比如它是 Unitary 的，再比如说它是非常常见的可以线性组合的

\begin{equation} \begin{cases} \hat{\mathcal{J}}( \,\mathrm{d}{x'} )\hat{\mathcal{J}} ^\dagger ( \,\mathrm{d}{x'} ) = 1\\ \hat{\mathcal{J}}( \,\mathrm{d}{x'} )\hat{\mathcal{J}}( \,\mathrm{d}{x''} ) = \hat{\mathcal{J}}( \,\mathrm{d}{x'} + \,\mathrm{d}{x''} )\\ \hat{\mathcal{J}}(- \,\mathrm{d}{x'} ) = \hat{\mathcal{J}}^{-1}( \,\mathrm{d}{x'} )\\ \hat{\mathcal{J}}(0) = I \end{cases}~. \end{equation}

考虑到量子力学的基本假设⁴，$[x,p] = \mathrm{i} \hbar$，我们注意到

\begin{equation} \hat{x}\hat{\mathcal{J}}( \,\mathrm{d}{x'} )|x'\rangle = (x'+ \,\mathrm{d}{x'} )|x'+ \,\mathrm{d}{x'} \rangle~, \end{equation}

\begin{equation} \hat{\mathcal{J}}( \,\mathrm{d}{x'} )\hat{x}|x'\rangle = x'|x'+ \,\mathrm{d}{x'} \rangle~. \end{equation}

也就是说

\begin{equation} [\hat{x},\hat{\mathcal{J}}( \,\mathrm{d}{x'} )] \sim \,\mathrm{d}{x'} ~, \end{equation}

这里面的约等于号是考虑到 $|x'+ \,\mathrm{d}{x'} \rangle \sim |x'\rangle$。利用在 $ \,\mathrm{d}{x'} \rightarrow0$ 的时候 $\hat{\mathcal{J}}( \,\mathrm{d}{x'} )\rightarrow1$，我们得到

\begin{equation} \hat{\mathcal{J}}( \,\mathrm{d}{x'} ) \sim 1-\frac{ \mathrm{i} }{\hbar}\hat{p} \,\mathrm{d}{x'} ~. \end{equation}

例 5　

　　可以证明 $\hat{P}$ 是 Hermitian 的。一般这种问题的做法是看矩阵元，比如我有一套本征态 $|i\rangle$，定义 $P_{ij} \equiv \langle i|P|j\rangle$。如果他是 Hermitian 的，那么 $P_{ij} = P_{ji}^*$。但是这里的话，我们没有办法选取离散的本征态，不过即使只是连续本征态，也是可以的。最直觉的做法就是选取坐标本征态，我们规定 $P(x,x') = \langle x|P|x'\rangle$。我们只需要证明 $P(x,x') = P(x',x)^*$。这里简要地给出一个 “令人信服” 但不那么严格的说法。

　　我们有一个最方便的办法来计算，就是利用 $ \,\mathrm{d}{x'} $ 很小的时候的 $\hat{\mathcal{J}}( \,\mathrm{d}{x'} )$。

\begin{equation} \langle x|\hat{\mathcal{J}}(a)|x'\rangle \sim \langle x|x'\rangle - \frac{ \mathrm{i} }{\hbar} a \langle x|P|x'\rangle~. \end{equation}

也就是说

\begin{equation} P(x,x') \sim \mathrm{i} \frac{\hbar}{a}[\langle x|\hat{\mathcal{J}}(a)|x'\rangle - \langle x|x'\rangle] = \mathrm{i} \frac{\hbar}{a}[\langle x|x'+a\rangle - \langle x|x'\rangle]~, \end{equation}

而很类似的

\begin{equation} P(x',x) \sim \mathrm{i} \frac{\hbar}{a}[\langle x'|x+a\rangle - \langle x'|x\rangle]~, \end{equation}

\begin{equation} P(x,x')^* \sim - \mathrm{i} \frac{\hbar}{a} [\langle x'+a|x\rangle - \langle x'|x\rangle] = \mathrm{i} \frac{\hbar}{a} [\langle x'|x\rangle - \langle x'+a|x\rangle]~. \end{equation}

取 $a\rightarrow0$，上面的式子严格等于，而且两者的关系更一目了然。

4. 投影算符

　　这是一个概念，看起来并不是很有趣，但是我们在后面学习微扰理论的时候会发现它很重要。

　　它一般指这样一个算符：我们现在有一组正交完备归一的基 $\{|\alpha_i\rangle\}$。我们很关心一个初始在 $|\alpha_j\rangle$ 的基的行为，并且可以预料到，在其刚刚开始演化的时候，其大部分成分都还这个态上。这就有点像你把一根直线转了一个小角度，它沿原来方向的分量还是很大，如图 1 。

图 1：偏移一点的矢量与投影

　　很显然的，这个投影算符就可以用 $|\alpha_j\rangle\langle\alpha_j|$ 来表示。我们还是利用我们之前介绍过的一个例子来说明。

例 6　

　　三维空间一个矢量

\begin{equation} \boldsymbol{\mathbf{v}} = v_x \boldsymbol{\mathbf{i}} + v_y \boldsymbol{\mathbf{j}} + v_z \boldsymbol{\mathbf{k}} ~. \end{equation}

如果我要获得它的 $x$ 方向的投影，我首先要保证它在 $x$ 方向上，其次要保证它的大小。于是，最后得到

\begin{equation} \boldsymbol{\mathbf{v}} _x = v_x \boldsymbol{\mathbf{i}} = ( \boldsymbol{\mathbf{v}} \cdot \boldsymbol{\mathbf{i}} ) \boldsymbol{\mathbf{i}} = \langle i|v\rangle |i\rangle = |i\rangle\langle i| \boldsymbol{\mathbf{v}} ~. \end{equation}

　　投影算符不仅指投影到一个方向的，还指投影到一个平面上的投影算符，或者投影到 Hilbert 空间上更 “高维度” 的空间。

　　这个投影算符虽然现在看起来没有什么用，但是后面你会看到它的作用的。几个有趣的性质读者可以作为练习

习题 4　

　　请读者证明：如果 $\hat{P}$ 是投影算符，则

　　 (1) $\hat{P}\hat{P} = \hat{P}$

　　 (2) $1-\hat{P}$ 也是投影算符。

5. 算符的函数

　　我们很多时候可以写一些算符的函数来简化算符。大部分时候这种函数都是一目了然的，比如 $\hat{A}^2 = \hat{A}\cdot\hat{A}$，但有的时候也存在一些很微妙的东西。值得注意的是，无论什么时候，都要记得算符不一定是可对易的。

　　一个简单的函数，$f(\hat{A}) = \hat{A}^2$ 就容易造成初学者的失误。比如

\begin{equation} f(\hat{A}+\hat{B}) = \hat{A}^2 + \hat{A}\hat{B} + \hat{B}\hat{A} + \hat{B}^2~. \end{equation}

稍微复杂点的函数，比如

\begin{equation} \exp\left(\hat{A}\right) = I + \hat{A} + \frac{1}{2!}\hat{A}^2 + \cdots~ \end{equation}

也是非常常见的一种算符函数。

习题 5　

　　考虑一个体系，它的 Hilbert 空间是二维的，并且计 $\left(\begin{matrix}1 \\0\end{matrix}\right) = |\!\uparrow\rangle, \left(\begin{matrix}0 \\1\end{matrix}\right) = |\!\downarrow\rangle$。现在有一个算符

\begin{equation} \hat{U} = \exp\left( \mathrm{i} \alpha(t) \sigma_x\right) ~. \end{equation}

其中，$\sigma_x$ 是式 18 定义的 Pauli 矩阵，那么求

\begin{equation} \hat{U} \left(\begin{matrix}1 \\0\end{matrix}\right) = ? ~. \end{equation}

显然，我们有

\begin{equation} \hat U= I_{2\times2} + \alpha(t) \sigma_x + \frac{1}{2!}\left(\alpha(t) \sigma_x\right)^2 + \dots~, \end{equation}

由于 Pauli 矩阵有很好的性质：

\begin{equation} \sigma_x^2 = I_{2\times2}~. \end{equation}

我们有

\begin{equation} \begin{split}\hat U &= \left(1 - \frac{1}{2!}\alpha(t)^2 + \frac{1}{4!}\alpha(t)^4 \cdots\right) I_{2\times2} + \left(\alpha(t) + \frac{1}{3!}\alpha(t)^3 + \cdots \right) \mathrm{i} \sigma_x\\ & = \cos\alpha(t) I_{2\times2} + \sin\alpha(t) \mathrm{i} \sigma_x ~. \end{split} \end{equation}

从而，我们有

\begin{equation} \hat U \left(\begin{matrix}1 \\0\end{matrix}\right) = \left(\begin{matrix}\cos\alpha(t) \\ \mathrm{i} \sin\alpha(t)\end{matrix}\right)~, \end{equation}

　　这个例子实际上在我们后面看到动力学分析中是一个很常见的``量子演化问题''的基本处理。以后我们会再次看到这个问题的。

　　以上是一个带答案的练习，现在我们出一个证明性的练习。

习题 6　

　　求证：

\begin{equation} \mathrm{e} ^{\hat A}\hat B \mathrm{e} ^{-\hat A} = \hat{B} + [\hat A,\hat B] + \frac{1}{2!} [\hat A, [\hat A,\hat B]] + \cdots~. \end{equation}

这个等式叫做 Baker-Hausdorff formula，我们可能会经常地遇到这个式子。

6. $^\star$ 密度矩阵，与量子信息基本概念

　　量子信息可以说是只要具备完善的量子力学知识就能够入门，但是入的好不好得看初等数学功力的一个方向。

　　量子信息里面一个重要的概念就是密度矩阵。对于纯态（Pure State），即一个可以被用态矢量描述的态，归一态矢量为 $|\psi\rangle$，其密度矩阵可以用

\begin{equation} \hat\rho_{\psi} = |\psi\rangle\langle\psi|~ \end{equation}

来描述。这样的描述可以略去态矢量的相位，是自由度更小的更 “好” 的描述。

　　纯态密度矩阵有很多性质，比如

\begin{equation} \hat\rho = \hat\rho ^\dagger ,\ \text{Tr}(\hat\rho) = 1,\ \text{Tr}(\hat\rho^2) = 1~. \end{equation}

这是由于

\begin{equation} \rho^2 = |\psi\rangle\langle\psi|\psi\rangle\langle\psi| = |\psi\rangle\langle\psi| = \rho~, \end{equation}

一个算符在这个态下的平均值

\begin{equation} \langle\hat O\rangle = \langle\psi|\hat O|\psi\rangle = \text{Tr}(\hat O\hat \rho)~ \end{equation}

与纯态相对的是混态（Mixed State）。我们来想这么一个问题：纯态就是一个态，按照统计的观点，它的熵就是 $\ln 1 = 0$。而如果我们这个体系描述的东西内部很复杂，各个态之间自发的跳动，我们不能简单的用一个态来描述，怎么办呢？我们仍然能用密度矩阵来描述。一个最基本的要求就是这个密度矩阵的性质得和纯态一致，即

\begin{equation} \hat\rho = \hat\rho ^\dagger ,\ \text{Tr}(\hat\rho) = 1~. \end{equation}

一个算符在这个态下的平均值

\begin{equation} \langle\hat O\rangle = \langle\psi|\hat O|\psi\rangle = \text{Tr}(\hat O\hat \rho)~, \end{equation}

　　我们再来看看密度矩阵的一些行为。由于它是 Hermitian，我们通过某种对角化，显然可以把密度矩阵写成

\begin{equation} \rho = \sum_i\lambda_i|i\rangle\langle i|,\quad \sum_i\lambda_i = 1,\quad \forall i\lambda_i > 0 ~. \end{equation}

这部分有点数学，而且有的时候并不有趣，我们来看一个练习。

习题 7　

　　假设存在一系列的密度矩阵 $\rho_j$，和一些复数 $c_j, \sum c_j = 1 \& \forall j, c_j>0$。证明：

\begin{equation} \sum_j c_j \rho_j~ \end{equation}

也是一个密度矩阵。

　　一个系统处于某个态的时候可以求它的熵，其中，目前广泛接受并应用的熵是 von Neumann 熵，其定义为

\begin{equation} S=-\text{Tr}(\hat\rho\ln\hat\rho)=-\sum_i\lambda_i\ln\lambda_i~. \end{equation}

当然，对于纯态，$S=0$，但是对于混态则不然。会想热力学，我们知道熵有一个很有趣的结论，我们这里留作练习。

习题 8　

　　 von Neumann 熵满足两个系统的混杂会增大熵，数学上讲也就是

\begin{equation} S[\lambda\hat\rho_1+(1-\lambda)\hat\rho_2]\ge\lambda S[\hat\rho_1]+(1-\lambda) S[\hat\rho_2],\quad \forall \hat\rho_1,\rho_2,\quad 0<\lambda<1~. \end{equation}

试证明这点（答案：Nielsen⁵, section 11.3.5）。

　　有的时候，我们要考虑多粒子的问题。当然真正的量子多粒子问题我们在 “全同粒子的统计” 中再仔细考虑，我们这里先看一些简单的情况，比如定域的（从而就不需要考虑全同性了）。有两个粒子 $a, b$，其各自 Hilbert 空间为 $\mathcal{H}_a, \mathcal{H}_b$。那么，整体 Hilbert 空间，代数的讲，就变成了两个粒子各自 Hilbert 空间的张量积⁶：$\mathcal{H} = \mathcal{H}_a\otimes \mathcal{H}_b$。这时候我们定义约化密度矩阵”（reduced density matrix），来得到单粒子的信息。比如，我们如果想了解 $a$ 粒子，那么就可以写它的对 $a$ 的约化密度矩阵 $\hat\rho_a=\text{Tr}_b(\hat\rho)$，其是通过对 $\mathcal{H}_b$ 做部分取迹做到的。技术上讲，这是通过用一组完备的基 $|\phi_i\rangle \in\mathcal{H}_b$ 来做到的：

\begin{equation} \langle\psi_1\hat\rho_a|\psi_2\rangle=\sum_i\langle\psi_1\otimes\phi_i|\hat\rho|\psi_2\otimes\phi_i\rangle~, \end{equation}

　　我们用一个练习来结束这一部分。

习题 9　

　　求 trace 自然会发生很多事情，一个显然的事情就是两体关联的失去：

\begin{equation} \begin{split} S_{a\otimes b}[\hat\rho]&=\text{Tr}_{a\otimes b}(-\hat\rho\ln\hat\rho)\le S_a[\hat\rho_a]+S_b[\hat\rho_b]\\ &=\text{Tr}_a(-\hat\rho_a\ln\hat\rho_a)+\text{Tr}_b(-\hat\rho_b\ln\hat\rho_b)=S_{a\otimes b}[\hat\rho_a\otimes\hat\rho_b]~. \end{split} \end{equation}

试证明这一点（答案：Trace⁷），并验证对于 Bell 基，比如

\begin{equation} |\psi\rangle = \frac{1}{\sqrt{2}}(|0\rangle|1\rangle-|1\rangle|0\rangle)~, \end{equation}

这个不等式是成立的。

　　这是量子信息论的一个经常需要考虑的事情，很多量子信息相关的书，比如 XiaoGang Wen 的书⁸ 都介绍了这点，在此不再赘述。

　　我们这里再讲有关密度矩阵的一个知识：在有限温度的时候，密度矩阵如何表示（一般我们处理的时候都是处理零温问题，不考虑统计分布）。其实很简单：

\begin{equation} \rho= \exp\left(-\hat{H}/k_BT\right) /Z~. \end{equation}

其中，$Z=\text{Tr} \exp\left(-\hat{H}/k_BT\right) $。更多的关于密度矩阵，量子信息的内容就不在此赘述了。

7. 测量，不确定性原理

　　测量发生于一个 Hermitian 算符 $\hat A$ 在纯态或者混态 $\hat\rho$ 上。最终得到的结果是算符 $\hat A$ 的本征值 $\lambda$，而测量得到这个本征值 $\lambda$ 的概率是 $P_\lambda=\text{Tr}(\hat{P}_\lambda\hat\rho)$，而这里 $\hat P_\lambda=\sum|\hat{A}=\lambda\rangle\langle\hat{A}=\lambda|$ 是投影算符。可以想象，统计上来说，平均的测量值是 $\hat A$ 在态 $\hat\rho$ 上的期待值，也就是 $\text{Tr}(\hat A\hat\rho)=\sum_\lambda \lambda P_\lambda$。其中，对于纯态，就是简单的 $\langle\psi|\hat A|\psi\rangle, \hat\rho=|\psi\rangle\langle\psi|$。

　　量子力学有几个假设，其中比较有名的（你们或许在此前就听说过）就是``塌缩''假设：如果测量的结果是 $\lambda$，那么这个量子态就会塌缩到 ${\hat P_\lambda\hat\rho\hat P_\lambda}/{\text{Tr}(\hat P_\lambda\hat\rho)}$。特例就是当本征值为 $\lambda$ 的态只有一个的话，系统就会塌缩到 $|\hat{A}=\lambda\rangle$ 上。下面一个练习是对这一点的直接应用。

习题 10　

　　考虑一个系统，它的态可以用角动量 $l$、角动量 $z$ 分量 $m$ 的共同本征态展开为

\begin{equation} \begin{aligned} |\psi\rangle = &\frac{1}{\sqrt{2}}\left(\frac{1}{2}|l=1,m=1\rangle+\frac{1}{\sqrt{2}}|l=1,m=0\rangle+\frac{1}{2}|l=1,m=-1\rangle\right) \\ &+ \frac{1}{\sqrt{2}}|l=0,m=0\rangle~. \end{aligned} \end{equation}

现在测它的角动量 $z$ 分量，测到 $m=0$。求测量完的体系处于什么态（用密度矩阵和态矢分别写出）。

　　量子信息学的一个很重要的（也看起来很平庸的）结论是：通过测量，我们得到了信息。而得到了信息也就是说，熵见笑了。这换成数学语言就是说

\begin{equation} S[\hat\rho]\ge\sum_\lambda P_\lambda S[\hat\rho_\lambda]~. \end{equation}

其中，$\hat\rho_\lambda$ 表示测量到塌缩到的 $\lambda$ 态。我们看一个例子。

习题 11　

　　考虑一个密度矩阵

\begin{equation} \hat\rho =\frac{1}{4}[\mathbb{I}-\sigma_1\otimes\sigma_2]~. \end{equation}

　　 1. 求验算：它是否是一个纯态？

　　 2. 定义算符 $\hat A=\sigma_1\otimes\sigma_0$，求它的本征值，并定义投影到这些本征值的投影算符，计算进行该算符的测量后得到各个本征值的概率，并验证我们之前对于测量得到信息的结论。

　　接下来，也就是本章的最后，我们来看不确定性原理。

　　对于 Hermitian 算符 $\hat A\&\hat B$，不确定原理告诉我们

\begin{equation} (\langle\hat A^2\rangle-\langle\hat A\rangle^2)(\langle\hat B^2\rangle-\langle\hat B\rangle^2)\ge\frac{1}{4}|\langle[\hat A,\hat B]\rangle|^2~. \end{equation}

其中，$\langle\cdot\rangle$ 是其在某个量子态 $\hat\rho$ 下的期待值。

　　证明如下：首先，定义所谓两个算符（不一定是 Hermitian）的内积：

\begin{equation} (\hat A, \hat B)=\langle\hat A ^\dagger \hat B\rangle = \text{Tr}(\hat A ^\dagger \hat B\hat\rho)~. \end{equation}

不难看出，它是满足内积的性质的（线性、共轭）。现在考虑两个新的算符 $\hat A'=\hat A-\langle\hat A\rangle, \hat B'=\hat B-\langle\hat B\rangle$，此时

\begin{equation} \begin{split} \frac{1}{4}|\langle[\hat A,\hat B]\rangle|^2&=\frac{1}{4}|\langle[\hat A',\hat B']\rangle|^2 \\ &=\frac{1}{2}(\hat A',\hat B')(\hat B',\hat A')-\frac{1}{4}(\hat A',\hat B')^2-\frac{1}{4}(\hat B',\hat A')^2\\ &=[\text{Im}(\hat A',\hat B')]^2\\ &\le |(\hat A',\hat B')|^2\le(\hat A',\hat A')(\hat B',\hat B')\\ &=(\langle\hat A^2\rangle - |\langle\hat A\rangle|^2)(\langle\hat B^2\rangle - |\langle\hat B\rangle|^2)~. \end{split} \end{equation}

　　补充几个练习题

习题 12　

　　如果 $[\hat A,\hat B]=\hat B^2$，用 $\hat B$ 表示 $ \mathrm{e} ^{\hat A}\hat B \mathrm{e} ^{\hat A}$。

习题 13　

　　矢量 $ \boldsymbol{\mathbf{A}} , \boldsymbol{\mathbf{B}} $ 为三维矢量，而 $ \boldsymbol{\mathbf{\sigma}} $ 则是 Pauli 矩阵的矢量，计算 $[ \boldsymbol{\mathbf{A}} \cdot \boldsymbol{\mathbf{\sigma}} , B\cdot \boldsymbol{\mathbf{\sigma}} ]$

习题 14　

　　矢量 $ \boldsymbol{\mathbf{n}} $ 为三维实数矢量，而 $ \boldsymbol{\mathbf{\sigma}} $ 则是 Pauli 矩阵的矢量，计算 $ \exp\left( \mathrm{i} \theta \boldsymbol{\mathbf{n}} \cdot \boldsymbol{\mathbf{\sigma}} \right) $，并计算 $ \exp\left( \mathrm{i} \theta \boldsymbol{\mathbf{n}} \cdot \boldsymbol{\mathbf{\sigma}} \right) ( \boldsymbol{\mathbf{A}} \cdot \boldsymbol{\mathbf{\sigma}} ) \exp\left(- \mathrm{i} \theta \boldsymbol{\mathbf{n}} \cdot \boldsymbol{\mathbf{\sigma}} \right) $

1. ^ 其实这有约定俗成的翻译：厄米；然而，这个翻译实在是不能达意，我并不打算使用它。
2. ^ 实际上有不可数无穷个态，而且归一的办法和我们之前说的不完全一样，但是这里就先不管数学上这样会不会带来问题了
3. ^ 从这里开始，后面很可能有的时候算符不写它的那个 “帽子” $\hat{\ }$ 了。
4. ^ 我后面可能会总结一下基本假设，但也可能不总结了 orz
5. ^ M. A. Nielsen and I. L. Chuang, Quantum Computation and Quantum Information (Cambridge University Press, 2010).
6. ^ 张量积的矩阵表达：$A\otimes B$ 就是把 $A$ 中的每个元素 $A_{ij}$ 变成一个矩阵 $A_{ij}\cdot B$。
7. ^ H. Araki and E. H. Lieb, Communications in Mathematical Physics 18, 160 (1970).
8. ^ B. Zeng, X. Chen, D. Zhou, and X. Wen, ArXiv e-prints (2015), arXiv:1508.02595 [cond-mat.str-el].

致读者：小时百科一直以来坚持所有内容免费无广告，这导致我们处于严重的亏损状态。长此以往很可能会最终导致我们不得不选择大量广告以及内容付费等。因此，我们请求广大读者热心打赏 ，使网站得以健康发展。如果看到这条信息的每位读者能慷慨打赏 20 元，我们一周就能脱离亏损，并在接下来的一年里向所有读者继续免费提供优质内容。但遗憾的是只有不到 1% 的读者愿意捐款，他们的付出帮助了 99% 的读者免费获取知识，我们在此表示感谢。