贡献者: ASAHI
在量子力学的学习中,我们了解了测量公设。粗略地来讲,在量子态上进行对某个可观测量的测量,就会让这个量子态坍缩到这个可观测量的某个本征态上,同时返回这个本征态对应的本征值作为测量结果。得到这个本征态的概率由 Born 定则给出。在本节中,我们将会从量子信息的角度来研究量子测量,首先我们会回顾投影测量的基本结构,然后我们将会介绍 von Neumann 的测量理论,最后我们将会给出投影测量的推广——POVM 测量。
1. 投影测量
在数学上我们知道,可观测量 $A$ 对应的是一个厄米算符,谱分解定理表明 $A$ 的本征向量构成一组 Hilbert 空间的完备正交基,也即(先假设没有发生本征值的简并)
\begin{equation}
A=\sum_i\lambda_i \left\lvert i \right\rangle \left\langle i \right\rvert ~.
\end{equation}
对于待测量的物理系统,我们可以用这一组完备正交基来对量子态进行展开,具体来说,对于一个量子态 $ \left\lvert \psi \right\rangle $,在上面测量 $A$ 得到结果 $\lambda_i$ 的概率为 $p(\lambda_i)=| \left\langle \psi \middle| i \right\rangle |^2$。
对于含有简并的情况也可以类似地处理。虽然在这种情况下本征态分解并不唯一,但是总可以先考虑 $A$ 的一个特定分解,然后考虑在这一分解下与 $A$ 具有相同本征态的另一个厄米算符 $A'$,但是其本征值 $\lambda_i'$ 不含简并。在这种情况下对 $A$ 进行测量应当理解为 “先对量子态进行了 $A'$ 所对应的投影测量,再对测量结果 $\lambda_i'$ 重新标记为 $A$ 再相应本征态 $ \left\lvert i \right\rangle $ 上所对应的本征值 $\lambda_i$”。换句话说,含有简并的情况下的投影测量相当于是对不含简并的情况的测量的一种粗粒化。
现在我们就可以在数学上重新审视什么是投影测量了。在量子力学中,更一般的投影测量 $\Pi$ 被定义为一些投影算符的集合:
$$
\Pi=\left\{\Pi_j: \Pi_i \Pi_j=\delta_{i j} \Pi_i, \sum_j \Pi_j=\mathbb{I}\right\}~.
$$
两个条件分别对应着正交性和完备性。不含简并的测量相当于在说每一个 $\Pi_j$ 都是秩为 1 的,即可以写作 $\Pi_j= \left\lvert j \right\rangle \left\langle j \right\rvert $。
由测量公设可以得到,当我们对一个系统进行投影算符 $\Pi_j$ 所对应的投影测量,我们会得到下面的结果:
- 如果测量前的量子态处于 $ \left\lvert \psi \right\rangle $,那么测量得到结果 $\lambda_i$ 的概率为
\begin{equation}
p(\lambda_i)=\Vert \Pi_i \left\lvert \psi \right\rangle \Vert^2= \left\langle \psi \right\rvert \Pi_i \left\lvert \psi \right\rangle ~.
\end{equation}
- 如果测量得到结果 $\lambda_i$,测量后的系统将会演化为下面的归一化量子态
\begin{equation}
\frac{\Pi_i \left\lvert \psi \right\rangle }{\Vert\Pi_i \left\lvert \psi \right\rangle \Vert}~.
\end{equation}
- 测量结果的平均值为
\begin{equation}
\langle A\rangle \equiv \sum_i \lambda_i p\left(\lambda_i\right)=\sum_i \lambda_i\left\langle\psi\left|\Pi_i\right| \psi\right\rangle=\langle\psi|A| \psi\rangle~.
\end{equation}
如果是在混态上进行测量的,很容易得到此时的平均值可以表示为
\begin{equation}
\langle A\rangle=\operatorname{Tr}(\rho A)~.
\end{equation}
习题 1
如果量子态是混态而不是纯态,那么上面的这些结论应该如何进行改写呢?
2. von Neumann 测量模型
von Neumann 的测量模型是试图理解量子态测量和坍缩的重要尝试。这一模型的基本想法是,测量仪器会和待测系统因为某种动力学过程而耦合起来,从而可以通过对测量仪器进行观测从而导致对量子系统的观测。考虑一个最简单的例子,即对量子比特态 $ \left\lvert \psi \right\rangle =a \left\lvert 0 \right\rangle +b \left\lvert 1 \right\rangle $ 进行计算基上的投影测量。那么测量的过程可以被描述为
- 初始状态:待测量量子态处于 $ \left\lvert \psi \right\rangle _S=a \left\lvert 0 \right\rangle _S+b \left\lvert 1 \right\rangle _S$,测量设备处于 $ \left\lvert 0 \right\rangle _M$ 状态。
- 测量设备与量子态发生相互作用:整体的量子态演化为 $a \left\lvert 0 \right\rangle _S \left\lvert 0 \right\rangle _M+b \left\lvert 1 \right\rangle _S \left\lvert 1 \right\rangle _M$。
- 坍缩:测量设备处于宏观可区分状态 $ \left\lvert 0 \right\rangle _M$ 或 $ \left\lvert 1 \right\rangle _M$,且整体量子态发生坍缩。整体量子态分别以 $|a|^2$ 和 $|b|^2$ 的概率坍缩到 $ \left\lvert 0 \right\rangle _S \left\lvert 0 \right\rangle _M$ 和 $ \left\lvert 1 \right\rangle _S \left\lvert 1 \right\rangle _M$。
在更加精细的 von Neumann 测量模型中,还会对这一耦合的动力学过程进行更详细的建模。比如我们想要研究的系统的 Hamiltonian 为 $H$(我们想要去测量这个 Hamiltonian 的本征谱),测量设备由一个指针来代表,它可以被建模成一个一维自由粒子。在这种情况下,总系统的耦合 Hamiltonian 由 $H\otimes p$ 来表示。如果这个指针的质量足够大以至于可以忽略其动能项,那么演化算符可以表示为
\begin{equation}
e^{-i t H \otimes p}=\sum_a\left[\left|E_a\right\rangle\left\langle E_a\right| \otimes e^{-i t E_a p}\right]~.
\end{equation}
其中 $ \left\lvert E_a \right\rangle $ 是 $H$ 的本征值为 $E_a$ 的本征态。如果初始的指针制备在 $ \left\lvert x=0 \right\rangle $,那么上述演化算符便会让系统实现演化
\begin{equation}
\sum_a c_a \left\lvert E_a \right\rangle \otimes \left\lvert x=0 \right\rangle \mapsto \sum_a c_a \left\lvert E_a \right\rangle \otimes \left\lvert x=tE_a \right\rangle ~.
\end{equation}
这就代表着我们可以通过直接对指针进行测量来获得量子系统的信息。
当然了,von Neumann 测量仍然没有回答为什么量子态会坍缩这个问题,而是把问题从量子系统本身丢到了测量仪器乃至于观测者上。但是无论怎样,这样的测量模型仍然给了后续研究者以很大启发,比如上世纪 80 年代提出的弱测量技术便是在 von Neumann 测量的基础上得以提出的。
3. POVM 测量
在量子系综中我们已经明白了一个重要的哲学:量子信息中的纯态在物理上代表着封闭系统的描述,在信息上代表着我们掌握着系统的全部信息,在概率的角度则代表着系统中没有任何经典概率的成分。而量子信息中的混态在物理上代表着和外界耦合后对原系统的描述,在信息上代表着有一部分信息没有被我们掌握,在概率上代表着存在经典概率的成分。
从这三个出发点:物理,信息和概率的角度,我们都可以将传统的投影测量进行推广。具体来说,我们可以考虑以下三个问题作为出发点:
- 如果我们将物理系统和环境进行耦合,然后进行整体的幺正演化,然后再在环境上进行投影测量,那么这个投影测量会对物理系统对应的密度矩阵产生什么样的变化?
- 如果投影测量本身存在着瑕疵,比如说测量设备的分辨率有限,导致我们无法精确地区分两个相邻的本征值,那么这时的投影测量应该被描述成什么样的操作?
- 考虑这样一个测量设备,输入一个未知的量子比特态后,它会以 50%的概率进行 $Z$ 基矢测量,以 50%的概率进行 $X$ 基矢测量。测量后会输出 $\{\pm1\}$ 作为测量结果。这个设备对应的测量是什么?
我们将会看到,正如量子系综中,这三个角度都会导向密度矩阵和混态一样,在测量理论中这三个角度都会导向相同的作为投影测量的推广——POVM 测量。
在定义 POVM 测量之前,我们先引入一个推广版本的测量公设:
定理 1 广义测量公设
(广义)量子测量操作由一组测量算符 $\{M_m\}_m$ 描述,作用于待测量系统的 Hilbert 空间上,指标 $m$ 对应着实验上可能的测量结果。如果测量过程刚开始时量子系统处于状态 $\rho$,那么结果 $m$ 发生的概率为
\begin{equation}
p(m)=\operatorname{Tr}(M_m\rho M_m^\dagger)~.
\end{equation}
测量后相应的系统末态变为
\begin{equation}
\frac{M_m\rho M_m^\dagger}{\operatorname{Tr}(M_m\rho M_m^\dagger)}~.
\end{equation}
容易看出,概率的求和归一性可以得到对测量算符的约束
\begin{equation}
\sum_m p(m)=\sum_m\operatorname{Tr}(M_m\rho M_m^\dagger)=\operatorname{Tr}(\sum_m\rho M_m^\dagger M_m)=1=\operatorname{Tr}(\rho)~.
\end{equation}
即
\begin{equation}
\sum_m M_m^\dagger M_m=\mathbb{I}~.
\end{equation}
为了说明这种测量公设确实是投影测量的推广,只需要注意到当测量算符 $M_m$ 刚好是向 $ \left\lvert m \right\rangle $ 的投影 $M_m=\Pi_m= \left\lvert m \right\rangle \left\langle m \right\rvert $ 时,投影测量的公设就能得到满足。
POVM 测量的定义便是基于这一版本的测量公设。具体来说,我们定义一个新的算符
\begin{equation}
E_m=M_m^\dagger M_m~.
\end{equation}
它被称为 POVM 元素,并称集合 $\{E_m\}_m$ 为一个 POVM。在上述的定义下不难验证这些 POVM 元素拥有这些性质:
- $E_m\ge 0$
- $E_m=E_m^\dagger$
- $\sum_m E_m=\mathbb{I}$
投影测量是 POVM 测量的特殊情况,即测量算符和 POVM 元素相同:$E_m=M_m^\dagger M_m=M_m$。
习题 2
考虑这样一个测量设备,输入一个未知的量子比特态后,它会以 50%的概率进行 $Z$ 基矢测量,以 50%的概率进行 $X$ 基矢测量。测量后会输出 $\{\pm1\}$ 作为测量结果。这个设备对应的 POVM 元素是什么?
4. Naimark 定理
我们已经知道了一个混态的纯化是一个更大的系统上的纯态。对于 POVM 来说也有类似的结果,即任何 POVM 测量都可以看作是一个更大的系统上的投影测量。这一结果在数学上被称为 Naimark 定理:
定理 2 Naimark
对任意一个包含 $n$ 个半正定算符 $E_a$,且满足 $\sum_{a=1}^n E_a=\mathbb{I}$ 的 POVM,可以通过将 Hilbert 空间扩展到一个更大的空间,并且在这个更大的空间中进行投影测量来实现。
证明:不失一般性,我们认为所有 POVM 元素 $E_a$ 都是秩为 1 的,这可以通过对所有秩不为 1 的 POVM 元素进行分解得到。
考虑 $\operatorname{dim}\mathcal{H}=N$ 的 Hilbert 空间,其中所有的 POVM 可以表示为
\begin{equation}
E_a= \left\lvert \psi_a \right\rangle \left\langle \psi_a \right\rvert ~.
\end{equation}
注意这里的 $ \left\lvert \psi_a \right\rangle =\sum_{i=1}^N\psi_{ai} \left\lvert i \right\rangle $ 不一定是归一化的,那么 POVM 元素的归一化条件要求
\begin{equation}
\sum_{a=1}^n\left(E_a\right)_{i j}=\sum_{a=1}^n \psi_{a i}^* \psi_{a j}=\delta_{i j}~.
\end{equation}
该表达式中的 $\sum_{a=1}^n \psi_{a i}^* \psi_{a j}$ 可以被分解成两个 $n$ 维向量 $\boldsymbol{\psi}_i$ 和 $\boldsymbol{\psi}_j$ 的内积。其中 $\boldsymbol{\psi}_i=\left(\psi_{1 i}, \psi_{2 i}, \cdots, \psi_{n i}\right)^{\mathrm{T}}$,$\boldsymbol{\psi}_j=\left(\psi_{1 j}, \psi_{2 j}, \cdots, \psi_{n j}\right)^{\mathrm{T}}$。这 $N$ 个向量构成了一组标准正交基。我们可以将这些向量扩展到 $n$ 维空间的标准正交基,也就是说,可以找到 $n$ 个 $n$ 维列向量 $\boldsymbol{u}_i$,这样 $\forall a\in[n]$,有
\begin{equation}
\sum_{a=1}^n u_{a i}*u_{a j}=\delta_{ij}~.
\end{equation}
其中 $u_{ai}=\psi_{ai},\forall a\in[n],i\in[N]$。
可以验证此时的 $\{u_{ai}\}$ 构成了一个幺正矩阵。因此它的列也构成一组标准正交基。注意对于每一列来说,由前 $N$ 项构成的向量与(未)归一化的向量 $ \left\lvert \psi_a \right\rangle $ 保持一致。这表明我们可以扩大 Hilbert 空间,并定义其中的标准正交基 $ \left\lvert u \right\rangle $。在这种情况下,POVM 就被扩展成为了更大的 Hilbert 空间中的投影测量,这种测量由 $ \left\lvert u_a \right\rangle \left\langle u_a \right\rvert $ 给出。
习题 3
给定如下的一组 2 维 Hilbert 空间中的 POVM 测量 $ \left\lvert \psi_a \right\rangle \left\langle \psi_a \right\rvert $:
\begin{equation}
\begin{aligned}
\left|\psi_1\right\rangle & =|0\rangle \\
\left|\psi_2\right\rangle & =\frac{1}{\sqrt{3}}|0\rangle+\sqrt{\frac{2}{3}}|1\rangle \\
\left|\psi_3\right\rangle & =\frac{1}{\sqrt{3}}|0\rangle+\sqrt{\frac{2}{3}} e^{i \frac{2 \pi}{3}}|1\rangle \\
\left|\psi_4\right\rangle & =\frac{1}{\sqrt{3}}|0\rangle+\sqrt{\frac{2}{3}} e^{i \frac{4 \pi}{3}}|1\rangle~.
\end{aligned}
\end{equation}
试通过模仿 Naimark 定理的证明,找到一组能够实现这一组 POVM 测量的投影测量。