贡献者: certain_pineapple; addis
1 von Neumann 熵的形式来自于 Shannon 熵。
值得注意的是,定义 1 中 von Neumann 熵的底数并未指明,在某些文献中底数被定义为 $2$,在某些文献中底数则被定义为 $ \mathrm{e} $,请读者在阅读相关文献时自行判断,在大多数情况下两者并无任何本质区别,仅仅相差一个倍数,所以我们仅在涉及到 von Neumann 熵的具体数值的时候,比如讨论纠缠熵的连续性时指明底数。
von Neumann 度量了一个混态的密度矩阵的 “混乱程度”,正如约化密度矩阵中提到,如果一个大系统的纯态对其中的某一个子系统取偏迹,同时如果得到了一个混态而非纯态,那么代表该子系统与剩余部分存在纠缠,这时求完偏迹的密度矩阵的 von Neumann 熵就给出了一个度量纠缠的方法,这既是其纠缠熵名字的由来。
量子相对熵类似于经典相对熵,$\rho$ 到 $\sigma$ 的量子相对熵定义为:
接下来我们证明 Klein 不等式,也就是量子相对熵非负:
假设 $\rho = \sum\limits_ip_i \left| u_i \right\rangle \left\langle u_i \right| $,$\sigma = \sum\limits_jq_j \left| v_j \right\rangle \left\langle v_j \right| $。
带入量子相对熵的表达式:
其中 $P_{ij} = \left\lvert \left\langle u_i \middle| v_j \right\rangle \right\rvert ^2 \geqslant 0$。易得 $\sum\limits_i P_{ij} = \sum\limits_j P_{ij} = 1$($u_i$ 在另一组标准正交基 $\left\{v_j\right\}$ 下展开系数模方和为 1)。
考虑对数函数的凹凸性,则 $\sum\limits_j P_{ij}\log q_j \leqslant \log\left(\sum\limits_j P_{ij}q_j\right) = \log \left(r_i\right)$。当且仅当 $P$ 矩阵为置换阵时,不等式取等号。
且 $\sum\limits_i r_i = \sum\limits_{ij}P_{ij}q_j = \sum\limits_jq_j = 1$,即 $\left\{r_i\right\}$ 可视作一概率分布。
则有:
可以看出式 6 最后的形式是概率分布 $\left\{p_i\right\}$ 对概率分布 $\left\{r_i\right\}$ 的经典相对熵,由经典相对熵的非负性有 $\sum\limits_i p_i \log\frac{p_i}{r_i}\geqslant 0$。
则 $S\left(\rho || \sigma\right)\geqslant 0$。由此我们证明了量子相对熵是非负的。
von Neumann 熵有以下几条性质:
密度矩阵 $\rho$ 的 von Neumann 熵当且仅当 $\rho$ 表示纯态时为 0。我们在定义量子态的 von Neumann 熵时定义 1 ,规定了 $0\log 0 = 0$,纯态在计算 von Neumann 熵时仅会出现 $1\log 1$ 和 $0\log 0$ 项,均为 0,则纯态的纠缠熵也为 0。
von Neumann 熵存在上限,$d$ 维的希尔伯特空间中的量子态的 von Neumann 熵的最大值为为 $\log d$,当且仅当 $\rho = \frac{1}{d}I$ 时取到最大值。
对于这个上限的证明并不复杂,得益于我们已经在前文中证明了量子相对熵非负,所以我们仅需要计算一个量子态与 $\frac{1}{d}I$ 之间的量子相对熵即可。
所以我们可以得到 $S\left(\rho\right) \leqslant \log d$
如果复合系统 $AB$ 总体处于纯态,$\rho_A$ 和 $\rho_B$ 分别为其在 $A$ 区域和在 $B$ 区域分别的约化密度矩阵,那么其 von Neumann 熵相等。
对于定义在 $AB$ 两区域上的纯态 $ \left\lvert \psi \right\rangle $,我们取维数较大的 $N$ 维子空间称为空间 $A$,我们总可以取 $A$ 区域的一组正交基将其展开,写成: $$ \left\lvert \psi \right\rangle = \sum\limits_i^N \left\lvert a_i \right\rangle \left\lvert u_i \right\rangle = \begin{pmatrix} \left\lvert a_1 \right\rangle & \left\lvert a_2 \right\rangle &\cdots& \left\lvert a_N \right\rangle \end{pmatrix}\begin{pmatrix} \left\lvert u_1 \right\rangle \\ \left\lvert u_2 \right\rangle \\ \vdots\\ \left\lvert u_M \right\rangle \end{pmatrix}~.$$ 上式中 $\left\{ \left\lvert a_i \right\rangle \right\}$ 是 $A$ 区域上的一组正交归一基矢量,而 $\left\{ \left\lvert u_i \right\rangle \right\}$ 则是一组定义在 $B$ 区域上的,不一定正交也不一定归一的矢量。而我们总可以通过 $\left\{ \left\lvert u_i \right\rangle \right\}$ 来张成一个 $N$ 维线性空间(如果矢量不足 $N$ 个,则需引入额外的基矢量来补足),我们将这组新的基地记作 $\left\{ \left\lvert b_i \right\rangle \right\}$。则存在 $N\times N$ 的 $A$ 矩阵,使得: $$\begin{pmatrix} \left\lvert u_1 \right\rangle \\ \left\lvert u_2 \right\rangle \\ \vdots\\ \left\lvert u_N \right\rangle \end{pmatrix} = A \begin{pmatrix} \left\lvert b_1 \right\rangle \\ \left\lvert b_2 \right\rangle \\ \vdots\\ \left\lvert b_N \right\rangle \end{pmatrix}~.$$ 因此有: $$ \left\lvert \psi \right\rangle = \begin{pmatrix} \left\lvert a_1 \right\rangle & \left\lvert a_2 \right\rangle &\cdots& \left\lvert a_N \right\rangle \end{pmatrix}A\begin{pmatrix} \left\lvert b_1 \right\rangle \\ \left\lvert b_2 \right\rangle \\ \vdots \\ \left\lvert b_N \right\rangle \end{pmatrix}~.$$ 考虑矩阵 $A$ 的奇异值分解,$A = U\Sigma D^\dagger$,其中,$U$ 和 $D$ 为幺正矩阵,而 $\Sigma$ 为半正定对角矩阵,则有: $$ \left\lvert \psi \right\rangle = \begin{pmatrix} \left\lvert a_1 \right\rangle & \left\lvert a_2 \right\rangle &\cdots& \left\lvert a_N \right\rangle \end{pmatrix}U \Sigma D^\dagger\begin{pmatrix} \left\lvert b_1 \right\rangle \\ \left\lvert b_2 \right\rangle \\ \vdots \\ \left\lvert b_N \right\rangle \end{pmatrix}~.$$ 由于 $U$ 和 $D$ 的幺正特性,则其于原本的标准正交基相乘之后得到的仍然是一组标准正交基,即 $$\begin{pmatrix} \left\lvert \tilde{a}_1 \right\rangle & \left\lvert \tilde{a}_2 \right\rangle & \cdots & \left\lvert \tilde{a}_N \right\rangle \end{pmatrix} = \begin{pmatrix} \left\lvert a_1 \right\rangle & \left\lvert a_2 \right\rangle &\cdots & \left\lvert a_N \right\rangle \end{pmatrix}U~$$ 和 $$\begin{pmatrix} \left\lvert \tilde{b}_1 \right\rangle & \left\lvert \tilde{b}_2 \right\rangle & \cdots & \left\lvert \tilde{b}_N \right\rangle \end{pmatrix} = \begin{pmatrix} \left\lvert b_1 \right\rangle & \left\lvert b_2 \right\rangle & \cdots & \left\lvert b_N \right\rangle \end{pmatrix}D~$$ 都是标准正交基,那么我们记 $\Sigma$ 的第 $i$ 个对角元是 $\sigma_i$,那么我们则可以写出: $$ \left\lvert \psi \right\rangle = \sum_i \sigma_i \left\lvert \tilde{a}_i \right\rangle \left\lvert \tilde{b}_i \right\rangle ~.$$ 写道这里已经很容易看到,$ \left\lvert \psi \right\rangle $ 在以 $\left\{ \left\lvert \tilde{a}_i \right\rangle \right\}$ 和 $\left\{ \left\lvert \tilde{b}_i \right\rangle \right\}$ 为基矢分别求取约化密度矩阵时,得到的是相同的对角矩阵的形式,因此自然 von Neumann 熵也相同。
若 $\left\{p_i\right\}$ 是概率分布,而 $\rho_i$ 位于相互正交的空间上,那么有: $$S\left(\sum\limits_i p_i\rho_i\right) = \sum\limits_i p_i S\left(\rho_i\right) - \sum\limits_i p_i \log p_i~.$$
由于 $\rho_i$ 都是位于相互正交的空间上,所以其均是相互对易的,可同时对角化的,记 $\rho_i$ 的第 $j$ 个本征值为 $\lambda_i^j$,有 $\sum\limits_j \lambda_i^j = 1$,同时由于 $\sum\limits_i p_i = 1$,则 $\sum\limits_{ij}p_i\lambda_i^j = 1$,则事实上,$\sum\limits_i p_i\rho_i$ 实际上得到了一个本征值为 $p_i\lambda_i^j$(i,j 任意取值)的密度矩阵,所以有:
对于 $\rho$ 和 $\sigma$ 的直积态 $\rho\otimes\sigma$,其纠缠熵为 $S\left(\rho\otimes \sigma\right) = S\left(\rho\right) + S\left(\sigma\right)$。
假设 $\rho$ 的本征值为 $\lambda_i^1,~i\in \left\{1,2,\cdots N^1\right\}$,$\sigma$ 的本征值为 $\lambda_i^2,~i \in \left\{1,2,\cdots N^2\right\}$。那么直积态 $\rho\otimes \sigma$ 的本征值就为 $\lambda_i^1\lambda_j^2,~i\in\left\{1,2,\cdots N^1\right\},~j\in\left\{1,2,\cdots N^2\right\}$ 共 $N^1\times N^2$ 个本征值。
那么类似上一条性质的,我们有:
纠缠熵的次可加性说的是不等式:
纠缠熵的三角不等式,也被称为 Araki-Lieb 不等式,指的是:
分别考虑 $A$,$C$ 区域的次可加性和 $B$,$C$ 区域的次可加性,则有:
也可写作:
整理得:
写在一起就是 $S\left(A,B\right)\geqslant \left\lvert S\left(A\right) - S\left(B\right) \right\rvert $。
借助迹距离作为密度矩阵的度量,我们可以讨论纠缠熵的连续性。
纠缠熵的连续性由 Fannes 不等式保证。
而对于更大的 $T\left(\rho,\sigma\right)$,有弱化版的不等式:
在 [1] 中给出了证明,而在论文中给出了该不等式更强的形式:
其中 $H(p)$ 是香农熵。
可见由 Fannes 不等式可得,在 $\forall 0<\epsilon,~\exists \delta>0$,当 $T\left(\rho,\sigma\right)<\delta$ 时,有 $ \left\lvert S\left(\rho\right) - S\left(\sigma\right) \right\rvert <\epsilon$, 其中,$\delta$ 取 $\epsilon = x\log_2\left(d-1\right) + H\left(\left(x,1-x\right)\right)$ 的较小的解,当解不存在时,取 $f(x)=x\log_2\left(d-1\right) + H\left(\left(x,1-x\right)\right)$ 的极值点横坐标。
由此可以说 Fannes 不等式给出了在迹距离的度量下,纠缠熵的连续性。
[1] ^ Michael A. Nielsen,Isaac L. Chuang 著,郑大钟 赵千川 译 量子计算和量子信息(二)——量子信息部分 清华大学出版社