贡献者: addis
- 本文缺少预备知识,初学者可能会遇到困难。
- 这是事实上是线性代数的内容,并没有涉及到量子力学
考虑一个比较基本的问题,算符的 “功能” 是什么呢?算符就是对函数的一种操作方法。给出一个波函数,经过算符作用,可以得到一个新的波函数。以下给出量子力学中算符的两个重要性质
- 算符都是线性的,即对任意 $n$ 个波函数 $\psi_1, \psi_2 \dots \psi_n$, 算符 $ \hat{Q} $ 满足
\begin{equation}
\hat{Q} (c_1 \psi_1 + c_2 \psi_2 \dots c_n \psi_n) = c_1 \hat{Q} \psi_1 + c_2 \hat{Q} \psi_2 \dots c_n \hat{Q} \psi_n~.
\end{equation}
- 算符的本征方程的本征值都是实数。因为根据测量理论,本征值就是可能出现的测量结果,所以本征值一定是实数。
我们已经知道,波函数可以用列矢量表示。既然算符都是线性的,而矩阵可以表示列矢量的线性变换,是否可以用矩阵代替算符,从而作用于列向量呢?根据性质 $1$, 若 $\psi$ 是算符是算符 $ \hat{Q} $ 的本征函数,$\lambda_1 \dots \lambda_n$ 是对应的本征值(实数),则
\begin{equation}
\begin{cases}
\hat{Q} \psi & = \hat{Q} (c_1 \psi_1 + \dots + c_n \psi_n)\\
& = c_1 \hat{Q} \psi_1 + \dots + c_n \hat{Q} \psi_n\\
& = \lambda_1 c_1 \psi_1 + \dots + \lambda_n c_n \psi_n~.
\end{cases}
\end{equation}
若把上面的波函数表示成列矢量,就相当于在算符 $ \hat{Q} $ 的作用下任意一个列矢量 $ \left\lvert \psi \right\rangle = (c_1, \dots, c_n) ^{\mathrm{T}} $ 总是会变成 $(\lambda_1 c_1, \dots, \lambda_n c_n) ^{\mathrm{T}} $。这个变换可以用矩阵
\begin{equation}
\boldsymbol{\mathbf{Q}} = \begin{pmatrix}
\lambda_1 & & \\
& \ddots & \\
& & \lambda_n\end{pmatrix} ~
\end{equation}
来表示,即
\begin{equation}
\begin{pmatrix}\lambda_1 & & \\ & \ddots & \\ & & \lambda_n\end{pmatrix}
\begin{pmatrix}c_1\\ \vdots \\c_n\end{pmatrix}
= \begin{pmatrix}\lambda_1 c_1\\ \vdots \\ \lambda_n c_n\end{pmatrix} ~.
\end{equation}
所以矩阵 $ \boldsymbol{\mathbf{Q}} $ 就是算符 $ \hat{Q} $ 的矩阵形式,把算符作用在波函数上得到新的波函数,等效于把算符对应的矩阵作用在波函数对应的列矢量上,得到新的波函数对应的列矢量。
用矩阵和列向量表示的本征方程如下
\begin{equation}
\boldsymbol{\mathbf{Q}} \left\lvert \psi \right\rangle = \lambda \left\lvert \psi \right\rangle ~.
\end{equation}
解得 $\lambda = \lambda_i$ 时,$ \left\lvert \psi \right\rangle = \left\lvert \psi_1 \right\rangle = (0, \dots, 1, \dots, 0) ^{\mathrm{T}} $(只有第 $i$ 个分量等于 1,其余分量等于 0),而 $ \left\lvert \psi_i \right\rangle $ 正是波函数 $\psi_i$ 对应的列向量。
1. 在任意基底中的矩阵
上面的讨论中用矩阵 $ \boldsymbol{\mathbf{Q}} $ 表示算符 $ \hat{Q} $,其局限性在于,只能使用 $ \hat{Q} $ 的本征函数 $\psi_1 \dots \psi_n$ 作为基底。现在若用其他基底(正交归一的)$\phi_1 \dots \phi_n$,能否求出算符 $ \hat{Q} $ 对应的矩阵 $ \boldsymbol{\mathbf{Q}} _1$ 呢?
下面讨论中,为了避免混淆,用 $ \left\lvert f \right\rangle _\phi$ 表示波函数 $f$ 以 $\phi_1 \dots \phi_n$ 为基底的列矢量,$ \left\lvert f \right\rangle _\psi$ 表示波函数 $f$ 以 $\psi_1 \dots \psi_n$ 为基底的列矢量。
现取任意一波函数 $f$, $ \left\lvert f \right\rangle _\psi = (c_1\dots c_n) ^{\mathrm{T}} $,$ \left\lvert f \right\rangle _\phi = (d_1\dots d_n) ^{\mathrm{T}} $。虽然它们表示同一个波函数 $f$, 但是由于选取的基底不同,列向量也不同。下面讨论它们之间的变换关系。
若把 $f$ 按 $\phi_i$ 展开,有
\begin{equation} \begin{aligned}
\int \phi_i^*f \,\mathrm{d}{x} & = \int \phi_i^* ( d_1 \phi_1 + \ldots + d_n \phi_n) \,\mathrm{d}{x} = \sum_{j = 1}^n d_j \int \phi_i^*{\phi_j} \,\mathrm{d}{x} \\
&= \sum_{j=1}^n d_j \delta_{ij} = d_i~.
\end{aligned} \end{equation}
若把 $f$ 按 $\psi_i$ 展开,有
\begin{equation}
d_i = \int \phi_i^*f \,\mathrm{d}{x} = \int \phi_i^* (c_1 \psi_1 + \dots + c_n \psi_n) \,\mathrm{d}{x} = \sum_{j = 1}^n c_j \int \phi_i^*{\psi_j} \,\mathrm{d}{x} ~.
\end{equation}
上式用矩阵和列矢量表示,即 $(d_1 \dots d_n) ^{\mathrm{T}} = \boldsymbol{\mathbf{P}} (c_1 \dots c_n) ^{\mathrm{T}} $, 即 ${\left| f \right\rangle_\phi } = P{\left| f \right\rangle_\psi }$。其中 $P$ 矩阵的矩阵元 ${P_{ij}} = \int {\phi_i^*{\psi_j}dx} $。 $ \boldsymbol{\mathbf{P}} $ 叫做基底变换矩阵(或表象变换矩阵)。
若令 $ \hat{Q} f = g$, 根据前面的内容,$Q \left\lvert f \right\rangle _\psi = \left\lvert g \right\rangle _\psi$ 其中 $Q = \rm{diag}(\lambda_1\dots\lambda_n)$。
下面应用基底变换矩阵,有 $ \left\lvert f \right\rangle _\psi = P^{-1} \left\lvert f \right\rangle _\phi$ ; $ \left\lvert g \right\rangle _\psi = P^{-1} \left\lvert g \right\rangle _\phi$。代入上式得
\begin{equation}
Q P^{-1} \left\lvert f \right\rangle _\phi = P^{-1} \left\lvert g \right\rangle _\phi~,
\end{equation}
两边左乘 $P$ 得
\begin{equation}
PQ P^{-1} \left\lvert f \right\rangle _\phi = \left\lvert g \right\rangle _\phi~.
\end{equation}
令 $ \boldsymbol{\mathbf{Q}} _1 = \boldsymbol{\mathbf{P}} \boldsymbol{\mathbf{Q}} \boldsymbol{\mathbf{P}} ^{-1}$, 得
\begin{equation}
Q_1 \left\lvert f \right\rangle _\phi = \left\lvert g \right\rangle _\phi~,
\end{equation}
所以 $ \boldsymbol{\mathbf{Q}} _1$ 就是要求的矩阵。
下面证明 $ \boldsymbol{\mathbf{Q}} _1$ 是厄米矩阵。
我们先学习所谓幺正矩阵。这里给出幺正矩阵的一种定义:若把矩阵 $ \boldsymbol{\mathbf{P}} $ 的每一列划分成一个列向量,从左到右分别为 $ \left\lvert p_1 \right\rangle \dots \left\lvert p_n \right\rangle $, 若满足 $ \left\langle p_i \middle| p_j \right\rangle =\delta_{ij}$ 则矩阵 $ \boldsymbol{\mathbf{P}} $ 叫做幺正矩阵。
容易证明式 $*$ 中的 $P$ 就是幺正矩阵(证明略)。
性质 $1$:幺正矩阵一个很重要的性质就是其厄米共轭等于其逆矩阵,$ \boldsymbol{\mathbf{P}} ^* = \boldsymbol{\mathbf{P}} ^{- 1}~.$
证明:要证明 $ \boldsymbol{\mathbf{P}} ^* = \boldsymbol{\mathbf{P}} ^{-1}$, 只需证明 $ \boldsymbol{\mathbf{P}} ^* \boldsymbol{\mathbf{P}} $ 是单位矩阵即可。根据矩阵乘法的定义,
\begin{equation}
(P^* P)_{ij} = \sum_{k=1}^n (P^*)_{ik}P_{kj}~.
\end{equation}
根据厄米共轭的定义,
\begin{equation}
\sum_{k=1}^n (P^*)_{ik}P_{kj} = \sum_{k=1}^n (P_{ki})^* P_{kj} = \left\langle p_i \middle| p_j \right\rangle \delta_{ij}~,
\end{equation}
所以 $ \boldsymbol{\mathbf{P}} ^* \boldsymbol{\mathbf{P}} $ 是 $n$ 阶的单位矩阵。 证毕。
在上文中,$ \boldsymbol{\mathbf{Q}} $ 是所谓的实数元的对角矩阵,所以 $ \boldsymbol{\mathbf{Q}} ^* = \boldsymbol{\mathbf{Q}} ~.$
另外容易证明,$( \boldsymbol{\mathbf{A}} \boldsymbol{\mathbf{B}} )^* = \boldsymbol{\mathbf{B}} ^* \boldsymbol{\mathbf{A}} ^*$。 所以
\begin{equation}
\boldsymbol{\mathbf{Q}} _1^* = ( \boldsymbol{\mathbf{P}} \boldsymbol{\mathbf{Q}} \boldsymbol{\mathbf{P}} ^{-1})^* = ( \boldsymbol{\mathbf{P}} ^{-1})^* ( \boldsymbol{\mathbf{P}} \boldsymbol{\mathbf{Q}} )^* = \boldsymbol{\mathbf{P}} ( \boldsymbol{\mathbf{Q}} ^* \boldsymbol{\mathbf{P}} ^*) = \boldsymbol{\mathbf{P}} \boldsymbol{\mathbf{Q}} \boldsymbol{\mathbf{P}} ^{-1} = \boldsymbol{\mathbf{Q}} _1~,
\end{equation}
所以 $ \boldsymbol{\mathbf{Q}} _1$ 是厄米矩阵。