对偶空间

                     

贡献者: JierPeter; Giacomo; addis

预备知识 基(线性代数),多线性映射

1. 线性函数

   中学数学中一个贯穿始终的研究对象就是函数(function)。函数是映射(mapping)的一种,在现代数学的习惯中通常把从任意集合到一个数字集合1的映射称为一个函数。特别地,我们把定义线性空间时使用的域 $\mathbb{F}$ 都当作数字集合,多数情况下这些域都是实数域、复数域或者它们的子域商域2

   如果给定一个域 $\mathbb{F}$ 上的线性空间 $V$,把 $V$ 中的任意向量 $ \boldsymbol{\mathbf{v}} $ 映射到 $\mathbb{F}$ 中的一个元素 $f( \boldsymbol{\mathbf{v}} )$ 上,那么映射 $f:V\rightarrow\mathbb{F}$ 就是线性空间 $V$ 上的一个函数。你可以任意指定函数的对应规则,但我们只关心所有可能的函数中最容易研究的一类,线性函数。

   通俗来说线性函数就是 “图像过原点的平直图形”,因此非常容易讨论。很多时候,尽管我们研究的不一定是平直的函数,但是总能在局部取平直的线性函数来考察任一点附近的函数性质,这其实就是微分的思想。换句话说,微分实际上是一种 “线性近似”,在给定点把可微函数近似为一个线性函数,方便讨论。

定义 1 线性函数

   给定一个域 $\mathbb{F}$ 上的线性空间 $V$,如果映射 $f:V\rightarrow\mathbb{F}$ 满足线性性,即对于任意 $ \boldsymbol{\mathbf{v}} , \boldsymbol{\mathbf{u}} \in V$ 以及任意的 $a, b\in\mathbb{F}$,都有 $f(a \boldsymbol{\mathbf{v}} +b \boldsymbol{\mathbf{u}} )=af( \boldsymbol{\mathbf{v}} )+bf( \boldsymbol{\mathbf{u}} )$,那么我们称 $f$ 是 $V$ 上的一个线性函数(linear function)

   线性性质的好处就在于,线性函数的性质只依赖于基向量的函数值。就是说,当我们取定了一组基 $\{\hat{ \boldsymbol{\mathbf{e}} }_i\}$,那么只要知道了线性函数 $f$ 对它们的取值 $f(\hat{ \boldsymbol{\mathbf{e}} }_i)$,我们就可以利用线性性算出任意向量 $ \boldsymbol{\mathbf{v}} \in V$ 的函数值 $f( \boldsymbol{\mathbf{v}} )$,因为每一个 $ \boldsymbol{\mathbf{v}} $ 都是基向量的某个线性组合。

   如果要定义 $V$ 上一个任意的函数,我们的自由度很高,可以对每一个向量都指定一个函数值,各向量的函数值并不互相影响;但是对于线性函数,自由度就只有 $ \operatorname {dim} V$ 个,一旦选定了基向量的函数值,所有向量的函数值就都确定了。不过基向量的函数值仍然可以任意指定。

   函数之间可以进行加减法和乘法运算,这使得函数自然构成一个环,线性函数自然也不例外。目前我们只关心线性函数之间的加减法。

定义 2 线性函数的加减法

   给定一个域 $\mathbb{F}$ 上的线性空间 $V$,对于两个线性函数 $f, g: V\rightarrow\mathbb{F}$,定义函数的和 $(f+g):V\rightarrow\mathbb{F}$ 如下:对于任意 $ \boldsymbol{\mathbf{v}} \in V$,有 $(f+g)( \boldsymbol{\mathbf{v}} )=f( \boldsymbol{\mathbf{v}} )+g( \boldsymbol{\mathbf{v}} )$。

   这样一来,我们就可以对函数也进行加减法,就像对数字所做的那样。同样地,我们可以定义函数的数乘,即用域中的数字和函数相乘来得到新的函数。对于线性函数,数乘定义如下:

定义 3 线性函数的数乘

   给定一个域 $\mathbb{F}$ 上的线性空间 $V$,标量 $a\in\mathbb{F}$ 以及线性函数 $f: V\rightarrow\mathbb{F}$,定义函数的数乘 $af:V\rightarrow\mathbb{F}$ 如下:对于任何 $ \boldsymbol{\mathbf{v}} \in V$,有 $(af)( \boldsymbol{\mathbf{v}} )=a\cdot f( \boldsymbol{\mathbf{v}} )$。

   线性函数的数乘对加法具有分配律:

定理 1 线性函数的数乘对加法的分配律

   给定一个域 $\mathbb{F}$ 上的线性空间 $V$,对于两个线性函数 $f, g: V\rightarrow\mathbb{F}$ 和标量 $a\in\mathbb{F}$,有:$a(f+g)=af+ag$。

   这一定理的证明是非常直接的,应用域 $\mathbb{F}$ 上的乘法分配律就可以。

2. 对偶空间

   从定义 2 定义 3 ,以及定理 1 我们可以看出,对于一个域 $\mathbb{F}$ 上的线性空间 $V$,$V$ 上的全体线性函数也满足向量空间的定义,构成一个向量空间。我们把这个空间称作 $V$ 的对偶空间

定义 4 对偶空间

   给定一个域 $\mathbb{F}$ 上的线性空间 $V$,记 $V^*$ 为集合 $\{V\text{上全体线性函数}\}$。在 $V^*$ 上定义加法和数乘如定义 2 定义 3 ,那么 $V^*$ 构成一个线性空间,称作 $V$ 的对偶空间

   为了简洁地表示区分,也可以称 $V$ 为主空间。

   看起来,$V^*$ 称作线性函数空间更直接,为什么要特地取 “对偶” 一名字呢?初看对偶空间的定义,你可能会觉得 $V$ 和 $V^*$ 的元素之间是不对等的,$V^*$ 中的函数是用来对 $V$ 中的向量进行映射的。可是反过来看的话,$V$ 中向量也可以看成是 $V^*$ 中向量的映射。这就是说,$f\in V^*$ 可以看成是一个 $V\rightarrow\mathbb{F}$ 的映射,而 $ \boldsymbol{\mathbf{v}} \in V$ 也可以看成是 $V^*\rightarrow\mathbb{F}$ 的映射。

定理 2 对偶对偶空间

   考虑一个域 $\mathbb{F}$ 上的线性空间 $V$ 及其对偶空间 $V^*$,那么对于任意 $ \boldsymbol{\mathbf{v}} \in V$,我们可以定义 $V^*$ 上的线性函数

\begin{equation} \iota_v(f): = f(v)~, \end{equation}
它是一个单射,此后我们不区分 $v$ 和 $\iota_v$,所以可以记
\begin{equation} V \subseteq V^{**}~. \end{equation}

   如果我们形式上进行一下简化,把 $f$ 记为向量形式 $ \boldsymbol{\mathbf{f}} $,然后把 $f( \boldsymbol{\mathbf{v}} )$ 记为 $ \boldsymbol{\mathbf{f}} \boldsymbol{\mathbf{v}} $,那么可以更清晰地看出它们互为彼此的线性函数:给定一个域 $\mathbb{F}$ 上的线性空间 $V$ 及其对偶空间 $V^*$,取 $a_i\in\mathbb{F}$、$ \boldsymbol{\mathbf{f}} _i\in V^*$ 和 $ \boldsymbol{\mathbf{v}} _i\in V$,那么从 $ \boldsymbol{\mathbf{f}} _0(a_1 \boldsymbol{\mathbf{v}} _1+a_2 \boldsymbol{\mathbf{v}} _2)=a_1 \boldsymbol{\mathbf{f}} _0 \boldsymbol{\mathbf{v}} _1+a_2 \boldsymbol{\mathbf{f}} _0 \boldsymbol{\mathbf{v}} _2$ 可知,$ \boldsymbol{\mathbf{f}} $ 是 $V$ 上的线性函数;从 $(a_1 \boldsymbol{\mathbf{f}} _1+a_2 \boldsymbol{\mathbf{f}} _2) \boldsymbol{\mathbf{v}} _0=a_1 \boldsymbol{\mathbf{f}} _1 \boldsymbol{\mathbf{v}} _0+a_2 \boldsymbol{\mathbf{f}} _2 \boldsymbol{\mathbf{v}} _0$ 可知,$ \boldsymbol{\mathbf{v}} $ 是 $V^*$ 上的线性函数。

   我们可以这么理解:$ \boldsymbol{\mathbf{f}} \boldsymbol{\mathbf{v}} $ 实际上就是 “取 $V$ 和 $V^*$ 中各一个元素,把它们俩对应到一个标量上” 的过程。因此,我们可以定义,对偶空间和主空间的对子

\begin{equation} \langle *, * \rangle: V^* \times V \to \mathbb{F}~ \end{equation}
就是把 $ \boldsymbol{\mathbf{f}} \boldsymbol{\mathbf{v}} $ 记为 $\langle \boldsymbol{\mathbf{f}} , \boldsymbol{\mathbf{v}} \rangle$3

定理 3 

   对于有限维度向量空间 $V$,我们有 $V^{**} = V$。

   证明留作习题。

   因此,对于有限维度向量空间,我们可以说两个空间互为对偶、地位平等,都是彼此的线性函数构成的线性空间4

   因此对于有限维度向量空间,我们可以更对称地定义对偶空间的概念:

定义 5 有限维度向量空间的对偶

   给定域 $\mathbb{F}$ 上两个 $n$ 维线性空间 $V$ 和 $W$。如果指定了一个非退化双线性映射 $m:V\times W\rightarrow\mathbb{F}$,那么称 $V$ 和 $W$ 是相互对偶的。更进一步的,我们有同构映射

\begin{equation} \begin{aligned} W &\to V^* \\ w &\mapsto (v \mapsto f(v, w))~. \end{aligned}~ \end{equation}

  

未完成:非退化双线性映射的链接

对偶基和互反基

   本小节我们考虑有限维度的主空间 $V$。

定义 6 对偶基

   给定线性空间 $V$ 作为主空间,选择其一组基 $\{ \boldsymbol{\mathbf{e}} _i\}$。在 $V^*$ 上选择一向量组 $\{ \boldsymbol{\mathbf{f}} _i\}$,使得

\begin{equation} \langle \boldsymbol{\mathbf{f}} _i, \boldsymbol{\mathbf{e}} _j \rangle = \delta_{ij}~, \end{equation}
则 $\{ \boldsymbol{\mathbf{f}} _i\}$ 构成 $V^*$ 的一组基,称为 $\{ \boldsymbol{\mathbf{e}} _i\}$ 的对偶基(dual basis)

习题 1 

   利用 “对偶向量是线性函数” 这一定义,证明定义 6 中的 $\{ \boldsymbol{\mathbf{f}} _i\}$ 构成 $V^*$ 上的一组基。

   给定线性空间 $V$ 作为主空间,再给定 $V$ 的一组基,我们就可以把 $V$ 中的向量表示为列矩阵。对应地,$V^*$ 中的向量表示为行矩阵,这个行矩阵是该向量在对偶基下的坐标。这样一来,对偶基的定义就保证了,向量和对偶向量相互作用的过程,就是这两个矩阵相乘的过程,其中对偶向量的行矩阵放在左边,向量的列矩阵放在右边。

   因为 $V$ 和 $V^*$ 的维度相同,它们也是相互同构的,它们之间的同构依赖于基的选取。要注意,虽然主空间中每个基都可以唯一对应一个对偶基,但却没有特别的理由让一个主向量对应一个对偶向量。哪怕是同一个主向量,在不同的基中,它对应的对偶向量也可能不同。所以仅仅讨论对偶空间而没有其它结构的话,只有基和对偶基之间的天然对应,而没有主向量和对偶向量之间的天然对应。

   不过,如果主空间上定义了内积,就可以建立主向量和对偶向量之间的天然对应了。

定理 4 

   给定域 $\mathbb{F}$ 上的线性空间 $V$ 及其上的内积 $g:V\times V\to \mathbb{F}$,则可以建立线性同构 $\sigma_g: V\to V^*$,使得

\begin{equation} g( \boldsymbol{\mathbf{u}} , \boldsymbol{\mathbf{v}} ) = \langle \sigma_g( \boldsymbol{\mathbf{u}} ) , \boldsymbol{\mathbf{v}} \rangle~ \end{equation}
对于任意 $ \boldsymbol{\mathbf{u}} , \boldsymbol{\mathbf{v}} \in V$ 成立。

   事实上,不需要限定为内积,任意给定 $V$ 上的非退化对称双线性形式,都可以导出 $V$ 和 $V^*$ 之间的同构,方式和定理 4 一样,只不过用这个双线性形式取代内积。以下论述中我们依然使用 “内积” 这一概念,但都可以替换为 “非退化对称双线性形式”。

   对偶基不依赖于内积即可确定,而对偶空间之间的对应则依赖于内积。这提示我们,主空间上会存在一个基之间的对应,依赖于内积:

定义 7 互反基

   给定域 $\mathbb{F}$ 上的线性空间 $V$ 及其上的内积 $g:V\times V\to \mathbb{F}$。对于 $V$ 上的基 $\{ \boldsymbol{\mathbf{e}} _i\}$,若 $V$ 的基 $\{ \boldsymbol{\mathbf{\varepsilon}} _i\}$ 满足 $g( \boldsymbol{\mathbf{e}} _i, \boldsymbol{\mathbf{\varepsilon}} _j)=\delta_{ij}$,则称 $\{ \boldsymbol{\mathbf{\varepsilon}} _i\}$ 是 $\{ \boldsymbol{\mathbf{e}} _i\}$ 的互反基(reciprocal basis)

   互反基是主空间的基,对偶基是对偶空间的基。先把给定的基天然对应到对偶基上,然后再用内积决定的线性同构把对偶基中的每个向量逐个对应回主空间,所得结果即为给定基的互反基。

例 1 

   欧几里得空间(即定义了内积的有限维实线性空间)中,任何正交归一基的互反基都是它自身。

   闵可夫斯基空间中,记其闵可夫斯基 “内积” 为 $g$。取标准正交基 $\{ \boldsymbol{\mathbf{e}} _0, \boldsymbol{\mathbf{e}} _1, \boldsymbol{\mathbf{e}} _2, \boldsymbol{\mathbf{e}} _3\}$,其中 $g( \boldsymbol{\mathbf{e}} _0, \boldsymbol{\mathbf{e}} _0)=1$,以及对于 $i=1, 2, 3$,$g( \boldsymbol{\mathbf{e}} _i, \boldsymbol{\mathbf{e}} _i)=-1$。那么这个标准正交基的互反基为

\begin{equation} \{ \boldsymbol{\mathbf{e}} _0, - \boldsymbol{\mathbf{e}} _1, - \boldsymbol{\mathbf{e}} _2, - \boldsymbol{\mathbf{e}} _3\}~. \end{equation}

无限维度的情况

   而对于无限维度空间来说,对偶空间的定义并不符合 “对偶” 的本意,对偶空间严格 “大于” 主空间:

定理 5 

   取无限维度向量空间 $V$ 的一组基 $\{e_\alpha\}_\alpha$,函数

\begin{equation} f(e_\alpha) = 1~ \end{equation}
不由对偶向量 $ \boldsymbol{\mathbf{f}} _\alpha$ 张成。

   换言之,“对偶基” 对于无限维度向量空间而言不再是一组基了。

推论 1 

   无限维度向量空间 $V$ 真含于 $V^{**}$。

3. 对偶空间的表示

矩阵表示的习惯

   在线性空间中,给定了一组基,则任意向量都可以表示为一串标量。比如说,给定基 $\{ \boldsymbol{\mathbf{e}} _1, \boldsymbol{\mathbf{e}} _2\}$,则任意向量都可以表示为 $a \boldsymbol{\mathbf{e}} _1+b \boldsymbol{\mathbf{e}} _2$ 的形式,其中 $a, b$ 可以是任何标量。

   由于给定主空间的基相当于同时给定了对偶空间上的对偶基,故任意对偶向量也可以表示为一串标量。

   通常,在讨论时,选定了主空间以及主空间上的一组基后,我们用列矩阵来表示主向量,用行矩阵来表示对偶向量。比如,给定基 $\{ \boldsymbol{\mathbf{e}} _1, \boldsymbol{\mathbf{e}} _2\}$,则主向量 $a \boldsymbol{\mathbf{e}} _1+b \boldsymbol{\mathbf{e}} _2$ 表示为

\begin{equation} \begin{pmatrix} a\\ b \end{pmatrix}~, \end{equation}
而对偶向量 $x \boldsymbol{\mathbf{f}} _1+y \boldsymbol{\mathbf{f}} _2$ 表示为
\begin{equation} \begin{pmatrix} x&y \end{pmatrix}~. \end{equation}
其中,$\{ \boldsymbol{\mathbf{f}} _1, \boldsymbol{\mathbf{f}} _2\}$ 是 $\{ \boldsymbol{\mathbf{e}} _1, \boldsymbol{\mathbf{e}} _2\}$ 的对偶基。

   这种规定的好处是,对偶向量之间的相互作用可以直接用矩阵乘法表示:

\begin{equation} \langle a \boldsymbol{\mathbf{e}} _1+b \boldsymbol{\mathbf{e}} _2 , x \boldsymbol{\mathbf{f}} _1+y \boldsymbol{\mathbf{f}} _2 \rangle = ax+by = \begin{pmatrix} x&y \end{pmatrix} \begin{pmatrix} a\\ b \end{pmatrix}~. \end{equation}

对偶空间上的同构的表示

   给定线性空间的基以后,内积,或者更一般的双线性形式,就都可以表示为对称

狄拉克符号

   狄拉克符号是一种用来描述量子态的表示方法。量子力学中认为每个量子态都是一个向量,定义在复数域上的线性空间中,因此狄拉克符号表示的都是复向量。

   狄拉克符号分为左矢和右矢,其中左矢相当于行矩阵,右矢相当于列矩阵;左矢和右矢在两个不同的空间中,称为左矢空间和右矢空间,这两个空间彼此对偶。每个量子态向量都有双重表示,一个左矢表示,一个右矢表示。同一个量子态的左矢和右矢是对偶向量,故满足以下条件:在同一个基5下,如果同一个量子态向量 $s$ 的左矢表达是 $\langle s|$,右矢表达是 $|s\rangle$,那么有 $\langle s|\cdot|s\rangle=1$。为了简便,我们也把这个表达写成 $\langle s|\cdot|s\rangle=\langle s|s\rangle$。

   一般来说,量子态空间都是无穷维希尔伯特空间,并不能把向量坐标简单表示为矩阵。但是我们依然可以用矩阵来做类比,在这样的类比下,如果一个表象下的一个量子态的右矢中第 $i$ 个坐标是复数 $s_i$,那么其左矢中第 $i$ 个坐标就是 $s_i^*$,也就是对应坐标值取其复数共轭,这样就能满足条件 $\langle s|s\rangle=1$。

   由于量子态的另一种理解方式是波函数,所以我们其实可以把左矢、右矢的乘积理解为波函数的乘积积分,就像最常见的函数向量一样。具体来说,如果有两个量子态 $s$ 和 $t$,分别对应波函数 $f_s$ 和 $f_t$,以及右矢 $|s\rangle$ 和 $|t\rangle$,那么我们有对应关系:

\begin{equation}\langle s|t\rangle=\int\limits_{\text{全空间}}f_s^*f_tdx~,\end{equation}
注意左矢对应的 $f_s$ 取了复共轭。


1. ^ 数字集合就是我们通常叫做数字的元素的集合,比如实数集 $\mathbb{R}$,有理数集 $\mathbb{R}$,整数集 $\mathbb{R}$,复数集 $\mathbb{C}$ 等,甚至 $\{0, 1\}$ 这样的集合都叫数字集合。
2. ^ 如整数中提到的模运算,其元素也被称为数字,只不过不是通常意义上的整数。
3. ^ 注意,对偶向量的相互作用和两个向量的内积在概念上有所不同。作内积需要额外定义 “内积” 这一双线性函数多线性映射
4. ^ 换句话说,谁是主空间,谁是(主空间的)对偶空间,并没有绝对的定义,而要看讨论的情景。如同样是考虑流形上的切向量和余切向量,有的视角会认为切向量更自然,因此把切空间当作主空间,此时余切空间就是对偶空间;但也有视角认为余切向量更自然,而把余切空间当作主空间,此时切空间是对偶空间。
5. ^ 量子力学中所说的基和所谓的 “表象” 相关,比如在空间表象下的基就是空间的特征态,也就是在空间坐标下表示的波函数为 $\delta$ 函数的那些态;动量表象下的基就是动量的特征态,这些基向量都是在全空间概率均匀分布的波函数,不过用动量坐标来表示的话,这些波函数又是 $\delta$ 函数了。同一个波函数在两种坐标之间的表示由傅里叶变换计算出,具体方式详见量子力学。


致读者: 小时百科一直以来坚持所有内容免费,这导致我们处于严重的亏损状态。 长此以往很可能会最终导致我们不得不选择大量广告以及内容付费等。 因此,我们请求广大读者热心打赏 ,使网站得以健康发展。 如果看到这条信息的每位读者能慷慨打赏 10 元,我们一个星期内就能脱离亏损, 并保证在接下来的一整年里向所有读者继续免费提供优质内容。 但遗憾的是只有不到 1% 的读者愿意捐款, 他们的付出帮助了 99% 的读者免费获取知识, 我们在此表示感谢。

                     

友情链接: 超理论坛 | ©小时科技 保留一切权利