高斯分布(正态分布)

                     

贡献者: addis

预备知识 分布函数,误差函数
图
图 1:正态分布图,来自 Wikipedia

  1高斯分布也叫正态分布,概率密度函数为

\begin{equation} f(x) = \frac{1}{\sqrt{2\pi}\ \sigma} \exp \left[-\frac{(x - \mu )^2}{2\sigma ^2} \right] ~, \end{equation}
其中 $\mu$ 是分布的的平均值,$\sigma^2$ 是方差,$\sigma$ 是标准差。上式也通常记为 $x \sim N(\mu,\sigma^2)$,且满足归一化条件
\begin{equation} \int_{-\infty}^{+\infty} f(x) \,\mathrm{d}{x} = 1~. \end{equation}
$N(0,1)$ 被称为标准正态分布

   正态分布中,$x$ 落在区间 $[\mu-a,\mu+a]$ 内的概率可以用误差函数 $ \operatorname{erf} $ 表示:

\begin{equation} P\{ \left\lvert x-\mu \right\rvert \leqslant a\} = \int_{-a}^a f(x) \,\mathrm{d}{x} = \operatorname{erf} \left(\frac{a}{\sqrt{2}\ \sigma} \right) ~. \end{equation}
若已知 $P\{ \left\lvert x-\mu \right\rvert \leqslant a\}$,也可以用反误差函数 $ \operatorname{erf} ^{-1}$ 求出 $a$。

1. 特殊值

   高斯分布的半峰全宽(FWHM)

\begin{equation} \text{FWHM} = 2\sqrt{2\ln 2}\ \sigma \approx 2.3548\ \sigma~. \end{equation}
也就是在 $ \left\lvert x - \mu \right\rvert = \text{FWHM}/2$ 处,函数值为峰值的一半。

   另外当 $ \left\lvert x - \mu \right\rvert = \sigma$ 处,函数值为峰值的 $ \exp\left(-1/2\right) \approx 0.6065$。

   其他特殊函数值以及对应的概率如下

表1:高斯分布的特殊值和概率
$x$ $\sigma$ $2\sigma$ $3\sigma$ $4\sigma$ $5\sigma$ $6\sigma$ $7\sigma$ $8\sigma$
$f(x)/f_\text{max}$ 0.6065 0.1353 1.111e-2 3.355e-4 3.727e-6 1.523e-8 2.2897e-11 1.2664e-14
$1-\int_{-x}^x f(t) \,\mathrm{d}{t} $ 0.3173 4.550e-2 2.700e-3 6.334e-5 5.733e-7 1.973e-9 2.56e-12 1.24e-15

2. 推导

   若已知高斯分布具有如下形式

\begin{equation} f(x) = A\exp \left[-a (x - x_0)^2 \right] ~, \end{equation}
可见其主要特征就是指数函数中含有 $\Delta x^2$ 项。由对称性,分布函数关于 $x =x_0$ 对称,所以平均值显然为 $\mu = x_0$。

   现在我们补充两个积分,由换元积分法($x=\sqrt{t}$)以及 $\Gamma$ 函数 的性质得

\begin{equation} \int_{-\infty }^{+\infty } \mathrm{e} ^{-x^2} \,\mathrm{d}{x} = \int_0^{+\infty} t^{-1/2} \mathrm{e} ^{ - t} \,\mathrm{d}{t} = \left(-\frac12 \right) ! = \sqrt \pi ~, \end{equation}
\begin{equation} \int_{-\infty}^{+\infty} x^2 \mathrm{e} ^{-x^2} \,\mathrm{d}{x} = \int_0^{+\infty} t^{1/2} \mathrm{e} ^{-t} \,\mathrm{d}{t} = \frac12 ! = \frac12 \left(-\frac12 \right) ! = \frac{\sqrt\pi}{2}~. \end{equation}

   根据归一化条件式 2 ,结合式 6

\begin{equation} 1 = \int_{-\infty}^{+\infty} f(x) \,\mathrm{d}{x} = A\int_{-\infty}^{+\infty} \exp \left[-a (x - x_0)^2 \right] \,\mathrm{d}{x} = A\sqrt{\frac{\pi}{a}}~, \end{equation}
即 $A = \sqrt{a/\pi}$。再来计算高斯分布的方差,结合式 7
\begin{equation} \sigma ^2 = \int_{-\infty}^{+\infty} (x - x_0)^2 A\exp \left[-a (x - x_0)^2 \right] \,\mathrm{d}{x} = \frac{1}{2a}~. \end{equation}
式 8 式 9 解得 $a = 1/(2\sigma^2)$ 和 $A = 1/(\sqrt{2\pi}\ \sigma)$,代入式 5 可得高斯分布式 1


1. ^ 参考 Wikipedia 相关页面

                     

© 小时科技 保留一切权利