标准差与方差

                     

贡献者: JierPeter; ACertainUser

  

未完成:本文处于草稿阶段。
未完成:加入目录

图
图 1:经典的正态分布示意图。三组数据的平均值虽然相同,但是他们的离散程度不同。

   标准差和方差用于衡量一组数据的离散程度

   直观地,如果所有数据都是相等的,我们就认为这组数据没有一点离散;但若数据平均值不变,各数据离平均值越远,我们就认为数据离散程度越高。因此,我们可以给出衡量离散程度的式子:

定义 1 方差

   设有一组数据 $\{x_i\}_{i=1}^n$,它们的平均值是 $\mu=\frac{x_1+x_2+\cdots+x_n}{n}$。则定义这组数据的方差

\begin{equation} \sigma^2 = \frac{(x_1-\mu)^2+(x_2-\mu)^2+\cdots+(x_n-\mu)^2}{n}~. \end{equation}

   定义方差时使用平方,是为了避免向不同方向离开平均值的数据相互抵消。

定义 2 总体标准差

   设有一组数据 $\{x_i\}_{i=1}^n$,它们的平均值是 $\mu=\frac{x_1+x_2+\cdots+x_n}{n}$。则定义这组数据的总体标准差

\begin{equation} \sigma = \sqrt{\frac{(x_1-\mu)^2+(x_2-\mu)^2+\cdots+(x_n-\mu)^2}{n}}~. \end{equation}

定义 3 标准误差

   数据的标准误差定义为 $\sigma_n=\sigma/\sqrt{n}$。

定义 4 样本标准差

   设有一组数据 $\{x_i\}_{i=1}^n$,它们的平均值是 $\mu=\frac{x_1+x_2+\cdots+x_n}{n}$。则定义这组数据的样本标准差

\begin{equation} S = \sqrt{\frac{(x_1-\mu)^2+(x_2-\mu)^2+\cdots+(x_n-\mu)^2}{n-1}}~. \end{equation}

1. 与期望值的关系

   给定一组数据 $\{x_i\}_{i=1}^n$,记它的平均值(期望值)为 $\langle x_i \rangle$,即定义 1 里的 $\mu$。有了这个符号,就可以方便地表示 $\{x_i^2\}$ 的平均值了:$\langle x_i^2 \rangle$。

   根据式 1

\begin{equation} \begin{aligned} \sigma^2 &= \frac{x_1^2+x_2^2+\cdots+x_n^2}{n}+\frac{n\mu^2}{n}-\frac{2\mu(x_1+x_2+\cdots+x_n)}{n}\\ &=\langle x_i^2 \rangle+\mu^2-2\mu\langle x_i \rangle\\ &=\langle x_i^2 \rangle-\langle x_i \rangle^2~. \end{aligned} \end{equation}

                     

© 小时科技 保留一切权利