标准差与方差

                     

贡献者: JierPeter; ACertainUser

  

未完成:本词条处于草稿阶段。
未完成:加入目录

图
图 1:经典的正态分布示意图。三组数据的平均值虽然相同,但是他们的离散程度不同。

   标准差和方差用于衡量一组数据的离散程度

   直观地,如果所有数据都是相等的,我们就认为这组数据没有一点离散;但若数据平均值不变,各数据离平均值越远,我们就认为数据离散程度越高。因此,我们可以给出衡量离散程度的式子:

定义 1 方差

   设有一组数据 $\{x_i\}_{i=1}^n$,它们的平均值是 $\mu=\frac{x_1+x_2+\cdots+x_n}{n}$。则定义这组数据的方差

\begin{equation} \sigma^2 = \frac{(x_1-\mu)^2+(x_2-\mu)^2+\cdots+(x_n-\mu)^2}{n}~. \end{equation}

   定义方差时使用平方,是为了避免向不同方向离开平均值的数据相互抵消。

定义 2 总体标准差

   设有一组数据 $\{x_i\}_{i=1}^n$,它们的平均值是 $\mu=\frac{x_1+x_2+\cdots+x_n}{n}$。则定义这组数据的总体标准差

\begin{equation} \sigma = \sqrt{\frac{(x_1-\mu)^2+(x_2-\mu)^2+\cdots+(x_n-\mu)^2}{n}}~. \end{equation}

定义 3 标准误差

   数据的标准误差定义为 $\sigma_n=\sigma/\sqrt{n}$。

定义 4 样本标准差

   设有一组数据 $\{x_i\}_{i=1}^n$,它们的平均值是 $\mu=\frac{x_1+x_2+\cdots+x_n}{n}$。则定义这组数据的样本标准差

\begin{equation} S = \sqrt{\frac{(x_1-\mu)^2+(x_2-\mu)^2+\cdots+(x_n-\mu)^2}{n-1}}~. \end{equation}

1. 与期望值的关系

   给定一组数据 $\{x_i\}_{i=1}^n$,记它的平均值(期望值)为 $\langle x_i \rangle$,即定义 1 里的 $\mu$。有了这个符号,就可以方便地表示 $\{x_i^2\}$ 的平均值了:$\langle x_i^2 \rangle$。

   根据式 1

\begin{equation} \begin{aligned} \sigma^2 &= \frac{x_1^2+x_2^2+\cdots+x_n^2}{n}+\frac{n\mu^2}{n}-\frac{2\mu(x_1+x_2+\cdots+x_n)}{n}\\ &=\langle x_i^2 \rangle+\mu^2-2\mu\langle x_i \rangle\\ &=\langle x_i^2 \rangle-\langle x_i \rangle^2~. \end{aligned} \end{equation}


致读者: 小时百科一直以来坚持所有内容免费,这导致我们处于严重的亏损状态。 长此以往很可能会最终导致我们不得不选择大量广告以及内容付费等。 因此,我们请求广大读者热心打赏 ,使网站得以健康发展。 如果看到这条信息的每位读者能慷慨打赏 10 元,我们一个星期内就能脱离亏损, 并保证在接下来的一整年里向所有读者继续免费提供优质内容。 但遗憾的是只有不到 1% 的读者愿意捐款, 他们的付出帮助了 99% 的读者免费获取知识, 我们在此表示感谢。

                     

友情链接: 超理论坛 | ©小时科技 保留一切权利