卡方分布

                     

贡献者: addis

  • 本文处于草稿阶段。

1. 卡方分布

图
图 1:卡方概率密度函数(式 1 ),来自 Wikipedia

  1卡方分布为(可以认为 $x<0$ 时函数值为零)

\begin{equation} f_k(x) = \frac{1}{2^{k/2}\Gamma(k/2)}x^{k/2-1} \mathrm{e} ^{-x/2} \qquad (x > 0)~ \end{equation}
期望值 $k$,方差 $2k$。

   累计分布函数为(Matlab 的 gammainc(x/2,k/2)

\begin{equation} F_k(x) = \int_0^{x} f_k(t) \,\mathrm{d}{t} = \frac{\gamma(k/2, x/2)}{\Gamma(k/2)}~, \end{equation}
其中 $\gamma$ 为下不完全 $\Gamma$ 函数

2. 检验是否符合指定一维分布

   若要检验 $N$ 次试验中,某分布是否符合指定分布。把随机变量划分成 $k$ 个区间,落入每个区间的数量是 $f_i$,$\sum f_i = N$。指定分布在每个区间的概率为 $p_i$,那么 $f_i/N$ 应该接近于 $p_i$,可以用以下函数判断有多接近

\begin{equation} \sum_{i=1}^k C_i \left(\frac{f_i}{N} - p_i \right) ^2~, \end{equation}
Pearson's cumulative test statistic 令 $C_i = N/p_i$,于是
\begin{equation} \chi^2 = \sum_{i=1}^k \frac{N}{p_i} \left(\frac{f_i}{N} - p_i \right) ^2 = \sum_{i=1}^k \frac{f_i^2}{Np_i} - N~. \end{equation}
当 $N$ 足够大,上式的值近似服从 $\chi^2(k-1)$ 分布。

   对于显著水平(significance level) $\alpha$,当 $\chi_{\alpha}^2(k-1)$ 时就接受假设。其中 $\chi_{\alpha}^2(k-1)$ 满足

\begin{equation} 1 - F_{k-1}(\chi_{\alpha+}^2(k-1)) = \int_{\chi_{\alpha}^2(k-1)}^\infty f_{k-1}(x) \,\mathrm{d}{x} = \alpha~. \end{equation}
假设被拒绝的显著水平越小,说明假设越不可能成立。

   $\alpha$ 被称为 $p$ 值。

图
图 2:临时例题(待删除)

3. 检验两个变量的独立性

\begin{equation} \chi^2 = \sum_{i=1}^{k} \sum_{j=1}^{l} \frac{N}{p_ip_j} \left(\frac{f_{ij}}{N} - p_ip_j \right) ^2 = \sum_{i=1}^{k} \sum_{j=1}^{l} \frac{f_{ij}^2}{Np_ip_j} - N~. \end{equation}
当 $N$ 足够大,上式的值近似服从 $\chi^2[(k-1)(l-1)]$ 分布。
未完成:补充详细


1. ^ 参考 Wikipedia 相关页面 1相关页面 2


致读者: 小时百科一直以来坚持所有内容免费无广告,这导致我们处于严重的亏损状态。 长此以往很可能会最终导致我们不得不选择大量广告以及内容付费等。 因此,我们请求广大读者热心打赏 ,使网站得以健康发展。 如果看到这条信息的每位读者能慷慨打赏 20 元,我们一周就能脱离亏损, 并在接下来的一年里向所有读者继续免费提供优质内容。 但遗憾的是只有不到 1% 的读者愿意捐款, 他们的付出帮助了 99% 的读者免费获取知识, 我们在此表示感谢。

                     

友情链接: 超理论坛 | ©小时科技 保留一切权利