The Wayback Machine - https://web.archive.org/web/20221028205653/https://baike.sogou.com/kexue/d10195.htm

F检验

编辑


F检验是在零假设下检验统计量具有F分布的统计检验。它最常用于比较已拟合到数据集的统计模型,以识别最适合数据抽样总体的模型。精确的“F检验”主要出现在当模型用最小二乘法拟合数据的时候。该名称是George W. Snedecor为纪念Sir Ronald A. Fisher而创造的。Fisher在20世纪20年代发明了这一检验统计量,最初称之为方差比率。[1]

1 常见示例编辑

使用F检验的常见例子包括以下情况的研究:

  • 假设一组给定的标准差相同的正态分布总体,它们的均值相等。这也许是最著名的F检验,该检验在方差分析中起着重要的作用。
  • 假设提出的回归模型很好地拟合了数据。
  • 假设回归分析中的数据集遵循两个相互嵌套的线性模型中较简单的一个。

此外,一些统计方法,如线性模型中多重比较调整的Scheffé方法,也使用F检验。

1.1 两个方差相等的F检验

F检验对非正态性很敏感。[2][3]在方差分析中,替代检验包括Levene检验、Bartlett检验和Brown-Forsythe检验。然而,当进行这些检验中的任何一个来检验同方差性(即方差齐性)的基本假设时,作为检验平均效应的初步步骤,在实验方面的第一类错误率有所增加。[4]

2 公式和计算编辑

大多数F检验是通过考虑数据集合中方差的平方和分解而产生的。F检验中的检验统计量是两个尺度调整后的平方和的比率,这两个平方和反映的是不同来源的可变性。这些平方和的构造使得当零假设不成立时,统计量往往趋于更大。为了使统计量在零假设成立条件下服从F分布,平方和在统计意义上应该是独立的,并且每个平方和应该服从一个尺度调整后的   分布。如果数据值是独立的,并且服从方差相等的正态分布,则后一个条件得到保证。

2.1 多重比较方差分析问题

单因素方差分析中的F检验用于评估几个预定义组中定量变量的期望值是否彼此不同。例如,假设一项医学试验比较了四种治疗方法。方差分析F检验可以用来评估任何一种治疗方法是否平均优于或劣于其他治疗方法,与之相应的零假设是所有的四种治疗方法产生相同的平均反应。这是一个“综合”检验的例子,意味着执行一个检验来检测几个可能的差异中的任何一个。或者,我们可以在治疗方法之间进行配对检验(例如,在具有四种治疗方法的医学试验示例中,我们可以在成对治疗方法之间进行六次检验)。方差分析F检验的优势在于,我们不需要预先指定要比较哪些治疗方法,也不需要为进行多次比较而进行调整。方差分析F检验的缺点是,如果我们拒绝零假设,我们不知道哪些治疗方法可以说与其他治疗方法显著不同,如果F检验在α水平上进行,我们也不能说平均差异最大的一对治疗方法在α水平上显著不同。

单因素方差分析F检验统计量的公式为

  

或者

  

“解释方差”或“组间变异性”是

  

在哪里   表示采样平均在i第四组,   中的观察次数i第四组,   表示数据的总体平均值,以及   表示组的数量。

“无法解释的方差”或“组内变异性”是

  

在哪里   jth观察ith由于   群组和   是总样本量。这F-统计遵循以下原则F分发有自由度的      在无效假设下。如果组间可变性相对于组内可变性较大,则统计量将较大,如果人口意味着所有的组都有相同的值。

请注意,当单向方差分析只有两组时F-测试,   在哪里t是学生的   统计的。

2.2 回归问题

考虑两个模型,1和2,其中模型2“嵌套”在模型1中。模型2是受限制的模型,模型1是不受限制的模型。也就是说,模型1具有p1个参数,模型2具有   个参数,其中    <   ,并且对于模型2中任何参数的选择,通过模型1的一些参数的选择可以获得相同的回归曲线。

在这方面,一个常见的情况是确定模型是否比朴素模型显著更好地拟合了数据,其中朴素模型的唯一的解释项是截距项,因此因变量的所有预测值都设置为等于该变量的样本均值。朴素模型是受限模型,因为所有潜在解释变量的系数都被限制为零。

另一个常见的情况是确定数据中是否存在结构性中断:这里,受限模型在一个回归中使用所有数据,而非受限模型对数据的两个不同子集使用单独的回归。这种F检验的使用被称为Chow检验。

具有更多参数的模型将始终能够至少像具有较少参数的模型一样拟合数据。因此,通常地,模型2将比模型1更好地(即更低的误差)拟合数据。但是人们经常想确定模型2是否能显著更好地拟合数据。解决这个问题的一种方法是使用F检验。

如果有n个数据点可以用来估计两个模型的参数,那么就可以计算F统计量,如下所示

  

其中RSSi   是模型i的残差平方和。如果回归模型是用权重计算的,那么用加权残差平方和   代替RSSi   。在模型2没有提供比模型1显著更好的拟合的零假设下,F将服从自由度为(    -   ,n -   )的F分布。如果从数据中计算出的F值大于某个期望的错误拒绝概率(例如0.05)的F分布的临界值,则拒绝零假设。F检验是Wald检验。

参考文献

  • [1]

    ^Lomax, Richard G. (2007). Statistical Concepts: A Second Course. p. 10. ISBN 0-8058-5850-4..

  • [2]

    ^Box, G. E. P. (1953). "Non-Normality and Tests on Variances". Biometrika. 40 (3/4): 318–335. doi:10.1093/biomet/40.3-4.318. JSTOR 2333350..

  • [3]

    ^Markowski, Carol A; Markowski, Edward P. (1990). "Conditions for the Effectiveness of a Preliminary Test of Variance". The American Statistician. 44 (4): 322–326. doi:10.2307/2684360. JSTOR 2684360..

  • [4]

    ^Sawilowsky, S. (2002). "Fermat, Schubert, Einstein, and Behrens–Fisher: The Probable Difference Between Two Means When σ12 ≠ σ22". Journal of Modern Applied Statistical Methods. 1 (2): 461–472. Archived from the original on 2015-04-03. Retrieved 2015-03-30..

阅读 1.5w
版本记录
  • 暂无