The Wayback Machine - https://web.archive.org/web/20221029031818/https://baike.sogou.com/kexue/d10059.htm

Z检验

编辑

Z检验是在零假设下检验统计量的分布,可以用正态分布近似的任何统计检验。由于中心极限定理,对于大样本,许多检验统计量近似正态分布。对于每个显著性水平,Z检验有一个单一的临界值(例如,1.96对应于5%双尾),这比对每个样本大小有单独的临界值的t-检验更为方便。因此,如果样本量大或总体方差已知,许多统计检验可以方便地作为近似的Z检验来执行。如果总体方差未知(因此必须从样本本身进行估计),并且样本量不大(n < 30),t检验可能更合适。

如果T是一个在零假设下近似正态分布的统计量,那么执行Z检验的下一步是估计在零假设下的T的期望值θ,然后获得对T的标准差的估计s。之后,计算标准分数Z=(T-θ)/s,从中可以计算出单尾和双尾p值为φ(-Z)(对于右尾检验)、φ(Z)(对于左尾检验)和2φ(-|Z|)(对于双尾检验),其中φ是标准正态累积分布函数。

1 用于位置检验编辑

术语“Z检验”通常用于特指单样本位置检验,当样本方差已知时,将一组测量值的平均值与给定常数进行比较。如果观察到的数据是(i)独立的,(ii)具有共同的平均值μ,以及(iii)具有共同的方差 σ2,那么样本平均值X具有平均值μ和方差σ2 / n.。

零假设是,X的平均值是给定的数字μ0。我们可以用X作为检验统计量,如果X − μ0很大,就拒绝零假设。

要计算标准化统计量Z = (X  −  μ0) / s,我们需要知道或者得到的一个近似值σ2,从中我们可以计算s2 = σ2 / n。在某些应用中,σ2 是已知的,但这并不常见。

如果样本大小适中或较大,我们可以用样本方差 代替σ2 ,进行一个嵌入式检验。由于没有考虑样本方差的不确定性,最终的检验结果将不是精确的Z检验。但是,除非样本量很小,否则这将是一个很好的近似值。

当数据完全正态时,t检验可用于解释样本方差的不确定性。

没有一个通用的常数,在这个常数下,样本大小通常被认为足够大,可以证明嵌入式检验的使用是合理的。典型的经验法则:样本量应被观察50次或更多。

对于大的样本量,t检验过程给出的p值与Z检验过程几乎相同。

其他可以作为Z检验执行的位置检验是双样本位置检验和成对比较检验。

2 条件编辑

为了使Z检验适用,必须满足某些条件。

  • 讨厌参数应该是已知的,或者是高精度估计的(讨厌参数的一个例子是单样本位置检验中的标准偏差)。Z检验只关注单个参数,并将所有其他未知参数视为固定在其真实值。在实践中,根据斯卢茨基定理,“插入”讨厌参数的一致估计是合理的。然而,如果样本量的大小不足以使这些估计合理准确,则Z检验可能不会进行地很好。
  • 检验统计量应遵循正态分布。一般来说,人们借助于中心极限定理来证明假设检验统计量成正态变化是合理的。关于检验统计量何时近似正态变化,有大量的统计研究。如果检验统计量的变化特别非正态,则不应使用Z检验。

如上所述,如果插入了讨厌参数的估计值,使用适合数据抽样方式的估计是很重要的。在一个或两个样本位置问题的Z检验的特殊情况下,通常的样本标准差仅在数据作为独立样本收集时才适用。

在某些情况下,有可能设计一个检验来正确地解释讨厌参数的嵌入式估计值的变化。在一个和两个样本位置问题的情况下,t检验可以做到这一点。

3 例子编辑

假设在特定的地理区域,阅读测试的平均值和标准差分别为100分和12分。我们感兴趣的是某个特殊学校平均分为96分的55名学生。我们可以问这个平均分数是否明显低于地区平均分数——也就是说,这个地区学校的所有学生是否相当于这55个学生的简单随机样本,或者他们的分数是否低得惊人?

首先计算平均值的标准误差:

 

其中  是总体标准差。

接下来计算z分数,即从样本均值到总体均值的距离,单位为标准误差:

 

在本例中,我们将总体均值和方差视为已知,如果对该地区的所有学生进行测试,这将是合适的。当总体参数未知时,应进行t检验。

这个班级的平均分数为96,即96距离总体均值100有-2.47个标准误差单位。在标准正态分布表中查找z分数,我们发现观察一个低于-2.47的标准正态值的概率约为0.5-0.4932 = 0.0068。这是零假设下的单侧p值,即55名学生相当于所有测试群体中的一个简单随机样本。双侧p值约为0.014(单侧p值的两倍)。

另一种说法是,概率为1-0.014 = 0.986时,55名学生的一个简单随机样本的平均测试分数可以在总体均值的四个单位内得到。我们也可以说,有98.6%的置信度,我们拒绝了零假设,即55名测试者与来自测试群体的简单随机样本相当。

Z检验告诉我们,与来自测试群体的相似大小的最简单随机样本相比,55名感兴趣的学生的平均测试分数异常低。这种分析的一个缺点是它没有考虑4点的效应量是否有意义。如果不是一个班级,而是考虑一个包含900名平均分数为99的学生的子区域,将观察到几乎相同的z分数和p值。这表明,如果样本量足够大,与空值的非常小的差异在统计上是非常显著的。

4 除了位置检验以外的z-检验编辑

位置检验是最常见的Z检验。另一类Z检验产生于参数统计模型中参数的最大似然估计。在某些条件下,最大似然估计是近似正态的,并且它们的渐近方差可以根据费雪信息来计算。最大似然估计除以其标准误差可用作参数总体值等于零的零假设的检验统计量。更一般地说,如果    是参数θ的最大似然估计,θ0 是零假设下的θ值,

 

可以用作Z检验统计量。

当使用Z检验进行最大似然估计时,重要的是要注意,如果样本量不够大,正态逼近可能会很差。虽然没有简单、通用的规则来说明使用Z检验时样本量必须有多大,但模拟可以很好的了解Z检验在给定的情况下是否合适。

只要可以证明一个检验统计量在感兴趣的零假设下遵循正态分布,就采用z检验。对于足够大的样本量,许多非参数检验统计量(如U统计量)是近似正态的,因此通常运用Z检验。

阅读 4536
版本记录
  • 暂无