本文主要梳理数理统计中的假设检验。假设检验与前面的参数估计并称为数理统计的两大核心内容。
它们之间的区别和联系可以简单概括为:
利用样本数据去推断总体中的未知参数具体是多少
利用样本数据去推断关于总体参数的某一种说法是否可信
1. 假设检验的基本思想#
假设检验的核心理论依据是概率论中的小概率事件原理:
如果在原假设成立的前提下,一个极小概率的事件居然在一次抽样试验中发生了,那么我们就有充分的理由怀疑该原假设是不成立的。
典型简例#
某零件工厂声称其生产的产品平均寿命为:
μ=1000 小时现进行随机抽样检测,测得样本的平均寿命明显小于 1000 小时。如果在“总体均值 μ=1000 成立”的前提下,抽样得到如此之小的样本均值是一件几乎不可能发生的小概率事件,那么我们就有理由推翻厂家的宣传,倾向于拒绝该厂家的说法。
2. 原假设与备择假设#
在假设检验中,我们需要对立地提出两个假设。
原假设#
原假设(也称虚无假设)记作:
H0通常代表:
- 状态没有差异或没有变化;
- 维持原状,或厂家宣称的指标成立;
- 未知参数等于某个给定的标准值。
例如:
H0:μ=1000
备择假设#
备择假设记作:
H1通常代表我们所倾向于寻找、证实或检验的另一种可能性。
例如:
H1:μ=1000或H1:μ>1000或H1:μ<1000
3. 双侧检验与单侧检验#
根据备择假设 H1 的方向不同,假设检验可以细分为双侧检验与单侧检验。
双侧检验#
如果备择假设是:
H1:μ=μ0则称为双侧检验。这代表只要样本数据算得的总体均值显着地大于 μ0 或者显着地小于 μ0,均会被判定为异常,从而拒绝原假设。
例如:
H0:μ=1000,H1:μ=1000
右侧检验#
如果备择假设是:
H1:μ>μ0则称为右侧检验。例如,我们需要检验某种新改进的教学法是否显著提高了学生的平均成绩:
H0:μ=80,H1:μ>80
左侧检验#
如果备择假设是:
H1:μ<μ0则称为左侧检验。例如,我们需要检验某种新设备零件的寿命是否低于标准寿命要求:
H0:μ=1000,H1:μ<1000
4. 显著性水平#
显著性水平记作:
α它代表在进行假设检验时,我们所能允许的犯第一类错误(即原假设本是真实的却被错误地拒绝)的最大概率限度。
常见的取值有 0.05 或 0.01。例如,当设定 α=0.05 时,意味着有至多 5% 的概率会将一个真实成立的原假设 H0 错误地予以拒绝。
5. 两类错误#
在做出检验决策时,受样本随机性的局限,我们可能会犯以下两类错误:
| 决策结果 \ H0 的真实状态 | H0 为真 | H0 为假 |
|---|
| 接受 H0 | 决策正确 | 犯第二类错误(概率为 β) |
| 拒绝 H0 | 犯第一类错误(概率为 α) | 决策正确 |
- 第一类错误:原假设 H0 真实成立,但我们根据样本决策却拒绝了它。其概率上限即为显著性水平 α。
- 第二类错误:原假设 H0 不成立,但由于样本特征不明显,我们决策未能拒绝它。其发生概率通常记作 β。
在考题与实际应用中,主要控制和考查的是第一类错误概率 α。
6. 检验统计量#
为进行检验,我们需要构造一个基于样本的统计量,称为检验统计量。
该统计量需要具备以下核心性质:
当原假设 H0 成立时,该检验统计量的概率分布类型是完全已知的例如在正态总体均值的检验中,若已知总体方差 σ2,我们构造检验统计量为:
Z=σ/nX−μ0一旦假定 H0:μ=μ0 成立,该统计量必服从标准正态分布:
Z∼N(0,1)我们可以通过观察样本实际算出的 Z 是否落入其分布的极端区域,来判断该事件是否发生。
7. 拒绝域#
如果样本算得的检验统计量数值落入了某个概率极低的极端取值区域,说明在原假设成立的前提下发生了一件小概率事件,据此我们将拒绝原假设。这个极端的区域称为拒绝域。
以检验统计量 Z∼N(0,1) 为例:
双侧检验#
H0:μ=μ0,H1:μ=μ0拒绝域公式为:
∣Z∣>zα/2其中分位数满足 P(Z>zα/2)=2α。
右侧检验#
H1:μ>μ0拒绝域公式为:
Z>zα
左侧检验#
H1:μ<μ0拒绝域公式为:
Z<−zα
8. 假设检验的一般决策步骤#
进行假设检验题时,标准的步骤可以分为五步:
第一步:提出原假设与备择假设#
明确写出 H0 与 H1 的具体参数表达形式。
第二步:选择显著性水平 α#
根据题干要求,一般取 α=0.05 或 α=0.01。
第三步:确定检验统计量#
结合总体背景条件(如正态总体中方差已知或未知),选择 Z、T、χ2 或 F 统计量。
第四步:确定拒绝域边界临界值#
根据检验的双侧或单侧方向,以及显著性水平查表确定临界值,写出拒绝域表达式。
第五步:代入数据计算并得出决策结论#
如果计算值落入拒绝域,则:
拒绝原假设 H0如果计算值没有落入拒绝域,则:
不拒绝原假设 H0
- 注意:学术上通常表述为“不拒绝 H0”而避免直接写“接受 H0”,因为样本只能说明没有充足的证据拒绝它,并不等同于从数学上证明了它绝对正确。
9. 单个正态总体均值 μ 的检验#
这是考试中出现频率最高的一类检验。
情况一:总体方差 σ2 已知#
设总体 X∼N(μ,σ2),其中 σ2 已知。我们需要检验 H0:μ=μ0。
选择统计量:
Z=σ/nX−μ0当原假设 H0 成立时,此统计量满足 Z∼N(0,1)。
根据备择假设的方向,其拒绝域为:
- 双侧检验 (H1:μ=μ0):
∣Z∣>zα/2
- 右侧检验 (H1:μ>μ0):
Z>zα
- 左侧检验 (H1:μ<μ0):
Z<−zα
情况二:总体方差 σ2 未知#
设总体 X∼N(μ,σ2),其中 σ2 未知。我们需要检验 H0:μ=μ0。
此时需要使用样本无偏标准差 S 来替换未知的总体标准差 σ,构造的统计量变为 t 统计量:
T=S/nX−μ0当原假设 H0 成立时,此统计量满足 T∼t(n−1)。
其对应的拒绝域为:
- 双侧检验 (H1:μ=μ0):
∣T∣>tα/2(n−1)
- 右侧检验 (H1:μ>μ0):
T>tα(n−1)
- 左侧检验 (H1:μ<μ0):
T<−tα(n−1)
10. 单个正态总体方差 σ2 的检验#
设总体服从正态分布 X∼N(μ,σ2),我们需要检验总体方差是否等于特定值 σ02:
H0:σ2=σ02构造检验统计量为:
χ2=σ02(n−1)S2当原假设 H0 成立时,此统计量满足 χ2∼χ2(n−1)。
根据卡方临界值规定(定义 χα2 表示卡方右侧尾部面积为 α 的分位数),其拒绝域为:
- 双侧检验 (H1:σ2=σ02):
χ2<χ1−α/22(n−1)或χ2>χα/22(n−1)
- 右侧检验 (H1:σ2>σ02):
χ2>χα2(n−1)
- 左侧检验 (H1:σ2<σ02):
χ2<χ1−α2(n−1)
11. 两个独立正态总体均值差 μ1−μ2 的检验#
设有两个独立的总体 X∼N(μ1,σ12) 和 Y∼N(μ2,σ22)。样本均值分别为 X 和 Y。
我们检验原假设:
H0:μ1−μ2=Δ0(当检验均值是否相等时,Δ0=0)
情况一:两个总体方差已知#
选择检验统计量为:
Z=n1σ12+n2σ22(X−Y)−Δ0当原假设 H0 成立时,此统计量满足 Z∼N(0,1)。
情况二:两个总体方差未知但相等#
若两个总体的方差均未知,但满足 σ12=σ22=σ2。
我们使用合并样本方差 Sw2:
Sw2=n1+n2−2(n1−1)S12+(n2−1)S22选择的检验统计量为:
T=Swn11+n21(X−Y)−Δ0当原假设 H0 成立时,此统计量满足 T∼t(n1+n2−2)。
12. 配对样本(成对数据)均值差的检验#
如果抽样得到的两个样本数据不是独立的,而是存在一一配对的关系,我们应进行配对样本检验。
常见场景有:
- 同一批被试在参加培训(或接受干预)前后的考试成绩对比;
- 同一批病人在使用某种治疗药物前后的血压指标对比;
- 采用不同仪器对同一批工业零件测量所得的误差对比。
对于这类问题,我们的解题方法是先对每组配对数据求差值:
Di=Xi−Yi通过做差,将两样本检验问题完美转化为了单总体均值的假设检验问题:
H0:μD=0构造检验统计量:
T=SD/nD−0当原假设 H0 成立时,满足 T∼t(n−1),式中 D 和 SD 分别是差值序列的样本均值和样本无偏标准差。
核心策略:
配对样本检验:先求差值建立单序列,再套用单总体均值 t 检验
13. 两个独立正态总体方差比 σ22σ12 的检验#
设有两个独立的总体,我们需要检验它们的方差是否相等:
H0:σ12=σ22构造检验统计量为:
F=S22S12当原假设 H0 成立时,此统计量满足 F∼F(n1−1,n2−1)。
- 若进行右侧检验 (H1:σ12>σ22),对应的拒绝域为:
F>Fα(n1−1,n2−1)
14. 总体比例 p 的假设检验#
设总体中事件发生的概率为 p,我们要检验:
H0:p=p0在样本容量 n 较大时,利用中心极限定理,样本比例 p^ 近似服从正态分布,由此构造检验统计量:
Z=np0(1−p0)p^−p0当 H0 成立时,其值近似服从标准正态分布,可根据单双侧方向确定拒绝域。
15. P 值检验法#
除了上面基于临界值确定拒绝域的检验决策方法外,还可以直接利用 P 值 开展决策。
P 值(概率值)定义为:
在原假设 H0 成立的前提下,所获得的样本观测值或比其更为极端的事件发生的概率P 值的决策规则为:
P 值≤α⟹拒绝原假设 H0P 值>α⟹不拒绝原假设 H0简单记为:
P 值越小,说明样本观测数据对原假设 H0 的支持力度越弱
16. 假设检验与置信区间的内在联系#
对于参数的双侧检验问题:
H0:μ=μ0,H1:μ=μ0在显著性水平 α 下执行假设检验决策,与计算该参数置信水平为 1−α 的置信区间是等价的:
- 若假设的参数点 μ0 落在了置信区间内部,说明它是个可信的取值,故不拒绝原假设;
- 若假设的参数点 μ0 未落入置信区间内部,说明它落在置信区间外,故拒绝原假设。
例如,显著性水平为 0.05 的双侧均值检验与 95% 的均值置信区间相互对应。
17. 典型例题解析#
某加工厂生产的产品标准寿命为 1000 小时。现在从新批次的产品中随机抽样抽取 16 件进行测试,测得:
x=970 小时,s=60 小时假设该产品的寿命分布服从正态分布,在显著性水平 α=0.05 条件下,试检验该批次产品的平均寿命是否低于标准寿命。
第一步:提出假设#
由于是要检验产品的均值“是否低于”标准,属于单侧的左侧检验:
H0:μ=1000H1:μ<1000
第二步:选择检验统计量#
因为总体为正态分布,且总体方差未知,所以应采用 t 检验:
T=S/nX−μ0
第三步:代入样本数据计算统计量#
代入数据计算 T 值:
T=60/16970−1000=15−30=−2
第四步:确定拒绝域#
本题样本容量 n=16,自由度为 n−1=15。
在显著性水平 α=0.05 下的左侧检验,其对应的拒绝域形式为:
T<−t0.05(15)查表得出自由度为 15 时的 t 分布临界值为 t0.05(15)≈1.753。
故拒绝域为:
T<−1.753
第五步:对比并得出最终决策结论#
因为计算得到的统计量结果:
−2<−1.753统计量值落入了拒绝域。
结论为:
拒绝原假设 H0也就是说,在显著性水平 0.05 下,我们可以认为该批次产品的平均寿命显著低于 1000 小时的标准。
18. 常用参数假设检验方法汇总#
| 检验类型 | 适用条件场景 | 检验统计量公式 |
|---|
| 单总体均值 | 正态总体,σ 已知 | Z=σ/nX−μ0 |
| 单总体均值 | 正态总体,σ 未知 | T=S/nX−μ0 |
| 单总体方差 | 正态总体,均值未知 | χ2=σ02(n−1)S2 |
| 双总体均值差 | 独立样本,方差已知 | Z=σ12/n1+σ22/n2(X−Y)−Δ0 |
| 双总体均值差 | 独立样本,方差未知但相等 | T=Sw1/n1+1/n2(X−Y)−Δ0 |
| 配对均值差 | 成对关联样本 | T=SD/nD−0 |
| 双总体方差比 | 独立正态总体 | F=S22S12 |
| 总体比例 | 大样本近似 | Z=p0(1−p0)/np^−p0 |
19. 解题时的决策判断路径#
面对具体考题,可以通过以下顺序开展判断:
第一步:明确检验的对象#
确认题目中是要对“均值”、“方差”还是对“比例”指标开展判定;是一样本的检验,还是二样本的差值或比值检验。
第二步:分析总体假定与抽样性质#
理清总体是否正态,方差是否已知;两个样本是相互独立的,还是配对样本。
第三步:根据备择假设确定拒绝域方向#
观察备择假设 H1 中是“不等于”(双侧)、“大于”(右侧)还是“小于”(左侧),以此准确锁定对应的分位数边界。
20. 常见易错陷阱总结#
易错陷阱一:决策结论用语不严密#
不能轻易下结论为“完全接受原假设 H0”。当统计量没落入拒绝域时,正确的结论描述是“在当前的显著性水平下,我们没有充足的证据拒绝原假设 H0,因此不拒绝原假设 H0”。
易错陷阱二:单双侧假设方向与题目对不齐#
如果题目问的是“是否有显著性差异”或“是否发生改变”,应当选用双侧检验;若题目明确倾向性,如检验“是否提高/大于”则选用右侧,检验“是否降低/低于”则选用左侧。
易错陷阱三:统计量中的标准差代错#
要注意如果总体方差未知,用无偏样本标准差 S 替代 σ 后,统计量必须使用 t 临界值;千万不能在使用样本标准差的同时去查标准正态分布 Z 分位数表。
21. 本章核心公式速查表#
| 知识点 | 检验统计量表达形式 |
|---|
| 单均值 (σ2 已知) | Z=σ/nX−μ0 |
| 单均值 (σ2 未知) | T=S/nX−μ0 |
| 单方差 | χ2=σ02(n−1)S2 |
| 双均值差 (方差已知) | Z=σ12/n1+σ22/n2(X−Y)−Δ0 |
| 双均值差 (方差相等) | T=Sw1/n1+1/n2(X−Y)−Δ0 |
| 配对差值均值 | T=SD/nD−0 |
| 双总体方差比 | F=S22S12 |
| 总体比例 | Z=p0(1−p0)/np^−p0 |
22. 一句话掌握假设检验#
假设检验的完整逻辑主线为:
假设原假设成立→寻找并计算检验统计量→判定是否落入低概率拒绝域做题时的标准思考模板为:
列假设→选统计量→定拒绝域→算结果→下结论