mobile wallpaper 1mobile wallpaper 2mobile wallpaper 3mobile wallpaper 4mobile wallpaper 5mobile wallpaper 6
4300 字
11 分钟
参数估计
2026-06-24 01:50:00

本文主要梳理数理统计中的参数估计。这一章属于数理统计的核心内容,其研究目标可以概括为:

用收集到的样本数据去估计总体中未知的参数\boxed{\text{用收集到的样本数据去估计总体中未知的参数}}

例如,我们已知总体服从正态分布:

XN(μ,σ2)X \sim N(\mu, \sigma^2)

但其中均值参数 μ\mu 和方差参数 σ2\sigma^2 是未知的。我们通过在总体中进行随机抽样,获得一组样本数据:

X1,X2,,XnX_1, X_2, \dots, X_n

随后通过对这些样本数据进行计算,推断和估计未知参数 μ\muσ2\sigma^2 的取值。这就是参数估计。


1. 参数估计的两大分类#

根据估计结果的形式,参数估计可以分为两大类:

点估计区间估计\boxed{\text{点估计}} \quad \text{与} \quad \boxed{\text{区间估计}}
估计类型核心含义典型简例
点估计用一个具体的数值来估计未知参数用样本均值 X\overline{X} 估计总体均值 μ\mu
区间估计用一个包含未知参数的随机区间进行估计估计总体均值满足 μ(a,b)\mu \in (a, b)

简单总结:

点估计给出一个值,区间估计给出一个取值范围\boxed{\text{点估计给出一个值,区间估计给出一个取值范围}}

2. 点估计的定义#

设总体的概率分布中含有未知参数 θ\theta。我们构造一个样本的函数(即统计量):

θ^=θ^(X1,X2,,Xn)\hat{\theta} = \hat{\theta}(X_1, X_2, \dots, X_n)

用这个统计量作为 θ\theta 的代表去进行推断。

  • 估计量:统计量 θ^(X1,X2,,Xn)\hat{\theta}(X_1, X_2, \dots, X_n) 称为未知参数 θ\theta估计量,它是随机变量。
  • 估计值:抽样后代入具体观测值所得到的实数值 θ^(x1,x2,,xn)\hat{\theta}(x_1, x_2, \dots, x_n) 称为未知参数 θ\theta估计值,它是一个确定常数。

例如,样本均值:

X=1ni=1nXi\overline{X} = \frac{1}{n}\sum_{i=1}^n X_i

是总体均值 μ\mu 的一个估计量。

当我们抽样后得到具体的数字,计算出来的算术平均数:

x=1ni=1nxi\overline{x} = \frac{1}{n}\sum_{i=1}^n x_i

则是总体均值 μ\mu 的一个估计值。


3. 常用点估计方法#

在参数估计中,最常用的两种点估计构造方法是:

矩估计法最大似然估计法\boxed{\text{矩估计法}} \quad \text{与} \quad \boxed{\text{最大似然估计法}}

4. 矩估计法#

4.1 核心思想#

矩估计法的基本立足点为:

用样本矩去替代对应的总体矩\boxed{\text{用样本矩去替代对应的总体矩}}

我们用样本原点矩直接替换总体原点矩:

  • 总体的一阶原点矩(即期望)为:E(X)E(X)
  • 样本的一阶原点矩(即均值)为:X\overline{X}

求解单未知参数时,常令二者相等:

E(X)=XE(X) = \overline{X}

然后解出未知参数的表达式即可。

如果总体包含两个未知参数,则需使用两个矩:

  • 总体的一阶与二阶原点矩分别为:E(X)E(X)E(X2)E(X^2)
  • 样本的一阶与二阶原点矩分别为:1ni=1nXi\dfrac{1}{n}\sum\limits_{i=1}^n X_i1ni=1nXi2\dfrac{1}{n}\sum\limits_{i=1}^n X_i^2

4.2 单个参数的矩估计示例#

设总体服从泊松分布:

XP(λ)X \sim P(\lambda)

已知泊松分布的数学期望为:

E(X)=λE(X) = \lambda

样本均值为 X\overline{X}。令总体一阶矩等于样本一阶矩,即:

λ=X\lambda = \overline{X}

从而解得参数 λ\lambda 的矩估计量为:

λ^=X\boxed{\hat{\lambda} = \overline{X}}

4.3 两个参数的矩估计示例#

设总体服从正态分布,其中两个参数 μ\muσ2\sigma^2 均未知:

XN(μ,σ2)X \sim N(\mu, \sigma^2)

总体的前二阶原点矩为:

E(X)=μE(X) = \muE(X2)=D(X)+[E(X)]2=σ2+μ2E(X^2) = D(X) + [E(X)]^2 = \sigma^2 + \mu^2

样本的前二阶原点矩为:

A1=1ni=1nXi=XA_1 = \frac{1}{n}\sum_{i=1}^n X_i = \overline{X}A2=1ni=1nXi2A_2 = \frac{1}{n}\sum_{i=1}^n X_i^2

令总体原点矩等于样本原点矩建立方程组:

μ=X\mu = \overline{X}σ2+μ2=1ni=1nXi2\sigma^2 + \mu^2 = \frac{1}{n}\sum_{i=1}^n X_i^2

解该方程组,得出估计量:

μ^=X\hat{\mu} = \overline{X}σ^2=1ni=1nXi2X2=1ni=1n(XiX)2\hat{\sigma}^2 = \frac{1}{n}\sum_{i=1}^n X_i^2 - \overline{X}^2 = \frac{1}{n}\sum_{i=1}^n (X_i - \overline{X})^2

因此,正态总体方差参数的矩估计量为:

σ^2=1ni=1n(XiX)2\boxed{\hat{\sigma}^2 = \frac{1}{n}\sum_{i=1}^n (X_i - \overline{X})^2}

需要特别注意的是,矩估计中方差项的分母是 nn,而不是无偏样本方差中的 n1n-1


5. 最大似然估计法#

5.1 核心思想#

最大似然估计法的基本立足点为:

寻找能使当前已发生样本观测值概率达到最大值的参数作为估计值\boxed{\text{寻找能使当前已发生样本观测值概率达到最大值的参数作为估计值}}

例如抛一枚硬币 10 次,若实验结果为出现了 8 次正面朝上。我们直觉上会判定该硬币正面朝上的概率更接近 p=0.8p=0.8,而不是普通的 p=0.5p=0.5。这是因为在 p=0.8p=0.8 的设定下,发生“8次正面朝上”这一实验结果的概率最大。这就是最大似然的核心思想。


5.2 似然函数#

设获得的独立同分布样本观测值为 x1,x2,,xnx_1, x_2, \dots, x_n,未知参数为 θ\theta

  • 离散型总体:若总体分布律为 P(X=x)=p(x;θ)P(X = x) = p(x; \theta),则样本联合概率为:
L(θ)=i=1np(xi;θ)L(\theta) = \prod_{i=1}^n p(x_i; \theta)
  • 连续型总体:若总体概率密度函数为 f(x;θ)f(x; \theta),则似然函数定义为:
L(θ)=i=1nf(xi;θ)L(\theta) = \prod_{i=1}^n f(x_i; \theta)

最大似然估计的目标就是求解使似然函数 L(θ)L(\theta) 取得最大值的未知参数:

θ^=argmaxθL(θ)\boxed{\hat{\theta} = \arg\max_\theta L(\theta)}

5.3 对数似然的引入#

由于似然函数 L(θ)L(\theta) 通常是多个乘积项的乘式,直接求导数寻找极值点计算量极大。

而对数函数是单调递增的,所以 L(θ)L(\theta) 的极值点与对数似然函数 lnL(θ)\ln L(\theta) 的极值点完全重合:

lnL(θ)=i=1nlnf(xi;θ)\ln L(\theta) = \sum_{i=1}^n \ln f(x_i; \theta)

取对数后,原本的乘积式转换成了求和式,便于求导数计算。

最大似然估计的通用计算步骤为:

  1. 写出似然函数表达式 L(θ)L(\theta)
  2. 取对数得到对数似然函数 lnL(θ)\ln L(\theta)
  3. 对对数似然函数关于参数求导数(或偏导数);
  4. 令导数为 0 建立一阶极值方程;
  5. 解方程求得最大似然估计量。

6. 最大似然估计例题一:伯努利分布#

设总体服从两点分布,其中 pp 为未知参数:

P(X=1)=p,P(X=0)=1pP(X = 1) = p, \quad P(X = 0) = 1 - p

抽取随机样本为 X1,X2,,XnX_1, X_2, \dots, X_n。求参数 pp 的最大似然估计量。

【解析】

每一个样本 XiX_i 的概率质量可以统一表示为 P(X=Xi)=pXi(1p)1XiP(X = X_i) = p^{X_i}(1-p)^{1-X_i}

写出似然函数:

L(p)=i=1npXi(1p)1Xi=pXi(1p)nXiL(p) = \prod_{i=1}^n p^{X_i}(1-p)^{1-X_i} = p^{\sum X_i}(1-p)^{n - \sum X_i}

取对数得到对数似然函数:

lnL(p)=(i=1nXi)lnp+(ni=1nXi)ln(1p)\ln L(p) = \left(\sum_{i=1}^n X_i\right) \ln p + \left(n - \sum_{i=1}^n X_i\right) \ln(1 - p)

对参数 pp 求导:

ddplnL(p)=XipnXi1p\frac{d}{dp}\ln L(p) = \frac{\sum X_i}{p} - \frac{n - \sum X_i}{1 - p}

令导数等于 0,建立极值方程:

Xip=nXi1p    (1p)Xi=p(nXi)\frac{\sum X_i}{p} = \frac{n - \sum X_i}{1 - p} \implies (1 - p)\sum X_i = p\left(n - \sum X_i\right)

解该方程得出 pp 的最大似然估计量:

p^=1ni=1nXi=X\boxed{\hat{p} = \frac{1}{n}\sum_{i=1}^n X_i = \overline{X}}

它恰好等于样本中发生事件的比例。


7. 最大似然估计例题二:正态分布#

设总体服从正态分布,其中均值 μ\mu 与方差 σ2\sigma^2 均未知:

XN(μ,σ2)X \sim N(\mu, \sigma^2)

样本观测值为 X1,X2,,XnX_1, X_2, \dots, X_n

正态分布密度函数为:

f(x;μ,σ2)=12πσe(xμ)22σ2f(x; \mu, \sigma^2) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x - \mu)^2}{2\sigma^2}}

写出似然函数:

L(μ,σ2)=i=1n12πσe(Xiμ)22σ2=(2πσ2)n2e12σ2(Xiμ)2L(\mu, \sigma^2) = \prod_{i=1}^n \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(X_i - \mu)^2}{2\sigma^2}} = (2\pi\sigma^2)^{-\frac{n}{2}} e^{-\frac{1}{2\sigma^2}\sum (X_i - \mu)^2}

取对数:

lnL(μ,σ2)=n2ln(2π)n2ln(σ2)12σ2i=1n(Xiμ)2\ln L(\mu, \sigma^2) = -\frac{n}{2}\ln(2\pi) - \frac{n}{2}\ln(\sigma^2) - \frac{1}{2\sigma^2}\sum_{i=1}^n (X_i - \mu)^2

分别对 μ\muσ2\sigma^2 求偏导数并令其等于 0:

lnLμ=1σ2i=1n(Xiμ)=0    μ^=X\frac{\partial \ln L}{\partial \mu} = \frac{1}{\sigma^2}\sum_{i=1}^n (X_i - \mu) = 0 \implies \hat{\mu} = \overline{X}lnL(σ2)=n2σ2+12(σ2)2i=1n(Xiμ)2=0    σ^2=1ni=1n(Xiμ^)2\frac{\partial \ln L}{\partial (\sigma^2)} = -\frac{n}{2\sigma^2} + \frac{1}{2(\sigma^2)^2}\sum_{i=1}^n (X_i - \mu)^2 = 0 \implies \hat{\sigma}^2 = \frac{1}{n}\sum_{i=1}^n (X_i - \hat{\mu})^2

代入求出的均值估计量,得到最大似然估计结果:

μ^=X\boxed{\hat{\mu} = \overline{X}}σ^2=1ni=1n(XiX)2\boxed{\hat{\sigma}^2 = \frac{1}{n}\sum_{i=1}^n (X_i - \overline{X})^2}

需要指出的是,最大似然估计推导出的方差分母是 nn,而不是 n1n-1

因为无偏样本方差定义为:

S2=1n1i=1n(XiX)2S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \overline{X})^2

这说明:

正态总体方差的最大似然估计量不是无偏估计量\boxed{\text{正态总体方差的最大似然估计量不是无偏估计量}}

8. 矩估计与最大似然估计的对比#

估计方法核心思想方法特点
矩估计用样本均值、样本平方均值等直接替代总体的对应矩计算相对简单直接,不需要明确知晓总体具体的概率分布类型
最大似然估计寻找使已发生观测结果的联合发生概率达到最大值的参数依赖于总体概率密度的具体形式,推导出的估计量通常具备更为优良的数理统计性质

简明记忆:

矩估计关注统计特征对齐,最大似然估计关注最合理解释样本数据\boxed{\text{矩估计关注统计特征对齐,最大似然估计关注最合理解释样本数据}}

9. 估计量的评价标准#

对于同一个未知参数,采用不同的估计方法可能会构造出不同的估计量。我们需要通过以下三个标准来评价估计量的好坏:

无偏性有效性相合性\boxed{\text{无偏性} \quad \text{与} \quad \text{有效性} \quad \text{与} \quad \text{相合性}}

9.1 无偏性#

若估计量 θ^\hat{\theta} 的数学期望等于未知参数的真实值,则称其为无偏估计量

E(θ^)=θ\boxed{E(\hat{\theta}) = \theta}

这意味着在大量的重复抽样估算中,该估计量在平均水平上没有系统性偏差。

  • 样本均值 X\overline{X} 是总体均值 μ\mu 的无偏估计量,因为 E(X)=μE(\overline{X}) = \mu
  • 无偏样本方差 S2S^2 是总体方差 σ2\sigma^2 的无偏估计量,因为满足 E(S2)=σ2E(S^2) = \sigma^2
  • 而前面求出的矩估计与最大似然估计中的方差估计量 σ^2\hat{\sigma}^2 的期望为:
E(σ^2)=n1nσ2σ2E(\hat{\sigma}^2) = \frac{n-1}{n}\sigma^2 \ne \sigma^2

因此 σ^2\hat{\sigma}^2 是有偏估计。


9.2 有效性#

如果两个估计量 θ^1\hat{\theta}_1θ^2\hat{\theta}_2 都是参数 θ\theta 的无偏估计量,我们通过比较它们的方差来评估其精确度:

若满足:

D(θ^1)<D(θ^2)D(\hat{\theta}_1) < D(\hat{\theta}_2)

则称估计量 θ^1\hat{\theta}_1θ^2\hat{\theta}_2 更有效

简明记忆:

在同样无偏的前提下,谁的方差小波动小,谁就更有效\boxed{\text{在同样无偏的前提下,谁的方差小波动小,谁就更有效}}

9.3 相合性#

若当样本容量 nn \to \infty 时,估计量 θ^\hat{\theta} 依概率收敛于未知参数的真实值 θ\theta,则称其为相合估计量(也叫一致估计量):

θ^Pθ\hat{\theta} \xrightarrow{P} \theta

直观理解是:样本量越大,估算值就越接近真实参数。根据辛钦大数定律,样本均值 X\overline{X} 是总体均值 μ\mu 的相合估计量。


10. 区间估计的基本概念#

点估计仅给出一个具体数值,但在实际中,单点估值刚好等于真实参数的概率几乎为 0。

为了说明估计的精确度与可靠性,我们需要构造一个以高概率包含真实参数的区间,这就是区间估计


10.1 置信区间与置信水平#

如果对于给定的显著性水平 α\alpha0<α<10 < \alpha < 1),能够构造两个统计量 θ1\theta_1θ2\theta_2,使得总体未知参数 θ\theta 满足:

P(θ1<θ<θ2)=1αP(\theta_1 < \theta < \theta_2) = 1 - \alpha

则称随机区间 (θ1,θ2)(\theta_1, \theta_2) 是未知参数 θ\theta 的置信度为 1α1 - \alpha置信区间

  • 这里的 1α1 - \alpha 称为置信水平(置信度),常见的取值有 0.95 或 0.99;
  • 统计量 θ1\theta_1θ2\theta_2 分别称为置信区间的置信下限与置信上限。

10.2 置信区间的正确理解#

例如,我们通过估算得出均值参数置信区间为 μ(98.5,101.2)\mu \in (98.5, 101.2),其置信水平为 95%95\%

需要特别指出,不能解释为“参数 μ\mu95%95\% 的概率落在此区间内”。因为在数理统计中,未知参数 μ\mu 是一个固定的常数,它并不具有随机性;而我们求出来的区间端点 (θ1,θ2)(\theta_1, \theta_2) 才是包含样本数据的随机变量。

正确的解释是:如果按照同样的方法重复抽样 100 次,可以构造出 100 个不同的置信区间,其中大约有 95 个区间能够包含真正的未知参数。

简明规律:

在样本量一定时,置信水平越高,置信区间跨度越宽\boxed{\text{在样本量一定时,置信水平越高,置信区间跨度越宽}}

11. 单个正态总体均值 μ\mu 的区间估计#

这是参数估计章节中最核心的计算部分。


情况一:总体方差 σ2\sigma^2 已知#

设总体服从 XN(μ,σ2)X \sim N(\mu, \sigma^2),其中方差 σ2\sigma^2 已知。

根据样本均值性质有 XN(μ,σ2n)\overline{X} \sim N\left(\mu, \dfrac{\sigma^2}{n}\right),进行标准化处理:

Xμσ/nN(0,1)\frac{\overline{X} - \mu}{\sigma / \sqrt{n}} \sim N(0, 1)

因此,在置信水平为 1α1-\alpha 下,总体均值 μ\mu 的置信区间公式为:

(Xzα/2σn,X+zα/2σn)\boxed{\left( \overline{X} - z_{\alpha/2} \frac{\sigma}{\sqrt{n}}, \quad \overline{X} + z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \right)}

其中 zα/2z_{\alpha/2} 是标准正态分布的双侧分位数。对于 95%95\% 的置信水平,对应 z0.025=1.96z_{0.025} = 1.96


情况二:总体方差 σ2\sigma^2 未知#

设总体服从 XN(μ,σ2)X \sim N(\mu, \sigma^2),其中方差 σ2\sigma^2 未知。

因为方差未知,我们使用无偏样本标准差 SS 替换未知的总体标准差 σ\sigma,此时标准化后的变量不再服从正态分布,而是服从学生分布(即 tt 分布):

XμS/nt(n1)\frac{\overline{X} - \mu}{S / \sqrt{n}} \sim t(n-1)

因此,在置信水平为 1α1-\alpha 下,总体均值 μ\mu 的置信区间公式为:

(Xtα/2(n1)Sn,X+tα/2(n1)Sn)\boxed{\left( \overline{X} - t_{\alpha/2}(n-1) \frac{S}{\sqrt{n}}, \quad \overline{X} + t_{\alpha/2}(n-1) \frac{S}{\sqrt{n}} \right)}

其中 tα/2(n1)t_{\alpha/2}(n-1) 是自由度为 n1n-1tt 分布的双侧分位数。


区间估计工具选择判断#

对于正态总体均值的区间估计,选择检验分布的依据为:

总体方差状态适用分布类型
总体方差 σ2\sigma^2 已知标准正态分布 ZZ 分布
总体方差 σ2\sigma^2 未知tt 分布

简明记忆:

方差已知用 Z,方差未知用 t\boxed{\text{方差已知用 } Z \text{,方差未知用 } t}

12. 单个正态总体方差 σ2\sigma^2 的区间估计#

设总体服从正态分布 XN(μ,σ2)X \sim N(\mu, \sigma^2),其参数均未知。

根据数理统计的基本定理,样本方差满足卡方分布性质:

(n1)S2σ2χ2(n1)\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)

因此,在置信度为 1α1-\alpha 下,总体方差 σ2\sigma^2 的置信区间公式为:

((n1)S2χα/22(n1),(n1)S2χ1α/22(n1))\boxed{\left( \frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)}, \quad \frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)} \right)}
  • 注意:由于卡方分布概率密度并不对称,此区间是不对称的,且分母上较小的值 χ1α/22(n1)\chi^2_{1-\alpha/2}(n-1) 作为分母排在右侧上限位置。

若需要求标准差 σ\sigma 的置信区间,对区间两端点开平方根即可:

((n1)S2χα/22(n1),(n1)S2χ1α/22(n1))\boxed{\left( \sqrt{\frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)}}, \quad \sqrt{\frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)}} \right)}

13. 单个总体比例 pp 的区间估计#

设总体某特征出现的概率(如次品率、合格率)为 pp。进行了 nn 次独立重复试验,样本比例为 p^=Xn\hat{p} = \dfrac{X}{n}

当样本量 nn 较大时,根据中心极限定理,样本比例近似服从正态分布:

p^N(p,p(1p)n)\hat{p} \approx N\left(p, \frac{p(1-p)}{n}\right)

我们在计算方差时使用样本比例 p^\hat{p} 代替未知参数 pp,得出其近似的 1α1-\alpha 置信区间公式:

(p^zα/2p^(1p^)n,p^+zα/2p^(1p^)n)\boxed{\left( \hat{p} - z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}, \quad \hat{p} + z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \right)}

14. 两个独立正态总体均值差 μ1μ2\mu_1 - \mu_2 的区间估计#

设有两个独立的总体 XN(μ1,σ12)X \sim N(\mu_1, \sigma_1^2)YN(μ2,σ22)Y \sim N(\mu_2, \sigma_2^2)。样本均值分别为 X\overline{X}Y\overline{Y}


情况一:两个总体方差已知#

当总体方差 σ12\sigma_1^2σ22\sigma_2^2 均已知时,均值差的 1α1-\alpha 置信区间公式为:

((XY)zα/2σ12n1+σ22n2,(XY)+zα/2σ12n1+σ22n2)\boxed{\left( (\overline{X} - \overline{Y}) - z_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}, \quad (\overline{X} - \overline{Y}) + z_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}} \right)}

情况二:两个总体方差未知但相等#

若两总体方差未知,但根据经验可以确定它们相等,即 σ12=σ22=σ2\sigma_1^2 = \sigma_2^2 = \sigma^2

我们首先计算两个样本的联合样本方差(即合并样本方差) Sw2S_w^2

Sw2=(n11)S12+(n21)S22n1+n22S_w^2 = \frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2}

在此条件下,均值差的置信区间采用 tt 分布:

((XY)tα/2(n1+n22)Sw1n1+1n2,(XY)+tα/2(n1+n22)Sw1n1+1n2)\boxed{\left( (\overline{X} - \overline{Y}) - t_{\alpha/2}(n_1+n_2-2)S_w\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}, \quad (\overline{X} - \overline{Y}) + t_{\alpha/2}(n_1+n_2-2)S_w\sqrt{\frac{1}{n_1} + \frac{1}{n_2}} \right)}

15. 两个独立正态总体方差比 σ12σ22\dfrac{\sigma_1^2}{\sigma_2^2} 的区间估计#

对于方差比值的估计,需要构造服从 FF 分布的统计量:

S12/σ12S22/σ22F(n11,n21)\frac{S_1^2 / \sigma_1^2}{S_2^2 / \sigma_2^2} \sim F(n_1 - 1, n_2 - 1)

由此推导出总体方差比值 σ12σ22\dfrac{\sigma_1^2}{\sigma_2^2}1α1-\alpha 置信区间为:

(S12S221Fα/2(n11,n21),S12S221F1α/2(n11,n21))\boxed{\left( \frac{S_1^2}{S_2^2} \frac{1}{F_{\alpha/2}(n_1-1, n_2-1)}, \quad \frac{S_1^2}{S_2^2} \frac{1}{F_{1-\alpha/2}(n_1-1, n_2-1)} \right)}

利用临界值倒数关系 F1α/2(d1,d2)=1Fα/2(d2,d1)F_{1-\alpha/2}(d_1, d_2) = \dfrac{1}{F_{\alpha/2}(d_2, d_1)},上式也可以改写。


16. 参数估计常见考查题型#

题型一:求参数的矩估计量#

解题步骤

  1. 算期望:写出总体原点矩表达式,如 E(X)E(X)E(X2)E(X^2)
  2. 算样本矩:写出样本对应的一阶或二阶均值式子,如 X\overline{X}1nXi2\dfrac{1}{n}\sum X_i^2
  3. 对齐:令总体矩恒等于对应的样本矩;
  4. 解方程:解出未知参数的显式表达式。

题型二:求参数的最大似然估计量#

解题步骤

  1. 乘积建立似然函数:根据离散分布律或连续密度函数求积式,列出 L(θ)L(\theta)
  2. 取对数:求得对数似然 lnL(θ)\ln L(\theta)
  3. 求导数:对对数似然求未知参数的一阶导数(或偏导数方程组);
  4. 令导数为 0:建立极值点方程;
  5. 解未知数:解得估计量表达式。

题型三:检验估计量的无偏性#

解题步骤

  1. 求出所构造估计量 θ^\hat{\theta} 的数学期望 E(θ^)E(\hat{\theta})
  2. 判定其结果是否完全等于参数的真实值 θ\theta。若恒等则为无偏估计,否则为有偏估计。

题型四:判断置信区间的适用公式#

解题步骤: 审清题目中是“均值区间”还是“方差区间”;针对均值区间,看清总体标准差 σ\sigma 在题干中是否已知,根据“已知用 ZZ,未知用 tt”的规律选择对应公式。


17. 易错点总结#

易错点一:混淆估计量与估计值#

估计量(如 θ^(X1,,Xn)\hat{\theta}(X_1, \dots, X_n))是一个关于样本随机变量的函数,其本身是具有分布特性的随机变量。而估计值(如 θ^(x1,,xn)\hat{\theta}(x_1, \dots, x_n))是将具体的数值代入后计算得出的具体数值。

易错点二:正态总体方差估计的常数分母混淆#

需要理清:样本方差 S2S^2 的分母是 n1n-1,它是总体方差的无偏估计;而通过矩估计与最大似然估计求出来的正态方差估计量,其分母是 nn,它是有偏估计。

易错点三:区间估计中置信水平与区间宽度的关系#

在样本容量不变的情况下,如果想要提高置信水平(例如从 95% 提升到 99%),置信区间的跨度必然会变宽,因为更高的可靠度要求更大的覆盖范围。

易错点四:区间估计中对未知参数随机落入的错误表述#

置信区间是一个随机区间,其边界是随机变量。而未知参数是一个未知的恒定常数。所以应当表述为“区间包含该参数的概率为置信水平”,而不是“参数落入区间的概率”。


18. 本章核心公式表#

知识点内容核心公式与计算式
矩估计法总体原点矩等于对应的样本原点矩(E(Xk)=AkE(X^k) = A_k
似然函数 (连续型)L(θ)=i=1nf(xi;θ)L(\theta) = \prod\limits_{i=1}^n f(x_i; \theta)
对数似然求极值ddθlnL(θ)=0\dfrac{d}{d\theta}\ln L(\theta) = 0
无偏性定义E(θ^)=θE(\hat{\theta}) = \theta
有效性比较在无偏的前提下,方差较小者更有效(D(θ^1)<D(θ^2)D(\hat{\theta}_1) < D(\hat{\theta}_2)
均值置信区间 (σ\sigma 已知)(Xzα/2σn,X+zα/2σn)\left( \overline{X} - z_{\alpha/2}\dfrac{\sigma}{\sqrt{n}}, \quad \overline{X} + z_{\alpha/2}\dfrac{\sigma}{\sqrt{n}} \right)
均值置信区间 (σ\sigma 未知)(Xtα/2(n1)Sn,X+tα/2(n1)Sn)\left( \overline{X} - t_{\alpha/2}(n-1)\dfrac{S}{\sqrt{n}}, \quad \overline{X} + t_{\alpha/2}(n-1)\dfrac{S}{\sqrt{n}} \right)
方差置信区间 (σ2\sigma^2 未知)((n1)S2χα/22(n1),(n1)S2χ1α/22(n1))\left( \dfrac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)}, \quad \dfrac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)} \right)
总体比例置信区间(p^zα/2p^(1p^)n,p^+zα/2p^(1p^)n)\left( \hat{p} - z_{\alpha/2}\sqrt{\dfrac{\hat{p}(1-\hat{p})}{n}}, \quad \hat{p} + z_{\alpha/2}\sqrt{\dfrac{\hat{p}(1-\hat{p})}{n}} \right)

19. 一句话掌握参数估计#

参数估计的完整推导链条为:

构造点估计量利用三大性质评价利用枢轴量法建立置信区间\boxed{\text{构造点估计量} \rightarrow \text{利用三大性质评价} \rightarrow \text{利用枢轴量法建立置信区间}}

做题时的分析路径为:

  1. 确定估计模式:如果要求单一估值则用点估计,如果要求范围则用区间估计;
  2. 点估计求解:矩估计令一二阶原点矩对齐解方程;最大似然估计求导对数似然式并令导数为 0;
  3. 区间估计求解:根据正态分布均值估计的条件判断,方差已知套用标准正态分位数,方差未知套用 tt 分位数;方差估计套用卡方分位数。

20. 框框老师#

Image Image Image Image Image Image

分享

如果这篇文章对你有帮助,欢迎分享给更多人!

参数估计
https://www.bilibili.com/video/BV168411Z7pf?p=9
作者
黎明
发布于
2026-06-24 01:50:00
许可协议
MIT

部分信息可能已经过时

目录