mobile wallpaper 1mobile wallpaper 2mobile wallpaper 3mobile wallpaper 4mobile wallpaper 5mobile wallpaper 6
3393 字
9 分钟
随机变量的数字特征
2026-06-22 11:26:44

本文主要梳理随机变量的数字特征。这一章的核心思想可以总结为:

用几个关键的数值来概括随机变量分布的主要特征\boxed{\text{用几个关键的数值来概括随机变量分布的主要特征}}

前面的分布律、概率密度函数和累积分布函数能够完整地描述随机变量的概率分布。然而,在实际问题中,人们往往更需要从分布中提取出最具有代表性的指标,例如:

  • 衡量平均水平:数学期望
  • 衡量波动程度:方差标准差
  • 衡量两个随机变量的相关关系:协方差相关系数
  • 更高阶的特征描述:

1. 数学期望#

数学期望也常称为均值,它描述的是随机变量取值的平均水平,记作:

E(X)E(X)

需要明确的是,数学期望并不代表随机变量 XX 一定会取到这个数值,而是代表在大量重复试验后,随机变量取值的长期平均水平。


1.1 离散型随机变量的数学期望#

若离散型随机变量 XX 的分布律为:

P(X=xi)=pi,i=1,2,P(X = x_i) = p_i, \quad i = 1, 2, \dots

XX 的数学期望定义为:

E(X)=ixipi\boxed{E(X) = \sum_i x_i p_i}

这里要求级数必须是绝对收敛的,即 ixipi\sum_i |x_i| p_i 存在。

简要理解:

期望=取值×对应概率,然后进行求和\boxed{\text{期望} = \text{取值} \times \text{对应概率},\text{然后进行求和}}

计算示例#

掷一个均匀的骰子,令随机变量 XX 表示掷出的点数。

易知 XX 的分布律为:

P(X=1)=P(X=2)==P(X=6)=16P(X = 1) = P(X = 2) = \dots = P(X = 6) = \frac{1}{6}

则其数学期望为:

E(X)=116+216++616E(X) = 1 \cdot \frac{1}{6} + 2 \cdot \frac{1}{6} + \dots + 6 \cdot \frac{1}{6}E(X)=1+2+3+4+5+66=216=3.5E(X) = \frac{1 + 2 + 3 + 4 + 5 + 6}{6} = \frac{21}{6} = 3.5

骰子的点数只可能是整数,绝不可能掷出 3.5 这个值,但 3.5 代表了长期掷骰子得到的点数平均值。


1.2 连续型随机变量的数学期望#

若连续型随机变量 XX 的概率密度函数为 f(x)f(x),则其数学期望定义为:

E(X)=+xf(x)dx\boxed{E(X) = \int_{-\infty}^{+\infty} x f(x)\,dx}

要求该积分绝对收敛。

简要理解:

连续型期望:将离散型的求和符号替换为积分运算\boxed{\text{连续型期望:将离散型的求和符号替换为积分运算}}

计算示例#

设随机变量 XX 在区间 [0,1][0, 1] 上服从均匀分布,即:

XU(0,1)X \sim U(0, 1)

其概率密度函数为:

f(x)={1,0<x<10,其他f(x) = \begin{cases} 1, & 0 < x < 1 \\ 0, & \text{其他} \end{cases}

根据公式计算其数学期望:

E(X)=01x1dx=[12x2]01=12E(X) = \int_0^1 x \cdot 1\,dx = \left[ \frac{1}{2}x^2 \right]_0^1 = \frac{1}{2}

2. 随机变量函数的期望#

在很多实际计算中,我们并不是直接求解 E(X)E(X),而是需要求解由 XX 通过某种函数关系 g(X)g(X) 得到的新随机变量的期望:

E[g(X)]E[g(X)]

例如常见的:E(X2)E(X^2)E(2X+1)E(2X + 1)E(eX)E(e^X)

求此类期望时,无需先推导新随机变量 Y=g(X)Y = g(X) 的概率分布,直接利用下述公式进行计算即可。


2.1 离散型情况#

XX 的分布律为 P(X=xi)=piP(X = x_i) = p_i,则其函数的期望为:

E[g(X)]=ig(xi)pi\boxed{E[g(X)] = \sum_i g(x_i)p_i}

2.2 连续型情况#

XX 的密度函数为 f(x)f(x),则其函数的期望为:

E[g(X)]=+g(x)f(x)dx\boxed{E[g(X)] = \int_{-\infty}^{+\infty} g(x)f(x)\,dx}

这两个期望求法极其重要,特别是在计算方差时,通常需要优先套用此公式求出 E(X2)E(X^2)


3. 数学期望的性质#

性质一:常数的期望#

常数不具备随机性,其期望即为常数本身。

E(c)=c\boxed{E(c) = c}

性质二:线性性质#

数学期望是一个线性算子,满足如下拆分规则:

E(aX+b)=aE(X)+b\boxed{E(aX + b) = aE(X) + b}

对于两个随机变量的和:

E(aX+bY)=aE(X)+bE(Y)\boxed{E(aX + bY) = aE(X) + bE(Y)}

需要特别提醒的是:此线性性质对任意随机变量 X,YX, Y 均成立,不需要它们相互独立。


性质三:独立变量乘积的期望#

如果随机变量 XXYY 相互独立,则它们乘积的期望等于各自期望的乘积:

E(XY)=E(X)E(Y)\boxed{E(XY) = E(X)E(Y)}

注意其反面结论:当满足 E(XY)=E(X)E(Y)E(XY) = E(X)E(Y) 时,并不能反向推导得出 X,YX, Y 相互独立。


4. 方差#

均值描述的是随机变量的平均水平,但无法反映随机变量取值在其均值周围波动的剧烈程度。

例如两个学生的成绩数据:

  • 学生甲:80,80,8080, 80, 80
  • 学生乙:60,80,10060, 80, 100

他们的平均分都是 80 分,但显然学生乙的成绩波动性、不确定性大得多。

为了刻画这种偏差程度,引入方差

方差记作:

D(X)Var(X)D(X) \quad \text{或} \quad \operatorname{Var}(X)

其定义为:

D(X)=E[(XE(X))2]\boxed{D(X) = E\left[(X - E(X))^2\right]}

它代表随机变量取值与其期望值之间偏差平方的平均水平。


方差的常用计算公式#

在实际计算中,利用定义直接求方差往往比较繁琐,通常采用以下推导出的化简公式:

D(X)=E(X2)[E(X)]2\boxed{D(X) = E(X^2) - [E(X)]^2}

这是求解方差最常用的黄金公式。

做题步骤通常分为三步:

  1. 算出 E(X)E(X)
  2. 算出 E(X2)E(X^2)
  3. 代入公式 D(X)=E(X2)[E(X)]2D(X) = E(X^2) - [E(X)]^2 得到最终结果。

计算示例#

我们来求解掷骰子点数 XX 的方差。

已知期望 E(X)=3.5=72E(X) = 3.5 = \frac{7}{2}

首先计算 E(X2)E(X^2)

E(X2)=1216+2216++6216E(X^2) = 1^2 \cdot \frac{1}{6} + 2^2 \cdot \frac{1}{6} + \dots + 6^2 \cdot \frac{1}{6}E(X2)=1+4+9+16+25+366=916E(X^2) = \frac{1 + 4 + 9 + 16 + 25 + 36}{6} = \frac{91}{6}

然后代入常用公式计算方差:

D(X)=E(X2)[E(X)]2=916(72)2D(X) = E(X^2) - [E(X)]^2 = \frac{91}{6} - \left(\frac{7}{2}\right)^2D(X)=916494=18214712=3512D(X) = \frac{91}{6} - \frac{49}{4} = \frac{182 - 147}{12} = \frac{35}{12}

5. 标准差#

由于方差公式中含有平方项,导致方差的量纲(单位)是原随机变量单位的平方。例如当随机变量表示身高(单位为厘米)时,其方差的单位变成了平方厘米,在直观上不便于比较。

因此引入标准差,记作 σ(X)\sigma(X)

σ(X)=D(X)\boxed{\sigma(X) = \sqrt{D(X)}}

标准差的单位与随机变量本身的单位完全一致,能更直观地反映随机变量偏离均值的实际波动幅度。


6. 方差的性质#

性质一:常数的方差为 0#

常数没有波动性,其方差必然为 0。

D(c)=0\boxed{D(c) = 0}

性质二:平移不改变方差#

将随机变量整体加上一个常数,只是整体平移,并不改变其取值的离散程度(波动幅度):

D(X+b)=D(X)\boxed{D(X + b) = D(X)}

性质三:倍数呈平方系数影响方差#

自变量放大 aa 倍,其对应的波动偏差的平方则会放大 a2a^2 倍:

D(aX)=a2D(X)\boxed{D(aX) = a^2 D(X)}

结合性质二,可以得到常用的复合线性公式:

D(aX+b)=a2D(X)\boxed{D(aX + b) = a^2 D(X)}

性质四:两个随机变量和与差的方差#

在一般情况下,和的方差公式中必须包含它们之间的协方差项:

D(X+Y)=D(X)+D(Y)+2Cov(X,Y)\boxed{D(X + Y) = D(X) + D(Y) + 2\operatorname{Cov}(X, Y)}

如果随机变量 XXYY 相互独立,则协方差项为 0,公式化简为:

D(X+Y)=D(X)+D(Y)\boxed{D(X + Y) = D(X) + D(Y)}

同理,当随机变量相互独立时,差的方差公式也为加号:

D(XY)=D(X)+D(Y)\boxed{D(X - Y) = D(X) + D(Y)}

注意:无论独立时是相加还是相减,方差均是直接求和,没有减法。


7. 常见分布的期望和方差#

熟练记忆常见分布的期望与方差,在做选择题、填空题时可以极大地提高解题速度。

分布类型记号数学期望 E(X)E(X)方差 D(X)D(X)
两点分布XB(1,p)X \sim B(1, p)ppp(1p)p(1 - p)
二项分布XB(n,p)X \sim B(n, p)npnpnp(1p)np(1 - p)
泊松分布XP(λ)X \sim P(\lambda)λ\lambdaλ\lambda
均匀分布XU(a,b)X \sim U(a, b)a+b2\dfrac{a + b}{2}(ba)212\dfrac{(b - a)^2}{12}
指数分布XE(λ)X \sim E(\lambda)1λ\dfrac{1}{\lambda}1λ2\dfrac{1}{\lambda^2}
正态分布XN(μ,σ2)X \sim N(\mu, \sigma^2)μ\muσ2\sigma^2

8. 协方差#

方差用来研究一个随机变量自身的波动程度。当我们需要同时考察两个随机变量,研究它们之间共同变化的关联关系时,就需要使用协方差

协方差记作 Cov(X,Y)\operatorname{Cov}(X, Y),其定义为:

Cov(X,Y)=E[(XE(X))(YE(Y))]\boxed{\operatorname{Cov}(X, Y) = E\left[(X - E(X))(Y - E(Y))\right]}

实际计算中,常使用以下计算公式:

Cov(X,Y)=E(XY)E(X)E(Y)\boxed{\operatorname{Cov}(X, Y) = E(XY) - E(X)E(Y)}

协方差的物理意义#

  • Cov(X,Y)>0\operatorname{Cov}(X, Y) > 0:表示 XXYY 呈同向变化趋势(正相关),即 XX 变大时 YY 往往也偏大。
  • Cov(X,Y)<0\operatorname{Cov}(X, Y) < 0:表示 XXYY 呈反向变化趋势(负相关),即 XX 变大时 YY 往往偏小。
  • Cov(X,Y)=0\operatorname{Cov}(X, Y) = 0:表示 XXYY 不存在线性相关关系。

关于独立与相关的核心区别,必须牢记:

X,Y 相互独立    Cov(X,Y)=0(即不线性相关)\boxed{X, Y \text{ 相互独立} \implies \operatorname{Cov}(X, Y) = 0 \quad (\text{即不线性相关})}Cov(X,Y)=0无法推导得出 X,Y 相互独立\boxed{\operatorname{Cov}(X, Y) = 0 \quad \text{无法推导得出 } X, Y \text{ 相互独立}}

也就是说,独立是强条件,不相关是弱条件。独立一定不相关,不相关不一定独立。


9. 相关系数#

协方差包含了两随机变量本身的量纲单位,其绝对值的大小易受到变量本身取值尺度的影响,不利于横向对比相关程度。

因此对协方差进行无量纲标准化处理,引入相关系数 ρXY\rho_{XY}

ρXY=Cov(X,Y)D(X)D(Y)\boxed{\rho_{XY} = \frac{\operatorname{Cov}(X, Y)}{\sqrt{D(X)}\sqrt{D(Y)}}}

相关系数的数值范围被限定在:

1ρXY1-1 \le \rho_{XY} \le 1

相关系数的取值含义#

相关系数值含义说明
ρXY>0\rho_{XY} > 0XXYY 之间存在正线性相关关系
ρXY<0\rho_{XY} < 0XXYY 之间存在负线性相关关系
ρXY=0\rho_{XY} = 0XXYY 之间不存在线性相关关系,即不相关
ρXY=1\rho_{XY} = 1XXYY 之间存在完全正线性相关关系(即存在 Y=aX+b,a>0Y = aX + b, a > 0 的确定关系)
ρXY=1\rho_{XY} = -1XXYY 之间存在完全负线性相关关系(即存在 Y=aX+b,a<0Y = aX + b, a < 0 的确定关系)

注意:相关系数只衡量两个随机变量之间的线性关系,若两个随机变量之间存在非线性的确定关系(例如抛物线关系 Y=X2Y = X^2),它们的相关系数仍可能为 0。


10. 矩#

矩是比期望、方差更为一般化的数字特征。

10.1 原点矩#

随机变量 XXkk 阶原点矩定义为:

αk=E(Xk)(k=1,2,)\boxed{\alpha_k = E(X^k) \quad (k = 1, 2, \dots)}
  • 一阶原点矩即为数学期望:E(X)E(X)
  • 二阶原点矩为平方的期望:E(X2)E(X^2)

10.2 中心矩#

随机变量 XXkk 阶中心矩定义为:

μk=E[(XE(X))k](k=1,2,)\boxed{\mu_k = E\left[(X - E(X))^k\right] \quad (k = 1, 2, \dots)}
  • 一阶中心矩恒等于 0:E[XE(X)]=0E\left[X - E(X)\right] = 0
  • 二阶中心矩即为方差:D(X)=E[(XE(X))2]D(X) = E\left[(X - E(X))^2\right]
  • 三阶、四阶中心矩分别在统计学中与分布的偏度及峰度密切相关。

11. 二维随机变量中的数字特征#

若题目中给出的是二维随机变量 (X,Y)(X, Y),考生通常需要求解以下六个核心数字特征:

E(X),E(Y),D(X),D(Y),Cov(X,Y),ρXYE(X), \quad E(Y), \quad D(X), \quad D(Y), \quad \operatorname{Cov}(X, Y), \quad \rho_{XY}

这其中,最关键的中间计算量是乘积的期望 E(XY)E(XY),通过它代入公式求得协方差:

Cov(X,Y)=E(XY)E(X)E(Y)\boxed{\operatorname{Cov}(X, Y) = E(XY) - E(X)E(Y)}

12. 离散型二维随机变量求数字特征#

若已知离散型随机变量 (X,Y)(X, Y) 的联合分布律为 P(X=xi,Y=yj)=pijP(X = x_i, Y = y_j) = p_{ij},则各数字特征通过双重求和公式进行计算:

  • 均值求法:
E(X)=ijxipij\boxed{E(X) = \sum_i \sum_j x_i p_{ij}}E(Y)=ijyjpij\boxed{E(Y) = \sum_i \sum_j y_j p_{ij}}
  • 乘积期望求法:
E(XY)=ijxiyjpij\boxed{E(XY) = \sum_i \sum_j x_i y_j p_{ij}}

进而求出各自的方差与协方差:

D(X)=E(X2)[E(X)]2=ijxi2pij[E(X)]2D(X) = E(X^2) - [E(X)]^2 = \sum_i \sum_j x_i^2 p_{ij} - [E(X)]^2D(Y)=E(Y2)[E(Y)]2=ijyj2pij[E(Y)]2D(Y) = E(Y^2) - [E(Y)]^2 = \sum_i \sum_j y_j^2 p_{ij} - [E(Y)]^2Cov(X,Y)=E(XY)E(X)E(Y)\operatorname{Cov}(X, Y) = E(XY) - E(X)E(Y)

13. 连续型二维随机变量求数字特征#

若已知连续型随机变量 (X,Y)(X, Y) 的联合概率密度函数为 f(x,y)f(x, y),则数字特征通过二重积分公式进行计算:

  • 均值求法:
E(X)=++xf(x,y)dxdy\boxed{E(X) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x f(x, y)\,dx\,dy}E(Y)=++yf(x,y)dxdy\boxed{E(Y) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} y f(x, y)\,dx\,dy}
  • 乘积期望求法:
E(XY)=++xyf(x,y)dxdy\boxed{E(XY) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy f(x, y)\,dx\,dy}

同理求出 E(X2)E(X^2)E(Y2)E(Y^2)

E(X2)=++x2f(x,y)dxdyE(X^2) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x^2 f(x, y)\,dx\,dy

然后代入常用公式计算方差与协方差。


14. 典型例题解析#

设离散型随机变量 XX 的分布律表格如下:

X012P0.20.50.3\begin{array}{c|ccc} X & 0 & 1 & 2 \\ \hline P & 0.2 & 0.5 & 0.3 \end{array}

我们要求出其期望 E(X)E(X) 与方差 D(X)D(X)


第一步:计算数学期望 E(X)E(X)#

根据期望公式:

E(X)=00.2+10.5+20.3E(X) = 0 \cdot 0.2 + 1 \cdot 0.5 + 2 \cdot 0.3E(X)=0+0.5+0.6=1.1E(X) = 0 + 0.5 + 0.6 = 1.1

第二步:计算二阶原点矩 E(X2)E(X^2)#

利用函数期望公式:

E(X2)=020.2+120.5+220.3E(X^2) = 0^2 \cdot 0.2 + 1^2 \cdot 0.5 + 2^2 \cdot 0.3E(X2)=0+0.5+1.2=1.7E(X^2) = 0 + 0.5 + 1.2 = 1.7

第三步:套用常用公式求方差#

代入公式 D(X)=E(X2)[E(X)]2D(X) = E(X^2) - [E(X)]^2

D(X)=1.7(1.1)2=1.71.21=0.49D(X) = 1.7 - (1.1)^2 = 1.7 - 1.21 = 0.49

所以,最终答案为:

E(X)=1.1,D(X)=0.49\boxed{E(X) = 1.1, \quad D(X) = 0.49}

15. 常考题型总结#

题型一:已知单变量分布,求期望与方差#

求解步骤

  1. 离散型利用 E(X)=xipiE(X) = \sum x_i p_i,连续型利用 E(X)=xf(x)dxE(X) = \int x f(x)\,dx 计算出均值;
  2. 利用函数期望求出 E(X2)E(X^2)
  3. 代入 D(X)=E(X2)[E(X)]2D(X) = E(X^2) - [E(X)]^2

题型二:求随机变量函数的期望 E[g(X)]E[g(X)]#

求解方法:千万不要先去费力推导新变量 Y=g(X)Y = g(X) 的分布,直接将函数关系 g(x)g(x) 带入到原分布的积分或求和式中计算,即 g(xi)pi\sum g(x_i) p_ig(x)f(x)dx\int g(x) f(x)\,dx

题型三:求解二维联合分布的协方差与相关系数#

求解步骤

  1. 分别求出 E(X)E(X)E(Y)E(Y)
  2. 根据联合分布律或联合概率密度函数,计算二重积分或双重求和得到 E(XY)E(XY)
  3. 利用 Cov(X,Y)=E(XY)E(X)E(Y)\operatorname{Cov}(X, Y) = E(XY) - E(X)E(Y) 计算协方差;
  4. 若要求相关系数,需额外求出 D(X)D(X)D(Y)D(Y) 后代入分式求解。

题型四:判断随机变量的相关性#

求解方法:计算协方差 Cov(X,Y)\operatorname{Cov}(X, Y),若等于 0 则二者不相关;若不等于 0 则二者相关。


16. 易错点总结#

易错点一:误认为数学期望就是最可能取的值#

数学期望反映的是均值,但在很多离散分布中,随机变量根本无法取到期望值(如抛硬币正面次数的期望为 0.5,掷骰子点数均值为 3.5)。

易错点二:混淆方差公式的减数与被减数#

计算方差时,常用公式为 E(X2)[E(X)]2E(X^2) - [E(X)]^2,考生容易将其记反,或者误认为方差直接等于二阶原点矩 E(X2)E(X^2)

易错点三:计算独立随机变量差的方差时写成减法#

X,YX, Y 相互独立,则有:

D(XY)=D(X)+D(Y)D(X - Y) = D(X) + D(Y)

许多考生会由于减号而习惯性地写成 D(X)D(Y)D(X) - D(Y),导致计算错误。

易错点四:将不相关等同于相互独立#

必须注意:协方差为 0 仅代表它们不存在线性相关性,不代表它们没有其他函数关系,因此无法推导得出独立。只有当随机变量服从二维正态分布时,不相关才与相互独立完全等价。


17. 本章核心公式表#

数字特征离散型公式写法连续型公式写法
数学期望 E(X)E(X)ixipi\sum_i x_i p_i+xf(x)dx\int_{-\infty}^{+\infty} x f(x)\,dx
函数期望 E[g(X)]E[g(X)]ig(xi)pi\sum_i g(x_i) p_i+g(x)f(x)dx\int_{-\infty}^{+\infty} g(x) f(x)\,dx
方差定义式E[(XE(X))2]E\left[(X - E(X))^2\right]E[(XE(X))2]E\left[(X - E(X))^2\right]
方差计算常用公式E(X2)[E(X)]2E(X^2) - [E(X)]^2E(X2)[E(X)]2E(X^2) - [E(X)]^2
标准差 σ(X)\sigma(X)D(X)\sqrt{D(X)}D(X)\sqrt{D(X)}
协方差常用公式E(XY)E(X)E(Y)E(XY) - E(X)E(Y)E(XY)E(X)E(Y)E(XY) - E(X)E(Y)
相关系数 ρXY\rho_{XY}Cov(X,Y)D(X)D(Y)\dfrac{\operatorname{Cov}(X, Y)}{\sqrt{D(X)}\sqrt{D(Y)}}Cov(X,Y)D(X)D(Y)\dfrac{\operatorname{Cov}(X, Y)}{\sqrt{D(X)}\sqrt{D(Y)}}
和的方差公式\multicolumn{2}{c}{D(X+Y)=D(X)+D(Y)+2Cov(X,Y)D(X + Y) = D(X) + D(Y) + 2\operatorname{Cov}(X, Y)}
乘积的期望(独立时)\multicolumn{2}{c}{E(XY)=E(X)E(Y)E(XY) = E(X)E(Y)}

18. 一句话掌握本章#

随机变量的数字特征这一章的主线可以归纳为:

数学期望刻画平均水平方差度量波动离散协方差度量变量关联\boxed{\text{数学期望刻画平均水平} \rightarrow \text{方差度量波动离散} \rightarrow \text{协方差度量变量关联}}

解答具体题目时的标准计算逻辑为:

  1. 先求一阶原点矩 E(X)E(X)E(Y)E(Y),代表各变量的中心位置;
  2. 再求二阶原点矩 E(X2)E(X^2)E(Y2)E(Y^2),为计算波动程度打下基础;
  3. 代入常用化简公式求出方差 D(X)D(X)D(Y)D(Y)
  4. 若为二维题,进一步求出乘积期望 E(XY)E(XY)
  5. 最后利用差值公式算出协方差,进而判断二者相关性并求解相关系数。

19. 框框老师#

Image Image Image Image Image Image

分享

如果这篇文章对你有帮助,欢迎分享给更多人!

随机变量的数字特征
https://www.bilibili.com/video/BV168411Z7pf?p=7
作者
黎明
发布于
2026-06-22 11:26:44
许可协议
MIT

部分信息可能已经过时

目录