本文主要梳理随机变量的数字特征。这一章的核心思想可以总结为:
用几个关键的数值来概括随机变量分布的主要特征
前面的分布律、概率密度函数和累积分布函数能够完整地描述随机变量的概率分布。然而,在实际问题中,人们往往更需要从分布中提取出最具有代表性的指标,例如:
- 衡量平均水平:数学期望;
- 衡量波动程度:方差与标准差;
- 衡量两个随机变量的相关关系:协方差与相关系数;
- 更高阶的特征描述:矩。
1. 数学期望#
数学期望也常称为均值,它描述的是随机变量取值的平均水平,记作:
E(X)需要明确的是,数学期望并不代表随机变量 X 一定会取到这个数值,而是代表在大量重复试验后,随机变量取值的长期平均水平。
1.1 离散型随机变量的数学期望#
若离散型随机变量 X 的分布律为:
P(X=xi)=pi,i=1,2,…则 X 的数学期望定义为:
E(X)=i∑xipi这里要求级数必须是绝对收敛的,即 ∑i∣xi∣pi 存在。
简要理解:
期望=取值×对应概率,然后进行求和计算示例#
掷一个均匀的骰子,令随机变量 X 表示掷出的点数。
易知 X 的分布律为:
P(X=1)=P(X=2)=⋯=P(X=6)=61则其数学期望为:
E(X)=1⋅61+2⋅61+⋯+6⋅61E(X)=61+2+3+4+5+6=621=3.5骰子的点数只可能是整数,绝不可能掷出 3.5 这个值,但 3.5 代表了长期掷骰子得到的点数平均值。
1.2 连续型随机变量的数学期望#
若连续型随机变量 X 的概率密度函数为 f(x),则其数学期望定义为:
E(X)=∫−∞+∞xf(x)dx要求该积分绝对收敛。
简要理解:
连续型期望:将离散型的求和符号替换为积分运算计算示例#
设随机变量 X 在区间 [0,1] 上服从均匀分布,即:
X∼U(0,1)其概率密度函数为:
f(x)={1,0,0<x<1其他根据公式计算其数学期望:
E(X)=∫01x⋅1dx=[21x2]01=21
2. 随机变量函数的期望#
在很多实际计算中,我们并不是直接求解 E(X),而是需要求解由 X 通过某种函数关系 g(X) 得到的新随机变量的期望:
E[g(X)]例如常见的:E(X2)、E(2X+1)、E(eX)。
求此类期望时,无需先推导新随机变量 Y=g(X) 的概率分布,直接利用下述公式进行计算即可。
2.1 离散型情况#
若 X 的分布律为 P(X=xi)=pi,则其函数的期望为:
E[g(X)]=i∑g(xi)pi
2.2 连续型情况#
若 X 的密度函数为 f(x),则其函数的期望为:
E[g(X)]=∫−∞+∞g(x)f(x)dx这两个期望求法极其重要,特别是在计算方差时,通常需要优先套用此公式求出 E(X2)。
3. 数学期望的性质#
性质一:常数的期望#
常数不具备随机性,其期望即为常数本身。
E(c)=c
性质二:线性性质#
数学期望是一个线性算子,满足如下拆分规则:
E(aX+b)=aE(X)+b对于两个随机变量的和:
E(aX+bY)=aE(X)+bE(Y)需要特别提醒的是:此线性性质对任意随机变量 X,Y 均成立,不需要它们相互独立。
性质三:独立变量乘积的期望#
如果随机变量 X 与 Y 相互独立,则它们乘积的期望等于各自期望的乘积:
E(XY)=E(X)E(Y)注意其反面结论:当满足 E(XY)=E(X)E(Y) 时,并不能反向推导得出 X,Y 相互独立。
4. 方差#
均值描述的是随机变量的平均水平,但无法反映随机变量取值在其均值周围波动的剧烈程度。
例如两个学生的成绩数据:
- 学生甲:80,80,80
- 学生乙:60,80,100
他们的平均分都是 80 分,但显然学生乙的成绩波动性、不确定性大得多。
为了刻画这种偏差程度,引入方差。
方差记作:
D(X)或Var(X)其定义为:
D(X)=E[(X−E(X))2]它代表随机变量取值与其期望值之间偏差平方的平均水平。
方差的常用计算公式#
在实际计算中,利用定义直接求方差往往比较繁琐,通常采用以下推导出的化简公式:
D(X)=E(X2)−[E(X)]2这是求解方差最常用的黄金公式。
做题步骤通常分为三步:
- 算出 E(X);
- 算出 E(X2);
- 代入公式 D(X)=E(X2)−[E(X)]2 得到最终结果。
计算示例#
我们来求解掷骰子点数 X 的方差。
已知期望 E(X)=3.5=27。
首先计算 E(X2):
E(X2)=12⋅61+22⋅61+⋯+62⋅61E(X2)=61+4+9+16+25+36=691然后代入常用公式计算方差:
D(X)=E(X2)−[E(X)]2=691−(27)2D(X)=691−449=12182−147=1235
5. 标准差#
由于方差公式中含有平方项,导致方差的量纲(单位)是原随机变量单位的平方。例如当随机变量表示身高(单位为厘米)时,其方差的单位变成了平方厘米,在直观上不便于比较。
因此引入标准差,记作 σ(X):
σ(X)=D(X)标准差的单位与随机变量本身的单位完全一致,能更直观地反映随机变量偏离均值的实际波动幅度。
6. 方差的性质#
性质一:常数的方差为 0#
常数没有波动性,其方差必然为 0。
D(c)=0
性质二:平移不改变方差#
将随机变量整体加上一个常数,只是整体平移,并不改变其取值的离散程度(波动幅度):
D(X+b)=D(X)
性质三:倍数呈平方系数影响方差#
自变量放大 a 倍,其对应的波动偏差的平方则会放大 a2 倍:
D(aX)=a2D(X)结合性质二,可以得到常用的复合线性公式:
D(aX+b)=a2D(X)
性质四:两个随机变量和与差的方差#
在一般情况下,和的方差公式中必须包含它们之间的协方差项:
D(X+Y)=D(X)+D(Y)+2Cov(X,Y)如果随机变量 X 与 Y 相互独立,则协方差项为 0,公式化简为:
D(X+Y)=D(X)+D(Y)同理,当随机变量相互独立时,差的方差公式也为加号:
D(X−Y)=D(X)+D(Y)注意:无论独立时是相加还是相减,方差均是直接求和,没有减法。
7. 常见分布的期望和方差#
熟练记忆常见分布的期望与方差,在做选择题、填空题时可以极大地提高解题速度。
| 分布类型 | 记号 | 数学期望 E(X) | 方差 D(X) |
|---|
| 两点分布 | X∼B(1,p) | p | p(1−p) |
| 二项分布 | X∼B(n,p) | np | np(1−p) |
| 泊松分布 | X∼P(λ) | λ | λ |
| 均匀分布 | X∼U(a,b) | 2a+b | 12(b−a)2 |
| 指数分布 | X∼E(λ) | λ1 | λ21 |
| 正态分布 | X∼N(μ,σ2) | μ | σ2 |
8. 协方差#
方差用来研究一个随机变量自身的波动程度。当我们需要同时考察两个随机变量,研究它们之间共同变化的关联关系时,就需要使用协方差。
协方差记作 Cov(X,Y),其定义为:
Cov(X,Y)=E[(X−E(X))(Y−E(Y))]实际计算中,常使用以下计算公式:
Cov(X,Y)=E(XY)−E(X)E(Y)
协方差的物理意义#
- Cov(X,Y)>0:表示 X 与 Y 呈同向变化趋势(正相关),即 X 变大时 Y 往往也偏大。
- Cov(X,Y)<0:表示 X 与 Y 呈反向变化趋势(负相关),即 X 变大时 Y 往往偏小。
- Cov(X,Y)=0:表示 X 与 Y 不存在线性相关关系。
关于独立与相关的核心区别,必须牢记:
X,Y 相互独立⟹Cov(X,Y)=0(即不线性相关)Cov(X,Y)=0无法推导得出 X,Y 相互独立也就是说,独立是强条件,不相关是弱条件。独立一定不相关,不相关不一定独立。
9. 相关系数#
协方差包含了两随机变量本身的量纲单位,其绝对值的大小易受到变量本身取值尺度的影响,不利于横向对比相关程度。
因此对协方差进行无量纲标准化处理,引入相关系数 ρXY:
ρXY=D(X)D(Y)Cov(X,Y)相关系数的数值范围被限定在:
−1≤ρXY≤1
相关系数的取值含义#
| 相关系数值 | 含义说明 |
|---|
| ρXY>0 | X 与 Y 之间存在正线性相关关系 |
| ρXY<0 | X 与 Y 之间存在负线性相关关系 |
| ρXY=0 | X 与 Y 之间不存在线性相关关系,即不相关 |
| ρXY=1 | X 与 Y 之间存在完全正线性相关关系(即存在 Y=aX+b,a>0 的确定关系) |
| ρXY=−1 | X 与 Y 之间存在完全负线性相关关系(即存在 Y=aX+b,a<0 的确定关系) |
注意:相关系数只衡量两个随机变量之间的线性关系,若两个随机变量之间存在非线性的确定关系(例如抛物线关系 Y=X2),它们的相关系数仍可能为 0。
10. 矩#
矩是比期望、方差更为一般化的数字特征。
10.1 原点矩#
随机变量 X 的 k 阶原点矩定义为:
αk=E(Xk)(k=1,2,…)
- 一阶原点矩即为数学期望:E(X);
- 二阶原点矩为平方的期望:E(X2)。
10.2 中心矩#
随机变量 X 的 k 阶中心矩定义为:
μk=E[(X−E(X))k](k=1,2,…)
- 一阶中心矩恒等于 0:E[X−E(X)]=0;
- 二阶中心矩即为方差:D(X)=E[(X−E(X))2];
- 三阶、四阶中心矩分别在统计学中与分布的偏度及峰度密切相关。
11. 二维随机变量中的数字特征#
若题目中给出的是二维随机变量 (X,Y),考生通常需要求解以下六个核心数字特征:
E(X),E(Y),D(X),D(Y),Cov(X,Y),ρXY这其中,最关键的中间计算量是乘积的期望 E(XY),通过它代入公式求得协方差:
Cov(X,Y)=E(XY)−E(X)E(Y)
12. 离散型二维随机变量求数字特征#
若已知离散型随机变量 (X,Y) 的联合分布律为 P(X=xi,Y=yj)=pij,则各数字特征通过双重求和公式进行计算:
E(X)=i∑j∑xipijE(Y)=i∑j∑yjpijE(XY)=i∑j∑xiyjpij进而求出各自的方差与协方差:
D(X)=E(X2)−[E(X)]2=i∑j∑xi2pij−[E(X)]2D(Y)=E(Y2)−[E(Y)]2=i∑j∑yj2pij−[E(Y)]2Cov(X,Y)=E(XY)−E(X)E(Y)
13. 连续型二维随机变量求数字特征#
若已知连续型随机变量 (X,Y) 的联合概率密度函数为 f(x,y),则数字特征通过二重积分公式进行计算:
E(X)=∫−∞+∞∫−∞+∞xf(x,y)dxdyE(Y)=∫−∞+∞∫−∞+∞yf(x,y)dxdyE(XY)=∫−∞+∞∫−∞+∞xyf(x,y)dxdy同理求出 E(X2) 和 E(Y2):
E(X2)=∫−∞+∞∫−∞+∞x2f(x,y)dxdy然后代入常用公式计算方差与协方差。
14. 典型例题解析#
设离散型随机变量 X 的分布律表格如下:
XP00.210.520.3我们要求出其期望 E(X) 与方差 D(X)。
第一步:计算数学期望 E(X)#
根据期望公式:
E(X)=0⋅0.2+1⋅0.5+2⋅0.3E(X)=0+0.5+0.6=1.1
第二步:计算二阶原点矩 E(X2)#
利用函数期望公式:
E(X2)=02⋅0.2+12⋅0.5+22⋅0.3E(X2)=0+0.5+1.2=1.7
第三步:套用常用公式求方差#
代入公式 D(X)=E(X2)−[E(X)]2:
D(X)=1.7−(1.1)2=1.7−1.21=0.49所以,最终答案为:
E(X)=1.1,D(X)=0.49
15. 常考题型总结#
题型一:已知单变量分布,求期望与方差#
求解步骤:
- 离散型利用 E(X)=∑xipi,连续型利用 E(X)=∫xf(x)dx 计算出均值;
- 利用函数期望求出 E(X2);
- 代入 D(X)=E(X2)−[E(X)]2。
题型二:求随机变量函数的期望 E[g(X)]#
求解方法:千万不要先去费力推导新变量 Y=g(X) 的分布,直接将函数关系 g(x) 带入到原分布的积分或求和式中计算,即 ∑g(xi)pi 或 ∫g(x)f(x)dx。
题型三:求解二维联合分布的协方差与相关系数#
求解步骤:
- 分别求出 E(X) 和 E(Y);
- 根据联合分布律或联合概率密度函数,计算二重积分或双重求和得到 E(XY);
- 利用 Cov(X,Y)=E(XY)−E(X)E(Y) 计算协方差;
- 若要求相关系数,需额外求出 D(X) 与 D(Y) 后代入分式求解。
题型四:判断随机变量的相关性#
求解方法:计算协方差 Cov(X,Y),若等于 0 则二者不相关;若不等于 0 则二者相关。
16. 易错点总结#
易错点一:误认为数学期望就是最可能取的值#
数学期望反映的是均值,但在很多离散分布中,随机变量根本无法取到期望值(如抛硬币正面次数的期望为 0.5,掷骰子点数均值为 3.5)。
易错点二:混淆方差公式的减数与被减数#
计算方差时,常用公式为 E(X2)−[E(X)]2,考生容易将其记反,或者误认为方差直接等于二阶原点矩 E(X2)。
易错点三:计算独立随机变量差的方差时写成减法#
若 X,Y 相互独立,则有:
D(X−Y)=D(X)+D(Y)许多考生会由于减号而习惯性地写成 D(X)−D(Y),导致计算错误。
易错点四:将不相关等同于相互独立#
必须注意:协方差为 0 仅代表它们不存在线性相关性,不代表它们没有其他函数关系,因此无法推导得出独立。只有当随机变量服从二维正态分布时,不相关才与相互独立完全等价。
17. 本章核心公式表#
| 数字特征 | 离散型公式写法 | 连续型公式写法 |
|---|
| 数学期望 E(X) | ∑ixipi | ∫−∞+∞xf(x)dx |
| 函数期望 E[g(X)] | ∑ig(xi)pi | ∫−∞+∞g(x)f(x)dx |
| 方差定义式 | E[(X−E(X))2] | E[(X−E(X))2] |
| 方差计算常用公式 | E(X2)−[E(X)]2 | E(X2)−[E(X)]2 |
| 标准差 σ(X) | D(X) | D(X) |
| 协方差常用公式 | E(XY)−E(X)E(Y) | E(XY)−E(X)E(Y) |
| 相关系数 ρXY | D(X)D(Y)Cov(X,Y) | D(X)D(Y)Cov(X,Y) |
| 和的方差公式 | \multicolumn{2}{c}{D(X+Y)=D(X)+D(Y)+2Cov(X,Y)} | |
| 乘积的期望(独立时) | \multicolumn{2}{c}{E(XY)=E(X)E(Y)} | |
18. 一句话掌握本章#
随机变量的数字特征这一章的主线可以归纳为:
数学期望刻画平均水平→方差度量波动离散→协方差度量变量关联解答具体题目时的标准计算逻辑为:
- 先求一阶原点矩 E(X) 与 E(Y),代表各变量的中心位置;
- 再求二阶原点矩 E(X2) 与 E(Y2),为计算波动程度打下基础;
- 代入常用化简公式求出方差 D(X) 和 D(Y);
- 若为二维题,进一步求出乘积期望 E(XY);
- 最后利用差值公式算出协方差,进而判断二者相关性并求解相关系数。