本文主要梳理二维随机变量及其分布。这一章可以理解为:一维随机变量研究的是单个随机变量的概率规律,而二维随机变量研究的是两个随机变量的联合概率规律。
在实际生活中,我们往往需要同时关注多个随机量。例如:
- 掷两枚骰子:X 为第一枚的点数,Y 为第二枚的点数;
- 抽样检测:X 为次品数,Y 为合格品数;
- 学生成绩:X 为数学成绩,Y 为英语成绩;
- 身体指标:X 为身高,Y 为体重。
研究它们不仅要看它们各自的规律,还要研究它们之间的关联。
1. 什么是二维随机变量#
如果在同一个随机试验中定义了两个随机变量 X 和 Y,我们将它们组合在一起:
(X,Y)就叫做二维随机变量,也叫二维随机向量。
比如掷两枚骰子,定义:
X=第一枚骰子的点数Y=第二枚骰子的点数那么 (X,Y) 就是一个二维随机变量。它可能取的值有:
(1,1),(1,2),…,(6,6)共 36 种结果。
2. 联合分布函数#
二维随机变量最基本的分布形式是联合分布函数。
定义为:
F(x,y)=P(X≤x,Y≤y)它表示随机变量 X 不超过 x,并且随机变量 Y 不超过 y 的概率。
一维分布函数是 F(x)=P(X≤x),二维分布函数就是增加了一个变量维度的累积概率:
F(x,y)=P(X≤x,Y≤y)
联合分布函数的性质#
1. 取值范围#
0≤F(x,y)≤1因为它本质上是概率。
2. 单调性#
F(x,y) 对 x 和 y 都是单调不减的。
- 如果固定 y,让 x 变大,事件 X≤x 的范围变大,所以概率不会减小;
- 如果固定 x,让 y 变大,事件 Y≤y 的范围变大,所以概率也不会减小。
3. 极限性质#
F(−∞,y)=0F(x,−∞)=0F(+∞,+∞)=1如果 x 或 y 趋近于负无穷大,代表至少有一个事件是不可能发生的,概率为 0;如果两者都趋于正无穷大,代表必然事件,概率为 1。
4. 右连续性#
分布函数关于 x 和 y 都是右连续的:
F(x+0,y)=F(x,y)F(x,y+0)=F(x,y)
3. 用联合分布函数求矩形区域概率#
这是二维分布函数最重要的用法之一。
如果我们要求二维随机变量 (X,Y) 落在矩形区域 x1<X≤x2,y1<Y≤y2 内的概率:
P(x1<X≤x2,y1<Y≤y2)可以使用联合分布函数进行计算:
P(x1<X≤x2,y1<Y≤y2)=F(x2,y2)−F(x1,y2)−F(x2,y1)+F(x1,y1)这个公式可以通过平面几何的面积加减法来理解:
- 先取大矩形左下方的无穷区域概率:F(x2,y2);
- 减去左边多余的区域概率:F(x1,y2);
- 减去下面多余的区域概率:F(x2,y1);
- 因为左下角交叉重叠的部分被减了两次,所以需要把它加回来:F(x1,y1)。
该公式在计算联合分布函数的相关题目时经常被使用。
4. 二维离散型随机变量#
如果二维随机变量 (X,Y) 只能取有限个或可列个点,则称它为二维离散型随机变量。
例如掷两枚骰子,其取值 (X,Y) 只能是:
(i,j),i=1,2,…,6,j=1,2,…,6
联合分布律#
二维离散型随机变量使用联合分布律来描述:
P(X=xi,Y=yj)=pij它必须满足以下两个基本条件:
pij≥0i∑j∑pij=1联合分布律通常用表格形式表现,便于观察和计算。
例如:
X\Y0100.10.210.20.120.10.3这表示:
P(X=0,Y=0)=0.1P(X=0,Y=1)=0.2P(X=1,Y=2)=0.3表格中所有格子的概率相加必须等于 1。
5. 边缘分布#
联合分布描述的是 (X,Y) 作为整体的联合概率。但如果我们只关心其中某一个变量,比如只关心 X 独自的概率分布,就需要求出边缘分布。
离散型边缘分布#
若已知联合分布律为 P(X=xi,Y=yj)=pij,则有:
P(X=xi)=j∑pij也就是固定 X=xi 的那一行,把所有对应不同 Y 取值的概率加起来。
P(Y=yj)=i∑pij也就是固定 Y=yj 的那一列,把所有对应不同 X 取值的概率加起来。
离散型边缘分布计算示例#
我们可以直接利用分布律表格进行计算。在表格右侧和下方分别添加边缘和概率:
X\Y01PY00.10.20.310.20.10.320.10.30.4PX0.40.61这样我们可以快速得出:
P(X=0)=0.1+0.2+0.1=0.4P(X=1)=0.2+0.1+0.3=0.6P(Y=0)=0.1+0.2=0.3P(Y=1)=0.2+0.1=0.3P(Y=2)=0.1+0.3=0.4核心规律:
离散型求边缘分布:对另一个变量对应的所有项进行求和
6. 条件分布#
条件分布表示在一个随机变量已经确定取某个值的条件下,另一个随机变量的概率分布。
例如:
P(X=xi∣Y=yj)表示在已知 Y=yj 的事件发生的条件下,X=xi 的条件概率。
离散型条件分布#
根据条件概率公式:
P(X=xi∣Y=yj)=P(Y=yj)P(X=xi,Y=yj)同理,已知 X=xi 条件下 Y 的条件分布为:
P(Y=yj∣X=xi)=P(X=xi)P(X=xi,Y=yj)需要注意的是,分母作为条件事件的边缘概率不能为 0。
即:
条件分布=边缘分布联合分布
离散型条件分布计算示例#
沿用上一节的表格数据:
X\Y01PY00.10.20.310.20.10.320.10.30.4PX0.40.61我们要求:
P(X=1∣Y=2)根据条件分布公式计算:
P(X=1∣Y=2)=P(Y=2)P(X=1,Y=2)代入表格中的数值:
P(X=1∣Y=2)=0.40.3=43
7. 二维连续型随机变量#
如果二维随机变量 (X,Y) 的取值可以在某个平面区域内连续变化,则称它为二维连续型随机变量。
常见的连续随机量有:
- X 为身高,Y 为体重;
- X 为零件长度误差,Y 为零件宽度误差;
- X 为顾客在超市排队等待时间,Y 为接受服务时间。
联合概率密度函数#
如果对于二维随机变量 (X,Y) 的联合分布函数 F(x,y),存在非负可积函数 f(x,y) 满足:
F(x,y)=P(X≤x,Y≤y)=∫−∞x∫−∞yf(u,v)dvdu则称 f(x,y) 为 (X,Y) 的联合概率密度函数。
联合概率密度函数必须满足两个核心性质:
f(x,y)≥0∫−∞+∞∫−∞+∞f(x,y)dxdy=1
用联合概率密度求区域概率#
若要求 (X,Y) 落在平面某个区域 D 内的概率 P((X,Y)∈D),可以通过对联合密度进行二重积分求得:
P((X,Y)∈D)=∬Df(x,y)dxdy若区域 D 是一个矩形区域 a<X<b,c<Y<d,则概率为:
P(a<X<b,c<Y<d)=∫ab∫cdf(x,y)dydx在几何上,联合概率密度在某区域上的积分对应的是密度曲面在区域 D 上方的“体积”。由于是连续型随机变量,单点的概率为 0。
8. 连续型边缘密度#
与离散型累加求和类似,连续型随机变量则是通过对另一个变量在全部取值范围内积分,来求取某个变量的边缘密度函数。
如果已知 (X,Y) 的联合密度函数为 f(x,y),则:
fX(x)=∫−∞+∞f(x,y)dyfY(y)=∫−∞+∞f(x,y)dx核心规律:
连续型求边缘密度:对另一个变量进行积分我们可以用下表做直观对照:
| 类型 | 求边缘分布的方式 |
|---|
| 离散型 | 对另一个变量的所有取值求和 |
| 连续型 | 对另一个变量在全域进行积分 |
9. 连续型条件密度#
设连续型随机变量 (X,Y) 的联合密度为 f(x,y),边缘密度分别为 fX(x) 和 fY(y):
- 在已知 Y=y 的条件下,随机变量 X 的条件概率密度为:
fX∣Y(x∣y)=fY(y)f(x,y)(其中 fY(y)>0)
- 在已知 X=x 的条件下,随机变量 Y 的条件概率密度为:
fY∣X(y∣x)=fX(x)f(x,y)(其中 fX(x)>0)其核心思想依然是:
条件密度=边缘密度联合密度
10. 经典例题解析#
设二维连续型随机变量 (X,Y) 的联合概率密度为:
f(x,y)={c(x+y),0,0<x<1,0<y<1其他我们来依次求解以下问题:
- 求常数 c;
- 求 X 的边缘概率密度 fX(x);
- 求 Y 的边缘概率密度 fY(y);
- 判断 X 与 Y 是否相互独立。
第一步:求常数 c#
根据联合概率密度的规范性,全部区域的积分值必须为 1:
∫01∫01c(x+y)dydx=1我们先对 y 进行积分:
∫01c(x+y)dy=c[xy+21y2]01=c(x+21)接着对 x 进行积分:
∫01c(x+21)dx=c[21x2+21x]01=c因此,得出常数:
c=1所以,该联合概率密度函数为:
f(x,y)={x+y,0,0<x<1,0<y<1其他
第二步:求 X 的边缘概率密度 fX(x)#
当 0<x<1 时:
fX(x)=∫01f(x,y)dy=∫01(x+y)dy=[xy+21y2]01=x+21当 x 取其他值时,概率密度为 0。
所以,X 的边缘概率密度为:
fX(x)={x+21,0,0<x<1其他
第三步:求 Y 的边缘概率密度 fY(y)#
当 0<y<1 时:
fY(y)=∫01f(x,y)dx=∫01(x+y)dx=[21x2+xy]01=y+21当 y 取其他值时,概率密度为 0。
所以,Y 的边缘概率密度为:
fY(y)={y+21,0,0<y<1其他
第四步:判断独立性#
如果 X 与 Y 相互独立,应满足 f(x,y)=fX(x)fY(y) 对一切实数均成立。
而在定义域区间内:
fX(x)fY(y)=(x+21)(y+21)=xy+21x+21y+41这显然不等于:
f(x,y)=x+y因此,可以判定:
X 与 Y 不相互独立
11. 随机变量的独立性#
独立性是二维随机变量在考试和实际应用中的重要概念。
用联合分布函数判断独立性#
如果对于任意实数 x,y,均有:
F(x,y)=FX(x)FY(y)则称随机变量 X 与 Y 相互独立。
离散型随机变量独立条件#
如果对于所有可能取的值 xi,yj,均满足:
P(X=xi,Y=yj)=P(X=xi)P(Y=yj)则 X 与 Y 相互独立。
即其联合分布律等于边缘分布律的乘积:
pij=pi⋅p⋅j其中 pi⋅=P(X=xi),p⋅j=P(Y=yj)。
连续型随机变量独立条件#
如果对任意实数 x,y,均有:
f(x,y)=fX(x)fY(y)则 X 与 Y 相互独立。也就是说联合密度函数等于两个边缘密度函数的乘积。
独立性的核心记忆法则为:
联合分布=边缘分布的乘积
12. 二维随机变量函数的分布#
在这一节中,我们的目标是已知 (X,Y) 的分布,求解由它们通过某种函数关系构成的新随机变量:
Z=g(X,Y)的概率分布。
离散型函数的分布#
如果 (X,Y) 是离散型随机变量,解题方法是直接列举法:
- 列举出所有可能出现的组合 (xi,yj) 并算出新随机变量取值 zk=g(xi,yj);
- 计算对应的联合概率 P(X=xi,Y=yj);
- 将计算出相同 zk 值的事件概率进行合并累加,得到 Z 的分布律。
例如求解 Z=X+Y,其概率计算公式为:
P(Z=z)=xi+yj=z∑P(X=xi,Y=yj)
连续型函数的分布#
若 (X,Y) 是连续型随机变量,最基本、最通用的方法是分布函数法:
- 先写出 Z 的累积分布函数:
FZ(z)=P(Z≤z)=P(g(X,Y)≤z)
- 确定满足关系式 g(x,y)≤z 在平面直角坐标系中的积分区域 Dz:
Dz={(x,y)∣g(x,y)≤z}
- 通过二重积分计算累积概率值:
FZ(z)=∬Dzf(x,y)dxdy
- 将分布函数 FZ(z) 对 z 求导数,求得 Z 的概率密度函数 fZ(z)。
解决此类题目的关键并不在于记忆死公式,而在于能准确画出平面上的积分区域,并能够正确地确定二重积分的积分上下限。
13. 常见函数的分布结论#
有些经典的随机变量函数分布在考试中极高频出现,掌握其通用结论和推导方法至关重要。
13.1 和的分布 Z=X+Y#
如果随机变量 X 和 Y 相互独立,且均为连续型随机变量,则可以通过卷积公式计算其概率密度函数:
fZ(z)=∫−∞+∞fX(x)fY(z−x)dx或者对称地写为:
fZ(z)=∫−∞+∞fX(z−y)fY(y)dy如果是离散型,同理可得:
P(Z=z)=x∑P(X=x)P(Y=z−x)典型例题#
设随机变量 X 与 Y 相互独立,且:
X∼U(0,1),Y∼E(1)令:
Z=X+Y求随机变量 Z 的概率密度函数 fZ(z)。
【解析】
首先写出随机变量的概率密度函数。
因为 X∼U(0,1),所以 X 的密度函数为:
fX(x)={1,0,0<x<1其他因为 Y∼E(1),所以 Y 的密度函数为:
fY(y)={e−y,0,y>0其他因为 X 与 Y 相互独立,所以其联合概率密度函数为:
f(x,y)=fX(x)fY(y)={e−y,0,0<x<1,y>0其他下面给出两种经典的求解方法。
方法一:分布函数法#
分布函数法的核心思路是:
先求累积分布函数 FZ(z)=P(Z≤z),再通过求导得到概率密度 fZ(z)因为 Z=X+Y,所以:
FZ(z)=P(X+Y≤z)我们需要在联合密度非零的区域 0<x<1,y>0 以及满足 x+y≤z 的平面区域上进行积分。
根据 z 的取值范围,我们需要分区间讨论:
1. 当 z≤0 时
因为 X>0,Y>0 恒成立,所以它们的和 Z=X+Y>0 也是恒成立的。
因此,不可能有 Z≤z,概率为 0:
FZ(z)=0,z≤02. 当 0<z<1 时
此时,积分区域由 0<x<1,y>0 和 x+y≤z 共同决定。
由 x+y≤z⟹y≤z−x。因为 y>0,所以必须有 z−x>0⟹x<z。
结合 X 的定义域 0<x<1 以及当前 z<1 的限制,自变量 x 的积分区间为 0<x<z。
因此,累积分布函数为:
FZ(z)=∫0z∫0z−xe−ydydx先计算内层关于 y 的积分:
∫0z−xe−ydy=[−e−y]0z−x=1−e−(z−x)将其代回外层积分:
FZ(z)=∫0z[1−e−(z−x)]dx=∫0z1dx−e−z∫0zexdx=z−e−z(ez−1)=z−1+e−z即当 0<z<1 时,FZ(z)=z−1+e−z。
3. 当 z≥1 时
此时,因为 z≥1,自变量 x 的上限由其自身的定义域限制,即 0<x<1。
对于任意在这个区间内的 x,都有 x<1≤z,即 z−x>0 恒成立。所以 y 的积分区间始终为 0<y<z−x。
因此,累积分布函数为:
FZ(z)=∫01∫0z−xe−ydydx代入内层积分结果并计算外层积分:
FZ(z)=∫01[1−e−(z−x)]dx=∫011dx−e−z∫01exdx=1−e−z(e−1)=1−(e−1)e−z即当 z≥1 时,FZ(z)=1−(e−1)e−z。
4. 总结分布函数并求导
综上所述,求得 Z 的累积分布函数为:
FZ(z)=⎩⎨⎧0,z−1+e−z,1−(e−1)e−z,z≤00<z<1z≥1对分布函数 FZ(z) 进行分段求导以得到概率密度函数 fZ(z)=FZ′(z):
- 当 z<0 时,fZ(z)=0;
- 当 0<z<1 时,fZ(z)=dzd(z−1+e−z)=1−e−z;
- 当 z>1 时,fZ(z)=dzd(1−(e−1)e−z)=(e−1)e−z。
(在分界点处,其概率密度不影响最终的积分概率,可以任意归入某一区间)
最终求得概率密度函数为:
fZ(z)=⎩⎨⎧0,1−e−z,(e−1)e−z,z≤00<z<1z≥1方法二:卷积公式法#
由于 X 与 Y 相互独立且均为连续型,可以直接使用卷积公式求解:
fZ(z)=∫−∞+∞fX(x)fY(z−x)dx因为 fX(x) 在 0<x<1 之外为 0,且 fY(z−x) 在 z−x≤0(即 x≥z)时为 0。
为了使被积函数 fX(x)fY(z−x) 不为 0,积分自变量 x 必须同时满足:
0<x<1且x<z即积分的有效区间上限为 min(1,z),下限为 0。因此我们同样需要分区间讨论:
1. 当 z≤0 时
由于 x<z≤0,不存在满足 0<x<z 的实数,此时被积函数在积分区间上恒为 0,故:
fZ(z)=02. 当 0<z<1 时
此时积分的有效范围为 0<x<z。代入各自的密度函数:
fZ(z)=∫0z1⋅e−(z−x)dx=e−z∫0zexdx=e−z[ex]0z=e−z(ez−1)=1−e−z3. 当 z≥1 时
此时积分的有效范围被 X 本身的定义域限制,即 0<x<1。代入密度函数:
fZ(z)=∫011⋅e−(z−x)dx=e−z∫01exdx=e−z[ex]01=(e−1)e−z4. 总结最终答案
将各分段结果合并,得到 Z 的概率密度函数:
fZ(z)=⎩⎨⎧0,1−e−z,(e−1)e−z,z≤00<z<1z≥1方法对比总结#
- 分布函数法:思路极其直观,先通过二重积分计算平面区域的累积概率 FZ(z),随后通过求导得出密度。该方法不容易出错,但积分与求导的计算步骤相对较多。
- 卷积公式法:直接一步到位计算密度函数,省去了后续的求导步骤。其难点和易错点在于:必须根据定义域的非零区间限制,推导出积分上限关于 z 的分段情况(如本题中的 min(1,z)),进而确定积分讨论区间。
13.2 最大值分布 M=max(X,Y)#
如果随机变量 X 与 Y 相互独立,则最大值小于等于 m 的事件等价于两者同时小于等于 m:
FM(m)=P(M≤m)=P(X≤m,Y≤m)由于独立性,概率可以拆分为边缘分布相乘:
FM(m)=FX(m)FY(m)
13.3 最小值分布 N=min(X,Y)#
如果随机变量 X 与 Y 相互独立,则最小值分布可以利用其对立事件求取,因为最小值大于 n 等价于两者同时大于 n:
P(N>n)=P(X>n,Y>n)=P(X>n)P(Y>n)将其转化为累积分布函数:
FN(n)=1−P(N>n)=1−[1−FX(n)][1−FY(n)]所以,最小值的分布函数公式为:
FN(n)=1−[1−FX(n)][1−FY(n)]
14. 二维与一维随机变量的深层关系#
在理解二维分布时,需要特别厘清一个认知问题:我们是否能用单独的边缘分布拼凑出完整的联合分布?
通常情况下,仅凭单独的 X 分布和单独的 Y 分布,是无法确定 (X,Y) 的联合分布的。这是因为边缘分布只说明了各自随机量在单独视角下的取值规律,而丢失了两个变量在同一试验中发生关联的相互影响关系。
只有在明确得知 X 与 Y 相互独立 的前提下,联合分布才等于边缘分布的乘积。
因此,可以用下述规律总结:
联合分布可以唯一推出边缘分布,但边缘分布一般无法推出联合分布
15. 本章常考题型#
题型一:给联合分布律,求边缘分布#
求解方法:利用 ∑jpij=P(X=xi) 和 ∑ipij=P(Y=yj),在离散型表格中横向或纵向累加求和即可。
题型二:给联合分布律,求条件分布#
求解方法:利用 P(X=xi∣Y=yj)=P(Y=yj)pij,先算出分母上的边缘概率,然后用联合概率除以该边缘概率。
题型三:判断独立性#
求解方法:
- 离散型:检验是否对于所有的点都有 pij=pi⋅p⋅j;
- 连续型:求出边缘概率密度,检验是否在全域上满足 f(x,y)=fX(x)fY(y)。
题型四:给联合密度,求未知常数#
求解方法:利用规范性条件,计算在全域积分 ∬f(x,y)dxdy=1,求出密度函数中的未知数。
题型五:给联合密度,求边缘密度#
求解方法:按照 fX(x)=∫f(x,y)dy 或 fY(y)=∫f(x,y)dx 计算。解题的关键在于正确识别定义域的边界,从而合理确定积分区域的上下限。
题型六:求平面区域概率#
求解方法:利用 P((X,Y)∈D)=∬Df(x,y)dxdy,根据题意绘制平面积分区域 D,列出积分表达式并求解。
题型七:求 Z=g(X,Y) 的分布#
求解方法:优先选择分布函数法,先表示出 FZ(z)=P(g(X,Y)≤z),然后找出积分边界条件并进行计算,最后对分布函数求导得出密度函数。
16. 易错点总结#
易错点一:将边缘分布与联合分布混淆#
在求边缘分布时,务必将另一个变量消除(离散型求和累加,连续型积分积掉)。边缘分布结果是关于单变量的函数,其表达式中不应该包含另一个随机变量的符号。
易错点二:认为知道边缘分布就能决定联合分布#
在题目中如果未告知 X,Y 独立,千万不可直接假定 f(x,y)=fX(x)fY(y) 开展后续计算。
易错点三:条件分布的分母位置放错#
在计算条件概率或条件密度时,分母必须是条件事件(已发生的那个随机变量)对应的边缘分布,千万不可放错自变量。
易错点四:连续型随机变量计算单点概率#
二维连续型随机变量在平面上某一个特定的点或一条线段上的概率为 0。只有在平面上具有面积的区域积分,对应的体积概率才可能有大于 0 的数值。
易错点五:判断独立性仅验证个别数值#
判断独立性时要求“任意”或“所有”点都满足乘积公式。离散型如果有任何一格不满足 pij=pi⋅p⋅j,或者连续型在定义域内任一子区间不满足 f(x,y)=fX(x)fY(y),则两个随机变量即不独立。
17. 本章核心公式表#
| 内容 | 公式与表达 |
|---|
| 联合分布函数 | F(x,y)=P(X≤x,Y≤y) |
| 矩形概率计算 | P(x1<X≤x2,y1<Y≤y2)=F(x2,y2)−F(x1,y2)−F(x2,y1)+F(x1,y1) |
| 离散型联合分布律 | P(X=xi,Y=yj)=pij,且 ∑i∑jpij=1 |
| 离散型边缘分布律 | P(X=xi)=∑jpij, P(Y=yj)=∑ipij |
| 离散型条件概率 | P(X=xi∣Y=yj)=P(Y=yj)pij |
| 连续型联合密度规范性 | ∫−∞+∞∫−∞+∞f(x,y)dxdy=1 |
| 连续型区域概率 | P((X,Y)∈D)=∬Df(x,y)dxdy |
| 连续型边缘概率密度 | fX(x)=∫−∞+∞f(x,y)dy,fY(y)=∫−∞+∞f(x,y)dx |
| 连续型条件概率密度 | fX∣Y(x∣y)=fY(y)f(x,y) |
| 独立性判断条件 | 联合分布(或联合密度、联合分布律)等于对应边缘分布之乘积 |
| 和的分布(独立连续型) | fX+Y(z)=∫−∞+∞fX(x)fY(z−x)dx |
| 最大值分布(独立) | Fmax(z)=FX(z)FY(z) |
| 最小值分布(独立) | Fmin(z)=1−[1−FX(z)][1−FY(z)] |
18. 一句话掌握本章#
二维随机变量的研究主线可以归纳为:
联合分布→边缘分布→条件分布→独立性→函数分布做题时的思考路径为:
- 审题型:弄清题目给的是联合分布函数、联合密度函数,还是离散型的联合分布律表格;
- 定方法:离散型题目核心在于“求和与累加”,连续型题目核心在于“积分与确定边界”;
- 推边缘:只求单一随机变量的规律时,对另一个自变量进行全域积分或全值累加求和;
- 求条件:某随机变量已知时求另一个,直接套用比值公式,将联合分布除以已知随机量的边缘分布;
- 断独立:看联合函数是否恒等于各边缘函数的乘积;
- 算函数:计算新变量 Z=g(X,Y) 时,优先使用分布函数法,建立累积分布二重积分求解。