本文按“概念 → 分布 → 常见分布 → 函数分布 → 题型”的顺序梳理一维随机变量及其分布。这一章可以理解为:上一章研究的是“事件的概率”,这一章开始把随机结果数量化,研究一个随机变量取各种数值的概率规律。
1. 什么是随机变量#
随机变量本质上是一个函数,它把随机试验的结果映射成一个实数。
记作:
X=X(ω)其中 ω 是样本点,X(ω) 是对应的数值。
例如抛一枚硬币,样本空间为:
Ω={正面,反面}可以定义随机变量:
X={1,0,出现正面出现反面这样,原来的“正面、反面”就变成了数字 1,0。
所以:
随机变量就是把随机试验的结果用数字表示出来
2. 一维随机变量#
如果一个随机变量只用一个数来描述结果,就叫一维随机变量。
例如:
| 随机试验 | 随机变量 |
|---|
| 掷一个骰子 | X=掷出的点数 |
| 抽查产品 | X=次品个数 |
| 等公交 | X=等待时间 |
| 测量身高 | X=某人的身高 |
| 射击 | X=命中次数 |
这里的 X 都是一个数,所以是一维随机变量。
3. 随机变量的分布#
随机变量的分布描述的是:
随机变量取不同数值的概率规律比如掷骰子,令:
X=掷出的点数那么:
P(X=1)=61P(X=2)=61一直到:
P(X=6)=61这就是 X 的分布。
4. 分布函数#
不管随机变量是离散型还是连续型,都可以用分布函数描述。
随机变量 X 的分布函数定义为:
F(x)=P(X≤x)它表示随机变量 X 取值不超过 x 的概率。
例如:
F(3)=P(X≤3)意思是:
X 取值小于等于 3 的概率
分布函数的性质#
性质一:单调不减#
如果 x1<x2,那么:
F(x1)≤F(x2)因为 X≤x1 的范围一定包含在 X≤x2 里面。
性质二:取值范围在 0 到 1 之间#
0≤F(x)≤1因为它本质上是概率。
性质三:两端极限#
x→−∞limF(x)=0x→+∞limF(x)=1意思是:
当 x 非常小时,X≤x 几乎不可能发生;
当 x 非常大时,X≤x 几乎必然发生。
性质四:右连续#
分布函数总是右连续的:
F(x+0)=F(x)这个性质考试中一般不会重点计算,但要知道。
5. 用分布函数求概率#
分布函数最重要的用法是求区间概率。
P(a<X≤b)=F(b)−F(a)注意这里是 a<X≤b,左开右闭。
例如:
P(2<X≤5)=F(5)−F(2)还有:
P(X>b)=1−F(b)因为:
P(X>b)=1−P(X≤b)也就是:
P(X>b)=1−F(b)
6. 离散型随机变量#
如果随机变量只能取有限个或可列个值,就叫离散型随机变量。
例如:
- 掷骰子的点数;
- 抛硬币正面次数;
- 一批产品中的次品数;
- 某人一天收到的快递数。
这些值通常是一个一个分开的。
离散型随机变量的分布律#
若随机变量 X 可能取 x1,x2,…,xn,…,并且:
P(X=xi)=pi那么称:
P(X=xi)=pi,i=1,2,…为 X 的分布律。
通常写成表格:
XPx1p1x2p2⋯⋯xnpn
分布律必须满足两个条件#
第一:
pi≥0第二:
i∑pi=1也就是说,每个概率不能为负,而且所有可能取值的概率加起来必须等于 1。
离散型随机变量例题#
掷一个均匀骰子,令:
X=掷出的点数则 X=1,2,3,4,5,6,并且:
P(X=k)=61,k=1,2,3,4,5,6分布律为:
XP161261361461561661
离散型随机变量的分布函数#
对于离散型随机变量:
F(x)=P(X≤x)=xi≤x∑pi也就是把所有不超过 x 的取值概率加起来。
例如掷骰子:
F(3)=P(X≤3)=P(X=1)+P(X=2)+P(X=3)=61+61+61=21
7. 连续型随机变量#
如果随机变量可以在某个区间内连续取值,就叫连续型随机变量。
例如:
这些变量不是一个一个孤立的值,而是在区间内连续变化。
概率密度函数#
对于连续型随机变量,不能像离散型那样直接列出 P(X=xi),因为连续型随机变量在某一个点上的概率通常为 0:
P(X=a)=0所以连续型随机变量用概率密度函数表示,记作 f(x),它满足:
f(x)≥0并且:
∫−∞+∞f(x)dx=1
分布函数和密度函数的关系#
如果 X 是连续型随机变量,密度函数为 f(x),则:
F(x)=P(X≤x)=∫−∞xf(t)dt反过来,如果 F(x) 可导,则:
f(x)=F′(x)
连续型随机变量求区间概率#
对于连续型随机变量:
P(a<X≤b)=∫abf(x)dx因为单点概率为 0,所以:
P(a<X<b)=P(a≤X≤b)=P(a<X≤b)它们都等于:
∫abf(x)dx这是连续型随机变量和离散型随机变量的重要区别。
8. 离散型和连续型的核心区别#
| 类型 | 概率怎么给 | 单点概率 | 求区间概率 |
|---|
| 离散型 | 分布律 P(X=xi)=pi | 可能大于 0 | 概率相加 |
| 连续型 | 密度函数 f(x) | 通常等于 0 | 积分求面积 |
简单记:
离散型靠“加”,连续型靠“积分”
9. 常见离散型分布#
9.1 两点分布#
如果随机变量 X 只取 0 和 1,并且:
P(X=1)=pP(X=0)=1−p则称 X 服从两点分布,也叫 0-1 分布。
记作:
X∼B(1,p)例如一次射击:
X={1,0,命中未命中若命中率是 p,则:
P(X=1)=pP(X=0)=1−p
9.2 二项分布#
如果进行 n 次独立重复试验,每次成功概率为 p,令:
X=成功次数则:
X∼B(n,p)它的分布律为:
P(X=k)=Cnkpk(1−p)n−k,k=0,1,2,…,n二项分布就是前面提到的伯努利概型对应的随机变量分布。
例如某人命中率为 0.8,独立射击 5 次,令:
X=命中次数则:
X∼B(5,0.8)恰好命中 3 次:
P(X=3)=C53(0.8)3(0.2)2
9.3 泊松分布#
如果随机变量 X 表示某段时间、某个区域内某事件发生的次数,并且平均发生次数为 λ,则常用泊松分布。
记作:
X∼P(λ)分布律为:
P(X=k)=k!λke−λ,k=0,1,2,…例如:
- 某路口一分钟内通过的车辆数;
- 某商店一天内到店顾客数;
- 某机器一小时内故障次数;
- 某页书中的印刷错误数。
其中 λ 表示平均发生次数。
10. 常见连续型分布#
10.1 均匀分布#
如果随机变量 X 在区间 [a,b] 上每个位置“机会均等”,则称 X 服从均匀分布。
记作:
X∼U(a,b)其密度函数中的常数公式:
f(x)=b−a1来自于均匀分布的定义。
如果 X∼U(a,b),意思是说:X 在区间 [a,b] 上每一小段出现的可能性都一样。
所以它的概率密度函数 f(x) 应该是一个常数,设为:
f(x)=c,a≤x≤b因为概率密度函数有一个基本要求:
∫−∞+∞f(x)dx=1而 X 只在 [a,b] 上取值,在其他区域概率密度为 0,所以有:
∫abcdx=1计算积分可得:
c(b−a)=1⟹c=b−a1因此,均匀分布的密度函数为:
f(x)=⎩⎨⎧b−a1,0,a≤x≤b其他例如随机等待时间在 0 到 10 分钟之间均匀分布:
X∼U(0,10)则:
P(2<X<5)=10−05−2=103
10.2 指数分布#
如果随机变量 X 表示“等待时间”或“寿命”,常用指数分布。
记作:
X∼E(λ)密度函数为:
f(x)={λe−λx,0,x>0x≤0分布函数为:
F(x)={1−e−λx,0,x>0x≤0所以:
P(X>x)=1−F(x)=e−λx指数分布常见于:
10.3 正态分布#
正态分布是最重要的连续型分布之一。
若:
X∼N(μ,σ2)则密度函数为:
f(x)=2πσ1e−2σ2(x−μ)2其中 μ 控制中心位置,σ 控制曲线离散程度。正态分布曲线呈钟形,关于 x=μ 对称。
常见例子:
特别地,当 μ=0 且 σ2=1 时,称为标准正态分布:
X∼N(0,1)通常记作:
Z∼N(0,1)
标准正态分布的计算与标准化#
在实际做题中,我们经常遇到一般的正态分布,此时需要用到标准化法。其核心思想是:将一般正态分布 X∼N(μ,σ2) 转化为标准正态分布 Z∼N(0,1),再利用标准正态分布的分布函数 Φ(x) 进行计算。
标准化公式#
若 X∼N(μ,σ2),则:
Z=σX−μ∼N(0,1)典型简例#
设随机变量 X∼N(2,σ2),且 P(2<X<4)=0.3,求 P(X<0)。
用文字描述就是:已知 X 服从均值为 2、方差为 σ2 的正态分布,并且 X 落在区间 (2,4) 内的概率是 0.3,求 X 小于 0 的概率。
【解析】
第一步:标准化已知条件,求 Φ(σ2)
因为 μ=2,我们对已知概率进行标准化转换:
P(2<X<4)=P(σ2−2<σX−2<σ4−2)=P(0<Z<σ2)利用标准正态分布函数 Φ(x) 表示:
P(0<Z<σ2)=Φ(σ2)−Φ(0)因为标准正态分布在原点处的分布函数值 Φ(0)=0.5,所以:
0.3=Φ(σ2)−0.5⟹Φ(σ2)=0.8第二步:标准化待求概率,求 P(X<0)
同样地,对 P(X<0) 进行标准化转换:
P(X<0)=P(σX−2<σ0−2)=P(Z<−σ2)写成标准正态分布函数的形式:
P(X<0)=Φ(−σ2)利用标准正态分布的对称性质 Φ(−x)=1−Φ(x),可得:
Φ(−σ2)=1−Φ(σ2)将第一步求得的结果 Φ(σ2)=0.8 代入上式:
P(X<0)=1−0.8=0.2所以,最终答案为:
0.2这个方法可以总结为:
先标准化,再用标准正态分布函数 Φ(x) 计算
11. 随机变量函数的分布#
有时题目不是直接问 X 的分布,而是问:
Y=g(X)的分布。这叫做随机变量函数的分布。
离散型情况#
如果 X 是离散型随机变量,可以直接代入。
例如:
XP−10.200.320.5令:
Y=X2则:
- X=−1⇒Y=1
- X=0⇒Y=0
- X=2⇒Y=4
所以:
YP00.310.240.5如果不同的 X 对应同一个 Y,要把概率合并。
连续型情况#
连续型随机变量函数的分布,常用分布函数法:
先写:
FY(y)=P(Y≤y)再把 Y=g(X) 代进去,转化成关于 X 的不等式。
例如:
Y=2X+1则:
FY(y)=P(Y≤y)=P(2X+1≤y)=P(X≤2y−1)=FX(2y−1)这类题的核心是:
先写分布函数,再化成 X 的不等式
再来看一个经典的例题。
【例题】
设随机变量 X 在区间 (0,2) 上服从均匀分布,
Y=X3求:
(1) Y 的分布函数 FY(y);
(2) Y 的密度函数 fY(y)。
【解析】
因为:
X∼U(0,2)所以 X 的密度函数为:
fX(x)=⎩⎨⎧21,0,0<x<2其他又因为:
Y=X3当 X∈(0,2) 时,有 Y∈(0,8)。
所以要求 FY(y),需要分三段讨论:
第一段:y<0#
因为 Y=X3>0,所以:
P(Y≤y)=0因此:
FY(y)=0,y<0
第二段:0≤y<8#
FY(y)=P(Y≤y)因为 Y=X3,所以:
FY(y)=P(X3≤y)两边开三次方:
FY(y)=P(X≤3y)由于 X 在 (0,2) 上均匀分布,所以概率等于区间长度之比:
P(0<X≤3y)=2−03y−0所以:
FY(y)=23y,0≤y<8
第三段:y≥8#
因为 Y 最大到 8,所以当 y≥8 时,Y≤y 是必然事件:
P(Y≤y)=1因此:
FY(y)=1,y≥8
综上所述,Y 的分布函数是:
FY(y)=⎩⎨⎧0,23y,1,y<00≤y<8y≥8
接下来求密度函数。连续型随机变量的密度函数是分布函数的导数:
fY(y)=FY′(y)对中间这一段求导:
FY(y)=21y1/3可得:
fY(y)=21⋅31y−2/3即:
fY(y)=6y2/31,0<y<8其他地方密度为 0。
所以,Y 的密度函数为:
fY(y)=⎩⎨⎧6y2/31,0,0<y<8其他
这题的关键就是:
先求 FY(y)=P(Y≤y),再对 FY(y) 求导得到 fY(y)
12. 本章常考题型#
题型一:由分布律求概率#
给你:
XP00.110.220.330.4求:
P(X≥2)直接加:
P(X≥2)=P(X=2)+P(X=3)=0.3+0.4=0.7
题型二:由分布律求分布函数#
如果:
XP10.220.540.3则:
F(x)=P(X≤x)所以:
F(x)=⎩⎨⎧0,0.2,0.7,1,x<11≤x<22≤x<4x≥4离散型随机变量的分布函数是阶梯函数。
题型三:由密度函数求常数#
如果:
f(x)={cx,0,0<x<2其他求 c。
因为密度函数总面积为 1:
∫−∞+∞f(x)dx=1所以:
∫02cxdxc⋅2x2022cc=1=1=1=21
题型四:由密度函数求概率#
仍设:
f(x)={21x,0,0<x<2其他求:
P(1<X<2)则:
P(1<X<2)=∫1221xdx=21⋅2x212=41(4−1)=43
题型五:由密度函数求分布函数#
已知:
f(x)={2x,0,0<x<1其他求 F(x)。
分段讨论:
当 x≤0 时:
F(x)=0当 0<x<1 时:
F(x)=∫0x2tdt=x2当 x≥1 时:
F(x)=1所以:
F(x)=⎩⎨⎧0,x2,1,x≤00<x<1x≥1
13. 易错点总结#
易错点一:随机变量不是变量,而是函数#
随机变量 X 是从样本空间到实数的映射。不过初学时可以先把它理解成“随机取值的数”。
易错点二:分布函数永远是 P(X≤x)#
不是 P(X=x),而是 P(X≤x),这个一定要分清。
易错点三:离散型有单点概率,连续型单点概率为 0#
离散型 P(X=a) 可能大于 0。
连续型 P(X=a)=0。
所以连续型中:
P(a<X<b)=P(a≤X≤b)端点有没有等号不影响结果。
易错点四:密度函数值不是概率#
对于连续型随机变量,f(2) 不是 P(X=2)。密度函数下面的面积才是概率:
P(a<X<b)=∫abf(x)dx易错点五:分布函数是累积概率#
分布函数 F(x) 表示从左边一直累积到 x 的概率,所以它一定不会下降。
14. 本章公式总结#
| 内容 | 公式 |
|---|
| 分布函数 | F(x)=P(X≤x) |
| 区间概率 | P(a<X≤b)=F(b)−F(a) |
| 右尾概率 | P(X>x)=1−F(x) |
| 离散型分布律 | P(X=xi)=pi |
| 离散型分布函数 | F(x)=∑xi≤xpi |
| 连续型分布函数 | F(x)=∫−∞xf(t)dt |
| 连续型区间概率 | P(a<X<b)=∫abf(x)dx |
| 密度函数求总概率 | ∫−∞+∞f(x)dx=1 |
| 密度与分布函数关系 | f(x)=F′(x) |
15. 一句话掌握本章#
这一章的核心是:
随机变量把随机结果变成数字,分布描述这些数字出现的概率规律做题时按这个顺序:
- 判断 X 是离散型还是连续型;
- 离散型用分布律,概率靠加法;
- 连续型用密度函数,概率靠积分;
- 遇到分布函数,永远先想到 F(x)=P(X≤x);
- 遇到随机变量函数,先写 FY(y)=P(Y≤y)。