本文主要对概率论与数理统计里常见的各类概率分布进行系统的梳理。在学习这一章时,核心思路可以总结为:
1. 概率分布的总分类
随机变量的概率分布主要可以划分为以下三大类:
| 分布类别 | 核心数学特点 | 常见典型分布 |
|---|---|---|
| 离散型分布 | 随机变量的可能取值是有限个或可列无限个 | 两点分布、二项分布、几何分布、超几何分布、泊松分布 |
| 连续型分布 | 随机变量可以在某一个或多个实数区间内连续取值 | 均匀分布、指数分布、正态分布 |
| 抽样分布 | 数理统计中用于推断未知参数的统计量所服从的分布 | 卡方分布、学生分布( 分布)、 分布 |
2. 常见离散型分布
2.1 两点分布 / 伯努利分布
若随机变量 只能取两个值 和 ,且其发生的概率分别为:
则称 服从两点分布,也称为伯努利分布。
记作:
其概率质量函数(分布律)可以统一表示为:
数学期望与方差分别为:
典型适用场景
- 一次射击试验:命中(1)或未命中(0);
- 一次产品质量抽查:合格(1)或不合格(0);
- 一次选举投票:支持(1)或不支持(0);
- 一次科学试验:成功(1)或失败(0)。
简明规律:
2.2 二项分布
若进行 次独立重复的伯努利试验,每次试验中事件成功的概率均为 。令随机变量 表示 次试验中成功的次数,则 服从二项分布。
记作:
其分布律公式为:
数学期望与方差分别为:
典型适用场景
- 独立重复射击 次,射中目标的次数;
- 重复抛掷一枚硬币 次,正面朝上的次数;
- 从大批工业产品中随机抽检 件,其中所包含的次品个数;
- 独立作答 道单选题,最终答对的题目数。
计算示例
假设某射击运动员每次射击的命中率均为 0.8。现独立射击 5 次,令随机变量 表示命中的次数,则 。
其恰好命中 3 次的概率计算为:
简明规律:
![]()
2.3 几何分布
若每次试验成功的概率为 ,在独立重复试验中,令随机变量 表示为了获得首次成功所需要的累计试验次数,则 服从几何分布。
其分布律公式为:
数学期望与方差分别为:
典型适用场景
- 重复射击,直到第几次射击才出现首次命中;
- 重复参与抽奖,直到第几次才首次中奖;
- 连续质检产品,直到第几件才首次发现次品。
计算示例
某人投篮的命中率为 0.6。问其直到第 3 次投篮才首次投中的概率。
根据几何分布定义,前 2 次必须未投中,第 3 次投中:
简明规律:
- 注意:部分国外教材或特定考题将 定义为“首次成功前所失败的次数”,此时随机变量的取值范围为 ,其分布律公式会变更为 。在审题时务必看清变量的具体定义。
2.4 超几何分布
超几何分布用于描述在不放回抽样条件下的概率问题。
设总体共包含 个个体,其中有 个属于成功类,剩下的 个属于失败类。现从中不放回地随机抽取 个个体,令随机变量 表示抽出的个体中属于成功类的个数,则 服从超几何分布。
其分布律公式为:
其取值的合理范围为 。
数学期望与方差为:
典型适用场景
- 一箱共 件产品中含有 件次品,不放回地随机抽出 件,求抽到的次品个数;
- 从装有红球和白球的袋子中,不放回地摸出若干个球,求摸出红球的个数;
- 从包含男女生的班级中,不放回地随机抽取若干人,求其中女生的人数。
计算示例
一批共 20 件产品中含有 5 件次品。现从中不放回地随机抽取 4 件,求恰好抽到 2 件次品的概率。
简明规律:
2.5 泊松分布
如果随机变量 表示在某段特定的时间、空间或区域内,某随机事件发生的次数,且该事件平均发生的次数为 ,则 服从泊松分布。
记作:
其分布律公式为:
数学期望与方差满足特征:
典型适用场景
- 某繁忙路口在一分钟内通过的车辆总数;
- 某零售商铺在一天内迎来光顾的顾客总数;
- 某生产设备在一小时内发生故障的次数;
- 某书籍页面中印刷错误的字符数;
- 某特定地区在一天内发生交通事故的次数。
计算示例
某客服热线中心平均每分钟接到 3 个来电,求其在一分钟内恰好接到 2 个来电的概率。
此随机发生次数服从泊松分布 :
简明规律:
3. 常见连续型分布
3.1 均匀分布
若随机变量 在实数区间 上取值,且落在该区间内任意等长度子区间内的概率均相等,则称 在区间 上服从均匀分布。
记作:
其概率密度函数为:
累积分布函数为:
数学期望与方差分别为:
典型适用场景
- 某线路公交车每 10 分钟一班,某人随机到达站台,其等待公交车的时间;
- 计算机生成的伪随机数;
- 测量仪器读数四舍五入带来的舍入误差。
计算示例
已知公交车每 10 分钟发车一班,某乘客随机到达车站,其等待时间服从均匀分布 。求该乘客等待时间不超过 3 分钟的概率。
简明规律:
![]()
3.2 指数分布
指数分布常用于描述设备寿命或随机服务系统中的等待时间。
如果随机变量服从指数分布:
其概率密度函数为:
其累积分布函数为:
在实际计算中,我们常用其右尾生存概率公式:
数学期望与方差分别为:
- 这里的参数 代表单位时间内事件发生的平均速率。
典型适用场景
- 某电子元器件或机械设备的物理使用寿命;
- 电话中心等待下一个呼入电话所经历的时间;
- 排队论中,等待下一位顾客到店的服务间隔时间。
计算示例
某精密仪器平均使用寿命为 1000 小时。假设其寿命服从指数分布,求该仪器使用寿命超过 1500 小时的概率。
因为平均寿命 ,解得率参数 。
仪器寿命超过 1500 小时的概率为:
简明规律:
![]()
核心性质:无记忆性
指数分布是唯一的具有无记忆性的连续型概率分布,满足如下条件:
这在直观上的物理含义是:对于一个正常工作的元器件,它已经工作了 小时这一事实,并不影响它能继续工作 小时的概率。它在任何时刻都“宛如新生”。
3.3 正态分布
正态分布是概率论与数理统计中应用最为广泛、最重要的连续型随机变量分布。
如果随机变量服从正态分布:
其概率密度函数为经典的钟形曲线:
数学期望与方差分别为:
曲线的几何特征
- 曲线呈单峰钟形,关于直线 左右对称;
- 参数 决定了分布中心的位置;
- 参数 控制了曲线的离散波动程度。 越大,曲线越扁平宽分散; 越小,说明数据越集中,曲线越尖锐窄高。
典型适用场景
- 成年人群的身高与体重数据;
- 某次标准化考试中考生的考试成绩;
- 物理测量过程中不可避免的测量误差;
- 机械加工中零件的尺寸误差;
- 受到自然界大量独立、微小的随机因素共同叠加作用所产生的数据分布。
简明规律:
![]()
3.4 标准正态分布与标准化法
当正态分布满足均值 ,方差 时,特称为标准正态分布。
通常记为:
其概率密度函数与累积分布函数分别记为:
标准化定理
对于任意一般的正态分布随机变量 ,我们可以通过线性变换将其转化为标准正态变量:
这一标准化过程是求解正态分布概率的核心工具。
例如,计算 落在区间 内的概率:
简明规律:
4. 数理统计中的三大抽样分布
数理统计中的三大抽样分布是由正态分布衍生出来的,在参数估计与假设检验中扮演着枢轴量的角色。
4.1 卡方分布
设随机变量 相互独立,且均服从标准正态分布 。
则它们平方和所构成的新随机变量:
服从自由度为 的卡方分布,记作:
其数学期望与方差分别为:
核心应用定理
在正态总体样本中,样本方差 与总体方差 之间满足如下结论:
这为估计和检验总体方差提供了理论依据。
简明规律:
![]()
4.2 学生分布( 分布)
设随机变量 ,随机变量 ,且 与 相互独立。
则新随机变量:
服从自由度为 的 分布,记作:
分布特征
- 曲线关于 对称,形状类似于标准正态分布,但比标准正态分布具有“更厚”的尾部;
- 当自由度 时, 分布在极限下收敛于标准正态分布 。
核心应用定理
当正态总体方差 未知时,样本均值与样本标准差满足如下结论:
这为单总体及双总体的均值推断奠定了基础。
简明规律:
![]()
4.3 分布
设随机变量 ,随机变量 ,且 与 相互独立。
则这两个卡方统计量除以各自自由度之后的比值:
服从第一自由度为 ,第二自由度为 的 分布,记作:
核心应用定理
从两个独立正态总体中抽样,其样本方差之比满足结论:
这可直接用于推断两个总体方差是否相等。
简明规律:
5. 各种概率分布之间的深层联系
不同的分布之间存在着紧密的内在转换与极限近似关系:
1. 两点分布与二项分布
两点分布是二项分布当试验次数 时的特例,即二项分布可以看作是 个独立同分布的两点分布随机变量之和。
2. 二项分布与泊松分布的极限(泊松定理)
当二项分布中试验次数 非常大(如 ),且单次成功概率 非常小(如 ),而乘积 保持稳定时,二项分布可近似为泊松分布:
这常被用于计算稀有突发事件的概率。
3. 二项分布的正态近似(棣莫弗-拉普拉斯定理)
当二项分布的 较大且 与 均较大(通常大于 5)时,二项分布可近似为正态分布:
在实际近似计算中,为提高精确度,通常需要对区间进行连续性校正。例如,将 校正为 后再进行标准化计算。
4. 泊松分布的正态近似
当泊松分布的均值参数 较大(如 )时,泊松分布也可以近似为正态分布:
5. 抽样分布的起源
三大抽样分布 分布、 分布与 分布,其数学构造的源头全部来自于独立的标准正态分布变量 。
6. 常见概率分布速查总表
| 分布名称 | 常用记号 | 随机变量取值范围 | 数学期望 | 物理方差 | 典型应用领域 |
|---|---|---|---|---|---|
| 两点分布 | 一次成败试验 | ||||
| 二项分布 | 重复抽样、成败计数 | ||||
| 几何分布 | 首次成功的等待次数 | ||||
| 超几何分布 | 合理整数组合 | 不放回抽样质检 | |||
| 泊松分布 | 单位时间或区域发生频数 | ||||
| 均匀分布 | 区间等概率取值、随机等待 | ||||
| 指数分布 | 设备物理寿命、服务间隔 | ||||
| 正态分布 | 测量误差、身高、自然现象 | ||||
| 卡方分布 | 正态总体方差推断 | ||||
| 分布 | 方差未知时的均值推断 | ||||
| 分布 | 较复杂 | 两个总体方差的对比推断 |
7. 实际做题时如何选择分布
在面对概率论应用题时,可以通过题目中的关键性线索锁定所使用的分布类型:
- “仅有一次且只有两种结果” 选用 两点分布;
- “独立重复进行 次,求解成功了多少次” 选用 二项分布;
- “不断重复试验,问第几次才首次出现成功” 选用 几何分布;
- “针对一个有限总体进行‘不放回’地抽取样本” 选用 超几何分布;
- “求解在一段确定时间或一个确定空间里,某随机事件发生的次数” 选用 泊松分布;
- “随机变量在某个范围区间内的取值机会是均等的” 选用 均匀分布;
- “研究某些产品设备的使用寿命,或者求两次随机事件发生的间隔等待时间” 选用 指数分布;
- “物理测量的误差,大量独立小随机因素累积的结果” 选用 正态分布;
- “推断正态总体的方差性质” 选用 卡方分布;
- “总体方差未知,需要估计或检验正态总体的均值” 选用 分布;
- “比较两个正态总体的方差大小” 选用 分布。
8. 易混淆分布深入对比
8.1 二项分布 与 超几何分布
- 二项分布:每次抽样是有放回的(或者总体无穷大),每次抽取时摸出目标物的概率 保持恒定不变。
- 超几何分布:每次抽样是不放回的,因为每一次抽走个体会影响下一次摸出目标物的概率。
- 联系:当总体容量 趋于无穷大时,不放回抽样和放回抽样差别极小,超几何分布在极限下收敛于二项分布。
8.2 二项分布 与 几何分布
- 二项分布:试验的次数是固定的(即常数 ),随机变量是“成功的次数”。
- 几何分布:试验的次数是随机变量(即试验一直做到成功为止),随机变量是“首次成功时的试验次数”。
8.3 泊松分布 与 指数分布
- 泊松分布:属于离散型随机变量,数的是在单位时间内事件发生的“次数”(如一小时内通过路口的车辆数)。
- 指数分布:属于连续型随机变量,测量的是两次随机事件发生之间的“时间长短”(如等待下一辆车通过路口的时间)。
8.4 正态分布 与 分布
- 正态分布:在总体方差 已知,或样本量较大(利用中心极限定理)时使用。
- 分布:仅在总体服从正态分布,且总体方差 未知的小样本推断中使用。
9. 备考复习优先级建议
- 第一梯队(核心考点,必须透彻掌握): 二项分布、泊松分布、正态分布(包含标准化计算与中心极限定理的结合)。
- 第二梯队(常考基础题): 均匀分布、指数分布(牢记无记忆性)、超几何分布。
- 第三梯队(统计推断必备): 卡方分布、 分布、 分布(熟练掌握它们与正态总体样本均值、样本方差的转换公式)。
10. 一句话总结各种分布
如果这篇文章对你有帮助,欢迎分享给更多人!
部分信息可能已经过时


















