定义 3.1 设是一个样本空间,如果对每个基本事件,都对应于一个实数,称这样的单射实值函数为随机变量(random variable),一般简写为.
根据取值类型,可以将随机变量进行分类:
- 离散型随机变量:的取值是有限的、无限可列的
- 非离散型随机变量:的取值是无限不可列的
3.1 离散型随机变量及分布列
定义 3.2 设随机变量的所有可能的取值为,事件的概率为
称之为随机变量的概率分布列或概率分布,简称分布列.
3.1.1 分布列
分布列包含随机变量的取值和概率,可以完全刻画其概率属性
| X | |||||
|---|---|---|---|---|---|
| P(X) |
性质 3.1
- 对任意的都有
3.2 离散型随机变量的期望
3.2.1 期望
定义 3.3 设随机变量的分布列为若级数绝对收敛,则称级数为随机变量的期望,记为
Remarks:
期望是常量不是变量
期望反映随机变量的平均值
期望的性质:
- 设,若随机变量,则,不考虑其分布列
- 线性:对随机变量及常数,
除非特殊说明,通常直接利用定义计算期望,不考虑绝对收敛性
定理 3.1 设离散型随机变量的分布列是对任意的实质函数.若级数绝对收敛,则有
Remarks:
- 求的期望,无需知道的分布列,使用的分布列即可计算.
- 定理 3.1 即期望的线性性
3.2.2 凸函数和凹函数
定义 3.4(凸函数) 设函数,对任意和.若
则称是定义在的凸函数或者下凸函数
定义 3.5(凹函数) 设函数,对任意和,若
则称是定义在的凹函数或者上凸函数
Jensen 不等式
定理 3.2 对随机变量和若实值函数是凸函数,实值函数是凹函数,则有
3.3 离散型随机变量的方差
定义 3.6 设随机变量的分布列为.若期望和
存在,则称为随机变量的方差,记为.称
为标准差。
Remarks:
- 方差是常量而不是变量
- 方差反映随机变量与其期望的偏离程度
离散型随机变量方差的性质
设是常数,若随机变量,则
对随机变量和常数,有
对随机变量和常数,有
Bhatia-Davis 不等式:对随机变量,有
3.4 常用离散型随机变量
3.4.1 0-1 分布
伯努利试验:
只考虑事件发生或不发生两种情况,用 0 和 1 标记来实现试验结果数值化。
定义 3.7
随机变量的取值,其分布列为:
称服从参数为的分布,或伯努利分布,记
期望:
若,则
方差:
若,则
3.4.2 二项分布
定义 3.8(n重伯努利试验) 将一个伯努利试验独立重复地进行次,称这一系列重复的独立试验为重伯努利试验.
在重伯努利试验中,用表示事件发生的次数,取值
定义 3.9
随机变量的取值,其分布列为:
称服从参数为和的二项分布,记
期望
方差
3.4.3 泊松分布
用于描述大量试验中稀有事件出现次数的概率模型。
定义 3.10
若随机变量的分布列为:
其中,是一个常数,称随机变量服从参数为的泊松分布,记为或者
期望
方差
泊松定理
定理 3.2 设 任意给定的常数,是一个正整数,若,则对任意给定的非负整数,有
若随机变量,当比较大而比较小时,令,有
即利用泊松分布可近似计算二项分布
3.4.4 几何分布
定义 3.11
在多重伯努利试验中设事件发生的概率为,用随机变量表示事件首次发生时的试验次数
的分布列为
称服从参数为的几何分布,记为
期望
方差
无记忆性
设随机变量,对任意正整数,有
根据定义及等比数列求和计算
3.4.5 Pascal 分布
在多重伯努利试验中,随机事件发生的概率为,用表示事件第次成功时发生的试验次数。
随机变量的取值为:,其分布列为:
称服从参数为和的 Pascal 分布,又称负二项分布,记为。
期望:
方差:
3.5 案例分析
3.5.1 德国坦克问题
3.5.2 集卡活动
3.5.3 随机二叉树叶子结点的高度