本文最后更新于120 天前,其中的信息可能已经过时,如有错误请发送邮件至 2641805259@qq.com
一、核心概念
1. 区间估计定义
- 点估计的局限性:用样本统计量直接作为总体参数估计值,存在以偏概全问题。
- 区间估计核心:推断总体参数落在某一区间范围内,区间对应预估准确度(置信度)。
置信区间与置信度:
定义 0.1 设是来自总体的样本,总体分布含未知参数,若统计量和,使得
成立,则称为置信度,为的置信度为的置信区间。
Remarks:
- 置信区间长度反映估计精度,长度越小,精度越高;
- 置信度反映估计可靠度,越小,可靠度越高;
- 给定时,置信区间不唯一,通常选择长度最小的区间。
2. 枢轴变量法(构造置信区间核心方法)
- 构造枢轴变量,其分布含待估参数但不依赖其他参数,且分布已知;
- 给定置信度,根据的分布确定临界值和,使得;
- 由,解出,即得置信区间。
二、单个正态总体参数的置信区间
1. 已知时,的置信区间
枢轴变量:
其中(为样本均值);
临界值:由正态分布对称性,,,其中;
因此
置信区间:
2. 未知时,的置信区间
由于未知,因此用样本方差估计,枢轴变量选为
临界值:,;
置信区间:;
Q:在已知的时候,判断的置信区间是通过 是正态分布去预估的。但是为什么未知的时候,用去预估后, 是分布去预估的?
A:在已知的时候,它是一个常量,因此运算后是一个正态分布。而未知时,虽然用去预估,但是仍然是一个自由度的随机变量,并且,因此需要用到分布。
3. 的置信区间(未知,实际常用场景)
由于未知,因此可用来估计,枢轴变量选为:
- 临界值:因分布不对称,取,得,;
- 置信区间:;
三、两个正态总体参数的置信区间
设来自,来自,样本独立,定义
1. 均值之差的置信区间
(1)和已知
有
取枢轴变量为:
置信区间:;
(2)未知
有
故可以构造如下服用分布的枢轴变量
其中.
- 置信区间:;
2. 方差之比的置信区间
由于,故可构造服从分布的枢轴变量
根据分布的不对称性,采用概率对称的区间,得,;
- 置信区间:;
四、非正态分布的区间估计
若总体的分布未知或非正态分布,可以利用集中不等式和中心极限定理给出总体期望的区间估计。
1. 基于集中不等式(总体)
若,设,根据集中不等式有
令
求解
于是有置信区间:
2. 基于中心极限定理(总体期望,方差)
利用中心极限定理求枢轴量的近似分布,设总体的期望,方差,有
当已知时,有置信区间:
当未知时,用样本方差替代,有置信区间:
五、单侧置信区间
定义 0.2 给定,若统计量满足
则为的置信度为的单侧置信区间,为单侧置信下限;
2. 正态总体单侧置信区间
若是来自的样本,若已知,则构建枢轴量为
若未知,构建枢轴量为
六、区间估计与机器学习
1. 核心价值
为机器学习模型的参数或预测结果提供不确定性量化,提升决策可靠性,应用场景包括风险控制(如房价预测区间)、医学诊断(如病人指标预测区间)、置信学习等。
2. 典型模型的区间估计
(1)线性回归
- 模型:,;
- 预测值:;
- 预测标准误:(为残差均方);
- 预测区间:;
- 均值响应置信区间(不含噪声):。
(2)逻辑回归
- 模型:,;
- 参数置信区间:(为参数估计协方差矩阵,为标准正态临界值);
- 预测概率区间:通过 delta 方法得标准误,区间为。
(3)神经网络
- 模型假设:单隐藏层回归,输出;
- 预测不确定性估计:通过蒙特卡洛 dropout(MC dropout)或贝叶斯近似获得标准误;
- MC dropout 实现:对新输入进行次前向传播,得预测样本,则();
- 预测区间:(或基于分布)。
3. 小结
| 模型 | 区间构造方法 |
|---|---|
| 线性回归 | 利用残差和分布直接构造预测区间 |
| 逻辑回归 | 基于参数协方差矩阵和 delta 方法近似获得概率预测区间 |
| 神经网络 | 通过蒙特卡洛 dropout 或贝叶斯神经网络获得预测分布,进而计算预测区间 |
我不要考区间估计啊我怎么什么都不会。。。