置信区间(详细定义及计算)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章
置信区间的概念
一、置信区间的概念 二 、数学期望的置信区间 三 、方差的置信区间
1
前面,我们讨论了参数点估计. 它是用样本算得的
一个值去估计未知参数.但是点估计值仅仅是未知参数
的一个近似值,它没有反映出这个近似值的误差范围,
使用起来把握不大. 范围通常用区间的形式给出的。 这种形式的估计称为区间估计.
(双侧置信区间).
1 为置信度, 为显著水平.
4
置信水平的大小是根据实际需要选定的.
例如,通常可取显著水平 0.025, 0.等05., 0.1, 即取置信水平 1 0或.9705.95,0.9 等.
根据一个实际样本,由给定的置信水平,我们求出
一个尽可能小的区间 ,使 [1,2 ]
2 2 (X1, X 2,, X n )
(1 2 )
则称 [1,2 ] 为随机区间。
随机区间与常数区间 (a, b) 不同,其长度与在数轴上
的位置与样本 X1, X 2 ,, X n 有关。
当一旦获得样本值 x1 , x2 , xn 那么, 1(x1, x2 , xn ), 2 (x1, x2 , xn ) 都是常数。
置信区间也可简记为 [ X n z 2 ]
9
[ X n z 2 , X n z 2 ]
0.05 1 0.95 1 n 16
查表得 z z0.025 1.96
2
若由一个样本值算得样本均值的观察值 x 5.20
则得到一个区间 (5.20 0.49) (4.71, 5.69)
[1,2 ] 为常数区间。
3
设 是总体X的 一个未知参数,
若存在随机区间 [1,2 ], 对于给定的 0 1,
若满足 P{1 2} 1 则称区间 [1,是2 ] 的置信水平(置信度)为 1
的置信区间.1 和2 分别称为置信下限和置信上限
个区间,它以1-α的概率包含总体X的数学期望μ。
6
1、已知σ2时,μ的置信区间
设 X ~ N (, 2)
X ~ N(, 2 )
EX DX 2
n
n
则随机变量 令 P{ X
2
n
X
Z
~ N (0,1)
2
n
z } 1
2
2
z
2
2
z
2
7
X
P{1 2} 1
由于正态随机变量广泛存在,特别是很多产品的 指标服从正态分布,我们重点研究一个正态总体情形
数学期望和方差 2的区间估计。 5
设 X1, X 2 ,, X n 为总体 X ~ N (, 2 ) 的样本,
X , S 2 分别是样本均值和样本方差。 对于任意给定的α,我们的任务是通过样本寻找一
它以1-α的概率包含总体 X的数学期望μ。
由定义可知,此区间即为μ的置信区间。
8
2
2
[ X n z 2 , X n z 2 ]
z
z
2
2
它以1-α的概率包含总体X的数学期望μ。
由定义可知,此区间即为μ的置信区间。
其置信度为 1-α。
置信下限
X
n z 2
置信上限
X n z 2
其区间长度不一样,上例
2
n
z0.025
3.92 1 4
0.98
比此例
1 4
( z0.04
z0.01 )
4.08
1 4
1.02
短。
14
第一个区间为优
P{
2
z } 1
2
n
2
2
P{ z 2
X 2
z 2} 1
z
z
n
2
2
Байду номын сангаас
P{
n
z 2 X
n
z
2}
1
P{X
n
z
2
X
n
z
2} 1
这就是说随机区间
[ X n z 2 , X n z 2 ]
也就是说,我们希望确定一个区间,使我们能以比 较高的可靠程度相信它包含真参数值.
这里所说的“可靠程度”是用概率来度量的,
称为置信概率,置信度或置信水平.
习惯上把置信水平记作 1 ,这里是一个很小
的正数,称为显著水平。
2
若由总体X的样本 X1,X2,…Xn 确定的
两个统计量
1 1( X1, X 2 ,, X n ),
X
P{ z0.04 P{X
n
2 z0.01}
n
z0.01 X
0.95
n z0.04}
0.95
z0.04
0.01
z0.01
则μ的置信度为0.95的置信区间为
[ X n z0.01 , X n z0.04 ]
与上一个置信区间比较,同样是 1 0.95
本题中 (4.71, 5.69),属于那些包含μ的区间的可信
程度为0.95.或“该区间包含μ”这一事实的可信程度 为0.95.
注: μ的置信水平1-α的置信区间不唯一。
11
μ的置信区间是总体 X ~ N (, 2 )的前提下提出的。
分布,都近似有
当 n 充分大时,无论X服从什么
Z X EX ~ N (0,1) DX n
[X
n
z 2 ,
X
n
z 2 ]
均可看作EX的置信区间。
12
设总体X ~ N(μ,0.09), 有一组样本
值:
12.6,13.4,12.8,13.2,
解 μ的求置参信数区μ间的为置信[ X度为z20.9n0 5,的X 置 z信2 区n0间] .
有 1-α= 0.95,σ0= 0.3,n =
4,
代入样本值算 x 13 z z0.025 1.96
得
[13
1.96
0.3
,
,
13
1.96
0.3]
2
2
2
得到μ的一个区间估计为 [12.706,13.294].
注:该区间不一定包含μ. 13
0.05 可以取标准正态分布上
α分位点-z0.04 和 z0.01 ,则又有
0.04
我们称其为置信度为0.95的μ的置信区间。其含义是:
若反复抽样多次,每个样本值(n =16) 按公式
(x 1.96 , x 1.96) 即 (x 0.49) 确定一个区间。
4
4
10
(x 0.49, x 0.49) 确定一个区间。
在这么多的区间内包含μ的占0.95, 不包含μ的占0.05。
置信区间的概念
一、置信区间的概念 二 、数学期望的置信区间 三 、方差的置信区间
1
前面,我们讨论了参数点估计. 它是用样本算得的
一个值去估计未知参数.但是点估计值仅仅是未知参数
的一个近似值,它没有反映出这个近似值的误差范围,
使用起来把握不大. 范围通常用区间的形式给出的。 这种形式的估计称为区间估计.
(双侧置信区间).
1 为置信度, 为显著水平.
4
置信水平的大小是根据实际需要选定的.
例如,通常可取显著水平 0.025, 0.等05., 0.1, 即取置信水平 1 0或.9705.95,0.9 等.
根据一个实际样本,由给定的置信水平,我们求出
一个尽可能小的区间 ,使 [1,2 ]
2 2 (X1, X 2,, X n )
(1 2 )
则称 [1,2 ] 为随机区间。
随机区间与常数区间 (a, b) 不同,其长度与在数轴上
的位置与样本 X1, X 2 ,, X n 有关。
当一旦获得样本值 x1 , x2 , xn 那么, 1(x1, x2 , xn ), 2 (x1, x2 , xn ) 都是常数。
置信区间也可简记为 [ X n z 2 ]
9
[ X n z 2 , X n z 2 ]
0.05 1 0.95 1 n 16
查表得 z z0.025 1.96
2
若由一个样本值算得样本均值的观察值 x 5.20
则得到一个区间 (5.20 0.49) (4.71, 5.69)
[1,2 ] 为常数区间。
3
设 是总体X的 一个未知参数,
若存在随机区间 [1,2 ], 对于给定的 0 1,
若满足 P{1 2} 1 则称区间 [1,是2 ] 的置信水平(置信度)为 1
的置信区间.1 和2 分别称为置信下限和置信上限
个区间,它以1-α的概率包含总体X的数学期望μ。
6
1、已知σ2时,μ的置信区间
设 X ~ N (, 2)
X ~ N(, 2 )
EX DX 2
n
n
则随机变量 令 P{ X
2
n
X
Z
~ N (0,1)
2
n
z } 1
2
2
z
2
2
z
2
7
X
P{1 2} 1
由于正态随机变量广泛存在,特别是很多产品的 指标服从正态分布,我们重点研究一个正态总体情形
数学期望和方差 2的区间估计。 5
设 X1, X 2 ,, X n 为总体 X ~ N (, 2 ) 的样本,
X , S 2 分别是样本均值和样本方差。 对于任意给定的α,我们的任务是通过样本寻找一
它以1-α的概率包含总体 X的数学期望μ。
由定义可知,此区间即为μ的置信区间。
8
2
2
[ X n z 2 , X n z 2 ]
z
z
2
2
它以1-α的概率包含总体X的数学期望μ。
由定义可知,此区间即为μ的置信区间。
其置信度为 1-α。
置信下限
X
n z 2
置信上限
X n z 2
其区间长度不一样,上例
2
n
z0.025
3.92 1 4
0.98
比此例
1 4
( z0.04
z0.01 )
4.08
1 4
1.02
短。
14
第一个区间为优
P{
2
z } 1
2
n
2
2
P{ z 2
X 2
z 2} 1
z
z
n
2
2
Байду номын сангаас
P{
n
z 2 X
n
z
2}
1
P{X
n
z
2
X
n
z
2} 1
这就是说随机区间
[ X n z 2 , X n z 2 ]
也就是说,我们希望确定一个区间,使我们能以比 较高的可靠程度相信它包含真参数值.
这里所说的“可靠程度”是用概率来度量的,
称为置信概率,置信度或置信水平.
习惯上把置信水平记作 1 ,这里是一个很小
的正数,称为显著水平。
2
若由总体X的样本 X1,X2,…Xn 确定的
两个统计量
1 1( X1, X 2 ,, X n ),
X
P{ z0.04 P{X
n
2 z0.01}
n
z0.01 X
0.95
n z0.04}
0.95
z0.04
0.01
z0.01
则μ的置信度为0.95的置信区间为
[ X n z0.01 , X n z0.04 ]
与上一个置信区间比较,同样是 1 0.95
本题中 (4.71, 5.69),属于那些包含μ的区间的可信
程度为0.95.或“该区间包含μ”这一事实的可信程度 为0.95.
注: μ的置信水平1-α的置信区间不唯一。
11
μ的置信区间是总体 X ~ N (, 2 )的前提下提出的。
分布,都近似有
当 n 充分大时,无论X服从什么
Z X EX ~ N (0,1) DX n
[X
n
z 2 ,
X
n
z 2 ]
均可看作EX的置信区间。
12
设总体X ~ N(μ,0.09), 有一组样本
值:
12.6,13.4,12.8,13.2,
解 μ的求置参信数区μ间的为置信[ X度为z20.9n0 5,的X 置 z信2 区n0间] .
有 1-α= 0.95,σ0= 0.3,n =
4,
代入样本值算 x 13 z z0.025 1.96
得
[13
1.96
0.3
,
,
13
1.96
0.3]
2
2
2
得到μ的一个区间估计为 [12.706,13.294].
注:该区间不一定包含μ. 13
0.05 可以取标准正态分布上
α分位点-z0.04 和 z0.01 ,则又有
0.04
我们称其为置信度为0.95的μ的置信区间。其含义是:
若反复抽样多次,每个样本值(n =16) 按公式
(x 1.96 , x 1.96) 即 (x 0.49) 确定一个区间。
4
4
10
(x 0.49, x 0.49) 确定一个区间。
在这么多的区间内包含μ的占0.95, 不包含μ的占0.05。