置信区间的概念

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

x 5.20
(5.20 0.49) (4.71, 5.69)
我们称其为置信度为0.95的μ的置信区间。 其含义是: 若反复抽样多次,每个样本值(n =16) 按公式
1.96 1.96 (x ,x ) 即 4 4
( x 0.49) 确定一个区间。
10
( x 0.49, x 0.49)
[1 , 2 ] 为常数区间。
3
定义7.7
设 是总体X的 一个未知参数,
若存在随机区间 [1 , 2 ], 对于给定的 0 1, 若满足
P{1 2 } 1
则称区间 [1 , 2 ] 是 的置信水平(置信度)为 1 的置信区间. 1 和 2 分别称为置信下限和置信上限 (双侧置信区间).
这种形式的估计称为区间估计.
使我们能以比 也就是说,我们希望确定一个区间, 较高的可靠程度相信它包含真参数值.
这里所说的“可靠程度”是用概率来度量的, 称为置信概率,置信度或置信水平. 习惯上把置信水平记作 1 ,这里 是一个很小 2 的正数,称为显著水平。
定义7.6 若由总体X的样本 X1,X2,…Xn 确定的
对于任意给定的α,我们的任务是通过样本寻找一
个区间, 它以1-α的概率包含总体X的数学期望μ。
6
一、数学期望的置信区间
1、已知σ2时,μ的置信区间 设
X ~ N ( , 2 )
EX DX
X ~ N ( ,
2
n
)

2
n
则随机变量

X
Z
X
2
~ N (0,1)
2

z z0.025 1.96 n 25 x 6
2
[x

z 2 ] [6 1 1.96] [6 0.392 ] n 5
17
所求为 [5.608, 6.392].
例3
X ~ N ( , 2 ), 现从5~6岁的幼儿 已知幼儿身高
中随机地抽查了9人,其高度分别为:
若σ2=25 μ的置信区间为[ X

例5
用某仪器间接测量温度,重复测量5次得
1250 0 1265 0 1245 0 1260 0 1275 0
求温度真值的置信度为 0.99 的置信区间。

设μ为温度的真值,X表示测量值,通常是一个 正态随机变量 EX .
问题是在未知方差的条件下求μ的置信区间。 由公式 1 x 1250 [0 15 5 10 25] 1259 5
115, 120, 131, 115, 109, 115, 115, 105, 110cm;
假设标准差
0 7,置信度为 95%;
试求总体均值 的置信区间。
解:已知 0 7, n 9, 0.05. 由样本值算得: 1 x (115 120 110) 115. 9 查正态分布表得临界值 Z 1.96,由此得置信区间:
P{ X

z 2 X

n n 它以1-α的概率包含总体 X的数学期望μ。
由定义可知,此区间即为μ的置信区间。
这就是说随机区间
[X

z 2 , X

z 2 ]
8
这就是说随机区间
[X
பைடு நூலகம்

n
z 2 , X

n
2
2
z
2
z 2 ]
z
2
它以1-α的概率包含总体X的数学期望μ。 由定义可知,此区间即为μ的置信区间。 其置信度为 1-α。
两个统计量 1 1 ( X 1 , X 2 ,, X n ),
2 2 ( X 1 , X 2 , , X n )
则称 [1 , 2 ] 为随机区间。
(1 2 )
随机区间与常数区间 (a, b) 不同, 其长度与在数轴上
的位置与样本 X 1 , X 2 , , X n 有关。 当一旦获得样本值 x1 , x2 , xn 那么, 1 ( x1 , x2 , xn ), 2 ( x1 , x2 , xn ) 都是常数。
确定一个区间。
在这么多的区间内包含μ的占0.95, 不包含μ的占0.05。 本题中 (4.71, 5.69) 属于那些包含μ的区间的可信 , 程度为0.95. 或“该区间包含μ”这一事实的可信程度 为0.95. 注: μ的置信水平1-α的置信区间不唯一。
11
X ~ N ( , 2 )的前提下提出的。 μ的置信区间是总体
z
2
n
P{
2
z } 1
2
2
z
2
n
7

P{
X
2
z } 1
2
n
P{ z 2
P{
X
2
z
2
2
z
2

2
z 2 } 1

n
n
z 2 X n

n
z 2 } 1 n z 2 } 1
1 为置信度, 为显著水平.
4
置信水平的大小是根据实际需要选定的. 例如,通常可取显著水平 0.025, 0.05, 0.1, 等. 即取置信水平 1 0.975 或 0.95,0.9 等. 由给定的置信水平,我们求出 根据一个实际样本, 一个尽可能小的区间 ,使 [1 , 2 ]
则所求μ的置信区间为 [1259 24.58 , 1259 24.58] 21
2
例6 为了估计一批钢索所能承受的平均张力(单位 kg/cm2), 随机选取了9个样本作试验, 由试验所得数据得
x 6720 s 2 28 2 设钢索所能承受的张力X, X ~ N ( , 2 ) 分别估计这批钢索所能承受的平均张力
置信下限 X

n
z 2
置信上限
X

n
z 2
置信区间也可简记为
[X

n
z 2 ]
9
[X
若取 查表得

n n 0.05 1 0.95
z z0.025 1.96
2
z 2 , X

z 2 ]
1 n 16
若由一个样本值算得样本均值的观察值 则得到一个区间
n
n
置信区间短表示估计的精度高, 第一个区间为优
(单峰对称的)。 可见,像 N(0,1)分布那样概率密度
的图形是单峰且对称的情况。 当n固定时以[ X 的区间长度为最短,我们一般选择它。

n
z 2 ]
若以L为区间长度,则
2 L z 2 n
可见L随 n 的增大而减少(α 给定时),
有时我们嫌置信度0.95偏低或偏高, 也可采用0.99或
P{ z0.04 X
0.04
0.01
z0.04 n P{ X z0.01 X z0.04} 0.95 n n
则μ的置信度为0.95的置信区间为
[X z0.01 , X z0.04 ]

2
z0.01} 0.95
z0.01
与上一个置信区间比较,同样是 1 0.95 1 其区间长度不一样,上例 2 z0.025 3.92 0.98 4 n 1 1 比此例 ( z0.04 z 0.01) 4.08 1.02 短。 14 4 4
ˆ ˆ 一旦有了样本,就把 估计在区间 [1 , 2 ] 内. 这里有两个要求:
ˆ ˆ 1. 要求 很大的可能被包含在区间 [1 , 2 ] 内,
ˆ ˆ 就是说,概率 P{1 2 } 要尽可能大. 即要求估计尽量可靠.
ˆ ˆ 2. 估计的精度要尽可能的高.如要求区间长度 2 1 尽可能短,或能体现该要求的其它准则.
P{1 2 } 1
由于正态随机变量广泛存在, 特别是很多产品的 指标服从正态分布, 我们重点研究一个正态总体情形
和方差 2的区间估计。 数学期望
5
设 X 1 , X 2 , , X n 为总体 X ~ N ( , 2 ) 的样本,
X , S 2 分别是样本均值和样本方差。

n n 115 1.96 7 / 9 , 115 1.96 7 / 9 110 .43 , 119 .57
[X

z 2 , X

2
z 2 ]

18
2、未知σ2时,μ的置信区间 当总体X的方差未知时, 容易想到用样本方差Ѕ 2代替σ2。 X T ~ t (n 1) 已知 2
2
1 570 2 2 s [(1250 1259 ) (1275 1259 ) ] 5 1 4 n 1 4 0.01 s 2 28.5 5.339 5 S [X t 2 (n 1)] t 0.01 (4) t0.005(4) 4.6041 查表 n
可靠度与精度是一对矛盾, 一般是在保证可靠度的 16 条件下尽可能提高精度.
例2
已知某种油漆的干燥时间X(单位:小时)
服从正态分布 X ~ N ( ,1), 其中μ未知,现在抽取 25个样品做试验, 得数据后计算得 1 n x xk 6 25 k 1
取 0.05 (1 0.95), 求μ的置信区间。
由中心极限定理知, n 充分大时, 当 无论X服从什么 分布,都近似有
X EX Z ~ N (0,1) DX n
[X

n
z 2 , X

n
z 2 ]
均可看作EX的置信区间。
12
例1 设总体X ~ N(μ,0.09), 有一组样本值: 12.6,13.4,12.8,13.2,
求参数μ的置信度为0.95的置信区间. 0 0 , X z ] 解 μ的置信区间为 [ X z
的范围与所能承受的平均张力。 0.05
解 本题是在σ2未知的条件下求正态总体参数μ的 S t 2 (n 1)] 置信区间。 由公式知μ的置信区间为 [ X n 查表 t 0.05 (8) t0.025 (8) 2.306 x 6720 s 2 28 2
0.9. 对于 1- α不同的值, 可以得到不同的置信区间。
15
ˆ ˆ ˆ ˆ 1 1 ( X 1 , X 2 , X n ) 2 2 ( X 1 , X 2 , X n )
可见,对参数 作区间估计,就是要设法找出两个 只依赖于样本的界限(构造统计量) (ˆ1 ˆ2 )
2
n
2
n

1-α= 0.95,σ0= 0.3,n = 4,
代入样本值算得 x 13 ,
0.3 0.3 [13 1. 96 , 13 1.96 ] 2 2
z z0.025 1.96
2
得到μ的一个区间估计为
[12.706,13.294].
13
注:该区间不一定包含μ.
又如,上例中同样给定 0.05 可以取标准正态分布上 α分位点-z0.04 和 z0.01 ,则又有
S n
则对给定的α,令 P{
X S
2
t (n 1)} 1
2
n
查t 分布表,可得 t (n 1) 的值。 2 S S P{ X t 2 (n 1) X t 2 (n 1)} 1 n n 则μ的置信度为1- α的置信区间为
S S S t 2 (n 1)] [X t 2 (n 1), X t 2 (n 1)] [ X n n n 19
T X S
2
~ t (n 1)
由公式知μ的置信区间为 [ X S t 2 (n 1)] n 查表 t 0.05 (39) t0.025 (39) 2.0227 则所求μ的置信区间为 即 [103 .45 , 106 .55]
2
n
[96.05 , 113 .95]
5 1.96] z 2 ] [105 40 n 20
例4 为了调查某地旅游者的消费额为X, 随机访问了 40名旅游者。 得平均消费额为 x 105 元,样本方差 2 2 2 s 28 设 X ~ N ( , )求该地旅游者的平均消费额 μ的置信区间。 0.05 解 本题是在σ2未知的条件下求正态总体参数μ的 置信区间。选取统计量为
第四节 置信区间的概念
一、置信区间的概念 二 、数学期望的置信区间 三 、方差的置信区间
第七章
1
一、置信区间的概念 前面,我们讨论了参数点估计. 它是用样本算得的 一个值去估计未知参数.但是点估计值仅仅是未知参数
的一个近似值, 它没有反映出这个近似值的误差范围, 使用起来把握不大. 范围通常用区间的形式给出的。
相关文档
最新文档