置信区间详细定义及计算ppt课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
试求总体均值 的置信区间。
解:已知 x 1 (115
0 7, n 9,
120 110)
0.05. 115.
由样本值算得:
9
查正态分布表得临界值 Z 1.96,由此得置信区间:
2
[ X n z 2, X n z 2 ]
115 1.96 7 / 9 ,115 1.96 7 / 9 110.43 ,119.57
若σ2=25 μ的置信区间为
即 [103.45 , 106.55]
[X
n
编辑课件
z
2 ]
[105
5 1.96] 40
20
例5 用某仪器间接测量温度,重复测量5次得 12500 12650 12450 12600 12750
求温度真值的置信度为 0.99 的置信区间。
解 设μ为温度的真值, X表示测量值,通常是一个
0.95
z0.04
0.01
z0.01
则μ的置信度为0.95的置信区间为
[ X n z0.01 , X n z0.04 ]
与上一个置信区间比较,同样是 1 0.95
其区间长度不一样,上例
2
n
z0.025
3.92 1 4
0.98
比此例
1
1
4
( z0.04
z0.01 )
4.08
1.02 4编辑课件
11
μ的置信区间是总体 X ~ N (, 2)的前提下提出的。 由中心极限定理知,当 n 充分大时,无论X服从什么 分布,都近似有
Z X EX ~ N (0,1) DX n
[ X n z 2 , X n z 2 ]
均可看作EX的置信区间。
编辑课件
12
例1 设总体X ~ N(μ,0.09), 有一组样本值:
p( y)d
y
0
2
2 1
(n
1)
2
(n
1)
x
2
2
p(y)d y
2
( n 1)
2
P{12 2
(n 1)
(n 1)S 2
2
2
2
(n
1)}
2
1
(n 1)S 2
P{
2
(n
1)
2
(n 1)S
2 1
(n
2
} 1)
1
2
2
则得到σ2随机区间
(n 1)S 2 (n 1)S 2
[
2
(n
1)
,
2 1
(n
] 1)
1 5
1.96]
[6
0.392]
所求为 [5.608, 6.392].
编辑课件
17
例3 已知幼儿身高 X ~ N (, 2 ), 现从5~6岁的幼儿
中随机地抽查了9人,其高度分别为:
115, 120, 131, 115, 109, 115, 115, 105, 110cm;
假设标准差 0 7,置信度为 95%;
3
则钢索所能承受的平均张力为 编6辑6课件50.9 kg/cm2
22
三、方差σ2的置信区间
已知总体 X ~ N (, 2)
下面我们将根据样本找出σ2 的置信区间, 这在研究
生产的稳定性与精度问题是需要的。 我们利用样本方差对σ2进行估计,由于不知道S2与
σ2差多少?容易看出把 S 2 看成随机变量,又能找到
16
例2 已知某种油漆的干燥时间X(单位:小时)
服从正态分布 X ~ N (,1), 其中μ未知,现在抽取
25个样品做试验, 得数据后计算得
x
1 25
n k 1
xk
6
取 0.05 (1 0.95), 求μ的置信区间。
解 z z0.025 1.96 n 25 x 6
2
[x
n
z
2
]
[6
正态随机变量 EX .
问题是在未知方差的条件下求μ的置信区间。 由公式
x 1250 1 [0 15 510 25] 1259
s2
1
5 [(1250
1259)2
(1275
1259)2
]
570
5 1
4
s2 5
28.5 5.339
n 1 4
查表 t0.01 (4) t0.005(4) 4.6041
2
若由一个样本值算得样本均值的观察值 x 5.20
则得到一个区间 (5.20 0.49) (4.71, 5.69)
我们称其为置信度为0.95的μ的置信区间。其含义是:
若反复抽样多次,每个样本值(n =16) 按公式
(x 1.96 , x 1.96) 即 (x 0.49) 确定一个区间。
4
1
则μ的置信度为1- α的置信区间为
[X
S n t 2 (n 1), X
S n
t
2 (n 1)]
编辑课件
[X
S n t 2 (n 1)]
19
例4 为了调查某地旅游者的消费额为X,随机访问了
40名旅游者。得平均消费额为 x 105 元,样本方差
s2 282 设 X ~ N (, 2)求该地旅游者的平均消费额
6
一、数学期望的置信区间
1、已知σ2时,μ的置信区间
设 X ~ N(, 2)
X ~ N(, 2 )
EX
2
DX
n
n
则随机变量 令 P{ X
2
n
Z X ~ N (0,1)
2
n
z } 1
2
2
z
2
编辑课件
2
z
2
7
令
X
P{
2
z } 1
2
n
2
2
P{z 2
X 2
z 2} 1
z
z
n
2
2
P{
n
z 2 X
n
z 2} 1
P{X
n
z 2
X
n
z 2} 1
这就是说随机区间
[X
n
z 2 ,
X
n
z 2 ]
它以1-α的概率包含总体 X的数学期望μ。
由定义可知,此区间即为μ的编置辑课信件 区间。
8
这就是说随机区间
2
2
[ X n z 2 , X n z 2 ]
z
z
2
的范围与所能承受的平均张力。 0.05
解 本题是在σ2未知的条件下求正态总体参数μ的
置信区间。由公式知μ的置信区间为
[X
S n t 2 (n 1)]
x 6720 s2 282 查表 t0.05 (8) t0.025(8) 2.306
则所求μ的置信区间为
2
[6720
28
2.306]
即 [6650.9 , 6889.1]
第四节
第七章
置信区间的概念
一、置信区间的概念 二 、数学期望的置信区间 三 、方差的置信区间
编辑课件
1
一、置信区间的概念
前面,我们讨论了参数点估计. 它是用样本算得的
一个值去估计未知参数. 但是点估计值仅仅是未知参数
的一个近似值,它没有反映出这个近似值的误差范围,
使用起来把握不大. 范围通常用区间的形式给出的。
这种形式的估计称为区间估计.
也就是说,我们希望确定一个区间,使我们能以比
较高的可靠程度相信它包含真参数值.
这里所说的“可靠程度”是用概率来度量的,
称为置信概率,置信度或置信水平.
习惯上把置信水平记作 1 ,这里是一个很小
的正数,称为显著水平。 编辑课件
2
定义7.6 若由总体X的样本 X1,X2,…Xn 确定的
4
编辑课件
10
(x 0.49, x 0.49) 确定一个区间。
在这么多的区间内包含μ的占0.95, 不包含μ的占0.05。
本题中 (4.71, 5.69),属于那些包含μ的区间的可信
程度为0.95. 或“该区间包含μ”这一事实的可信程度 为0.95.
注: μ的置信水平1-α的置信区间不唯一。
编辑课件
μ的置信区间。 0.05 解 本题是在σ2未知的条件下求正态总体参数μ的
置信区间。选取统计量为 T X ~ t(n 1)
S2
n
由公式知μ的置信区间为 [ X
查表 t0.05 (39) t0.025(39) 2.0227
S n
t
2 (n 1)]
则所求μ2的置信区间为 [96.05 , 113.95]
编辑课件
4
置信水平的大小是根据实际需要选定的.
例如,通常可取显著水平 0.025, 0.等05., 0.1,
即取置信水平 1 0或.9705.95,0.9 等.
根据一个实际样本,由给定的置信水平,我们求出
一个尽可能小的区间 ,使 [1,2 ]
P{1 2} 1
由于正态随机变量广泛存在,特别是很多产品的
0.9. 对于 1- α不同的值,可以得到不同的置信区间。
编辑课件
15
可见,对参数作区间估计, 就是要设法找出两个
只依赖于样本的界限(构造统计量) (ˆ1 ˆ2 )
ˆ1 ˆ1( X1, X 2 , X n ) ˆ2 ˆ2 ( X1, X 2 , X n )
一旦有了样本,就把 估计在区间 [ˆ1,内ˆ2 .]
12.6,13.4,12.8,13.2,
求参数μ的置信度为0.95的置信区间.
解
μ的置信区间为
[X
z
2
0 ,
n
X
z
2
0 ]
n
有 1-α= 0.95,σ0= 0.3,n = 4,
代入样本值算得 x 13, z z0.025 1.96
[13 1.96 0.3 , 13 1.96 0.3] 2
2
0.01
[X
S n
t
2
(n
1)]
则所求μ的2 置信区间为 [1259 编辑2课4件.58 , 1259 24.58] 21
例6 为了估计一批钢索所能承受的平均张力(单位
kg/cm2), 随机选取了9个样本作试验,由试验所得数据得
x 6720 s2 282 设钢索所能承受的张力X, X ~ N (, 2) 分别估计这批钢索所能承受的平均张力
[1,2 ] 为常数区间。
编辑课件
3
定义7.7 设 是总体X的 一个未知参数,
若存在随机区间 [1,2 ], 对于给定的 0 1,
若满足 P{1 2} 1 则称区间 [1,是2 ] 的置信水平(置信度)为 1
的置信区间. 1 和2 分别称为置信下限和置信上限
(双侧置信区间).
1 为置信度, 为显著水平.
2
得到μ的一个区间估计为 [12.706,13.294].
注:该区间不一定包含μ. 编辑课件
13
又如,上例中同样给定 0.05 可以取标准正态分布上
α分位点-z0.04 和 z0.01 ,则又有
0.04
X
P{ z0.04 P{X
n
2 z0.01}
n
z0.01 X
0.95
n z0.04}
编辑课件
18
2、未知σ2时,μ的置信区间
当总体X的方差未知时,容易想到用样本方差Ѕ 2代替σ2。
已知 T X ~ t(n 1)
S2
n X 则对给定的α,令 P{ S 2
n
t (n 1)} 1
2
查t 分布表,可得 t (n 1) 的值。
P{X
S n
t
2 (n
2
1)
X
S n
t
2
(n
1)}
2
它的概率分布,则问题可以迎刃而解了。
S 2 的概率分布是难以计算的,而
2
p y
2
(n 1)S 2
2
~
2 (n 1)
2
2
对于给定的 (0 1).
P{12 2
(n 1)
ຫໍສະໝຸດ Baidu
(n 1)S 2
2
2
2
(n 1)} 1编辑课件
2 1 2
(n 1)
2
(n
1)
2
x
23
即 py
2
2
12 (n1) 2
两个统计量
1 1( X1, X 2 ,, X n ),
2 2 (X1, X 2,, X n )
(1 2 )
则称 [1,2 ] 为随机区间。
随机区间与常数区间 (a, b) 不同,其长度与在数轴上
的位置与样本 X1, X 2 ,, X n 有关。
当一旦获得样本值 x1 , x2 , xn 那么, 1(x1, x2 , xn ), 2 (x1, x2 , xn ) 都是常数。
以1 的概率包含未知方2 差σ2,这就2 是σ2的置信度为
1-α的置信区间。
编辑课件
24
例1 某自动车床加工零件,抽查16个测得长度(毫米)
12.15 12.12 12.01 12.08 12.09 12.16 12.03 12.01
短。
14
置信区间短表示估计的精度高,第一个区间为优
(单峰对称的)。可见,像 N(0,1)分布那样概率密度
的图形是单峰且对称的情况。当n固定时以[ X
n
z
2]
的区间长度为最短,我们一般选择它。
若以L为区间长度,则
L
2
n
z
2
可见L随 n 的增大而减少(α 给定时),
有时我们嫌置信度0.95偏低或偏高,也可采用0.99或
这里有两个要求:
1. 要求 很大的可能被包含在区间 [ˆ内1,,ˆ2 ]
就是说,概率 P{ˆ1 ˆ2} 要尽可能大.
即要求估计尽量可靠.
2. 估计的精度要尽可能的高.如要求区间长度 ˆ2 ˆ1
尽可能短,或能体现该要求的其它准则.
可靠度与精度是一对矛盾, 一般是在保证可靠度的
条件下尽可能提高精度. 编辑课件
2
它以1-α的概率包含总体X的数学期望μ。
由定义可知,此区间即为μ的置信区间。
其置信度为 1-α。
置信下限
X
n z 2
置信上限
X n z 2
置信区间也可简记为
[X
z n 编辑课件
2]
9
[X
n
z 2 ,
X
n
z 2 ]
若取 0.05 1 0.95 1 n 16
查表得 z z0.025 1.96
指标服从正态分布,我们重点研究一个正态总体情形
数学期望和方差 2的区间估计。
编辑课件
5
设 X1, X 2 ,, X n 为总体 X ~ N (, 2) 的样本,
X , S 2 分别是样本均值和样本方差。 对于任意给定的α,我们的任务是通过样本寻找一
个区间,它以1-α的概率包含总体X的数学期望μ。
编辑课件