正态总体的置信区间
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
于是,评价此新技术的效果问题,就归结为研究两 个正态总体均值之差1-2的问题.
比较甲乙两厂生产某种药物的治疗效果──把两个 厂的药效分别看成服从正态分布的两个总体
N(1,12)和 N(2,22). 于是,评价两厂生产的药物的差异,就归结为研究
对应的两个正态总体的均值之差1-2的问题. 下面讨论如何构造两个正态总体均值之差1-2的
区间估计.
两个正N 态 (1,总 12)N , 体 (2,2 2)
给定置信度1-,
X1,X2,...X, n1是来自于第一个样 总本 体; 的
Y1,Y2,...Y, n2是来自于第二个总 样体 本的 ;
两个样本相互独立, X ,Y分别为样本均值,
S
2
1
,
S22分别为样本方差.
1.两个总体均值差 1-2 的置信区间
对给定的置信水平 1 ,
查标准正态分布表得u 2 ,
使
P{|
X
n
|
u
2}
1
从中解得
P{ X
n
u
2
X
n
u
2} 1
P{X
1
n u 2
X
n u 2 }
则的一个置信度为1- 的 置信区间为
(X
n
u , 2
X
n u 2 )
常写为( X
n u 2 )
说明:标准正态分布具有对称性,利用双侧分位数来
计算未知参数的置信度为1的置信区间,其区
例1 某旅行社为调查当地旅游才的平均消费额, 随
机访问了100名旅游者, 得知平均消费额 x80元.
根据经验, 已知旅游者消费服从正态分布, 且标准
差 12元, 求该旅游者平均消费额 的置信度
为95%置信区间.
解 对于给定的置信度
10.9,50.0,5 /20.02, 5
查标准正态分布表 u0.02 51.9,6将数据
所以 15494672 1549467
21.9
3.82
总体方差2的置信区间为(70752,405620)。
二.两个正态总体的情况
在实际应用中经常会遇到两个正态总体的区间估 计问题.例如:考察一项新技术对提高产品的某项质 量指标的作用──把实施新技术前产品的质量指标 看成一个正态总体 N(1,12),而把实施新技术后产 品质量指标看成另一个正态总体N(2,22).
(1) 12、22均为已知
YX~~NN((12,,1222nn12)),,
所以
X Y ~
N
(1
2
,
2 1
n1
2 2
n2
)
则 ( X Y ) (1 2 ) ~ N (0,1)
2 1
2 2
n1 n2
1 2的一个置信度( X 为1的置信区间为
Y
z 2
2 1
2 2
)
n1 n2
(b) 12222均为未知
P{t (n 1) 2
X
S
t (n 1)} 1 2
n
P{t2(n1)X St2(n1)}1
n
即 P {X St(n 1 ) X St(n 1 ) } 1
n2
n2
பைடு நூலகம்
则的置信度为1- 的置信区间为 ( X S t (n 1)) n2
例2 某旅行社随机访问了25名旅游者, 得知平均消
1.均值的置信区间
(1) 2为已知, 的置信度为1- 的置信区间为
( X n u 2 )
(2) 2未知, 的置信度为1- 的置信区间为
S ( X t (n 1))
n2
(2) 2为未知
用样本方差 S2n11in1(Xi X)2来代替2
统计量
X X
Z
S2
S
~ t(n 1)
n
n
服从自由度为n-1的t分布
S ( X t (n 1))
n2
则 的置信度为0.95的置信区间为(500.4,507.1).
(2) 1- =0.95 /2=0.025 n-1=15 s=6.2022
12-2(15)27.488
2 (15)6.262 2
则方差2的置信度为1- 的置信区间为
(n 1)S 2 (n 1)S 2
(
2
2
,
2 1 2
)
总体标准差的置信区间为(4.58,9.60)
思 考 假定出生婴儿(男孩)的体重服从正态分布,随机地 抽取12名新生婴儿,测其体重为
3100 2520 3000 3000 3600 3160
3560 3320 2880 2600 3400 2540 (1)以0.95的置信度估计新生男婴儿的平均体重。 (2)以0.95的置信度对新生男婴儿体重的方差进行区 间估计。
费额 x80元, 子样标准差 s12元, 已知旅游者
消费额服从正态分布, 求旅游者平均消费 的95%
的置信区间. 解 对于给定的置信度
9% 5 0 (.0)5 ,t/2 (n 1 ) t0 .0( 2 2 5 ) 4 2 .06 , 3
将 x80, s12, n25, t0.02(2 5 )42.06,39
注意
如果X服从任意分布,只要n充分大,仍可用
( X n u 2 )作为总体均值的置信区间
这是 因为由中心极限定理可知,无论X服从什么分布,
当 n充分大时,随机变量
U
X
n
近似服从标准正态分布。
2.单正态总体均值的置信区间(2)
给定置信度1-, X1, X2,…, Xn是来自N(,2)的样本,
X , S 2 分别是样本均值和样本方差
2
(n1)S2
2
~
2(n 1)
给定 ,
先查2分布的临界表
求得12,22使得
P {2 1 2 } 1 2 ,P {2 2 2 } 2
一般 1 2取 1 2 -2, 2 2 22
从而 P {1 2 22 22}1
将2
(n1)S2
2
代入
得 P {1 2 2(n1 2 )S2 22}1
代入计算得 的置信度为95%的置信区间为(75.05,
84.95),即在 2 未知情况下, 估计每个旅游者的平
均消费额在75.05元至84.95元之间,这个估计的可靠
度是95%.
3.单正态总体方差的置信区间
给定置信度1-, X1, X2,…, Xn是来自N(,2)的样本,
S 2是样本方差
若未知, 利用样本方差构造统计量
假设 标 07, 准置 差9 信 % 5; 度为
试求总体 的 均置 值信区间。
解: 0已 7,n知 9,0.0.5由样本值
x1(11 1 52 011 )0 11 . 5
查正态 9 分布 u2表 1.9得 , 6 临 由界 此值 得置
( 1 1 1 .9 5 7 6 /9 ,1 1 1 .9 5 7 6 /9 ) ( 1.4 1 ,1 3 0 .5 1 )7 9
解(1) 1- =0.95 /2=0.025 n-1=11
t0.025(11)=2.201 x3057 s=375.3
则 的置信度为0.95的置信区间为(2818,3295).
(2) 1- =0.95 /2=0.025 n-1=11
(n-1)S2=1549467
查表得 12-2(11)21.9
2 (11)3.82 2
1 n1
1 n2
2、两个总体方差比
2 1
2 2
的置信区间
总体1, 均 2未 值知
S12 S22
2 1
2 2
~ F (n1 1, n2 1)
S12
2 1
S22
2 2
~
F (n1
1, n2
1)
P{F1 2
(n1
1,n2
1)
S12
2 1
S22
2 2
F
2 (n1
1, n2
1)}
1
P{
S12 S22
(2) 单正态总体均值(方差未知)的置信区间; (3) 单正态总体方差的置信区间; (4) 双正态总体均值差(方差已知)的置信区间; (5) 双正态总体均值差(方差未知但相等)的置信区间.
(6) 双正态总体方差比的置信区间.
一.单正态总体 N(,2) 的情况
1.单正态总体均值的置信区间(1)
设总体X~N(,2), 2已知,未知,设X1, X2,…, Xn是 来自X的样本,求的置信度为1- 的置信区间。
n10,0 x80, 12, u0.02 51.9,6
代入
xu/2
n
计算得
的置信度为95%的置
信区间为 (7.7 6,8.2 4),即在已知 12情形下, 可
以 95% 的置信度认为每个旅游者的平均消费额在
77.6元至82.4元之间.
自己动手
已知幼儿身高服从正态分布,现从5~6岁的幼儿中 随机地抽查了9人,其高度分别为: 115,120,131,115,109,115,115,105,110cm;
X Y (1 2 )
(n1 1)S12 (n2 1)S22
1
1
~ tn1 n2 2
n1 n2 2
n1 n2
S w 2(n 1 1 n )1 S 1 2 n 2 (n 2 2 1 )S 2 2,S wS w 2
1 2的置信水平为1 的置信区间为
X Y t 2(n1 n2 2)Sw
第四节 正态总体的置信区间
一.单正态总体 N(,2) 的情况
二.双正态总体的情况(略) 三.小结
与其它总体相比,正态总体参数的置信区间是最完
善的,应用也最广泛. 在构造正态总体参数的置信
区间的过程中, t分布、 2 分布、F分布以及标准 正态分布 N(0,1)扮演了重要角色.
本节介绍正态总体的置信区间,讨论下列情形: (1) 单正态总体均值(方差已知)的置信区间;
P{(n 1 22 )S22(n1 2 1 )2S2}1
则方差2的置信度为1- 的置信区间为
(n 1)S 2 (n 1)S 2
(
2
2
,
2 1 2
)
例3. 有一大批糖果,从中随机地取16袋,称得重 量(以克计)如下:
506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496
间长度在的有这类区间中是最短的.
注意
(1) 区间长度 L 2 nu2
当给定时,置信区间的长度与n有关.
当然希望区间长度越短越好,但区间长度短,n必
须大,即需耗费代价高,故在实际问题中,要具体
分析,适当掌握,不能走极端。
(2) 置信度为1- 的置信区间并不唯一。
结论
若概率密度函数的图形是单峰且对称, 当n固定时,取两端对称的区间,其长 度为最短。
三、小结
解: 明选确问的题点,置是信估求水计什平为么是参多数X少的?置信一区寻个间找良?未好知估参计数.的
取
U
X
n
~N(0,
1)X
1 n
n
i 1
Xi
~
N(,2
n),
寻找一个待估参数和 估计量的函数 ,要求 其分布为已知.
有了分布,就可以求出 U取值于任意区间的概率.
对于给定的置信水平(大概率),根据U的分布, 确定一个区间, 使得U取值于该区间的概率为 置信水平.
设袋装糖果得重量近似地服从正态分布,求 (1)正态总体均值的置信度为0.95的置信区间。
(2)总体标准差的置信度为0.95的置信区间。
解(1) 1- =0.95 /2=0.025 n-1=15
t0.025(15)=2.1315 x50.735 s=6.2022
2未知, 的置信度为1- 的置信区间为
F
2 (n1
1 1, n2
1)
2 1
2 2
S12 S22
F
1 }
(n1 1,n2 1)
1
2
1
得到
2 1 2 2
的一个置
信水平为1
的置信区间
S12 S22
F
2 (n1
1 1, n2
, 1)
S12 S22
F1 (n1 2
1
1,n2 1)
说 明
这里,我们主要讨论总体分布为正态的情形. 若样本容量很大,即使总体分布未知,应用中心 极限定理,可得总体的近似分布,于是也可以近 似求得参数的区间估计.
比较甲乙两厂生产某种药物的治疗效果──把两个 厂的药效分别看成服从正态分布的两个总体
N(1,12)和 N(2,22). 于是,评价两厂生产的药物的差异,就归结为研究
对应的两个正态总体的均值之差1-2的问题. 下面讨论如何构造两个正态总体均值之差1-2的
区间估计.
两个正N 态 (1,总 12)N , 体 (2,2 2)
给定置信度1-,
X1,X2,...X, n1是来自于第一个样 总本 体; 的
Y1,Y2,...Y, n2是来自于第二个总 样体 本的 ;
两个样本相互独立, X ,Y分别为样本均值,
S
2
1
,
S22分别为样本方差.
1.两个总体均值差 1-2 的置信区间
对给定的置信水平 1 ,
查标准正态分布表得u 2 ,
使
P{|
X
n
|
u
2}
1
从中解得
P{ X
n
u
2
X
n
u
2} 1
P{X
1
n u 2
X
n u 2 }
则的一个置信度为1- 的 置信区间为
(X
n
u , 2
X
n u 2 )
常写为( X
n u 2 )
说明:标准正态分布具有对称性,利用双侧分位数来
计算未知参数的置信度为1的置信区间,其区
例1 某旅行社为调查当地旅游才的平均消费额, 随
机访问了100名旅游者, 得知平均消费额 x80元.
根据经验, 已知旅游者消费服从正态分布, 且标准
差 12元, 求该旅游者平均消费额 的置信度
为95%置信区间.
解 对于给定的置信度
10.9,50.0,5 /20.02, 5
查标准正态分布表 u0.02 51.9,6将数据
所以 15494672 1549467
21.9
3.82
总体方差2的置信区间为(70752,405620)。
二.两个正态总体的情况
在实际应用中经常会遇到两个正态总体的区间估 计问题.例如:考察一项新技术对提高产品的某项质 量指标的作用──把实施新技术前产品的质量指标 看成一个正态总体 N(1,12),而把实施新技术后产 品质量指标看成另一个正态总体N(2,22).
(1) 12、22均为已知
YX~~NN((12,,1222nn12)),,
所以
X Y ~
N
(1
2
,
2 1
n1
2 2
n2
)
则 ( X Y ) (1 2 ) ~ N (0,1)
2 1
2 2
n1 n2
1 2的一个置信度( X 为1的置信区间为
Y
z 2
2 1
2 2
)
n1 n2
(b) 12222均为未知
P{t (n 1) 2
X
S
t (n 1)} 1 2
n
P{t2(n1)X St2(n1)}1
n
即 P {X St(n 1 ) X St(n 1 ) } 1
n2
n2
பைடு நூலகம்
则的置信度为1- 的置信区间为 ( X S t (n 1)) n2
例2 某旅行社随机访问了25名旅游者, 得知平均消
1.均值的置信区间
(1) 2为已知, 的置信度为1- 的置信区间为
( X n u 2 )
(2) 2未知, 的置信度为1- 的置信区间为
S ( X t (n 1))
n2
(2) 2为未知
用样本方差 S2n11in1(Xi X)2来代替2
统计量
X X
Z
S2
S
~ t(n 1)
n
n
服从自由度为n-1的t分布
S ( X t (n 1))
n2
则 的置信度为0.95的置信区间为(500.4,507.1).
(2) 1- =0.95 /2=0.025 n-1=15 s=6.2022
12-2(15)27.488
2 (15)6.262 2
则方差2的置信度为1- 的置信区间为
(n 1)S 2 (n 1)S 2
(
2
2
,
2 1 2
)
总体标准差的置信区间为(4.58,9.60)
思 考 假定出生婴儿(男孩)的体重服从正态分布,随机地 抽取12名新生婴儿,测其体重为
3100 2520 3000 3000 3600 3160
3560 3320 2880 2600 3400 2540 (1)以0.95的置信度估计新生男婴儿的平均体重。 (2)以0.95的置信度对新生男婴儿体重的方差进行区 间估计。
费额 x80元, 子样标准差 s12元, 已知旅游者
消费额服从正态分布, 求旅游者平均消费 的95%
的置信区间. 解 对于给定的置信度
9% 5 0 (.0)5 ,t/2 (n 1 ) t0 .0( 2 2 5 ) 4 2 .06 , 3
将 x80, s12, n25, t0.02(2 5 )42.06,39
注意
如果X服从任意分布,只要n充分大,仍可用
( X n u 2 )作为总体均值的置信区间
这是 因为由中心极限定理可知,无论X服从什么分布,
当 n充分大时,随机变量
U
X
n
近似服从标准正态分布。
2.单正态总体均值的置信区间(2)
给定置信度1-, X1, X2,…, Xn是来自N(,2)的样本,
X , S 2 分别是样本均值和样本方差
2
(n1)S2
2
~
2(n 1)
给定 ,
先查2分布的临界表
求得12,22使得
P {2 1 2 } 1 2 ,P {2 2 2 } 2
一般 1 2取 1 2 -2, 2 2 22
从而 P {1 2 22 22}1
将2
(n1)S2
2
代入
得 P {1 2 2(n1 2 )S2 22}1
代入计算得 的置信度为95%的置信区间为(75.05,
84.95),即在 2 未知情况下, 估计每个旅游者的平
均消费额在75.05元至84.95元之间,这个估计的可靠
度是95%.
3.单正态总体方差的置信区间
给定置信度1-, X1, X2,…, Xn是来自N(,2)的样本,
S 2是样本方差
若未知, 利用样本方差构造统计量
假设 标 07, 准置 差9 信 % 5; 度为
试求总体 的 均置 值信区间。
解: 0已 7,n知 9,0.0.5由样本值
x1(11 1 52 011 )0 11 . 5
查正态 9 分布 u2表 1.9得 , 6 临 由界 此值 得置
( 1 1 1 .9 5 7 6 /9 ,1 1 1 .9 5 7 6 /9 ) ( 1.4 1 ,1 3 0 .5 1 )7 9
解(1) 1- =0.95 /2=0.025 n-1=11
t0.025(11)=2.201 x3057 s=375.3
则 的置信度为0.95的置信区间为(2818,3295).
(2) 1- =0.95 /2=0.025 n-1=11
(n-1)S2=1549467
查表得 12-2(11)21.9
2 (11)3.82 2
1 n1
1 n2
2、两个总体方差比
2 1
2 2
的置信区间
总体1, 均 2未 值知
S12 S22
2 1
2 2
~ F (n1 1, n2 1)
S12
2 1
S22
2 2
~
F (n1
1, n2
1)
P{F1 2
(n1
1,n2
1)
S12
2 1
S22
2 2
F
2 (n1
1, n2
1)}
1
P{
S12 S22
(2) 单正态总体均值(方差未知)的置信区间; (3) 单正态总体方差的置信区间; (4) 双正态总体均值差(方差已知)的置信区间; (5) 双正态总体均值差(方差未知但相等)的置信区间.
(6) 双正态总体方差比的置信区间.
一.单正态总体 N(,2) 的情况
1.单正态总体均值的置信区间(1)
设总体X~N(,2), 2已知,未知,设X1, X2,…, Xn是 来自X的样本,求的置信度为1- 的置信区间。
n10,0 x80, 12, u0.02 51.9,6
代入
xu/2
n
计算得
的置信度为95%的置
信区间为 (7.7 6,8.2 4),即在已知 12情形下, 可
以 95% 的置信度认为每个旅游者的平均消费额在
77.6元至82.4元之间.
自己动手
已知幼儿身高服从正态分布,现从5~6岁的幼儿中 随机地抽查了9人,其高度分别为: 115,120,131,115,109,115,115,105,110cm;
X Y (1 2 )
(n1 1)S12 (n2 1)S22
1
1
~ tn1 n2 2
n1 n2 2
n1 n2
S w 2(n 1 1 n )1 S 1 2 n 2 (n 2 2 1 )S 2 2,S wS w 2
1 2的置信水平为1 的置信区间为
X Y t 2(n1 n2 2)Sw
第四节 正态总体的置信区间
一.单正态总体 N(,2) 的情况
二.双正态总体的情况(略) 三.小结
与其它总体相比,正态总体参数的置信区间是最完
善的,应用也最广泛. 在构造正态总体参数的置信
区间的过程中, t分布、 2 分布、F分布以及标准 正态分布 N(0,1)扮演了重要角色.
本节介绍正态总体的置信区间,讨论下列情形: (1) 单正态总体均值(方差已知)的置信区间;
P{(n 1 22 )S22(n1 2 1 )2S2}1
则方差2的置信度为1- 的置信区间为
(n 1)S 2 (n 1)S 2
(
2
2
,
2 1 2
)
例3. 有一大批糖果,从中随机地取16袋,称得重 量(以克计)如下:
506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496
间长度在的有这类区间中是最短的.
注意
(1) 区间长度 L 2 nu2
当给定时,置信区间的长度与n有关.
当然希望区间长度越短越好,但区间长度短,n必
须大,即需耗费代价高,故在实际问题中,要具体
分析,适当掌握,不能走极端。
(2) 置信度为1- 的置信区间并不唯一。
结论
若概率密度函数的图形是单峰且对称, 当n固定时,取两端对称的区间,其长 度为最短。
三、小结
解: 明选确问的题点,置是信估求水计什平为么是参多数X少的?置信一区寻个间找良?未好知估参计数.的
取
U
X
n
~N(0,
1)X
1 n
n
i 1
Xi
~
N(,2
n),
寻找一个待估参数和 估计量的函数 ,要求 其分布为已知.
有了分布,就可以求出 U取值于任意区间的概率.
对于给定的置信水平(大概率),根据U的分布, 确定一个区间, 使得U取值于该区间的概率为 置信水平.
设袋装糖果得重量近似地服从正态分布,求 (1)正态总体均值的置信度为0.95的置信区间。
(2)总体标准差的置信度为0.95的置信区间。
解(1) 1- =0.95 /2=0.025 n-1=15
t0.025(15)=2.1315 x50.735 s=6.2022
2未知, 的置信度为1- 的置信区间为
F
2 (n1
1 1, n2
1)
2 1
2 2
S12 S22
F
1 }
(n1 1,n2 1)
1
2
1
得到
2 1 2 2
的一个置
信水平为1
的置信区间
S12 S22
F
2 (n1
1 1, n2
, 1)
S12 S22
F1 (n1 2
1
1,n2 1)
说 明
这里,我们主要讨论总体分布为正态的情形. 若样本容量很大,即使总体分布未知,应用中心 极限定理,可得总体的近似分布,于是也可以近 似求得参数的区间估计.