6.4 正态总体的置信区间()
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
给定置信度1-,
X1 , X 2 ,..., X n1 是来自于第一个总体的 样本;
Y1 ,Y2 ,...,Yn2 是来自于第二个总体的 样本;
两个样本相互独立, X , Y 分别为样本均值,
2 S 12 , S 2 分别为样本方差 .
1.两个总体均值差 1-2 的置信区间 (1) 12、22均为已知 2 X ~ N ( 1 , 1 ), n1
X , S 2 分别是样本均值和样本方差
1.均值的置信区间 (1) 2为已知, 的置信度为1- 的置信区间为
(X
(2) 2未知, 的置信度为1- 的置信区间为
S (X t 2 ( n 1)) n
n
u )
2
(2) 2为未知
n 1 2 ( X X ) 用样本方差 S 2 来代替2 i n 1 i 1
1 2的置信水平为1 的置信区间为
1 1 X Y t 2 ( n1 n2 2) S w n n 1 2
2、两个总体方差比 12 22 的置信区间
总体均值1,2未知
2 S S12 S2 ~ F ( n1 1, n2 1) ~ F ( n1 1, n2 1) 2 2 S 1 2 2 1 2 2 2 1 2 2
比较甲乙两厂生产某种药物的治疗效果──把两个 厂的药效分别看成服从正态分布的两个总体 N(1,12)和 N(2,22). 于是,评价两厂生产的药物的差异,就归结为研究
对应的两个正态总体的均值之差1-2的问题.
下面讨论如何构造两个正态总体均值之差1-2的
区间估计.
2 两个正态总体 N ( 1 , 12 ), N ( 2 , 2 )
3560 3320 2880 2600 3400 2540 (1)以0.95的置信度估计新生男婴儿的平均体重。 (2)以0.95的置信度对新生男婴儿体重的方差进行区 间估计。
解(1) 1- =0.95
/2=0.025
n-1=11
t0.025(11)=2.201
x 3057
/2=0.025
2 1- 2
s=6.2022
2 (15) 27.488 (15) 6.262 2
则方差2的置信度为1- 的置信区间为
( n 1) S 2 ( n 1) S 2 ( , ) 2 2
总体标准差的置信区间为(4.58,9.60)
2
1
2
思 考 假定出生婴儿(男孩)的体重服从正态分布,随机地 抽取12名新生婴儿,测其体重为 3100 2520 3000 3000 3600 3160
例2 某旅行社随机访问了25名旅游者, 得知平均消 费额 x 80 元, 子样标准差 s 12 元, 已知旅游者 消费额服从正态分布, 求旅游者平均消费 的95% 的置信区间. 解 对于给定的置信度
95%( 0.05), t / 2 ( n 1) t0.025 ( 24) 2.0639, 将 x 80, s 12, n 25, t0.025 ( 24) 2.0639, 代入计算得 的置信度为95%的置信区间为(75.05, 2 84.95), 即在 未知情况下, 估计每个旅游者的平
求得12,22使得
2 2 P{ } 1 , P{ 2 } 2 2 2 2 1
2 2 一般取 12 12- , 2 2
2
2 2 2 从而 P{ 1 } 1 2 2 2 ( n 1) S 2 将 代入 2
P{ X
n
u 2 } 1
P{ X u X u } n 2 n 2 1
则的一个置信度为1- 的 置信区间为
(X u , X u ) n 2 n 2
常写为( X
n
u )
2
标准正态分布具有对称性, 利用双侧分位数来 说明: 计算未知参数的置信度为 1 的置信区间, 其区 间长度在的有这类区间中是最短的.
2 Y ~ N ( 2 , 2 ), n2
所以
2 2 N ( 1 2 , 1 2 ) n1 n2
X Y ~
则
( X Y ) ( 1 2 )
2 1
n1
2 2
~ N ( 0,1)
12 22 ) n1 n2
n2
2
1 2的一个置信度 (X Y z 为1 的置信区间为
统计量
Z X
X ~ t ( n 1) 2 S S n n
服从自由度为n-1的t分布
X P{ t 2 ( n 1) t 2 ( n 1)} 1 S n
X P{ t 2 ( n 1) t 2 ( n 1)} 1 S n S S 即P{ X t 2 ( n 1) X t 2 ( n 1)} 1 n n S 则的置信度为1- 的置信区间为 ( X t 2 ( n 1)) n
注意
(1) 区间长度
L2
n
u
2
当给定时,置信区间的长度与n有关.
当然希望区间长度越短越好,但区间长度短,n必 须大,即需耗费代价高,故在实际问题中,要具体 分析,适当掌握,不能走极端。 (2) 置信度为1- 的置信区间并不唯一。 结论 若概率密度函数的图形是单峰且对称, 当n固定时,取两端对称的区间,其长 度为最短。
以 95% 的置信度认为每个旅游者的平均消费额在 77.6元至82.4元之间.
自己动手
已知幼儿身高服从正态分布,现从5~6岁的幼儿中 随机地抽查了9人,其高度分别为: 115,120,131,115,109,115,115,105,110cm; 假设标准差 0 7,置信度为95%;
试求总体均值的置信区间。
解(1)
1- =0.95
/2=0.025
n-1=15
s=6.2022
t0.025(15)=2.1315
x 503 .75
2未知, 的置信度为1- 的置信区间为
S (X t 2 ( n 1)) n
则 的置信度为0.95的置信区间为(500.4,507.1). (2) 1- =0.95 /2=0.025 n-1=15
第四节
正态总体的置信区间
一.单正态总体 N(,2) 的情况 二.双正态总体的情况(略) 三.小结
正态总体参数的置信区间是最完 与其它总体相比, 善的,应用也最广泛. 在构造正态总体参数的置信
2 区间的过程中, t 分布、 分布、F 分布以及标准
正态分布 N (0,1) 扮演了重要角色. 本节介绍正态总体的置信区间,讨论下列情形: (1) 单正态总体均值(方差已知)的置信区间; (2) 单正态总体均值(方差未知)的置信区间;
得 P{ 12 2
P{ ( n 1) S 2
( n 1) S 2
2
2
22 } 1
2 1 2
( n 1) S 2
2
2
} 1
则方差2的置信度为1- 的置信区间为
( n 1) S 2 ( n 1) S 2 ( , ) 2 2
查正态分布表得临界值u 2 1.96,由此得置信区间:
(115 1.96 7 / 9 , 115 1.96 7 / 9 ) (110.43 , 119.57 )
解:已知 0 7, n 9, 0.05. 由样本值算得: 1 x (115 120 110) 115. 9
注意
(X
如果X服从任意分布,只要n充分大,仍可用
n
u ) 作为总体均值的置信区间 2
这是 因为由中心极限定理可知,无论X服从什么分布, 当 n充分大时,随机变量
U
X
n
近似服从标准正态分布。
2.单正态总体均值的置信区间(2)
给定置信度1-, X1, X2,…, Xn是来自N(,2)的样本,
例1 某旅行社为调查当地旅游才的平均消费额, 随 机访问了100名旅游者, 得知平均消费额 x 80 元. 根据经验, 已知旅游者消费服从正态分布, 且标准 差 12 元, 求该旅游者平均消费额 的置信度 为95%置信区间. 解 对于给定的置信度
1 0.95, 0.05, / 2 0.025, 查标准正态分布表 u0.025 1.96, 将数据 n 100, x 80, 12, u0.025 1.96, 代入 x u / 2 计算得 的置信度为95%的置 n 信区间为 (77.6,82.4), 即在已知 12 情形下, 可
寻找未知参数的 ,是求什么参数的置信区间 ? 解: 明确问题 选 的点估计为 X 置信水平是多少? 一个良好估计.
1.单正态总体均值的置信区间(1)
X 取 U n
寻找一个待估参数和 估计量的函数 ,要求 其分布为已知.
2 1 n X X i ~ N (, ), n ~N(0, 1) n i 1
2
1
2
例3. 有一大批糖果,从中随机地取16袋,称得重 量(以克计)如下:
506 508 499 503 504 510 497 512
514 505 493 496 506 502 509 496 设袋装糖果得重量近似地服从正态分布,求 (1)正态总体均值的置信度为0.95的置信区间。 (2)总体标准差的置信度为0.95的置信区间。
s=375.3
则 的置信度为0.95的置信区间为(2818,3295). (2) 1- =0.95
n-1=11
(n-1)S2=1549467
查表得
2 1-
2
(11) 21.9
2 (11) 3.82 2
1549467 2 1549467 所以 21.9 3.82
总体方差2的置信区间为(70752,405620)。
(3) 单正态总体方差的置信区间; (4) 双正态总体均值差(方差已知)的置信区间; (5) 双正态总体均值差(方差未知但相等)的置信区间.
(6) 双正态总体方差比的置信区间.
一.单正态总体 N(,2) 的情况
设总体X~N(,2), 2已知,未知,设X1, X2,…, Xn是 来自X的样本,求的置信度为1- 的置信区间。
2 2 ( b) 1 2 2均为未知
X Y ( 1 2 ) ( n1 1) S ( n2 1) S n1 n2 2
2 1 2 2
1 1 n1 n2
~ t n1 n2 2
2 2 ( n 1 ) S ( n 1 ) S 2 2 1 2 2 Sw 1 , Sw Sw n1 n2 2
二.两个正态总体的情况
在实际应用中经常会遇到两个正态总体的区间估
计问题.例如:考察一项新技术对提高产品的某项质
量指标的作用──把实施新技术前产品的质量指标
看成一个正态Biblioteka Baidu体 N(1,12),而把实施新技术后产
品质量指标看成另一个正态总体N(2,22).
于是,评价此新技术的效果问题,就归结为研究两 个正态总体均值之差1-2的问题.
均消费额在75.05元至84.95元之间,这个估计的可靠 度是95%.
3.单正态总体方差的置信区间
给定置信度1-, X1, X2,…, Xn是来自N(,2)的样本,
S 是样本方差
若未知, 利用样本方差构造统计量
2
2
( n 1) S 2
2
~ ( n 1)
2
给定 ,
先查2分布的临界表
有了分布,就可以求出 U取值于任意区间的概率.
对于给定的置信水平(大概率),根据U的分布, 确定一个区间, 使得U取值于该区间的概率为 置信水平.
对给定的置信水平
1,
2
查标准正态分布表得 u 使
,
从中解得
X P {| | u 2 } 1 n
n u 2 X