区间估计和误差计算
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(二)区间估计
区间估计是指用样本指标、抽样误差和概率所构造的区间以估计总体指标存在的可能范围。
在进行区间估计的时候,根据所给定的条件不同,总体平均数和总体成数的估计有两条模式可供选择: 第一套:给定置信度要求,去推算抽样误差的可能范围。
第二套:根据已给定的抽样误差范围,求出概率保证程度。
1. 总体平均数的区间估计
按照第一套模式,根据置信度F t ()的要求,估计极限抽样误差的可能范围)(∆∆∆或p x ,并指出估计区间(置信区间)。具体步骤是:
(1)抽取样本,并根据调查所得的样本单位标志值,计算样本平均数x ;计算样本标准差;在大样本下用以代替总体标准差推算抽样平均误差μ。
(2)根据给定的置信度F t ()的要求,查《正态分布概率表》,求得概率度t 值。
(3)根据概率度t 和抽样平均误差μx 计算极限抽样误差的可能范围μx
x t =∆,并据以计算置信区间的上下限。
例14 麦当劳餐馆在7周内抽查49位顾客的消
费额(元)如下,求在概率95%的保证下,顾客平均消费额的置信区间。
15 24 38 26 30 42 18
30 25 26 34 44 20 35
24 26 34 48 18 28 46
19 30 36 42 24 32 45
36 21 47 26 28 31 42
45 36 24 28 27 32 36
47 35 22 24 32 46 26
第一步:根据样本计算样本平均数和标准差:
x x n ==∑32 (元) S n x x ==-∑2
945().(元),用样本标准差代替总体
标准差σ=945.(元) 样本平均误差 x n μσ
===94549135..(元)
第二步:根据给定的置信度F t ()=95%,查概率表得t =196. 第三步:根据概率度t 和抽样平均误差推算抽样极限误差的可能范围。
65.235.196.1=⨯==∆μx
x t (元) 将μx
x ,的值代入区间估计公式 )(65.34)(35.2965
.23265.232元元≤≤+≤≤-+≤≤-∆∆X X x X x x
x
计算结果表明,以95%的概率保证,麦当劳餐馆顾客消费额在29.35~34.65元之间。
例15 某高校有5 000名学生,随机抽取250名调查每周收看电视的时间,分组资料见表4—7。 试按不重置抽样方法,以95.45%的概率推断该校全部学生每周收看电视时间的可能范围。
表4—7
巳知:N=5 000, n=250, 由F t ().=9545%查
表得t =2
首先,计算样本指标
样本平均数 xf n
==⨯+⨯+⨯+⨯+⨯==∑12235659276092025012502505()小时
样本方差
222222215355575952256926020250S x x n
==⨯+⨯+⨯+⨯+⨯------()()()()()()
=11362504544=.
由于不知道总体方差,所以用样本方差代替总体方差。
样本平均误差 x n n N μσ=-=-=2
1454425012505000013().().()小时
第二步:计算极限抽样误差
x x
t ∆=⋅=⨯=μ2013026..()小时 第三步:确定置信区间
5-0.26≤≤+X 5026.
4.74≤≤526
. 计算结果表明, 全部学生每周平均看电视的时间在4.74—5.26小时之间。
例16 某保险公司从投保人中随机抽取36人,计算出此36人的平均年龄x =395.岁,巳知投保人年龄分布近似正态分布,标准差为7.2岁,试求所有投保人平均年龄99%的置信区间。 解 已知 x =395.岁 σ=72. n =36
根据置信度F t t ().==99%,258查正态分布概率表得
计
算极限抽样误差 t n ∆=⋅=⨯=⨯=2
2258362581443097.2σ....(岁)
总体的置信区间为 x X x x x -≤≤+∆∆
395309
395309....-≤≤+X 36414259..≤≤X 计算结果表明:以99%的把握度保证,投保人年龄在36.41~42.59岁之间。
例17 某研究机构进行了一项调查来估计吸烟者一月花在抽烟上的平均支出,该机构随机抽取了容量为200的样本进行调查,得到样本平均数为110元,样本标准差为30元,试以95%的把握度估计全部吸烟者月均烟钱支出的置信区间。
解 巳知=110, S =30, n =〉20030; F t ().=096查概率分布表得t =206.
由于不知道总体方差,所以用样本方差代替。计算极限抽样误差:
x t S n ∆=⋅=⨯=20630200
437..(元) 置信区间: ∆∆+≤≤-x x
x X x
110—4.37≤≤+X 110437.
1056311437..≤≤X 结论,我们有95%的把握认为吸烟者月均烟钱支出在105.63~114.37元之间。
例18 某年某地区抽查了400户农民家庭年人均穿衣的消费支出,得到平均值为220元,标准差为86元,试以95%的置信水平估计该地区农民家庭年人均穿衣的消费支出。
解 因为 n=400是大样本,则有 t =196. ,极限抽样误差为
)(42.840086
96.1元=⨯=⋅=∆n t x σ
置信区间: 220—8.4222042.8+≤≤X
211.58元元42.228≤≤X
结论,我们有95%的把握认为该地区农民家庭年人均穿衣的消费支出,在3211.58元至228.42元之间。
此例可以看出,样本容量越大,样本平均数越