统计学例题-抽样估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例:(不重复抽样的情况)
某高校为了了解0.8万名学生英语四级考试的 平均成绩和通过率情况,根据以往的经验,平 均成绩的标准差在150分~200分之间,通过率 在40 %~60 %之间。现用不重复抽样的方法, 要求在95 %(t =1.96)的可靠性程度保证下 ,平均分数的误差范围不超过25分,通过率的 误差范围不超过5 %,求样本必要容量。
对某型号的电子元件进行耐用性能检查, 抽查100件,测得平均耐用时数为1055.5小 时,标准差为52.2小时,要求耐用时数的 允许误差范围为10.5小时( x 10.5 ),试 估计该批电子元件耐用时数区间范围及不 超过允许误差范围的可靠程度。
计算:
总体平均耐用时间的
上 限 x x 1055.5 10.5 1066小 时 下 限 x x 1055.5 10.5 1045小 时 t x 10.5 2
1.962 0.92 0.0813752 13752 0.0472 1.962 0.92 0.08
127
取两者之中较大者,即169个。
简单随机抽样平均误差计算
例1:平均数的抽样平均误差
根据抽样调查方案,从某地区10 000户居民中抽 取100户进行调查,得知:100户居民的月均收入 2500元,标准差为300元,试求居民月平均收入 的抽样平均误差。
例1:切比雪夫定理
对1154个成年人进行调查显示,每人每天平均 睡眠6.9小时。假定标准差为1.2小时,试问:
1、睡眠时间4.5~9.3小时之间的人数百分比? 2、睡眠时间3.9~9.9小时之间的人数百分比? 3、假定是正态分布,则睡眠时间4.5~9.3小时之间
的人数百分比又是多少?
例2:正态分布
平均学位获得率:
p
pf f
42 0.9048 66 0.9545 93.52% 108
s
2 p
p(1
f
p) f
0.9048 0.0952 42 0.9545 0.0455 66 0.06 108
计算:
μp
S
2 p
1
n
n N
试以90%(t =1.64)的概率对该批零件的合格率 进行区间估计。
零件质量统计表:
直径(cm)
假设IQ分数具有正态分布,其平均数为100,标 准差为15。试问:
1、IQ分数在85~115之间的人士占多大百分比? 2、IQ分数在70~130之间的人士占多大百分比? 3、IQ分数超过130之间的人士占多大百分比? 4、IQ分数超过145的人被视为天才。你认为这样
的说法是否合理? 5、思考一下: 85~130之间的人士占多大百分比?
计算:
重复抽样时:
μp
P(1 P) n
p(1 p) n
0.98 0.02 1.0%或0.01 200
不重复抽样时:
μp
P(1 P) N n n N 1
p(1 p) 1 n n N
0.98 0.02 (1 200 ) 0.98%
以95%的概率保证程度(t =1.96),对该城市居 民每年的家庭旅游支出进行区间估计。
统计表:
行政区
东城区 西城区 南城区 北城区 合计
家庭数 (家)
320 680 200 400
1600
平均支出 (万元)
1.2 2.0 0.8 1.5
-
标准差 (万元)
0.05 0.08 0.04 0.06
例:成数的区间估计
某高校对男女毕业生分别抽取6%的学生进行调 查,统计结果如下表所示:
按性别 分组
男生 女生
样本人数 (人) f
42 66
学位获得率% p
90.48 95.45
合计
108
-
要求:以90%(t = 1. 64)的可靠性程度,对该 高校毕业生的平均学位获得率进行区间估计。
计算:
计算:
原则: 取最大者。
先要确定标准差:
平均成绩的标准差取:200分(取大者)
通过率取:P = 50%
当P = 0.5时, P(1-P)最大。
nx
t 2σ2N N2x t 2σ 2
1.962 2002 8000 8000 252 1.962 2002
244
计算:
np
t 2P(1 P)N N2p t 2 P(1 P)
1.962 0.5 0.5 8000 8000 0.052 1.962 0.5
0.5
367
取两者之中较大者,即367人。
例:(不重复抽样的情况)
某机械加工厂对一批零件进行抽检,零件 数量为13752个,根据历史资料,这种零 件标准长度的标准差在12~20(mm)之间 ,一等品率在92%~96%之间。用不重复 抽样的方法,要求在95 %(t =1.96)的可 靠性程度保证下,零件标准长度的误差范 围不超过3(mm)一等品率的误差范围不 超过4.7 %,求样本必要容量。
试对该批零件的合格率进行点估计。
零件质量统计表:
直径(cm)
9.97—9.98 9.98—9.99 9.99—1.00 1.00—10.01 10.01—10.02 10.02—10.03
合计
零件数(件)
2 26 64 42 31 1 165
备注
不合格 合格 合格 合格 合格
不合格
-
计算:
样本合格率:
例3:用五数概括法进行数据汇总
对轿车保险索赔系数进行评分,平均分为100分, 评分越低意味着越好,越安全。下面是两种车型的 评分数据。
中型轿车:81 91 93 127 68 60 51 58 75 100 103 119 82 128 76 68 81 91 82
小型轿车:73 100 127 100 124 103 119 108 109 113 108 118 103 120 102 122 96 133 80 140
0.00430
计算:
不重复抽样的平均误差:
μx
S 2 1 n n N
0.00432 (1 3%) 0.0016 1600
置信度为95%的区间估计:
x t μx 1.96 0.0016 0.0031
即: 1.565± 0.0031万元
r 1
抽样平均误差:
抽样平均误差:
μx
δx 2 R r r R1
11.78 144010 1.08(2 公斤) 10 14401
μp
δp2 R r r R1
0.00476 1440 10 2.17% 10 14401
0.06 (1 6% ) 2.29% 108
来自百度文库
p t μp 1.64 2.29% 3.76%
上 限 p p 93.52% 3.76% 97.28% 下 限 p p 93.52% 3.76% 89.76%
例1:根据给定的抽样极限误差求概率 保证程度
均合格率进行区间估计。
水泥生产情况表:
样本编号
1 2 3 4 5 6 7 8 9 10
合计
各群每袋平均重量 x 一 等品率 p(%)
98
75
102
80
104
87
106
95
100
90
98
88
100
85
96
96
100
95
106
92
1 010
-
计算1:
每分钟为一群,总体被分为: R = 24×60 = 1 440 群,r = 1 440÷144 = 10 样本平均数:
p = 162÷165 = 98.18% 总体合格率估计:
Pˆ p 98.18%
例1:区间估计(大样本情形)
某机械制造企业有一批零件的公差为 (即 1000..0022 合格品直径范围为9.98cm—10.02cm),为了检 验零件质量,现随机抽取了10%的零件组成一个 样本,得统计资料如下表:
计算:
重复抽样时:
μx
σ n
s n
300 30(元) 100
不重复抽样时:
μx
σ 2 N n n N 1
s2 1 n n N
2
300 (1 100 ) 29.85(元) 100 10000
例2:成数的抽样平均误差
对某企业电子产品的合格率进行检测,从 5 000个成品中随机抽取200个进行检测, 测得合格品为196件,试求产品合格率的 抽样平均误差。
置信度为95%的区间估计:
x t μx 1.961.082 2.10 p t μp 1.96 2.17% 4.25%
估计区间: 平均袋重:101±2.10 一等品率: 88.3%± 4.25%
例:分层抽样区间估计
对某某城市居民每年的家庭旅游支出进行抽样调 查。在不同的行政区域,随机抽取3%的家庭进 行调查,得统计结果如下表所示:
上 限 p p 91% 5% 96%
下 限 p p 91% 5% 86%
t p
5%
2.86
μp 0.91 0.09
100
查表得:F(2.86)= 0.9958,即合格率在86% ~96%之间,其可靠程度为99.58%。
样本容量推算:
μx 52.2 100
查表得:F(2)= 0.9545,即平均耐用时数在 1045~1066小时之间,其可靠程度为95.45%。
例2:
上例中,同时又测得电子元件的合格 率为91%,要求合格率的估计误差范 围( Δ p )为5%,试估计该批电子元 件的合格率及可靠程度。
计算:
总的平均销售利润率及组内方差平均数:
分别对两种车型进行五数(最小值、Q1、Q2、Q3、最大值) 概括,画出箱形图,判断是否有异常值。
例:整群抽样区间估计
某水泥厂大量连续生产100公斤装水泥,一昼夜 产量为14 400袋。现每隔144分钟抽取1分钟的产 量(10袋为一群),共10群,全部检验。相关数 据如下表。
对水泥的平均袋重和一等品率进行点估计。 以95%的概率保证程度(t =1.96),对水泥的平
200
5000
例:简单随机抽样平均误差计算
根据抽样调查方案,从某地区10 000户居 民中抽取100户进行调查,得知:100户居 民的月均收入2500元,标准差为300元, 试求抽样平均误差。
计算:
重复抽样时:
μx
σ n
s n
300 30(元) 100
不重复抽样时:
μx
计算:
长度的标准差取20(mm)
一等品率取92 %
比P = 96%的标 准差要大。
nx
t 2σ2N N2x t 2σ 2
1.962 202 13752 13752 32 1.962 202
169
计算:
np
t 2 P(1 P)N N2p t 2 P(1 P)
x x 1010 10(1 公斤)
r 10
p p 883 88.3%
r 10
水泥的平均袋重: 101公斤。平均一等品率 88.3%。
计算2 :
组间方差计算:
δx 2
(x x)2
106
11.78
r 1 10 1
δp2
( p p)2 0.00476
σ 2 N n n N 1
s2 1 n n N
2
300 (1 100 ) 29.85(元) 100 10000
参数估计
某机械制造企业有一批零件的公差为 (即 1000..0022 合格品直径范围为9.98cm-10.02cm),为了检验 零件质量,现随机随机不重复抽取了6%的零件 组成一个样本,得统计资料如下表:
-
计算:
总的平均销售利润率及组内方差平均数:
x
xf f
1.2320 2.0 680 0.8 200 1.5 400 1.565万 1600
Sx2
S2 f f
0.052 320 0.082 680 0.042 200 0.062 400 1600
某高校为了了解0.8万名学生英语四级考试的 平均成绩和通过率情况,根据以往的经验,平 均成绩的标准差在150分~200分之间,通过率 在40 %~60 %之间。现用不重复抽样的方法, 要求在95 %(t =1.96)的可靠性程度保证下 ,平均分数的误差范围不超过25分,通过率的 误差范围不超过5 %,求样本必要容量。
对某型号的电子元件进行耐用性能检查, 抽查100件,测得平均耐用时数为1055.5小 时,标准差为52.2小时,要求耐用时数的 允许误差范围为10.5小时( x 10.5 ),试 估计该批电子元件耐用时数区间范围及不 超过允许误差范围的可靠程度。
计算:
总体平均耐用时间的
上 限 x x 1055.5 10.5 1066小 时 下 限 x x 1055.5 10.5 1045小 时 t x 10.5 2
1.962 0.92 0.0813752 13752 0.0472 1.962 0.92 0.08
127
取两者之中较大者,即169个。
简单随机抽样平均误差计算
例1:平均数的抽样平均误差
根据抽样调查方案,从某地区10 000户居民中抽 取100户进行调查,得知:100户居民的月均收入 2500元,标准差为300元,试求居民月平均收入 的抽样平均误差。
例1:切比雪夫定理
对1154个成年人进行调查显示,每人每天平均 睡眠6.9小时。假定标准差为1.2小时,试问:
1、睡眠时间4.5~9.3小时之间的人数百分比? 2、睡眠时间3.9~9.9小时之间的人数百分比? 3、假定是正态分布,则睡眠时间4.5~9.3小时之间
的人数百分比又是多少?
例2:正态分布
平均学位获得率:
p
pf f
42 0.9048 66 0.9545 93.52% 108
s
2 p
p(1
f
p) f
0.9048 0.0952 42 0.9545 0.0455 66 0.06 108
计算:
μp
S
2 p
1
n
n N
试以90%(t =1.64)的概率对该批零件的合格率 进行区间估计。
零件质量统计表:
直径(cm)
假设IQ分数具有正态分布,其平均数为100,标 准差为15。试问:
1、IQ分数在85~115之间的人士占多大百分比? 2、IQ分数在70~130之间的人士占多大百分比? 3、IQ分数超过130之间的人士占多大百分比? 4、IQ分数超过145的人被视为天才。你认为这样
的说法是否合理? 5、思考一下: 85~130之间的人士占多大百分比?
计算:
重复抽样时:
μp
P(1 P) n
p(1 p) n
0.98 0.02 1.0%或0.01 200
不重复抽样时:
μp
P(1 P) N n n N 1
p(1 p) 1 n n N
0.98 0.02 (1 200 ) 0.98%
以95%的概率保证程度(t =1.96),对该城市居 民每年的家庭旅游支出进行区间估计。
统计表:
行政区
东城区 西城区 南城区 北城区 合计
家庭数 (家)
320 680 200 400
1600
平均支出 (万元)
1.2 2.0 0.8 1.5
-
标准差 (万元)
0.05 0.08 0.04 0.06
例:成数的区间估计
某高校对男女毕业生分别抽取6%的学生进行调 查,统计结果如下表所示:
按性别 分组
男生 女生
样本人数 (人) f
42 66
学位获得率% p
90.48 95.45
合计
108
-
要求:以90%(t = 1. 64)的可靠性程度,对该 高校毕业生的平均学位获得率进行区间估计。
计算:
计算:
原则: 取最大者。
先要确定标准差:
平均成绩的标准差取:200分(取大者)
通过率取:P = 50%
当P = 0.5时, P(1-P)最大。
nx
t 2σ2N N2x t 2σ 2
1.962 2002 8000 8000 252 1.962 2002
244
计算:
np
t 2P(1 P)N N2p t 2 P(1 P)
1.962 0.5 0.5 8000 8000 0.052 1.962 0.5
0.5
367
取两者之中较大者,即367人。
例:(不重复抽样的情况)
某机械加工厂对一批零件进行抽检,零件 数量为13752个,根据历史资料,这种零 件标准长度的标准差在12~20(mm)之间 ,一等品率在92%~96%之间。用不重复 抽样的方法,要求在95 %(t =1.96)的可 靠性程度保证下,零件标准长度的误差范 围不超过3(mm)一等品率的误差范围不 超过4.7 %,求样本必要容量。
试对该批零件的合格率进行点估计。
零件质量统计表:
直径(cm)
9.97—9.98 9.98—9.99 9.99—1.00 1.00—10.01 10.01—10.02 10.02—10.03
合计
零件数(件)
2 26 64 42 31 1 165
备注
不合格 合格 合格 合格 合格
不合格
-
计算:
样本合格率:
例3:用五数概括法进行数据汇总
对轿车保险索赔系数进行评分,平均分为100分, 评分越低意味着越好,越安全。下面是两种车型的 评分数据。
中型轿车:81 91 93 127 68 60 51 58 75 100 103 119 82 128 76 68 81 91 82
小型轿车:73 100 127 100 124 103 119 108 109 113 108 118 103 120 102 122 96 133 80 140
0.00430
计算:
不重复抽样的平均误差:
μx
S 2 1 n n N
0.00432 (1 3%) 0.0016 1600
置信度为95%的区间估计:
x t μx 1.96 0.0016 0.0031
即: 1.565± 0.0031万元
r 1
抽样平均误差:
抽样平均误差:
μx
δx 2 R r r R1
11.78 144010 1.08(2 公斤) 10 14401
μp
δp2 R r r R1
0.00476 1440 10 2.17% 10 14401
0.06 (1 6% ) 2.29% 108
来自百度文库
p t μp 1.64 2.29% 3.76%
上 限 p p 93.52% 3.76% 97.28% 下 限 p p 93.52% 3.76% 89.76%
例1:根据给定的抽样极限误差求概率 保证程度
均合格率进行区间估计。
水泥生产情况表:
样本编号
1 2 3 4 5 6 7 8 9 10
合计
各群每袋平均重量 x 一 等品率 p(%)
98
75
102
80
104
87
106
95
100
90
98
88
100
85
96
96
100
95
106
92
1 010
-
计算1:
每分钟为一群,总体被分为: R = 24×60 = 1 440 群,r = 1 440÷144 = 10 样本平均数:
p = 162÷165 = 98.18% 总体合格率估计:
Pˆ p 98.18%
例1:区间估计(大样本情形)
某机械制造企业有一批零件的公差为 (即 1000..0022 合格品直径范围为9.98cm—10.02cm),为了检 验零件质量,现随机抽取了10%的零件组成一个 样本,得统计资料如下表:
计算:
重复抽样时:
μx
σ n
s n
300 30(元) 100
不重复抽样时:
μx
σ 2 N n n N 1
s2 1 n n N
2
300 (1 100 ) 29.85(元) 100 10000
例2:成数的抽样平均误差
对某企业电子产品的合格率进行检测,从 5 000个成品中随机抽取200个进行检测, 测得合格品为196件,试求产品合格率的 抽样平均误差。
置信度为95%的区间估计:
x t μx 1.961.082 2.10 p t μp 1.96 2.17% 4.25%
估计区间: 平均袋重:101±2.10 一等品率: 88.3%± 4.25%
例:分层抽样区间估计
对某某城市居民每年的家庭旅游支出进行抽样调 查。在不同的行政区域,随机抽取3%的家庭进 行调查,得统计结果如下表所示:
上 限 p p 91% 5% 96%
下 限 p p 91% 5% 86%
t p
5%
2.86
μp 0.91 0.09
100
查表得:F(2.86)= 0.9958,即合格率在86% ~96%之间,其可靠程度为99.58%。
样本容量推算:
μx 52.2 100
查表得:F(2)= 0.9545,即平均耐用时数在 1045~1066小时之间,其可靠程度为95.45%。
例2:
上例中,同时又测得电子元件的合格 率为91%,要求合格率的估计误差范 围( Δ p )为5%,试估计该批电子元 件的合格率及可靠程度。
计算:
总的平均销售利润率及组内方差平均数:
分别对两种车型进行五数(最小值、Q1、Q2、Q3、最大值) 概括,画出箱形图,判断是否有异常值。
例:整群抽样区间估计
某水泥厂大量连续生产100公斤装水泥,一昼夜 产量为14 400袋。现每隔144分钟抽取1分钟的产 量(10袋为一群),共10群,全部检验。相关数 据如下表。
对水泥的平均袋重和一等品率进行点估计。 以95%的概率保证程度(t =1.96),对水泥的平
200
5000
例:简单随机抽样平均误差计算
根据抽样调查方案,从某地区10 000户居 民中抽取100户进行调查,得知:100户居 民的月均收入2500元,标准差为300元, 试求抽样平均误差。
计算:
重复抽样时:
μx
σ n
s n
300 30(元) 100
不重复抽样时:
μx
计算:
长度的标准差取20(mm)
一等品率取92 %
比P = 96%的标 准差要大。
nx
t 2σ2N N2x t 2σ 2
1.962 202 13752 13752 32 1.962 202
169
计算:
np
t 2 P(1 P)N N2p t 2 P(1 P)
x x 1010 10(1 公斤)
r 10
p p 883 88.3%
r 10
水泥的平均袋重: 101公斤。平均一等品率 88.3%。
计算2 :
组间方差计算:
δx 2
(x x)2
106
11.78
r 1 10 1
δp2
( p p)2 0.00476
σ 2 N n n N 1
s2 1 n n N
2
300 (1 100 ) 29.85(元) 100 10000
参数估计
某机械制造企业有一批零件的公差为 (即 1000..0022 合格品直径范围为9.98cm-10.02cm),为了检验 零件质量,现随机随机不重复抽取了6%的零件 组成一个样本,得统计资料如下表:
-
计算:
总的平均销售利润率及组内方差平均数:
x
xf f
1.2320 2.0 680 0.8 200 1.5 400 1.565万 1600
Sx2
S2 f f
0.052 320 0.082 680 0.042 200 0.062 400 1600