第6章抽样调查
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
取样: (5,8) x1 6.5
(42,46) x2 44
(72,76) x3 74
s12 4.5
s22 8
s32 8
总方差
2
组间方差
2
平均组内方差
2 i
x
n
2
n
2
2 i
n
2 i
n
总体:
2 i
2 i
N
i
N
样本:si2
si2 ni n
第六章 区间估计
STAT
(四)区间估计(与SRS样本的不同点)
r
5
2 p
( pˆ i pˆ )2 r 1
(2% 2%)2
(2.1% 2%)2 5 1
0.0000085
pˆ
2 p
R
r
r R 1
0.0000085 60 5 0.126% 5 60 1
pˆ Z pˆ 1.96 0.126 % 0.25% ( pˆ pˆ ) (1.75%,2.25%)
第六章 区间估计
STAT
(2)按有关标志排队 A、职工家庭生活水平调查:按职工的工资水平排队; B、耕地农产量调查:按往年平均亩产的高低进行排队。 (二)区间估计:按SRS样本推断。
第六章 区间估计
STAT
第四节 必要样本容量的确定
一、必要样本容量
1、决定样本容量的因素
2、必要样本容量:在估计精度(费用限制)的前提下,必
分群: A群
B群
C群
R=3
取样:
样本第一群 样本第二群 r =2
调查:
全面调查
全面调查 M=4
第六章 区间估计
STAT
(二)抽样标准差的计算
168, 171, 172, 174, 165, 170, 174, 178; 173, 176, 178, 172
分群: A群
B群
C群
R=3
取样:
样本第一群
x2 174.75
2 174.75
总方差
2
组间方差 2
平均组内方差
2 i
x
n
N n 2
N 1 n
Nn N 1
2
2 i
r
Rr
2 Rr
R 1 r R 1
总体: 2 (i )2 M 样本:(xi x)2
RM
r 1
第六章 区间估计
STAT
[例]某连某班士兵的身高资料如下
168, 171, 172, 174, 165, 170, 174, 178, 173, 176, 178, 172
P1 )
1.962
0.27(1 0.27) 0.052
302.87
303只
n2
Z 2 P2 (1 2pˆ
P2 )
1.962
0.25(1 0.25) 0.052
288.12
289只
n3
Leabharlann Baidu
Z 2 P3 (1 2pˆ
P3 )
1.962
0.24(1 0.24) 0.052
第六章 区间估计
STAT
第三节 其他抽样方式下的区间估计
一、类型(分层)抽样(stratified random sampling) (一)抽样方法(P128,165) [例]10人年龄如下。N=10 n=3,推断总体平均年龄。 人: A B C D E F G H I J 年龄: 5 8 12 40 42 46 48 70 72 76 [简单随机抽样] ( B 、 H、 I ),( C、 D 、 E ),( F 、 G 、 I ) [分层(strata)抽样] ( B 、 E、 I ),( C、 D 、 H ),( A 、 G 、 J) (二)抽样数目的分配
Nn
2x
Z 2 2
n
Z 2 2
N
2x
Z 2 2
N
Z 2 2
n
N2x Z 2 2 Z 2 2
N
n
N
n
N2x Z 2 2 Z 2 2
公式 n NZ 2 2 N2x Z 2 2
整群抽样 2
N R,n r
第六章 区间估计
STAT
2、估计P时,n的确定 (1)重复抽样
pˆ Z pˆ
1、的估计
(1)全样本平均数:x xi ni n
(2)平均组内方差: i2
si2
si2 ni n
x
2 i
n
2、P的估计
(1)全样本比例:pˆ pˆ i ni n
pˆ
(2)平均组内方差:P(1 P) pˆ i (1 pˆ i )ni n
P(1 P) n
第六章 区间估计
STAT
[例]某厂有甲、乙两车间生产保温瓶,乙产量是甲的2倍。 现按产量比例共抽查了60支,结果甲车间平均保温时间为 25小时,标准差1.2小时;乙车间为28小时和0.8小时。试以 95.45%的置信水平推断总体平均保温时间的可能范围。
n
1000
P(1 P) pˆ i (1 pˆ i )ni n
pˆ
P(1 P) 1 n
n
N
0.8 0.2 300 0.15 0.85 700 1.12%
1000
pˆ Z pˆ 2.24%
0.14
2
( pˆ pˆ ) (32.26%,36.74%)
第六章 区间估计
n1
20, n2
40, x1
25, x2
28, s12
1.44,
s
2 2
0.64
x xi ni 25 20 28 40 2( 7 小时)
n
60
(x x )
si2
si2ni n
1.44 20 0.64 40 0.91 60
(26.76,27.24)
x
2 i
n
si2 n
0.12 x
第六章 区间估计
STAT
[例]某乡播种某种农作物3000亩,分布在60块地段上,每块 地段50亩。现抽取5块地,其平均亩产为8.25、9.50、8.50、 9.00和8.75百斤;受灾面积为2.0、1.6、1.4、1.9和2.1%。要 求以95%的置信水平估计其平均亩产及受灾面积的区间。
pˆ pˆ i 2.0% 1.6% 2.4% 1.9% 2.1% 2%
2、等比例分配:n1/N1= n2/N2= … = n/N(全样本)
∵ n/N =0.3 ∴n1/N1=0.3 n1=0.3×N1=0.3 ×3= 0.9
3、最优分配: ni/Ni=i/
∵ 1/ =2.87/8.52=0.34 ∴ n1/N1=0.34 n1=1.02
第六章 区间估计
STAT
第六章 区间估计
STAT
三、等距(机械、系统)抽样(systematic sampling) (一)抽样方法(P129、170) 1、定义:先排序,然后等间隔抽样。
总体N 样本 n :抽样间隔K=N/n [例]N=50 n =5,则 K=10
A4、A14、A24、A34、A44; A7、A17、A27、A37、A47。 2、排队方式 (1)按无关标志排队 A、职工工资调查:按职工的姓氏笔划排队; B、产品质量调查:按产品入库顺序排队。
3 72.67
x 6.5 2 44 2 41.5 6
组内误差: x1 1 1.83 误差产生原因:
5 8 12 40 41.9
10
1、总体各类全面调查 2、组内单位抽样调查
第六章 区间估计
STAT
人: A B C D E F G H I J
年龄:5 8 12 40 42 46 48 70 72 76
样本第二群 r =2
x 0.67
x1 171.75
1 171.75
x2 174.75
2 174.75
全样本平均数 x
xi M rM
171 .75 4 174 .75 4 24
173 .25
总体平均数
168
171 172 174 12
172
172 .58
x1
x2
须抽取的容量。
样 本 容 量 与 精 度 的 关
精度 95% 越大
N50%n
越小
精确度越高
x 越小
精x 确度越越大低
费用越多
费用越少
样本 / 总体
系
20%
50%
第六章 区间估计
STAT
二、根据允许误差(精度)确定样本容量
(一)简单随机抽样(P156)
1、估计时,n的确定
(1)重复抽样
Z x
2
0.24
第六章 区间估计
STAT
[例]某地有一万住户,按城乡比例不重复抽取一千户,进行 彩电拥有量调查,结果城市抽取300户,拥有比重为80%; 乡村700户,比重为15%。试以95.45%的置信水平推断该地 彩电拥有户比率的范围。
pˆ pˆ i ni 0.8 300 0.15 700 34.5%
r 1
(171.75 173.25)2 (174.75 173.25)2 2 1
4.5
第六章 区间估计
STAT
(三)区间估计(与SRS样本的不同点)
1、估计 (1)全样本平均数:x xi M xi
rM r
(2)组间方差: 2
(xi x)2 r 1
x
2 Rr
r R 1
2、估计P
(1)全样本比例(成数):pˆ pˆ i M pˆ i
第六章 区间估计
STAT
[例]10人年龄资料如下。N=10 n=3。
人: A B C D E F G H I J
年龄:5 8 12 40 42 46 48 70 72 76
分类: N1=3
N2=4
N3=3 N=10
1=2.87
2=3.16
3=2.49 =8.52
n1=?
n2=?
n3=?
n=3
1、等额分配:n1= n2= n3= 1
STAT
二、整群抽样(cluster sampling,集团抽样)
(一)抽样方法(P128、168)
1、按某种标志或要求将总体区分为若干群(R),群内单位 数(M)相等;
2、采取不重复抽样方式从R群随机抽出r群,尔后对样本群 进行全面调查以推断总体。
[例]某连某班12名士兵的身高资料如下
168, 171, 172, 174; 165, 170, 174, 178; 173, 176, 178, 172
(三)抽样标准差的计算
[例]10人年龄资料如下。N=10n=6,推断总体平均年龄。 人: A B C D E F G H I J
年龄:5 8 12 40 42 46 48 70 72 76
取样: (5,8) x1 6.5
1 8.33
(42,46) x2 44
2 44
(72,76) x3 74
x xi 8.25 9.50 8.50 9.00 8.75 8.8
r
5
2 (xi x)2 (8.25 8.8)2 (8.75 8.8)2 0.23
r 1
5 1
x
2 R r
r R 1
0.23 60 5 0.21 5 60 1
x Z0.025 x 1.96 0.21 0.41 (x x ) (839,921)
rM
r
(2)组间方差:
2 p
( pˆ i pˆ )2 r 1
pˆ
2 p
R
r
r R 1
第六章 区间估计
STAT
[例]某乡播种某种农作物3000亩,分布在60块地段上,每块 地段50亩。现抽取5块地,其平均亩产为8.25、9.50、8.50、 9.00和8.75百斤;受灾面积为2.0、1.6、1.4、1.9和2.1%。要 求以95%的置信水平估计其平均亩产及受灾面积的区间。
分群: A群
B群
C群
R=3
取样:
群 数据 均值
A
168,171 172,174
未抽
B
165,170 174,178
171.75
C
173,176 178,172
174.75
173.25
样本第一群
x1 171.75
1 171.75
样本第二群 r =2
x2 174.75
2 174.75
2 (xi x)2
STAT
[例]某冷库对一批鸡蛋的变质率进行抽样调查。据以往三次 调查的结果,其变质率分别为27%、25%、24%。现在允许 误差不超过5%,推断的概率保证程度为95%。问至少要抽 取多少枚鸡蛋?
解:Z0.025=1.96,p=5%,P1=27%,P2=25%,P3=24%
n1
Z 2 P1 (1 2pˆ
2
pˆ
P(1 P)
n
pˆ Z
2
P(1 P) n
两边平方
2pˆ
Z2 P(1 n
P)
n
Z2 P(1 2pˆ
P)
(公式)
(2)不重复抽样
用 pˆ 替代x
P(1 P)替代 2
n NZ2 2 NZ2 P(1 P) (公式) N2x Z2 2 N2pˆ Z2 P(1 P)
第六章 区间估计
1 2
0 0
群内无误差
原因总群体内各单群位
抽样调查 全面调查
第六章 区间估计
STAT
168, 171, 172, 174, 165, 170, 174, 178; 173, 176, 178, 172
分群: A群
B群
C群
R=3
取样:
样本第一群
x1 171.75
1 171.75
样本第二群 r =2
要求 : x x
则 x Z x
2
x
n
x Z
2
n
两边平方
2x
Z 2
n
2
公式 n Z 2 2
2x
注:影响样本容量的因素
类型抽样
2 i
第六章 区间估计
STAT
(2)不重复抽样
x Zx
2
x
n
1
n N
x
Z
2
n
1 n N
两边平方
2x
Z 2 2
n
1
n N
Z 2 2
n
nZ 2 2