应用抽样技术课后习题答案精品PPT课件
合集下载
应用抽样技术课后习题答案
=(0.0907,0.4433)
N1的95%的置信区间为: (159,776) 95%的置信区间为 (159, 的置信区间为:
(3)N=1750,n=30, (3)N=1750,n=30,n1=8, t=1.96, p=0.267, q=1q=1-0.267=0.733 由此可计算得: t 2q 1.962 × 0.733 n0 = 2 = =1054.64 r p 0.01× 0.267 n = n0/[1+(n0—1)/N] = 1054.64/[1+1053.64/1750]=658.2942 = 659 计算结果说明,至少应抽取一个样本量为659的简单随机 样本,才能满足95%置信度条件下相对误差不超过10%的精度 要求。
t=1.96 (2)易知,N=1750,n=30, n = 8 1 n 8 N − n 1750 − 30 1− f p= 1 = = 0.267 = = = 0.03389 n −1 (n −1)N 29 ×1750 n 30
pq = p(1 − p) = 0.267 × 0.733 = 0.1957
5.5 证明:由(5.6)得:
V ( yR ) ≈ 1− f n (Yi − RX i )2 ∑
i =1 N
N −n 2 令 Sd = V , Nn
2 d
N −1
=
N −n 2 Sd Nn
则n(NV + S ) = NS ,
2 d
S 2 NSd 从而n = = V 2 2 NV + Sd Sd 1+ NV
第五章 比率估计与回归估计
5.2 N=2000, n=36, 1-α=0.95, t=1.96, ˆ f = n/N=0.018, v(R) = 0.000015359, ˆ se(R) =0.00392 置信区间为[40.93%,42.47%]。 置信区间为[40.93%,42.47%]。
应用抽样技术课件第三章
首先要将总体 N 个单位从1到 N 编号,每个单位对 应一个号; 然后从所编的号中随机抽号,如果抽到某个号,则 对应的那个单位入样,直到抽够 n 个单位为止。 具体方法:
(一)抽签法
(二)随机数法
12
(一)抽签法
当总体不大时采用。用同质均匀的材料制作N个签,并充分混合。 全样本抽选法 从N个签中一次抽取n个,这n个 签上的号码即为入样的单位号码 一次抽取一个签但不放回,接着 抽下一个签,直到抽够n个签为 止,签上号码所对应的单位入样
18 16 14 12 10 8 6 4 2 0 50-60 70-80
35% 30% 25% 20%
`
15% 10% 5% 0% 90-100
第三章
简单随机抽样
本章要点
简单随机抽样是抽样中最基本、最成熟、也 是最简单的抽样设计方式,是所有概率抽样方法 发展、比较的基础。 ①要求熟练掌握简单随机抽样的抽样方式和 样本抽选方法; ②熟知总体均值、总体总值和总体比例的简 单估计; ③掌握样本量的确定。
24
由于总体方差 未知,需用样本方差 s 估计它。
S2
2
1 f 2 v( y ) s n
样本方差 s 是总体方差S2的无偏估计量,所以
2
v( y ) 是 V ( y ) 的无偏估计 。
25
(三)放回简单随机抽样的简单估计
由于每次抽取时总体中任一单位都有1/N的概率被抽 中,考虑样本单位顺序的放回简单随机抽样也是等 1 V ( y) 概率抽样。 n
但是利用计算机产生的随机数是伪随机数,并不能
保证其随机性,通常产生的伪随机数有循环周期。
一般不建 议使用此种方法!
19
第二节 总体均值与总体总值 的简单估计
应用抽样技术课后习题答案ppt课件
(118266 16822
/ 30) / 30
798.73
1 f N n 1750 30 0.03276 b2 4ac n n N 30 1750
v( y) 0.03276 798.73 26.168
se( y) v( y) 5.115
因此,对该校学生某月的人均购书支出额的估计为56.07 (元),由于置信度95%对应的 t=1.96, 所以,可以以95%的把 握说该,学生该月的人均购书支出额大约在56.07±1.96×5.115, 即50.96--61.19元之间。
5.3当
方法,当
2CCX=Y时C用X 时第两一种种方方法法都,可当使用。2CC这XY时是用因第为二:种
可编辑ppt
8
3.5要调查甲乙两种疾病的发病率,从历史资料得知 ,甲种疾病的发病率为8%,乙种疾病的发病率为 5%,求:
(1)要得到相同的标准差0.05,采用简单随机抽样各 需要多大的样本量?
(2)要得到相同的变异系数0.05,又各需要多大的样 本量?
可编辑ppt
9
3.5解:已知 P1= 0.08, Q1= 1-P1 = 0.92;
(3)如果要求相对误差限不超过10%,以95%的置信 度估计该校学生该月购书支出超出70元的人数比 例,样本量至少应为多少。
可编辑ppt
4
表1 30名学生某月购书支出金额的样本数据
可编辑ppt
5
3.3解:(1)依据题意和表1的数据,有:
yi
1682,
y
1682 30
56.07(元),
s
2 y
1 0.0167 2n
P 的95%的置信区间为:
p
(u ) 0.267 (1.96 0.08144 0.0167) n 1 2n
抽样技术(第5版)课件PPT课件第5章
抽样。如果超市的营业面积近似正比于超市的销
售额,那么超市A的销售额就占所有超市销售额
的1/16,因此超市A的销售额乘16可以近似的估
计所有超市的销售额。因此,样本量为1的不等
概率抽样的总体总量估计量为
= =
式中
∈
∈
1
1
=
=
(单元在样本中)
第二节 放回不等概抽样
nn 1 i 1 mi M 0
s YˆHH v YˆHH
765404
2
174454
s YˆHH
174118
r t
1.96
=45%
757087
Yˆ
HH
相对误差达到20%时所需样本量对误差达到20%
时所需样本量nnnnnnn
n= 150
第二节 放回不等概抽样
Z
Z
nm
n i 1 Z i
i 1 Z i
1
j
1
i
ij
i
它的一个无偏估计量为
v(Yˆ )
n
1 n ˆ2
1
2
2
ˆ
ˆ
ˆ
nY
Y
)
Y
Y
(
i
i
n n 1 i 1
n n 1 i 1
M i 1 Kij Yiju2
2
Y
Mi
1
常数K
nZi mi
f0
这里,f 0 为总体中任意一个二级单元被抽中的概率。如果f 事先确定,则
售额,那么超市A的销售额就占所有超市销售额
的1/16,因此超市A的销售额乘16可以近似的估
计所有超市的销售额。因此,样本量为1的不等
概率抽样的总体总量估计量为
= =
式中
∈
∈
1
1
=
=
(单元在样本中)
第二节 放回不等概抽样
nn 1 i 1 mi M 0
s YˆHH v YˆHH
765404
2
174454
s YˆHH
174118
r t
1.96
=45%
757087
Yˆ
HH
相对误差达到20%时所需样本量对误差达到20%
时所需样本量nnnnnnn
n= 150
第二节 放回不等概抽样
Z
Z
nm
n i 1 Z i
i 1 Z i
1
j
1
i
ij
i
它的一个无偏估计量为
v(Yˆ )
n
1 n ˆ2
1
2
2
ˆ
ˆ
ˆ
nY
Y
)
Y
Y
(
i
i
n n 1 i 1
n n 1 i 1
M i 1 Kij Yiju2
2
Y
Mi
1
常数K
nZi mi
f0
这里,f 0 为总体中任意一个二级单元被抽中的概率。如果f 事先确定,则
抽样教学课件 PPT
抽样教学课件
第一节 抽样得意义与作用
一、抽样得概念
1、总体:构成它得所有元素(个体、分析单位、研 究对象)得集合,就是从中抽取样本得元素(个体) 得集合体。
2、样本:按照一定方法从调查总体中抽取出来元 素得集合 。
3、抽样:从总体中按照一定方式抽取样本得过程。
4、抽样单位:指一次直接抽样过程中使用得基本 单位,它往往就是多层次得。
4、优缺点
优点:方便易行、较为灵活,特别适用于调查 范围大,单位多,情况复杂得调查对象
缺点:误差较大,可相应增加开头阶段得样本 数而减少最后阶段得样本数。
第四节 户内抽样与PPS抽样
一、户内抽样得方法——kish选择法
1、kish选择法 (1)将调查表分为八种, A、B1、B2、C、D、 E1、E2、F, A、C、D、F各占总数得1/6、 B1、 B2、 E1、E2 1各占/12。 (2)印制相应八种选择卡 (3)将家体中成员进行排序编号,顺序就是:最 年长男性、次年长男性……最年幼男性、最 年长女性、次年长女性……最年幼女性 (4)按照调查表上得编号,用相应得选择卡进 行选择。
抽样得程序
总体 抽样框
抽样方法
样本
四、抽样设计得原则
1、目得性原则: 以课题研究得总体方案与研究目标为依据
2、可测性原则 能够从样本自身计算出有效得估计值或抽样 变动得近似值。
3、可行性原则 抽样方案必须在实践中切实可行
4、经济性原则 方案设计与研究得经费、时间、人力等适应
大家有疑问的,可以询问和交流
元素2
G院
900
9
70 061~070 076
元素3
H院
800
8
78 071~078
第一节 抽样得意义与作用
一、抽样得概念
1、总体:构成它得所有元素(个体、分析单位、研 究对象)得集合,就是从中抽取样本得元素(个体) 得集合体。
2、样本:按照一定方法从调查总体中抽取出来元 素得集合 。
3、抽样:从总体中按照一定方式抽取样本得过程。
4、抽样单位:指一次直接抽样过程中使用得基本 单位,它往往就是多层次得。
4、优缺点
优点:方便易行、较为灵活,特别适用于调查 范围大,单位多,情况复杂得调查对象
缺点:误差较大,可相应增加开头阶段得样本 数而减少最后阶段得样本数。
第四节 户内抽样与PPS抽样
一、户内抽样得方法——kish选择法
1、kish选择法 (1)将调查表分为八种, A、B1、B2、C、D、 E1、E2、F, A、C、D、F各占总数得1/6、 B1、 B2、 E1、E2 1各占/12。 (2)印制相应八种选择卡 (3)将家体中成员进行排序编号,顺序就是:最 年长男性、次年长男性……最年幼男性、最 年长女性、次年长女性……最年幼女性 (4)按照调查表上得编号,用相应得选择卡进 行选择。
抽样得程序
总体 抽样框
抽样方法
样本
四、抽样设计得原则
1、目得性原则: 以课题研究得总体方案与研究目标为依据
2、可测性原则 能够从样本自身计算出有效得估计值或抽样 变动得近似值。
3、可行性原则 抽样方案必须在实践中切实可行
4、经济性原则 方案设计与研究得经费、时间、人力等适应
大家有疑问的,可以询问和交流
元素2
G院
900
9
70 061~070 076
元素3
H院
800
8
78 071~078
抽样技术(第5版)课件PPT课件第2章
n i 1
n i j
1 n N
1 n(n 1)
2 (Yi Y ) 2 2
(Yi Y )(Y j Y )
n N i 1
n N ( N 1) i j
n 1 N
n 1 N
1 N
n 1
2
2
(Yi Y )
(Yi Y ) 2
1.5
4.5
10
平均
5
6
5.5
2.5
0.5
3
0
6.5
方差1.95
y -Y
2
证明 性质1
对于固定的有限总体,估计量的期望是对所有可能样本求平均得
到的,因此
y y1 y 2 y n
E y n
CN
nCNn
总体中每个特定的单元
在不同的样本中出现的次数。C n 1
小写符号表示样本的标志值
符号
总
1
Y
N
体
Y1 Y2 YN
Y
i
N
i 1
N
N
Y Yi Y1 Y2 YN
i 1
A 1
P
N N
N
Y Yi 0或1
i 1
i
1 N
N
2
S
Y
Y
2
i
N 1 i 1
N 1
2
样
y y2 yn
i 1
n
i 1
y
x
n i j
1 n N
1 n(n 1)
2 (Yi Y ) 2 2
(Yi Y )(Y j Y )
n N i 1
n N ( N 1) i j
n 1 N
n 1 N
1 N
n 1
2
2
(Yi Y )
(Yi Y ) 2
1.5
4.5
10
平均
5
6
5.5
2.5
0.5
3
0
6.5
方差1.95
y -Y
2
证明 性质1
对于固定的有限总体,估计量的期望是对所有可能样本求平均得
到的,因此
y y1 y 2 y n
E y n
CN
nCNn
总体中每个特定的单元
在不同的样本中出现的次数。C n 1
小写符号表示样本的标志值
符号
总
1
Y
N
体
Y1 Y2 YN
Y
i
N
i 1
N
N
Y Yi Y1 Y2 YN
i 1
A 1
P
N N
N
Y Yi 0或1
i 1
i
1 N
N
2
S
Y
Y
2
i
N 1 i 1
N 1
2
样
y y2 yn
i 1
n
i 1
y
x
应用抽样技术课件第一章
计学会会议上提出“代表性调查”的抽样方法以来,经过 100多年的理论探讨(tàntǎo)和实践积累,抽样技术已成为一门 日臻完善的科学。
精品文档
10
抽样技术(jìshù )在世界各国都被广泛应用!
从抽样技术诞生以来,它已经在世界(shìjiè)各国 得到广泛应用,极大提高了人们开展统计调 查的水平和认识自然、认识社会的能力。
也称代表性抽样,即抽样者根据自己的知识、经验 (jīngyàn)和判断从总体中挑选出“典型的”或“有代表 性”的单位来组成样本。
最具有(jùyǒu)共性的个体, 具有平均水平或一般特征 的个体
例如:从所在区域抽取几家“规模中等、生产经营比较稳定”
的企业来了解企业的能源消费状况; 从社区中抽取若干“收入中等”的住户来了解居民日常收支 情况; 从全班学生中抽选几位成绩中等的学生了解学生的学习时
精品文档
16
本章 要点 (běn zhānɡ)
本章对抽样技术的涵义(hán yì)、作用、产 生历史和实际应用等作简要介绍,为以后各 章的学习奠定基础。具体要求:
①正确理解抽样技术的科学涵义、基本分 类和特点,对抽样调查的基本程序和作用有 初步的认识;
②对抽样技术产生与发展的历史有一般的 了解;
③对抽样技术的实际应用有大致的认识。
精品文档
4
收视率调查(diào chá)
•中央电视台“索福瑞”调查公司在全国11亿电视观众中,
采用科学的概率抽样方法抽取了6万个样本户,覆盖全国
200多个(duō ɡè)市县。 •采用的是目前国际上最新的收视调查手段——测量仪法:
在样本户电视机上安装测量仪。样本户家每个人在遥控 器上都有自己的按钮。谁看了什么节目,测量仪把信 息储存起来通过电话线传送到总部的中心计算机 。 •调查结果的可信度在95%以上,误差在3%以下 。
精品文档
10
抽样技术(jìshù )在世界各国都被广泛应用!
从抽样技术诞生以来,它已经在世界(shìjiè)各国 得到广泛应用,极大提高了人们开展统计调 查的水平和认识自然、认识社会的能力。
也称代表性抽样,即抽样者根据自己的知识、经验 (jīngyàn)和判断从总体中挑选出“典型的”或“有代表 性”的单位来组成样本。
最具有(jùyǒu)共性的个体, 具有平均水平或一般特征 的个体
例如:从所在区域抽取几家“规模中等、生产经营比较稳定”
的企业来了解企业的能源消费状况; 从社区中抽取若干“收入中等”的住户来了解居民日常收支 情况; 从全班学生中抽选几位成绩中等的学生了解学生的学习时
精品文档
16
本章 要点 (běn zhānɡ)
本章对抽样技术的涵义(hán yì)、作用、产 生历史和实际应用等作简要介绍,为以后各 章的学习奠定基础。具体要求:
①正确理解抽样技术的科学涵义、基本分 类和特点,对抽样调查的基本程序和作用有 初步的认识;
②对抽样技术产生与发展的历史有一般的 了解;
③对抽样技术的实际应用有大致的认识。
精品文档
4
收视率调查(diào chá)
•中央电视台“索福瑞”调查公司在全国11亿电视观众中,
采用科学的概率抽样方法抽取了6万个样本户,覆盖全国
200多个(duō ɡè)市县。 •采用的是目前国际上最新的收视调查手段——测量仪法:
在样本户电视机上安装测量仪。样本户家每个人在遥控 器上都有自己的按钮。谁看了什么节目,测量仪把信 息储存起来通过电话线传送到总部的中心计算机 。 •调查结果的可信度在95%以上,误差在3%以下 。
抽样技术(第5版)课件PPT课件第5章
首先,可能医院中愿意接受CPR治疗的病人数量
会正比与医院床位的数量,采用等概简单估计量
可能会有大的方差。
其次,自加权的等概率样本可能难于管理。可能
仅仅为了调查一两个病人就需要去一家医院,并
且合理分配调查人员的工作负担也是比较困难的。
第三,调查成本在调查开始的时候是未知的---一个40个医院的样本可能包括了主要的大的医院,
四个n=1的可能的不等概抽样
样本
Zi
yi
[A]
1/16
11
176
15375
[B]
2/16
20
160
19600
[C]
3/16
24
128
29584
[D]
10/16
245
392
8464
第二节 放回不等概抽样
=
= 300
总是无偏估计量,因为
第二节 放回不等概抽样
二 有放回不等概抽样
对于放回不等概抽样,对总体总量的估计是汉森
-赫维茨(Hansen-hurwitz)估计
YˆHH
n
yi M 0
1
n i 1 z i
n
n
yi
i 1 mi
例如:估计超市销售额,
m:员工人数
解释公式意义
第二节 放回不等概抽样
Y
1 N
ˆ
V (YHH ) Z i ( i Y ) 2
可能样本见下表
1 1
,
4
= ,所有的
样本
[A]
1/4
11
44
65536
[B]
1/4
会正比与医院床位的数量,采用等概简单估计量
可能会有大的方差。
其次,自加权的等概率样本可能难于管理。可能
仅仅为了调查一两个病人就需要去一家医院,并
且合理分配调查人员的工作负担也是比较困难的。
第三,调查成本在调查开始的时候是未知的---一个40个医院的样本可能包括了主要的大的医院,
四个n=1的可能的不等概抽样
样本
Zi
yi
[A]
1/16
11
176
15375
[B]
2/16
20
160
19600
[C]
3/16
24
128
29584
[D]
10/16
245
392
8464
第二节 放回不等概抽样
=
= 300
总是无偏估计量,因为
第二节 放回不等概抽样
二 有放回不等概抽样
对于放回不等概抽样,对总体总量的估计是汉森
-赫维茨(Hansen-hurwitz)估计
YˆHH
n
yi M 0
1
n i 1 z i
n
n
yi
i 1 mi
例如:估计超市销售额,
m:员工人数
解释公式意义
第二节 放回不等概抽样
Y
1 N
ˆ
V (YHH ) Z i ( i Y ) 2
可能样本见下表
1 1
,
4
= ,所有的
样本
[A]
1/4
11
44
65536
[B]
1/4
抽样技术PPT教学课件
(2)不重复抽样时 :
样本个数=4×3=12
• 若改变样本单位数,取n=3 ,
样本个数=4×3×2=24
18
必要样本容量的影响因素
STAT
允许误差范围的大小; 抽样调查的组织方式和方法; 人力、财力和物力的允许条件。
19
§4.2 随机抽样技术 STAT 一、简单随机抽样 二、分层抽样 三、系统抽样 四、整群抽样
例:总体群数R=16
A D
E
B F G
CM N
J H
L K
P O I
LP HD
样本群数r=4
样本容量
n nd np nl nh
简单、方便,易于组织,能节省人力、物力、财力 和时间,但其限制了样本在总体中分配的均匀性。 40
特点
STAT
(1)总体和样本都是由“群”组成; (2)引起的抽样误差的方差是群间方差, 群内方差不影响抽样误差; (3)整群抽样均为不重复抽样,可提高样 本的代表性。
34
解:根据最低成本抽样法,则
n大
(50
5020000
20000) / 1508000
600 3005000
30
600
500
400
7家
n中
(150 8000) / 5020000 1508000
500 3005000
30
600
500
400
9家
ni
Ni i / (Ni i /
ci n ci )
式 中: ni为第i层抽出的样本数
Ni为第i层的总单位数
i 为第i层Biblioteka 标准差ci 为第i层每单位的调查费用
抽样技术(第5版)课件PPT课件第7章
n N
n n
若有限总体修正系数 可忽略不计
1 2 1 1
V ( yRD ) S y ( )( R 2 S x2 2 RS yx )
n
n n
1 2 1 1 ˆ2 2
ˆ )
v( yRD ) s y ( )( R sx 2 Rs
yx
n
n n
1 2 ˆ2 2
1 ˆ
2 2
1000 8000
0.32 (7 6.42) 2 0.1 (15 6.42) 2
0.04 (40 6.42) 2 ]
0.0552
v( ystD ) 0.0368 0.0552 0.092
s(Y ) Ns( ystD ) N v( ystD ) 2426.52
, =
1 + 2
7.2 捕获再捕获抽样
一、捕获再捕获估计
捕获再捕获抽样的基本思想是从总体中抽取一个样
本,将样本的每个个体标识(作标记或加标签) 后释放
回总体中,经过一段时间的充分混合后,再从总体中抽
取一个样本,此时,该样本将包括已标识的和未标识的
个体,利用这两个样本的信息对总体数量做估计。
h 1 nh
其中
nh
1
2
sh2
(
y
y
)
hj
h
nh 1 j 1
为第二重样本第h层的方差。
当抽样比
nh 和 n 可以忽略不计时,上式简化为
N
n
wh2 sh2 1 L
( ystD )
wh ( yh ystD )2
nh
n h1
h 1
n n
若有限总体修正系数 可忽略不计
1 2 1 1
V ( yRD ) S y ( )( R 2 S x2 2 RS yx )
n
n n
1 2 1 1 ˆ2 2
ˆ )
v( yRD ) s y ( )( R sx 2 Rs
yx
n
n n
1 2 ˆ2 2
1 ˆ
2 2
1000 8000
0.32 (7 6.42) 2 0.1 (15 6.42) 2
0.04 (40 6.42) 2 ]
0.0552
v( ystD ) 0.0368 0.0552 0.092
s(Y ) Ns( ystD ) N v( ystD ) 2426.52
, =
1 + 2
7.2 捕获再捕获抽样
一、捕获再捕获估计
捕获再捕获抽样的基本思想是从总体中抽取一个样
本,将样本的每个个体标识(作标记或加标签) 后释放
回总体中,经过一段时间的充分混合后,再从总体中抽
取一个样本,此时,该样本将包括已标识的和未标识的
个体,利用这两个样本的信息对总体数量做估计。
h 1 nh
其中
nh
1
2
sh2
(
y
y
)
hj
h
nh 1 j 1
为第二重样本第h层的方差。
当抽样比
nh 和 n 可以忽略不计时,上式简化为
N
n
wh2 sh2 1 L
( ystD )
wh ( yh ystD )2
nh
n h1
h 1
应用抽样技术课件第二章
抽样推断的结论只适合于说明抽样总体!
但我们研究的目的是认识目标总体的数量特征,
因此在抽样之前要尽量使抽样查总体与目标总体保持 一致。
基本原则是,抽样总体由目标总体所决定, 但在实践中,还要根据抽样总体来调整目标总体。
10
案例:全国电视观众抽样调查
目标总体:定为全国31个省、自治区、直辖市(港澳台除外) 电视信号覆盖区域内所有城乡家庭户中的13岁以上可视居民 以及4~12岁的儿童。
估计量的所有可能取值和与之对应的概率组成了
估计量的概率分布,称为抽样分布。
39
估计量:12均0保0家X险样额本企x业的平
210万家企业的平均 保险消费额?
它有 m 多C少2112?0000000 个取值 假设其中完全不相等的值有k个
抽样分布
xi : x1, x2, x3 , , xkm
抽样总体
11
抽样总体中所包含的调查单位个数称为总体容量, 常用N 表示
12
二、抽样单位与抽样框
总体是由单位构成的,单位可以分为 调查单位与抽样单位。
调查单位 调查项目的承担者,即我们想通过调查取 survey unit 得其观测值的单位。
例如:调查浙江工商大学在校生的生活消费情况, 调查单位是每一个在校生。
初级抽样单位:每一个区或县 次级抽样单位:每一个街道、乡或镇 三级抽样单位:每一个居委会、村委会 四级抽样单位:每一个家庭户 五级抽样单位:每一个个人
16
抽样框 根据抽样单位所编制的名录,
是抽样总体的具体表现。
中国经理人名录大全 中国传真号码大全
精准全国31省市名录数据库 所有行业名录 外资企业名录
例如:杭州市居民家计调查, 调查单位是杭州市每一户家庭。
但我们研究的目的是认识目标总体的数量特征,
因此在抽样之前要尽量使抽样查总体与目标总体保持 一致。
基本原则是,抽样总体由目标总体所决定, 但在实践中,还要根据抽样总体来调整目标总体。
10
案例:全国电视观众抽样调查
目标总体:定为全国31个省、自治区、直辖市(港澳台除外) 电视信号覆盖区域内所有城乡家庭户中的13岁以上可视居民 以及4~12岁的儿童。
估计量的所有可能取值和与之对应的概率组成了
估计量的概率分布,称为抽样分布。
39
估计量:12均0保0家X险样额本企x业的平
210万家企业的平均 保险消费额?
它有 m 多C少2112?0000000 个取值 假设其中完全不相等的值有k个
抽样分布
xi : x1, x2, x3 , , xkm
抽样总体
11
抽样总体中所包含的调查单位个数称为总体容量, 常用N 表示
12
二、抽样单位与抽样框
总体是由单位构成的,单位可以分为 调查单位与抽样单位。
调查单位 调查项目的承担者,即我们想通过调查取 survey unit 得其观测值的单位。
例如:调查浙江工商大学在校生的生活消费情况, 调查单位是每一个在校生。
初级抽样单位:每一个区或县 次级抽样单位:每一个街道、乡或镇 三级抽样单位:每一个居委会、村委会 四级抽样单位:每一个家庭户 五级抽样单位:每一个个人
16
抽样框 根据抽样单位所编制的名录,
是抽样总体的具体表现。
中国经理人名录大全 中国传真号码大全
精准全国31省市名录数据库 所有行业名录 外资企业名录
例如:杭州市居民家计调查, 调查单位是杭州市每一户家庭。
应用抽样技术课后习题答案49页PPT
侈 。——CocoCha nel 62、少而好学,如日出之阳;壮而好学 ,如日 中之光 ;志而 好学, 如炳烛 之光。 ——刘 向 63、三军可夺帅也,匹夫不可夺志也。 ——孔 丘 64、人生就是学校。在那里,与其说好 的教师 是幸福 ,不如 说好的 教师是 不幸。 ——海 贝尔 65、接受挑战,就可以享受胜利的喜悦 。——杰纳勒 尔·乔治·S·巴顿
谢谢!
应用抽样技术课后习题答案
11、获得的成功越大,就越令人高兴 。野心 是使人 勤奋的 原因, 节制使 人枯萎 。 12、不问收获,只问耕耘。如同种树 ,先有 根茎, 再有枝 叶,尔 后花实 ,好好 劳动, 不要想 太多, 那样只 会使人 胆孝懒 惰,因 为不实 践,甚 至不接 触社会 ,难道 你是野 人。(名 言网) 13、不怕,不悔(虽然只有四个字,但 常看常 新。 14、我在心里默默地为每一个人祝福 。我爱 自己, 我用清 洁与节 制来珍 惜我的 身体, 我用智 慧和知 识充实 我的头 脑。 15、这世上的一切都借希望而完成。 农夫不 会播下 一粒玉 米,如 果他不 曾希望 它长成 种籽; 单身汉 不会娶 妻,如 果他不 曾希望 有小孩 ;商人 或手艺 人不会 工作, 如果他 不曾希 望因此 而有收 益。-- 马钉路 德。
谢谢!
应用抽样技术课后习题答案
11、获得的成功越大,就越令人高兴 。野心 是使人 勤奋的 原因, 节制使 人枯萎 。 12、不问收获,只问耕耘。如同种树 ,先有 根茎, 再有枝 叶,尔 后花实 ,好好 劳动, 不要想 太多, 那样只 会使人 胆孝懒 惰,因 为不实 践,甚 至不接 触社会 ,难道 你是野 人。(名 言网) 13、不怕,不悔(虽然只有四个字,但 常看常 新。 14、我在心里默默地为每一个人祝福 。我爱 自己, 我用清 洁与节 制来珍 惜我的 身体, 我用智 慧和知 识充实 我的头 脑。 15、这世上的一切都借希望而完成。 农夫不 会播下 一粒玉 米,如 果他不 曾希望 它长成 种籽; 单身汉 不会娶 妻,如 果他不 曾希望 有小孩 ;商人 或手艺 人不会 工作, 如果他 不曾希 望因此 而有收 益。-- 马钉路 德。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.6 解 已知W1=0.2,W2=0.3,W3=0.5, P1=0.1,P2=0.2,P3=0.4
P=ΣhWhPh=0.28,Q=1—P=0.72 n=100的简单随机抽样估计方差:
V(Psrs) ≈ [(1—f ’)/100]PQ ≈ 0.28*0.72/100 = 0.002016
按比例分配的分层抽样的估计方差:
3.5要调查甲乙两种疾病的发病率,从历史资料得知 ,甲种疾病的发病率为8%,乙种疾病的发病率为 5%,求:
(1)要得到相同的标准差0.05,采用简单随机抽样各 需要多大的样本量?
(2)要得到相同的变异系数0.05,又各需要多大的样 本量?
3.5解:已知 P1= 0.08, Q1= 1-P1 = 0.92;
第三章 简单随机抽样
3.3为调查某中学学生的每月购书支出水平,在全校 名学生中,用不放回简单随机抽样的方法抽得一 个的样本。对每个抽中的学生调查其上个月的购 书支出金额 yi (如表1所示)。
(1)在95%的置信度下估计该校学生该月平均购书支 出额;
(2)试估计该校学生该月购书支出超出70元的人数;
p n1 8 0.267 n 30
1 f N n 1750 30 0.03389 n 1 (n 1)N 29 1750
pq p(1 p) 0.267 0.733 0.1957
(1 f ) pq 0.03389 0.1957 0.08144 n 1
1 0.0167 2n
因此,对该校学生某月的人均购书支出额的估计为56.07 (元),由于置信度95%对应的 t=1.96, 所以,可以以95%的把 握说该,学生该月的人均购书支出额大约在56.07±1.96×5.115, 即50.96--61.19元之间。
(2)易知,N=1750,n=30, n1 8 t=1.96
11 12 13 14 15 16 17 18 19 20
支出额 (元)
20 75 34 41 58 63 95 120 19 57
样本 序号
21 22 23 24 25 26 27 28 29 30
支出额 (元)
49 45 95 36 25 45 128 45 29 84
3.3解:(1)依据题意和表1的数据,有:
(3)如果要求相对误差限不超过10%,以95%的置信 度估计该校学生该月购书支出超出70元的人数比 例,样本量至少应为多少。
表1 30名学生某月购书支出金额的样本数据
样本 序号
1 2 3 4 5 6 7 8 9 10
支出额 (元)
85 62 42 15 50 39 83 65 32 46
样本 序号
V(Pprop) ≈ΣhWh2 [(1—fh)/nh] Ph Qh ≈ n-1ΣhWh Ph Qh = n-1[0.2*0.1*0.9+0.3*0.2*0.8+0.5*0.4*0.6]
= 0.186 n-1 故 n ≈ 92.26 ≈93
4.8 解 已知W1=0.7,W2=0.3,p1=1/43,p2=2/57 (1)简单随机抽样 Psrs=(1+2)/100=0.03 V(P)=PQ/(n-1)=0.03*0.97/99=0.0002937 (2)事后分层 Ppst=ΣhWhph=0.7*1/43+0.3*2/57=0.0268 V(Ppst) =ΣhWh2[(1—fh)/(nh—1)]phqh =0.72*[1/42](1/43)(42/43)+0.32*[1/56](2/57)(55/57) =0.00031942
n02
0.95 0.052 0.05
7600
第四章 分层抽样
4.3解: (1) yst 20.0( 7 元),s( yst ) 3.0(8 元) (2)按比例分配 n=186,n1=57,n2=92,n3=37 (3)Neyman分配 n=175,n1=33,n2=99,n3=43 4.5 yst 75.7( 9 元),置信区间(60.63,90.95)元。
yi
1682,
y
1682 30
56.07(元),
s
2 y
(118266 16822
/ 30) / 30
798.73
1 f N n 1750 30 0.03276 b2 4ac n n N 30 1750
v( y) 0.03276 798.73 26.168
se( y) v( y) 5.115
第五章 比率估计与回归估计
5.2 N=2000, n=36, 1-α=0.95, t=1.96, f = n/N=0.018, v(Rˆ) 0.000015359, se(Rˆ) =0.00392 置信区间为[40.93%,42.47%]。
P 的95%的置信区间为:
p
(u
1
2
(1 f ) pq 1 ) 0.267 (1.96 0.08144 0.0167) n 1 2n
=(0.0907,0.4433)
N1的95%的置信区间为: (159,776)
(3)N=1750,n=30,n1=8, t=1.96, p=0.267, q=1-0.267=0.733
由此可计算得:
n0
t2q r2 p
1.962 0.733 0.01 0.267
1054.64
n = n0/[1+(n0—1)/N] = 1054.64/[1+1053.64/1750]=658.2942 = 659
计算结果说明,至少应抽取一个样本量为659的简单随机 样本,才能满足95%置信度条件下相对误差不超过10%的精度 要求。
应用抽样技术答案
第二章 抽样技术基本概念
2.7(1)抽样分布: 3 3.67 4.33 5 5.67 6.33 7
1/10 1/10 2/10 2/10 2/10 1/10 1/10 (2)期望为5,方差为4/3 (3)抽样标准误1.155 (4)抽样极限误差2.263 (5)置信区间(3.407,7.933)
P2= 0.05, Q2 = 1– P2 = 0.95;
V(p) = 0.05*0.05
PQ
(1) 由
n0
V ( p)
得:
,
n01
0.08 0.92 0.052
30
n02
0.05 0.95 0.052 Nhomakorabea 19(2 )
Q 由 n0 Cv2 ( p)P 得:
n01
0.92 0.052 0.08
4600