抽样技术课件 第三章(分层抽样)
合集下载
分层抽样(人教版)PPT教学课件
1、分层抽样的定义及特点是什么? 2、通过对三种抽样方法的比较,学会选
择适当正确的方法进行抽样。
2020/12/10
12
PPT教学课件
谢谢观看
Thank You For Watching
13
2020/12/10
6
3、步骤:
a、根据已经掌握的信息,将总体分成互 不交叉的分层
b、根据总体中的个数N和样本容量n计算抽 样比n/N。
c、确定第i层应抽取的个体数目 ni Ni k 使得n i 之和等于n。
d、在每一层进行抽样(可采取简单随机抽样
或系统抽样),然后把所抽取的样本合在一
起。2020/12/10
中在任抽意取抽的取样2本0人中进有行青调年查职.工这3种2抽人样,方则法该是样(本
)中的老年职工人数为( )
(A)9
(B)18 (C)27 (D) 36
A.简单随机抽样法
B.抽签法
C.随机数表法
D.分层抽样法
2020/12/10
10
课堂练习
做导学案【课堂检测】1~4
2020/12/10
11
课堂小结
7
讨论
1、分小组讨论第61页的“探究”(2), 提出各小组的解决方案,并推荐一人作小组 发言:
2、比较三种抽样(简单随机抽样、系统 抽样、分层抽样)各自特点和适用范围,填 表。
2020/12/10
8
2020/12/10
9
高考链接
生健青 工 身康5职人体01情02.工数状(人.况(是况42,3,20老,000女人从09年现生陕8,男其重职采4西生0中庆工 用高0中青高人 分人考任年考数 层,)意职)的 抽为某抽工某样2了单倍取1校方解位6。2高法该05共为人人三进年有了,,年行级老解中从级调学、职年女有查生中工职生男,的、
择适当正确的方法进行抽样。
2020/12/10
12
PPT教学课件
谢谢观看
Thank You For Watching
13
2020/12/10
6
3、步骤:
a、根据已经掌握的信息,将总体分成互 不交叉的分层
b、根据总体中的个数N和样本容量n计算抽 样比n/N。
c、确定第i层应抽取的个体数目 ni Ni k 使得n i 之和等于n。
d、在每一层进行抽样(可采取简单随机抽样
或系统抽样),然后把所抽取的样本合在一
起。2020/12/10
中在任抽意取抽的取样2本0人中进有行青调年查职.工这3种2抽人样,方则法该是样(本
)中的老年职工人数为( )
(A)9
(B)18 (C)27 (D) 36
A.简单随机抽样法
B.抽签法
C.随机数表法
D.分层抽样法
2020/12/10
10
课堂练习
做导学案【课堂检测】1~4
2020/12/10
11
课堂小结
7
讨论
1、分小组讨论第61页的“探究”(2), 提出各小组的解决方案,并推荐一人作小组 发言:
2、比较三种抽样(简单随机抽样、系统 抽样、分层抽样)各自特点和适用范围,填 表。
2020/12/10
8
2020/12/10
9
高考链接
生健青 工 身康5职人体01情02.工数状(人.况(是况42,3,20老,000女人从09年现生陕8,男其重职采4西生0中庆工 用高0中青高人 分人考任年考数 层,)意职)的 抽为某抽工某样2了单倍取1校方解位6。2高法该05共为人人三进年有了,,年行级老解中从级调学、职年女有查生中工职生男,的、
分层抽样 课件
B.某社区有500户家庭,其中高收入的家庭125户,中等收入的家庭
280户,低收入的家庭95户,为了了解生活购买力的某项指标,要从中
抽取一个容量为100户的样本
C.从1 000名工人中抽取100人调查上班途中所用时间
D.从生产流水线上抽取样本检查产品质量
解析:A项中总体所含个体无差异且个数较少,适合用简单随机抽
岁的职工;50岁及其以上的职工.
(2)确定每层抽取个体的个数,抽样比为
1
100
500
1
= ,
5
则在不到35 岁的职工中抽取 125× = 25(人);
5
1
在 35 岁到 49 岁的职工中抽取 280× = 56(人);
5
1
在 50 岁及其以上的职工中抽取 95× = 19(人).
5
(3)在各层分别按抽签法或随机数法抽取样本.
(4)抽样:各层分别按简单随机抽样或系统抽样的方法抽取
样本.(Biblioteka )成样:综合各层抽样,组成样本分层,计算,定数,抽样,成样
当总体由差异明显的几部分组成时,往往采用分层抽样
归纳总结分层抽样的特点:
(1)分层抽取;
(2)按比例抽取;
(3)必须结合简单随机抽样或系统抽样完成.
【做一做】 有一批产品,其中一等品10件,二等品25件,次品5件.
数目 =
样本容量
总体容量
× 该层个体数目.
2.选择抽样方法的原则
剖析:(1)若总体由差异明显的几部分组成,则选用分层抽样.
(2)若总体所含个体没有差异,则考虑采用简单随机抽样或系统抽
样.
当总体容量较小时宜用抽签法;当总体容量较大,样本容量较小
时宜用随机数法;当总体容量较大,样本容量也较大时宜用系统抽
280户,低收入的家庭95户,为了了解生活购买力的某项指标,要从中
抽取一个容量为100户的样本
C.从1 000名工人中抽取100人调查上班途中所用时间
D.从生产流水线上抽取样本检查产品质量
解析:A项中总体所含个体无差异且个数较少,适合用简单随机抽
岁的职工;50岁及其以上的职工.
(2)确定每层抽取个体的个数,抽样比为
1
100
500
1
= ,
5
则在不到35 岁的职工中抽取 125× = 25(人);
5
1
在 35 岁到 49 岁的职工中抽取 280× = 56(人);
5
1
在 50 岁及其以上的职工中抽取 95× = 19(人).
5
(3)在各层分别按抽签法或随机数法抽取样本.
(4)抽样:各层分别按简单随机抽样或系统抽样的方法抽取
样本.(Biblioteka )成样:综合各层抽样,组成样本分层,计算,定数,抽样,成样
当总体由差异明显的几部分组成时,往往采用分层抽样
归纳总结分层抽样的特点:
(1)分层抽取;
(2)按比例抽取;
(3)必须结合简单随机抽样或系统抽样完成.
【做一做】 有一批产品,其中一等品10件,二等品25件,次品5件.
数目 =
样本容量
总体容量
× 该层个体数目.
2.选择抽样方法的原则
剖析:(1)若总体由差异明显的几部分组成,则选用分层抽样.
(2)若总体所含个体没有差异,则考虑采用简单随机抽样或系统抽
样.
当总体容量较小时宜用抽签法;当总体容量较大,样本容量较小
时宜用随机数法;当总体容量较大,样本容量也较大时宜用系统抽
分层随机抽样概论(PPT 50张)
4
2019/2/15
例题
例如,对全国范围汽车运输的抽样调查,调查目的不 仅要推算全国货运汽车完成的运量,还要推算不同经 济成分(国有、集体、个体)汽车完成的运量。 为组织的方便,首先将货运汽车总体按省分层,由 各省运输管理部门负责省内的调查工作。 各省再将省内拥有的汽车按经济成分分层。 为提高抽样效率,再对汽车按吨位分层。 例如,某高校对学生在宿舍使用电脑的情况进行调查, 根据经验,本科生和研究生拥有电脑的状况差异较大。 因此,在抽样前对学生按本科生和研究生进行分层 是有必要的。
st
W 2 VY VY h h s t
h 1
L
只要对各层估计无偏,则总体估计也无偏。
各层可以采用不同的抽样方法,只要相应的估计量 是无偏的,则对总体的推算也是无偏的。
8
2019/2/15
证明性质1
由于对每一层有 L L ˆ ˆ ˆ E Y E W Y W E Y st hh h h 因此, h 1 1 h L L L 1 1 Y W Y N Y Y Y h h h h h N N N h 1 h 1 h 1 估计量的方差 L L L L ˆ ˆ ˆ ˆ 2ˆ V Y V W Y W V Y 2 W W Cov Y , Y st h h h h h k hk h 1 h 1 h 1 k h 由于各层是独立抽取的,因此上式第二项中的协方差全 L 为0,从而有
二、分层原则:
总体中的每一个单元一定属于并且只属于某一个层,而不可能同时属于两个 层或不属于任何一个层。
1.估计:层内单元具有相同性质,通常按调查对 象的不同类型进行划分。 2.精度:尽可能使层内单元的指标值相近,层间 单元的差异尽可能大,从而达到提高抽样估计精 度的目的。 3.估计和精度:既按类型、又按层内单元指标值 相近的原则进行多重分层,同时达到实现估计类 值以及提高估计精度的目的。 4.实施:抽样组织实施的方便,通常按行政管理 机构设置进行分层。
2019/2/15
例题
例如,对全国范围汽车运输的抽样调查,调查目的不 仅要推算全国货运汽车完成的运量,还要推算不同经 济成分(国有、集体、个体)汽车完成的运量。 为组织的方便,首先将货运汽车总体按省分层,由 各省运输管理部门负责省内的调查工作。 各省再将省内拥有的汽车按经济成分分层。 为提高抽样效率,再对汽车按吨位分层。 例如,某高校对学生在宿舍使用电脑的情况进行调查, 根据经验,本科生和研究生拥有电脑的状况差异较大。 因此,在抽样前对学生按本科生和研究生进行分层 是有必要的。
st
W 2 VY VY h h s t
h 1
L
只要对各层估计无偏,则总体估计也无偏。
各层可以采用不同的抽样方法,只要相应的估计量 是无偏的,则对总体的推算也是无偏的。
8
2019/2/15
证明性质1
由于对每一层有 L L ˆ ˆ ˆ E Y E W Y W E Y st hh h h 因此, h 1 1 h L L L 1 1 Y W Y N Y Y Y h h h h h N N N h 1 h 1 h 1 估计量的方差 L L L L ˆ ˆ ˆ ˆ 2ˆ V Y V W Y W V Y 2 W W Cov Y , Y st h h h h h k hk h 1 h 1 h 1 k h 由于各层是独立抽取的,因此上式第二项中的协方差全 L 为0,从而有
二、分层原则:
总体中的每一个单元一定属于并且只属于某一个层,而不可能同时属于两个 层或不属于任何一个层。
1.估计:层内单元具有相同性质,通常按调查对 象的不同类型进行划分。 2.精度:尽可能使层内单元的指标值相近,层间 单元的差异尽可能大,从而达到提高抽样估计精 度的目的。 3.估计和精度:既按类型、又按层内单元指标值 相近的原则进行多重分层,同时达到实现估计类 值以及提高估计精度的目的。 4.实施:抽样组织实施的方便,通常按行政管理 机构设置进行分层。
抽样技术第三章_分层随机抽样
4
4
4
ˆ v Y ˆ 23208 s Y
ˆ 209650 2 23208 ˆ ts Y Y
2015/11/6
23
三、对总体比例的估计
总体比例P的估计为:pst Wh ph
h 1
L
估计量的性质
对于一般的分层抽样,如果 ph是 P h 的无偏估计 (h 1,2,, L ),则 pst 是 P的无偏估计。 p 的方差为:
W 2V Y V Y h h st
h1
L
只要对各层估计无偏,则总体估计也无偏。
各层可以采用不同的抽样方法,只要相应的估计量是无 偏的,则对总体的推算也是无偏的。
11
2015/11/6
证明性质1
由于对每一层有
ˆ Y EY h h
L L ˆ ˆ ˆ E Y E W Y W E Y st h h h h 因此, h1 h1
L
L
N Y hh
h 1
L
分层随机样本,总体均值 Y 的简单估计
1 y st Wh y h N h 1
N
h 1
L
h
yh
10
2015/11/6
估计量的性质
是 Yh 的无 性质1&2:对于一般的分层抽样,如果 Y h 偏估计( h 1,2, , L ),则 Y 是Y 的无偏估计。 st Yst 的方差为:
7
三、符号
所有总体参数的估计量都采用下标“st”以示区别:
记 号 代表的含义
h
下标
i
分层抽样 课件
【思维·引】当总体由差异明显的几部分组成时,该样 本的抽取适合用分层抽样,结合题目中的四个选项及分 层抽样的特点可对题目作出判断.
【解析】1.选C.教师各部分之间有明显的差异,所以适 合分层抽样. 2.选B.A中总体中的个体无明显差异且个数较少,适合 用简单随机抽样;C和D中总体中的个体无明显差异且个 数较多,适合用系统抽样;B中总体中的个体差异明显, 适合用分层抽样.
分层抽样
1.分层抽样 一般地,在抽样时,将总体分成互不交叉的层,然后按照 一定的比例,从各层独立地抽取一定数量的个体,将各 层取出的个体合在一起作为样本,这种抽样的方法是一 种分层抽样.
【思考】 在什么情况下适用分层抽样? 提示:当总体是由差异明显的几部分组成时,往往选用 分层抽样的方法.
2.分层抽样的实施步骤 第一步,按某种特征将总体分成若干部分(层). 第二步,计算抽样比.抽样比= 样本容量 .
A.3
B.4
C.5
D.6
【思维·引】观察特征→确定抽样方法→求出比例→ 确定各层样本数→从各层中抽样→成样
【解析】选B.根据分层抽样的特点可知,抽样比例为
12 1 ,则应抽取的中型城市数为16× 1 =4.
48 4
4
【内化·悟】 设计分层抽样问题时,各层之间抽样方法有什么共同点? 各层抽样时方法必须一样吗?
类型一 分层抽样概念理解
【典例】1.某中学有老年教师20人,中年教师65人,青
年教师95人.为了调查他们的健康状况,需从他们中抽
取一个容量为36的样本,则合适的抽样方法是 ( )
A.抽签法
B.系统抽样
C.分层抽样
D.随机数法
2.下列问题中,最适合用分层抽样抽取样本的是( ) A.从10名同学中抽取3人参加座谈会 B.从参加模拟考试的1 200名高中生中随机抽取100人 分析试题作答情况 C.从1 000名工人中,抽取100名调查上班途中所用时间 D.从生产流水线上,抽取样本检查产品质量
分层抽样课件
结论与展望
1 结论
分层抽样是一种有效的样本抽取方法,能够在样本代表性和准确性之间保持平衡。
2 展望
未来需要进一步研究和发展分层抽样技术,结合新的实践经验,完善分层抽样理论和方 法。
参考文献
莫德尔·哈立德
分层随机抽样方法及其应用
王淑琴等
大规模样本调查的设计和实施
李维华等
分层抽样理论与实践
类型和特点
等比分层抽样
每层样本占总体比例相同,适合于做分层总 量估计。
多阶段分层抽样
将抽样过程分为多个阶段进行,适合于大规 模复杂样本调查。
等距分层抽样
每层样本之间间隔相等,适合于大体积、难 抽罕见样本。
总体分层抽样和样本分层抽样
前者是对整个总体做分层,后者是对已抽样 的数据再做分层。
设计和方法
分层抽样PPT课件
欢迎来到本次PPT课件,我们将一起来探讨分层抽样的背景、类型、设计和 优缺点,以及它在实际应用中的案例分析。
背景介绍
调查
概念
分层抽样是从总体中选出样本时的一种抽样方法, 它可以提高样本的代表性和准确性。
分层抽样是指根据总体的某些特征将总体分成若 干层,并从各个层中分别抽取样本的
根据实际情况分层,考虑分组的数量和层次关系。
2
确定每层的样本容量
根据分层原则,控制每层样本的误差范围,确定每层的样本容量。
3
选择样本时的误差控制
控制抽样的误差类型和范围,保证抽样结果的准确性。
4
确定样本容量的大小
通过统计学方法和经验确定样本容量大小。
优点和缺点
优点
1. 提高样本的代表性和准确性。 2. 能够应对总体的复杂性和分层需求。
缺点
分层随机抽样(课件)
i1 ;w i1
i1 .
M N
mn
• 探究 与考察简单随机抽样估计效果类似, 小明也想通过多次抽样考察一
•下分层随机抽样的估计效果. 他用比例分配的分层随机抽样, 从高一年级的学生中抽取 了10个样本量为50的样本, 计算出样本平均数如下表所示. 与上一节“探究”中相同样本量 的简单随机抽样的结果比较,小明有了一个重要的发现. 你是否也有所发现?
100
100
1.分层抽样
当已知总体由差异明显的几部分组 成时,为了使样本更充分地反映总体的 情况,常将总体分成几个部分,然后按 照各部分所占的比例进行抽样,这种抽 样叫做“分层抽样”,其中所分成的各 部分叫作“层”.
解:(1)男生应抽取 100 490 49人,女生应抽取 100 510 51人.
490 510
490 510
∴样本平均数为 49 70.2 51 160.8 165.4(cm).
100
100
(2) 应按(1)的方法进行改进更合理,即高二年级全体学生的平均身高估计为
49 170.2 51 160.8 165.4(cm).
9.1.2分层随机抽样
温故知新
1、简单随机抽样
简单随机抽样 :
设一个总体的个体数为 N。如果通过逐个抽取的方 法从中抽取一个样本,且每次抽取时各个个体被抽到 的概率相等,就称这样的抽样为简单随机抽样。
[注]简单随机抽样有以下特点: (1)它要求被抽取样本的总体的个体数是有限的; (2)它是从总体中逐个地进行抽取; (3)它是一种不放回的抽样; (4)它是一种等概率抽样。(为什么?)
抽样序号
1
2
3
4
5
6
7
8
9 10
抽样调查理论与方法 金勇进(第二版)第3章-分层随机抽样
h 1
L
定理 3.3:对于分层随机抽样, 的估 Y 计量 yst 具有如下性质:
E yst Y
ˆ W 2 1 fh S 2 V yst W V Yh h n h h 1 h 1 h
L L 2 h 2 2 L Wh2 S h Wh2 S h nh Nh h 1 h 1 L
2013-8-10
18
3.3 比率估计量及其性质
两种途径:
分别比估计:对每层样本分别考虑比估计量,然 后对各层的比估计量进行加权平均,即先“比” 后“加权”; 联合比估计:对比率的分子和分母分别加权计算 出总体均值或总体总量的分层估计量,然后用对 应的分层估计量来构造比估计,即先“加权”后 “比”。
2013-8-10
5
符号说明 (关于第h层的记号 )
层号
h 1,2, , L
单元总数
Nh
nh y hi
Wh
样本单元数
第 i 个单元的值
层权
抽样比
1 Yh Nh
Nh 2 h
y
i 1
Nh
hi
总体均值
样本均值
nh fh Nh
Nh N
2 1 S y hi Yh N h 1 i 1
1 yh nh
y
i 1
nh
hi
总体方差
样本方差
2013-8-10
1 nh 2 sh y hi y h 2 nh 1 i1
6
3.2 简单估计量及其性质
3.2.1 总体均值的简单估计及其性质
分层样本,总体均值 Y 的估计
WY 1 Yst h h N h 1
L
定理 3.3:对于分层随机抽样, 的估 Y 计量 yst 具有如下性质:
E yst Y
ˆ W 2 1 fh S 2 V yst W V Yh h n h h 1 h 1 h
L L 2 h 2 2 L Wh2 S h Wh2 S h nh Nh h 1 h 1 L
2013-8-10
18
3.3 比率估计量及其性质
两种途径:
分别比估计:对每层样本分别考虑比估计量,然 后对各层的比估计量进行加权平均,即先“比” 后“加权”; 联合比估计:对比率的分子和分母分别加权计算 出总体均值或总体总量的分层估计量,然后用对 应的分层估计量来构造比估计,即先“加权”后 “比”。
2013-8-10
5
符号说明 (关于第h层的记号 )
层号
h 1,2, , L
单元总数
Nh
nh y hi
Wh
样本单元数
第 i 个单元的值
层权
抽样比
1 Yh Nh
Nh 2 h
y
i 1
Nh
hi
总体均值
样本均值
nh fh Nh
Nh N
2 1 S y hi Yh N h 1 i 1
1 yh nh
y
i 1
nh
hi
总体方差
样本方差
2013-8-10
1 nh 2 sh y hi y h 2 nh 1 i1
6
3.2 简单估计量及其性质
3.2.1 总体均值的简单估计及其性质
分层样本,总体均值 Y 的估计
WY 1 Yst h h N h 1
2.1.3分层抽样课件人教新课标
步骤3—定数:确定每一层应抽取的个体数目,并使每一层 应抽取的个体数目之和为样本容量 步骤4—抽样:按步骤3确定的数目在各层中随机抽取个体, 合在一起得到样本
当你每天醒来,口袋里便装着24小时的时 间,这是属于你自己最宝贵的财产.
(2)每次 抽出个体 后不再将 它放回, 即不放回 抽样
各自特点
联系
适用 范围
从总体中逐 个抽取
是系统抽样 总体中 和分层抽样 个体较 的基础 少
将总体平均分成 几部分,按预先 制定的规则在各 部分抽取
将总体分成几 层,分层进行 抽取
在起始部分 总体中 时采用简单 个体较 随机抽样 多
各层抽样时 采用简单随 机抽样或系 统抽样
160 则样本中的老年职工人数为 90 86 18.
430
3.某工厂生产A、B、C三种不同型号的产品,相应产品 数量比为2∶3∶5,现用分层抽样方法抽取一个容量为n 的样本,样本中A型号产品有16件,那么样本的容量 n=_8_0__.
解:由已知得: 2 n=∴1n6,=80.
10
答案:80
4.某农场在三种地上种玉米,其中平地210亩,河沟地 120亩,山坡地180亩,估计产量时要从中抽取17亩作为 样本,则平地、河沟地、山坡地应抽取的亩数分别是 __7_,4__,6___.
160人,中年职工人数是老年职工人数的2倍.为了解职
工身体状况,现采用分层抽样方法进行调查,在抽取的
样本中有青年职工32人,则该样本中的老年职工人数为27
(D)36
解:选B.由已知得中年职工人数和老年职工人数共为 430-160=270(人). 中年职工人数是老年职工人数的2倍,则 中年职工人数为180,老年职工人数为90, 样本的容量为 32 430 86,
9.1.2 分层抽样课件(共32张PPT)
9.1.2 分层随机抽样 9.1.3 获取数据的途径
复习回顾
1、简单随机抽样的概念:
设一个总体含有有限个个体,并记其个体数为 N.如果通过逐个抽取的方法从中抽取一个样本, 且每次抽取时各个个体被抽到的机会相等,就称这 样的抽样为简单随机抽样.
2、简单随机抽样的特点:
①总体个数有限;②逐个进行抽取;③机会均等抽样.
8、某中学高一年级有学生600人,高二年级有
学生450人,高三年级有学生750人,若该校取一
个容量为n的样本,每个学生被抽到的可能性均
讲 课
为0.2,
则n=
360 .
人
:
邢
启 强
17
巩固练习
9、某单位有职工160人,其中业务员有104人,管 理人员32人,后勤24人,现用分层抽样从中抽取
一容量为20的样本,则抽取管理人员( B)人
人、60 人。 (3)将300人组到一起,即得到一个样本。
讲
课
人
:
邢
启 强
13
巩固练习
3.某公司共有1000名员工,下设若干部门, 现用分层抽样法,从全体员工中抽取一个容 量为80的样本,已知策划部被抽取4个员工,
求策划部的员工人数是多少? 50人.
4. 某中学有180名教职员工,其中教学人员 144人,管理人员12人,后勤服务人员24人, 设计一个抽样方案,从中选取15人去参观学习.
Mx Ny M N
M M N
x N M N
y
估计总体平均数 W
对各层样本平均数加权(层权)求和
M
N
xi yi
w i1
i1
m
x
n
y
M
x
复习回顾
1、简单随机抽样的概念:
设一个总体含有有限个个体,并记其个体数为 N.如果通过逐个抽取的方法从中抽取一个样本, 且每次抽取时各个个体被抽到的机会相等,就称这 样的抽样为简单随机抽样.
2、简单随机抽样的特点:
①总体个数有限;②逐个进行抽取;③机会均等抽样.
8、某中学高一年级有学生600人,高二年级有
学生450人,高三年级有学生750人,若该校取一
个容量为n的样本,每个学生被抽到的可能性均
讲 课
为0.2,
则n=
360 .
人
:
邢
启 强
17
巩固练习
9、某单位有职工160人,其中业务员有104人,管 理人员32人,后勤24人,现用分层抽样从中抽取
一容量为20的样本,则抽取管理人员( B)人
人、60 人。 (3)将300人组到一起,即得到一个样本。
讲
课
人
:
邢
启 强
13
巩固练习
3.某公司共有1000名员工,下设若干部门, 现用分层抽样法,从全体员工中抽取一个容 量为80的样本,已知策划部被抽取4个员工,
求策划部的员工人数是多少? 50人.
4. 某中学有180名教职员工,其中教学人员 144人,管理人员12人,后勤服务人员24人, 设计一个抽样方案,从中选取15人去参观学习.
Mx Ny M N
M M N
x N M N
y
估计总体平均数 W
对各层样本平均数加权(层权)求和
M
N
xi yi
w i1
i1
m
x
n
y
M
x
分层抽样ppt课件
3
知识回顾:
系统抽样
• 将总体分成均衡的n个部分,然后按照预 先定出的规则,从每一部分抽取一个个体, 得到容量为n的样本,这种抽样叫做系统 抽样(也称为机械抽样)。
注:在抽样过程中每个个体被抽取的概率也 是相同的
4
设计科学、合理的抽样方法,其核心 问题是保证抽样公平,并且样本具有好的 代表性。 例如要调查我校高一学生的平均身高, 由于男生一般比女生高,故用简单随机抽 样或系统抽样,都可能使样本不具有好的 代表性。对于此类抽样问题,我们需要一 个更好的抽样方法来解决。 下面我们探究:
分层抽样
5
探究 某地区有高中生2400人,初中生10800人,小学 生11100人,当地教育部门为了了解本地区中小 学生的近视率及其形成原因,要从本地区的中小 学生中抽取1%的学生进行调查。你认为应当如 何抽取样本?
• 不同年龄阶段的学生的近视情况可能存在明显差异,因 此,宜将全体学生分成高中、初中和小学三部分分别抽 样。另外,三部分的学生人数相差较大,因此,为了提 高样本的代表性,还应考虑他们在样本中所占比例的大 小。
分层抽样
7
分层抽样
一般地,在抽样时,将总体分成互不交 叉的层,然后按照一定的比例,从各层独立 地抽取一定数量的个体,将各层取出的个体 合在一起作为样本,这种抽样的方法叫分层 抽样。
适用范围:分层抽样适用于总体由差异明显的几部分构成
8
分层抽样的操作步骤为:
第一步,计算样本容量与总体的个体数之比。 第二步,将总体分成互不交叉的层,按比例确定各 层要抽取的个体数。 第三步,用简单随机抽样或系统抽样在各层中抽取 相应数量的个体。 第四步,将各层抽取的个体合在一起,就得到所取 样本。
• 注:样本容量与总体的个数之比是分层抽样的比例常数, 按这个比例可以确定各层应抽取的个体数,如果各层应抽 取的个体数不都是整数该如何处理? 应该调整样本容量,剔除个体
知识回顾:
系统抽样
• 将总体分成均衡的n个部分,然后按照预 先定出的规则,从每一部分抽取一个个体, 得到容量为n的样本,这种抽样叫做系统 抽样(也称为机械抽样)。
注:在抽样过程中每个个体被抽取的概率也 是相同的
4
设计科学、合理的抽样方法,其核心 问题是保证抽样公平,并且样本具有好的 代表性。 例如要调查我校高一学生的平均身高, 由于男生一般比女生高,故用简单随机抽 样或系统抽样,都可能使样本不具有好的 代表性。对于此类抽样问题,我们需要一 个更好的抽样方法来解决。 下面我们探究:
分层抽样
5
探究 某地区有高中生2400人,初中生10800人,小学 生11100人,当地教育部门为了了解本地区中小 学生的近视率及其形成原因,要从本地区的中小 学生中抽取1%的学生进行调查。你认为应当如 何抽取样本?
• 不同年龄阶段的学生的近视情况可能存在明显差异,因 此,宜将全体学生分成高中、初中和小学三部分分别抽 样。另外,三部分的学生人数相差较大,因此,为了提 高样本的代表性,还应考虑他们在样本中所占比例的大 小。
分层抽样
7
分层抽样
一般地,在抽样时,将总体分成互不交 叉的层,然后按照一定的比例,从各层独立 地抽取一定数量的个体,将各层取出的个体 合在一起作为样本,这种抽样的方法叫分层 抽样。
适用范围:分层抽样适用于总体由差异明显的几部分构成
8
分层抽样的操作步骤为:
第一步,计算样本容量与总体的个体数之比。 第二步,将总体分成互不交叉的层,按比例确定各 层要抽取的个体数。 第三步,用简单随机抽样或系统抽样在各层中抽取 相应数量的个体。 第四步,将各层抽取的个体合在一起,就得到所取 样本。
• 注:样本容量与总体的个数之比是分层抽样的比例常数, 按这个比例可以确定各层应抽取的个体数,如果各层应抽 取的个体数不都是整数该如何处理? 应该调整样本容量,剔除个体
第三章分层随机抽样
第三章分层随机抽样
§3.1 引言
§3.2 估计量
§3.3 样本量在各层的分配§3.4 样本量的确定
附录一
附录二
§3.1 引言⏹定义与特点➢定义
➢特点
※分层抽样的抽样效率高(即分层抽样的估计精度高)。
①层抽样估计量的方差只与层内方差有关,与层间方
差无关。
通过分层,尽可能降低层内差异,使层间差异增大,从而提高估计精度。
②从直观的角度来看,分层抽样可以使样本在总体中
分布比较均匀。
※分层抽样不仅可以对总体指标进行推算,也可以对各层指标进行推算。
▪使用场合
符号说明
§3.2 估计量
⏹总体均值的估计➢简单估计量的定义
➢简单估计量的性质
⏹总体总量的估计➢简单估计量的定义
➢简单估计量的性质
⏹总体比例的估计➢简单估计量的定义
➢估计量的性质
§3.3 样本量在各层的分配 比例分配
➢比例分配下总体均值估计
➢比例分配下总体总值估计
➢比例分配下总体比例估计
最优分配
➢Neyman(内曼)分配
▪考虑估计总体比例P的情形
§3.4 样本量的确定 影响样本量的因素
➢估计总体均值的情形
➢总体参数为P的情形。
分层随机抽样
•
V (YˆRC ) V (YˆRS )
• •
因用如此 联 果合 各,当比 层n估 的h 计 样均量本大量时,n用h不分大Y别ˆR,比较C或好估者。计各量层YˆR的S否比则率,R
差异较小(成本考虑 R Rh 0近似成立,联
h
合比估计并非更好,而只是与分别比估计相
当,但联合比估计本身由于只需知道辅助变
L
P的简单估计为pst Whph
h1
且是pst的无偏估计。
(2)
L
pst的方差V(ps)t
Wh
2
V(p
)
h
h1
L h1
Wh 2
1 fh nh
Nh Nh
1
PhQh
L h1
Wh 2
1 fh nh
PhQh (当Nh很大时)
(3) pst的方差V(pst )的估计:
h1
h1
yst的方差为V(ys) t
L h1
Wh 2 V(y h)
L h1
Wh 2
1 fh nh
Sh2
^
Y 的方差V ( yst )的估计:
v( yst )
L
Wh 2
h1
1 fh nh
sh 2
且为V(y)的无偏估计。
Y的置信度为1 的置信区间为:
y st z s( y st ), y st z s( y st )
pst z
Vˆ ( pst ), pst z
2
2
18.33%,27.39%
Vˆ
(
pst
)
《抽样技术》第三章-分层随机抽样
记 ran ——简单随机抽样; prop ——按比例分配的分层随机抽样; opt ——最优分配的分层随机抽样。 均值估计量的方差分别用Vran,Vprop,Vopt表示。 从Vopt的定义必定有Vprop≥Vopt。nh (h=1,2, ⋯,L)不取 整时,使用公式
V prop
L
1 f n
则它是Y 的无偏估计。可计算出 1 f 1 2 7 2 2 2 V yst S1 S2 S3 n 10 30 3
2 S12 , S2 , S32 S 2 ,故 由经验知,应有
1 f V yst n 1 f n
1 2 7 2 2 2 S S S 30 3 10 S2 V y
2 h 2 h
1 L 1 L 2 2 2 Wh Sh Wh Sh Wh Sh n h1 N h1 h 1
L 2 h L 2
L
Vopt
W S Wh S 1 1 L 2 Wh Sh Wh Sh nh N n h1 N h1 h 1 h 1 V prop Vopt
2 L L 1 2 Wh Sh Wh Sh n h1 h1 2 1 L Wh Sh S n h1
其中S Wh Sh是Sh的加权平均值。
h 1
L
这是因为
n V prop Vopt Wh S Wh Sh h 1 h1
采用分层技术的主要理由
1.需要有总体的某些分类数据,且要具有规定的精 确度; 2.为便于行政管理而要求分层; 3.总体的各个不同部分的抽样问题可能显著地不同 ,即采用各自不同的抽样方法; 4.分层可能提高整个总体指标估计值的精确度。它 可以将一个内部差异很大的总体分成一些内部比较 相似的子总体。
V prop
L
1 f n
则它是Y 的无偏估计。可计算出 1 f 1 2 7 2 2 2 V yst S1 S2 S3 n 10 30 3
2 S12 , S2 , S32 S 2 ,故 由经验知,应有
1 f V yst n 1 f n
1 2 7 2 2 2 S S S 30 3 10 S2 V y
2 h 2 h
1 L 1 L 2 2 2 Wh Sh Wh Sh Wh Sh n h1 N h1 h 1
L 2 h L 2
L
Vopt
W S Wh S 1 1 L 2 Wh Sh Wh Sh nh N n h1 N h1 h 1 h 1 V prop Vopt
2 L L 1 2 Wh Sh Wh Sh n h1 h1 2 1 L Wh Sh S n h1
其中S Wh Sh是Sh的加权平均值。
h 1
L
这是因为
n V prop Vopt Wh S Wh Sh h 1 h1
采用分层技术的主要理由
1.需要有总体的某些分类数据,且要具有规定的精 确度; 2.为便于行政管理而要求分层; 3.总体的各个不同部分的抽样问题可能显著地不同 ,即采用各自不同的抽样方法; 4.分层可能提高整个总体指标估计值的精确度。它 可以将一个内部差异很大的总体分成一些内部比较 相似的子总体。
分层抽样 课件
分层抽样的概念及应用
【例1】 一个单位有职工500人,其中不到35岁的有125 人,35~49岁的有280人,50岁及以上的有95人,为了了解这 个单位职工与身体状况有关的某项指标,要从中抽取100名职 工作为样本,职工年龄与这项指标有关,应该怎样抽取?
【解题探究】由于职工年龄与这项指标有关,所以应选取 分层抽样来抽取样本.
A.该抽样一定是系统抽样 B.该抽样一定是分层抽样 C.该抽样可能是简单随机抽样 D.以上说法都不正确
【错解】B 【错因】分层抽样中每一层的比例都相等,但是每一层比 例都相等的抽样不一定是分层抽样,也有可能是系统抽样或者 简单随机抽样. 【正解】该抽样中,每个人被抽中的机会都相等,故该抽 样可能是简单随机抽样、系统抽样或分层抽样.故选C. 【警示】简单随机抽样、系统抽样和分层抽样都是随机抽 样的,所以都有每个个体被抽中的机会相同这一共同点.区分 好各个抽样的适用范围,采用最合适的抽样方法进行抽样.
三种抽样方法的比较
【例2】 为了解某地区的中小学生的视力情况,拟从该
地区的中小学生中抽取部分学生进行调查,事先已了解到该地
区小学、初中、高中三个学段学生的视力情况有较大差异,而
男女生视力情况差异不大.在下面的抽样方法中,最合理的抽
样方法是( )
A.简单随机抽样
B.按性别分层抽样
C.按学段分层抽样 D.系统抽样
分层抽样的前提和遵循的两条原则 1.前提:分层抽样使用的前提是总体可以分层,层与层 之间有明显区别,而层内个体间差异较小,每层中所抽取的个 体数按各层个体数在总体中所占比例来分配. 2.遵循的两条原则: (1)将相似的个体归入一类,即为一层,分层要求每层的各 个个体互不交叉,即遵循不重复、不遗漏的原则; (2)分层抽样为保证每个个体等可能入样,需遵循在各层中 进行简单随机抽样,每层入样数量与每层个体数量的比等于抽 样比.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
估计量方差的证明
在一般分层抽样下
L L L L ˆ V W Y ˆ W 2V Y ˆ 2 ˆ ,Y ˆ VY W W Cov Y st h h h h h k h k h 1 k h h1 h1 L ˆ ˆ V Y W 2V Y
L 2 h L L 2 h
1 2 N
2 L Nh ( N h nh ) PhQh PhQh 2 Wh (1 f h ) Nh nh nh h 1 h 1
性质二的证明:
ph qh v( pst ) W v( ph ) W (1 f h ) nh 1 h 1 h 1
ˆ 2 2 1 fh 2 V (Yst ) V ( yst ) Wh V ( yh ) Wh Sh nh h 1 h 1
L L
1 fh 2 v( yst ) W v( yh ) W sh nh h 1 h 1
L 2 h L 2 h
无偏性的证明
在一般分层抽样下
ˆ Y EY h h
30
200
25
180
10
300
30
220
25
N1 200 N 2850 W1 0.07018 N 2850 n1 10 f1 0.05 nh 10 N1 200 n1 n1 1 2 2 1 y1i y1 1624.722 y1 y1i 39.5 s1 n1 1 i 1 n i 1
L L ˆ E W Y ˆ W EY ˆ EY st h h h h h1 h1
L
1 L 1 L Y WhYh N hYh Yh Y N h1 N h1 N h 1
在分层随机抽样下
ˆ y Y h h
所以无偏性也成立
h 1
L
L
ˆ ) N 2 W 2V (Y ˆ) ˆ ) N V (Y V (Y st st h h
2 h 1
注意:总体总量的估计,完全可以由总体均值来推算,因为它们只
相差一个常数。
性质二(分层随机抽样)
ˆ 是Y的无偏估计,即 ˆ ) Y Y E ( Y st st
ˆ ) N V(y ) N V (Y st st
i 1
ˆ Ny N W y Y st st h h
h 1
L
简单估计量: 由于没有其他总体信息的,这也是总体的简单估计量。
性质一(一般的分层抽样)
• 对于一般的分层抽样,如果每层的均值都是无 偏估计,则总体总量也是无偏估计。
ˆ ) N W E (Y ˆ) ˆ ) E ( NY E (Y h h st st
二、估计量
1、简单估计量
– 总体均值的估计 – 总体总量的估计 – 总体比例的估计
2、比率估计量
– 分别比率估计 – 联合比率估计
一、简单估计量
总体均值的估计 总体均值的期望 总体均值的方差 总体总量的估计 总体均值的期望 总体均值的方差 总体比例的估计 总体均值的期望 总体均值的方差
2 h
L
例3.2
• 在例3.1的调查中,同时调查了居民户拥有家庭电 脑的情况,获得如下数据(单位:台),要估计 该地区居民拥有家庭电脑的比例及估计的标准差。
例子
• 调查杭州的超市情况: 分成大超市和小超市两层。 如果在两层都独立进行简单随机抽样,则 为分层随机抽样。 如果在大超市一层中,先确定下沙物美必 定抽样。则为一般分层抽样。
3、分层抽样的符号说明
h层指标
总体指标 总体总量: N 总体层数:L 总体均值:Yst 总体总量:Yst 总体比例:Pst
2 h
4、分层抽样的作用
• 分层抽样的抽样效率比较高,也就是说分 层抽样的估计精度高。 • 分层抽样不仅能对总体指标进行推算,而 且能对各层指标进行推算。 • 层内抽样方法可以不同,而且便于抽样工 作的组织。
5、分层原则:
• 1. 估计:层内单元具有相同性质,通常按调查对 象的不同类型进行划分。 • 2. 精度:尽可能使层内单元的指标值相近,层间 单元的差异尽可能大,从而达到提高抽样估计精 度的目的。 • 3. 估计和精度:既按类型、又按层内单元指标值 相近的原则进行多重分层,同时达到实现估计类 值以及提高估计精度的目的。 • 4. 实施:抽样组织实施的方便,通常按行政管理 机构设置进行分层。
2 h 2 h
L
L
性质二的证明:
P h Qh V ( pst ) W V ( ph ) W (1 f h ) nh h 1 h 1
2 h 2 h L L
证明:因 为是分 层随机 抽样样,所 N h nh PhQh V ( ph ) , 及N h 1 N h N h 1 nh N h nh PhQh V ( pst ) W V ( ph ) W N h 1 nh h 1 h 1
E ( yst )
ˆ E(Yst )
V ( yst )
ˆ V (Yst )
E ( pst )V ( pst )
1、总体均值的估计
1 Y N
Y
i 1
N
N
i
L 1 L ˆ ˆ ˆ Yst WhYh N hY h N h 1 h 1
如果是分层随机抽样
1 Y N
Yi
i 1
层 居民户 总数 1 1 2 200 400 10 50 2 40 130 3 0 60 样本户奶制品年消费支出 4 110 80 5 15 100 6 10 55 7 40 160 8 80 85 9 90 160 10 0 170
3
4
750
1500
180
50
260
35
110
15
0
0
140
20
60
ˆ y W y Y h h st st
h 1
L
简单估计量: 由于没有其他总体信息的,这也是总体的简单估计量。
性质一(一般的分层抽样)
• 对于一般的分层抽样,如果每层的均值都是无 偏估计,则总体均值也是无偏估计。
ˆ ) E( W Y ˆ ) W E (Y ˆ) E (Y hh h h st
所以
1 fh 2 v y st W v y h W sh nh h 1 h 1
L 2 h L 2 h
2、总体总量的估计
Y Yi
i 1
N
ˆ NY ˆ Y ˆ NY Y h h ˆh st
h 1 h 1
L
L
如果是分层随机抽样
N
Y Yi
y3 165
y4 24
W4
N 4 1500 0.52632 N 2850
f4
n4 10 0.0067 N4 1500
ˆ N y Y h h
h 1
4
200 39.5 400 105 750 165 1500 24
2 2 2 1 fh 2 8 ˆ v Y N Wh v yh N h sh 5.93 10 nh h 1 h 1
209650
4
4
ˆ v Y ˆ 23208 s Y
ˆ ts Y
ˆ 209650 2 23208 Y
3、总体比例的估计 总体比例的估计,是总体均值估计的一 种特例,所以具有相同的特点。
1, Yi 0, 则有 A 1 P N N
简单估计量:
由于各层是独立进行的,所以协方差为0,即
st
h 1
h h
在分层随机抽样下,由于每层都是简单随机抽样,所以
1 fh 2 V yst W V yh W Sh nh h1 h1
L 2 h L 2 h
估计量的方差的估计的证明
在分层随机抽样下,
1 fh 2 v y h sh nh
第i个单元具有所考虑的特 征 其他
Y
i 1
N
i
Y pst Wh ph
h 1
L
由于没有其他总体信息的,这也是总体的简单估计量。
性质一(一般的分层抽样)
• 对于一般的分层抽样,如果每层都是无偏估计, 则总体比例也是无偏估计。
ˆ ) W E ( P ˆ ) E(P st h h
1
N 400 W2 2 0.14035 N 2850
f2
f3
n2 10 0.025 N 2 400
y2 105
s22 2166.667
s32 8205.556
2 s4 193.333
N 750 W3 3 0.26316 N 2850
n3 10 0.0133 N3 750
2 h 2 h
L
L
证明:因 为是分 层随机 抽样样, 所以 1 fh v ( ph ) ph qh nh 1 1 fh v( pst ) W v( ph ) W ph qh nh 1 h 1 h 1
L 2 h L 2 h
ph qh W (1 f h ) nh 1 h 1
单元总体:N h 样本单元数: nh 第i个单元标志值: yhi 层权:Wh n 抽样比:h Nh 1 h层总体均值: Yh Nh 1 h层样本均值: yh nh
2 h
Nh N
Y
i 1 nh i 1
Nh
hi
y
Hale Waihona Puke hi1 Nh h层总体方差: S (Yhi Yh ) 2 N h 1 i 1 1 nh h层样本方差: s ( yhi yh ) 2 nh 1 i 1