分层随机抽样

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第九章统计

9.1 随机抽样

9.1.2 分层随机抽样

教学设计

一、教学目标

1.通过实例了解分层随机抽样的特点和适用范围;

2.了解分层随机抽样的必要性;

3.掌握各层样本量化比例分配的方法.

二、教学重难点

1.教学重点

分层随机抽样的方法及计算.

2.教学难点

实际问题中抽样方法的选择与操作.

三、教学过程

(一)新课导入

在对树人中学高一年级学生身高的调查中,我们使用简单随机抽样,使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比较“极端”的样本.可能出现样本中50个个体大部分来自高个子或矮个子的情形.这种“极端”样本的平均数会大幅度地偏离总体平均数,从而使得估计出现较大的误差.

问题1 能否利用总体中的一些额外信息对抽样方法进行改进呢?

(二)探索新知

问题2 在树人中学高一年级的712名学生中,男生有326名、女生有386名.能否利用这个辅助信息改进简单随机抽样方法,减少“极端”样本的出现,从而提高对整个年级平均身高的估计效果呢?

影响身高的因素有很多,性别是其中的一个主要因素.我们可以利用性别和身高的这种关系,把高一年级学生分成男生和女生两个身高有明显差异的群体,对两个群体分别进行简单随机抽样,然后汇总作为总体的一个样本.由于在男生和女生两个群体中都抽取了相应的个体,这样就能有效地避免“极端”样本.

问题3 对男生、女生分别进行简单随机抽样,样本量在男生、女生中应如何分配?

为了使样本的结构与总体的分布相近,人数多的群体应多抽一些,人数少的群体应少抽一些.因此,按男生、女生在全体学生中所占的比例进行分配是一种比较合理的方式,即

这样无论是男生还是女生,每个学生抽到的概率都相等.当总样本量为50时,可以计算出从男生、女生中分别应抽取的人数为

按上述方法抽取一个容量为50的样本,其观测数据(单位:cm)如下:

男生和女生身高的样本平均数分别为170.6,160.6.根据男生、女生身高的样本平均数以及他们各自的人数,可以估计总体平均数为

即估计树人中学高一年级学生的平均身高在165.2cm左右.

上面我们按性别变量,把高一学生划分为男生、女生两个身高差异较小的子总体分别进行抽样,进而得到总体的估计.

一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么

称这种样本量的分配方式为比例分配.

在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M 和N ,抽取的样本量分别为m 和n. 我们用

表示第1层各个个体的变量值,用

表示第

1层样本的各个个体的变量值;用

表示

第2层各个个

体的变量值,用

表示第2层样本的各个个体的变量值,则第1层的总体平均数和样本平均数分别为

第2层的总体平均数和样本平均数分别为

总体平均数和样本平均数分别为

由于用第

1层的样本平均数可以估计第1

层的总体平均数,用第2

层的样本平均数可

以估计第2层的总体平均数

,因此可以用

估计总体平均数.

在比例分配的分层随机抽样中,

可得

因此,在比例分配的分层随机抽样中,可以直接用样本平均数估计总体平均数

问题4 与考察筒单随机抽样估计效果类似,小明也想通过多次抽样考察一下分层随机抽样的估计效果.他用比例分配的分层随机抽样方法,从高一年级的学生中抽取了10个样本量为50的样本,计算出样本平

1

1

1

1

=

=

.

M N

m n

i

i

i i

i i i i X Y

x y

W w M N

m n

====++++∑∑∑∑,

均数如表所示. 与上一小节“探究”中相同样本量的简单随机抽样的结果比较,有什么发现?

把分层随机抽样的平均数与上一小节样本量为50的简单随机抽样的平均数用图形进行表示(如图),其中红线表示整个年级学生身高的平均数.

从试验结果看,分层随机抽样的样本平均数围绕总体平均数波动,与简单随机抽样的结果比较,分层随机抽样并没有明显优于简单随机抽样.但相对而言,分层随机抽样的样本平均数波动幅度更均匀,简单随机抽样中出现了一个(第2个)偏离总体平均数的幅度比较大的样本平均数,即出现了比较“极端”的样本,而分层随机抽样没有出现.

实际上,在个体之间差异较大的情形下,只要选取的分层变量合适,使得各层间差异明显、层内差异不大,分层随机抽样的效果一般会好于简单随机抽样,也好于很多其他抽样方法.分层随机抽样的组织实施也比简单随机抽样方便,而且除了能得到总体的估计外,还能得到每层的估计.

在实际抽样调查中,由于实际问题的复杂性,除了要考虑获得的样本的代表性,还要考虑调查实施中人力、物力、时间等因素,因此通常会把多种抽样方法组合起来使用.

(二)课堂练习

1. 下列问题中,最适合用分层抽样抽取样本的是()

A.从10名同学中抽取3人参加座谈会

B.某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本

C.从1000名工人中,抽取100名调查上班途中所用时间

D.从生产流水线上,抽取样本检查产品质量

相关文档
最新文档