第二章 抽样设计
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一般地,当总体由差异明显的几个部分组
成时,为了使样本更客观地反映总体情况 ,我们常常将总体中的个体按不同的特点 分成层次比较分明的几部分,然后按各部 分在总体中所占的比实施抽样,这种抽样 方法叫做——
分层抽样
其中所分成的各部分称为“层”。
分层的步骤
(1)对总体进行分层。分层的原则是把性质 相近的单位分为一层 (2)确定各层抽取样本的数量。分为分层同 比抽样和分层异比抽样 (3)按照随机原则从各层次中抽取样本。自 层内抽取样本时,通常采用的方法为简单 随机抽样或等距随机抽样的方法。
例:某班有40个学生,为了了解学生各方面
的情况,需要从中抽取一个容量为10的样本, 用抽签法确定要抽取的学生。
解:注意抽签法的要求和步骤
S1
将这40名学生按学号编号,分别为1, 2…40; S2 将这40个号码分别写在相同的40张纸片 上; 将这40个纸片放在一个盒子里搅拌均匀,抽 出一张纸片,记下上面的号码,然后再搅 拌军训,继续抽取第2张纸片,记下号码; 重复这个过程,直到抽取到10个号码为止; 于是和这10个号码对应的10个学生,就构成 了一个简单随机样本。
二、系统抽样 (一)复习 1.简单随机抽样 设一个总体的个体数为N。如果通过逐个抽取的 方法从中抽取一个样本,且每次抽取时各个个体 被抽到的概率相等,就称这样的抽样为简单随机 抽样。 [注]简单随机抽样有以下特点: (1)它要求被抽取样本的总体的个体数是有限 的; (2)它是从总体中逐个地进行抽取; (3)它是一种不放回的抽样; (4)它是一种等概率抽样。(为什么?)
系统抽样与简单随机抽样的联系在于: 将总体均分后的每一部分进行抽样时,采用
的是简单随机抽样.
探究:某学校为了了解高一年级学生的视
力状况,打算从高一年级1000名学生中抽 取100名进行调查,应该怎样抽样?
①将这1000名学生从1开始编号; ②按号码顺序以一定的间隔进行抽取,由
第二章 抽样设计
第一节 第二节 第三节 第四节 抽样概述 总体与抽样框 概率抽样 抽样误差与样本规模
第一节 抽样概述
抽样是研究者选择对象的方法,与社会调 查研究的其他议题相比,有关抽样的讨论 更加严谨和精确。
一、抽样的概念 在社会调查研究中,研究者经常从一个规 模很大的研究对象集合中,选出一部分作 为研究对象,这个选取过程就是抽样 (sampling)。 1.总体:全体研究对象 2.样本:被抽取元素的总和
第一步:将100个个体编号,号码是001,
002,…,100; 第二步:由于100÷20=5,则将编号按顺序 每5个一段,分成20段; 第三步:在第一段001,002, …, 005这五 个编号中用简单随机抽样法抽出一个(如 004)作为起始号码; 第四步:将编号为004,009,014,019,024 ,029,034,039,044… 094的个体抽出,组成 样本。
随机数?彼此之间有何差异? 6.为什么说等距抽样是一种准随机抽样方法? 7.为什么系统抽样的代表性与总体单位的排 列顺序有关? 8.为什么分层抽样中,各层的样本规模要进 行非比例分配?
复习思考题:
9.分层抽样中,层的数目要受到哪些因素的限制? 10.群的划分原则与分层原则有什么不同之处? 11.PPS抽样是如何保证大小不等的群中的元素以相 等概率入样的? 12.总体规模与样本规模之间是一种什么关系?
简单随机抽样的特点 (1)它要求被抽取的样本的个数有限,这
样便于通过随机抽取的样本对总体进行分 析。 (2)它是从总体中逐个地进行抽取。这样 便于在实践中进行操作。
问题:下面的抽样方法是简单随机抽样吗?
为什么? 1.某班45名同学,指定个子最高的5名同学 参加学校组织的运动会。 2.从20个零件中一次性抽出3个进行质量检 验。 3.一儿童从玩具箱中的20件玩具中随意拿出 一件来玩,玩后放回再拿下一件,连续玩 了5件。 4.从整数中抽出所有的偶数。
样本容量很大时,用随机数表法抽取样本 仍不方便,容易重复或读错行列。 适用性:随机数表法适用于总体多但个体 样本比较少。
结合所学的知识,你认为用什么样的抽样
方法更为方便? 1.从1万个灯泡中抽取100个进行质量检验。 2.要从汽车厂生产的30辆汽车中随机抽取3 辆进行测试,请选择合适的抽样方法,写 出抽样过程。
第二节 总体与抽样框
一、定义总体 编制抽样框工作的第一步是定义总体,只 有对总体构成及边界有一个清晰的认识, 才能最大限度地使抽样框与总体保持一致。
二、编制抽样框 对于抽样而言,真正有操作意义的是确定 抽样框,没有抽样框实际抽样就无法进行。 1.界定总体 2.抽样分层次进行
第三节 概率抽样
一、简单随机抽样 一般地,从元素个数为N的总体中不放回地 逐个抽取数量为n的样本,如果每一次抽取时 总体中的各个个体有相同的可能性被抽到, 这种抽样方法叫做简单随机抽样,这样抽取 到的样本,叫做简单随机样本
简单随机抽样的方法 (1)抽签法步骤: ①编号:
:
②制签 ③搅匀: ④抽签 ⑤取出
样本 (2)随机数表法步骤: ①编号 ②定起点 ③取号 ④取样
一般地,当总体中的个数较多时,采用简单
随机抽样显得较为费事.这时可将总体分成 几个数量相等的部分,然后按照预先定出的 规则,从每一部分抽取一个体,得到所需要的 样本,这种抽样叫做——
S1
将总体中的所有个体编号,(每个号码 位数一致) S2 在随机数表中任选一个数作为开始 S3 从选定的数开始按一定的顺序读下去, 得到的号码若不在编号中,则跳过。若在 编号中则取出。得到的号码若在前面已经 取出,也跳过。重复这个过程,直到取满 为止。 根据选定的号码抽取样本
用随机数表法抽取样本的优点和缺点 优点:简单易行。解决了抽签法的难题 缺点:当总体中的个数很多,从而需要的
例:从某厂生产的802辆轿车中随机抽取80
辆测试某项功能,请合理选择抽样方法, 并写出过程。
练习2
从2004名同学中,抽取一个容量为
20的样本,试叙述系统抽样的步骤.
二、分层抽样
问题:某校高一、高二、高三年级分别有学
生1000、800和700名,为了了解全校学生的 视力情况,欲从中抽取容量为100的样本, 问怎样抽取较为合理? 1、各年级应按比例抽取 高一年级应抽取40名 高二年级应抽取32名 高三年级应抽取28名 2、在各年级中按简单随机机抽样或系统 抽样法分别抽取
(二)随机数法 随机数表由数字0,1,2…9,这10个数字组
成,并且每个数字在表中各个位置上出现 的机会一样。通过随机数表生成器,例如 计算器或计算机的应用程序生成随机数的 功能,可以生成一张随机数表。 通过随机数表,根据实际需要和方便使 用的原则,将几个数组合一组,然后抽取 样本。
用随机数表法抽取样本的步骤
(2)确定分段间隔k,对编号进行分段。
当N/n是整数时,取k= N/n; (当N/n不 是整数时呢?)
(3)在第一段用简单随机抽样确定第一个
个体编号L(L≤k);
(4)以L为起始号码,每间隔k个号码抽取
,直到获取整个样本。
练习1:从含有100个个体的总体中抽取20
个样本, 请用系统抽样法给出抽样过程。
3.抽样的优点:经济、有效(准确度高) 注:使用概率抽样时,应注意以下两点: 1.抽样误差无法避免
2.概率抽样并不具有普遍的适用性
二、非概率抽样
(一)方便抽样 (二)配额抽样 (三)判断抽样 (四)雪球抽样
三、概率抽样设计要点
(一)编制抽样框
(完整性和不重复性) (二)选择抽样方法 (三)估计抽样误差 (四)确定样本规模
码写在号签上,将号签放在一个容器中, 搅拌均匀后,每次从中抽取一个号签,连 续抽取n次,记下号签上的号码,就得到一 个容量为n的样本。
抽签法的优点和缺点:
优点:抽签法能够保证每个个体入选样本
的机会均等。(得到的样本是简单随机样 本) 缺点:(1)当总体中的个数较多时,制作 号签的成本将会增加,使得抽签法成本高 (费时费力) (2)号签较多时,把它们“搅拌均匀”就 比较困难,结果就很难保证每个个体入选 样本的可能性相等 抽签法适用于总体和样本个数比较少。
二、简单随机抽样的样本规模
(一)影响样本规模的因素 (二)样本规模的估算
复习思考题:
1.为什么要进行抽样?
2.为什么说“街头拦人”不是随机抽样? 3.判断抽样比较适合用于哪些场合? 4.目标总体与抽样总体之间有哪些差异?
复习思考题:
5.简单随机抽样中,有哪几种方法可以产生
师144名,管理人员12名,后勤服务人员24 人,今从中抽取一个容量15的样本。
(一)整数抽样间距 (二)非整数抽样间距 (三)总体单位的排列
三、分层抽样
(一)样本规模在各层的分配 (二)层的划分 (三)分层抽取样本的方法
四、整群抽样
(一)群的性质 (二)规模不等的群
分层的标准:
(1)以调查所要研究的主要问题或与其相
关的问题作为分类标准。(家庭收入和受 教育水平) (2)以能突出总体的内在结构作为分层标 准。(干部、工人、技术员) (3)以已有的明显层次作为分层标准。( 学生年级,年龄按老中青,城市按大中小 等)
分层随机抽样的优点: (1)同一层中每个单位间的差异较小,容
(3)它是一种不放回抽样。由于抽样实践
中多采用不放回抽样,使其具有较广泛的 实用性,而且由于所抽取的样本中没有被 重复抽取的个体,便于进行有关的分析和 计算。 (4)它每一次抽取时总体中的各个个体有 相同的可能性被抽到,从而保证了这种抽 样方法的公平性。
(一)抽签法 抽签法就是把总体中的N个个体编号,把号
于这个间隔定为10,即将编号按顺序每10个 为一段,分成10段; ③在第一段号码1~10中用简单随机抽样法 抽出一个 作为起始号码,如6; ④然后从“6”开始,每隔10个号码抽取一 个,得到6,16,26,36,…,996,这样我 们就得到一个容量为100的样本。
系统抽样的步骤: (1)先将总体的N个个体编号
易实现子样本与子总体的同构 (2)由于分层,各种情况都包含在样本中 ,具有代表性 (3)与简单随机抽样和等距随机抽样相比 ,分层抽样的抽样误差要小。 适用范围:层间差异大,层内差异小的总 体
练习一:
1.
在下列问题中,各采用什么抽样方法抽取 样本较为合适?
(1)实验等概率抽样
(一)代码法 (二)拉希里(Lahiri)法
六、多阶段抽样
(一)分层多阶段等概率抽样 (二)多阶段PPS抽样 (三)规模测量值
第四节 抽样误差与样本规模
一、简单随机抽样的抽样误差
(一)放回简单随机抽样 (二)不放回简单随机抽样 (三)标准误差的意义