抽样方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2)缺点:系统抽样有一个十分重要的前提
条件,就是总体中个体的排列,相对于研究的变
量来说,应是随机的,即不存在某种与研究变
量相关的规则分布。否则,系统抽样的结果将 会产生极大的偏差。
例:在一项有关二战士兵的经典研究中,研究人员从名册
中每隔10个士兵抽出一个来进行研究。然而士兵的名册是 以下列组织方式来编排的:首先是中士,接着是下士,其 后才是二等兵;用一班一班的方式进行编排,每班10个人。 因此名册中每隔10个就是中士。如此系统抽样可能会得到 一个完全是中士的样本,也可能会得到一个完全不含中士 的样本。
要获得全市家庭的抽样框几乎是不可能的,因此无法进 行简单随机抽样和系统抽样。但整群抽样则轻而易举。 假设全市有 200 个居委会,每个居委会有 500 户左右家 庭。我们只要有这200个居委会的名单,按上述两种方 法之一,抽取两个居委会,然后该两个居委会的所有家 庭构成样本。
2)缺点:样本分布不广、样本对总体的代表性差
五.多段抽样
3.实例: 风笑天的独生子女研究(1988年)
研究总体是全国城市的独生子女。为了 在有限的财力、人力及时间的情况下保 证样本的代表性,研究者选择了以湖北 省为代表。因为无论是在地理条件、社 会经济文化发展水平,还是人口规模、 家庭结构方面,湖北省都处于全国中等
•首先抽取城市。按城市的规模,分别选取了武
适用范围:总体元素不多时.
一、简单随机抽样
3.常用方法:
2)随机数表法
利用随机数表抽样的具体步骤: ( 1 )先取得一份总体所有元素的名单(抽 抽取 取数
适用范围:总体元素很多时.
样框);
(2)将总体中所有元素一一按顺序编号; ( 3 )根据总体规模是几位数来确定从随机 量表中选几位数; ( 4 )以总体规模为标准,对随机数表中的 数码逐一进行衡量并决定取舍; ( 5 )根据总体规模的要求选择出足够的数 码个数; ( 6 )依据从随机数表中选出的数码,到抽 样框中找出它所对应的元素。
2.样本都有相同机 会被抽到,因此抽 出来的样本有可能 不能很好代表总体。
02
系统抽样
二、系统抽样
1.定义:
系统抽样又称等距抽样或机械抽样。它是把总体的
单位进行编号排序后,再计算出某种间隔,然后按 这一固定的间隔抽取个体的号码来组成样本的方法。
基本和简单随机抽样 一样,计算公式也一 样
需要完整的样本 框,直接从总体 中抽取个体
步骤
选数 编号
一、简单随机抽样
3.常用方法:
2)随机数表法
编号
一、简单随机抽样
3.常用方法:
2)随机数表法
使用举例
随机数表中的数码 8432990906 1053873020 9427410041 0139022507 9361404310 1359866042 6321912683 9420582507 2725651176
抽样单位 不是单个的个体,而是成群的个体。
个班,每班都是30名同学,总共3000名学生,现在 要抽取300名。先从100个班中抽取10个班,则这10 个班的全部学生就构成了样本。
举例:某大学共有100
四、整群抽样
3.优缺点: 1)优点:简便易行、节省费用。
例:研究某市 10 万户家庭生活状况,抽取1000 户。若
三.分层抽样
3.运用:
以所要分析和研究的主要变量或相关变量 作为分层的标准。
考虑两个问题: 1)分层的标准问题。 通常采用的原则有:


以保证各层内部同质性强、各层之间异质 性强、突出总体内在结构的变量作为分层 变量。
以那些已有明显层次区分的变量作为分层 变量。

三.分层抽样
3.运用: 考虑两个问题: 2)分层的比例问题。
三.分层抽样
1)在不增加样本规 模的情况下降低抽 样误差,即提高抽 样信度。注意前提 是,所分的类有意 义,即每个类内部 数据的变异程度小 , 而类与类之间变异 程度大。
2.优点
2)非常便于了解总体 内不同层次的情况。 比如:在《中国妇女社 会地位调查》中,将城 市和乡镇分为两个类, 以便于了解各自情况, 并可以比较。
汉市、黄石市、沙市市、仙桃市、云梦县城关 镇这五个市镇作为调查点。 •第二步抽取学校。在各个城市中,先请该市教
育部门的同志按照重点、一般、较差的标准,
各推荐 1-3 所小学。然后,研究者采取简单随 机抽样的方式,从给出的各类小学中各抽一所 小学。 •第三步抽取年级。在每个城市所抽中的三所小 学中,按随机抽样的方法,分别抽取高年级 (4-6年级)和低年级(1-3年级)各一个。 •第四步抽取班级。在每个抽中的年级中,随机 抽取一个整班。 •根据上述抽样程序,总共抽取 5 个市镇 15 所小 学1-6年级30个班的学生1342人。
使数据资料恢复到总体中各层实际的比例结构。
三.分层抽样
4.特点: ①适用于总体由差异明显的几部分组成的情况;
②按比例确定每层抽取的个数; ③抽取时采用系统抽样或简单随机抽样; ④等概率抽样; ⑤样本具有良好的代表性
5.步骤: 1)分层; 2)定抽样比; 3)确定各层抽样的数目; 4)抽取个体
三种抽样方法的比较
按比例分层抽样指按各种类型或层次 中的单位数目同总体单位数目间的比 例来抽样,以确保得到一个与总体结 构相同的样本。
比 如 : 某 厂 有 工 人 600 名 , 男 工 500 人 , 女 工 100 人。两类工人占总人数的比率分别为 5/6 和 1/6 。因此若要按比例抽取 60 人,应该分别从男 工 中 抽 取 5/6*60=50 人 , 从 女 工 中 抽 取 1/6*60=10 人。这样样本就有非常好的代表性。 •有些情况又不宜采用比例抽样。在总体类型或 层次的单位数目太少时,往往采取不按比例抽 样的方法,以便于对不同层次的子总体进行专 门研究或进行比较。 比如:从 500 男工中抽取 30 人,从 100 女工中 抽取 30 人,则可以对两类进行比较,不会影响 推论统计时的条件。 •但用样本资料来推断总体时,需要先对各层数 据资料加权处理,通过调整样本中各层的比例,
四、整群抽样
4.运用:
要与分层抽样的方法相区别。 当总体由若干个自然界限或区分 的子群(或类别、层次)所组成 时
1
若子群内部差异较大,子群间差异较小 ---整群抽样
若子群内部差异较小,子群间差异较大---分层抽样。
2
05
多段抽样
五.多段抽样
1.定义:
多段抽样又称多级抽样、分段抽样。它是按抽样元
素的隶属关系或层次关系,把抽样过程分为几个阶 段进行。

具体做法:先从总体 中抽几个大组,再在 抽中的几个大组中抽 取几个小组,这样一 层层抽下来,直到抽 到基本的抽样元素为 止。
在社会研究中,当总体 规模特别大时,或者总 体范围分布非常广时, 一般都要采用多段抽样。
五.多段抽样
2.举例: 研究某市青年工人情况。 先以全市的企业名单为抽样框,抽取一部分企业; 然后在抽中的企业里,以车间为抽样单位,抽取若干个车间; 最后再在抽中的车间里抽取青年工人。 在每个阶段都要采用简单随机抽样或系统抽样或分层抽样的方法进行。 注意:运用多段抽样方法时要注意在类别和个体之间保持合适的比例。
二、系统抽样
将总体按编号顺序 平均分成50部分, 可得抽样间距为: K=1000/50=20, 每
以18为起始号,每 间隔20抽取一个号 码,这样就得到一 个容量为50的样本: 18,38,58, …… , 978,998.
3.举例:为了了 解参加某种知识 竞赛的1000名学 生的成绩,应采 用什么样的抽样 方法恰当?
类别
简单随机 抽样 系统 抽样
各自特点
从总体中 逐个抽取
将总体均分成 几部分,按事 先确定的规则 在各部分抽取 将总体分成 几层,分层 进行抽取
相互联系
适用范围
总体中的 个体数较 少
共同点
在起始部分抽样时 采用简单随机抽样 各层抽样时采用 简单随机抽样或 系统抽样
总体中的 个体数较 多
等可能抽 取; 不放回抽 样;
部分包含20个个 体 。
1
随 机 将 这 1000 名 学生编号为1,2, 3 , …… , 1000 (比如可以利用准
2
3
在第一部分的个体 编号 1 , 2 ,……,
4
20中,利用简单随
机抽样抽取一个号 码,比如是18 .
考证号)。
二、系统抽样
4.优缺点: 1)优点:操作简便,实施时不容易出差错。
二、系统抽样
2.具体步骤:
1 2 3 4 5
给总体中的每一个个体按顺序编号,即制定出抽样框。
计算出抽样间距。计算方法是用总体的规模除以样本的规模。假设总体规模为N,样本规模为 n,那么抽样间距K就由下列公式导出: K=N/n( 在最前面的K个个体中,采用简单随机抽样的方法抽取一个个体,记下这个个体的编号A,称 为随机起点。 在抽样框中,自A开始,每隔K个个体抽取一个个体,即所抽取个个体编号分别为A,A+K, A+2K,﹍,A+(n-1)K。 将这n个个体合起来,就构成了该总体的一个样本。
选用的 数码
0906
不选原因
后4位大于3000 0041 2507 后4位大于3000 后4位大于3000 2683 与所选第3个数重 1176
一、简单随机抽样
4.优缺点:
优点:
缺点:
1.是概率抽样的 理想类型,简便 易学
1.在总体多的情况 下,工作量大,费 时多且费用太高。
2.抽样框不需要 其他信息就能直 接抽样。




问题1 江西省今年高考考生达35.5万,为了调查了解这些考 生数学试题的得分情况,将他们所有的考试卷加以统计,那 将是十分麻烦的,怎样才能既科学又客观地了解这些考生数 学试题的得分情况呢? 问题2 现有某灯泡厂生产的灯泡10000只,怎样才能了解这批 灯泡的使用寿命呢?
数理统计的核心问题:如何根据样本的情况对总体的情况作 出一种推断。
确定样本
后 , 他 们 又 用 300 张 小 纸 条 分 别 写 上
001,002 , … , 300 。他们把这 300 张 写好不同号码的小纸条放在一个盒子里, 搅乱后,随便摸出 60 张小纸条。然后, 他们按这 60 张小纸条上的号码找到总体 名单上所对应的60位同学。这60位同学 就构成了他们本次的样本。 编号 制签
• 从3000总体中抽取100人作为样本
• 1 取得总体名单; • 2 从1到3000编号; • 3 从随机数表中选择4位数; • 具体选法是从随机数表中的任意一行和 任意一列的某一个四位数开始,按照从 左到右,或者从上到下的顺序,以3000 为标准,对随机数表中依次出现的每个 4位数进行取舍:选出3000以内的,直 至选够100个。
分层 抽样
总体由差 异明显的 几部分组 成
04
整群抽样
四、整群抽样
1.定义: 2.特点:
整群抽样是从总体中随机抽取一些小的群体, 然后由所抽中的若干个小群体内的所有元素 构成调查的样本。即只要该群被选中,该 群中的所用成员都进入随后的子样本。
对小群体的抽样可以采用简单随机抽样、 系统抽样或分层抽样。
(一)概率抽样
简单随机抽样
系统抽样
分层抽样
整群抽样
多段抽样
01
简单随机Байду номын сангаас样
一.简单随机抽样
1.定义: 又称纯随机抽样,它是按等概率原则直接从含有N个元素 的总体中抽取n 个元素组成样本(N>n)。最基本形式。 2.特点: ①不放回抽样; ②逐个进行抽取; ③个体数有限; ④等概率抽样: 每次抽取一个个体时任一个体被抽到的概率为 1/N; 在整个抽样过程中各个个体被抽到的概率为n/N 3.常用方法: 1)抽签法; 2)随机数表法。
一、简单随机抽样
3.常用方法:
1)抽签法
例: 某系共有学生 300 人,系学生会打 算采用简单随机抽样的方法,从中抽取 抽签 均匀 搅拌
优点:简单易学.
出 60 人进行调查。为了保证抽样的科学
性,他们先从系办公室得到一份全系学 生的名单,然后给名单中的每个学生都 编上号(从 001 到 300 )。抽样框编好
03
分层抽样
三.分层抽样
1.定义: 分层抽样又称类型抽样,它是先将总体中的所有单位按某种特征或标志 (如性别、年龄、职业或地域等)划分成若干类型或层次;然后再在各 个类型或层次中采用简单随机抽样或系统抽样的方法抽取一个子样本;
最后,将这些子样本合起来构成总体的样本。
例如:从一个企业抽取职工样本。 先将职工划分成工人、干部、技术人员三种类型 分别用简单随机抽样或系统抽样方法在各类型中抽取子样本 将三个子样本合在一起,就构成了该企业的全体职工的样本。
相关文档
最新文档