05第五章 抽样调查及其方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
57 56 55
43 44 45
四、抽样的类型
简单随机抽样 系统抽样
概率抽样
分层抽样 整群抽样
抽样方法
多段抽样 偶遇抽样
判断抽样
非概率抽样
定额抽样
雪球抽样
五、抽样调查的一般程序 1、设计抽样方案 2、界定调查总体 3、选择抽样方法 4、编制抽样框 5、实际抽取样本 6、评估样本质量
1、设计抽样方案:根据研究目的、总体 特征、客观条件选择不同的抽样方案。 并同时根据调查的精确程度和可靠性的 要求,确定样本规模。
抽样框
抽样框(sampling frame)又称做抽样范围,它指 的是一次直接抽样时总体中所有抽样单位的名单
二、抽样调查的特点与作用
1、抽样调查的特点 1)按随机原则抽样 2)样本推论总体 3)抽样误差可以控制 4)节省人力财力和时间 5)调查对象只是作为样本的一部 分抽样单位。
2、抽样调查的作用
找相关同学)。
特点:总体单位很多时,写号码的工作量就很大,搅拌均匀也不容易, 因而此法经常在总体规模较小的时候使用
简 单 随 机 抽 样
总体元素多时,采用随机数表
随 机 数 表
利用随机数表进行抽样的具体步骤:
先取得一份总体所有元素的名单(即抽样框)
将总体中所有元素一一按顺序编号 根据总体规模是几位数来确定从随机数表中选几位数码 以总体的规模为标准,对随机数表中的数码逐一进行衡量并决 定取舍
社会调查理论与方法
Research Methods in Social Sciences
第五章 抽样调查及其方法
§1 抽样的概念和程序 §2 非随机抽样及其方法 §3 随机抽样及其方法 §4 随机抽样中的几个实际问题 §5 抽样误差与样本规模 §6 抽样调查的优点与局限性
§1 抽样调查的概念和程序
接下来的问题是从随机数表中随机选取500个数字。 这500个数字所对应的人就是样本。
接下来是确定所选择的随机数需要几位数。需要有四 位数字才能保证所有人都有被选中的机会 。(如果总 数为21654的话,需要选择五位数的随机数)。因此, 我们要从0001到9999的数字中抽取100个随机数。
我们可以随意确定表格中选取数字的顺序:依纵列的方向向
不在于说明样本本身的情况,而是 要从数量上推断总体,说明总体。
抽样方法是架在研究者十分有限的 人力、财力和时间与庞杂、广阔、纷繁、 多变的社会现象之间的一座桥梁 。是人 们从部分认识整体的关键环节。
3、抽样调查的适用情况:
1)有些现象不可能进行全面调查,但又需要 了解全面情况时,可采用抽样调查。
2)有些现象可以但没有必要进行全面调查 时,可采用抽样调查。 3)需要对普查统计资料的质量进行检验或修 正时,可采用抽样调查。
中的机会相等)。而且,任何一个个体的入选与否,与其他个体 毫不相关,互不影响。
。
最好的例子:投掷硬币
对于投掷硬币的结果(总体)来说,只有正面和反面(个体)两种可
能。每次投掷硬币相当于一次抽样过程(从两种可能性中抽取一
种);这种抽样是随机的(两种可能性都可能出现,且出现的机会 均等)
尽管一次具体的随机抽样(一次投掷)只会有一种结果,或者说出 现某一种情况(正面或反面)的概率为100%;但是若下次不同的 抽样的结果,却总是趋向于两种情况出现的次数各为50%—— 即趋向于两种不同结果本身所具有的概率,或者说趋向于总体 内在结构中所蕴涵的随机事件的概率。
例:1984年美国总统选举预测与实际结果比较%
里根
《时代》/《扬基拉维奇》 《今日美国》/《黑蛇发女怪》 哥伦比亚广播公司/《纽约时代周刊》 盖洛普民意测验/《新闻周刊》 实际投票结果 64 63 61 59 59
蒙代尔
36 37 39 41 41
美国广播公司/《华盛顿邮报》 哈里斯民意测验 罗珀民意测验
下选取,也可以依纵列的方向往上选取,由左到右或者由右到 左,也可以依对角线的方式选取。什么方式并不重要,关键是 从头到尾贯彻使用这种方法。这里我们为了方便选择从纵列方 向,当一列到了末端时,可以从下一列最顶端选起,当一页选 完以后,可以从下一页的第一纵列继续选取。
决定从那里开始。可以闭着眼睛随便戳一个数字。也可以随意
盖洛普的成功主要得益于其选取样本的方法。 首先.他分析了选民酌的性别、年龄、社会 阶层、人种等。 还分析了人口数量分布特征。 再依据分析结果对样本数量进行分配。 这就保证了选取样本的质量,在调查方法上 他们也否定邮寄问卷的方式,从所选取的调 查对象尽可能地用直接面谈的方法进行调查。
3、选择抽样方法: 随机抽样,还是非随机抽样? 凡是从数量上推断调查总体的抽 样调查,都必须采取随机抽样。
(一)偶遇抽样(accidental or convenience sampling) 又称方便抽样或自然抽样。指研究者根据现 实情况,以自己方便的形式抽取偶然遇到的 人作为调查对象,或者仅仅选择那些离得最 近的、最容易找到的人作为调查对象。 街头拦人、邮寄式调查、杂志内问卷调查 区别于随机抽样
(二)判断抽样 (judgmental sampling)
抽样调查(Sampling survey)
运用一定的方法在调查对象总体中抽取一部分 调查对象作为样本,并对样本调查结果来推断总体 的方法
一、基本概念
调查对象(元素)(element)
调查对象是构成总体的最基本单位,是搜集信息 的单位和进行分析的基础
调查总体
调查总体是研究者从中实际抽取调查样本的个 体的集合体 例如1:人口普查——调查总体:全国人口。
(四)雪球抽样 (snowball sampling)
当我们无法了解总体情况时,可以从总体中少数成员入手,对 他们进行调查,向他们询问还知道哪些符合条件的人;再去找 那些人并再询问他们知道的人。 如同滚雪球一样,我们可以找到越来越多具有相同性质的群体 成员。
注意:具体如何操作。
§3 随机抽样及方法
又叫立意抽样 (purposive sampling) 调查者根据研究的目标和自己主观的分析来选择和确 定调查对象的方法 典型调查经常使用这种方法。 难点:确定抽样标准 优点:发挥研究者主观能动性 缺点:无法判断样本代表性 例如:某村村民对基层选举的看法的调查。
判断抽样适用范围:
1. 总体结构差异较大,样本容量较小 2. 无法确定总体边界 3. 研究者的时间和设备有限无法进行概率抽样
具体方法(总体元素少时):
先编制一个抽样框,把总体各单位编上号码写在纸片上搓成纸团,作成 签和阄(给每个学生编号,从001到300,并写在纸片上);
然后,把签和阄放在一个盒子内搅拌均匀;
最后,随机从盒子内抽取签和阄,被抽中的签和阄上的号码所代表的单 位就是样本,直到抽满规定的样本为止(从300张纸条里抽取60张,并
1)根据研究的Biblioteka Baidu的要求; 2)依据各种抽样方法的特点;
3)考虑其他有关因素。
2、界定调查总体: 就是根据调查课题的要求,把所 要调查的对象的范围加以确定。
首先要界定研究总体,即从理论 上明确定义的所有调查单位的集合体。 然后再界定调查总体。
例如:韶关人调查 ,怎样确定调查总体?
《文摘》杂志的错误?
6、评估样本质量: 样本评估:对样本的质量、代表性、 偏差等等进行初步的检验和衡量,其目 的是防止由于样本的偏差过大而导致调 查的失误。 方法:对比
§2 非随机抽样及方法
非随机抽样: ——依据研究者的主观意愿、判断或是否 方便等因素来抽取对象的方法。
– – – – 偶遇抽样 判断抽样 定额抽样 滚雪球抽样
随机抽样
– 简单随机抽样 – 系统抽样
– 分层抽样
– 整群抽样 – 多段抽样
一、简单随机抽样 (simple random sampling)
又称纯随机抽样,是概率抽样的最基本 形式。
常用的方法: A、总体元素较少时,类似于抽签方法。
B、总体元素较多时,随机数表法 基本原理:从N中抽取n 练习 1:我系共有学生300人,系学生会打算采用 简单随机抽样的办法,从中抽取60人进行调查。
性别独立控制配额抽样 性别 样本 99 男 女 总计 101 200
婚姻状况独立控制配额抽样 婚姻状况 已婚 未婚 样本 142 58
总计
200
举例:分层标准:性别、婚姻 状况、年龄,n=200 年龄独立控制配额抽样 年龄 18-30 31-50 50以上 总计 样本 80 65 55 200
举例:分层标准:性别、婚姻状况、 年龄,n=200 交互控制配额抽样
(三)定额抽样 涵义: 又称作配额抽样;
首先,研究者对总体进行分层,并找出具有 各种不同特征的成员在总体中所占的比例。 然后选择研究对象,使样本成员在各种特征 上的构成尽量接近总体的结构。 注意: a、按事先规定的条件,有目的地寻找。 b、与分层抽样区分
举例:分层标准:性别、婚姻状 况、年龄,n=200
例如2:韶关人调查——调查总体:在韶关市区生活、
工作、学习,且有韶关市户口,年龄在16—60周岁的 中国公民。
样本
样本(sample)就是从总体中按一定方式抽取出的 一部分元素的集合
一个样本就是总体的一个子集
抽样
所谓抽样(sampling),指的是从组成某个总体的所
有元素的集合中,按一定的方式选择或抽取一部分元
概率抽样是按照概率原理进行的,它要求样 本的抽取具有随机性。 随机原则就是使总体中每一个体都有一个已 知不为零的被选机会进入样本。 特点:能够避免抽样过程中的人为误差,保 证样本的代表性。
所谓随机抽取,就是保证总体中的每一个个体都有同等的机
会入选样本。
或者说,总体中的每一个成员被抽中的概率相等(也即被抽
想一个行号和列号。
假设我们从第二行第三列的0623为起点,那
么第一个样本就为0623,由第三列往下,我 们选择4430,0175,2011,3126,4860……
依次进行,选足500个随机数。样本的编码就 为0623……等。
现在要用定额抽样方法依上述三个变数抽取一个
规模为100人的样本。
依据总体的构成和样本规模,我们得到的定额表
男生(60人)
文科(30人) 理科(30人)
女生(40人)
文科(20人) 理科(30人) 一 二 三 四
年级
一 二 三 四
一 二 三 四 一 二 三 四
人数
? ? ? ?
? ? ? ? ? ? ? ?
例如:题目:韶关市老年人生活状况调查。准备采取 抽样调查,是采取随机抽样方法还是非随机抽样 方法?
4、制定抽样框: 根据已经明确的总体围, 收集总体中全部抽样单位的名单, 并通过对名单进行统一编号来建 立其供抽样使用的抽样框。 如果是分阶段抽样,应该根 据抽样方案分阶段制定。
5、实际抽取样本: 从抽样框中抽取一个个的抽 样样本,构成调查样本。 ——可以先抽好样本再调查 ——也可以边抽部分样本边 调查
? ? ? ?
依据总体的构成和样本规模,我们得到的定额表
男生(60人)
文科(30人) 理科(30人) 一 二 三 四 12 9 6 3
女生(40人)
文科(20人) 一 二 三 四 8 6 4 2 理科(30人) 一 二 三 四 8 6 4 2
年级 人数
一 二 三 四 12 9 6 3
英克尔斯在研究“人的现代性”时的配额抽样设计
已婚
男 女
未婚
男 女
合计 80 65 55
200
18-30 31-50 50以上 小计 总计
20 25 24 69
25 22 26 73 142
20 15 8 10 2 3 30 28 58
练习:
假设某高校有4000名学生,其中男生占60%,女
生占40%;文科学生和理科学生各占50%;一年级学 生占40%、二年级、三年级、四年级学生分别占30%、 20%和l0%。
根据样本规模的要求选择出足够的数码个数
依据从随机数表中选出的数码,到抽样框中去找出它所对应的 元素
练习 2
对照附表中的随机数表,练习随机抽样。 要从5000个人(或其他分析单位)的总体中用简单随 机抽样的方法选取500个人作为样本进行调查。
步 骤
首先,将总体中所有的人编码:本例中编码为1-5000。
素(即抽取总体的一个子集)的过程
抽样是从总体中按一定方式选择或抽取样本的过程
抽样单位 (sampling unit)
抽样单位就是一次直接的抽样所使用的基本单位 指在抽样各阶段中考虑选取的某个元素或者某组元素 在更复杂的抽样中,需要采用不同层次的抽样单位
例如:从全班50人中抽取10人构成小样本,个人(学生)是抽 样单位