社会调查研究方法——第4章抽样
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总体与样本
总体
样 本
样本统计量
例如:样本均 值、比例、方 差
(4)抽样单位(sampling unit) 就是我们可以单独从总体中抽取出来的基本单位 。 一个理想的抽样框的要求是,它应该尽可能地 与目标总体相一致。 一般而言,如果总体中的每个元素在清单上分 别只出现一次,且清单上又没有总体以外的其 他元素出现,则该清单就是一个完备的抽样框 。在完备的抽样框中,每个元素必须且只能同 一个号码对应。 (5)抽样框(sampling frame) 又称抽样范畴,是从中抽取样本的抽样单位名 单。
第四章 抽样
第一节 第二节 第三节 第四节 第五节 第六节 抽样的意义与作用 非概率抽样方法 概率抽样的原理与程 概率抽样方法 户内抽样与PPS抽样 样本规模与抽样误差
教学要求:
了解抽样的概念、意义 掌握概率抽样和非概率抽样的的几种方法 教学重点:概率抽样 教学难点:概率抽样中的分层抽样
3、抽样的作用
(1)现实生活中有些研究总体是不可能进行 全面调查的,只可能调查其中的一部分。 (2)节约人力、物力。 (3)对其他调查方法所得到的资料的可信性 的检验,尤其是对普查资料的修正与补充, 必须进行抽样调查。
4、抽样的优越性
(1)调查费用较低。 (2)速度快 (3)应用范围广。 (4)可获得内容丰富的资料。 (5)准确度高。
实例:“职业地位:社会分层的指示器———上海
社会结构与社会分层研究”,仇立平,《社会学研究》 根据调查结果,样本的基本情况如下:男性占59 3%, 女性占40 7%;平均年龄为46 25岁。大多数调查对 象的教育程度在初中及以上(95%)。 本人平均月收入约 1030 元,家庭平均月收入约 2074 元;家庭平均财产 ( 包括不动产 ) 为 23 29 万 ( 据《’99 上海年鉴》, 1998 年职工月平均工资为 1005 元, 2000年为1188元。《文汇报》,2000)。 虽然样本的本人月收入较接近总体状况;但由于是 非概率抽样,某些指标如性别、职业等与总体有较 大差别,且样本较小,因此样本的资料按抽样理论 是不能推论总体的,或者在推论时要谨慎。 本调查的目的在于检验以“职业地位”作为社会分 层标准的有效性和可行性,以及理论假设的内在逻 辑性。
实例“都市里的吉卜赛人——对武汉市外来务工、经商 人员的调查”,《青年研究》2001年第6期,作者:刘玉 等 调查对象。本次调查以武汉市外来务工、经商人 员为对象。具体做法如下:在武汉市外来务工、 经商人员集中的地方 ( 汉正街 ) 的几条主街道发放 调查问卷,由调查员按照非随机抽样中的偶遇抽样 原则抽取一定的人员进行调查。 资料的收集方法。本次调查问卷由58个问题组成, 主要询问了外来务工、经商人员的基本社会特征、 工作、收入与支出、观念、社会交往以及对现有 生活的满意度等方面的问题。实际发放问卷280份, 回收有效问卷252份,有效回收率90 0%。问卷采用 自填法,由被调查者当场填写回收,对一些没有上过 学不识字的被调查者采取由调查员根据问卷的内 容逐一访谈的方式完成。
(1)总体(population) 总体通常与构成它的元素共同定义,总体是构成 它的所有元素的集合,而元素则是构成总体的最 基本单位。在社会研究中,最常见的总体是由社 会中的某些个人组成的,这些个人便是构成总体 的元素。 (2)样本(sample) 就是从全体或总体中随机抽取出来并用来代表总 体的那部分单位所构成的新的小总体。 (3)抽样(sampling) 指的是从组成某个总体的所有元素的集合中,按 一定的方式选择和抽取一部分元素(即抽取总体 的一个子集)的过程,或者说,抽样是从总体中 按一定方式选择或抽取样本的过程。
第一节 抽样的意义与作用
1、抽样估计在统计方法中的地位 2、抽样的概念 3、抽样的作用 4、抽样的优越性 5、抽样的类型
1、抽样估计在统计方法中的地位
统计方法
描述统计 推断统计
抽样估计
假设检验
2、抽样的概念
(1)总体(population) (2)样本(sample) (3)抽样(sampling) (4)抽样单位(sampling unit) (5)抽样框(sampling frame) (6)参数值(parameter) (7)统计值(statistic) (8)抽样误差 (9)置信水平与置信区间
5、抽样的类型
抽样技术
概率抽样
滚雪球抽样
源自文库非概率抽样
方便抽样 判断抽样 配额抽样
简单随机抽样
系统抽样
分层抽样
整群抽样
多级抽样
其他抽样技术
按比例
不按比例
第二节 非概率抽样
1、偶遇抽样 2、判断抽样 3、定额抽样 4、滚雪球抽样 5、空间抽样
1、偶遇抽样
偶遇抽样又称做方便抽样或自然抽样,是指 研究者根据现实情况,以自己方便的形式抽 取偶然遇到的人作为对象,或者仅仅选择那 些离得最近的、最容易找到的人作为对象。 常见的未经许可的街头随访或拦截式访问、 邮寄式调查、杂志内问卷调查等都属于偶遇 抽样的方式。 其优点就在于方便省力,速度快,可以用于 那些需要迅速了解到信息的调查。 但是样本的代表性差,带有很大的偶然性。 举例说明:
2、判断抽样
判断抽样又称立意抽样,它是研究者根据研 究的目标和自己主观的分析来选择和确定研 究对象的方法。 这种抽样首先要确定抽样标准。 这种通过主观判断对样本的选择通常有两种 方法, 一是找“平均人”的方法, 一是找异常个案的方法。 小组座谈会调查属于判断抽样。
2、判断抽样
配额抽样和分层抽样的区别
而分层抽样进行分层, 一方面是要提高各层间的异质性与同层中的同质性, 另一方面也是为了照顾到某些比例小的层次,使得 所抽样本的代表性进一步提高,误差进一步减小。 而其抽样的方法则是完全根据概率原则,排除主观 因素,客观地。等概率地到各层中进行抽样,这与 定额抽样中那种“按事先规定地条件,有目的地寻 找”的做法是完全不同的。
配额抽样和分层抽样的区别
二者虽然都依据某些特征对总体进行分层,但二 者的目的不同,抽样方法也不同。 定额抽样之所以分层分类,其目的在于要抽选出 一个总体的“模拟物”,其方法则是通过主观的 分析来确定和选择组成这种模拟物的成员。 也就是说,定额抽样注重的是样本与总体在结构 比例上的表面一致性。
4 滚雪球抽样
是先从几个适合的调查对象开始,然后通过他们得 到更多的调查对象,这样一步步扩大样本范围。 当调查总体中的个体信息不充分时,常采用这种方 法。 例如,某研究部门在调查某市劳务市场中的保姆问 题时, 先访问了7名保姆, 然后请她们再提供其他保姆名单,逐步扩大到近百 人。 通过对这些保姆的调查,对保姆的来源地、从事工 作的性质等状况就有了较全面的掌握。 还有对政府工作人员心理素质的测试、家用健身器 的应用状况、老人问题调查等等。
3、定额抽样
定额抽样与分层抽样中的比例抽样相似,也是按调查对象 的某种属性或特征将总体中所有个体分成若干类或层,然 后在各层中抽样,样本中各层所占比例与他们在总体中所 占的比例一样, 但不同的是,分层抽样中各层样本是随机抽取的,而定额 抽样中各层样本是非随机抽取的。 定额抽样假定: (1)只要类型划分较细,那么同一个类型中的每一个个 体都是同质的,因而无需采用随机抽样。 (2)只要类型划分合理,且分配给各类的名额符合总体 中各类人员的分布,那么,样本就可以准确地反映总体。
实例:“职业地位:社会分层的指示器———上海社会结构
与社会分层研究”,仇立平,《社会学研究》
调查方法和样本: 研究总体是具有上海户籍的、年龄在35-60岁的上海 职工(包括部分郊区农民)。 由于根据研究框架设计的问卷涉及到许多个人隐私, 如家庭财产、经济收入、重大生活事件、家庭出身 或家庭成分等,因此抽样是采用判断抽样法,即要 求访问员在自己的熟人范围里选择调查对象。 考虑到样本的代表性,访问员在选择调查对象时要 按照年龄、性别、职业等要求,按配额抽样方法选 择样本。 计划样本 400 个,有效样本 391 个,调查时间是 1999 年1月。
1、偶遇抽样
为了调查某市的交通情况,研究者到离他们最近的 公共汽车站,把当时正在那里等车的人选作调查对 象。 其他类似的偶遇抽样还有: 在街口拦住过往行人进行调查; 在图书馆阅览室对当时正在阅读的读者进行调查; 在商店门口、展览大厅、电影院等公众场所向进出 往来的顾客、观众进行的调查; 利用报刊杂志向读者进行调查; 老师以他所教的班级的学生作为调查样本的调查等 等。
案例: 我们要对学生抗议活动中的学生领袖进行研 究。许多学生领袖是很容易找到的,但是却 不大可能对所有的学生领袖的样本进行研究。 为了对所有的或大多数样本进行研究,就必 须根据研究目的来搜集资料,所运用的抽样 方法就是判断抽样法。
实例:“丹江口水库移民生活满意度的调查”,载《社 会》2002年6月,作者:陆青华。 这次我们调查的对象是 1978 年前因丹江口水库工 程而迁出的移民,着重是了解他们的生活状况以及 对移民生活的满意程度,希望通过对移民们生活中 这一敏感而又关键的问题的把握,为改善移民工作 提供一些有价值的参考意见。 本次调查以湖北的宜城市和荆门市的部分乡镇的 移民为总体,采用判断抽样方法选取调查对象。由 于该项调查的指导者王茂福教授对宜城一带较熟 悉且得到荆门地区移民局的热情支持,所以我们首 选了这两个地区。此次调查总样本为427人。 其中宜城市为328人,占总样本的55.7%,荆 门市为189人,占总样本的44.3%。 资料收集方法:问卷法。
(6)参数值(parameter) 关于总体中某一变量的综合指标,在统计 中最常见的总体值是某一变量的平均值。 (7)统计值(statistic) 它是关于样本中某一变量的综合描述,它 是相应的总体值的估计量。
(8)抽样误差 总体的异质性和样本与总体范围的差异性, 在用样本的统计值去推算总体的参数值时会 有偏差,这种偏差就是抽样误差。 (9)置信水平与置信区间 置信水平是指总体参数值落在样本统计值某 一正负区间内的概率,而置信区间是指在某 一置信水平下,样本统计值与总体参数值的 误差范围。
3、定额抽样
举例如下: 1936年美国的盖洛普使用定额抽样的方法成 功地预测了总统当选人,而同样的方法却也 造成了他在1948年的错误预测。 就像概率抽样一样,定额抽样所强调的也是 样本的代表性,虽说二者所达到目的的方法 不一样。
定额抽样示例
表 4-1 年龄 所得 ¥10,000以下 ¥10,101以上 合计 21% 12% 33% 27% 40% 67% 48% 52% 100% 34岁以下 35岁以上 合计
4 滚雪球抽样
滚雪球抽样的主要优点: 能够保证抽取的样本均具有某总特征,且抽 样误差和成本都较小; 这种由推荐获得的样本能够很好地满足抽样 对样本的人口统计学和心理统计学的特征的 要求,因为推荐人对这些特征比随机情景更 熟悉。 滚雪球抽样的局限性:有许多个体无法找到, 产生误差。
组合不同年龄与所得额可形成四种类型: (1)年龄在34岁以下,所得额在10000元以下; (2)年龄在34岁以下,所得额在10101以上; (3)年龄在35岁以上,所得额在10000元以下; (4)年龄在35岁以上,所得额在 10101元以上;
定额抽样示例
此时,研究者就根据研究目的从不同的格子 里选择样本并搜集资料,而代表每一个格子 出现的人,则按照这些格子相对于总体的比 例,给予加权。 当所有的样本的要素都被加权时,这样的资 料就可以合理的代表整个总体了。 同样,定额抽样的逻辑有时还可以有效地用 于实地调查。