《现代社会调查方法》第四章抽样

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
随机现象:在一定条件下可能出现这样的结果,也可能出现那样 的结果,但究竟出现哪种结果事先是不能肯定的。 随机事件:在一定条件下可能发生也可能不发生的事件。 如抛硬币、生小孩 概率:事件发生频率所接近的固定数值,它是相应事件发生的可 能性大小的一个客观、定量的度量。


小概率事件
据《每日邮报》18日 报道,生双胞胎是一 件大喜事。但当赖安 (Ryan)和利奥(Leo) 两兄弟来到这个世界 时,他们给父母带来 了一份意外的惊喜— —兄弟俩肤色不同。 双胞胎一个白皮肤一 个黑皮肤非常少见, 据医学专家介绍,生 下这种双胞胎的概率 仅为百万分之一,也 就是说,一百万对双 胞胎中才有一对双胞 胎。
大数定理(大数法则或平均法则):


研究在什么条件下,随机事件可以转化为不可能事件或必然事件, 即有关阐明大量随机现象平均结果的稳定性的一系列定理。 它的意义:在随机事件的大量重复出现中,往往呈现几乎必然的规 律。

中心极限定理:

研究在什么条件下,随机变量之和的分布可以近似正态分布。 中心极限定理表明,如果一个现实的量是由大量独立偶然因素的影 响迭加而得,且其中每一个偶然因素的影响又是均匀地微小的话, 则可以断定这个量将近似地服从正态分布。


第一节 抽样的意义与作用




(5)抽样框( sampling frame),又称抽样范围,指的是一次 直接抽样时总体中所有元素的名单。 (6)参数值(parameter),也称之为总体值,它是关于总体中 某一变量的综合描述,或者说是总体中所有元素的某种特征的综 合数量表现。 (7)统计值(statistic),也称样本值,它是关于样本中某一变 量的综合描述,或者说是样本中所有元素的某种特征的综合数量 表现。 (8)置信度(confidence level),又称置信水平,指的是总体 参数值落在样本统计值某一区间的概率,或者说,是总体参数值 落在样本统计值某一区间中的把握性程度。 (9)置信区间(confidence interval),指在一定的置信度下,样 本统计值与总体参数值之间的误差范围。它反映抽样的精确性程 度。

抽样分布的标准差,称为标准误差(SE)。

由于均值的抽样分布是正态分布,而其面积就是均值的次数, 故任何两值之间的样本均值次数所占的比例是可以知道的。
正态分布图与统计推论
第二节 概率抽样的原理与程序


3、抽样的一般程序
(1)界定总体。指的是在具体抽样前,首先 对从中抽取样本的总体范围与界限作明确的界 定。 (2)制定抽样框。这一步骤的任务就是依据 已经明确界定的总体范围,收集总体中全部抽 样单位的名单,并通过对名单进行统一编号来 建立起供抽样使用的抽样框。

民意调查机构准 确预测 1亿选民,调查 对象仅2000人!

两个例子

1936年美国总统大选
PK
Franklin Rooselvelt
Alfred Landon
两个例子

《文学文摘》杂志曾准确地预测了1920、1924、1928、 1932年的美国总统大选。 1936年,《文摘》进行了一次最具雄心的民意测验活 动:
分层抽样
整群抽样
多段抽样
其他抽样技术
按比例
不按比例
图 抽样分类
第三节 概率抽样方法


一、简单随机抽样(simple random sampling)
又称纯随机抽样,是按照等概率原则直接从含 有N个元素的总体中抽取n个元素组成样本 (N>n),常用的办法是抽签。

另外方法是利用随机数表进行抽样。
第三节 概率抽样方法


利用随机数表进行抽样的步骤。
(1)先取得一份调查 总体所有元素的名单。 (2)将总体中所有的元素一一按顺序编号。 (3)根据总体规模是几位数来确定从随机数表中选几 位数码。 (4)以总体的规模为标准,对随机数表中的数码逐一 进行衡量并决定取舍; (5)根据样本规模的要求选择足够的数码个数。 (6)依据从随机数表中选出的数码,到抽样框中去找 出它所对应的元素。

随机抽样:同等、独立
第二节 概率抽样的原理与程序

在概率抽样的过程中,我们总是要求保 证总体中的每一个个体都有同等的机会 入选样本,而且,任何一个个体的入选 与否,与其他个体毫不相关,互不影响。
随机事件与概率

确定性现象:必然发生的。 必然事件:在一定条件下必然发生的。 如:在一个大气压下,水在100摄氏度时必然沸腾。
第二节 概率抽样的原理与程序


1、概率抽样的基本原理
现实社会的异质性与同质性。 样本代表性与概率抽样。 概率抽样的基本原则:

如果总体中的每一个个体被抽取为样本的概率相同, 那么从这个总体中抽取的样本就具有对该总体的代 表性。

代表性,即所选取的样本能再现总体的结构。

具有这一性质的样本通常被称为等概率抽样方法 (Equal Probability of Selection Method,EPSEM)。
第四章 抽样
本章主要内容:
1、抽样的意义与作用 2、概率抽样的原理与程序 3、概率抽样方法 4、非概率抽样方法 5、样本规模与抽样误差
第一节 抽样的意义与作用


1、抽样及其相关的概念
(1)总体(population),总体是构成它的所有元素的集合,而 元素(element)则是构成总体的最基本单位。一个总体中所包 含的元素数目常用大写字母N表示。
第二节 概率抽样的原理与程序


2、抽样分布
抽样分布是根据概率的原则而成立的理 论分布,它显示出:从一个总体中不断 抽取样本时,各种可能出现的样本统计 值的分布情况。
2、抽样分布
2、抽样分布
2、抽样分布
2、抽样分布
2、抽样分布
2、抽样分布
极限定理:大数定理与中心极 限定理

极限定理:观察次数n趋向无限时的极限行为。采用极限的方法 所得出的一系列定理,统称极限定理。可分为两类:
简单随机抽样 系统抽样 分层抽样 整群抽样
抽样方法
多段抽样
偶遇抽样
判断抽样 非概率抽样 定额抽样 雪球抽样
第二节 概率抽样的原理与程序
社会科学研究的三个基本原理: 变异性原理

同质性与异质性 单个案不具有代表性

社会分组原理

社会情境原理

(谢宇,2006:15)《社会学方法与定量研究》
第二节 概率抽样的原理与程序

(卢淑华,1998:177)《社会统计学》
中心极限定理与正态分布

在自然、社会、经济领域里大量存在服从正态分布的 随机变量,如身高、体重、智商、婚龄等。
根据中心极限定理,均值的抽样分布具有如下特征:



如果样本相当大(不少于30,最好是大于等于100),则抽样 分布接近正态分布。其特点是单峰和对称,众值、中位值与 均值都相同。 抽样分布之均值就是总体之均值(μ)。

第二节 概率抽样的原理与程序

(3)决定抽样方案。 (4)实际抽取样本。 (5)评估样本质量。指的是对样本的质 量、代表性、偏差等等进行初步的检验 和衡量,其目的是防止由于样本的偏差 过大而导致调查的失误。
抽样分类
非概率抽样
抽样技术
Leabharlann Baidu概率抽样
偶遇抽样
判断抽样
定额抽样
雪球抽样
简单随机抽样
系统抽样
第二节 概率抽样的原理与程序

社会情境原理:群体变异性的模式会随着社会情境 (social context )的变化而变化,这种社会情境常常是 由时间和空间来界定的。也就是说,社会情境不一样, 变异性就不一样。比如说,教育对收入的影响是每个 社会都有的,教育高,收入高,但是并不是所有的人 教育高收入一定就高。大街上,有些小学、中学没有 毕业的人也有可能比你还有钱,这就是差异,但教育 对收入的影响可能随着社会的变化而不一样。社会情 境不同于社会分组。因为社会情境是有边界的,是一 个独立的社会系统,比如说社会主义制度、以前的中 世纪和现在。而社会分组是没有边界的。男女生活在 同一个家庭,在一起工作,是没有界限的,只是因为 社会研究的统计和调查的需要把他们分出来。社会情 境的边界是怎么来的呢?边界有两个:一个是时间,一 个是空间。

变异性原理:变异性是社会科学研究的真正本质。我 们不是研究类型的,而是研究变异和差异的。当然, 差异也有可能是组与组之间的差异。比如男女之间的 收入不一样,假如说男女收入是一样的话,那么我们 就不会认为性别在研究收入这个现象中是一个有趣的、 重要的东西。我们之所以要研究性别收入差,就是因 为有差别的存在。虽然这是一个组间差别,但是我们 的重点还是在差异上,比如说种族之间的差异、家庭 背景之间的差异、教育的差异、家庭婚姻的差异等等。 你仔细想一想,我们研究的东西是差异,而不是共性。 类型之间的差异也是差异,只不过是一个特例而已。


二、系统抽样(systematic sampling)
又称等距抽样或间隔抽样,是把总体的元素进 行编号排序后,再计算出某种间隔,然后按照 这一固定的间隔抽取元素来组成样本的方法。
第三节 概率抽样方法


系统抽样的具体步骤

1、给总体中的每一个元素按顺序编上号码,制定出抽 样框。 2、计算出抽样时间距,方法是用总体的规模除以样本 的规模。K(抽样间隔)=N(总体规模)/n(样本规模) 3、在最前面的K个元素中,采用简单随机抽样的方法 抽取一个元素,记下这个元素的编号(假设为A),A 称为随机起点。 4、在抽样框中,自A开始,每隔K个元素抽取一个元素, 即所抽元素编号为A,A+K,A+2K,…A+(n-1)K。 5、将这n个元素合起来,就构成了该总体的一个样本。
第二节 概率抽样的原理与程序

社会分组原理:为什么要分组?因为社会分组可减少 组内差异。个体之间是很不一样的,但是个体可以分 成组,比如分成年龄组、性别组、家庭背景境况组等 等。分组显示了组与组之间的差异,这意味着每个组 里面有相对组外来说更高的共同性。如果一个组当中 没有共同性的话,那么组和组之间就没有差异性。如 果女人没有共同性的话,那么就不可能有男和女的差 异。同样的道理,每一个组当中有相对来说比较相似 的特点。我们分组是基于组员之间有一定的共同性, 分组以后组与组之间就有差异性。社会分组能减少社 会结果的差异性,减少得越多,社会分组就越有意义。
第二节 概率抽样的原理与程序

概率抽样的两项优点:

概率样本更具代表性,可避免各种偏见和减少误差 概率理论使我们能够估计样本的精确度和代表性

概率抽样之所以能够保证样本对总体的代表性, 其原理就在于它能够很好地按总体内在结构中 所蕴涵的各种随机事件的概率来构成样本,使 样本称为总体的缩影。
第二节 概率抽样的原理与程序
第一节 抽样的意义与作用


2、抽样的作用
抽样作为人们从部分认识整体这一过程的关键 环节,其基本作用是向人们提供一种实现“由 部分认识总体”这一目标的途径和手段。 在社会调查中,抽样主要是解决的是调查对象 的选取问题,即如何从总体中选出一部分对象 作为总体的代表的问题。

两个例子

1984年的美 国总统大选



《文摘》将选票寄给了从电话簿与车牌号登记名单中挑选出 来的1000万人。收到了200万人以上的回应。 结果显示,有57%的人支持共和党候选人兰登,而当时在任 的总统罗斯福的支持率为43%。 两个星期后,投票结果显示:罗斯福以历史上最大的优势— —61%的得票率,获得第二届任期。相对于罗斯福的523张选 票,兰登仅得8张。

惨败!声誉扫地,不久关门。
两个例子

问题的症结:

回收率只有22% 抽样框:电话用户和汽车拥有者。这种设计 只选择了不成比例的富人样本,尤其是当时 美国还处在最严重的经济萧条后期。这个样 本排除了穷人,而几乎所有穷人都支持罗斯 福的新经济政策。
第一节 抽样的意义与作用

3、抽样的类型
概率抽样


第三节 概率抽样方法

优点:在抽样过程中完全排除了主观因素的干 扰,而且简单、易行,只要有总体各单位名单 就可以进行。
缺点:只适用于总体单位数量不多的调查对象, 如果总体单位数量很大,编制抽样框的工作就 十分复杂;样本代表性较差,抽样误差大;抽 取的样本可能比较分散或者过分集中。

第三节 概率抽样方法

(2)样本(sample),就是从总体中按一定方式抽取出的一部 分元素的集合。样本中所包含的元素数目常用小写字母n表示。
(3)抽样(sampling),指的是从组成某个总体的所有元素的集 合中,按一定的方式选择或抽取以部分元素(总体的一个子集) 的过程,或者说,抽样是从总体中按一定的方式选择或抽取样本 的过程。 (4)抽样单位(sampling unit),就是一次直接的抽样所使用的 基本单位。
相关文档
最新文档