社会调查与统计 第四章 抽样..

合集下载

抽样的基本概念1:总体、样本、抽样、抽样单位、抽样框

抽样的基本概念1:总体、样本、抽样、抽样单位、抽样框
《社会调查与统计分析》
第四章 抽样
知识点1 抽样的基本概念1
总体、样本、抽样、抽样单位、抽样框
学习导航
抽样的基本概念 总体 样本 抽样 抽样单位 抽样框
抽样的推断
样本 400人
研究结果
抽样的基本概念
抽样(sampling)就是从总体中按照一定方 式抽取样本的过程。
总体用N表示,样本用n表示。
抽样的基本概念
抽样单位(Sampling Unit):一次直接抽样所使用 的基本单位。
调查1000名大学生的价值 观念 元素:每一个大学生 抽样单位:每一个大学生
调查1000名大学生的价值 观念(直接从200个班级中 抽取40个班级) 元素:每一个大学生 抽样单位:班级
抽样的基本概念
总体(Population):构成它的所有元素(Element) 的集合。
调查某市大学生的价值观念 总体:该市所有的在校大学 生
调查某城市居民的家庭生活 质量 总体:该市所有居民家庭
元素:每一个大学生
元素:每一户家庭
样本(Sample):从总体中按一定方式抽取出的一部 分元素的集合。
选民的地址与姓名大都取自于电话簿与汽车俱乐部会 员名单
THE END
谢 谢 观 看!
抽样框(Sampling Frame):又称作抽样范围,一 次直接抽样中总体中所有抽样单位的名单。
抽样框的经典例子
《文学摘要》杂志在1920年、1924年、1928年和1932 年,以邮寄明信片的方式对美国总统大选,进行了民 意测验,并准确预测出这4次选举的结果。当1936年总 统大选来临时,杂志回收了200多万份明信片。测验结 果显示57%的人支持共和党的候选人兰登,民主党候 选人、在任总统罗斯福的支持率为43%。然而,两星 期后的选举结果,罗斯福以62%的得票率当选。杂志 因此声誉扫地,不久就关门大吉了。

PPS抽样

PPS抽样

甲:800户居民
乙:200户居民
甲居委会每一户居民被抽中的概率=20/200 × 50/800=1/160 乙居委会每一户居民被抽中的概率=20/200 × 50/200=1/40
不符合等概率原则
1. PPS抽样——概率与元素的规模大小成比例的抽样 (Sampling to Size)
《社会调查与统计分析》
第四章 抽样
知识点10 PPS抽样
学习导航
PPS抽样
PPS抽样的定义 PPS抽样的原理 PPS抽样的具体操作
1. PPS抽样——概率与元素的规模大小成比例的抽样 (Sampling with Probability Proportional to Size)
多段抽样暗含的假定:每一个阶段抽样时,其元素的规 模是相同的。
原理:以阶段性的不等概率换取最终的、总体的等概率 。
实质:在第一个阶段中,大的群被抽中的概率大,而小 的群被抽中的概率小;这样到了第二个阶段,被抽中的 大的群中的元素被抽中的概率就小于被抽中的小的群中 的元素了。正是这一大一小,平衡了由于群的规模不同 带来的概率差异。
2. PPS抽样的原理
每一个元素被抽中的概率
甲居委会中居民被抽中的概率=20×1/125×1/16=1/100 乙居委会中居民被抽中的概率=20×1/500×1/4=1/100
3. PPS的具体操作
例2:从全市100家企业(总共20万名职工)中,抽取 1000名职工进行调查。
THE END
谢 谢 观 看!
=
所抽取的群数
群的规模 总体规模
平均每个群中要抽的元素 群的规模
=所抽取的群数╳平均每个群中所要抽取的元素/总体的规模 =样本规模/总体规模

第4章__抽样调查

第4章__抽样调查

4.1.3抽样误差的确定
❖1)抽样误差的概念
❖2)影响抽样平均误差的因素
1、全及总体标志变异程度 2、样本容量 3、抽样组织方式 4、抽样方法
❖3)降低调查误差的途径
1、提高样本的代表性
2、注重样本量的控制
3、提高抽样设计的效率 4、重视抽样方案的审评
5、努力降低调查员的误差 6、努力调查被调查者的误差
❖ (4)如果这一地区街对面从第一号开始都没有住户,在第一号对面的街区转 一圈,并遵循右手法则。(即按顺时针方向在街区转一圈。)试着沿路线每 隔两户访问一户。
❖ (5)在起始门牌号对面邻近的街区绕过一圈后,如果你没有完成所需的访问, 就按顺时针方向到下一个街区访问。
❖ (6)如果第三个街区的住户数不够完成你的任务,就再做几个街区直到要求 的户数完成为止;这些区要按顺时针方向绕原有的街区来找。
❖5)简单随机抽样方式的优缺点
随机抽样方式的优点
方法简单直观,当总体名单完整时,可直接从中随机抽取样本。由于 抽取概率相同,计算抽样误差及对总体指标加以推断比较方便。
随机抽样方式的缺点
尽管简单随机抽样在理论上是最符合随机原则的,但是在实际应用中 有一定的局限性。第一,采用简单随机抽样,一般需对总体各单位加以 编码,而实际市场调查活动中所需调查总体往往是十分庞大的,单位非 常多,逐一编码几乎是不可能的;第二,对于某些事物无法使用简单随 机抽样,如对连续不断产生的大量产品进行质量检验,就不能对全部产 品进行编号抽样;第三,当总体的标志变异程度较大时,简单随机抽样 的代表性就不如经过分组后再抽样的代表性高;第四,由于抽出样本单 位较为分散,所以调查人力、物力、费用消耗较大。
2)抽样调查的特征
❖(1)抽取样本的客观性 ❖(2)抽样调查可以比较准确地推断总体

现代社会调查 第四章 抽样

现代社会调查  第四章 抽样

2.抽样的一般程序 2.抽样的一般程序
界定总体 制定抽样框
决定抽样方案 实际抽取样本 评估样本质量
14
2.抽样的一般程序 2.抽样的一般程序
界定总体 制定抽样框
明确界定总体是确保样本 代表性的重要前提
当存在多阶段抽样时, 当存在多阶段抽样时,需 分别编制不同的抽样框
决定抽样方案
是对样本的质量、 样本评估 是对样本的质量、代表 性、偏差等进行初步的检验和衡量
……
调整:在1-86之间选择整数的随机起点,如27;将小数 点调回,得到非整数的随机起点2.7,由此得到号码:2.7, 11.3, 19.9, 28.5,……。将小数点后面的部分略去,就是迁 中单位的号码:2, 11, 19, 28, …… 26
系统抽样的注意事项: 系统抽样的一个十分重要的前提条件,是总体中个体 的排列,相对于研究的变量来说,应是随机的 相对于研究的变量来说, 相对于研究的变量来说 应是随机的,即不存在 某种与研究变量相关的规则分布。否则,系统抽样的结果 将会产生极大的偏差。 两种可能导致偏差的情况: (1)个体的排列有次序的先后,等级上高低的情况; (2)总体名单中,个体的排列与抽样间隔有相对应的周 期分布。
当抽样间距(K=N/n)不是整数时怎么办? 不是整数时怎么办? 当抽样间距 不是整数时怎么办
25
当抽样间距(K=N/n)不是整数时: 当抽样间距(K=N/n)不是整数时: (K=N/n)不是整数时
循环等距抽样法 A+K A A+2K A+3K A+4K
A+(n-1)K
调整直线等距抽样 如:N=2580, n=300, 则K=8.6
16
二、概率抽样及其方法
概率抽样的类型: 概率抽样的类型: 的类型

《现代社会调查方法》第四章抽样

《现代社会调查方法》第四章抽样

第一节 抽样的意义与作用


2、抽样的作用
抽样作为人们从部分认识整体这一过程的关键 环节,其基本作用是向人们提供一种实现“由 部分认识总体”这一目标的途径和手段。 在社会调查中,抽样主要是解决的是调查对象 的选取问题,即如何从总体中选出一部分对象 作为总体的代表的问题。

两个例子

1984年的美 国总统大选
第二节 概率抽样的原理与程序

概率抽样的两项优点:

概率样本更具代表性,可避免各种偏见和减少误差 概率理论使我们能够估计样本的精确度和代表性

概率抽样之所以能够保证样本对总体的代表性, 其原理就在于它能够很好地按总体内在结构中 所蕴涵的各种随机事件的概率来构成样本,使 样本称为总体的缩影。
第二节 概率抽样的原理与程序

随机抽样:同等、独立
第二节 概率抽样的原理与程序

在概率抽样的过程中,我们总是要求保 证总体中的每一个个体都有同等的机会 入选样本,而且,任何一个个体的入选 与否,与其他个体毫不相关,互不影响。
随机事件与概率

确定性现象:必然发生的。 必然事件:在一定条件下必然发生的。 如:在一个大气压下,水在100摄氏度时必然沸腾。
分层抽样
整群抽样
多段抽样
其他抽样技术
按比例
不按比例
图 抽样分类
第三节 概率抽样方法


一、简单随机抽样(simple random sampling)
又称纯随机抽样,是按照等概率原则直接从含 有N个元素的总体中抽取n个元素组成样本 (N>n),常用的办法是抽签。

另外方法是利用随机数表进行抽样。
第三节 概率抽样方法

社会调查研究第四—七章

社会调查研究第四—七章
概率抽样有简单随机抽样、系统抽样、分类抽样、整群抽 样、多阶段抽样等类型。
非概率抽样有偶遇抽样、主观抽样、定额抽样、滚雪球抽 样等类型。
5、抽样的基本程序
界定总体 决定抽样方法 设计抽样方案 制定抽样框 实际抽取样本 样本评估
6、概率抽样的概念
概率抽样又称随机抽样指总体中每一个成员都 有同等的进入样本的可能性,但任何一个个体 之间彼此被抽取的机会是独立的。
9、分类抽样
分类抽样也叫类型抽样或分层抽样,即先分类, 然后从每一类中简单随机抽取样本。
分类抽样的分类:比例分类抽样和非比例分类 抽样。
分类抽样的两个假设:活分合理,分配合理。 分类抽样的评价:精度高,适用不同层面,效
率高。
10、整群抽样
整群抽样是将总体根据标准先划分为一些群体, 再随机从群体中抽取若干个体,并将个人集合 为总体的样本。
非概率抽样则主要是依据研究者的主观意愿判断或是否方便等因素来抽取对象它不考虑抽样中的等概率原则因而往往产生较大的误差难以保证样本的代表性
第四章 抽样调查
主讲:周红益
1、抽样的概念
抽样指从总体中按照一定方式选择或抽取样本 的过程和方法。
抽样存在的必要性缘于总体中所有个体之间的 异质性。
抽样存在的合理性性缘于总体中所有个体之间 的同质性。
7、简单随机抽样
简单随机抽样指在特定总体的所有单位中直接 抽取n个组成样本。
简单随机抽样方法有直接抽样法、抽签法和随 机数表法。
简单随机抽样的评价:简单易行,但效果不好。
8、系统抽样
系统抽样也称等距抽样或机械抽样,是按一定 的间距抽取样本的方法。
系统抽样的评价:规模较大时,易于实施,工 作量少;精确度更高,更有代表性;可仍有一 定的局限性。

影响样本规模确定的因素

影响样本规模确定的因素
《社会调查与统计分析》
第四章 抽样
知识点14 影响样本规模确定 的因素
学习导航
影响样本规模确定的因素
影响样本规模确定的四类因素 样本规模与抽样误差
1. 影响样本规模确定的因素
总体 的规模
经费、人 力和时间
影响因素
推断的把
握性与精 确性
总体的异 质性程度
总体的规模
在一定程度上,总体越大时,则样本也要越大。 样本规模的增加速度低于总体规模的增加速度。
样本 规模
600
400
200
10000 20000 30000 40000
总体规模
推断的把握性和精确性
在其他条件一定的情况下,置信度越高,即推论的可靠 性越大,则所要求的样本规模就越大。
n=(t2×σ2)/e2 n=[t2×p(1-p)]/e2 在其他条件下一定的情况下,置信区间越小,即样本统 计值与总体参数值之间的误差范围越小,则所要求的样 本规模就越大。
总体的异质性程度
总体的同质性程度越高,所需要的样本规模就越小。 总体的异质性程度越高,所需要的样本规模就越大。
调查者所拥有的经费、人力和时间
样本规模越大就意味着所需投入的人力、 物力和时间越多,调查的成本会上升。
2. 抽样误差(Sampling Error)
抽样误差就是样本统计值与总体参数值之间的误差。
(%)
(%)
(%)
1.0
9604
4.5
474
8.0
150
1.5
4268
5.0
384
8.5
9.0
119
2.5
1537
6.0
267
9.5
106
3.0

分层抽样

分层抽样
《社会调查与统计分析》
第四章 抽样
知识点7 分层抽样
学习导航
分层抽样
分层抽样的定义 分层抽样的优点 分层的标准 按比例分层和不按比例分层
1. 分层抽样的定义
分层抽样又称类型抽样,它是先将总体中的 所有元素按照某种特征或标志(如性别、年 龄、职业或地域等)划分成若干类型或层次 ,然后再在各个类型或层次中采用简单随机 抽样或系统抽样的办法抽取一个子样本,最 后,将这些子样本合起来构成总体的样本。
2. 分层抽样的优点
优点2:便于了解总体内不同层次的情况,便于对总 体中不同层次进行单独研究,或者进行比较。
3. 分层的标准
已有明显层次区分的变量; 把分析和研究的主要变量或相关的变量作为分层的标准; 保证各层内部同质性强和各层之间的异质性强。
思考:在“大学生价值观念研究”层
例如,某工厂有工人500人,男性有450人,女性有 50人,男女比例为9:1,样本为100人。 按比例分层抽样,男性90人,女性10人。 不按比例的方法进行分层抽样,男性70人,女性30 人。
THE END
谢 谢 观 看!
专业、家庭背景
4. 按比例分层和不按比例分层
按比例分层是根据统一的比例来确定各层要抽取的 元素数。即通常用各类型组的元素数占总体元素数 的比例,来确定各层抽样的样本元素数。 不按比例分层就是不根据各类型组的元素数占总体 元素数的比例,来确定各层抽样的样本元素数。
4. 按比例分层和不按比例分层
例:某县共有农户30万户,其中纯务农户10万户、 兼业户15万户、纯务工户5万户,问如何使用按比例 分层抽样抽取3000户进行家庭状况调查? N=300000户 n=3000户 统一的抽样比例为:n/N=3000/300000=1/100,按照 要求,三种农户类型分别抽取的样本元素数为: n1(纯农户)=100000×1%=1000(户) n2(兼业户)=150000×1%=1500(户) n3(纯务工户)=50000×1%=500(户)

PPS抽样

PPS抽样
例1:一个城市有100000户居民,分属200个居委会,要 从中抽取1000户居民构成样本。
甲:500户居民
乙:500户居民
1. PPS抽样——概率与元素的规模大小成比例的抽样 (Sampling with Probability Proportional to Size)
例1:一个城市有100000户居民,分属200个居委会,要从 中抽取1000户居民构成样本。
甲:800户居民
乙:200户居民
甲居委会每一户居民被抽中的概率=20/200 × 50/800=1/160 乙居委会每一户居民被抽中的概率=20/200 × 50/200=1/40
不符合等概率原则
1. PPS抽样——概率与元素的规模大小成比例的抽样 (Sampling with Probability Proportional to Size)
=
所抽取的群数
群的规模 总体规模
Hale Waihona Puke 平均每个群中要抽的元素 群的规模
=所抽取的群数╳平均每个群中所要抽取的元素/总体的规模 =样本规模/总体规模
2. PPS抽样的原理
在第一阶段,甲居委会被抽中的概率=800/100000=1/125 乙居委会被抽中的概率=200/100000=1/500 在第二阶段,甲居委会的居民被抽中的概率 =50/800=1/16 乙居委会的居民被抽中的概率=50/200=1/4
甲居委会中居民被抽中的概率=20×1/125×1/16=1/100 乙居委会中居民被抽中的概率=20×1/500×1/4=1/100
3. PPS的具体操作
例2:从全市100家企业(总共20万名职工)中,抽取 1000名职工进行调查。
THE END
谢 谢 观 看!

《社会调查理论与方法》第四章 社会调查的抽样

《社会调查理论与方法》第四章  社会调查的抽样

党派 共和党 民主党
支持率 57% 43%
选举结果——两个星期之后,美国总统选举 的结果罗斯福以61%的得票率获得第二任任期。 相较于罗斯福的523张选举人票,兰登仅得到8张。
预测为什么失败呢?
3. 决定抽 样方案
4. 实际抽 取样本
5. 评估样 本质量
•确定样本的
数量
•选择抽样的 由于拒访或样 具体方法:总 本缺失,可根 体规模的大小; 据实际情况抽 调查对象的特 取预备样本
,在抽样的过程中,总体的每一个元素都有同等的 机会入选样本,而且每个元素的抽取都是相互独立 的。
特点:总体中的任何个体都同样有被抽取的平等机 会。
主要方法: • 总体较小时:抓阄,抽签法 • 总体较大时:摇号法,随机数字表
随机数法的具体步骤
例题:要从3000个人(或其他分析单位)的总体中用简单随 机抽样的方法选取100个人作为样本进行调查。
随机数表
简单随机抽样方法的适用性:
➢ 总体数量较小 ➢ 易获得所有样本单位的完整列表 ➢ 样本单位之间差异程度较小或难以分组 ➢ 总体在空间范围内较为集中 ➢ 采用电子技术辅助调查的方法时,如CATI
(二)系统抽样
按无关标志; 按有关标志
系统抽样( systematic sampling):又叫等距抽样
一天,爸爸叫儿子小华去买一盒火柴。临出门 前,爸爸嘱咐儿子要买能划燃的火柴。小华拿着钱 出门了,过了好一会儿,小华才回到家。
“火柴能划燃吗?”爸爸问。 “都能划燃。” “你这么肯定?” 小华递过一盒划过的火柴,兴奋地说:“我每 根都试过啦。”
思考:得到火柴能否划燃的信息准确吗?
这样做有什么后果?
在日常生活当中所 熟知的抽样有哪些?

电大最新《社会调查研究》第四章抽样

电大最新《社会调查研究》第四章抽样
7.统计值-----也称为样本值,是关于样本中某一变量
的综合描述,或者说是样本中所有元素的某种特征的综合 数量表现。
• 8.抽样误差----是用样本统计值去估计总体参数值时所
出现的误差
参数值和统计值之间的关系:
① 参数值是固定不变的,唯一的,通常是未知的 ② 统计值是变化的,既对于同一个总体来说,不同
• (六)样本评估-----样本评估就是对样
本的质量和代表性进行检验,其目的是防 止因样本的偏差过大而导致的失误。
第二节 概率抽样
• 概率抽样-----是指总体中每一个成 员都有同等的进入样本的可能性, 即每一个成员的被抽概率相等,而 且任何个体之间彼此被抽取的机会 是独立的。
一、简单随机抽样
• (一)简单随机抽样概念和方法
如果某个总体中的每一个成员在所有方要了。
• 2.抽样存在的合理性-----是由辩证唯物主义个别与一
般的理论和建立在概率论基础上的大数定律和中心极限定律决定的。
这些理论与定律证明,尽管总体所包含的每一个个体都不能完全地反映总体 的性质和特征,却都具有不同程度的总体的性质和特征的因素,所以一定数 量个体的因素的集合,就可以等同或接近总体的性质和特征。
四、抽样程序
• 1.界定总体-----就是在具体抽样前,明 确从中抽取样本的总体的范围与界限。
• 例如----某市企业劳动合同执行情况 • 明确总体是所有企业的所有职工,如果只
把总体界定为国有企业或某类职工,从中 抽取样本是无法正确说明某市企业劳动合 同执行情况的
• 2.决定抽样方法------各种不同的抽样
•2.非概率抽样-----又称为不等概率抽样、
非随机抽样或主观抽样,就是调查者根据自己的 方便或主观判断抽取样本的方法。它不是严格按 随机抽样原则来抽取样本,所以失去了大数定律 的存在基础,也就无法确定抽样误差,无法正确 地说明样本的统计值在多大程度上适合于总体。 虽然根据样本调查的结果也可在一定程度上说明 总体的性质、特征,但不能从数量上推断总体。

社会调查研究方法——第4章抽样

社会调查研究方法——第4章抽样

实例“都市里的吉卜赛人——对武汉市外来务工、经商 人员的调查”,《青年研究》2001年第6期,作者:刘玉 等 调查对象。本次调查以武汉市外来务工、经商人 员为对象。具体做法如下:在武汉市外来务工、 经商人员集中的地方 ( 汉正街 ) 的几条主街道发放 调查问卷,由调查员按照非随机抽样中的偶遇抽样 原则抽取一定的人员进行调查。 资料的收集方法。本次调查问卷由58个问题组成, 主要询问了外来务工、经商人员的基本社会特征、 工作、收入与支出、观念、社会交往以及对现有 生活的满意度等方面的问题。实际发放问卷280份, 回收有效问卷252份,有效回收率90 0%。问卷采用 自填法,由被调查者当场填写回收,对一些没有上过 学不识字的被调查者采取由调查员根据问卷的内 容逐一访谈的方式完成。
2、判断抽样
判断抽样又称立意抽样,它是研究者根据研 究的目标和自己主观的分析来选择和确定研 究对象的方法。 这种抽样首先要确定抽样标准。 这种通过主观判断对样本的选择通常有两种 方法, 一是找“平均人”的方法, 一是找异常个案的方法。 小组座谈会调查属于判断抽样。
2、判断抽样
案例: 我们要对学生抗议活动中的学生领袖进行研 究。许多学生领袖是很容易找到的,但是却 不大可能对所有的学生领袖的样本进行研究。 为了对所有的或大多数样本进行研究,就必 须根据研究目的来搜集资料,所运用的抽样 方法就是判断抽样法。
实例:“丹江口水库移民生活满意度的调查”,载《社 会》2002年6月,作者:陆青华。 这次我们调查的对象是 1978 年前因丹江口水库工 程而迁出的移民,着重是了解他们的生活状况以及 对移民生活的满意程度,希望通过对移民们生活中 这一敏感而又关键的问题的把握,为改善移民工作 提供一些有价值的参考意见。 本次调查以湖北的宜城市和荆门市的部分乡镇的 移民为总体,采用判断抽样方法选取调查对象。由 于该项调查的指导者王茂福教授对宜城一带较熟 悉且得到荆门地区移民局的热情支持,所以我们首 选了这两个地区。此次调查总样本为427人。 其中宜城市为328人,占总样本的55.7%,荆 门市为189人,占总样本的44.3%。 资料收集方法:问卷法。

抽样的基本概念2:参数值、统计值、置信度、置信区间

抽样的基本概念2:参数值、统计值、置信度、置信区间
《社会调查与统计分析》
第四章 抽样
知识点2 抽样的基本概念2
参数值、统计值、置信度、置信区间
学习导航
抽样的基本概念 参数值 统计值 置信度 置信区间
抽样的基本概念
参数值(Parameter):也称为总体值,是关于总体 中某一变量的综合描述,或者说是总体中所有元素 的某种特征的综合数量表现。
全国妇女平均受教育年限、全国大学生的性别比例
统计值(Statistic):也称为样本值,是关于样本中 某一变量的综合描述,或者说是样本中所有元素的 某种特征的综合数量表现。
从全国妇女中调查10000名妇女的平均受教育年限为8.6年 从全部大学生中抽取5000名进行调查发现男女性别比例为
100:108
抽样的基本概念
参数值和统计值的区别在于: 参数值是唯一的、不变的,但难以获得的; 统计值是多样的、可变的,且容易获得。 抽样调查的重要目的之一就是采用统计值去 推论参数值
抽样的基本概念
调查1000名大学生家庭平均月收入水平为5000元
如何估计总体参数值?
样本统计值
90%的置信度
置信区间[4800,5200]
95%的置信度
置信区间[4300,5700]
抽样的基本概念
置信度越高,置信区间越大;置信度越低, 置信区间越小 抽样的可靠性(置信度)越高,抽样的精确 性程度(置信区间)就越低;反之,抽样的 可靠性越低,抽样的精确程度就越高。
抽样的基本概念
置信度(Confidence Level):又称为置信水平,指 的是总体参数值落在样本统计值某一区间内的概率 或把握性程度。 置信区间(Confidence Interval):在一定的置信度 下,样本统计值与总体参数值之间的误差范围。置 信区间越大,误差范围越大,抽样的精确性程度就 越低。

整群抽样

整群抽样

技术部
行政部
销售部
ቤተ መጻሕፍቲ ባይዱ
制造部
THE END
谢 谢 观 看!
《社会调查与统计分析》
第四章 抽样
知识点8 整群抽样
学习导航
整群抽样
整群抽样的定义 整群抽样的优缺点 整群抽样和分层抽样的区别运用
1. 整群抽样( Cluster Sampling )的定义
又称为集体抽样或群体抽样 ,是从总体中随机抽取一些 小的群体,然后由所抽出的若干个小群体内的所有元素 构成调查的样本的方法。 整群抽样区别于其它抽样方法的最大特点在于它的抽样 单位不是单个元素,而是成群的元素 。
2. 整群抽样的优缺点
优点 „ (1)在于可以简化抽样的过程 „ (2)节省时间、人力和经费 缺点就是其样本的分布面不大、样本对总体的代表性相 对较差。
3. 整群抽样与分层抽样区别运用
不同子群相互之间差别不大、而每个子群内部的异质性 较大时,则适合于采用整群抽样的方法;
反之,当不同子群相互之间差别很大、而每个子群内部 的差异不大时,则特别适合于采用分层抽样的方法。

偶遇抽样与判断抽样

偶遇抽样与判断抽样
《社会调查与统计分析》
第四章 抽样
知识点11 偶遇抽样与判断抽样Hale Waihona Puke 学习导航非概率抽样
偶遇抽样 判断抽样
非概率抽样方法
不是按照概率原则,而是根据人们的主观经验或其他 条件来抽取样本。
样本的代表性成问题,误差无法估计。
1. 偶遇抽样(Accidental or Convenience Sampling)
研究者用它来选择特别能够提供信息的独特个案 研究者用它来根据研究目的或样本的特殊要求选择调
查对象 研究者用它来选取难以接近、特殊总体中的成员
THE END
谢 谢 观 看!
又称立意抽样。它是调查者根据研究的目标和自己主 观的分析来选择和确定调查对象的方法。
在实际调查中,判断抽样多用于总体规模小,调查所 涉及的范围较窄或调查时间、人力等条件有限而难以 进行大规模抽样的情况。
2. 判断抽样(Judgmental or Purposive Sampling)
判断抽样的适用条件
又称为方便抽样或自然抽样,指研究者根据现实情况 ,以自己方便的形式抽取偶然遇到的人作为调查对象 ;或者仅仅选择那些离得最近的、最容易找到的人作 为调查对象。
偶遇抽样与简单随机抽样的区别:偶遇抽样没有保证 使总体中的每一个成员都具有同等的被抽中的概率。
2. 判断抽样(Judgmental or Purposive Sampling)

社会调查与研究 第四章

社会调查与研究 第四章

﹠置信水平反映的是抽样的可靠性程度,置信区间反
三、抽样的程序
确定总体
制定抽样框
制定抽样方案 实际抽取样本 评估样本质量
1、确定总体:对总体的范围与界限作明确界
定。 原因之一:是由抽样调查的目的决定的,其目的
是调查部分以反映总体。
原因之二:界定总体是达到良好的抽样效果的前
提条件。
﹠参数值与统计值之间的区别与联系: (1)参数值是确定不变的、唯一的,并且通常是未知的。 (2)统计值则是变化的,即对于同一个总体来说,不同
第四章 抽样
8.抽样误差(Sampling Error) 是指在用样本统计值去推估总体参数值时所 存在的偏差。它是由抽样本身的随机性引起 的,是不可避免的。但是抽样误差的大小是 控制的。 ﹠抽样误差的意义:是衡量样本代表性好坏的

试验者
抛掷次数 n
正面出现次数 m
正面出现频率m/n
德· 摩尔根 蒲丰 皮尔逊 皮尔逊 维尼
2048 4040 12000 24000 30000
1061 2048 6019 12012 14994
0.518 0.5069 0.5016 0.5005 0.4998
例:
10个人的平均受教育年限调查

3、等概率原则/随机性

每一个个体被抽中的概率相等,即保证总 体中的每一个个体都有同等被抽取的机会。
各种随机事件的背后,存在着事件发生的客观概 率,正是这种概率决定着随机事件的发展变化规律。 (例:投掷硬币) 概率抽样之所以能够保证样本对总体的代表性, 其原理就在于它能够很好地按照总体内在结构中所 蕴涵的各种随机事件的概率来构成样本,使样本成 为总体的缩影。

抽样的一般程序

抽样的一般程序
(5)评估样本质量:对样本的质量、代表性、偏差等进行 初步的检查和衡量。
抽样的一般程序
(5)评估样本质量
基本方法:将可得到的反映总体中某些重要特征及分布 的资料与样本中的同类指标的资料进行对比。
总体(4000名大学生):男78%,女22%;大一28%, 大二25%,大三25%,大四22% 样本1(200名大学生):男76%,女24%;大一29%, 大二24%,大三27%,大四20% 样本2(200名大学生):男54%,女46%;大一38%, 大二12%,大三17%,大四33%
THE END
谢 谢 观 看!
(2)制定抽样框:收集总体中全部抽样单位的名单,并通 过对名单进行统一编号来建立起供抽样使用的抽样框。 当抽样是分几个阶段、在不同层次上进行时,要分别 建立几个抽样框。
抽样的一般程序
(3)选择抽样方法:依据研究的目的和要求,依据各种抽 样方法的特点和其他有关因素来决定具体采用哪种抽样 方法。
(4)实际抽取样本:根据所选定的抽样方法,研究者从抽 样框中抽取一个个抽样单位,构成调查样本,然后由研 究者或调查员进入实地,进行抽样调查。
《社会调查与统计分析》
第四章 抽样
知识点4 抽样的一般程序
ห้องสมุดไป่ตู้
学习导航
抽样的一般程序 界定总体 制定抽样框 决定抽样方案 实际抽取样本 评估样本质量
抽样的一般程序
(1)界定总体:地域、时间、对象 1988年全国1‰生育率调查对总体的定义是:1988年7 月1日零时全国(除西藏、台湾外)28个省、市、自治 区所有15~67岁的妇女。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.抽样:从组成某个总体的所 有元素的集合中,按一定的方 式选择或抽取一部分元素的过 程。
4.抽样单位( sampling unit)
抽样单位就是一次直接的抽样
所使用的基本单位。抽样单位 与构成总体的元素有时是相同 的,有时又是不同的。 抽取1000个大学生。 直接抽取 先抽班级,在抽学生
(一)与抽样有关的概念(续2)
5.抽样框(sample frame) 又称作抽样范围,它指的是 一次直接抽样时总体中所有 抽样单位的名单。
案例——抽样框
从一所中学中,直接抽取 200名学生作为样本。
抽样框
该中学的全体学生名单
案例——抽样框

如果抽取20个班级作为 调查样本。
抽样框
该中学的所有班级名单
社会调查步骤
选 抽 题 样 研究设计
第问卷设计 资料收集
资料分析 调查报告撰写
第四章


本章主要内容
1.抽样的概念和类型 2.非概率抽样方法 4.概率抽样方法 5.户内抽样和PPS抽样 6.样本规模
案例1——2004年美国大选主要民调样本数
调查机构
福克斯新闻
盖洛普 全国广播公司/《华尔街日报》 哥伦比亚广播公司/纽约时报 美国广播公司/华盛顿邮报
(一)与抽样有关的概念(续3)
6.参数值 (parameter)也称 为总体值,它是关于总体中某 一变量的综合描述。 7.统计值(statistic)也称为 样本值,它是关于样本中某一 变量的综合描述。
二、抽样的作用
基本作用:是人们从部分认识
整体的关键环节 必要性:研究人员难以做到任 何研究都进行全面调查,而抽 样误差可以控制到很小,因而 抽样调查成为最常用的研究方 法之一。
一、抽样的基本概念
1.元素:等同于分析单位
2.总体(population):元素的集合体 N
3.样本(sample)从总体中按一定的方式抽取
出的一部分元素的集合。
研究结论只能推及总体范围
不反映总体的样本——农民为何常在民 意调查中被忽略(中国青年报 2005-03-04 )
中国人如何看美国,如何看美国人和中美 关系?近期,《环球时报》在中国社会科 学院美国研究所和专业调查公司的帮助下, 就此进行了民意调查,并公布了调查结果。 尽管该媒体发布的报道声称,他们这次是 “做了一次严格意义上的民意调查”,但 这次调查是否真称得上“严格意义”,值 得商榷。


实际上,他们调查的只是中国5大 城市的部分居民,却根本没有调查过 任何一位农民,而在当代中国,农村 人口在全国人口总数中所占比例远远 大于城市人口。所以,仅仅5个城市部 分居民在调查中表达出来的民意,并 不足以真正代表包括广大农村居民在 内的“中国人”。
值得注意的是,类似这种只调查部分城市居民、 调查结果却被说成是整个“中国人”的民意调查, 并不鲜见。例如,稍前,《解放日报》和复旦大 学、神州调查公司等合作,开展了“今天我们怎 样过春节”的全国30个城市抽样调查,也将农民 排除在外。 中国经济景气监测中心曾经发布的一项调查结果, 本来只是显示有58.2%的中国城市居民对目前的 收入水平感到满意,但某些媒体在报道时,则声 称是“逾半中国人满意当前收入”。超过8亿的中 国农民居然“人间蒸发”。
三、抽样的一般程序
界定总体
48% 44%
0% 1%
0.35%
持平
布什+6 布什+3.03
51.3 51.34% 4%
48.31 48.31% %
案例2《文学文摘》抽样——理论依据
《文学文摘》(literary
Digest) 以邮寄明信片的方式进行民意测 验,并且颇为准确预测出1916年、 1920年、1924年、1928年和1932 年的总统选举结果。该杂志所依 据的理论是:“所询问的选民愈 多,则结果愈可靠”。


零点调查公司曾经对京沪穗蓉宁等 10个城市的4226名成年市民进行一项 调查,旨在了解这些城市居民未来5 年内最关心的事情,但媒体发布的调 查结果,却是“中国人关注的十大焦 点”。一项标榜为揭示“当代中国人 世界观”的调查,实际调查的不过是 京沪穗三市的部分居民。
(一)与抽样有关的概念(续1)
样本量
1200
1573 1014 939 939
《新闻周刊》
882
2004年美国总统大选一周前民调结果
当选的相对机会值 福克斯新闻(1200 LV) 盖洛普(1573 LV) 全国广播公司/《华 尔街日报》 (1014 LV*) 哥伦比亚广播公司/ 纽约时报(939 LV) 美国广播公司/华盛 顿邮报(939 LV**) 《新闻周刊》(882 LV)
案例《文学文摘》—预测结果
候选人
兰登 A· Landon 罗斯福 F· Roosevelt
党派
共和党 民主党
支持率
57% 43%
案例《文学文摘》抽样——选举结果 两个星期之后,美国总统选举 的结果罗斯福以61%的得票率 获得第二任任期。相较于罗斯 福的523张选举人票,兰登仅 得到8张。
案例《文学文摘》——失败原因
案例《文学文摘》——抽样框获得
《文学文摘》通常会采用上千
万个调查单位样本,而这些样 本名单则是通过全美杂志订户、 电话薄和汽车俱乐部会员名单 收集到的。
案例《文学文摘》——样本量
当1936年总统大选来临时,杂
志仍以同样的方式进行了民意 测验,并从寄出的10000万份 明信片中,回收了200多万份。
最后结果
日期
10/30-10/31 10/29-10/31
奥巴马 克里 纳德尔
46% 49% 48% 49% 1% 1%
差额
克里+2 持平
10/29-10/31
48%
47%
1%
布什+1
10/28-10/30
49%
46%
1%
布什+3
10/27-10/30 10/27-10/29
11 月 2 日
48% 50%
《文学文摘》的民意测验失败是
因为它的样本严重地偏向高收入 群体。在当时条件下,收入较低 或失业者家里通常没有电话,也 没有汽车,因此,根据电话薄和 汽车俱乐部会员名单选定的样本, 主要涵盖的是经济地位较高的上 层选民。
案例《文学文摘》——失败原因

当时下层选民是罗斯福 社会及经济政策的主要受益 者和支持者,而共和党候选 人则更受上层选民的青睐。
相关文档
最新文档