第四章 抽样调查
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
案例启示:错误的抽样框将导致调查的失败,当样本框不恰当时,
再大的样本量也无济于事。
成功的对比:盖洛普的配额抽样
但乔治〃盖洛普运用抽样调查,却正确地预测到罗斯福当选。 他之所以成功,是由于运用了配额抽样法,保证了样本的代表 性。配额抽样是建立在了解抽样总体性质的基础上,从各阶层各种 类型的人中按比例进行抽样。
摇号机法:使用专门的机器对事先编号的各样本单位进行 选择。适合于规模较大的总体。
样本的容量是__________。 500
2、抽样框与抽样单元
抽样框:指对可以供抽样用的所有调查单位的名册
或详细名单。
抽样框的主要形式有三种:
①名单抽样框 ②区域抽样框
③时间表抽样框。
认识: 例如:要从10000名职工中抽出200名组成一个样本,则10000名
职工的名册,就是抽样框。
常见的抽样框:大学学生花名册、城市黄页里的电话列表、工
适应于调研总体中各个体之间差异较小且各个体数目较小的情况,
或者调查对象不明,难以分组、分类时的情况。
指样本单位的抽取不受主观因素及 其他系统性因素的影响,每个总体 单位都有均等的被抽中机会
(2)常用方法
抽签法:a、先编号 b、再把相应号码写在卡片上 c、任意抽选,直到抽足规定样本数 适用于调查总数中个体数目少的情况。
如何确定替代受访者:舍弃、过多抽 样、再抽样
(四)实施调查 (五)测算结果
用样本指标推断总体指标的结果。
百分比推算法:根据样本框架中不同调研结
果所占比例推断总体中的各比例结果。
平均数推算法:将调查的样本结果加以平均,
求出样本平均数,代入平均数推算公式,即
总体=总体个数X样本平均数
三、抽样技术的分类及选择
Reuter(路透社)
49
41
39 39 38 38 38
8
9 7 9 9 9
2
1 2 2 2 2
Harris Poll(哈里斯民意测验) 51 ABC(美国广播公司) NBC(国家广播公司) USA Today(今日美国报) Gallup(盖洛普公司) 52 51 51 51
11.3~4
11.3~4
投票人数的过低估计。
在1948年,一些研究者开始采用随机抽样方法,结果比配额抽样 方法更成功。
3.抽样误差
因使用样本而产生的误差 抽样必然会产生误差,调查人员应该做的不是消除误差,而 是通过提高设计的有效性、寻找更好的抽样框、选择更合适 的抽样方法来减少或控制抽样误差。
抽样误差影响因素
抽样技术
随机抽样
非随机抽样 实验法
简 单 随 机 抽 样
等 距 抽 样
分 层 随 机 抽 样
整 群 抽 样
多 阶 段 抽 样
方 便 抽 样
判 断 抽 样
配 额 抽 样
滚 雪 球 抽 样
(一)随机抽样技术及应用
随机抽样:又叫概率抽样,是对总体中每一个个体都给予平
等的抽取机会的抽样技术。
随机原则:完全排除了人的主观因素影响,使每一个 单位都有同等的可能性被抽到 。
包含尽可能多的样本单位 所有样本单位出现的概率相等
问:为了解重庆市中学生的饮料消费情况,需要从全市500所中学
中抽取10所中学,再从每所抽中的中学中抽取3个班级,最后从
每个抽中的班级中抽取10名中学生。需要选择哪些抽样框? 答:分别收集三个不同层次的抽样框:
全市500所中学的名单;
每所抽中的中学里所有班级的名单; 每个抽中的班级中所有学生的名单。
以合理的成本选择误差最小的抽样框
三、确定抽样方法
依据研究目的的要求、各种抽样方法的特点,
以及其他限制因素决定采用哪种抽样方法。
四、决定样本大小
考虑调查精确度的要求、总体性质、抽样方法 和人力、财力等客观条件确定样本的大小。 其原则是:“代价小,代表性高。”
(三)选择抽样样本
确定抽样的技术 抽样方法 样本的数量 选择样本
特征(时间、地点、年龄范围、收
入范围、性别等)。
(二)确定抽样框架和个体编号
依据已明确界定的总体范围,收集总体中所 有样本单位的名单,建立供抽样使用的抽样 框。完整的抽样框架中,每个调查对象应该 出现一次,而且只能出现一次;抽样框的不 完整,往往会导致抽样框误差产生。 个体编号,即对调查总体中的个体进行编号。 在概率抽样中,需要对总体中的每一个个体 进行编号,以使抽出的每一个个体更具有代 表性。
第五章 抽样调查
生活常识
为什么要知道一个人的血液情况,只需抽一 点点血来化验就行了?
由部分认识总体 同质和异质
一天,爸爸叫儿子小华去买一盒火柴。临出门前,爸爸
嘱咐儿子要买能划燃的火柴。小华拿着钱出门了,过了好一 会儿,小华才回到家。
“火柴能划燃吗?”爸爸问。
“都能划燃。”
“你这么肯定?” 小华递过一盒划过的火柴,兴奋地说:“我每根都试过啦。”
合理地确定一个抽样数目,既满足抽样误差的要求,又使抽样调查所 需成本费用最小。样本容量的确定原则是控制在必要的最低限度。
考虑调查精确度的要求、总体性质、抽样方法和人力、 财力等客观条件确定样本的大小。
其原则是:“代价小,代表性高。”
五、抽取样本
在上述几个步骤的基础上,严格按照所选定的抽 样方法和数量,从抽样框中抽取一个个的样本单位, 构成样本。
总体
估计
样本
抽样
所有实际被调查的 学生的爱好情况组 成一个样本。
样本的个数称为样本容量
在一次考前摸底考试中,考生有2万名。怎样才能既省时又 省力的了解到这些考生的英语平均成绩呢?
2万名考生英语成绩 总体是________________; 其中每名考生的英语成绩 个体是________________; 所抽取的500名考生的英语成绩 样本是________________;
总体:是所要调查的全体。一般用“ N ”表示。 样本:是总体的一部分,是从总体中按一定的程序抽选出来的个 体或单元组合。一般用“ n ”表示。
认识:
某市在12万名大学生中抽出1000人进行消费结构调查。
总体:12万名大学生。 样本:被抽到的1000名大学生。
学校的全体学生的爱好情况是我们 要考察的全体对象,称为总体。 总体中每一个考察 对象叫做个体
A:
15 2 1至2次 3至6次 7次及以上 生病次数
B:小组在医院调查了
C:小组调查了10名老年
100名老年病人,他们一 邻居,他们一年中生病的 年中生病的次数如图所示: 次数如下表所示:
1至2次 7% 3至6次 24% 7次及以上 69%
生病的次数 1 至 2次 3 至 6次
人数 4 5
7次及以上
此外,他还运用了配额抽样法,正确地预测了1940年和1944 年大选的结果。
但是,在1948年,他用配额抽样法也曾导致预测失败,他预言 共和党侯选人战胜民主党侯选人,结果却相反。
为什么呢?
主要原因是样本的代表性出了偏差。
因为1948年,经过二战,美国大量人口从农村流向城市,而盖洛
普对人口总体的认识仍停留在1940年的状况。城市居民倾向于投 民主党的票,因此,样本中过大的农村人口比例造成了对民主党
优点:
1、抽出样本的分布情况接近总体,样本对总体研 究具有充分的代表性 。 2、有助于调查人员准确地计算抽样误差,并有效 的加以控制,从而提高调查的精度
1.简单随机抽样
(1)定义
又叫纯随机抽样,它是概率抽样技术中最简单的一种。它对调研
总体不经过任何分组、排队,完全凭着偶然的机会从中抽取个体 加以调查。
抽样框的重要性
案例:1936年《文学文摘》的民意测量:从电话薄和车牌登记名
单中选择1000万人,最后收到200万人,预测出43% 的罗斯福支 持率(实际是61%)
思考:为什么预测不准?
抽样框选择的不合理:只选择了不成比例的富人 样本,而排除了穷人。
在大萧条时期拥有汽车、电话的是富人,从电话薄和私人汽车登记薄上抽 样必然导致样本中富人过多,而穷人基本上都为罗斯福新政投了赞成票。
选举结果 (11月5日公布)
49
40
9
2
调查研究总体:美国全体选民
调查访问样本:2000名选民
二、抽样调查程序
确定目标总体 确定抽样框架 和个体编号
选择抽样样本 实施调查 测算结果
(一)确定目标总体
即明确调查的全部对象及其范 围。这是抽样调查的前提和基础。 清楚地说明研究对象的人口统计学
一种新品牌男 士古龙香水的 消费者反映。
思考:得到火柴能否划燃的信息准确吗?
这样做有什么后果?
问1:在这则笑话中,儿子采用的是什么调查方式?
问2:这种调查方式好不好?还可采用什么方法调查?
调查方式的选择
下列调查中,你认为应该采用哪种调查方式,并说出自己 选择这一观点的理由。
(1)了解你们班同学周末时间是如何安排的;
(2)了解一批圆珠笔芯的使用寿命;
抽样调查是按照一定程序,从调查总体中抽取部分样本进行调 查或观察,用所获取的数据对总体的数量特征进行估计和推断。
抽样调查是目前国际上公认和普遍采用的科学的调查手段。
抽样调查旨在以样本资料来推断调查对象总体的相关统计数据。
总体参数估计
总体
样本统计量 (X) 样本
(二)相关术语
1.总体与样本
果准确。
缺 点
工作量大,难度大, 而且有些调查不宜使 用普查
思考学习
为了了解你所在地区老年人的健康状况,你准备怎样收集数据?
下面分别是A、B、C三个小组的调查结果:
100 90 80 小组在公园里 70 60 50 调查了100名老年 40 人,他们一年中生 30 病的次数如图所示: 20 10 0 人数 83
(3)了解我国八年级学生的视力情况; (4)要保证嫦娥三号卫星的成功发射,对重要零部件采用何种方式 检查; (5)全国中学生的节水意识; (6)中央电视台春节联欢晚会的收视率。
普查与抽样调查的比较
普查
优 点
通过调查总体来收 集数据,调查的结
抽样调查
通过调查样本来收 集数据,工作量较 小,便于进行。 调查结果往往不如普 查得到的结果准确
性的情况下,样本增大,所得结果误差会减小。但是当样本大到一定程度之后, 再增加样本,精确度的增加却是微小的,同时巨大的样本不仅耗资太大,也不 便于管理。因此在进行抽样调查时,关键在于精心设计抽样方案,选择有代表性的样本,
这样,只用较少的经费,就可能作出接近真实情况的预测。
一、抽样调查概述
(一)概念
商企业名录、街道派出所里居民户籍册、意向购房人信息册……。
注意: 在利用现有的名单作为抽样框时,要先对该名录进行检
查,避免有重复、遗漏的情况发生。以提高样本对总体 的代表性。
抽样单元指构成抽样框的有限又不重复的个体。
ቤተ መጻሕፍቲ ባይዱ说明:
1、抽样单元不仅指构成抽样框的目录项,同时还表
示该目录项所对应的实际总体特定的一个或一些单元。 2、抽样单元可大可小。 如:在手机调查中我们抽中一栋居民楼,居民楼是一 级单元,而楼中的每个居民就是二级单元。
原来20世纪30年代是美国经济衰退的时期,那时能够安装电话、加入上流社会俱乐部 或能订阅杂志的美国人,大部分支持共和党。也就是说《文学文摘》选择的样本虽然
巨大却存在偏差,样本不具有广泛性和代表性。
《文学文摘》的事例表明抽样调查时,既要关注样本的大小,又要关注样本的代表性。 那是不是在样本具有代表性的情况下,样本越大越好呢?一般来说,在样本具有代表
1
感悟与反思:
抽样调查只考察总体的一部分个体,因此它的优点是
调查范围小,节省时间、人力、物力和财力,但其调
查结果往往不如普查得到的结果准确。 为了获得较为准确的调查结果,抽样时要注意样本的
代表性和广泛性.
大样本一定能保证调查结论准确吗
1936年美国总统竞选时,《文学文摘》向1000万选民寄去了调查问卷,这些选民的 名单是从电话簿、俱乐部名册以及杂志的订户中挑选的.结果在寄出的1000万份调查问卷 中,约有240万的选民寄回了调查表.根据这部分选民的回答,《文学文摘》预测共和党 的布兰登将当选。选举那天的结果完全出乎他们的意料,选民中只有 38%投了共和党的票, 而民主党的罗斯福以多数票当选。《文学文摘》采用了1000万的巨大样本,为何会预测 失败呢?
总体特征 样本特征 男生76% 45% 女生24% 55% 本省67% 80% 外省33% 20%
总 体
样 本
男生78% 女生22% 本省64% 外省36%
样本容量大小 抽样调查的方法
案例:美国1996年大选
候选人得票百分比
日期 主办机构 克林顿 54 多尔 35 佩罗特 9 其他 2
10.30~11.2 New York Times(纽约时报) 11.1~3 11.1~3 11.2~3 11.2~3