抽样技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
又如:调查国人对中国举办2008奥运会的态度: 在大街上某个路口随意访问。
这样会有意无意地先择那些穿戴整齐、较为文 明的人来访问,很容易产生偏差。
3.定额抽样
第一章 抽样调查概述
先对调查对象按一定标志分类,根据历史 资料确定每类应抽比例,每类依主观判断抽取 一定数量的单位作为样本。由美国民意调查专 家盖洛普创立,比随意抽样有不少改进之处。 优点:样本结构接近总体结构,提高了样本的 代表性,可使n减少,有一定的科学性。 推广较快。 缺点:1、仍然无法排除主观因素随意性影响。 2、难以估计、控制抽样误差。 事实上,这种抽样是划类选典式的典型调查。
(三)抽样调查的特点
第一章 抽样调查概述
1.按一定的概率以随机原则抽取样本单位
典型调查以人的主观判断选择,重点调查以 在总体标志总值中所占比重大这一客观标准。
随机原则就是在抽取样本时排除主观上有 意识地抽取调查单位,使每个单位都有一定的 机会被抽中。根据这一原则,各单位是否中选 不受任何主观因素的影响,完全取决于随机因 素。只有这样,才能使样本与总体结构相似, (总体的缩影),从而保证样本的代表性,所 以,这是抽样调查的根本原则。(否则,抽样 推断将缺乏依据)。
(一)目的抽样:(非概率抽样)
第一章 抽样调查概述
以调查者的主观判断为依据来抽取样本。 在实际应用中,有以下几种形式: 1.典型抽样 调查者凭借自己对调查对象的了解和主观 判断,有意识地从总体中抽取具有平均水平或 具有一般特性的单位作为样本。
优点:发挥主观能动性。充分利用已掌握的有 关信息,避免产生有极端的偏误。
第一章 抽样调查概述
柴先生告诉《中国财富》:“我回国以后,请 了十多个新产品的购买者回来座谈,他们拒绝 再次购买的原因是宠物不喜欢吃。”产品的最 终消费者并不是“人”,人只是一个购买者, 错误的市场调查方向,决定了调查结论的局限, 甚至荒谬。 经历了这次失败,柴先生认识到了调研的两面 性,调研可以增加商战的胜算,而失败的调研 对企业来说是一场噩梦。
第一章 抽样调查概述
注意,随机≠随意。随意或任意抽样,一 般是为了图方便,省事,常常带有调人员的主 观意愿。尽管其主观上不希望样本有偏,但在 无意中任仍会产生意想不到的偏差。 按随机原则抽样,有2个共同特点:
① 选择样本有确定的程序 ② 访问者没有权利自己去选择被访对象
第一章 抽样调查概述
2.以样本的数量特征推断总体的数量特征。
这么大的误差是怎么得来的呢?
我们来看一下其民意调查过程:
1.调查中共印制问卷1000万份,回收240万份。 2.采用邮寄问卷的形式,寄信地址来源于电话公 司。
第一章 抽样调查概述
当时的社会经济背景是:1936年的美国只有 1/4的人装了电话。
预测失败的原因: 1.样本的选择不是随机的,是有偏的。装 了电话与未装电话的人是富人与穷人两个不同 的群体,投票倾向明显不同,大多数穷人支持 罗斯福。 2.问卷的回收率偏低。回收的与未回收的 问卷填写人也有不同的投票倾向。更加扩大的 误差。
统计研究的目的:认识现象总体的数量特征。 但不一定只有全面调查才能达到这一目的。以 样本→总体,是抽样调查的独特功能。总体和 样本肯定有差异,但概率论与数理统计已严格 证明了随机抽样下样本与总体的内在联系与抽 样分布规律。 2 2 如 E( Sn1 ) 2 E( xi ) X , E( p ) P , E( sn ) n 1 2
n
2 S n为 2的渐迈无偏估计,→∞, n
3.运用概率估计方法
第一章 抽样调查概述
由于抽样的随机性,样本是不确定的,因 为样本统计量与总体参数之间不存在象自变量 和因素量那样的涵数关系,统计量的可靠性只 能以一定的概率保证程度来说明,而非完全肯 定。如学生身高的估计(95%)。 当用样本对总体目标量进行估计时,要考 虑该样本被抽中的概率。即估计量不仅与样本 单位的观测值有关,也与其入样概率有关。
第一章 抽样调查概述
为了能够了解更多的消费信息,柴先生设计了精 细的问卷,在上海选择了1000个样本,并且保证 所有的抽样在超级市场的宠物组购物人群中产生, 内容涉及:价格、包装、食量、周期、口味、配 料等6大方面,覆盖了所能想到的全部因素。
2005年初,上海柴氏的新配方、新包装狗粮产品 上市了,短暂的旺销持续了一星期,随后就是全 面萧条,在一些渠道甚至遭到了抵制。 “科学的 调研为什么还不如以前我们凭感觉定位来的准 确?”到2005年2月,新产品被迫从终端撤回, 产品革新宣布失败。
因为一般而言共和党比民主党富裕一些,受 过良好的教育,他们更可能拥有电话,任在较好 的地段,总之,访问他们比较容易。
(无意之中)于是在定额抽样中经常产生“共和 党偏差”。其实,在1936、1940、1944年三次调 查中,同样存在此问题,但由于当时民主党领先 优势十分明显,而使这种偏差得到抑制,其结果 仍然正确。但到了1948年,民主党领先的优势变 得十分微弱,这种微弱的优势被定额抽样中的 “共和党偏差”压倒,于是得出了共和党杜威将 战胜民主党杜鲁门这一错误预测。
统计调查的组织方式
《统计学》第二章 统计调查
wk.baidu.com
报表制度
总体单位 调查单位
可以全面调查,但 通常是调查限定规 模以上的总体单位
统计调查的组织方式
《统计学》第二章 统计调查
普
查
总体单位
调查单位
对全部单位 进行调查
统计调查的组织方式
《统计学》第二章 统计调查
重点调查
总体单位 调查单位
只调查重点单位(单位 数不多但其标志量占标 志总量比重较大的单位)
第一章 抽样调查概述
对定额抽样的进一步分析
定额抽样中,在每类中访问定额固定 的情况下,每位访问员可以自由地访问他 所愿意访问的任何人。由于定额常常是按 总体有关情况而设定的,从直观上看使人 感到样本很像总体,但实际情况并非如此 理想 看以下例子:
第一章 抽样调查概述 例如: 1984年,盖洛普公司的访问人员就过多地选 择了共和党人作为样本,为什么???
(二)概率抽样(随机抽样)
第一章 抽样调查概述
以概率论和随机原则为依据抽取样本。
保证总体中每个单位有被抽中的机会(一 定概率),不受调查者主观因素的影响,从而 能充分保证样本的代表性。本课程所讨论的即 为随机抽样。 抽样调查的完整概念为: 按随机原则,从总体中抽取部分单位作 为样本,以样本特征值估计或推断总体数量 特征的一种统计分析方法。
第一章 抽样调查概述
直到2000年、2001年,以旭日升为代表的冰茶在 中国全面旺销,北华饮业再想迎头赶上为时已晚, 一个明星产品就这样穿过详尽的市场调查与刘强 擦肩而过。 举行口味测试的时候是在冬天,被访问者从寒冷 的室外来到现场,没等取暖就进入测试,寒冷的 状态、匆忙的进程都影响了访问者对味觉的反应。 测试者对口感温和浓烈的口味表现出了更多的认 同,而对清凉淡爽的冰茶则表示排斥。测试状态 与实际消费状态的偏差让结果走向了反面。
天下没有免费的午餐,你能用抽样原理揭穿其骗局吗?
第一章 抽样调查概述
让我们来计算一下出现各种分数的概率。
50、100分的概率:
c c
10 10 10 20
1 184756
75分的概率:
c c c
5 5 10 10 10 20
1 3
第一章 抽样调查概述
总统选举结果民意调查
1936年,罗斯福和兰登在美国进行总统竞选, 当时有一家著名杂志社《文学摘要》进行了一 次民意调查预测,预测结果是:
第一章 抽样调查概述
40 30 20 10 0 第一季度
西部 第三季度
第一季度 第二季度 第三季度 第四季度
免费摸奖的例子
第一章 抽样调查概述
大街上免费摸奖的小摊,摸奖规则如下:
有20个球,10个标记5,10个标记10,放在一个纸箱里, 摸奖者任意从中抽取10个球,将球上的分数相加。奖 励如下: 50分、100分奖2000元 55分、95分奖200元 60分、90分奖水壶一个 65分、85分奖热水瓶一个 80分、70分奖劣质香皂一块 75分则花30元买一瓶洗发水.
统计调查的组织方式
《统计学》第二章 统计调查
典型调查
总体单位 调查单位
对典型单位进行调 查,典型单位的选 择并不一定按规模
统计调查的组织方式
《统计学》第二章 统计调查
抽样调查
总体单位 调查单位
按随机原则选择调 查单位,各单位被 选中的机会相同。
一、抽样调查
第一章 抽样调查概述
抽样调查是一种非全面统计调查方法。在 各种调查方法中,抽样调查是当今最主要的统 计调查方法。广泛应用于社会、经济的各个领 域,抽样理论和方法已成为现代统计学的重要 组成部分,成为其中发展最快,最为活跃的一 个分支。 对抽样最通常的理解就是抽取样本进行调 查。由于抽取样本的依据不同,广义的抽样调 查可以分为两类:
缺点:
第一章 抽样调查概述
1、主观随意性大,不同的人有不同的判断。
2、对调查结果的评价缺乏客观标准。
3、对调查偏误无法掌握和控制。
这种抽样,事实上就是解剖麻雀式的典型调查。
2.随意抽样
第一章 抽样调查概述
指利用已有的名册、号薄或地图等资料, 任意确定调查单位。 优点:简便易行
缺点:抽样所依据的总体(抽样总体)不能涵 盖所有被研究现象总体(全及总体)。所抽取 的样本常会产生较大偏差。例如《文学摘要》 进行的民意测验就是一次失败的随意抽样。
数据给企业带来的噩梦
第一章 抽样调查概述
上海柴远森先生出差来北京的时候,在西单买了 一本市场调查的书。3个月以后,他为这本书付 出了三十几万元的代价。更可怕的是,这种损失 还在继续,除非柴先生的宠物食品公司关门。
最近两年,宠物食品市场空间增加了两三倍,竞 争把很多国内企业逼到了死角。渠道相近,谁开 发出好的产品,谁就有前途。以前做生意靠经验, 我觉得产品设计要建立在科学的调研基础上。去 年底,决定开始为产品设计做消费调查。
中国人不喝冰红茶
第一章 抽样调查概述
一间宽大的单边镜访谈室里,桌子上摆满了没有 标签的杯子,有几个被访问者逐一品尝着不知名 的饮料,并且把口感描述出来写在面前的卡片 上……这个场景发生在1999年,当时任北华饮业 调研总监的刘强组织了5场这样的双盲口味测试, 他想知道,公司试图推出的新口味饮料能不能被 消费者认同。
第一章 抽样调查概述
此前调查显示:超过60%的被访问者认为不能 接受“凉茶”,他们认为中国人忌讳喝隔夜茶, 冰茶更是不能被接受。刘强领导的调查小组认 为,只有进行了实际的口味测试才能判别这种 新产品的可行性。
等到拿到调查的结论,刘强的信心被彻底动摇 了,被测试的消费者表现出对冰茶的抵抗,一 致否定了装有冰茶的测试标本。新产品在调研 中被否定
第一章 抽样调查概述
目的抽样(非概率抽样)的共同特点是: 抽取样本时不是按照随机原则,而是根 据主观判断有目的、有意识地进行,或根据 方便的原则进行。 采用非概率抽样方法获得的数据不能用来 计算抽样误差,不能从概率的意义上控制误差 并以此来保证推断的准确性。 如果调查的目的是用样本数据推断总体的目 标量,并以一定的把握程度保证总体目标量落 在一定范围,这时非概率抽样是不适合的。
第一章 抽样调查概述
主要内容 第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章
第一章 抽样调查概述
抽样调查概述(导论) 抽样调查的基本理论 纯随机抽样(比率估计、回归估计) 分层抽样 等距抽样 整群抽样 多阶段抽样 非抽样误差分析
第一章 抽样调查概述
参考书目: 《抽样调查与推断》 李金昌 中国统计出版社 《抽样调查技术》 任栋 西南财大出版社 《抽样调查的理论和方法》 施锡铨 上海财大 出版社 《调查统计学》 隗斌贤等 中国统计出版社 《抽样调查的理论和方法》 冯士雍等 中国统 计出版社 《抽样技术》 [美]W· 科克伦 中国统计出版社 G·
兰登(57%)
胜
罗斯福(43%)
这些预测是根据有约240万人参加的问卷调查 作出的,样本数已足够多了,但不幸的是,竞 选结果是:
罗斯福(62%) 胜
兰登(38%)
第一章 抽样调查概述
罗斯福以一边倒的优势当选为总统,此后不久, 《文学摘要》杂志社就垮了。
《文学摘要》预测误差幅度之大令人吃惊,这是重要 民意测验所出现过的最大的误差,成为西方统计教学 中的一个经典案例。