第4章 抽样调查
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 系统抽样适用于同质性较高的总体, 即总体内部各单位之间的差别不大。
(三)分层抽样
• 分层抽样方法:将总体个单位先按照某些特征 标志相关的表式分组(层),然后在各组(层) 中采用随机抽取方式确定所要抽取的单位。
• 优点:更为精确,还可以获得对每层的推断。 • 技术问题:分层需要额外费用;分层的精确性要另外 评估,增加复杂性和新的误差。
一、随机抽样 • (一)简单随机抽样:
–单纯随机抽样,完全随机抽样 –是所有随机抽样方法中最简单的一种方法 –它按照随机的原则从调查总体中不加任何分 类、排序、分组等先行工作,直接地抽取调 查样本单位。 –各单位被抽到的机会完全均等,相互独立, 排除了抽样过程中各种主观因素的干扰。
直接抽取法
• 从调查总体中直接随机抽取样本进行调查
到底多少人赞成取消“黄金周”?
2007年11月9-15日,新华网、人民网、国家发改委网站、新浪、搜 狐等网站就“节假日调整方案”联合进行网上调查,约155万人通 过网络参与了调查,调查结果是: 68%的网民支持将“五一”节调整出的两天和新增加的一天用于增 加清明、端午、中秋三个传统节日为国家法定节假日; 81%的网民支持保留“十一”和春节两个黄金周,并将春节放假时 间提前一天(即春节假从除夕开始); 77%的网民支持调整前后周末形成元旦、清明、国际劳动节、端 午、中秋五个连续三天的“小长假”; 90%网民支持国家全面推行职工带薪休假制度。
一、全及总体和抽样总体
• 抽样总体n:
– “样本”,是从全及总体中随机抽取出来,代 表全及总体部分单位的集合体。 –抽样总体的单位数通常用小写英文字母n表示。 –一般说来,样本单位数达到或超过30个称为大 样本,而在30个以下称为小样本。
二、重复抽样和不重复抽样
• 重复抽样又称放回式抽样 • Sampling with replication • 每次从总体中抽取的样本单位,经检验之后又 重新放回总体,参加下次抽样,这种抽样的特 点是总体中每个样本单位被抽中的概率是相等 的。
资料来源:2007年11月16日“北京青年报”
网友质疑: 网民调查的比例是否就是全体公民意愿的比例? 调查问卷中是否有缺欠?
(整个调查问卷以“五一”黄金周取消为前提, 例如问卷中“对于保留十一和春节两个黄金周, 您的态度是什么”这个问题,回避了五一黄金周 存废问题,有偷换概念的嫌疑) 该项调查也引起一片质疑。
(四)整群抽样
• 聚类抽样、集团抽样 • 整群抽样就是“一批批”、“一群群”的抽样。 • 当总体所在基本单位自然组合或被划分为若干个群 后,从中随机抽取部分群并对抽中群内全部或部分 单位进行调查。 • 在大规模市场调研中,当群体内各个体间的差异较 大,而各群之间差异较小时,最适合采用此方式。 • 在现实中使用广泛的优势。
整群抽样操作步骤
1、确定分群的标注 2 、总体(N)分成若干个互不重叠的部分,每个部分为一群 3、根据各样本量,确定应该抽取的群数 4、采用简单随机抽样或系统抽样方法,从i群中抽取确定的群 数。 例如,调查中学生患近视眼的情况,抽某一个班做统计; 进行产品检验; 每隔8h抽1h生产的全部产品进行检验等。
而分层抽样必须遵守随机原则; 在分层抽样中,用于分类的标志,应联系研究目 标来选择,而配额抽样无此要求。
1 1 1 例如: , , , 5000 5000 5000
二、重复抽样和不重复抽样
• 不重复抽样,亦称不放回式抽样。 • sampling without repeating
• 每次从总体中抽取的样本单位,经检验之后不再 放回总体,在下次抽样时不会再次抽到前面已抽 中过的样品单位。 • 总体每经一次抽样,其样品单位数就减少一个, 因此每个样品单位在各次抽样中被抽中的概率是 不同的。
第四章
抽样调查
绝大多数市场调研工作的目标是获取研究总体的 各类信息及其特征。
调查结果准 确、价值
耗费人力物 力、大量经 费和时间
普查:对每一个调查对象的信息和特征 进行详细的统计分析进行全面的调查
统计推断的过程
总体
样 本
样本统计量
例如:样本均 值、比例、方 差
生活在调查中的现代人
调查无所不在
抽样调查是应用最广泛的调查方式 在国外,抽样调查几乎应用于所有领域 在国内,抽样调查应用发展迅速 如人口变动调查,劳动力调查,社会问题 研究,电视收视率调查,满意度调查,以及各 种民意调查等。
五、抽样误差和非抽样误差
• 抽样误差:
• 抽样误差是指由于随机抽样的偶然因素使 样本各单位的结构对总体各单位结构的代 表性差别,而引起的抽样指标和全及指标 之间的绝对离差。 • 抽样误差即指随机误差,这种误差是抽样 调查固有的误差,是无法避免的。
抽样误差的作用
(1)在于说明样本指标的代表性大小。 • 误差大,则样本指标代表性低; • 误差小,则样本指标代表性高; • 误差等于0,则样本指标和总体指标一样大。 (2)说明样本指标和总体指标相差的一般范围。
与分层抽样的不同之处
• 划分的标准不同: – 分层---某一特征、分群----自然形成的区域 • 要求不同: – 分层---要求各层之间差异大,层内个体差异小(具 有相同的特征);分群—-各群之间差异小,群内个体 差异大 • 抽取的数目不同:
– 分层---每层抽取若干单元、分群----整群抽取
4.3.2 非随机抽样
对人的评价比对物的评价要更困难
4.1 抽样调查的基本概念
wenku.baidu.com
• 抽样调查,一种非全面调查,它是从全部 调查研究对象中,抽选一部分单位进行调 查,并据以对全部调查研究对象作出估计 和推断的一种调查方法。
一、全及总体和抽样总体
• 全及总体N:
– “母体”,简称“总体”,是指所要认识对象 的全体,总体是由具有某种共同性质的许多单 位组成的 –例如,要研究某城市职工的生活水平,则该城 市全部职工即构成全及总体。我们要研究某乡 粮食亩产水平,则该乡的全部粮食播种面积即 是全及总体。
影响抽样平均误差的因素
• • • • 全及总体标志变异程度——正比关系 样本容量——反比关系 抽样组织方式 抽样方法
降低调查误差的途径
• • • • • • • 提高样本的代表性 注重样本量的控制 提高抽样设计的效率 重视抽样方案的审评 努力降低调查员的误差 努力调查被调查者的误差 注意调查误差的事后控制
其适用场合包括: 1.严格的概率抽样几乎无法进行 2.调查目的仅是对问题的初步探索或提出假设 3.调查对象不确定或根本无法确定 4.总体各单位间离散程度不大,且调查人员有丰富的 调查经验
包括偶遇抽样、判断抽样、等额抽样、滚雪球抽样。
(一)任意抽样
含义:又称为偶遇抽样、便利抽样。它是指市
场调查者把在一定时间、一定环境中所遇见的 人,作为调查对象选入样本的方法。 • 调研人员根据“最便利”原则确定自己的调研样本。 • 一般用于非正式的探索性调查 • 便利抽样也要确定对受访者是否符合调查要求。
(一)任意抽样
常见类型:街头随访或拦截访问、邮寄调
查、杂志内问卷调查以及网上调查。
例:“沈阳市25-35岁居民的消费状况调查”调研 人员选择亲人、同学或朋友作为访问对象,立即 开展调查; 市场调研机构在行人通道或商场采用“拦截式访 问”的方法获得调研分析信息,也是便利抽样。
(二)判断抽样
• 判断抽样:
4.2 抽样调查的程序
• • • • • • • 界定总体 选择资料收集方法 制定抽样框 决定抽样方法 确定样本容量 制定抽样计划 抽样计划的实施
4.3 抽样调查方式
一、随机抽样
–含义:指按照随机原则从总体中抽取一定数 目的单位作为样本进行调查 –对总体中每一个总体单位都给与平等的抽取 机会的抽样技术。 –优点:大致可以代表总体;能够计算调查结 果的可靠程度。 –缺点:难以体现重点;范围广、时间长、参 加人员多和费用多;需要具有一定的专业技 术的专业人员进行抽样和资料分析。
四、抽样单元
• 抽样单元:
–抽样调查是被抽中的总体单位,也叫“样 本单元” –将总体划分为有限个互不重叠的部分
五、抽样误差和非抽样误差
抽 样 中 的 误 差
非抽样 误差 抽样 误差
系统误差 实际误差
代表性 误差
抽样平均误差
五、抽样误差和非抽样误差
• 非抽样误差:
–在抽样调查中由于人为因素造成的误差 –调查方案有缺陷、调查方法不科学、调查人员 不诚实、抄写、记录、登记、计算等工作上的 失误 –采取一定措施可以避免。
上述调查结果都是被社会广泛质疑的。从技术层面 讲,被质疑的一个重要原因是没有说明样本的产生过 程,样本的代表性。
成功的案例也有。如美国总统竞选的预测。
•
• • • • • • • • •
美国总统竞选预测:
民主党候选人 1968 汉佛莱(50%) 1972 1976 卡特(51%) 1980 1984 1988 共和党候选人 尼克松(50%) 尼克松(62%) 里根(52%) 里根(59%) 布什(56%) 实际 尼(50.3%) 尼(61.8%) 卡(51.1%) 里(55.3%) 里(59.2%) 布(53.9%)
• EG:随机数生成器,抽奖程序
• 简单随机抽样适用于总体数不太庞 大以及总体分布比较均匀的情况。
(二)系统抽样 当总体的个数较多时,采用简单随机抽样太 麻烦,这时将总体分成均衡的部分,然后按照 预先定出的规则,从每一部分中抽取1个个体, 得到所需要的样本,这种抽样称为系统抽样。 也称“等距抽样”、“机械抽样”,也就是 从总体中等距离的抽取样本。
• 如:质量检验
抽签法
• 1、把总体中的N个个体编号。 • 2、把号码写在号签上,将号签放在一个容 器中搅拌均匀。 • 3、每次从中抽取一个号签,连续不放回抽 取n次。 • 4、将取出的n个号签上所对应的n个个体取 出,就得到一个容量为n的样本。
随机数表法
• 将调查总体单位一一编号; • 在随机号码表上任意规定抽样的起点和抽 样的顺序; • 依次从随机号码表上抽取样本单位号码。 凡是抽到编号范围内的号码,就是样本单 位的号码,一直到抽满为止。
调查能测准吗?
也能,也不能。 看几个相关的例子
传统观念被颠覆了吗?
雪儿· 海蒂(Shere Hite)在1987年出版的《女性与爱情:前进中的文化 之旅》一书中,给出了一些数据: 84%的女性“在情感上对两性关系不满意”(第804页)。 70%的女性“在结婚五年或者更久后发生了婚外性关系”(第856页)。 95%的女性“在恋爱时会因男友而出现情感及心理上的烦恼”(第81页)。 84%的女性在与男友的恋爱中有屈尊感(第809页)。 这本书遭到全美报刊及杂志文章的广泛批评。例如,《时代周刊》的封 面故事“后退,巴迪”里认为海蒂的研究结论是“模糊的”、“没有价值 的”。 “是试图颠覆人们传统观念中的女性”。 资料来源:Sharon L. Lohr 2002, Sampling: Design and Analysis, 中 国统计出版社,P1
1 1 1 例如: , , , 5000 4999 4998
三、抽样框
• 抽样框又称“抽样框架”、“抽样结构”, • 是指对可以选择作为样本的总体单位列出 名册或排序编号,以确定总体的抽样范围 和结构。 • 设计出了抽样框后,便可采用抽签的方式 或按照随机数表来抽选必要的单位数。若 没有抽样框,则不能计算样本单位的概率, 从而也就无法进行概率选样。
–凭借研究人员的主观意愿、经验和知识,从总 体中选择具有典型代表性的样本作为调查对象 的抽样方法。
• 一般做法:
–选择最能代表普遍情况的调研对象,常以“平 均型”或“多数型”; –利用调查总体的全面统计资料,按照一定的标 准主观选取样本。
(三)配额抽样
• 配额抽样与分层抽样的区别:
配额抽样的被调查者不是按随机原则抽出来的,
等比例分层抽样
• 例如,一个单位的职工有500人,其中不到 35岁有125人,35岁至49岁的有280人,50 岁以上的有95人。为了了解这个单位职工 与身体状况有关的某项指标,要从中抽取 一个容量为100的样本,由于职工年龄与这 项指标有关,决定采用分层抽样方法进行 抽取。
• 分层抽样适用于规模大、内部结构 复杂且类别分明的总体。