6抽样调查案例分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
从总体中随机 抽取n个个体
简单随机抽样图示
样本抽取方法
⑴直接抽选法 ⑵抽签法
对总体单位不编号、不编制抽样框, 直接随机抽选调查单位
是将总体中每个单位的编号写在外 形完全一致的签上,将其搅拌均匀, 从中任意抽选,签上的号码所对应 的单位就是样本单位。
将总体中每个单位编上号码,然后 ⑶随机数码表法 使用随机数表,查出所要抽取的调 查单位。
CSM在全国建立了9个省网、67个单独城市 调查站,样本总规模达到18,500户 2008年春晚播出时,对全国406个区县进 行了3个多小时的电话调查。共访问成功 2063个家庭,其中1899个家庭收看了春晚 ,加权推算出全国有96.5%的家庭收看了央 视春晚。
北京奥运会开幕式收视率
央视-索福瑞:68.8% 家庭 AGB尼尔森: 86.8% 家庭
2、高峰时段轨道交通限流措施有争议
世博会期间,为了缓解大客流的压力,上海轨道 交通在高峰时段会采取临时性限流措施,封闭部 分出入口。这一措施,市民如何反应?调查显示 ,有43.3%的受访者赞成这一措施,44%认为轨道 交通限流给出行带来很多不便,不赞成这种做法 。在依靠轨道交通、或公交加轨道交通出行的受 访者中,反对限流措施的比重更高,分别达到 48.5%和50.3%。这表明,轨道交通限流措施在市 民中影响较大,是否能成为应对客流压力的常规 手段还有待考量,使用时需谨慎。
X 总体平均数: X
N
N1 总体成数:P P N 总体方差:
2 2 ( x X ) i
N
(x X ) F
i
2
F
样本指标:抽样总体的那些指标, 也称样本统计 量,为随机变量。样本指标有:
x 样本平均数: x
n
n1 样本成数:p p n 样本方差:s
第三节 抽样调查范本学习 ----上海市民出行状况调查报告
一、调查基本情况 本次调查通过网上调查形式,在“上海统计”和“ 中国上海”门户网站发布问卷。调查收到回答问卷 2598份,剔除非上海地区的IP地址及回答不全的 问卷后,共获得有效样本2331份,样本有效率为 89.7%。从调查对象的分布看,居住在各个环线 间与不同出行距离的受访者均占一定比重。因此 ,样本的分布情况比较符合上海的实际,具有一 定的代表性。
在影响抽样误差大小的其他因素相同的情况 下,类型抽样和机械抽样比简单随机抽样的 误差要小,单个抽样比整群抽样误差要小。
Baidu Nhomakorabea 将总体所有个 体分成若干群
总体中有N个个体
以选中群中的所 有个体组成样本
以群为单元在总 体中抽取若干群
整群抽样图示
案例1:民意调查
最为出名:盖洛普民意调查
以其准确性和权威性在世界各地享有极高的声誉 盖洛普民调:奥巴马50%对42%的支持率领先麦 凯恩 CNN民调:奥巴马50%对43%的支持率领先麦凯 恩
第一节 抽样调查与抽样推断 的相关概念
一、抽样调查与抽样推断
抽样调查:是一种科学的非全面调查。 它是按照随机原则从调查对象的总体中 抽取部分单位进行调查,并根据这部分 单位的调查结果推断总体的数量特征。
抽样推断:广义上的抽样调查其实已包 含了抽样推断,它是在按照 随机原则 从调 查对象的总体中抽取部分单位进行抽样调 查的基础上,根据这部分单位的调查结果 推断总体 的数量特征的一种由 局部推导全 局的统计分析方法。
二、本市公共交通基础设施建设得到广大市民的基本认可 1、逾四成受访者认为本市交通出行方便 经过多年的建设,目前,上海已形成了一个功能 比较齐全的道路交通网络。调查显示,有7.3%和 35%的受访者认为本市交通很方便和方便,合计 为42.3%;36.8%认为一般。其中,以轨道交通作 为上下班交通工具的受访者认为本市交通方便和 很方便的分别占8.2%和45.3%,合计为53.5%;认 为一般的占34.3%。市民对上海轨道交通总体评 价更为积极。 调查同时显示,仍有两成的受访者认为本市交通 不太方便或者很不方便。主要原因是这部分受访 者居住在外环外区域,受公共交通网络布点的局 限,上下班转换车辆不便及花费时间较多。
4、受访者平均步行7.5分钟乘上公共交通
按公共交通工具分组来看,乘坐公交车上 下班的受访者单程平均花费的交通时间为 53.7分钟,其中在车上时间为40.7分钟; 乘坐轨道交通的单程平均花费的交通时间 为58.5分钟,其中在车上时间为42.8分钟 ;公交车加轨道交通的单程平均花费的交 通时间为68分钟,其中在车上时间为53.4 分钟。这表明,目前受访者上下班两头的 平均步行时间约15分钟,平均步行7.5分钟 就能到达公交站点或轨道交通站点。
总体中有N个个体
将总体中个体按某一标志 排序,并均分成n个部分。
在第一部分中随机地抽取一 个,然后每隔相同的距离抽取 一个,直到抽完n个为止。
等距抽样图示
四、整群抽样
将总体各单位划分成许多群,然后从其中随机抽 取部分群,对中选群的所有单位进行全面调查的 抽样组织形式。又称区域抽样或分群抽样。 整群抽样对被抽中群体的所有单位都作调查,因此 抽样平均误差不再受群内方差的影响,而受群间方 差和抽样数目的影响。整群抽样采用不重复抽样方 法抽取样本。
社 会 调 查 方 法
---抽样调查
知识点回顾
普 查
全面调查 统 计 调查 非全面 调 查
全面报表 抽样调查
重点调查
典型调查
最常用的是:抽样调查
民意调查 市场调查 收视率调查 农产量、贸易、住户调查、劳动力、工业 企业抽样调查 ……
在这一章,我们将学习:
什么是抽样调查? 如何用抽样调查的样本数据推断总体 ? 抽样调查的组织方式有哪些?
二、类型抽样
先对总体各单位按主要标志加以分组,然后再从各
组中按随机原则抽选一定单位构成样本。 或称分
类抽样、分层抽样
样本抽取方法
(1)等比例类型抽样法(类型比例抽样法) (2)不等比例类型抽样法(类型适宜抽样法)
在类型比例抽样中,首先要对总体作分类(组)。再 从每类(组)中随机抽取样本。所以不存在组间误差, 抽样平均误差取决于各组内方差的平均水平。
2、逾六成受访者上下班出行选择公共交通 公交与轨道交通成为市民上下班的主要交通 工具。调查显示,有26.9%的受访者选择乘坐公 交,17.2%选择乘坐轨道交通,21.4%选择乘坐公 交加轨道交通,合计为65.5%;另有12%上下班出 行使用助动车,13.%使用私家车,9.3%使用自行 车或其他。这表明,逾六成受访者上下班出行选 择公共交通,这与目前上海公共交通方便快捷、 花费少有着重要关系。 分区域看,居住在内环的受访者选择公共交通 出行的占66.8%,居住在内中环间的受访者选择 公共交通出行的占70.1%,居住在中外环间的占 71.9%,居住在外环外的占56.9%。这表明,在公 共交通较为便捷的区域,市民更倾向于选择公共 交通出行。
5、近八成以公共交通出行的受访者每天上下 班交通花费在5元以上 在选择公共交通出行的受访者中,有 20.2%每天上下班交通费用在4元以内, 57.3%在5-10元,22.5%在10元以上。从居 住地到单位的距离分组来看,距离越长, 相对花费越多。从公共交通工具分组来看 ,公交车成本较低,而乘坐轨道交通的花 费相对较高。
二、全及总体和抽样总体(总体和样本)
全及总体:就是统计总体,是为了与样本 相区别而提出的,全及总体的容量(单位 数)用N表示。全及总体也称为母体。
抽样总体:有称样本总体,是抽取出来的子 样组成的总体,抽样总体的单位数用n表示。
三、总体指标和样本指标(参数和统计量)
总体指标:全及总体的那些指标,也称总体 参数或母体参数,其值唯一。总体指标有:
三、市民对本市交通状况的评价差异较大
1、逾三成受访者认为高峰时段路面严重拥堵 尽管世博会后上海交通更加便捷,但在上下 班的高峰时段,路面的交通状况仍不容乐观。调 查显示,仅有7.8%的受访者认为高峰时段的路面“ 很通畅或比较通畅”,56.1%认为“有点拥堵”, 34.9%认为“严重拥堵”。高峰时段市民感受到的路 面交通压力与居住地有明显的相关性。居住在内 环与中内环间的受访者认为路面“严重拥堵”的分 别占31.8%和31%,而居住在中外环间与外环外的 市民认为路面“严重拥堵”的分别达到37.7%和 37.2%。
2 2 ( x x ) i
n
( x x) f
i
2
f
四、重复抽样和不重复抽样(重置抽样和 不重置抽样)
重复抽样:也称为重置抽样,是指按照随机 原则,抽取一个登记后,放回去再按随机原 则再抽的抽样方法。 不重复抽样:也称为不重置抽样,是指抽取 出总体单位后,不再放回去,对剩下的总体 单位继续按随机原则进行抽样的方法。
总体中有N个个体
将总体分成若干个类型组 在 i组中随机抽取n i个个体
n1+ n2+ +nk= n
类型抽样图示
三、机械抽样
先按某一标志对总体各单位进行排队,然后依一定顺 序和间隔来抽取样本单位的一种组织形式。又称 等
距抽样或系统抽样
样本抽取方法
(1)按无关标志排队
(2)按有关标志排队
如果按无关标志排队,其抽样误差就十分接近简单随 机抽样的误差,因此可采用简单随机抽样平均误差的 计算公式来近似地反映;若按有关标志排队,其抽样 平均误差可采用类型抽样平均误差的公式计算其近似 值。但在实践上,由于各组的方差是未知的,而且各 间隔又只抽一个单位,因而也无法由抽样资料求得, 一般仍按纯随机抽样误差公式进行计算。
3、受访者上下班交通单程平均时间为50.4分钟
有9.3%的受访者上下班单程耗时在15分钟 以内,16.4%耗时在15-30分钟,18.7%耗 时在30-45分钟,24.2%耗时在45-60分钟, 22.4%耗时在60-90分钟,9%耗时在90分钟 以上。经加权平均计算,受访者上下班单 程平均时间为50.4分钟。按居住地到单位 距离的分组来看,距离越长,相对耗时越 多。
第二节 抽样组织方式
一、简单随机抽样
对总体单位不作任何分类、排队,而直接从总体中随 机抽取一部分单位来组成样本的抽样组织方式。又称 为纯随机抽样。
适用范围:
它适用于总体单位数不多,总体单位标志值的差异 不很大,或对抽样推断的要求又不高的情况下采用。
总体中有N个个体
简单随机抽样 的样本个体在总体 中的分布是无规律 的。
五、有序抽样和无序抽样
有序抽样:指每次抽样的先后要进行排序的 抽样方法。有有序重复抽样和有序不重复抽 样。 无序抽样:指每次抽样的先后不进行排序的 抽样方法。有无序重复抽样和无序不重复抽 样。
六、样本容量和样本个数
样本容量:是指一个样本所包含的单位数。 用n表示。 n ≥ 30 大样本 n < 30 小样本 样本个数:是指一个总体可能抽取的样本个 数,根据抽样方法的不同,同样的总体所可 能抽取的样本个数是不同的。
四、本市私家车拥有量逐年增加现象值得关注
1、半数有车受访者使用私家车上下班 在所有受访者中,有26.2%拥有私家车。从 居住地分组看,居住在外环外的受访者私家车拥 有率最高,达到29.9%,比内环高6.7个百分点。 从私家车使用情况看,半数有车族使用私家 车上下班。随着居住区域的外移,使用私家车作 为上下班出行工具的比重逐步提高。居住在内环 的有车族中仅有40.9%使用私家车上下班;居住 在内中环和中外环的有车族使用私家车上下班的 比重分别为46.4%和45.1%;居住在外环外的有车 族使用私家车上下班的比重最高,达到59.5%。
出口民调
出口民调,是私营调查机构在投票站出口 处对刚刚走出投票站的选民进行的一项调 查,通过直接询问选民投给谁来预估选举 结果。
案例2:电视收视率调查
收视率是指:收视人数除以整个市场电视人口数 的百分比(如:收视率2%,意味着100个人中 有2个人收看)
收视率影响广告商愿意花多少钱来买某节目 的广告,以及该节目播不播下去。
收视率在中国
央视-索福瑞公司 AGB尼尔森公司
尼尔森公司2008春晚收视率调查
总体:4.24亿收视人群 样本:全国14省市14,000户家庭 (装有个人收视记录仪) 标志:某一时段是否在看春晚节目 指标:全国家庭收视率71.8% 央视-索福瑞调查结果春晚收视率为96.5%
央视-索福瑞CSM公司