定量调查中样本量的计算

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

总体规模(N)
所需样本量(n)
50
44
100
80
500
222
1000
286
5000
370
10000
385
100000
398
1000000
400
10000000
400
估计精度越高越好吗?
简单随机抽样估计比例P的样本量与误差(当P=0.5时)
样本量 50
误差 0.14
100
0.10
500
0.045
1000
简单随机抽样案例计算
在北京进行一项抽样调查以了解某种新服务方式的接 受度,根据厂家反映,接受度为30%,厂家要求在95 %的置信度下抽样误差范围不超过正负4%,因此简 单随机抽样的样本量为:
1.96×1.96×30%×(1-30%)/(4%×4%) =504
样本量与总体规模N有关吗 ?
例:简单随机抽样估计P,置信度95%,允许误差5%,在P=0.5条件下
数据录入
统计分析
抽样的种类
概率抽样(简单随机抽样、系统抽样、分层抽样、整群抽样) 非概率抽样/配额抽样(拦截、邮寄、杂志内附问卷、判断、
雪球 )
总体
抽样 概率抽样
推断
样本
关于配额抽样
一般情况下,配额抽样是不能计算潜量或推算 总量的,即使进行推算也一定要说明数据的局 限性。
随机过程中的配额抽样要记录过滤量,合格但 配额已满没有访问的量。
确定样本量的公式
N= t2S2 / e2
N—样本规模 t—概率度 S—总体元素分布方差 e—极限抽样误差
t概率度(一般置信度95%时, t=1.96,如置信度为99%, t=2.6)
N并=使t用2P设(1计-P效)/应e2
dNP e——f样为f本总进规体模比行例修正:
t —概率度 e —极限抽样误差
定量调查中样本量的计算
By Tony ZHENG
2009.05
两个问题
问题:小A打算掷10次硬币,前6次的结果是4次正 面,两次反面,请问第7次的结果出现正面或反面的 可能性哪一个更大?
问题:小B打算掷10次色子,前6次的结果是3个六, 2个一,1个二,请问第7次的结果出现六的可能性有 多大?
为什么进行抽样
0.032
对精度要求的判断十分重要。为得到最小误差而选择最
大样本量不是好的选择。
费用与精度
100%
精 度
95% .…………..
……. 60%
20%
40%
费用
确定样本量需要考虑的内部 因素
• 全国性的还是分城市的或者是分区的 • 城市内是否要进一步按职业或企业类型等变量细分,分
析是否详尽(三层至四层) • 是否用高级统计分析方法 • 80%以上的CELL中不少于30个样本量 • 是否要做预测 • 是否使用模型
确定样本量需要考虑的外部 因素
费用是实际项目设计中最重要的 影响因素
非抽样误差的控 制
时间的限制
实际操作的可实 施性
由此可知,在精度要求相同条件下,在 北京
市进行一项调查和在全国进行一项调查,样 本
量的差别并不大。
总体规模越大,进行抽样调查的效率越 高。
若分类、分区、分层分别进行估计则另当别 论。
❖ 事实上,这是一个概率问题,不论前面的结果如何,每一次试验的出现某 种结果的概率都是一定的。
❖ 如果我们进行无数次的试验,正反面出现的次数一定是1:1 ❖ 其实我们并不需要进行无数次的试验(成本、精力、破坏性)
❖ 表面上的定义:统计学是搜集、整理和分析统计数据的方法,目的是 探索数据的内在数量规律性,以达到对客观事物的科学认识。
❖ 体现精髓的定义:统计学是用样本估计总体的方法。
为什么进行抽样——误差的 来源
不严格定义






非抽样误差
我要在北京做3万份,因为北京有好几千万人
非抽样误差的来源
项目设计
问卷设计-无歧义、无诱导、信度与效度的检验
访问环境
拒访率、空户率等
访问员素质 实地作业流程 回答记录
非抽样误差有 时超过抽样误 差!
小结


Hale Waihona Puke Baidu








•在荆棘中,如何望的更远?
•前程风险,如何预先判断?
数字100 数字决策
•没有调研数据,我们如何决策?
•我们利用概率研究市场,而不是猜测市
谢谢
www.data100.com.cn www.surveycool.com
北京:北京市西城区裕民路18号北环中心1506—1507室 Tel:010-82251655-632/633 上海:上海市普陀区陕西北路1388号银座企业中心905911室 Tel:021—60943470/71/72/73
配额抽样中没有抽样误差之说,也无从推算合 适的样本量。
Km100 ——随机抽样先行,随机配额抽样 ——真实配额加权
样本量的误区
• 有人回答不准确,所以样本量再大也没有用 • 电视上只调查几十个人就够了,我们也可以 • 样本量越大越好 • 这么大的城市,怎么也要好几千人才行 • 大城市多抽,小城市少抽 • 上次调查这么多人,这次也这么多吧 • 能省钱就省钱,先这么着吧,估计差不多吧 • 我们做了这么大量的问卷,结果肯定准确
相关文档
最新文档