《市场调查与预测》第十章 抽样估计与样本量确定(45P)
样本量估计 ppt课件
![样本量估计 ppt课件](https://img.taocdn.com/s3/m/9480ad6103d8ce2f00662369.png)
ppt课件
18
小结
样本量的估算方法很多,不同的统计检验 方法使用的计算公式也不一样,一般影响 样本量的因素比较多:研究事件的发生率、 研究因素的有效率、设定检验的第Ⅰ类错 误概率α、设定检验的第Ⅱ类错误概率β、 了解由样本推断总体的一些信息、处理组 间差别σ的估计。
ppt课件
19
样本量估算的影响因素
样本量的估算方法很多,不同的统计检验 方法使用的计算公式也不一样,一般影响 样本量的因素比较多:
研究事件的发生率:研究事件预期出现的 结局(疾病或死亡),疾病发生率越高, 所需的样本量越小,反之就要越大。
ppt课件
4
样本量估算的影响因素
研究因素的有效率:有效率越高,即实验组和 对照组比较数值差异越大,样本量就可以越小, 小样本就可以达到统计学的显著性,反之就要 越大。
抽样调查估计总体均数的样本含量公式为:
N u 2
式中:δ为容许的误差,即允许样本和总体 的最大容许误差为多少。 为总体标准差。
ppt课件
14
单样本与已知总体检验时样本量的估计
样本均数与总体均数的比较,估计的样本 量计算公式为:
N
u
u
设定检验的第Ⅰ类错误概率α,即检验水准或显 著性。即假设检验第一类错误出现的概率。为 假阳性错误出现的概率。α越小,所需的样本量 越大,反之就要越小。α水平由研究者根据具体 情况决定,通常α取0.05或0.01。
ppt课件
5
样本量估算的影响因素
设定检验的第Ⅱ类错误概率β,或检验效能1-β 。 检验效能又称把握度,为1-β,即假设检验第二 类错误出现的概率,为假阴性错误出现的概率。 即在特定的α水准下,若总体参数之间确实存在 着差别,此时该次实验能发现此差别的概率。 检验效能即避免假阴性的能力,β越小,检验效 能越高,所需的样本量越大,反之就要越小。β 水平由研究者具情决定,通常取β为0.2,0.1或 0.05。即1-β=0.8,0.1或0.95,也就是说把握 度为80%,90%或95%。
《市场调查与预测》课程教学大纲 烟台南山学院
![《市场调查与预测》课程教学大纲 烟台南山学院](https://img.taocdn.com/s3/m/5652b1cff8c75fbfc77db275.png)
《市场调查与预测》课程教学大纲烟台南山学院《市场调查与预测》课程教学大纲课程名称:市场调查与预测课程代码:1739041课程类型:专业核心课学分:3.5 总学时:64 理论学时:48 实践学时:16先修课程:市场营销学适用专业:市场营销一、课程性质、目的和任务本课程是市场营销专业的专业核心课。
通过本课程的学习,应使学生比较全面系统地掌握市场调研的基础理论和基本方法,在市场营销活动中经常应用的调查、测量方法,同时具备分析基础数据和撰写调查报告的能力。
培养学生严谨的市场调查研究的态度和职业素质。
二、教学基本要求1.知识、能力、素质的基本要求本课程是市场营销专业课程,通过对市场调查的基本概念、调查内容、调查方法技巧、调查过程特点及其每一阶段的具体操作(包括调查方案企划设计、调查抽样、调查实施、调查资料整理设计分析、调查报告书撰写)等方面知识技能的讲解分析与实践训练使学生能够理解掌握现代市场调查的专业知识与专业操作技能技巧,并能比较熟练且规范地开展各种类型的市场调查。
2.教学模式基本要求本课程在学科体系上属于市场营销的一个分支,但其内容又与多种学科相融合,涉及《市场营销学》、《心理学》、《统计学》等多学科的知识,所以,在本课程的教学过程中,应注意其学科特点与学习方法,重点系统论述市场调研与预测的基本理论、方法和技术。
3.考核方法基本要求成绩评定包括平时考查、期中考试和期末考试3种形式。
平时考查成绩占总成绩的20%,期中考试占总成绩的20%,期末考试成绩占总成绩的60%。
其中平时过程性考查主要课堂出勤10分;课后作业、课堂讨论、课内实践等综合评定10分。
平时考核要求作业最少8次,少一次作业扣2分,作业完成质量不高每次扣1分,扣完10分为止;旷课一次扣2分,迟到一次扣1分,扣完10分为止。
三、教学内容及要求第1篇市场调查设计总论第1章市场调研职能1.教学内容1.1 市场调研及其基本分类 1.2 市场调研的功能与价值1.3 市场调研的局限 1.4 市场调研的历史与现状2.教学要求了解市场、市场信息的概念;了解市场调研的历史与现状;理解市场调研的功能与价值;掌握市场调研的含义及基本分类。
抽样与抽样估计演示.pptx
![抽样与抽样估计演示.pptx](https://img.taocdn.com/s3/m/a79538d3cc7931b764ce15ab.png)
极限误差(即允许误差)公式推导(也 可由抽样平均误差公式推出,但一般直 接给出的条件是允许误差范围或误差率)
必要抽样数目的影响因素
第四节 其他抽样组织方式 及其抽样估计
一、分层抽样及其抽样估计 二、等距抽样及其抽样估计 三、整群抽样及其抽样估计 四、各种抽样组织方式的结合
• 14、Thank you very much for taking me with you on that splendid outing to London. It was the first time that I had seen the Tower or any of the other fam ous sights. If I'd gone alone, I couldn't have seen nearly as much, because I wouldn't have known my way about.
2
t 分布
F分布
三种重要分布
二、样本均值的抽样分布
(一)正态总体,总体方差已知时 样本均值的抽样分布——正态分布
样本均值的标准值的抽样分布——标准正态分布
大样本下,样本均值的抽样分布—— —渐进正态分布
均值的抽样平均误差=样本均值的标准差
(二)正态总体,总体方差未知时 样本均值的标准值的抽样分布——t分布
应用——正态总体的均值、方差的极大 似然估计量。(必须已知总体分布形式)
返回3.1
二、区间估计
区间估计——置信度、置信区间的意义
(一)总体均值的区间估计 (二)总体比率的区间估计 *(三)总体方差的区间估计
区间估计
《抽样与估计》PPT课件
![《抽样与估计》PPT课件](https://img.taocdn.com/s3/m/fbb37478960590c69fc37661.png)
第二讲 抽样与估计
1. 什么是推断统计 2. 概率与概率方法 3. 概率分布 4. 抽样方法与中心界限定理 5. 点估计与区间估计 6. 样本容量的确定
南京财经大学统计学系 管于华
什么是推断统计?
描述统计学强调的是:汇总从过去发生 的事件中搜集到的数据。例如,描述某个汽 车销售公司上个月的汽车销售价格;推断统 计学(inferential statistics),又称统计推断 (statistical inference)是根据从总体中抽取 的样本来对总体特征进行研究,计算某个事 件在将来发生的可能性。
精选ppt
10
概率分布
概率分布(probability distribution)出了一 次试验中可能发生的数值的全部范围。概率分 布类似于相对频数分布,但描述的不是过去, 而是事件在未来发生的可能性。
【例】一家制药厂声称某种治疗可以帮助80%的人减 肥。消费者保护协会可以用6个人的样本来检验这种
治疗的效果。如果药厂所说属实,那么没有一个人能
够成功减肥的情况几乎不可能发生,最有可能的情况 是6个人中有5个人减肥成功。
精选ppt
11
概率分布
随机变量(random variable)从一次试验中得到的 一个数量,由于偶然性,它可以取不同的值。例如,一 周内在302国道上发生事故的次数可能是10、11或12次, 也可能是其他一些数值。分离散型随机变量(discrete random variable)只能取一些单独数值的随机变量;连 续型随机变量(continuous random variable)可以在一个 给定的范围内,取无穷多个数值的随机变量。
一张写有“获胜者”,另一张空白。为了确定哪一
《市场调查与预测》第十章 抽样估计与样本量确定(45P)
![《市场调查与预测》第十章 抽样估计与样本量确定(45P)](https://img.taocdn.com/s3/m/986c41bc6529647d2728529b.png)
样本比例的中心极限定理
设从比例为π、方差为 2的一个任意总体中随机抽取容量为n的样
本,当n足够大(n 30)时,样本比例的抽样分布近似服从比例为π、
方差为(1-)/n的正态分布。
2019/5/15
18
正态分布及标准值Z
正态分布有以下几个重要特征:
正态曲线呈钟形,曲线下的面积等于1,表明它 包括了所有的调查结果。
LOGO
第10章 抽样估计与样本量确定
2019/5/15
1
【教学目标】
了解加权的含义与加权的基本形式 理解平均数的抽样分布与抽样误差 理解样本比例的抽样分布与抽样误差 了解正态分布及标准值的含义 掌握样本量问题的考虑和计算
2019/5/15
2
开篇案例
“百脑汇”调研中的样本计划问题
“百脑汇”在中国华北几个省市经营连锁电脑超市,它希 望获得更多关于其现有客户特点方面的信息。接受调研委 托的李文博士指派班上的王洪同学为样本计划小组的负责 人。
抽样分布:样本统计量的抽样分布,是指在重复选取容
量为n的样本时,由该统计量的所有可能取值形成的相 对频数分布。抽样分布是一种理论分布。
抽样分布提供了样本统计量长远而稳定的信息,是进行 推断的理论基础。
表10-6 各种分布的均值、比例和标准差的符号表示
分布类型
均值
比例
标准差
总体分布
样本分布 X
抽样分布
x
P
S
P
SX SP
2019/5/15
15
样本均值的抽样分布
样本均值的抽样分布,是 指在重复选取容量为n的 样本时,由样本均值的所 有可能取值形成的相对频 数分布。
抽样方法和样本量估计ppt课件
![抽样方法和样本量估计ppt课件](https://img.taocdn.com/s3/m/dee3dfa68762caaedd33d489.png)
优点2)不同的层中,根据实际情况可以选择不同
的抽样方法
各层观察单位数的分配:等比例分配;最优分配
1) 2) ;
非概率抽样法(non-probability sampling) 虽然在对总体的代表性上很差,在此基础
上做统计推断也不科学,但在很多情况下,
也是适用的。
方便抽样 Convenience Sampling
再从第一部分随机抽取k号观察单位,一次
用相等间隔,从每一部分各抽取一个观察
单位。
系统抽样常作为单纯随机抽样的替代。
整群抽样 cluster sampling
整群抽样是先将总体按照某种与主要研究指标无关的特征划分 为K个群,每个群包含若干观察单位,然后再随机抽取k个群, 由抽取的各个群的全部观察单位组成样本。 与前两种方法不同在于抽样单位不同,不是直接抽取个体,而 是抽群。 单层整群抽样single-stage cluster sampling 多层整群抽样multi-stage cluster sampling 群的变异越小,群越多,抽样误差越小
方便获得的个体即选为样本,样本中每个
个体的获得都是偶然性的。最终,样本不
能够代表总体。不能在此基础上做统计推
断。可以用于研究的初始阶段,目的可以
是为了发现了解相关信息,发现值得研究
的问题,为下一步提出假设准备信息。
配额抽样 Quota Sampling
配额抽样为保证样本的代表性,其样本中具有某种特征的比例几乎和母体中 具有此种特征的比例相等。譬如某大学有10000名学生,我们要抽取1000名。 将学生依年级分成如下四个子母体。 年级 一 二 三 四 学生数 在母体之百分比 样本人数 3200 2600 2200 2000 32% 26% 22% 20% 320 260 220 200
第10章 抽样估计与样本量确定
![第10章 抽样估计与样本量确定](https://img.taocdn.com/s3/m/e9fe75014431b90d6c85c7f0.png)
1 2 3 4 总体均值 2 .5 N 4
i 1 i 2 x i i 1 N
x
N
总体方差 2
N
1.25
14
抽样均值及方差
15
结论
1)
E x
2
2 2) S x OR n
40
设某一抽样设计样本估计值的方差为 S (,同等样本 ˆ) 2 S 量的简单随机抽样设计的样本估计值的方差为 在抽 ˆ ) ( 样设计效应Deff为:
1 0
2
Deff
S (2 ˆ)
1
S
2 ˆ ) ( 0
Deff 1,简单随机抽样 效率高于简单随机抽样 Deff 1,实际采用的抽样设计 Deff 1,实际采用的抽样设计 效率低于简单随机抽样
26
举例P227
已知:n 36,1 95%, 2 0.025,1 2 0.975. 根据样本计算得: x 39.5, s 2 60.37.
2 查 2分布表得知: , 12 2 n 1 20.6120 . 2 n 1 53.1604
抽样误差范围: E Z 2 S p 重复的简单随机抽样下 样本比例的标准误差: Sp 解得样本量n : n
2 Z 1 2
1
n
E2
如果在以往调查中可以得到总体比例的一个较好的估计, 那么直接代入公式即可。否则可以取π=0.5,因为此时总 体的方差最大。
Sx
n
3)若总体 X ~ N
市场调查与预测课件:抽样调查
![市场调查与预测课件:抽样调查](https://img.taocdn.com/s3/m/569961387ed5360cba1aa8114431b90d6c8589d3.png)
抽样调查概述
抽样调查的适用范围
对一些不可能或不必要进行全面调查的项目,最宜 用抽样调查方式解决
在经费、人力、物力和时间有限的情况下,采用抽 样调查方式,可节省开支,争取时效,用比较少的 人力、物力和时间,达到满意的调查效果。
运用抽样调查对全面调查或普查进行验证 对某种总体的假设进行检验,判断这种假设的真伪
抽样技术的分类及选择
固定样本连续调查法
固定样本连续调查法是把选定的样本单位固定下来, 进行长期调查。例如,工商企业调查或住户调查等。
这种调查方法的调查对象稳定,可以及时、全面获 得各种可靠的资料,具有费用低、效果好的优点, 所以在市场调查中也是普遍采用的一种较好的方法。
固定样本连续调查法最大的缺点是,调查户登记、 记账的工作量较大,长年累月的记账,负担较重, 难以长期坚持。
抽样技术的分类及选择
滚雪球抽样
滚雪球抽样也称为推荐抽样。 通常采用随机方式选择一组调查对象或个体,在对
他们进行调查后,根据他们所提供的信息由他们推 荐选择下一组调查对象或个体。这样,通过上一组 选择下一组,像滚雪球一样一波一波地继续下去, 直至调查结束。 滚雪球技术的主要优点表现在,通过对调查总体设 定期望的特征,从而增强了样本个体的相似性。因 此,采用这种方法所产生的抽样误差比较小,成本 比较低。
抽样技术的分类及选择
任意抽样
在调查对象范围内随意抽选一定数量的样本进行调 查。
任意抽样有两种常用方法: “街头拦人法”和“空 间抽样法”。
任意抽样技术的应用:
适用于非正式的探测性调查,或调查前的准备工作。 一般在调查总体中每一个体都是同质时,才能采用此类方
法。 抽样结果偏差较大,可信程度较低。
抽样技术的分类及选择
抽样方法与样本量估计ppt课件
![抽样方法与样本量估计ppt课件](https://img.taocdn.com/s3/m/0b8e5c87ad02de80d5d8409e.png)
x
Nn
n
率的标准 ) :误 Sp(( 1N n)有 p(n 1 1 p 限 ) 总 无 限 体 总 体 p(1n p)
ppt课件完整
31
4 . 1
例1 欲调查某农村小学学生的蛔虫感染率,该校有学生2000人,若取样本例数 100人,试作单纯随机抽样设计。
解:先将全校学生编号:0,1,2,3,…,1999;再用附表17随机数字表,任意 指定某行某列,比如第5行第9列,由此处开始,向右依次抄录随机数字100组,每 组4个数字,凡后面出现与前面相同的数字弃去,如得0873,3732,0405,6930, 1609,0588,…。凡首字≥8者减8,≥6者减6,≥4减4,≥2减2,依次得873,1732, 405,930,1609,588,…。
ppt课件完整
5
抽样调查的特点
特点1:抽取的样本作为一个“代表团”来代表总体。而不是随意 挑选的个别单位代表总体。
特点2:调查样本一般按随机的原则抽取,在总体中每个单位被抽 取的机会相等。因此被抽中的单位在总体中是均匀分布的,不致出 现倾向性误差,代表性强。
特点3:所抽取的调查样本数量是根据误差的要求并经过科学的计 算确定,在调查样本的数量上有可靠保证。
ppt课件完整
18
滚雪球抽样
通常是先选出一组最初的调查对象,通常是随机选出的, 在访谈之后,要求这些被访者推荐一些属于目标总体的其他 人,根据这些推选出后面的被访者。与随机的方式相比,被 推举的人将具备与推荐人更为翔实的人口及心理特征。 优点是:主要目的是估计总体中非常稀少的某些特征。 缺点是:这种方式非常耗时。
ppt课件完整
10
对抽样误差认识与使用的误区
一些研究者甚至部分官员不愿意或不习惯接受数据的误差 范围,一谈到误差,惟恐别人说数据不准,将数据误差绝对。 由于对数据误差的认识存在着误区,在如何使用数据上也存在 着误区。抽样调查的数据拿来就用,不谈抽样误差和调查误差, 认为调查数据就是总体的真值。在进行工作政绩考核或进行地 区间的数据对比时,调查指标数据的高低变成了地区之间排队、 政绩评比的依据,忽视了对数据误差的评估。现有的调查数据 不仅没有正确地使用,反而还带来地区之间数据高低的相互攀 比,同时也影响了以后抽样调查的数据质量。
MRAFC10抽样估计与样本量确定
![MRAFC10抽样估计与样本量确定](https://img.taocdn.com/s3/m/449cc240ba68a98271fe910ef12d2af90242a8fa.png)
• 要想在调查设计阶段使用辅助信息,抽样框中的所有单元都 必须具备这个辅助信息。否则,就只能在数据收集上来后, 在估计阶段利用辅助信息提高估计值的精度。
31
調查分析預測
MRAF
使用辅助信息调整权数
• [例10.5] 为得到某公司职员是否 有吸烟习惯的信息,进行了一项调 查。从N=780人的名录中抽出了 一个n=100人的简单随机样本。
– 另外, PPS等也可以设计为一个自加权抽样。
• 对于自加权抽样设计,如果无需对权数调整, 则在计算比例、均值等估计量时可将其忽略, 对总值估计也仅需将样本总值乘上某个倍数。 (例P215)
25
調查分析預測
MRAF
不等概率抽样的加权
• 自加权设计并不总是可行的。如,在使用分层抽样进行 一个全国调查时,可能需要采用纽曼分层。
1
調查M•分R析A(F預測一)抽样误差的估算方法 • 1.抽样误差大小的影响因素 • (1)总体各单位之间的差异程度。总体变量存 在变异是客观的,差异程度愈大,其分布就愈分 散,抽样误差就愈大;反之,愈小。这种差异程 度,在统计上叫做标志变异度,通常用方差或标 准差来表示。 • (2)样本数目,即样本容量有多少。当样本容 量达到与总体容量一样时,抽样调查就变成全面 市场调查了,抽样误差随即消失。 • (3)抽样方式。一般地说,等距随机抽样和分 层随机抽样的抽样误差要小于简单随机抽样和分 群随机抽样的误差。不重复抽样的误差要小于重 复抽样的误差。因此,要根据不同的抽样方式分 别估算抽样误差。
步骤3:计算无回答的调整权数。
无回答的调整权数wnr等于设计权数与
无回答调整因子的乘积:
市场调查中样本容量的确定
![市场调查中样本容量的确定](https://img.taocdn.com/s3/m/02840af90242a8956bece4af.png)
16 CHINA STATISTICS市场调查中样本容量的确定文/陈克明 宁震霖在市场调研工作中,采用随机抽样进行资料采集时,需要预先确定样本量的大小。
我们知道,在系统误差确定的条件下,抽样调查的准确性取决于抽样误差,而抽样误差的大小又与样本容量有直接的关系,即样本容量越大,抽样误差就越小。
当然,这并不能说在抽样调查中样本容量越大就越好,因为样本容量越大,调查的费用就越高。
因此,决定样本容量大小的主要因素是特定的调研项目对抽样误差的要求和项目预算经费这两个方面。
在实际工作中,样本容量的确定实际上就是在抽样误差与经费预算之间求得最佳的平衡,即在可以接受的抽样误差的条件下使用最少的经费,当然,有时候则可能是在一定的经费额度条件下争取最小的抽样调查误差,而这个误差当然必须是可以接受的。
所以,在市场调研中,随机抽样调查样本容量的确定,通常都是先根据调查对抽样误差的要求来考虑。
根据抽样误差要求确定的样本容量根据随机抽样的基本原理,样本容量可以通过抽样误差、极限误差及置信度等因素的分析来加以确定。
设在简单随机抽样(重复抽样)的条件下,置信度(t )与抽样误差(μ)及极限误差(Δ)的关系为t =Δ/μ,均值指标的抽样误差(μ)是由总体标准差(δ)和样本容量(n )决定的,即 显然,整理可得:这就是说,只要我们能够确定总体标准差(δ)、置信度(t)和极限误差(Δ),样本容量即可确定。
第一,总体标准差的确定。
总体标准差虽然是客观存在的,但我们是无法直接得到准确的数据的,所以在抽样调查中只能使用近似值,通常有几种简便的处理办法。
1.试验性抽样调查。
在调研总体规模较大的情况下,可采用抽样调查方法估计δ。
即根据抽样调查所取得的样本标准差S的结果求得δ。
根据概率论和数理统计的有关知识可知: 而 (其中X i 是样本值,X -是样本均值,n 是样本容量,δ是δ的最大似然估计),所以有 。
在样本容量n 满足大样本(一般不少于30个)的情况下, ,即 。
市场调查与预测_10抽样和样本量
![市场调查与预测_10抽样和样本量](https://img.taocdn.com/s3/m/797bbe3bb4daa58da0114a68.png)
抽 样 技 术
10.2.1
随机抽样(概率抽样)
1.2.2
10.2.2
非随机抽样
抽 样 技 术
1.随机抽样(概率抽样)
简单随机抽样:简单随机抽样又称纯随机抽样,即对N个总体单位
不进行任何组合,仅按随机原则直接抽取n个个体作为样本(n≤N ),把这种抽样方法叫做简单随机抽样。简单随机抽样的具体作 法有:直接抽选法,抽签法,随机数字表法。 (1)直接抽选法,就是对集中于某个空间的总体进行直接随机 抽样的方法。如从货架商品中随机抽取若干商品进行检验;从农 贸市场摊位中随意选择若干摊位进行调查或访问等。 例如某项调查采用直接抽选法对某市职工收入状况进行研究,该 市有职工56,000名,抽取5,000名职工进行调查,他们的年平均 收入为10,000元,据此推断全市职工年收入为8,000--12,000 元之间。 (2)抽签法,又称“抓阄法”。它是先将调查总体的每个单位 编号,(号码可以从1到N),制作同等规格、不同编号的卡片, 充分混匀后随机抽取卡片,所抽取卡片的编号对应的样本单位即 组成样本。抽签法简便易行,当总体的个体数不多时,适宜采用 这种方法。例如从全班学生中抽取样本时,可以利用学生的学号 、座位号等。
普查和抽样调查的基本概念
2.抽样调查的相关概念
概率:概率论是抽样调查得以成立的理论基础。概率就是机会,等概率就是
机会相等,随机抽取就是概率抽样,小概率事件就是机会渺茫的事件。 总体:所要调查研究对象的全部单位就是总体。总体单位数用N表示。 个体:个体则是指每一个调查的研究对象。如,要研究北京市居民户的生活 质量,那么北京市所有的居民就是此次调查的总体,每一个北京市民就是 个体。 抽样:从总体中选取一部分代表的过程就是抽样。 抽样框:编制抽样单位的目录,成为抽样框。抽样框的范围与被调查总体的 范围一致。抽样框可分为:名单抽样框、区域抽样框、时间表抽样框。例 如:要从10000名职工中抽出200名组成一个样本,则10000名职工的名册, 就是抽样框。抽样框一般可以用现成的名单,如户口、企业名录、企事业 单位职工的名册等,在没有现成的名单的情况下,可由调查人员自己编制 。应该注意的是,在利用现有的名单作为抽样框时,要先对该名录进行检 查,避免有重复、遗漏的情况发生,以提高样本对总体的代表性。
MRAFC10抽样估计与样本量确定
![MRAFC10抽样估计与样本量确定](https://img.taocdn.com/s3/m/898e3520daef5ef7bb0d3c35.png)
1
对无回答的权数调整(STR)
• [例10.4] 对于一项公共交通 系统调查,总体由1100人组成 ,并按城乡分为两个层。分层 及样本数据如表10-2所示。那 么,回答者的权数是多少?
表10-2 公交系统调查的分层数据
步骤1:各层的设层计权数总为体:大小 样本量
• 为了达到这些要求,王洪和他的小组正努力寻找计算所需 样本容量的方法。
4
10.1 引言
• 估计就是根据从样本中收集的信息对 总体未知量进行推断的过程。
• 抽样估计涉及的重要问题:
– 一个样本单元的设计权数问题。 – 抽样估计,包括总体总量、均值和比例以及抽
样误差的估计。 – 样本量的确定构成抽样设计程序的重要步骤和
• 8.在一个全国性的调查中,调研人员期望总体中 有30%的人将会同意某个态度陈述,要求误差小 于2个百分点,并且具有95%的把握性,那么,需 要多大的样本容量?假设调查总体为12000人, 事先预计调查的回答率约为55%,那么,样本容 量又应该为多少?
2
3
开篇案例
“百脑汇”调研中的样本计划问题
MRAFC10抽样估计与样本 量确定
2
七、抽样误差
• 调查结果的准确性无疑是调查组织者十分 重视的问题。其准确性通常用抽样误差的 高低来反映,在抽样方式和总体既定的前 提下,抽样误差的大小主要取决于抽样数 目的多少。对抽样误差的控制主要是通过 控制抽样数目来实现的。因此,抽样误差 与抽样数目的确定,是随机抽样市场调查 中两个重要的问题。
样本量的确定
• 1.影响合理的必要抽样数目的因素 • (1)总体各单位之间的标志差异程度。总体单位
之间的差异越小,一定数目的总体单位对总体的 代表性就越高。当总体单位的标志值都相等时, 一个总体单位的标志值就足以代表总体的平均水 平。 • (2)允许误差的大小。一般来说,调查的准确度 要求高、调查力强、调查经费充足,允许误差就 可以定得小一些。 • (3)不同的抽样方式和方法。一般情况下,简单 随机抽样和分群随机抽样比等距随机抽样和分层 随机抽样所需的样本单位数要多,重复抽样比不 重复抽样的样本单位数要多。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
❖抽样估计涉及的重要问题:
▪ 一个样本单元的设计权数问题。 ▪ 抽样估计,包括总体总量、均值和比例以及抽
样误差的估计。 ▪ 样本量的确定构成抽样设计程序的重要步骤和
内容。同时,样本量的确定与样本估计值的精 度密不可分。
2020/6/19
4
信息,将它们合并到权数中。
2020/6/19
8
对无回答的权数调整
❖ 单元无回答是指一个样本单元几乎所有的数据都缺失。 简单的处理办法是忽略它。然而,如果发现忽略单元 无回答是不适当的,则应该对权数进行调整。即,
▪ 设计权数×无回答调整因子=无回答的调整权数
❖ 无回答调整因子是原样本单元的权数和与给出回答的 单元的权数和的比值。对于自加权设计,该比值可用 原样本的单元数与给出回答的单元数的比值来表示。
步骤3:无回答的调整权数等于设计权数与无回答调整因子的乘积:
城市层:
w nr,1
w d,1
n1 n r,1
51.33
6.67
农村层:
w nr,2
w d,2
n2 n r,2
2 1.25 2.5
2020/6/19
11
使用辅助信息调整权数
❖ 为什么要使用辅助信息来调整权数呢?
▪ 首先,使调查的估计值与已知总体总值相匹配。例如, 使用最新的人口普查数据来调整估计值,以确保这些 估计值(如年龄、性别分布等)的一致性。
步骤3:计算无回答的调整权数。
无回答的调整权数wnr等于设计权数与
无回答调整因子的乘积:
w nr
wd
n nr
4
对无回答的权数调整(STR)
❖ [例10.4] 对于一项公共交通
系统调查,总体由1100人组成, 层 并按城乡分为两个层。分层及 样本数据如表10-2所示。那么, 城市
LOGO
第10章 抽样估计与样本量确定
2020/6/19
1
【教学目标】
❖了解加权的含义与加权的基本形式 ❖理解平均数的抽样分布与抽样误差 ❖理解样本比例的抽样分布与抽样误差 ❖了解正态分布及标准值的含义 ❖掌握样本量问题的考虑和计算
2020/6/19
2
开篇案例
“百脑汇”调研中的样本计划问题
❖ “百脑汇”在中国华北几个省市经营连锁电脑超市,它希 望获得更多关于其现有客户特点方面的信息。接受调研委 托的李文博士指派班上的王洪同学为样本计划小组的负责 人。
▪ 二是为了提高估计值的精度。将辅助信息与抽样设计 相结合,将有助于提高估计的精度。
• 要想在调查设计阶段使用辅助信息,抽样框中的所有单元都 必须具备这个辅助信息。否则,就只能在数据收集上来后, 在估计阶段利用辅助信息提高估计值的精度。
▪ 另外, PPS等也可以设计为一个自加权抽样。
❖ 对于自加权抽样设计,如果无需对权数调整, 则在计算比例、均值等估计量时可将其忽略, 对总值估计也仅需将样本总值乘上某个倍数。
2020/6/19
6
不等概率抽样的加权
❖ 自加权设计并不总是可行的。如,在使用分层抽样进行 一个全国调查时,可能需要采用纽曼分层。
回答者的权数是多少?
农村
表10-2 公交系统调查的分层数据
总体大小 样本量
回答者数量
N1=1000 N2=100
n1=200 n2=50
nr,1=150 nr,2=40
步骤1:各层的设计权数为: 城市层 wd,1=N1/n1==5 农村层 wd,2=N2/n2==2
步骤2:调整以弥补无回答。各层的无回答调整因子计算如下: 城市层:n1 / nr,1==200/150==1.33 农村层:n2 / nr,2==50/40==1.25
▪ 不同样本单元的设计权数可能不同,这取决于抽样设 计。因此,加权估计应区分等概率抽样的加权和不等 概率抽样的加权。
2020/6/19
5
等概率抽样的加权
❖ 当每个单元都有相同的入样概率时,所有样 本单元的设计权数都相同,这种抽样就是自 加权设计。
▪ SRS抽样和SYS抽样都属于自加权设计,比例分 层抽样也是自加权设计。
❖ 通过与“百脑汇”的市场部经理乔兰的初次会谈,王洪了 解到调研的一个主要目的是分别按人口和心理因素来估计 “百脑汇”的客户构成和比例。此外,确认总体估计值不 超过实际值的±5.0%,可靠度为95%。
❖ 为了达到这些要求,王洪和他的小组正努力寻找计算所需 样本容量的方法。
2020/6/19
3
10.1 引言
wd,1=N1/n1=2000/33.3=60.1 wd,2=N2/n2=12000/133.3=90.0 wd,3=N3/n3=6000/33.3=180.2
2020/6/19
7
设计权数的调整
❖上述等概率抽样的加权和不等概率抽样的 加权都是加权的基本形式。
❖权数估计常会遇到更真实和复杂的情况:
▪ 考虑无回答的情况,然后对权数做出调整; ▪ 考虑来自其他渠道的、更具权威性的某些辅助
❖ 无回答权数调整应区分两种不同情况:
▪ 等概率抽样 ▪ 不等概率抽样
2020/6/19
9
对无回答的权数调整(SRS)
❖ [例10.3] 从一个 N=100人的总体 中抽取一个n=25 人的简单随机样本。 记回答单元的数量 为nr,结果显示只 有20个人提供了所 需的信息。那么, 此时无回答的调整
权数是多少?
步骤1:计算设计权数。
入样概率p为:P=n/N=25/100=1/4
故,每个样本单元的设计权数为4。
步骤2:计算无回答调整因子。
由于在n=25人中只有nr=20人提供了
所需的信息,最终样本量应为20。假定回
答单元不仅能代表回答单元且能代表无回
答单元,计算无回答调整因子为:
n / nr = 25/20 = 1.25
❖ 当所采用的抽样设计不是等概率时,正确地使用设计权 数就显得尤为重要。
❖ [例10.2] 有关各层总体数和样本数资料见表10-1。对 于这项调查,被调查者的设计权数是多少呢?
收入层次 各层单位数 样本数量
设计权数
高收入层 中收入层 低收入层
2000 12000 6000
33.3 133.3 33.3
10.2 加权及权数调整
❖ 设计权数
▪ 设计权数是指每个样本单元所代表的调查总体的单元 数,它是由抽样设计所决定的,通常以wd表示。确定 设计权数是估计的第一步。
❖ 加权估计
▪ 设计权数其实就是样本单元的入样概率的倒数。假如 入样概率是1/10,那么每个入选样本代表总体中的10 个单元,此时设计权数即为10。