第四章 抽样调查
统计学抽样与抽样分布ppt课件
精选
21
概率抽样(小结)
精选
22
非概率抽样
n也叫非随机抽样,是指从研究目的出发,根据调查者的 经验或判断,从总体中有意识地抽取若干单位构成样本。 n重点调查、典型调查、配额抽样(是按照一定标准或一 定条件分配样本单位数量,然后由调查者在规定的数额内 主观地抽取样本)、方便抽样(指调查者按其方便任意选 取样本。如商场柜台售货员拿着厂家的调查表对顾客的调 查)等就属于非随机抽样。 n优点:及时了解总体大致情况,总结经验教训,在进行 大规模抽样调查之前的试点。 n缺点:非随机抽样容易产生倾向性误差,并且误差不能 计算和控制 ,也就无法说明调查结果的可靠程度。
4. 特别是在标志值相差悬殊时,由于划分了类型,一
方面缩小了组内方差,另一方面也保证各组都能抽 取一定的样本单位,所以,分层抽样较之纯随机抽 样可以提高样本的代表性,能获得更为满意的效果
精选
16
分层抽样
(stratified sampling)续
Ü 优点:
Ü 除了可以对总体进行估计外,还可以对各层的子总 体进行估计
精选
23
概率抽样与非概率抽样
概率抽样
抽样类型
非概率抽样
简单随机抽样 分层随机抽样 整群抽样 系统抽样 多阶段抽样
方便抽样 判断抽样
其他非概率抽样
精选
24
重复抽样与非重复抽样
n重复抽样,又称回置抽样,是指从总体的N个
单位中,每次抽取一个单位后,再将其放回总 体中参加下一次抽选,连续抽n次,即得到一 个样本。
n重复:42=16个。它们是
n
AA AB AC AD; BA BB BC BD
n
(完整版)抽样调查习题及答案
第四章习题抽样调查一、填空题1.抽样调查是遵循随机的原则抽选样本,通过对样本单位的调查来对研究对象的总体数量特征作出推断的。
2.采用不重复抽样方法,从总体为N的单位中,抽取样本容量为n的可能样本个数为N(N-1)(N-2)……(N-N+1)。
3.只要使用非全面调查的方法,即使遵守随机原则,抽样误差也不可避免会产生。
4.参数估计有两种形式:一是点估计,二是区间估计。
5.判别估计量优良性的三个准则是:无偏性、一致性和有效性。
6.我们采用“抽样指标的标准差”,即所有抽样估计值的标准差,作为衡量抽样估计的抽样误差大小的尺度。
7.常用的抽样方法有简单随机抽样、类型(分组)抽样、等距抽样、整群抽样和分阶段抽样。
8.对于简单随机重复抽样,若其他条件不变,则当极限误差范围Δ缩小一半,抽样单位数必须为原来的4倍。
若Δ扩大一倍,则抽样单位数为原来的1/4。
9.如果总体平均数落在区间960~1040内的概率是95%,则抽样平均数是1000,极限抽样误差是40.82,抽样平均误差是20.41。
10.在同样的精度要求下,不重复抽样比重复抽样需要的样本容量少,整群抽样比个体抽样需要的样本容量多。
二、判断题1.抽样误差是抽样调查中无法避免的误差。
(√)2.抽样误差的产生是由于破坏了随机原则所造成的。
(×)3.重复抽样条件下的抽样平均误差总是大于不重复抽样条件下的抽样平均误差。
(√)4.在其他条件不变的情况下,抽样平均误差要减少为原来的1/3,则样本容量必须增大到9倍。
(√)5.抽样调查所遵循的基本原则是可靠性原则。
(×)6.样本指标是一个客观存在的常数。
(×)7.全面调查只有登记性误差而没有代表性误差,抽样调查只有代表性误差而没有登记性误差。
(×)8.抽样平均误差就是抽样平均数的标准差。
(×)三、单项选择题1.用简单随机抽样(重复)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大为原来的(C)A.2倍B.3倍C.4倍D.5倍2.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织方式叫做(D)A.分层抽样B.简单随机抽样C.整群抽样D.等距抽样3.计算抽样平均误差时,若有多个样本标准差的资料,应选哪个来计算(B)A.最小一个B.最大一个C.中间一个D.平均值4.抽样误差是指(D)A.计算过程中产生的误差B.调查中产生的登记性误差C.调查中产生的系统性误差D.随机性的代表性误差5.抽样成数是一个(A)A.结构相对数B.比例相对数C.比较相对数D.强度相对数6.成数和成数方差的关系是(C)A.成数越接近于0,成数方差越大B.成数越接近于1,成数方差越大C.成数越接近于0.5,成数方差越大D.成数越接近于0.25,成数方差越大7.整群抽样是对被抽中的群作全面调查,所以整群抽样是(B)A.全面调查B.非全面调查C.一次性调查D.经常性调查8.对400名大学生抽取19%进行不重复抽样调查,其中优等生比重为20%,概率保证程度为95.45%,则优等生比重的极限抽样误差为(40%)A. 4%B. 4.13%C. 9.18%D. 8.26%9.根据5%抽样资料表明,甲产品合格率为60%,乙产品合格率为80%,在抽样产品数相等的条件下,合格率的抽样误差是(B)A.甲产品大B.乙产品大C.相等D.无法判断10.抽样调查结果表明,甲企业职工平均工资方差为25,乙企业为100,又知乙企业工人数比甲企业工人数多3倍,则随机抽样误差(B)A.甲企业较大B.乙企业较大C.不能作出结论D.相同四、多项选择题抽样调查中的抽样误差是(ABCDE)A.是不可避免要产生的B.是可以通过改进调查方法来避免的C.是可以计算出来的D.只能在调查结果之后才能计算E.其大小是可以控制的2.重复抽样的特点是(AC)A.各次抽选相互影响B.各次抽选互不影响C.每次抽选时,总体单位数始终不变D每次抽选时,总体单位数逐渐减少E.各单位被抽中的机会在各次抽选中相等3.抽样调查所需的样本容量取决于(ABE)A.总体中各单位标志间的变异程度B.允许误差C.样本个数D.置信度E.抽样方法4.分层抽样误差的大小取决于(BCD)A.各组样本容量占总体比重的分配状况B.各组间的标志变异程度C.样本容量的大小D.各组内标志值的变异程度E.总体标志值的变异程度5.在抽样调查中(ACD)A.全及指标是唯一确定的B.样本指标是唯一确定的C.全及总体是唯一确定的D.样本指标是随机变量E.全及指标是随机变量五、名词解释1.抽样推断2.抽样误差3.重复抽样与不重复抽样4.区间估计六、计算题1.某公司有职工3000人,现从中随机抽取60人调查其工资收入情况,得到有关资料如下:(1)试以0.95的置信度估计该公司工人的月平均工资所在范围。
第4章__抽样调查
4.1.3抽样误差的确定
❖1)抽样误差的概念
❖2)影响抽样平均误差的因素
1、全及总体标志变异程度 2、样本容量 3、抽样组织方式 4、抽样方法
❖3)降低调查误差的途径
1、提高样本的代表性
2、注重样本量的控制
3、提高抽样设计的效率 4、重视抽样方案的审评
5、努力降低调查员的误差 6、努力调查被调查者的误差
❖ (4)如果这一地区街对面从第一号开始都没有住户,在第一号对面的街区转 一圈,并遵循右手法则。(即按顺时针方向在街区转一圈。)试着沿路线每 隔两户访问一户。
❖ (5)在起始门牌号对面邻近的街区绕过一圈后,如果你没有完成所需的访问, 就按顺时针方向到下一个街区访问。
❖ (6)如果第三个街区的住户数不够完成你的任务,就再做几个街区直到要求 的户数完成为止;这些区要按顺时针方向绕原有的街区来找。
❖5)简单随机抽样方式的优缺点
随机抽样方式的优点
方法简单直观,当总体名单完整时,可直接从中随机抽取样本。由于 抽取概率相同,计算抽样误差及对总体指标加以推断比较方便。
随机抽样方式的缺点
尽管简单随机抽样在理论上是最符合随机原则的,但是在实际应用中 有一定的局限性。第一,采用简单随机抽样,一般需对总体各单位加以 编码,而实际市场调查活动中所需调查总体往往是十分庞大的,单位非 常多,逐一编码几乎是不可能的;第二,对于某些事物无法使用简单随 机抽样,如对连续不断产生的大量产品进行质量检验,就不能对全部产 品进行编号抽样;第三,当总体的标志变异程度较大时,简单随机抽样 的代表性就不如经过分组后再抽样的代表性高;第四,由于抽出样本单 位较为分散,所以调查人力、物力、费用消耗较大。
2)抽样调查的特征
❖(1)抽取样本的客观性 ❖(2)抽样调查可以比较准确地推断总体
第四章:抽样调查技术
分层 或
分类
在每一层 或类中 分配样本数
在每一层 或类中 进行简单 随机抽样
22
• 两种两种样本数分配方法:
1、等比例分层随机抽样
• 例:某居住小区有100户人家,其中高收入 户20户、中等收入户50家、低收入户30家。 计划抽10户,
• 由高的应抽2户、中的应抽5户、低的应抽3 户。
• 思考:上述案例中采用此种方法合理吗? 为什么?
第二章:抽样调查技术P90
• 主要学习内容 • 补充:全面市场调查
补充:典型和重点市场调查方式 • 随机抽样市场调查方式 • 非随机抽样技术 • 抽样误差
1
第一节 全面市场调查
一、概念、特征、适用情况
• 1、概念: • 为了搜集比较全面、精确的调查资料,对调查
对象(总体)的全部样本所进行的逐一的、无 遗漏的专门调查。
择。
4
三、全面调查的具体做法
• 1、向每一个调查样本发放调查表,由对方 按规定填报。
• 小提示:适合于谁对谁的调查呢?
• 2、调查人员按照调查项目的要求,对调查 对象进行访问或观察。
• 小提示:适用于谁对谁的调查呢?
5
• 3、借用机关、团体、企业等单位的统计资料, 再进行汇总
• 4、搭便车。利用国家或地方、部门所组织的普 查机会,搜集自己的资料。
6
第二节 典型和重点市场调查方式
一、典型调查方式
• 1、含义 • 对调查对象作全面分析、比较的基础上,有意识
地选择少数具有代表性的样本作为典型,对其进 行比较系统、深入的专门调查。“解剖麻雀”
7
•2、特点 •优点: •1)可节省工作量和费用 •2)可和研究结合起来,揭示事物的内在规律。
第四章 抽样
主讲人: 张建鹏 要内容
一、抽样的意义与作用 二、概率抽样的原理与程序 三、概率抽样方法 四、非概率抽样方法 五、样本规模与抽样误差
2
一、抽样的意义与作用
1. 相关概念 (1). 总体(population):构成它的所有元素的集合 N 表示。元素则是构成总体的基本的单元。 如:海医学生新闻获得方式调查 某市居民家庭生活状况 (2). 样本(sample):从总体中按一定方式抽取的一部 分元素的集合。用n表示 如:从海医1万名学生中,按一定方式抽取300人进行 调查,这300人构成该总体的一个样本。
28
分层(最佳)抽样法
定义:又称非比例抽样法,根据各层样本标准差 的大小确定各层的样本数目的方法。 计算公式为:
ni = n * ( N i Si / ∑ N i Si )
(1)
式中:ni ----- 各类型应抽选的样本单位数 n ----- 样本单位数 Ni ----- 各类型的调查单位数 Si ----- 各类型调查单位数的样本标准差
14
抽样设计的五个步骤 1)定义目标总体 (如上述案例中正在上学的 年龄在8-17岁的年轻人) 2)制定抽样框 (例如上述案例中的所有县及 县内的城市和城镇) 3)选择一种抽样技术 (如上述案例中的三段 分层概率抽样) 4)实际抽取样本 (样本容量,1000名;执行 抽样过程和对调查员指令) 5)评估样本质量 (如检测样本平均年龄是否 与全国普查数据一致或接近)
33
整群抽样与分层抽样的比较
特征 样本来源 抽样目的 划分原则 整群抽样 一个或几个 不提高成本而提 高抽样效率 分层抽样 所有层 不提高成本而提 高精度
群中的个体异质, 层中个体同质, 群间同质 层间异质
第四章 抽样技术练习题
第四章抽样技术一、名词解释1、抽样调查2、总体和样本3、样本容量4、重复抽样5、不重复抽样6、抽样极限误差7、点估计8、区间估计二、填空1、抽样调查是从研究的中抽取部分单位作为进行观察研究,并根据这部分单位的调查结果来推断,以达到认识总体的一种统计调查方法。
2、抽样调查分为和两类。
抽样调查遵循。
3、是用主观的(非随机的)方法从总体中抽选单位进行调查,它是一种快速、简便且省钱的抽选样本的方法。
但非概率抽样具有很大的风险,因为主观选定的样本很难保证其对总体的代表性。
所以一般情况下不用来对总体进行推断。
主要包括随意抽样,,。
4、概率抽样有两条基本准则:第一,单位是随机抽取的;第二,调查总体中的每个单位都有一个非零的入样概率。
概率抽样方法主要有、、分层随机抽样、、、。
常用的为前四种。
5、是指包括调查对象所有单位的全体,它是由具有某种共同性质的许多单位组成的。
从中按随机原则抽取出来的部分单位所组成的集合体就称为样本。
6、从总体中抽取样本单位有与两种方法。
7、抽样框又称为抽样框架、抽样结构,是指对可以选择作为样本的总体单位列出名册成排序编号,以确定总体的和。
设计抽样框式进行抽样调查的前提,常见的抽样框有、等。
8、抽样误差是指指标数值与指标数值之差,即抽样估计值与被估计的未知的真实总体参数值之差。
9、在抽取多个样本时,就其中每个样本来说,都有其相应的抽样误差,而这些抽样误差的平均数,就是,用以反映抽样误差的一般水平。
10、一般来说,在实际应用时,常常采用的方法从总体各单位中抽取样本单位,进行调查;在计算上,为了计算简便,通常可以采用条件下抽样平均误差的计算公式进行计算。
11、概率分布的中心极限定理证明:(1)大量的客观事物总体现象是总体或近似于总体。
(2)在大样本的条件下,的分布是或近似地是正态分布,抽样成数的分布是或近似地是正态分布。
(3)抽样平均数的平均数总体平均数,抽样成数的平均数总体成数。
12、概率度t越大,估计的可靠性越,样本统计量与总体参数之间正负离差的变动范围也就越。
现代社会调查 第四章 抽样
2.抽样的一般程序 2.抽样的一般程序
界定总体 制定抽样框
决定抽样方案 实际抽取样本 评估样本质量
14
2.抽样的一般程序 2.抽样的一般程序
界定总体 制定抽样框
明确界定总体是确保样本 代表性的重要前提
当存在多阶段抽样时, 当存在多阶段抽样时,需 分别编制不同的抽样框
决定抽样方案
是对样本的质量、 样本评估 是对样本的质量、代表 性、偏差等进行初步的检验和衡量
……
调整:在1-86之间选择整数的随机起点,如27;将小数 点调回,得到非整数的随机起点2.7,由此得到号码:2.7, 11.3, 19.9, 28.5,……。将小数点后面的部分略去,就是迁 中单位的号码:2, 11, 19, 28, …… 26
系统抽样的注意事项: 系统抽样的一个十分重要的前提条件,是总体中个体 的排列,相对于研究的变量来说,应是随机的 相对于研究的变量来说, 相对于研究的变量来说 应是随机的,即不存在 某种与研究变量相关的规则分布。否则,系统抽样的结果 将会产生极大的偏差。 两种可能导致偏差的情况: (1)个体的排列有次序的先后,等级上高低的情况; (2)总体名单中,个体的排列与抽样间隔有相对应的周 期分布。
当抽样间距(K=N/n)不是整数时怎么办? 不是整数时怎么办? 当抽样间距 不是整数时怎么办
25
当抽样间距(K=N/n)不是整数时: 当抽样间距(K=N/n)不是整数时: (K=N/n)不是整数时
循环等距抽样法 A+K A A+2K A+3K A+4K
A+(n-1)K
调整直线等距抽样 如:N=2580, n=300, 则K=8.6
16
二、概率抽样及其方法
概率抽样的类型: 概率抽样的类型: 的类型
第四章 抽样调查
抽样分布原理
(一)基本符号 1.总体 A = {a1 , a2 ,, aN }, A = N . 1.总体 2.从总体中抽取n个对象构成样本,共有k个样 2.从总体中抽取n个对象构成样本,共有k 本,设样本的符号为:
A1 , A2 ,, Ak , k = C , Ai = n, i = 1, 2,, k
本章复习思考题
1,什么叫抽样?从总体中抽样样本需满足哪些 条件? 2,简单随机抽样?机械抽样?抽样调查法的性 质?随机抽样的原则? 3,抽样误差?影响抽样误差大小的因素?抽样 误差与调查误差,系统误差的区别? 4,抽样分布?平均误差?抽样分布原理? 5,教材第三章课后习题P84的第二题,P85的第 ,教材第三章课后习题P84的第二题,P85的第 四题,P86的第六题. 四题,P86的第六题.
(三)问卷设计的原则 (三)问卷设计的原则 题意清楚,明确,易懂;口语化;避免一题两问;避免 诱导;公正客观;逻辑一致性;完整性(问题和备选 答案);不要用否定形式提问;不要直接询问敏感性 问题. (四)问卷的结构 1,四结构说:标题(简明扼要,概括专项调查的主 题);指导语(包括调查的目的和意义;问题及备选 答案的必要解释,调查须知及其他事项说明等;如涉 及需为被调查者保密的内容,需申明予以保密);主 体内容(内容不宜过多,过繁,应根据需要而确定); 结束语(提出几个开放性的问题或让被试提出对本研 究的建设性的意见;表示对被试合作的感谢). 2,六结构说:在四结构说的基础上,加上被调查者的 基本信息;作业证明的记载.
无限总体时, 有限总体时,
σ σx = n
σ N n σx = × N 1 n
对于有限总体,样本容量与总体容量的 比n/N称为抽样比例. n/N称为抽样比例. 一般认为,n/N<0.05时,就可以省略修 一般认为,n/N<0.05时,就可以省略修 正系数.
第四章 抽样技术
• (五)多阶段抽样
– 含义:multistage sampling-----即先抽大的调 查单元,在大单元中抽小单元,再在小单元 中抽更小的单元。如:我国的城市职工家计 调查,采用三阶段抽样,先城市-基层单位调查户。
第四章 抽样技术
– 应用:在复杂、大规模的市场调查中。
• (六)抽样技术的选用原则
• (四)常用术语
– 1.总体(population)与样本(sample) – 2.总体指标和样本指标
• 总体指标-------反映总体数量特征的指标,有总 体平均数µ,总体比例P, 总体方差 σ 2
第四章 抽样技术
– 样本指标------又称样本估计量或统计量,用 以估计和推断相应总体指标的综合指标,有 样本平均数 x ,样本比例p ,样本方差S2。
第四章 抽样技术
• 成数------分总体成数与样本成数 • 含义------总体中具有某种特征的单位占全部单 位的比例,称总体成数(总体比例) • 如:产品的合格率,市场占有率等。 • 样本成数的抽样分布
– 当从总体中抽出一个容量为n的样本时,样本中具有 某种特征的单位数x服从二项分布,即有x~B(n, π),且 有E(x)=n π V(x)=n π(1- π). – 因而样本比例p=x/n也服从二项分布,且有: – E(p)=E(x/n)= π – V(p)=V(x/n)=1/n π(1- π)
第四章 抽样技术
第四章 抽样技术
第四章 抽样技术
本章要点
• 1.抽样调查的含义、特点与程序; • 2.随机抽样技术的类型及其各自的特点、 方法; • 3.非随机抽样技术的类型及其各自的特 点、方法; • 4.抽样误差的含义及其计算方法 。
第四章 抽样技术
第四节抽样调查
共同定义:总体是构成它的所有元素的集合,而元 素则是构成总体的最基本单位。 样本(Sample)样本就是从总体中按一定方式抽取出 的一部分元素的集合。 抽样(Sampling) 指从组成某个总体的所有元素的集 合中,按一定的方式选择或抽取一部分元素的过程, 或者说抽样是从总体中按一定方式选择或抽取样本 的过程。
第二节 概率抽样的原理与程序
统计值(Statistic)也称为样本值,它是关于样本中某
一变量的综合描述。统计值是从样本中计算出来的, 它是相应的参数值的估计量。 置信度(Confidence level)与置信区间 (Confidence Interval)。置信度也称为置信水平,它是指总体参 数值,落在样本统计值某一区间内的概率,或者说 是总体参数值落在样本统计值某一区间中的把握性 程度。它反映的是抽样的可靠性程度。例子:P64。 置信区间指的是样本统计值与总体参数值之间的误 差范围,置信区间反映的是抽样的精确性程度。
第二节 概率抽样的原理与程序
确定抽样框:确立总体后,收集总体中全部
抽样单位的名单。有两种确立方法:一是全 选法,一个不能漏。如大学生社会实习调查。 选定总体为全日制大学在校本科生与研究生, 就要从各院系花名册中统一编号。 另一种是分层次的样本框:如调查一个城市 小学生的学习状况。全市500小学,选10所, 再从10所中每个学校选3个班;最后每个班选 10名学生。
第一节 抽样的意义与作用
(3)所抽选的调查样本数量,是根据调查误差的要求,
经过科学的计算确定的,在调查样本的数量上有可 靠的保证。 (4)抽样调查的误差,是在调查前就可以根据调查样 本数量和总体中各单位之间的差异程度进行计算, 并控制在允许范围以内,调查结果的准确程度较高。 基于以上特点,抽样调查被公认为是非全面调查方 法中用来推算和代表总体的最完善、最有科学根据 的调查方法。
第四章 抽样
• 3.设计抽样方案 • 4.制定抽样框
– 制定抽样框就是依据已经明确界定的总体范围,收集总体中全部抽样单位 的名单,并统一编号。
• 5.实际抽取样本 • 6.样本评估
– 样本评估就是对样本的质量和代表性进行检验,其目的是防止因样本的偏 差过大而导致的失误。
– 实际抽取样本就是在上述几个步骤的基础上,严格按照所选定的抽样方法, 从抽样框中抽取一个个的抽样单位,构成样本。
运用:
• 从侨光分校的7000位学生中,抽取100位学 生进行调查查,以研究学生对学校教学条 件的满意度。之前所做的普查表现出的对 学校教学条件的平均满意度为85%,现通 过抽查统计后的满意度为80%。 • 请说出本次抽查中的总体、样本、抽样元 素、抽样单位、抽样框、参数值、统计值、 抽样误差。
二、抽样的作用
• 分类抽样有着突出的优点: 第一,分类抽样能够克服简单随机抽样的缺 点,适用于总体内个体数目较多,结构较复杂, 内部差异较大的情况。 第二,精确度较高。 第三,便于对不同层面的问题进行探索。 第四,便于分工,使工作效率提高。 分类抽样的缺点是,如何分类通常由人们主 观判定,因此要求调查者具备较高的素质与能力, 并且必须事先对总体各单位的情况有较多的了解, 而它们在实际工作中有时难以完全实现,这就会 影响分类的科学性和精确性。
三、抽样的类型
• 概率抽样 • 非概率抽样
– 根据抽取对象的具体方式,人们把抽样分为许多不同 的类型。总的来说,各种抽样都可以归为概率抽样与 非概率抽样两大类。这是两种有着本质区别的抽样类 型。概率抽样是依据概率论的基本原理,按照随机原 则进行的抽样,因而它能够避免抽样过程中的人为误 差,保证样本的代表性;而非概率抽样则主要是依据 研究者的主观意愿、判断或是否方便等因素来抽取对 象,它不考虑抽样中的等概率原则,因而往往产生较 大的误差,难以保证样本的代表性。 概率抽样与非概率抽样又各自包括了许多具体类 型。分别适用于不同调查对象。联系实际认识概率抽 样的不同类型及其适用性是掌握抽样方法的关键。
第四章 抽样
(1)概率抽样:简单随机抽样、系统抽样、 分层抽样、整群抽样、多段抽样、PPS抽样、 户内抽样 (2)非概率抽样:偶遇抽样、判断抽样、 定额抽样、雪球抽样
二、概率抽样的原理与程序
(一)概率抽样的基本原理 1、总体的同质性与异质性 同质性:如果某个总体中的每一个成员在所有方 面都相同,那么,我们就说这个总体具有完全的 同质性。 否则,就存在不同程度的异质性。 同质性总体不需要抽样。 社会各种总体的异质性决定了严格的概率抽样的 必要性。
(二)系统抽样
3、系统抽样优缺点: <1>优点: ①易于实施,工作量少。 ②样本在总体中分布更为均匀,抽样误差 小于或至多等于简单随机抽样。
(二)系统抽样
<2>系统抽样缺点: ①系统抽样是以总体的随机排列为前提, 如果总体的排列出现有规律分布时,会使 系统抽样产生极大误差。 ②当总体内个体类别之间的数目悬殊过大 时,样本的代表性可能较差。 <3>适用范围:系统抽样最适用于同质性较 高的总体。
人们通常采用下列几组数字
有90%的样本统计值落在u〒1.65SE(样本 平均数的标准差)之间; 有95%的样本统计值落在u〒1.96SE之间; 有98%的样本统计值落在u〒2.33SE之间; 有99%的样本统计值落在u〒2.58SE之间。 其中,百分数表示置信水平,u〒1.65SE等 表示置信区间。
随机数表抽样举例
3、简单随机抽样方法
①当总体元素较少时:常用的办法类似于 抽签,即把总体中每一个单位都编号,将 这些号码写在一张张小纸条上,然后放入 一容器如纸盒、口袋中,搅拌均匀后,从 中任意抽取,直到抽够预定的样本数目。 这样,由抽中的号码所代表的元素组成就 是一个简单随机样本。
第四章(整群抽样)
编辑版pppt
11
一、群规模相等简介
总体中的N个初级单元即群的大小(群内次级单元数) 都相等的情形。也就是,若总体有N个群时,每个群中 所包含的单元数为M相等时,则称群规模相等,在实际 问题中,只要群的规模接近时,也称为群规模相等。这 时,对群的抽取一般采用简单随机抽样(无放回)。
Vran ( y )
1 f S2 nM
编辑版pppt
21
因此,群大小相等的整群抽样的设计效应为:
deff V( y) Vran ( y )
1(M1)c
上面结果意味着:按同样的样本量(以次级单元计)
整群抽样的方差约为简单随机抽样的方差的 1(M1)c
倍。换句话说,为了获得同样的精度,整群抽样的样本
解:由前已算出样本群间方差
而群内方差为
sw2
1 n(M 1)
n i1
M
(yij yi )2
j1
sb2 1418.168
1 n
n i1
1M M 1 j1 (yij
yi )2
1 n
n i1
si2(见表最后一) 列
1 (27.192 17.982 43.522) 1431.68 12
编辑版pppt
n i1
M
( y ij y ) 2
j1
s
2 b
M n 1
n
(yi
i1
y )2
s
2 w
1 n(M 1)
n i1
M
( y ij y i ) 2
j1
14
三、总体均值的估计及性质
总体平均值 Y 的估计为:
第4章 抽样调查技术要点
抽样调查
• 时间短、效率高,投入资源较少
• 调查结果的正确性较高,但是获取 的信息全面性不如普查
细性要求高时可采用这种方法,比如
人口普查,农业普查、企业员工整体 素质普查等。
• 可以通过统计推断技术来估计调查
总体的各项指标,是企业经常使用 的调查研究方法。
抽样调查的定义
抽样调查又称样本调查,是指按照随机原则,
几种概率抽样方法的选择与比较
对抽样误差大小的要求:
抽样误 差大小
• 有关标志值排队的系统抽样方式误差最小; • 分层抽样、按无标志值排队的系统抽样方式其次; • 简单随即抽样和整群抽样方式误差较大。 调查对象本身特点的要求:
调查对 象特点
• 有无总体的全面、详细的资料,如果没有就无法 按有关标志值排队进行系统抽样; • 与对调查对象了解的程度 也有关系。 人、财、物和事件等各种调查条件的要求: • 样本的分散程度大、调查往返的时间长和费用大的情况 下可以考虑整群抽样。
系统抽样的方法,将士兵的编号按班排序(每班10
人),进行抽样,从1号开始抽取,接下来是11号、
21号„„,调查发现士兵对待战争的积极性很高。但
是经过对样本进行研究发现,被抽到的士兵都是每班
的班长,样本的代表性就有问题了!
分层抽样
分层抽样,是指先将调查总体的所有个体按某一重要标志进行
分类(分组),然后在各类(组)中采用简单随即抽样或系统
配额抽样
配额抽样也叫定额抽样,是指将总体中的各单位按 一定的标准划分为若干个类别,将样本数额分配到
个类别中,在规定的数额内由调查人员任意抽选样
本。 配额抽样可分为独立控制配额抽样和相互控制配 额抽样两类。
的样本个体数。 非等比分层抽样主要在于减低各层之间的标准差,使母 非等比分层抽样适用于各层之间相差悬殊或标准差相差较 体平均数的估计更加精确。 大的情况。
第四章 抽样调查
p
p1 p
n
0.2 0.8 0.02 400
即:根据样本资料推断全部学生中戴眼镜的学 生所占的比重时,推断的平均误差为2%。
例: :
一批食品罐头共60000桶,随机抽查300桶,发 现有6桶不合格,求合格品率的抽样平均误差?
解: 已知 N 60000 n 300 n1 6
解:
x xf 12600 126件 f 100
s x x 2 f 4144 6.47件
f 1
99
x
s 2 1 n n N
6.472 1 100 0.614件
100 1000
x
通过例题可说明以下几点:
①样本平均数的平均数等于总体平均数。 ②抽样平均数的标准差仅为总体标准差的 1
n
③可通过调整样本单位数来控制抽样平均误差。
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
则:
x
3n
1 0.577 3
二、抽样调查的特点
1、 是专门组织的一次性的非全面调查 2、 抽选样本单位遵循随机原则 3、 用样本指标数值去推断总体指标数值 (与重点调查的区别) 4、 抽样误差可计算并控制在一定范围内 (与典型调查的区别)
三、抽样调查的几个基本概念 (一) 全及总体和抽样总体
全及总体 指研究对象的全体。其单位数 (总体) 用N 表示。
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例: 某厂生产一种新型灯泡共2000只,随机抽出 400只作耐用时间试验,测试结果平均使用寿 命为4800小时,样本标准差为300小时,求抽 样推断的平均误差?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
感悟与反思:
抽样调查只考察总体的一部分个体,因此它的优点是
调查范围小,节省时间、人力、物力和财力,但其调
查结果往往不如普查得到的结果准确。 为了获得较为准确的调查结果,抽样时要注意样本的
代表性和广泛性.
大样本一定能保证调查结论准确吗
1936年美国总统竞选时,《文学文摘》向1000万选民寄去了调查问卷,这些选民的 名单是从电话簿、俱乐部名册以及杂志的订户中挑选的.结果在寄出的1000万份调查问卷 中,约有240万的选民寄回了调查表.根据这部分选民的回答,《文学文摘》预测共和党 的布兰登将当选。选举那天的结果完全出乎他们的意料,选民中只有 38%投了共和党的票, 而民主党的罗斯福以多数票当选。《文学文摘》采用了1000万的巨大样本,为何会预测 失败呢?
商企业名录、街道派出所里居民户籍册、意向购房人信息册……。
注意: 在利用现有的名单作为抽样框时,要先对该名录进行检
查,避免有重复、遗漏的情况发生。以提高样本对总体 的代表性。
抽样单元指构成抽样框的有限又不重复的个体。
说明:
1、抽样单元不仅指构成抽样框的目录项,同时还表
示该目录项所对应的实际总体特定的一个或一些单元。 2、抽样单元可大可小。 如:在手机调查中我们抽中一栋居民楼,居民楼是一 级单元,而楼中的每个居民就是二级单元。
总体
估计
样本
抽样
所有实际被调查的 学生的爱好情况组 成一个样本。
样本的个数称为样本容量
在一次考前摸底考试中,考生有2万名。怎样才能既省时又 省力的了解到这些考生的英语平均成绩呢?
2万名考生英语成绩 总体是________________; 其中每名考生的英语成绩 个体是________________; 所抽取的500名考生的英语成绩 样本是________________;
合理地确定一个抽样数目,既满足抽样误差的要求,又使抽样调查所 需成本费用最小。样本容量的确定原则是控制在必要的最低限度。
考虑调查精确度的要求、总体性质、抽样方法和人力、 财力等客观条件确定样本的大小。
其原则是:“代价小,代表性高。”
五、抽取样本
在上述几个步骤的基础上,严格按照所选定的抽 样方法和数量,从抽样框中抽取一个个的样本单位, 构成样本。
果准确。
缺 点
工作量大,难度大, 而且有些调查不宜使 用普查
思考学习
为了了解你所在地区老年人的健康状况,你准备怎样收集数据?
下面分别是A、B、C三个小组的调查结果:
100 90 80 小组在公园里 70 60 50 调查了100名老年 40 人,他们一年中生 30 病的次数如图所示: 20 10 0 人数 83
思考:得到火柴能否划燃的信息准确吗?
这样做有什么后果?
问1:在这则笑话中,儿子采用的是什么调查方式?
问2:这种调查方式好不好?还可采用什么方法调查?
调查方式的选择
下列调查中,你认为应该采用哪种调查方式,并说出自己 选择这一观点的理由。
(1)了解你们班同学周末时间是如何安排的;
(2)了解一批圆珠笔芯的使用寿命;
(3)了解我国八年级学生的视力情况; (4)要保证嫦娥三号卫星的成功发射,对重要零部件采用何种方式 检查; (5)全国中学生的节水意识; (6)中央电视台春节联欢晚会的收视率。
普查与抽样调查的比较
普查
优 点
通过调查总体来收 集数据,调查的结
抽样调查
通过调查样本来收 集数据,工作量较 小,便于进行。 调查结果往往不如普 查得到的结果准确
此外,他还运用了配额抽样法,正确地预测了1940年和1944 年大选的结果。
但是,在1948年,他用配额抽样法也曾导致预测失败,他预言 共和党侯选人战胜民主党侯选人,结果却相反。
为什么呢?
主要原因是样本的代表性出了偏差。
因为1948年,经过二战,美国大量人口从农村流向城市,而盖洛
普对人口总体的认识仍停留在1940年的状况。城市居民倾向于投 民主党的票,因此,样本中过大的农村人口比例造成了对民主党
抽样框的重要性
案例:1936年《文学文摘》的民意测量:从电话薄和车牌登记名
单中选择1000万人,最后收到200万人,预测出43% 的罗斯福支 持率(实际是61%)
思考:为什么预测不准?
抽样框选择的不合理:只选择了不成比例的富人 样本,而排除了穷人。
在大萧条时期拥有汽车、电话的是富人,从电话薄和私人汽车登记薄上抽 样必然导致样本中富人过多,而穷人基本上都为罗斯福新政投了赞成票。
样本的容量是__________。 500
2、抽样框与抽样单元
抽样框:指对可以供抽样用的所有调查单位的名册
或详细名单。
抽样框的主要形式有三种:
①名单抽样框 ②区域抽样框
③时间表抽样框。
认识: 例如:要从10000名职工中抽出200名组成一个样本,则10000名
职工的名册,就是抽样框。
常见的抽样框:大学学生花名册、城市黄页里的电话列表、工
以合理的成本选择误差最小的抽样框
三、确定抽样方法
依据研究目的的要求、各种抽样方法的特点,
以及其他限制因素决定采用哪种抽样方法。
四、决定样本大小
考虑调查精确度的要求、总体性质、抽样方法 和人力、财力等客观条件确定样本的大小。 其原则是:“代价小,代表性高。”
(三)选择抽样样本
确定抽样的技术 抽样方法 样本的数量 选择样本
原来20世纪30年代是美国经济衰退的时期,那时能够安装电话、加入上流社会俱乐部 或能订阅杂志的美国人,大部分支持共和党。也就是说《文学文摘》选择的样本虽然
巨大却存在偏差,样本不具有广泛性和代表性。
《文学文摘》的事例表明抽样调查时,既要关注样本的大小,又要关注样本的代表性。 那是不是在样本具有代表性的情况下,样本越大越好呢?一般来说,在样本具有代表
抽样调查是按照一定程序,从调查总体中抽取部分样本进行调 查或观察,用所获取的数据对总体的数量特征进行估计和推断。
抽样调查是目前国际上公认和普遍采用的科学的调查手段。
抽样调查旨在以样本资料来推断调查对象总体的相关统计数据。
总体参数估计
总体
样本统计量 (X) 样本
(二)相关术语
1.总体与样本
案例启示:错误的抽样框将导致调查的失败,当样本框不恰当时,
再大的样本量也无济于事。
成功的对比:盖洛普的配额抽样
但乔治〃盖洛普运用抽样调查,却正确地预测到罗斯福当选。 他之所以成功,是由于运用了配额抽样法,保证了样本的代表 性。配额抽样是建立在了解抽样总体性质的基础上,从各阶层各种 类型的人中按比例进行抽样。
摇号机法:使用专门的机器对事先编号的各样本单位进行 选择。适合于规模较大的总体。
如何确定替代受访者:舍弃、过多抽 样、再抽样
(四)实施调查 (五)测算结果
用样本指标推断总体指标的结果。
百分比推算法:根据样本框架中不同调研结
果所占比例推断总体中的各比例结果。
平均数推算法:将调查的样本结果加以平均,
求出样本平均数,代入平均数推算公式,即
总体=总体个数X样本平均数
三、抽样技术的分类及选择
投票人数的过低估计。
在1948年,一些研究者开始采用随机抽样方法,结果比配额抽样 方法更成功。
3.抽样误差
因使用样本而产生的误差 抽样必然会产生误差,调查人员应该做的不是消除误差,而 是通过提高设计的有效性、寻找更好的抽样框、选择更合适 的抽样方法来减少或控制抽样误差。
抽样误差影响因素
特征(时间、地点、年龄范围、收
入范围、性别等)。
(二)确定抽样框架和个体编号
依据已明确界定的总体范围,收集总体中所 有样本单位的名单,建立供抽样使用的抽样 框。完整的抽样框架中,每个调查对象应该 出现一次,而且只能出现一次;抽样框的不 完整,往往会导致抽样框误差产生。 个体编号,即对调查总体中的个体进行编号。 在概率抽样中,需要对总体中的每一个个体 进行编号,以使抽出的每一个个体更具有代 表性。
性的情况下,样本增大,所得结果误差会减小。但是当样本大到一定程度之后, 再增加样本,精确度的增加却是微小的,同时巨大的样本不仅耗资太大,也不 便于管理。因此在进行抽样调查时,关键在于精心设计抽样方案,选择有代表性的样本,
这样,只用较少的经费,就可能作出接近真实情况的预测。
一、抽样调查概述
(一)概念
优点:
1、抽出样本的分布情况接近总体,样本对总体研 究具有充分的代表性 。 2、有助于调查人员准确地计算抽样误差,并有效 的加以控制,从而提高调查的精度
1.简单随机抽样
(1)定义
又叫纯随机抽样,它是概率抽样技术中最简单的一种。它对调研
总体不经过任何分组、排队,完全凭着偶然的机会从中抽取个体 加以调查。
包含尽可能多的样本单位 所有样本单位出现的概率相等
问:为了解重庆市中学生的饮料消费情况,需要从全市500所中学
中抽取10所中学,再从每所抽中的中学中抽取3个班级,最后从
每个抽中的班级中抽取10名中学生。需要选择哪些抽样框? 答:分别收集三个不同层次的抽样框:
全市500所中学的名单;
每所抽中的中学里所有班级的名单; 每个抽中的班级中所有学生的名单。
适应于调研总体中各个体之间差异较小且各个体数目较小的情况,
或者调查对象不明,难以分组、分类时的情况。
指样本单位的抽取不受主观因素及 其他系统性因素的影响,每个总体 单位都有均等的被抽中机会
(2)常用方法
抽签法:a、先编号 b、再把相应号码写在卡片上 c、任意抽选,直到抽足规定样本数 适用于调查总数中个体数目少的情况。
A:
15 2 1至2次 3至6次 7次及以上 生病次数
B:小组在医院调查了
C:小组调查了10名老年
100名老年病人,他们一 邻居,他们一年中生病的 年中生病的次数如图所示: 次数如下表所示: