第5章 抽样调查
第5章抽样调查2
n
n
n
P( x ˆ2 z x ˆ1 ) 1 a
p(1 p)
p(1 p)
n
n
5 - 35
统计学
STATISTICS
x ˆ1
p(1 p)
z 2
n
x ˆ2
p(1 p)
z 2
n
ˆ1 x z 2
p(1 p) n
ˆ2 x z 2
P(
x
ˆ2
x
x
ˆ1
)
n
n
n
P(
x
ˆ2
z
x
ˆ1
)
1
a
5 - 20
n
n
统计学
STATISTICS
x
ˆ1
z 2
n
x
ˆ2
z 2
n
ˆ1 x z 2
n
112.56 1.96
5 100
ˆ2 x z 2
STATISTICS
xn
2
2
x
n
N N
n 1
n
1
n N
5 - 42
统计学
STATISTICS
p 1 p
p
n
x
p
1
n
p
N N
n 1
p
1
n
p
1
n N
5 - 43
某外贸公司出口一种茶叶,规定每包规格
第五章 抽样
• 二是抽样要求不同:配额注重量的分配, 而判断抽样注重质的分配 • 三是抽样方法不同:配额抽样的方法复杂 精密,而判断抽样的方法简单、易行。
(二)独立控制配额抽样
• 独立控制配额抽样规定按独立的控制特征 分配并抽取样本。 • 例如,假设某调查项目需要对客户进行调 查,选定的控制特征为年龄、性别、和收 入三种,确定的样本数为360个。其独立控 制配额抽样如下表:
五、抽样数目的确定
• 第一,总体中各单位之间标志值的变异程 度; • 第二,允许误差的大小,允许误差又称为 极限误差或最大可能误差,是抽样误差的 范围。用 ∆ 来表示,公式为 ∆ =tµ ,式中t代 表概率度是指扩大或缩小抽样误差范围的 倍数, µ 代表抽样误差。 • 第三,不同的抽样方法也会影响抽样数目。
• 2、分层随即抽样:是把调查总体按其属性不 、分层随即抽样: 同分为若干层次然后在各层中随即抽取样本的 技术。例如:调查人口,可按年龄、收入、职 业、居住位置等标志划分不同的阶层。 • 3、分群随即抽样:又称整群抽样,是把调查 、分群随即抽样: 总体区分为若干个群体,按后用单纯随机抽样 法,从中抽取某些群体进行全面调查的技术。 • 4、系统随即抽样 、系统随即抽样:又称等距离抽样,它是在 总体中先按一定标志顺序排列,并根据总体单 位数和样本单位数计算出抽样距离,然后按相 同的距离或间隔抽选样本单位的技术。
四、固定样本连续抽样调查法
• (一)固定样本连续调查法的含义和特点 • 定义:是把选定的样本单位固定下来,长 期进行调查。 • 优点:调查对象稳定,可以及时、全面取 得各种可靠的资料;费用低效果好。 • 缺点:调查对象登记、记账的工作量很大, 长年累月记录,负担较重。
• • • • • • • •
二、分层随即抽样技术及其应用
第五章 抽样调查
第二种方案:洛阳市所有小学的名单(第一抽样框), 从中抽取10所学校(抽样单位是学校);被抽中 学校的所有班级名单(第二抽样框),每个学校抽 10个班级,共抽取100个班级。(抽样单位是 班级);被抽中班级的所有学生名单(第三抽样 框),每个班级抽20名学生,共抽取2000名 学生,(抽样单位是学生).
18-30 31-50 50以上 小计 总计
200
缺点 虑其中的几种,不可能做出很细的分类
1. 分层不可能兼顾总体的众多属性,只能考 2. 总体分布变化的最新信息不容易得到,因
而配额的合理性很难保证
3. 主观性很大。如一个访问员会本能地避免 访问难以找到的受访者。
四、滚雪球抽样(Snowball Sampling)
(4)依据从随机数表中选出的数码,到抽样 框中寻找它所对应的元素。 练习: 试用简单随机抽样方法在洛阳师范学院抽取 2000名学生。 请思考:操作的难点是什么?
优点:概率抽样的理想类型,简单易行,误差小。 缺点: 1. 需要为总体每个要素编号,当总体所含个 体的数目太多时采用这种方法费时费力; 2. 总体内分类明显时,这种抽样无法按类别 特征自动分配样本数,若想保证样本的代表性,必 须增大样本量,使工作量增大。
院系——专业——班级——学生
抽样框 抽样单位 院系 专业 班级
第一抽样框:所有院系的名单 第二抽样框:抽中院系的所有专 业名单 第三抽样框:抽中专业的所有班 级名单
第四抽样框:抽中班级的所有学 生名单
学生
四、 抽样的原则
随机原则(random principle):在完全
排除主观上人为选择的前提下,使总体中 每一个单位有相同被抽中的机会。——概 率抽样
第五章 市场调研抽样
2、总体指标与抽样指标
总体指标,是根据调研总体各个体指标值计算的综合指标。 总体指标,是根据调研总体各个体指标值计算的综合指标。 总体平均数、总体成数、总体方差和均方差。 有:总体平均数、总体成数、总体方差和均方差。 抽样指标,又称样本指标, 抽样指标,又称样本指标,是根据样本各单位标志值计算的 综合指标。 抽样平均数、抽样成数、抽样方差和均方差。 综合指标。有:抽样平均数、抽样成数、抽样方差和均方差。
© fyq2009
12
3、系统抽样的优缺点 、
优点
抽中的样本比较均匀的分布在总体中,利于推算总体目标 量,是应用最广泛的一种抽样方式。
缺点
(1)前提是要有总体每个单位的相关资料,特别是按 有关标志排队时。 (2)当抽选间隔和被调查对象本身的节奏性(或循环 周期)重合时,会影响调查精度。 (3)抽样误差计算较复杂。
受客观条件限制,无法进行严格的随机抽样; 为了快速获得调查结果; 对调查对象不确定或无法确定的情况; 总体各单位间离散程度不大且调查员具有丰富经验时采用。
非随机抽样技术有四种: 非随机抽样技术有四种: 方便抽样、判断抽样、配额抽样、 方便抽样、判断抽样、配额抽样、雪球抽样
© fyq2009
20
一、方便抽样
© fyq2009
11
二、系统抽样
1、定义 、
系统抽样(Systematic sampling):又称等距抽样,就是先将 调研总体的各个体按一定标志排列起来,然后按照固定顺序和 一定间隔来抽取样本个体。
2、排队标志、抽样间隔、抽样起点 、排队标志、抽样间隔、
排队标志 • 一种是按与调查项目无关的标志排队。 • 另一种是按与调查项目有关的标志排队。 抽样间隔(距离)=调研总体数(N)/样本数(n) 抽样起点确定 –在第一段距离中,用简单随机抽样方式抽取第一个样本。 –从距离的1/2处抽取第一个样本。 –便利方式。
第5章 市场调查的抽样技术
二、抽样调查的特点
抽样调查数据之所以能用来代表和推算总体,主要是因 为抽样调查本身具有其他非全面调查所不具备的特点, 主要是: (1)调查样本是按随机的原则抽取的,在总体中每一个 单位被抽取的机会是均等的,因此,能够保证被抽中的 单位在总体中的均匀分布,不致出现倾向性误差,代表 性强。 (2)是以抽取的全部样本单位作为一个“代表团”,用 整个“代表团”来代表总体,而不是用随意挑选的个别 单位代表总体。
二、系统抽样技术
系统抽样又称机械抽样或等距抽样,是指先将总 体各个单位按某一标志值的大小排列,再分成若 干个组,每个组的样本数基本相等,依照时间或 空间上相等的间隔来抽取调查单位。
抽样间隔(样本距离) =总体单位数/样本单位 数
系统抽样的步骤: 第一步:将总体中每一个个体按顺序排列并加以编号 第二步:计算抽样距离 第三步:抽取第一个样本 第四步:抽取所有的样本 系统抽样优缺点 优点:
即应包括全部总体单位。 例如:名单抽样框、区域抽样框、时间表抽样框 抽样单元:构成抽样框的基本元素。 抽样单元可以分级:初级单元、二级单元、三级单元等。 例如:抽取学校、抽取班级、抽取学生 (五)抽样误差和非抽样误差
抽样误差:指在遵守随机原则条件下,样本指标与总体指标之间的差异,是抽样 调查中不可避免的误差。
域之内
(3)群内差异大,而群间差异小
五、几种概率抽样方案的选择和比较
抽样技术
优点
缺点
简单随机抽样
易理解;结果可投影,可推广 到总体
抽样框难于构制;费用高; 精度低;不一定能保证代表
统计学课件05第5章抽样与参数估计
反映样本数据的集中趋势和平均水平。
样本方差
定义
样本方差是每个样本数据与样本均值差的平方和的平均值,即 $s^2 = frac{1}{n} sum_{i=1}^{n} (x_i - overline{x})^2$。
计算方法
先计算每个样本数据与样本均值的差,然后将差平方,最后求和平 均。
作用
反映样本数据的离散程度和波动情况。
样本量的确定
根据调查目的和精度要求确定样 本量:精度要求越高,需要的样
本量越大。
根据总体规模和抽样方法确定样 本量:总体规模越大,需要的样 本量越大;分层或整群抽样较简 单随机抽样需要的样本量更大。
根据调查资源确定样本量:资源 有限时,需要在满足调查目的和 精度要求的前提下,合理确定样
本量。
02 参数估计
大数定律的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布函数F(x),则对于任意正实数ε,有 lim(n->∞)P(|X1+X2+...+Xn/n-E(X))/ε)=0,其中E(X)是随机变量X的期望值。
大数定律的实例
在抛硬币实验中,随着实验次数的增加,正面朝上的频率将趋近于0.5。
中心极限定理
中心极限定理定义
中心极限定理是指在大量独立同分布的随机变量中,不论 这些随机变量的分布是什么,它们的平均值的分布总是趋 近于正态分布。
中心极限定理的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布 函数F(x),则对于任意实数x,有lim(n->∞)P(∑Xi≤x)=∫(∞->x)F(t)dt。
样本分布的性质
无偏性
如果样本统计量的数学期 望等于总体参数,则该统 计量是无偏的。
第5章抽样调查及参数估计(练习题)
第五章抽样调查及参数估计5.1 抽样与抽样分布5.2 参数估计的基本方法5.3 总体均值的区间估计5.4 总体比例的区间估计5.5 样本容量的确定一、简答题1.什么是抽样推断?用样本指标估计总体指标应该满足哪三个标准才能被认为是优良的估计?2.什么是抽样误差,影响抽样误差的主要因素有哪些?3.简述概率抽样的五种方式二、填空题1.抽样推断是在随机抽样的基础上,利用样本资料计算样本指标,并据以推算总体数量特征的一种统计分析方法。
2.从全部总体单位中随机抽选样本单位的方法有两种,即重复抽样和不重复抽样。
3.常用的抽样组织形式有简单随机抽样、类型抽样、等距抽样、整群抽样等四种。
4.影响抽样误差大小的因素有总体各单位标志值的差异程度、抽样单位数的多少、抽样方法和抽样调查的组织形式。
5.总体参数区间估计必须具备估计值、概率保证程度或概率度、抽样极限误差等三个要素。
6.从总体单位数为N的总体中抽取容量为n的样本,在重复抽样和不重复抽样条件下,可能的样本个数分别是______________和_____________。
7.简单随机_抽样是最基本的抽样组织方式,也是其他复杂抽样设计的基础。
8.影响样本容量的主要因素包括总体各单位标志变异程度_、__允许的极限误差Δ的大小、_抽样方法_、抽样方式、抽样推断的可靠程度F(t)的大小等。
三、选择题1.抽样调查需要遵守的基本原则是( B )。
A.准确性原则 B.随机性原则 C.代表性原则 D.可靠性原则2.抽样调查的主要目的是( A )。
A.用样本指标推断总体指标 B.用总体指标推断样本指标C.弥补普查资料的不足 D.节约经费开支3.抽样平均误差反映了样本指标与总体指标之间的( B )。
A.实际误差 B.实际误差的平均数C.可能的误差范围 D.实际的误差范围4.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D )。
A.简单随机抽样 B.类型抽样 C.等距抽样 D.整群抽样5.在其他情况一定的情况下,样本单位数与抽样误差之间的关系是( B )。
(完整版)第五章抽样调查习题答案
《统计学》习题五 参考答案、单项选择题:1、抽样误差是指( )。
CA 在调查过程中由于观察、测量等差错所引起的误差B 人为原因所造成的误差C 随机抽样而产生的代表性误差D 在调查中违反随机原则出现的系统误差2、抽样平均误差就是( )。
DA 样本的标准差B 总体的标准差C 随机误差D 样本指标的标准差3、抽样估计的可靠性和精确度( )。
BA 是一致的B 是矛盾的C 成正比D 无关系4、在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应( )。
A A 增加 8 倍B 增加 9 倍C 增加 1.25 倍D 增加 2.25 倍5、当有多个参数需要估计时,可以计算出多个样品容量 n 为满足共同的要求,必要的样本容量 一般应是( )。
BA 总体的标志变异程度B 允许误差的大小C 重复抽样和不重复抽样D 样本的差异程度E 估计的可靠度三、填空题:3、 实施概率抽样的前提条件是要具备( )。
抽样框4、 对总体参数进行区间估计时,既要考虑极限误差的大小,即估计的( 虑估计的( )问题。
准确性 可靠性四、简答题:1、抽样调查与重点调查的主要不同点。
A 最小的n 值 B 最大的n 值 6、抽样时需要遵循随机原则的原因是( C 中间的n 值 D 第一个计算出来的n 值)。
CA 可以防止一些工作中的失误B 能使样本与总体有相同的分布C 能使样本与总体有相似或相同的分布D 可使单位调查费用降低二、多项选择题:1、抽样推断中哪些误差是可以避免的( A 工作条件造成的误差 B D 人为因素形成偏差 E2、区间估计的要素是( A 点估计值 B D 抽样极限误差 E3、影响必要样本容量的因素主要有( )。
A B D系统性偏差 C 抽样随机误差 抽样实际误差)。
A C D样本的分布 C 估计的可靠度总体的分布形式)。
A B C E1、抽样推断就是根据( )的信息去研究总体的特征。
样本2、样本单位选取方法可分为( )和( )。
5.抽样调查
1
1.5 2 2.5 3
1.5
2 2.5 3 3.5
2
2.5 3 3.5 4
2.5
3 3.5 4 4.5
3
3.5 4 4.5 5
3.5
4 4.5 5 5.5
6点
3.5
4
4.5
5
5.5
6
5.2 抽样原理
• 样本均值的分布可整理为表
Y
P
1
1/36
1.5
2/36
2
3/36
2.5
4/36
3
5/36
3.5
6/36
5.2 抽样原理
–抽样误差的估算 假设用来 ^ 表示通过样本获得的对总体某个参数 的估 计,定义抽样误差为样本估计量 与总体参数 之间差异平 ^ 方的平均数,即 MSE(mean square error) =
( ) E ( ) 2
^ ^
其中E表示数学期望,即对所有可能情况求平均。在上面 ^ 的例子中, 表示总体平均数, 表示样本平均数 如上例,其抽样误差为:
5.1 抽样调查的概念及特点
• (5)单位
–抽样调查要通过对样本单位的观察或调查来取得有关 数据或记录有关特征,这些单位称之为调查单位。与 此同时,还有据以作为抽样之用的中介单位,称为抽 样单位 –抽样单位与调查单位可以统一,也可能一个抽样单位 包含多个调查单位,也可能一个调查单位可能包含多 个抽样单位 –单位可以是自然形成的,也可以是人为规定的。但单 位之间必须互不重选且能合成总体,尤其是在人为规 定单位或对基本单位进行组合时,更要注意这一点
2
总体
样本
单位数(单元) N n –样本指标是根据样本各单位标志值计算。常用样本指标有:
第5章 抽样调查
7/47
基本术语
1、总体
总体是指根据调查计划的目的所规定 的调查整体。市场调查者应在明确调 查整体后,再实施相应的市场调查活 动。定义总体是要解决:总体的范围、 性质和构成。
8/47
2、样本和样本单位 样本是由一定数量的样本单位组成, 能代表总体的子集。样本单位是按一 定的抽样方法从总体中抽取出来,是 调查中最基本的被调查对象。
22/47
抽样的分类:
抽样技术
随机抽样技术 简 系 分 分 多 单 统 层 群 阶 抽 样随 样随 样随 样随 段 样 机 机 机 机 随 抽 抽 抽 抽 机
非随机抽样技术
固 定 样 本 法 连 续 抽 样
任 意 抽 样
判 断 抽 样
配 额 抽 样
滚 雪 球 抽 样
23/47
• 随机抽样又称概率抽样,是指以概率论为基
28/47
二、随机抽样技术及应用 随机抽样方法可分为五种,即简单随 机抽样、系统或等距随机抽样、分层 随机抽样、分群随机抽样和多阶随机 抽样。
29/47
1、简单随机抽样
• 简单随机抽样就是总体中的第一个单位在抽 取时都有相同的被抽中机会。其概率公式为: • 抽样概率=样本单位数 /总体单位数 • 一般应用于调查总体中各个体之间差异程度 较小,或者调查总体数量不太多的情况。
经国务院批准,我国于2005年底开展了全国1%人口抽样调查工作。这次 调查以全国为总体,以各省、自治区、直辖市为次总体,采取分层、多阶 段、整群概率比例的抽样方法。最终样本单位为调查小区。这次调查的样 本量为1705万人,占全国总人口的1.31%。
截止2005年11月1日零时,全国总人口为130,628万人,与2000年11月1日零 时第五次全国人口普查的总人口126,583万人相比,增加了4,045万人,增 长3.2%;年平均增加809万人,年平均增长0.63%。根据调查数据推算, 2005年年末总人口为130756万人。 全国人口中,男性为67,309万人,占总 人口的51.53%;女性为63,319万人,占总人口的48.47%。性别比(以女性 为100,男性对女性的比例)为106.30,与第五次全国人口普查相比下降 0.44。
(完整版)第五章抽样调查习题答案
《统计学》习题五参考答案一、单项选择题:1、抽样误差是指()。
CA在调查过程中由于观察、测量等差错所引起的误差 B人为原因所造成的误差C随机抽样而产生的代表性误差 D在调查中违反随机原则出现的系统误差2、抽样平均误差就是()。
DA样本的标准差 B总体的标准差 C随机误差 D样本指标的标准差3、抽样估计的可靠性和精确度()。
BA是一致的 B是矛盾的 C成正比 D无关系4、在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应()。
AA增加8倍 B增加9倍 C增加1.25倍 D增加2.25倍5、当有多个参数需要估计时,可以计算出多个样品容量n,为满足共同的要求,必要的样本容量一般应是()。
BA最小的n值 B最大的n值 C中间的n值 D第一个计算出来的n值6、抽样时需要遵循随机原则的原因是()。
CA可以防止一些工作中的失误 B能使样本与总体有相同的分布C能使样本与总体有相似或相同的分布 D可使单位调查费用降低二、多项选择题:1、抽样推断中哪些误差是可以避免的()。
A B DA工作条件造成的误差 B系统性偏差 C抽样随机误差D人为因素形成偏差 E抽样实际误差2、区间估计的要素是()。
A C DA点估计值 B样本的分布 C估计的可靠度D抽样极限误差 E总体的分布形式3、影响必要样本容量的因素主要有()。
A B C EA总体的标志变异程度 B允许误差的大小 C重复抽样和不重复抽样D样本的差异程度 E估计的可靠度三、填空题:1、抽样推断就是根据()的信息去研究总体的特征。
样本2、样本单位选取方法可分为()和()。
重复抽样不重复抽样3、实施概率抽样的前提条件是要具备()。
抽样框4、对总体参数进行区间估计时,既要考虑极限误差的大小,即估计的()问题,又要考虑估计的()问题。
准确性可靠性四、简答题:1、抽样调查与重点调查的主要不同点。
答:第一,选取调查单位的方法不同。
抽样调查是按随机原则抽取调查单位的,重点调查中的重点单位是调查标志值占总体标志总量比重很大的单位,调查单位是明显的;第二,作用不同。
《抽样调查》第五章 整群抽样-课件ppt
平方和 19 112
1 216 203 1 235 315
自由度 6 524 530
均方(方差)
sb2=3 185 sw2=2 321 s2=2 331
三、整群抽样效率分析及群的划分原则
在总体方差固定的条件下,整群抽样的精 度取决于群内相关系数,群内相关系数愈小, 即群内差异或群内方差愈大,则估计量的精度 愈高。
群间抽样,群内全查 层间全查,层内抽查
分组原则 缩小群间差异,
扩大层间差异,
扩大群内差异
缩小层内差异
分组目的 扩大抽样单元
缩小总体
分组结果 总方差=群间方差+群 总方差=层间方差+层
内方差
内方差
第二节 群大小相等的整群抽样
—对群进行简单随机抽样时的估计量与方差
❖ 一、符号说明 ➢ 总体群数 N(A) ,样本群数 n(a) ➢ 第i群中包含的总体单位数 M ➢ 总体第i群第j个单位指标值 Yij(i=1,2...N;j=1,2..M) ➢ 样本第i群第j个单位指标值 yij(i=1,2...n;j=1,2..M)
)(Yik Y Y )2
)
(
j
k)
ˆc
sb2
sb2 (M
s2 1)s2
c
M (N 1)Sb2 (NM 1)S 2 (M 1)(NM 1)S 2
c
1
S 2 S2
sb 2
M n 1
n i 1
( yi
y)2
s2
1 n
n i 1
si2
分析
c 的取值范围在[ 1 ,1]。
1 M
明群当内单元c 越0 相时似,;表明c群值完越全小是,随则机群的内;单c元值的越差大异,越表大。 当 c 0时,表示这个差异比随机分组时群内的差异
市场调查第05章 - 抽样调查
Ni ni n, i (1, m) N
式中,m表示分层数目;ni表示第i层样本单位数;Ni表示第i层样 本总单位数;N表示总体单位数;n表示“样本容量”。
【案例分析】
某公司要分析某地家用电器的消费者购买行为,该地共有居民 20000户,按经济收入高低进行分类,其中高收入的居民为2000 户,占总体的10%,中收入的居民为6000户,占总体的30%,低 收入的居民为12000户,占总体的60%。要从中抽选200户进行调 查,则3类居民分别抽取多少样本?
调查总体中的 所有单位加以 编号,
根据编号的位 数确定适用若 干位数字
查随机数表
37 41 49 66 89
21 56 25 14 77
99 47 33 17 19
42 19 37 35 51
61 28 14 64 28
直到抽足预定 样本数目为止
(3)简单随机抽样优缺点:
优点:简单、直观、容易理解、易于操作 缺点: ① 必须对总体单位加以编号,总体庞大是不具操作性; ② 有些总体不能采用随机抽样。例如对不断生产的大量产品 进行质量检验; ③ 当总体标志变动度较大时,简单随机抽样的代表性不如“分 层随机抽样”代表性高; 适用:总体单位数不大,且分布均匀的总体。
【案例分析】
仍以上面的“购买行为分析”为例。各层样本标准差高收入为300 元,中收入为200元,低收入为50元,如: 调查单位数与样本标准差乘积计算表
各层次 各层的调查单位数 (户) Ni 高 中 低 ∑ NiSi 2000 6000 12000 各层的样本标准差 (元)Si 300 200 50 600000 1200000 600000 2400000 乘积 NiSi
随机抽样调查.特点(P115)
第五章抽样调查
7 8
4ቤተ መጻሕፍቲ ባይዱ4
2 3
30 3.5 0.25
x 0.577
94441
10 3 3 3 ? 3 即为抽样平均误差。
上一页 下一页 返回本节首页
三、影响抽样平均误差的因素
⒈全及总体标志的变动程度( )
全及总体标志变异程度大,抽样平均误差大;反之,全及 总体标志变异程度小,抽样平均误差小。
⒉样本单位标志的变异程度(S) ⒊样本容量(n)的多少 样本容量愈大,抽样平均误差愈小;反之,样本容量愈小,
2 i
xx 2
n
总体标准差 i xx 2
n
上一页 下一页 返回本节首页
在属性总体中,设N1个单位具有某种属性,N0个单位 不具有某种属性,则
P N1 ,Q N0 称为总体成数 NN
p n1 , q n0
n
n
P(1 P)
p(1 p)
称为样本成数 称为总体是非标志标准差 称为样本是非标志标准差
二、抽样调查的特点
❖ ⒈只抽取总体中一部分单位进行调查 ❖ ⒉用一部分部位的指标值去推断总体的指标值 ❖ ⒊抽取部分单位要遵循随机原则 ❖ ⒋抽样误差可以计算,并且可以控制
上一页 下一页 返回本节首页
三、抽样调查的作用
⒈有破坏性、不可能进行全面调查的事物可进行抽样调查 ⒉全面调查实际办不到的事物可进行抽样调查 ⒊节省人力、费用和时间,方式灵活 ⒋可对总体进行推断
f
1
上一页 下一页 返回本节首页
第五章抽样调查
16
注意:在有些书上,样本标准差用s表示
s x x 2
n 1
在计算器上,有σ和s按钮,σ代表总体标准差, S代表样本标准差。
在EXCEL“数据分析”“描述统计”中计算的样本方差 即是按上面公式计算的。
抽样调查案例分析
第四,抽样调查中的样本误差,在调查前就可以根据调 查样本数量和总体中各单位之间的差异程度进行计算, 可以把样本误差控制在一定范围之内,调查结果的准确
4.随机抽样——整群抽样法
整群随机抽样 指按照随机原则在抽样框中抽取部 分抽样单位群体作为调查样本的抽样方法。
整群抽样是先将总体单元分群,可以按照自然分 群或按照需要分群,在交通调查中可以按照地理 特征进行分群,随机选择群体作为抽样样本,调 查样本群中的所有单元。整群抽样样本比较集中 ,可以降低调查费用。例如,在进行居民出行调 查中,可以采用这种方法,以住宅区的不同将住 户分群,然后随机选择群体为抽取的样本。此法 优以抽选出的全部调查样本作为一个"代表团"来代表总体的,而 不是用随意挑选出来的个别单位来代表总体,使调查样本具有充分的代表性。
第三,抽样调查所抽选的调查样本数量,是根据要调查的总体各个单位之间的差 异程度和调查推断总体允许的误差大小,经过科学的计算确定的。由于在调查样 本的数量上有可靠的保证,样本就会与总体实际十分接近。
社 会 调 查 教 程
---抽样调查
第五章 抽样调查
第一节 抽样调查概述 第二节 随机抽样 第三节 非随机抽样 第四节 抽样误差和样本规模 第五节 抽样调查的优点和局限性
第一节 抽样调查概述
抽样:按照一定方式从研究整体中抽取 部分研究对象的程序和方法。 抽样的类型:随机抽样和非随机抽样
随机抽样又称为概率抽样,是指以概 率论为基础,按随机原则抽取样本的方 法。
05第五章 抽样调查
(三)分层抽样 1.分层抽样的含义 分层抽样,又称为分类抽样,它是先将总体中 的所有单位按其一定的属性或特征分成相互不重叠 的若干层,然后在每一层中分别抽取样本,最后把 各层中抽出的样本合在一起构成总体的样本的方法。 2.分层抽样程序 3.等比例分层抽样 4.不等比例分层抽样
【例5-3】某地共有居民4万户,按经济收入高低进行分类,其中高收 入居民为8000户,中等收入居民为24000户,低收入居民有8000户。 要从中抽出800户进行购买力调查,采用等比例分层抽样,如何抽取? 分析:因为购买力是与家庭的收入水平密切相关的,所以以收入水平作 为分层变量是合适的。按此变量将总体分为高收入户、中等收入户和低 收入户三层。具体的抽样程序如下: 第一步,计算各层在总体中的比例。 高收入户:8000/40000=20%;中等收入户: 24000/40000=60%;低收入户:8000/40000=20%。 第二步,各层在总体中所占的比例与各层在样本中所占的比例是一样的。 因此,计算样本在各层中的具体分布数目。 高收入户:800*20%=160(户); 中等收入户:800*60%=480(户); 低收入户:800*20%=160(户)。 第三步,在各层中采用等距抽样方法抽取样本单位。
小结
重点:抽样调查的分类和抽样误差的测定。
难点:样本容量的估计及抽样误差的测定。
作业
1.简要回答单纯随机抽样的具体分类及其各 自特点。 2.简述类型随机抽样的优点及其适用范围。
【例5-2】现有180名学生,要利用等距抽样法从中抽取 15名学生作研究样本,其方法如下:先将学生按与学生学 习成绩无关的标志编号,假设按学生座位顺序把学生编为1 -180号,然后按下述步骤抽取:
(1)确定抽样间隔距离k=180/15=12 (2)随机抽取了编号34为起点,即决定从第34号单位作 为第一个样本。先前抽取样本为34-12=22号单位;向后 抽取样本为34+12=46;如此类推,抽出的15个样本为: (10),(22),(34),(46),(58),(70), (82),(94)(106),(118),(130), (142),(154),(166),(178)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.抽样调查的特征 (1)抽取样本的客观性 (2)抽样调查可以比较准确的推断总体 (3)抽样调查是一种比较节省的调查方法 (4)抽样调查的应用范围广泛
5.1.2 抽样调查中常用的基本概念
1.总体和样本 2.总体单位和样本单位 3.总体指标和样本指标 (1)总体指标 ①总体平均数 ②总体成数 ③总体数量标志的标准差 ④总体是非标志的标准差 (2)样本指标 ①样本平均数 ②样本成数 ③样本数量标志的标准差 ④样本是非标志标准差
2.等距抽样
等距抽样又称机械抽样或系统抽样,它是先 将总体各单位按某一标志排队,并根据总体单 位数和样本单位数计算出抽样距离(即相同的 间隔),然后按相等的距离或等间隔来抽取样 本单位。
(1)等距抽样的过程 【例5-6】从5000名学生中随机抽取100名进行调 查。采用等距抽样法如何抽取样本? (2)等距抽样法的优缺点及适用范围 【小思考5—1】老师依照某种规律点名(如:2号、 12号、22号、32号……)是采用了哪种抽样方法?
简单随机抽样 等距抽样 分层抽样 整群抽样 多阶段抽样 任意抽样 判断抽样 配额抽样 滚雪球抽样 自愿抽样
5.3.1 随机抽样 1.简单随机抽样
也称纯随机抽样,即是在总体单位均匀混合的情况 下,随机逐个抽出样本的抽样方式,它是概率抽样的 最基本类型。 (1)直接抽取法 (2)抽签法 (3)随机数表法 (4)简单,它是先将总体按某一标志分 成若干个类型组,使各组组内标志值比较接近, 然后分别在各组组内按随机原则抽取样本单位, 最后把各层中抽出的样本合在一起构成总体的 样本的方法。
5.2.3 确定抽样数目 1、抽样数目的影响因素 (1)统计方面的因素 ①总体的性质和特点 ②抽样误差的大小 ③抽样的方式、方法 (2)管理方面的因素 ①经费预算 ②精度要求 (3)调查实施方面的因素 ①问卷的回收率 ②问题的回答率
2、抽样数目的计算
(1)公式法
①当测定的指标是平均数时,重复抽样的抽样数目的
总体 规模
100 以下
100~ 1000
1 000~ 5000
5000~ 10000
10000~ 100000
100000 以上
抽样数 占总体 比重(%)
50以上
50~20
30~10
15~3
5~1
1以下
5.2.4 选择抽样方式 5.2.5 抽样调查的实施
5.3 抽样调查方式
抽样调查 方式
随机抽样 非随机抽样
经国务院批准,我国于2005年底开展了全国1%人口抽样调查工作。这 次调查以全国为总体,以各省、自治区、直辖市为次总体,采取分层、 多阶段、整群概率比例的抽样方法。最终样本单位为调查小区。这次调 查的样本量为1705万人,占全国总人口的1.31%。
截止2005年11月1日零时,全国总人口为130,628万人,与2000年11 月1日零时第五次全国人口普查的总人口126,583万人相比,增加了 4,045万人,增长3.2%;年平均增加809万人,年平均增长0.63%。 根据调查数据推算,2005年年末总人口为130756万人。 全国人口中, 男性为67,309万人,占总人口的51.53%;女性为63,319万人,占总 人口的48.47%。性别比(以女性为100,男性对女性的比例)为 106.30,与第五次全国人口普查相比下降0.44。
第5章 抽样调查
5.1 抽样的基本问题 5.2 抽样调查程序 5.3 抽样调查方式
引导案例
2005年全国1%人口抽样调查
我国是世界第一人口大国,人口问题始终是一个关系经济社会发展全局 的重要问题。新中国成立56年来,我国已经先后开展了五次全国人口普 查。从20世纪80年代起,为了及时掌握人口变动情况,国务院决定在每 两次人口普查中间,进行一次1%人口抽样调查。
p
P(1 P) (1 n )
n
N
(3)极限抽样误差(允许误差)
5.2 抽样调查程序
确定调查 总体
选择样本 框
确定抽样 数目
选择抽样方 式
抽样调查的 实施
5.2.1 确定调查总体 调查总体是指研究者根据一定研究目的而规
定的所要调查对象的全体。 5.2.2 选择样本框 (1)有效性 (2)完整性
5.1 抽样的基本问题
5.1.1 抽样调查的概念与特征 1.抽样调查的概念
抽样调查的概念有广义和狭义之分。 广义上,抽样调查是指从总体中抽取一部分单位进 行观察,根据观察结果来推断总体的调查方法。包括 随机抽样和非随机抽样。随机抽样就是按随机原则抽 样,抽样时要保证总体内所有单位具有相同的被抽中 和不被抽中的机会;非随机抽样就是调查者根据自己 的认识和判断,选取若干个有代表性的单位。 狭义上,抽样调查就是指随机抽样。 一般我们所说的抽样调查,大多是指随机抽样。
计算公式为:
n
t 2 2
x2
不重复抽样的抽样数目的计算公式为:
n
Nt 2 2 N x 2 t 2 2
②当测定的指标是成数时,重复抽样的抽样数 目的计算公式为:
n
t2P(1 P2
P)
不重复抽样的抽样数目的计算公式为:
n
Nt2P(1 P) NP2 t2P(1
P)
(2)经验法 经验法确定抽样数目的范围
4.抽样误差的计算 (1)样本平均数的抽样平均误差的计算 ①重复抽样方法下的计算公式:
x
2
nn
②不重复抽样方法下的计算公式:(总体单位 数很大时)
x
2 (1 n )
nN
(2)样本成数的抽样平均误差的计算 ①重复抽样方法下的计算公式:
p
P(1 P) n
②不重复抽样方法下的计算公式:(总体单位 数很大时)
3.抽样误差的意义
抽样误差的意义首先表现在它可以说明样本 指标的代表性大小。显然,抽样误差大,说明 样本指标对总体指标的代表性低;抽样误差小, 则说明样本指标对总体指标的代表性高。其次 它还是计算样本指标和总体指标变异范围的主 要依据;最后,在组织抽样调查时,抽样误差 也是确定抽样数目的依据之一。
5.1.3 抽样误差
1.抽样误差的概念 统计误差可分为: 登记误差 代表性误差 代表性误差又有两种不同的情况: 偏差 随机误差 随机误差又有两种: 实际误差 抽样平均误差 抽样误差指的就是抽样平均误差。
2.抽样误差的影响因素 (1)抽样数目的多少 (2)总体各单位之间的差异程度 (3)不同的抽样组织方式和方法