第六章抽样案例
自考-市场调查与预测-第6章-抽样方法
1 定义总体 确定调查对象全体:从抽样元素、抽样 单位、抽样范围、抽样时间角度考虑 例如…
2 确定抽样框架 抽样总体中,抽样元素的表现形式。总体中 的每一个元素都在抽样框架中出现一次,且 仅出现一次。如户籍簿。 适用性、完整性。 3 确定抽样单位 容纳总体的基本单位,大于等于样本元素。 取决于抽样框架和调查方法。 电话调查——电话号码 邮寄调查——地址或姓名
B 平均值估计 C 百分比估计样本容量
根据允许误差大小估计样本量
不同抽样方法样本容量的确定 影响因素: 调查目的;总体大小;总体构成;抽样方式 计算公式:见表6-4
其它调查方法介绍
2、自愿样本
被调查者自愿参加,成为样本中的一分子,向
调查人员提供有关信息
–
例如,参与报刊上和互联网上刊登的调查问
第6章 抽样方法
普查与抽样调查 抽样程序
常用抽样方法
样本容量的确定
6.1普查与抽样调查
抽样设计的重要性 案例6-1 普查的相关概念和案例 P159 抽样调查的概念 抽样是通过抽取总体中的部分单位,收集 这些单位的信息,从而对总体进行推断的 一种手段。 抽样调查的含义 P163 抽样调查的适用范围
第一节 抽样方法
6.3 常用抽样方法
1 简单随机抽样 2 分层随机抽样 3 分群随机抽样 4 等距随机抽样 5 任意抽样 6 判断抽样 7 配额抽样 8 滚雪球抽样
1 简单随机抽样 1、抽样方法 根据研究目的选定总体,首先对总体中所 有的观察单位编号,遵循随机原则,采用不放 回抽取方法,从总体中随机抽取一定数量观察 单位组成样本。 2、具体方法 ①抽签法
统计学第六章抽样调查
Part
05
系统抽样技术
系统抽样原理及步骤
• 系统抽样原理:系统抽样是一种等距抽样方法,它首先确定一个抽样间隔,然后在总体中按照这个间隔进行抽 样。这种方法适用于总体单位排列有序且周期性变化的情况。
系统抽样原理及步骤
01
系统抽样步骤
02
确定总体范围和抽样框;
03
计算抽样间隔,确定样本量;
系统抽样原理及步骤
01
03 02
分层标准选择与确定方法
• 以调查对象的某些自然特征或社会特征作 为分层标准。
分层标准选择与确定方法
专家判断法
依靠专家经验判断选择合 适的分层标准。
数据分析法
通过对历史数据或相关数据的 分析,找出影响调查指标的主 要因素,作为分层标准。
试验法
通过试验确定不同分层标准 对调查结果的影响程度,选 择最优的分层标准。
缺点
由于样本可能被重复抽取,导致样本的代表性降 低。
缺点
操作相对复杂,需要记录已经抽取过的样本。
简单随机抽样优缺点分析
操作简单
简单随机抽样的操作过程相对简单,易于理解和实施。
等概率原则
保证了每个单位被抽中的机会相等,避免 具有代表性:当样本量足够大时,简单随机抽样可以获得具有代表性的样本。
整群抽样优缺点比较
• 适用于某些特定情况:对于某些总体分布不均匀或难以划分的情况,整群抽样 可能更为适用。
整群抽样优缺点比较
抽样误差较大
01
由于是以群为单位进行抽样,可能导致抽样误差较大。
样本代表性不足
02
如果群的划分不合理或随机性不足,可能导致样本代表性不足。
对群内个体差异考虑不足
03
统计学第6章统计量及其抽样分布
整理ppt
16
2. T统计量
设X1,X2,…,Xn是来自正态总体N~ (μ,σ2 )
n
的一个样本,
X
1 n
n i 1
Xi
(Xi X )2 s 2 i1
n 1
则 T(X) ~t(n1)
S/ n
称为T统计量,它服从自由度为(n-1)的t分布。
整理ppt
17
F分布
定义:设随机变量Y与Z相互独立,且Y和Z分别服 从自由度为m和n的c2分布,随机变量X有如下表达式:
整理ppt
8
中心极限定理
设从均值为,方差为2的一个任意总 体中抽取容量为n的样本,当n充分大时, 样本均值的抽样分布近似服从均值为μ、 方差为σ2/n的正态分布。
当样本容量足够大时
(n≥30),样本均值的抽样
分布逐渐趋于正态分布
整理ppt
9
标准误差
标准误差:样本统计量与总体参数之间的平均差异
1. 所有可能的样本均值的标准差,测度所有样本 均值的离散程度
因此,估计这100名患者治愈成功的比 例在85%至95%的概率为90.5%
整理ppt
22
6.5 两个样本平均值之差的分布
设
X
1
是独立地抽自总体
X1 ~N(1,12)
的一个容量
为n1的样本的均值。 X 2 是独立地抽自总体
X2 ~N(2,22)的一个容量为n2的样本的均值,则有
E (X 1X 2)E (X 1) E (X 2)12
2. 样本均值的标准误差小于总体标准差
3. 计算公式为
x
n
整理ppt
10
【例】设从一个均值μ=8、标准差σ=0.7的总 体中随机抽取容量为n=49的样本。要求:
社会研究方法 第6章
整群抽样
不同子群
子群抽取
整群抽样
优点:简便易行,节省费用 扩大抽样应用范围
缺点: 样本分布不广, 代表性相对较差
适用对象: 总体的不同子群之间差别不大, 而每个子群内部差异较大
五、多段抽样
按抽样元素的隶属、层级关系把抽样过程分为 几个阶段进行:先从总体中随机抽取几个大群, 然后再从这几个大群内随机抽取几个小群,这 样一级级抽下去直到抽到最基本的元素为止。
第六章 抽样
第一节 抽样的意义与作用 第二节 概率抽样的原理与程序 第三节 概率抽样方法 第四节 户内抽样与PPS抽样 第五节 非概率抽样方法 第六节 样本规模与抽样误差
第一节 抽样意义与作用
一、抽样的概念
(1)总体(population):构成它的所有元素的 集合,用“ N ”表示。
(2)元素(element):构成总体的最基本单位。
出总体内在结构的变量作为分层变量。 c:以那些已有明显层次区分的变量作为分层变量 (2)分层的比例 a:按比例分层抽样 b:不按比例分层抽样
按比例分层抽样
分层
学生
1200
女生1000 (5/6)
男生200 (1/6)
抽 样(120人)
100人 5/6
样 本 20人 1/6 120
按各种类型或层次中单位数目同总体单位数目间 的比例来抽取子样本的方法。可以确保得到一个 与总体结构完全一样的样本。
样本规模的计算
简单随机抽样中样本规模的计算 置信水平对应的临界值
➢
推论总体均值
:
n
t2
e2
பைடு நூலகம்
2
总体的标准差 允许的抽样误差
推论总体成数:
t 2 p(1 p)
统计学课件第六章抽样调查PPT课件
特点
每个样本被选中的机会都 相等,样本的代表性相对 较好。
分层抽样
定义
先将总体按一定标准分成 若干层次或群,然后从各 层或群中按随机原则抽取 样本。
方法
分类抽样、比例抽样、类 型抽样。
特点
能够提高样本的代表性, 降低误差,减少资源浪费。
系统抽样
定义
先将总体中的所有个体按某种顺序排列,然后按 照固定的间隔或系统选取样本。
改进抽样方法
采用更科学的抽样方法和技术,如分层抽样、系统抽样等,以提 高样本的代表性。
提高样本代表性
在抽样过程中尽量减少非随机误差,如无回答、不完整数据等, 以提高样本对总体的代表性。
05 抽样调查的组织与实施
抽样调查的设计
确定调查目的
明确调查的目标和意图,为后 续的抽样设计提供指导。
确定调查对象
合理安排问题的顺序、布局和格式,以提高 问卷的易用性和回答率。
确定调查方式
选择合适的调查方式,如自填式、面访式等, 并确定数据收集的途径。
测试与修正
对问卷进行测试和修正,确保问卷的准确性 和可靠性。
调查的实施与质量控制
培训调查员
对调查员进行培训,确保他们了解调 查目的、问卷内容、调查方法等。
现场实施
将总体分成若干个群集或组,然后从每个 群集或组中抽取一定数量的样本,也称为 簇抽样或组抽样。
抽样调查的应用场景
01
02
03
04
市场调查
通过对目标市场的部分消费者 进行调查,了解市场需求、消 费者行为和产品反馈等信息。
社会调查
通过对一定范围内的社会成员 进行调查,了解社会现象、人 口状况和社会问题等信息。
统计学课件第六章抽样调查ppt课 件
第六章抽样理论与参数估计作业案例
样本均值的分布与总体分布的比 较 (例题分析)(重复抽样)
总体分布
.3 P(X)
抽样分布
.3 .2 .1 0
.2 .1 0
1
2
3
4
1.0 1.5 2.0 2.5 3.0 3.5 4.0
X
= 2.5
σ2 =1.25
1.25 0.625 2
2 X
X 2 .5
样本均值的抽样分布
• 简单随机抽样法的局限是:当样本 规模小时,样本的代表性较差。
简单随机取样有两种基本方式:
• 抽签法(drawing lots) • 随机数字表法(random number table)
2.等距抽样
• 等距抽样(interval sampling)也称为 机械抽样或系统抽样。实施时,先把 总体中的所有个体按一定顺序编号,
样本均值的抽样分布
3 2.0 2.5 均值X的取值 4 2.5 3.0 均值X的个数
3.0 2
3.5 2
取值的概率P(X ) 2/12 2/12 4/12 2/12 2/12
样本均值的抽样分布
(例题分析)(不重复抽样)
总体分布
.3 .2
.1 .3 .2 P(X)
抽样分布
.1 0
0
1
2
3
4
1.0 1.5 2.0 2.5 3.0 3.5 4.0
然后依固定的间隔取样。
• 等距抽样可以保证样本的成分与总体
一致,但随机性不如单纯随机抽样法。
应用中可将两种方法结合使用。
3.分层随机抽样
• 分层随机取样简称分层抽样 (stratified sampling 或
hierarchical sampling),是进行
第六章不等概率抽样
23 9542
30 9542
2806070
se(YˆHH ) v(YˆHH ) 1675 (头)
20
第三节 不放回不等概率抽样
21
一、包含概率与 PS 抽样
在不放回不等概率抽样中,不仅总体中每 个单位被包含到样本的概率,即入样概率 ij p(i, j) 起着关键的作用,而且总体中任意
码数,将代码数累加得到 M 0,每次抽取都产生一个
单[1 ~位M拥0]有之的间代的码随数机,数则,第设个为jm单,位若入代样码。m重属复于n第次j这个
样的过程,就可得到由 n 个单位(存在重复的可能)
组成的 PPS 样本。如果在实际中存在 M i 不是整数的
情况,则可以乘以一个倍数,使所有的 v 都成为整数。
获得而且与研究变量往往有很高的相关性,这些优点可以极大
地提高抽样估计的精度,所以在抽样实践中,与单位规模大小
成比例的概率抽样受到青睐。记这种度量单位规模大小的指标
为Mi
,并记
M0
N
Mi
,则可取:
i 1
Zi
Mi M0
这时,每个单位在每次抽样中入样的概率与其单位的规模
大小成比例,称这种特殊的多项抽样为放回的与单位规模大小
4
如果这些为数不多,但指标值在总体总值中占较 大份额的大、特大城市,大、特大商场,大型农场, 万吨巨轮,大额账单,在调查中与为数众多,但指标 值在总体总值中只占微小份额的中小城市、中小商场、 中小农场、小船舶、小额账单一样对待,仍然采取等 概率抽样,显然是不合理的。这些调查指标值占较大 份额的大单位理应在调查中具有较重要的地位,给予 较多的关注,而那些调查指标值占较小份额的中 小单位则处于次要的地位,给予较少的关注。
《社会调查研究方法》 第六章 抽样
《社会调查研究方法》第六章抽样在社会研究中,最常见的总体是由社会中的某些个人组成的,这些个人便是构成总体的元素,比如,当我们对某省大学生的择业倾向进行研究和探讨时,该省所有在校大学生的集合就是我们研究的总体,而每一个在校大学生便是构成总体的元素。
又比如,我们打算研究某城市居民的家庭生活质量,那么,该市所有的居民家庭就构成我们研究的总体,而其中的每一户家庭都是这个总体中的一个元素。
样本(sample)就是从总体中按一定方式抽取出的一部分元素的集合。
或者说,一个样本就是总体的一个子集。
比如,从某省总数为12.8万人的大学生总体中,按一定方式抽取出1 000名大学生进行调查,这1 000名大学生就构成该总体的一个样本(当然,从一个总体中可以抽取出若干个不同的样本)。
在社会研究中,资料的收集工作往往是在样本中完成的。
明白了总体和样本的概念,再来理解抽样的概念就十分容易了。
比如,从3 000名工人所构成的总体中,按一定方式抽取200名工人的过程;或者从1 000户家庭构成的总体中,按一定方式抽取一个由100户家庭构成的样本的过程,都叫做抽样。
比如,上面所举的例子中,单个的大学生既是构成某省12.8万名大学生这一总体的元素,又是我们从总体中一次直接抽取出1000名大学生的样本时所用的抽样单位;但是,当我们从这一总体中一次直接抽取出40个班级,而以这40个班级中的全部学生(假定正好1000名)作为我们的样本时,抽样单位(班级)与构成总体的元素(学生)就不是一样的了。
比如,从一所中学的全体学生中,直接抽取200名学生作为样本,那么,这所中学全体学生的名单就是这次抽样的抽样框;如果是从这所中学的所有班级中抽取部分班级的学生作为调查的样本,那么,此时的抽样框就不再是全校学生的名单,而是全校所有班级的名单了。
因为此时的抽样单位已不再是单个的学生,而是单个的班级了。
在统计中最常见的总体值是某一变量的平均值,比如,某市待业青年的平均年龄、某厂工人的平均收入等等,它们分别是关于某市待业青年这一总体在年龄这一变量上的综合描述,以及某厂工人这一总体在收入这一变量上的综合描述。
《抽样技术》第六章
N
1. i n i 1
N
2. ij n 1i ji
3.
N i 1
N
ij
j i
1n 2
n 1
14
最感兴趣的是πi与单元大小Mi成比例的情形。若仍 记Zi=Mi/M0,则有: πi=nZi 这种不放回的与(单元)大小成比例的概率抽样称为 πPS抽样。
n 1i 2
i1 i
n
yi2 2
i 1
n ij i j ji i j ij
yi y j
是V YˆHT 的无偏估计。
2
s2 YGS
YˆHT
n i 1
n j i
i j ij ij
yi
i
yj
j
也是V YˆHT 的无偏估计。
11
12
§6.3 不放回不等概率抽样
一、包含概率与πPS抽样 二、霍维茨—汤普森估计量及其性质 三、n=2的严格πPS抽样
13
一、包含概率与πPS抽样
在不放回抽样中,每个单元Yi被包含到样本的概率 πi=P(i)及任意两个单元(Yi, Yj)都包含到样本的概率 πij=P(i,j)通称为包含概率。抽取了n个单元的样本。
拉希里法适用于N很大的情况。
9
三、汉森—赫维茨估计量及其性质
汉森—赫维茨(Hansen-Hurwitz)提出的对总体总和Y的估计如
下:
YˆHH
1 n
n i 1
yi zi
汉森一赫维茨估计量 i=1,2,⋯,N,则
YˆHH
具有如下性质:若所有的Zi>0,
第六章二阶及多阶抽样
(2)在两阶抽样中,总体各一阶单元所包含的二阶单元数,有相 等和不相等的两种情况。
• 前者无论在样本的抽取还是在指标的估算方面都相对比较简单, 然而在抽样实践中却很少有这种情况的存在,但作为基本方法仍 然有其实际意义;均匀复合体型
• 后种情况在抽样和指标的估算方法上都较为复杂,然而在实际中 普遍存在此种情况。 非均匀复合体型
=
S12 n
(1 −
f1) +
S
2 2
nm
f1 ⋅ (1 −
f2) +
S
2 3
nmg
Байду номын сангаас
f1 f 2 (1 − f3 )
二阶抽样估计方法
标准误
Sy =
S
2 y
估计误差限 估计精度
Δ = tα ( nm −1) ⋅ S y E=Δ
y
Pc = 1− E
算例
欲调查北京林业大学1998年人均生活费用。我校有120个班,平均每班有30 人。采用二阶抽样调查,随机抽取4个班,再从抽中的每个班中随机抽取4人进 行调查(见下表),试以95%的可靠性估计我校1998年学生人均生活费用。
基本概念
将总体划分为N个部分,称为一阶单元(primary units);再把每个一阶单元划分为M个单元,称为二 阶单元(second–stage units)。
从N个一阶单元中随机抽取n个单元,组成一阶样本; 再从抽中的每个一阶单元中随机抽取m个单元,组成 二阶样本。这种用两阶样本估计总体的方法叫二阶抽 样。
例2 1972年在河北省围场县龙头山林场进行的二阶抽样调查试
点,总体面积为636.3ha,一阶单元面积为2ha(最小小班面
抽样调查-第6章整群抽样
s( y) v( y ) 18.81 4.34
于是置信度为95%的置信区间为98.17±1.96×4.34, 也即[89.66元,106.68元】
2、整群抽样效率分析
在整群抽样中,由于
V (y) 1 f nM
Sb2
估计量的方差主要依赖群间的变异性。因此
整群抽样中
Sb2
S
2 w
较大,则整群抽样就会损失精度。
deff V ( y) 1 (M 1)
VSRS ( y)
这表明,整群抽样的方差约为简单随机抽样方差的
1 (M 1) 倍
整群抽样估计效应与群内相关系数 关系密切,
若群内各单元的值都相等,则群内方差S
2 w
0
此时, 1 为最大值,deff M 即整群抽样的估计
量方差是简单随机抽样估计量方差的倍。
v(Y )
N
2M
2v( y)
N
2M
(1 n
f
)Sb2
下面我们看一个整群抽样的例题
【例4.11】 在一次对某中学在校生零花钱的调查
中,以宿舍作为群进行整群抽样,每个宿舍都有M=6 名学生。用简单随机抽样在全部N=315间宿舍中抽取
n=8间宿舍。全部48个学生上周每人的零花钱 yij 及
相关计算数据如下表。试估计该学校学生平均每周
i1
M (N 1)
1 f nM
Sb2
定理4.3 V ( y) 的样本估计为:
v( y)
1 f nM
sb2
由于 sb2是Sb2 的无偏估计, 因而 v( y)是V ( y) 的无偏估计。
总体总值 Y NM Y 的估计量为:
Y NM y
总体总值 Y NM Y 的估计量的方差为:
第六章 抽样设计
七、敏感性问题
敏感性问题是指在抽样调查中,被调查的问题是属 于被调查人私人机密或不愿意如实回答的问题。
如调查被调查者是否曾冒充顾客进商店行窃,是否 吸毒,个人储蓄是多少等。
这类涉及个人隐私或违法行为的敏感性问题,若采 用直接问答的方式,被调查者往往会拒绝回答或故 意作出错误的回答。这样就破坏了数据的真实性, 而且其破坏程度的大小无法度量。
有独立控制配额抽样和交叉控制配的抽样。
独立控制配额抽样只用一个变量进行配额 交叉控制配额抽样采用多个变量进行配额
7
三、配额抽样
独立控制配额抽样之例: 某项调查确定样本量为200人,其中:男性70%,女性
30%。请对抽样进行配额。
男 女 合计
比例 70% 30% 100%
性别
人数 140 60 200
8
三、配额抽样
交叉控制配额抽样之例: 某项调查确定样本量为200人,其中男性70%,女性30%;
农村20%,城市80%。请对抽样进行配额。
男性比例 (70%)
地 农村(20%) 区 城市(80%)
合计
14% 56% 70%
性别
男性 人数
女性比例 (30%)
28
6%
112
24%
140
30%
女性 人数
0.71.35
故总体 A 的置信区间为:
0.565A0.835
35
2、西蒙斯随机化回答模型
西蒙斯模型是1967年由西蒙斯(Simmons)提出的。 其设计思想仍是基于沃纳的随机化回答思想,只是在设计
中用无关的问题Y代替了沃纳模型中的敏感性问题A的对 立问题。这有助于进一步消除被调查者的顾虑。
12 48 60
统计学第六章 抽样估计
(2)通过试访问进行估计 通过试访问的方法,先获得少数一部分样 本的误差数据,然后根据这些数据去计算最终 所需要的样本量,然后再将所需要的样本量完 成。
(3)序贯抽样方法 所谓序贯抽样,是指依次抽取样本,每抽 取一次,进行一次误差计算,直至达到所需要 的精度。
一般做序贯抽样时,会有一张图,如黑板 上图所示。
案例:
假定欲估计喜欢某产品的居民比例在95% 置信度水平下,要求绝对误差小于5%,求样 本量。
本题解法:
但是,如果是相对误差,已知P
五、其他抽样组织形式
1、分层抽样(Stratified Sampling) 2、整群抽样(Cluster Sampling) 3、多阶段抽样(Multi-stage Sampling) 4、设计效应(deff)
序贯抽样的方式操作比较简单,但不适用 于经济调查,一般运用于质量检验中。
(4)成数估计时,使用最大值判断 绝对误差与相对误差 有时候绝对误差很小,但相对误差会很大。
对于绝对误差: 当成数是P时,其标准差为 在成数估计的条件下,方差的最大值为 0.25,因此可以使用最大的方差作为推断最大 样本量的基础。
1、样本平均数的分布
从一个总体中抽出一部分单位,构成一个 样本,可计算出一个样本平均数。
无数次抽选的结果,将会产生无数个样本 平均数,这些样本平均数具有自己的分布形式。
根据大数定理,当样本量超过30时,样本 平均数的分布为正态分布。
2、分布特征
在有放回条件下,简单随机抽样的误差计 算公式如下:
3、多阶段抽样(Multi-stage Sampling)
多阶段抽样的误差计算取决于各阶段的 抽样方式,以最简单的二阶段抽样为例,如 果每一阶段的抽选都是简单随机抽样,一阶 单位的规模相同,则有下列公式:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
不再把这个单位重新放回总体,这个总体单位
26
不再继续参加下2次021/抽4/13选。
二、抽样的作用
基本作用:是人们从部分认识整体的关键环节. “你不必吃完整头牛,才知道肉是老的。” 必要性:研究人员难以做到任何研究都进行全面
调查,而抽样误差可以控制到很小,因而抽样调 查成为最常用的研究方法之一。
2.制定抽样框
制定抽样框 依据已经明确界定的总体范围,收集总体中全 部抽样单位的名单,并对名单进行统一编号,从 而建立抽样框。 当抽样是分几个阶段、在几个不同的抽样层次 上进行时,要建立不同的抽样框。
﹠准确的抽样框原则:
1、完整性 2、不重复性
例如: 在城市居民户的抽样中,会经常出现一户有多处住房的
参数值/总体值
——是关于总体中某一变量的综合描述,或者说 是总体中所有元素的某种特征的综合数量表现。 例如:全国妇女平均受教育年限
参数值只有通过总体的每一个元素都进行调查 或测量才到。
统计值/样本值
——是关于调查样本中的某一变量的综合描述。
是从样本中计算出来的 是作为总体值的估计值 例如:从一个样本中得到的妇女平均受教育年限。
普遍调查的特点
工作量大,费时、费力、费钱。 资料准确,适用了解总体的基本情况。 需要高度集中的组织和高度统一的安排。 调查项目不能多,只能了解某一方面必不可
少的基本情况。
二、抽样调查
抽样调查就是从所研究的总体中,按照一定的 方式选取一部分个体进行调查,并将从这部分 个体中所得到的调查结果推广到总体中去。
但是,当总体所含个体数目太多时,采用这种抽样 方式不仅费时多,工作繁杂且费用太高。
此外,这种抽样方法,在构成总体的个体差异不大 时,用之比较有效,而在总体异质性较高时,误差 较大。
适用范围:总体单位数目和所需样本数目都比较少。
例:某总体共6000人,现需要从中抽取300名作 为样本进行调查,运用随机数表法。
抽样的优越性
1.调查费用较低。 2.速度快 3.应用范围广。 4.可获得内容丰富的资料。 5.准确度高。
举例:美国的总统选举预测
总体:全体合法选民
样本:部分选民
推断:根据部分对整体做出归纳
指标:1、全体合法选民的平均年龄
2、当前登记投票的全体合法选民的百分比
以上总体指标是不能精确测定的,仅能根据统计量 和样本指标来估计
抽样误差
是指在用样本统计值去推估总体参数值时所存 在的偏差。它是由抽样本身的随机性引起的,是 不可避免的。但是抽样误差的大小是控制的。
﹠抽样误差的意义:是衡量样本代表性好坏的标 准,抽样误差越小,说明样本的代表性越好,反 之,则越不好。
抽样中因误抄、计算错误等人为过失和其他一 些因违反随机原则而产生的误差并不是抽样误差。
★方法:一是抽签;二是利用随机数表来抽样
抽签
先将研究总体中的每一个单位统一编号,使每 一个单位都有一个号,然后将每一个号作成一 个卡号并且混合均匀,最后从中随机抽取卡片, 直到抽到额定的数目为止。这种方法在一般日 常生活中用得比较多。
利用随机数表抽样的具体步骤:
(1)先取得一份总体所有元素的名单(抽样框); (2)将总体中所有元素一一按顺序编号; (3)根据总体规模是几位数来确定从随机量表中选几
三 、抽样的类型
根据抽取对象的具体方式,我们可以把抽样分 为两个大的类型:概率抽样和非概率抽样。
概率抽样是依据概率论的基本原理,按照随机 原则进行的抽样,它能够避免抽样过程中的人 为误差,保证样本的代表性。
非概率抽样则主要依据研究者的主观意愿,判 断或是否方便等因素来抽取样本,它不考虑抽 样中的等概率原则,因而往往产生较大的误差, 难以保证样本的代表性。
分析
概率抽样的方法
简单随机抽样 系统抽样 分层抽样 整群抽样 多段抽样
非概率抽样
1、偶遇抽样 2、判断抽样 3、定额抽样 4、雪球抽样
第二节 概率抽样的原理与程序
一、概率抽样的基本原理
随机抽取式概率抽样的关键 在概率抽样的过程中,我们要保证总体中的每
一个个体都有同等的机会入选样本,而且,任 何一个个体的入选与否,与其他个体毫不相关、 互不影响。(单选) 当总体情况不明时,无法做到随机抽样。
1.总体population:调查研究的全部事物,是构 成它的所有元素的集合。
人口普查——全国人口 某省大学生择业 在社会调
观念调查——某省全体大学生查表中示用N
在社会调 查中用n
表示
总体与样本
总体
样
样本统计量
本
例如:样本均
值、比例、方
差
实际抽样中,抽样单位往往是多层次的。如 调查家庭,通过县-乡-村三级抽样,抽样单 位为乡、村、家庭三种,分别为初级抽样单 位、次级抽样单位和终极抽样单位。
第六章 抽样
第六章 抽样
一、抽样的意义与作用 二、概率抽样的原理与程序 三、概率抽样方法 四、户内抽样与PPS抽样 五、非概率抽样方法 六、样本规模与抽样误差
普遍调查
普遍调查通常简称普查,它指的是对构成总体 的所有个体无一例外地进行调查。比如全国人 口普查,就是对全国所有人口逐个进行调查。
第四章 抽样
置信水平与置信区间
(1)置信水平(Confidence Level) 也称置信度,指的是总体参数值落在样本统计值某一区间内的 概率。
(2)置信区间(Confidence Interval) 是指在一定范围的置信水平下,样本统计值与总体参数值之间 的误差范围
(3)置信水平与置信区间的关系
﹠置信水平反映的是抽样的可靠性程度,置信 区间反映的是抽样的精确性程度。
﹠在其他条件不变的情况下,置信水平越高, 置信区间越大;置信水平越低,置信区间越小。 对抽样的可靠性程度要求越高,抽样的精确性 程度将越低;对抽样的可靠性程度要求越低, 则抽样的精确性程度将越高。
异质性
社会中由不同的个人所组成的各种群体、组织等构成了社会 调查的研究总体。它们所包含的个体相互之间总是存在着 或大或小的差异,这种差异就用异质性来表示。
界定总体是达到良好的抽样效果的前提条件。如果不 清楚明确界定总体的范围与界限,即使采用最严格的抽 样方法,也可能抽出对总体严重缺乏代表性的样本来。
三、抽样的一般程序
1.界定总体
但当年,盖洛普民意测验所只调查了3000人,就对 投票结果作出了准确的预测。
其中一个很重要的原因便是对抽取样本的总体缺乏 清楚认识和明确的界定。
同质性
一个总体中的各元素之所以会归为这个总体中,总是存在 着一些相似点或共同特征。同质性就是指总体中个体相互 之间的相似程度,它与异质性相对应。
25
2021/4/13
放回抽样
是指每次从总体中抽取一个单位进行观察后再 把这个单位重新放回总体,使之继续参加下次 抽选。
不放回抽样
是指每次从总体中抽取一个单位进行观察后,
指的是抽样设计能够从样本自身计算出有效的估计值 或抽样变动的近似值。
3、可行性原则
研究者所设计的抽样方案必须在实践中切实可行。
4、经济性原则
抽样方案的设计要与研究的可的资源相适应。
第三节 概率抽样方法
一、简单随机抽样
又称纯随机抽样,是概率抽样的最基本形式。 它是按照等概率原则,直接从含有N个元素中 的总体中抽样n个元素组成样本。抽样时不进 行任何分组排列,使总体中的任何个体都有同 等被抽中的机会。其典型就是抽签。
抽样调查的特点(一)
抽样调查非常节省时间、人力和财力,这也许 是抽样调查最突出的优点。
抽样调查可以十分迅速地获得资料数据。
抽样调查的特点(二)
抽样调查可以比较详细地收集信息,获得内容 丰富的资料。
应用范围十分广泛。 准确性高。
第一节 抽样的意义与作用
第一节 抽样的意义与作用
一、抽样概念
情况,这样很容易把一户重复列入抽样框,使得他们 在抽样中的中选概率高于其他居民,相反,许多城市 居民居住条件比较差,很多居民同住在一个门牌号中, 因此很容易遗漏。两种情况均违背了随机抽样的等概 率原则。
52
3.决定抽样方案(准备采用哪种抽样方法)
4.实际抽取样本
5.评估样本质量 评估样本:对样本的质量、代表性、偏差等等 进行初步的检验和衡量,防止由于样本的偏差 国大导致的失误。
位数; (4)以总体规模为标准,对随机数表中的数码逐一进
行衡量并决定取舍; (5)根据总体规模的要求选择出足够的数码个数; (6)依据从随机数表中选出的数码,到抽样框中找出
它所对应的元素。
随机数表的使用举例P329
从3000总体中抽取100人 作为样本
1 取得总体名单;
随机数表中的数 码
评估样本的正误
如果总体的资料分布与样本的资料分布基本上一致, 则我们对样本的代表性就有较大的信心。
Hale Waihona Puke 年龄总体样本(n=1000)
(N=100000)
15~17
30
28
18~22
50
51
23~25
20
21
四、抽样设计的原则
1、目的性原则
即要以课题研究的总体方案和研究目标为依据。
2、可测性原则
二、系统抽样
系统抽样又称等距抽样或机械抽样。它是把总 体的单位进行编号排序后,再计算出某种间隔, 然后按这一固定的间隔抽取个体的号码来组成 样本的方法。
具体步骤
(1)给总体中的每一个个体按顺序编号,即 制定出抽样框。
(2)计算出抽样间距。计算方法是用总体的 规模除以样本的规模。假设总体规模为N,样 本规模为n,那么抽样间距K就由下列公式导出:
8432990906
选用 的数 码
0906
不选原因
2 从1到3000编号; 3 从随机数表中选择4位
1053873020 9427410041 0139022507