抽样设计的理论与方法(PPT46).pptx
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总体总量和总体均值
N
Y Yi
(1)
与
i 1
Y
Y N
1 N
N i 1
yi
(2)
18
样本均值
y
1 n
n i 1
yi
总体均值和总量的估计
Yˆ
y
1 n
n i 1
yi
Yˆ
Ny
N n
n i 1
yi
(3)
(4) (5)
19
Leabharlann Baidu
估计量的方差
V ( y) S 2 (1 f ),
(6)
而
n
S 2
1 N 1
必要的公关工作 调查前的准备 数据收集过程 调查过程及调查质量的控制
12
数据处理
数据处理的简要过程 1、全面核查问卷上的数据 2、对问卷上的回答进行编码 3、将数据录入计算机 4、详细审核、插补 5、进行离群值的检测 6、将数据储存在数据库中
13
数据处理
数据处理的简要过程 1、全面核查问卷上的数据 2、对问卷上的回答进行编码 3、将数据录入计算机 4、详细审核、插补 5、进行离群值的检测 6、将数据储存在数据库中
14
数据发布与数据分析
调查报告 统计表和统计图 数据分析 保密和泄密控制
15
抽样设计的理论和方法
抽样调查中的一些基本概念
总体和样本:总体是指研究对象的全体`,它是 由研究对象中的单元组成的。总体中单元的数 目称作总体容量;样本是指抽样时按照抽样的 规则所抽中的那部分单元所组成的集合。
总体
抽取样本 推断总体
6
调查问卷设计
问卷的作用与设计原则 问卷结构与问题类型 问卷设计的技巧 问卷的度量方法
7
问卷的开发程序 8
试点调查和问卷的定稿 审议、测试和修改问卷
草拟问题 参考以前相同主题的问卷 向用户和调查对象咨询
抽样方法
什么是抽样 抽样是通过抽取总体中的部分单元,收集这些单 元的信息,用来 对总体进行推断的一种手段 非概率抽样 概率抽样
样本
16
研究的目标参数: 总体总量、总体均值、总体比例的估计
及其相应的方差估计
入样概率与抽样比 入样概率是指某个总体单元被选入样本的概率 抽样比:指样本量 n 与总体的容量N的比例
下面介绍主要抽样方法与相应的估计方法:
17
(一)简单随机抽样
定义:设总体中有N个单元,不加条件从中随机抽 取n个单元为样本,每个单元都有同样的概率被抽 中的抽样方法。
调查设计
调查前准备
调查的实施
调查的 分析与报告
4
调查设计
调查目标的确定 调查方法的选择 抽样设计的有关问题 调查中各种误差及其控制
5
数据的收集方法
1、邮寄调查:被调查者在没有访员协助下完成问卷。 2、人员面访:由调查人员协助完成问卷。 3、电话访问:访员通过电话协助被调查者完成问卷。 4、网络调查:调查者利用网络进行调查。
用较高;(3)有可能抽到较差的样本;(4)抽 选大样本比较费时
21
(二)分层抽样
定义:在抽样之前将总体分为同质的、 互不重叠的若干子总体,也称为层。然 后在每一个层独立地随机抽取样本。 分层抽样示意图
22
首先介绍分层抽样的的一些符号:
用下标h表示层的编号 (h 1,2,, L)
用 Yhi , yhi 分别表示总体和样本中第h层第i个
对分层随机抽样,V ( yst ) 的一个无偏估计为
25
v( yst )
L Wh2 sh2 (1 n h1 h
fh)
L Wh2 sh2 n h1 h
L Wh sh2 h1 N
估计量及其性质
24
总体均值的估计
Yˆst
L WhYˆh
h1
1 N
L N hYˆh
h1
对分层随机抽样,有如下简单估计
yst
L
Wh yh
h1
1 N
L
Nh yh
h1
总体总和的简单估计为
Yˆst Nyst L N h yh h1
(10) (11) (12)
无偏性:如果层的估计具有无偏性,分层的总 体总量和总体均值的估计具有无偏性。
▪ 调查概述 ▪ 调查设计 ▪ 数据的收集方法 ▪ 调查问卷设计 ▪ 抽样方法 ▪ 抽样估计 ▪ 样本量的确定 ▪ 数据收集的实施 ▪ 数据处理 ▪ 数据发布与数据分析
3
调查概述
调查指使用明确的概念、方法和程序,以有组织、有条理 的方式,从一个总体的部分或所有单元中收集感兴趣的指 标信息,并将这些信息综合编辑成有用的简要形式的所有 活动。 调查的重要性。调查是认识客观世界的一种手段,通过调 查获取信息,了解现状,进行管理决策和预测。 调查的任务。科学地反映客观情况,为解决问题、制定政 策或策略提供依据,调查是为决策服务。
单元指标值;
用 Wh Nh / N 表示h层的层权 用fh nh / N h 表示h层的抽样比
Nh
nh
Yh Yhi / N h , yh yhi / nh
i 1
i 1
分别表示h层(总体)均值与样本均值;
Nh
2
nh
2
S
2 h
(Yhi Yh )
/(N h
1),
s
2 h
( yhi yh ) /(nh 1)
9
抽样估计
抽样估计的基本原理 加权 总体均值、比例及总量的简单估计 辅助信息的使用 调查估计量的抽样误差估计
10
样本量的确定
影响样本量的因素: 估计值要求的精度;提供的经费能支持 多大的样本;调查的时间要求;需要和 能招聘到多少调查人员等。
11
数据收集的实施
数据收集是调查中收集每一个被抽中的 单元个体数据的过程。
抽样设计的理论与方法
中国科学院 数学与系统科学研究院
1
报告提纲
首先简单介绍调查的基本概念和主要组 成部分,以对抽样调查有个总体认识 讲述抽样调查中的抽样设计,包括各种 抽样设计与相应的估计方法以及辅助信 息的利用,重点是简单随机抽样、分层 抽样、整群抽样、系统抽样、多相抽样 参考文献
2
一、调查的主要组成部分
N
(Yi
i 1
2
Y)
(7)
估计量的方差估计
v( y) s2 (1 f )
(8)
n
s2
1 n 1
n i 1
( yi
2
y)
(9)
20
简单随机抽样的特点
优点: (1)比较容易理解和掌握;(2)抽样框不需要
其他辅助信息;(3)理论上比较成熟,有现成 的方差估计公式。
缺点: (1)没有利用辅助信息;(2)样本分散,面访费
i 1
i 1
23
分别为h层的(层内)方差和样本方差 下面介绍分层抽样适用的场合和优点 1)在调查中不仅需要对总体进行参数估计,
也需要对层的参数进行估计。 2)使样本更具代表性。 3)便于组织管理和数据汇总 4)对不同层可以按照不同情况和条件,具体
采用不同的抽样方法。 5)分层抽样可以提高估计量的精度
N
Y Yi
(1)
与
i 1
Y
Y N
1 N
N i 1
yi
(2)
18
样本均值
y
1 n
n i 1
yi
总体均值和总量的估计
Yˆ
y
1 n
n i 1
yi
Yˆ
Ny
N n
n i 1
yi
(3)
(4) (5)
19
Leabharlann Baidu
估计量的方差
V ( y) S 2 (1 f ),
(6)
而
n
S 2
1 N 1
必要的公关工作 调查前的准备 数据收集过程 调查过程及调查质量的控制
12
数据处理
数据处理的简要过程 1、全面核查问卷上的数据 2、对问卷上的回答进行编码 3、将数据录入计算机 4、详细审核、插补 5、进行离群值的检测 6、将数据储存在数据库中
13
数据处理
数据处理的简要过程 1、全面核查问卷上的数据 2、对问卷上的回答进行编码 3、将数据录入计算机 4、详细审核、插补 5、进行离群值的检测 6、将数据储存在数据库中
14
数据发布与数据分析
调查报告 统计表和统计图 数据分析 保密和泄密控制
15
抽样设计的理论和方法
抽样调查中的一些基本概念
总体和样本:总体是指研究对象的全体`,它是 由研究对象中的单元组成的。总体中单元的数 目称作总体容量;样本是指抽样时按照抽样的 规则所抽中的那部分单元所组成的集合。
总体
抽取样本 推断总体
6
调查问卷设计
问卷的作用与设计原则 问卷结构与问题类型 问卷设计的技巧 问卷的度量方法
7
问卷的开发程序 8
试点调查和问卷的定稿 审议、测试和修改问卷
草拟问题 参考以前相同主题的问卷 向用户和调查对象咨询
抽样方法
什么是抽样 抽样是通过抽取总体中的部分单元,收集这些单 元的信息,用来 对总体进行推断的一种手段 非概率抽样 概率抽样
样本
16
研究的目标参数: 总体总量、总体均值、总体比例的估计
及其相应的方差估计
入样概率与抽样比 入样概率是指某个总体单元被选入样本的概率 抽样比:指样本量 n 与总体的容量N的比例
下面介绍主要抽样方法与相应的估计方法:
17
(一)简单随机抽样
定义:设总体中有N个单元,不加条件从中随机抽 取n个单元为样本,每个单元都有同样的概率被抽 中的抽样方法。
调查设计
调查前准备
调查的实施
调查的 分析与报告
4
调查设计
调查目标的确定 调查方法的选择 抽样设计的有关问题 调查中各种误差及其控制
5
数据的收集方法
1、邮寄调查:被调查者在没有访员协助下完成问卷。 2、人员面访:由调查人员协助完成问卷。 3、电话访问:访员通过电话协助被调查者完成问卷。 4、网络调查:调查者利用网络进行调查。
用较高;(3)有可能抽到较差的样本;(4)抽 选大样本比较费时
21
(二)分层抽样
定义:在抽样之前将总体分为同质的、 互不重叠的若干子总体,也称为层。然 后在每一个层独立地随机抽取样本。 分层抽样示意图
22
首先介绍分层抽样的的一些符号:
用下标h表示层的编号 (h 1,2,, L)
用 Yhi , yhi 分别表示总体和样本中第h层第i个
对分层随机抽样,V ( yst ) 的一个无偏估计为
25
v( yst )
L Wh2 sh2 (1 n h1 h
fh)
L Wh2 sh2 n h1 h
L Wh sh2 h1 N
估计量及其性质
24
总体均值的估计
Yˆst
L WhYˆh
h1
1 N
L N hYˆh
h1
对分层随机抽样,有如下简单估计
yst
L
Wh yh
h1
1 N
L
Nh yh
h1
总体总和的简单估计为
Yˆst Nyst L N h yh h1
(10) (11) (12)
无偏性:如果层的估计具有无偏性,分层的总 体总量和总体均值的估计具有无偏性。
▪ 调查概述 ▪ 调查设计 ▪ 数据的收集方法 ▪ 调查问卷设计 ▪ 抽样方法 ▪ 抽样估计 ▪ 样本量的确定 ▪ 数据收集的实施 ▪ 数据处理 ▪ 数据发布与数据分析
3
调查概述
调查指使用明确的概念、方法和程序,以有组织、有条理 的方式,从一个总体的部分或所有单元中收集感兴趣的指 标信息,并将这些信息综合编辑成有用的简要形式的所有 活动。 调查的重要性。调查是认识客观世界的一种手段,通过调 查获取信息,了解现状,进行管理决策和预测。 调查的任务。科学地反映客观情况,为解决问题、制定政 策或策略提供依据,调查是为决策服务。
单元指标值;
用 Wh Nh / N 表示h层的层权 用fh nh / N h 表示h层的抽样比
Nh
nh
Yh Yhi / N h , yh yhi / nh
i 1
i 1
分别表示h层(总体)均值与样本均值;
Nh
2
nh
2
S
2 h
(Yhi Yh )
/(N h
1),
s
2 h
( yhi yh ) /(nh 1)
9
抽样估计
抽样估计的基本原理 加权 总体均值、比例及总量的简单估计 辅助信息的使用 调查估计量的抽样误差估计
10
样本量的确定
影响样本量的因素: 估计值要求的精度;提供的经费能支持 多大的样本;调查的时间要求;需要和 能招聘到多少调查人员等。
11
数据收集的实施
数据收集是调查中收集每一个被抽中的 单元个体数据的过程。
抽样设计的理论与方法
中国科学院 数学与系统科学研究院
1
报告提纲
首先简单介绍调查的基本概念和主要组 成部分,以对抽样调查有个总体认识 讲述抽样调查中的抽样设计,包括各种 抽样设计与相应的估计方法以及辅助信 息的利用,重点是简单随机抽样、分层 抽样、整群抽样、系统抽样、多相抽样 参考文献
2
一、调查的主要组成部分
N
(Yi
i 1
2
Y)
(7)
估计量的方差估计
v( y) s2 (1 f )
(8)
n
s2
1 n 1
n i 1
( yi
2
y)
(9)
20
简单随机抽样的特点
优点: (1)比较容易理解和掌握;(2)抽样框不需要
其他辅助信息;(3)理论上比较成熟,有现成 的方差估计公式。
缺点: (1)没有利用辅助信息;(2)样本分散,面访费
i 1
i 1
23
分别为h层的(层内)方差和样本方差 下面介绍分层抽样适用的场合和优点 1)在调查中不仅需要对总体进行参数估计,
也需要对层的参数进行估计。 2)使样本更具代表性。 3)便于组织管理和数据汇总 4)对不同层可以按照不同情况和条件,具体
采用不同的抽样方法。 5)分层抽样可以提高估计量的精度