统计学原理7-9.1抽样调查的基本理论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、名单抽样框:即列出全部总体单位的名录一览表,如职工 名单、企业名单等。
2、区域抽样框:即按地理位置将总体范围划分为若干小区域, 以小区域为抽样单位。
3、时间表抽样框:即将总体全部单位按时间顺序排列,把总 体的时间过程分为若干个小的时间单位,以此时间单位为抽 样单位。
2020/5/31
12
四、抽样误差:
第九章 抽样调查
2020/5/31
1
§1、抽样调查的意义与作用
一、抽样调查的概念、特点 (一)概念:
抽样调查是按照随机原则从全部研究对象中抽取一部 分单位进行观察,并依据所获得的数据对全部研究对象 的数量特征做出具有一定可靠性的估计判断,从而达到 对全部研究对象的认识的一种统计方法。
2020/5/31
不但要考虑样本各单位的不同性质,而且还考虑不同性质各
单位的中选顺序。相同构成成分的单位,由于顺序不同,也
作为不同样本。
2、不考虑顺序的抽样:即从总体N个单位抽取n个单位构成
样本。只考虑样本各单位的组成成分如何,而不考虑单位的
抽样顺序。如果样本的成分相同,不论顺序有多大不同,都
作为一种样本。
2020/5/31
16
以上抽样方法的两种分类还存在交叉情况,即有:
1. 考虑顺序的不重复抽样数目 2. 考虑顺序的重复抽样数目
ANn
N!
N n!
BNn N n
3.
不考虑顺序的不重复抽样数目
C
n N
N!
n!N n!
4. 不考虑顺序的重复抽样数目
2020/5/31
DNn
Cn N n1
17
例如:从4个(N)职工中抽取其中的2个(n)
掺杂调查者的主观偏见,出现因人而异的结果,且容易产生倾向性误差;此外,
非随机抽样不能计算和控制其抽样误差,无法说明调查结果的可靠程度。)
2020/5/31
11
三、抽样框:是包括全部抽样单位的名单框架。编制抽样框
是实施抽样的基础。抽样框的好坏通常会直接影响到抽样的随 机性和调查的效果。
抽样框的主要形式有三种:
2020/5/31
9
样本指标:
x xf 或 x f
f
f
s xi x 2 f
f
xp
p
n1 n
s p p(1 p)
2020/5/31
总体指标:
X XF 或 X F
F
F
来自百度文库 i X 2 F F
X
P
P
N1 N
P P 1 P
10
随的概机率原被则抽:二选是、为排概样除率本主单观抽位意样,愿与每的非个干概总扰率体,抽单使样位总能体否的选每入个样单本位是都随有机一的定。
2020/5/31
4
三、抽样调查的理论基础
1. 大数法则:关于大量的随机现象具有稳定性质的法 则。
2. 中心极限定理:如果总体变量存在有限的平均数和 方差,那么不论这个总体变量的分布如何,随着抽 样单位数n的增加,抽样平均数的分布便趋近于正态 分布。
2020/5/31
5
大数法则的意义可以归纳为:
登记性误差
登记性误差是指在调查和汇总过程中由 于观察、测量、登记、计算等方法的差 错或被调查者提供虚假资料而造成的误 差。任何一种统计调查都可能产生登记 性误差。
系统性误差是指由于非随机因素引起的样
误
本代表性不足而产生的误差,表现为样本 估计量的值系统偏低或偏高。。
差
系统性误差
代表性误差
随机性误差
代表性误差是指用样本指标推断 总体指标时,由于样本结构与总 体结构不一致、样本不能完全代 2020/5/31 表总体而产生的误差。
随机性误差又称 偶然性误差,是 指遵循随机原则 抽样,由于随机 因素(偶然性因 素)引起的误差。 抽样估计中的所 谓抽样误差,就 是指的这种随机 误差。
13
五、抽样方法和样本可能数目
样本的可能数目既和样本的容量有关,也和抽样的方法 有关。
根据取样方式的不同,抽样方法有重复抽样和不重复抽样两 种。
1、重复抽样:是指从总体的N个单位中抽取一个容量为n的样本,每
1. 概率抽样:也叫随机抽样,是指按照随机原则抽取样本。概 率抽样最基本的组织方式有:简单随机抽样、分层抽样、等 距抽样和整群抽样。
2. 非概率抽样:也叫非随机抽样,是指从研究目的出发,根据 调查者的经验或判断,从总体中有意识地抽取若干单位构成 样本。重点调查、典型调查、配额调查等属于非随机抽样。 (但由于非随机抽样的效果取决于调查者的经验、主观判断和专业知识,故难免
• 抽样误差较大。
• 不重复抽样:
• 同一总体单位不可能被重复 抽中;
• 由于每次抽取是在不同数目 的总体单位中进行,每个总 体单位在各次抽样中被抽中 的概率不相等。
• 抽样误差较小。
2020/5/31
15
根据对样本的要求不同,抽样方法又有考虑顺序抽 样和不考虑顺序抽样两种: 1、考虑顺序的抽样:即从总体N 中抽取n个单位构成样本,
6(个)
• 不考虑顺序的不重复抽样数目 AB BC CD AC BD AD
2020/5/31
18
1. 现象的某种总体规律只有当具有这些现象足够多数的单位汇 总综合在一起的时候,才能显示出来。因此只有从大量现象 的总体中,才能研究这些现象的规律性。
2. 现象的总体性规律,通常是以平均数的形式表现出来。
3. 所研究的现象总体包含的单位愈多,平均数也就越能够正确 地反映出这些现象的规律性。
4. 各单位的共同倾向(这些表现为主要的、基本的因素)决定 着平均数的水平;而单位对平均数的离差(这些表现为次要 的、偶然的因素)则由于足够多数单位的汇总综合的结果, 而相互抵消,趋于消失。
进行调查。
A=40、B=50、C=70、D=80
1. 考虑顺序的重复抽样数目
• 考虑顺序的重复组合:
B
n N
Nn
42
16(个)
AA BA CA DA
AB BB CB
DB
AC BC CC
DC
2. 不考虑顺序的不重复抽样数目
AD BD CD DD
C
n N
N!
n!N n!
4!
2!4
2!
4 3 2 1 22
2. 对某些社会经济现象虽然可以进行全面调查,但抽样调查可 以节约时间、费用,提高调查的时效性。
3. 抽样调查和全面调查同时进行,可以发挥相互补充和检查质 量的作用。
4. 抽样调查可以用于工业生产过程的质量控制。 5. 利用抽样调查原理,还可以对某种总体的假设进行检验,来
判断这种假设的真伪,以决定行动的取舍。
2
(二)、抽样调查的基本特点:
1. 根据部分实际资料对全部总体的数量特征 做出估计。
2. 按随机的原则从全部总体中抽取样本单位。 3. 抽样推断的抽样误差可以事先计算并且加
以控制。
2020/5/31
3
二、抽样调查的作用:
1. 对某些不可能进行全面调查而又要了解其全面情况的社会经 济现象,必须应用抽样调查。
2020/5/31
6
联系到抽样推断来看,大数法则证明: 如果随机变量总体存在着有限的平均数和方差,
则对于充分大的抽样单位数n,可以几乎趋近于1的概
率,来期望抽样平均数与总体平均数的绝对离差为任
意小,即对于任意的正数α有:
lim P n
xi X
1
随着抽样单位数n的增加,抽样平均数x有接近总体 平均数X的趋势。
次抽出一个单位后,再将其放回总体中参加下一次抽取,这样连续 抽n次即得到一个样本。
2、不重复抽样:是指抽中单位不再放回总体中,下一个样本单位只
能从余下的总体单位中抽取。
2020/5/31
14
重复抽样与不重复抽样的区别:
• 重复抽样:
• 同一总体单位有可能被重 复抽中;
• 每个总体单位在每次抽样 中被抽中的概率都是相同 的。
2. 抽样平均数也是一种随机变量和的分布,因此在抽样单位数 n充分大的条件下,抽样平均数也趋近于正态分布,这为抽 样误差的概率估计提供了一个极为有效而且方便的条件。
2020/5/31
8
§2、抽样调查中的基本概念
一、总体与样本 (一)总体与总体指标 总体:是根据研究目的确定的所要研究的同类事物的全体。总体单位数
称为总体容量,一般用N 表示。 总体指标:用来反映总体数量特征的指标。
(二)样本与样本指标
样本:从总体中抽取的部分总体单位所构成的整体。样本所包含的总体
单位个数称为样本容量,一般用n表示。在实际工作中,人们通常 把n≥30的样本称为大样本,而把 n﹤30的样本称为小样本。
样本指标:是根据样本资料计算的、用于估计和推断相应总体指标的综 合指标。
2020/5/31
7
大数法则未解决的问题: 1. 抽样平均数与总体平均数的离差究竟有多大? 2. 离差不超过一定范围的概率究竟有多少?
3. 这个离差的分布怎样?
要解决这些问题,就要依靠中心极限定理。
1. 在现实生活中,一个随机变量服从于正态分布未必很多,但 多个随机变量和的分布趋近于正态分布则普遍存在的。
2、区域抽样框:即按地理位置将总体范围划分为若干小区域, 以小区域为抽样单位。
3、时间表抽样框:即将总体全部单位按时间顺序排列,把总 体的时间过程分为若干个小的时间单位,以此时间单位为抽 样单位。
2020/5/31
12
四、抽样误差:
第九章 抽样调查
2020/5/31
1
§1、抽样调查的意义与作用
一、抽样调查的概念、特点 (一)概念:
抽样调查是按照随机原则从全部研究对象中抽取一部 分单位进行观察,并依据所获得的数据对全部研究对象 的数量特征做出具有一定可靠性的估计判断,从而达到 对全部研究对象的认识的一种统计方法。
2020/5/31
不但要考虑样本各单位的不同性质,而且还考虑不同性质各
单位的中选顺序。相同构成成分的单位,由于顺序不同,也
作为不同样本。
2、不考虑顺序的抽样:即从总体N个单位抽取n个单位构成
样本。只考虑样本各单位的组成成分如何,而不考虑单位的
抽样顺序。如果样本的成分相同,不论顺序有多大不同,都
作为一种样本。
2020/5/31
16
以上抽样方法的两种分类还存在交叉情况,即有:
1. 考虑顺序的不重复抽样数目 2. 考虑顺序的重复抽样数目
ANn
N!
N n!
BNn N n
3.
不考虑顺序的不重复抽样数目
C
n N
N!
n!N n!
4. 不考虑顺序的重复抽样数目
2020/5/31
DNn
Cn N n1
17
例如:从4个(N)职工中抽取其中的2个(n)
掺杂调查者的主观偏见,出现因人而异的结果,且容易产生倾向性误差;此外,
非随机抽样不能计算和控制其抽样误差,无法说明调查结果的可靠程度。)
2020/5/31
11
三、抽样框:是包括全部抽样单位的名单框架。编制抽样框
是实施抽样的基础。抽样框的好坏通常会直接影响到抽样的随 机性和调查的效果。
抽样框的主要形式有三种:
2020/5/31
9
样本指标:
x xf 或 x f
f
f
s xi x 2 f
f
xp
p
n1 n
s p p(1 p)
2020/5/31
总体指标:
X XF 或 X F
F
F
来自百度文库 i X 2 F F
X
P
P
N1 N
P P 1 P
10
随的概机率原被则抽:二选是、为排概样除率本主单观抽位意样,愿与每的非个干概总扰率体,抽单使样位总能体否的选每入个样单本位是都随有机一的定。
2020/5/31
4
三、抽样调查的理论基础
1. 大数法则:关于大量的随机现象具有稳定性质的法 则。
2. 中心极限定理:如果总体变量存在有限的平均数和 方差,那么不论这个总体变量的分布如何,随着抽 样单位数n的增加,抽样平均数的分布便趋近于正态 分布。
2020/5/31
5
大数法则的意义可以归纳为:
登记性误差
登记性误差是指在调查和汇总过程中由 于观察、测量、登记、计算等方法的差 错或被调查者提供虚假资料而造成的误 差。任何一种统计调查都可能产生登记 性误差。
系统性误差是指由于非随机因素引起的样
误
本代表性不足而产生的误差,表现为样本 估计量的值系统偏低或偏高。。
差
系统性误差
代表性误差
随机性误差
代表性误差是指用样本指标推断 总体指标时,由于样本结构与总 体结构不一致、样本不能完全代 2020/5/31 表总体而产生的误差。
随机性误差又称 偶然性误差,是 指遵循随机原则 抽样,由于随机 因素(偶然性因 素)引起的误差。 抽样估计中的所 谓抽样误差,就 是指的这种随机 误差。
13
五、抽样方法和样本可能数目
样本的可能数目既和样本的容量有关,也和抽样的方法 有关。
根据取样方式的不同,抽样方法有重复抽样和不重复抽样两 种。
1、重复抽样:是指从总体的N个单位中抽取一个容量为n的样本,每
1. 概率抽样:也叫随机抽样,是指按照随机原则抽取样本。概 率抽样最基本的组织方式有:简单随机抽样、分层抽样、等 距抽样和整群抽样。
2. 非概率抽样:也叫非随机抽样,是指从研究目的出发,根据 调查者的经验或判断,从总体中有意识地抽取若干单位构成 样本。重点调查、典型调查、配额调查等属于非随机抽样。 (但由于非随机抽样的效果取决于调查者的经验、主观判断和专业知识,故难免
• 抽样误差较大。
• 不重复抽样:
• 同一总体单位不可能被重复 抽中;
• 由于每次抽取是在不同数目 的总体单位中进行,每个总 体单位在各次抽样中被抽中 的概率不相等。
• 抽样误差较小。
2020/5/31
15
根据对样本的要求不同,抽样方法又有考虑顺序抽 样和不考虑顺序抽样两种: 1、考虑顺序的抽样:即从总体N 中抽取n个单位构成样本,
6(个)
• 不考虑顺序的不重复抽样数目 AB BC CD AC BD AD
2020/5/31
18
1. 现象的某种总体规律只有当具有这些现象足够多数的单位汇 总综合在一起的时候,才能显示出来。因此只有从大量现象 的总体中,才能研究这些现象的规律性。
2. 现象的总体性规律,通常是以平均数的形式表现出来。
3. 所研究的现象总体包含的单位愈多,平均数也就越能够正确 地反映出这些现象的规律性。
4. 各单位的共同倾向(这些表现为主要的、基本的因素)决定 着平均数的水平;而单位对平均数的离差(这些表现为次要 的、偶然的因素)则由于足够多数单位的汇总综合的结果, 而相互抵消,趋于消失。
进行调查。
A=40、B=50、C=70、D=80
1. 考虑顺序的重复抽样数目
• 考虑顺序的重复组合:
B
n N
Nn
42
16(个)
AA BA CA DA
AB BB CB
DB
AC BC CC
DC
2. 不考虑顺序的不重复抽样数目
AD BD CD DD
C
n N
N!
n!N n!
4!
2!4
2!
4 3 2 1 22
2. 对某些社会经济现象虽然可以进行全面调查,但抽样调查可 以节约时间、费用,提高调查的时效性。
3. 抽样调查和全面调查同时进行,可以发挥相互补充和检查质 量的作用。
4. 抽样调查可以用于工业生产过程的质量控制。 5. 利用抽样调查原理,还可以对某种总体的假设进行检验,来
判断这种假设的真伪,以决定行动的取舍。
2
(二)、抽样调查的基本特点:
1. 根据部分实际资料对全部总体的数量特征 做出估计。
2. 按随机的原则从全部总体中抽取样本单位。 3. 抽样推断的抽样误差可以事先计算并且加
以控制。
2020/5/31
3
二、抽样调查的作用:
1. 对某些不可能进行全面调查而又要了解其全面情况的社会经 济现象,必须应用抽样调查。
2020/5/31
6
联系到抽样推断来看,大数法则证明: 如果随机变量总体存在着有限的平均数和方差,
则对于充分大的抽样单位数n,可以几乎趋近于1的概
率,来期望抽样平均数与总体平均数的绝对离差为任
意小,即对于任意的正数α有:
lim P n
xi X
1
随着抽样单位数n的增加,抽样平均数x有接近总体 平均数X的趋势。
次抽出一个单位后,再将其放回总体中参加下一次抽取,这样连续 抽n次即得到一个样本。
2、不重复抽样:是指抽中单位不再放回总体中,下一个样本单位只
能从余下的总体单位中抽取。
2020/5/31
14
重复抽样与不重复抽样的区别:
• 重复抽样:
• 同一总体单位有可能被重 复抽中;
• 每个总体单位在每次抽样 中被抽中的概率都是相同 的。
2. 抽样平均数也是一种随机变量和的分布,因此在抽样单位数 n充分大的条件下,抽样平均数也趋近于正态分布,这为抽 样误差的概率估计提供了一个极为有效而且方便的条件。
2020/5/31
8
§2、抽样调查中的基本概念
一、总体与样本 (一)总体与总体指标 总体:是根据研究目的确定的所要研究的同类事物的全体。总体单位数
称为总体容量,一般用N 表示。 总体指标:用来反映总体数量特征的指标。
(二)样本与样本指标
样本:从总体中抽取的部分总体单位所构成的整体。样本所包含的总体
单位个数称为样本容量,一般用n表示。在实际工作中,人们通常 把n≥30的样本称为大样本,而把 n﹤30的样本称为小样本。
样本指标:是根据样本资料计算的、用于估计和推断相应总体指标的综 合指标。
2020/5/31
7
大数法则未解决的问题: 1. 抽样平均数与总体平均数的离差究竟有多大? 2. 离差不超过一定范围的概率究竟有多少?
3. 这个离差的分布怎样?
要解决这些问题,就要依靠中心极限定理。
1. 在现实生活中,一个随机变量服从于正态分布未必很多,但 多个随机变量和的分布趋近于正态分布则普遍存在的。