[社会学]应用统计学 抽样调查与推断

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
statistics
2012 第 10 页
第二节 抽样调查的组织方式和抽样方法
2、类型抽样
将总体按某个主要标志进行分组,再按随机原则采用简单随机抽样方式从 各组中抽取一定数目的总体单位组成样本的抽样组织方式。
描述:
N1
n1
等额抽取
样本
总体 N
N2
Nk
n2
nk
n
等比例抽取
不等比例抽取
· · ·
· · ·
成份,不问样本的构成顺序。
statistics
2012 第 22 页
第二节 抽样调查的组织方式和抽样方法
样本数量

考虑顺序的不重复抽样:
n AN N ( N 1)....( N n 1)
N! ( N n)!

考虑顺序的重复抽样:
n BN Nn

不考虑顺序的不重复抽样:
1、样本间距为K=10000/400=25。
2、然后从1-25中任意抽取一个数为样本,假定为第8台,则
第2个样本为8+25=33,即抽取第33台作为第2个样本,以
此类推,一直抽够400台为止。
statistics
2012
第 16 页
第二节 抽样调查的组织方式和抽样方法
优点:
(1)简便易行,容易确定样本单元 (2)分布比较均匀,有利于提高估计精度 例 如:对公路旁树木进行病虫害防治,确定每30棵树检查1棵,只 要确定了起点的被检查树,每隔30棵检查1棵即可。 (1)若抽样间隔与总体的某种周期性变化一致,
statistics
2012
第 4页
第一节 抽样推断概述
(1)对一些不可能或不必要进行全面调查的社会经济现象,最宜用抽样方式解 决。 举例:对有破坏性或损耗性质的商品质量检验;对一些具有无限总体的调查(如对 森林木材积蓄量的调查)等。 (2)在经费、人力、物力和时间有限的情况下,采用抽样调查方法可节省费用, 争取时效,用较少的人力物力和时间达到满意的调查效果。 (3)运用抽样调查对全面调查进行验证。全面调查涉及面广、工作量大、花费 时间和经费多,组织起来比较困难。但调查质量如何需要检查验证,这时,显然不 能用全面调查方式进行。 (4)可运用于企业质量管理。 (5)利用抽样推断的方法,可以对于某种总体的假设进行检 验,判断这种假设的真伪,以决定取舍。
第一节 第二节 第三节 第四节 第五节
statistics
2012
抽样推断概述 抽样调查的组织方式和抽样方法 抽样误差 抽样估计 样本容量的确定
第 2页
第一节 抽样推断概述
抽样调查的概念
一般所讲的抽样调查,即指狭义的抽样调查(随机抽样):按照随机原则从 总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部 分单位的数量特征为代表,对总体作出数量上的推断分析。
statistics
2012
第 11 页
第二节 抽样调查的组织方式和抽样方法
等比例 抽样
指分层后,按随机原则根据各层中单位数量占总体单位数量的比
例抽取各层的样本数量。
每层抽取的样本数计算公式为:
ni
Ni n N
式 中: ni为第i层抽出的样本数
Ni为第i层的总单位数 N为总体单位数 n为总体样本数
示意图:
A D E B
C J
H
M
N P O I
L
K
L
P D
样本容量
n Nd N p Nl Nh
F
G
H
statistics
2012
第 18 页
第二节 抽样调查的组织方式和抽样方法
特 点
(1)总体和样本都是由“群”组成; (2)引起的抽样误差的方差是群间方差,群内方差不影响抽样误差;
(3)整群抽样均为不重复抽样,可提高样本的代表性。
statistics
2012
第 14 页
第二节 抽样调查的组织方式和抽样方法
3、等距抽样
又称系统抽样先把总体单位按某种顺序排列成行(或按自然顺序),用随机方法抽 取第一个单位, 以后每隔若干单位抽取一个单位。
1、和调查项目无关,如按照门牌号排列;
排列:
2、和调查项目有关,如按收入给家庭排序。 设总体单元数为N,要抽n个单元为样本,先计算抽样间隔k=N/n (取整),
statistics
2012 第 12 页
第二节 抽样调查的组织方式和抽样方法
非等比例 抽样
指分层后,不按各层中单位数量占总体单位数量的比例抽取各层
的样本数量。一般用最佳抽样或最低成本抽样。 每层抽取的样本数计算公式为:
最佳抽样:
根据各层标准差的大小来调整各层样本数目的抽样方法。
N i i ni n N i i
统计推断的过程
总体
样 本
样本统计量
例如:样本均值、比 例、方差
statistics
2012
第 1页
第八章
抽样调查与推断
【学习目标】了解抽样调查的概念、特点;掌握抽样推断的几个基本概念; 掌握抽样平均误差、抽样极限误差的概念及计算方法;掌握全及指标推断: 点估计和区间估计方法;掌握抽样单位数的确定方法
statistics
2012 第 24 页
第三节 抽样误差
1. 总体标志变异程度。——正比关系 2. 抽样单位数目的多少。——反比关系 不同的抽样方法,一般讲不重复抽样好些。 不同的抽样组织形式,一般讲等距、类 型抽样比简单随机和整群抽样好些。 二、抽样误差的计算 1、样本平均数标准(平均)误差 重复抽样:

认识:
某市在12万名大学生中抽出1000人进行消费结构调查。 总体:12万名大学生就是调查。 样本:被抽到的1000名大学生。
statistics
2012
第 6页
第一节 抽样推断概述
总体指标和样本指标

总体指标:由全及总体各个单位的标志值或标志特征计算的,反映总体某种 属性的综合指标。又称(母体)参数。
statistics
第一节 抽样推断概述
变量样本的总体指标有平均数:
x x1 x2 xn n
p n1 n
属性样本的总体指标有成数:
样本方差或标准差:
S
2
(x
x 2) n
S 2 p( 1 p)
样本容量和样本个数:

样本容量:指样本中的单位个数。 样本个数:指在一定总体中可能抽取的样本组合的个数。
statistics
2012 第 5页
二、抽样推断的作用
第一节 抽样推断概述
三、 抽样调查的基本概念
总体和样本
总体:所要研究对象的全体。 它由某些具有共同性质或特征的个体或单位组成。同 时,各单位的数量表现又存在差异。一般用“ N ”表示。 分:属性总体和变量总体。 样本:从总体按一定程序抽取的个体或单元组合。 一般用“ n ”表示。 N大 于30叫大样本;小于30叫做小样本。
X X1 X 2 X N N
P N1 N
变量总体的总体指标有平均数:
属性总体的总体指标有成数: 总体方差或标准差:

2
( X )
N
2
F
2 P( 1 P)

样本指标:由样本各个单位的标志值或标志特征计算的,反映样本某种属性的 综合指标。
2012 第 7页
抽选 方法:
在1到k之间抽取一个随机起点r,则被抽中单元的顺序位置是:r,
r+k,r+2k,…。当N不能被n整除时,采用圆形系统抽样方法。
statistics
2012
第 15 页
第二节 抽样调查的组织方式和抽样方法
举例:
某企业对购进的10000台电视机的质量进行调查,计划抽 取400台作为样本调查,总体编号为1-10000。
2
10 10
10 15
-20 -15
10 10 10 10
(4)每群的数量可等可不等,而且抽样方法方便。
statistics
2012
第 19 页
第二节 抽样调查的组织方式和抽样方法
优点: 简单、方便,易于组织,能节省人力、物力、 财力和时间, 缺点: 限制了样本在总体中分配的均匀性,同样数量情况下,误差比 其它抽样方法大。
statistics
2012
ห้องสมุดไป่ตู้
第 20 页

不受主观因素及系统因素影响,机会均等 说明: 1、抽样调查是一种科学的非全面调查。 2、抽样调查必须按照随机原则来抽取被调查单位。
statistics
2012 第 3页
第一节 抽样推断概述
一、抽样调查的特点
1、目的是由部分推断整体。(与全面调查;重点、典型 调查不同) 2、建立在随机抽样的基础之上。(等可能性原则,通过部 分认识总体) 3、抽样推断运用概率估计方法;误差可事先计算且能估计。 以样本推断总体,必然存在误差,但这种误差是可以计算并 加以控制的,可以调整其它一些因素进行控制(与典型调查不 同)
n CN
N ( N 1)....( N n 1) N! n! n!( N n)!

不考虑顺序的重复抽样:
n DN C nnN 1
statistics
2012
第 23 页
第三节 抽样误差
一、抽样误差的概念及其影响程度 在统计调查中,调查资料与实际情况不一致,两者的偏离称为统计误差。
性质: 方法:
抽签法给总体各单位编号后,把号码写在结构均匀的字签上,将字签混合 均匀后即可从中抽取。
statistics
2012 第 9页
第二节 抽样调查的组织方式和抽样方法
随机数法 利用随机数表进行抽样的方法。
应用:
仅适用于规模不大、内部各单位标志值差异较小的总体
优点: (1)简单、直观比较容易理解和掌握; (2)抽样框不需要其他辅助信息; (3)理论上比较成熟,有现成的方差估计公式。 缺点: (1)对样本编号困难; (2)样本分散,费用较高; (3)总体方差大时,样本代表性差; (4)有些情况不能使用,如连续生产质检。
x
或 x ( x X )2 n ( x X )2 f f
x
或 x
第 25 页

n

2
n
statistics
2012
第三节 抽样误差
抽取样本
样本平均数 x 误差 x X
x X
400 225
2
抽取样本
样本平均数 x
误差 x X
x X
25 100 25 0
的抽选。
不重复抽样:是指每次从总体中抽取一个单位记录其标志表现后不再放回,
从剩余的单位中抽取下一个单位。 考虑顺序抽样:即从总体的单位中抽取 个单位构成样本,不但考虑样本各 单位的不同性质,而且还要考虑不同性质各单位的中选顺序。
不考虑顺序抽样:即从总体的单位中抽取
个单位构成样本,只考虑样本构成
i
statistics
2012
为第i层的标准差
第 13 页
第二节 抽样调查的组织方式和抽样方法
优点: 1)在调查中不仅可对总体进行参数估计,还可对层的参数进行估计。 2)使样本更具代表性。 3)对不同层可以按照不同情况和条件,具体采用不同的抽样方法。 4)分层抽样可以提高估计量的精度 缺点: 1)对抽样框的要求比较高,必须有分层的辅助信息; 2)估计值的计算比简单随机抽样复杂
缺点:
会得一个差的样本;
(2)要知道有关材料,如排序标志; (3)没有一个无偏的方差估计量;误差计算复杂。 国家统计局的调查多采用系统抽样,它便于操作。
statistics
2012 第 17 页
第二节 抽样调查的组织方式和抽样方法
4、整群抽样 将总体全部单位分为若干“群”,然后随机抽取一部分群”,被抽中群体的 所有单位进行全面调查的抽样组织方式。
认识: 在100个学生中抽取10个样本,则样本容量和样本个数分别是多少?
2012 第 8页
statistics
第二节 抽样调查的组织方式和抽样方法
一、抽样的组织方式 在随机原则下,根据需要可以有不同的方式。
1、简单随机抽样 简单随机抽样(SRS)按照随机原则,从总体中不加任何分组、划类、排序, 直接地抽取调查样本。如果抽样是有放回的,则称非常简单随机抽样(VSRS ) 用不重复抽样方法,按随机原则从N个单位中抽取n个单位组 成样本。则其样本数目 抽签法或随机数法
组织问题
登记误差 系统性误差 统计误差 代表性误差 实际误差 随机误差 抽样平均误差
1、抽样误差也叫随机误差,指样本指标和总体指标之差。是抽样调查固有的误 差,是无法避免的。但可以运用数理统计定理预先控制的。 2、抽样误差的影响因素:
第二节 抽样调查的组织方式和抽样方法
5、阶段抽样 先抽大的调查单位,再抽取小的调查单位,直到获得能推断总体资料的基 本单位为止的抽样方式。
示意图:
第一阶样本 最终样本
总体
statistics
2012
第 21 页
第二节 抽样调查的组织方式和抽样方法
二、抽样方法和样本可能数量 抽样方法
重复抽样:是指每次抽取一个单位记录其标志表现后又放回,重新参加下一次
相关文档
最新文档