第六章系统抽样
统计学第六章抽样调查
缺点
由于采用了多种抽样方法,可能导致样本分 布的复杂性增加;需要较高的专业知识和技
能,否则可能导致抽样误差的增大。
实例:多阶段混合抽样应用
要点一
实例一
要点二
实例二
在市场调研中,可以采用多阶段混合抽样技术。首先,根 据地理区域或行业特点进行分层抽样,然后在各层内采用 简单随机抽样或概率比例抽样等方法抽取样本。
统计学第六章抽样调 查
• 抽样调查基本概念与原理 • 简单随机抽样技术 • 分层抽样技术 • 整群抽样技术 • 系统抽样技术 • 多阶段混合抽样技术
目录
Part
01
抽样调查基本概念与原理
抽样调查定义及特点
抽样调查定义
抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进 行调查,并据以对全部调查研究对象做出估计和推断的一种调查方法。
Part
02
简单随机抽样技术
简单随机抽样原理及步骤
编制抽样框
确定总体范围
明确研究对象的总体范围,包括 时间、空间、人群等方面的界定。
将总体中所有单位按照一定顺序 排列,形成抽样框。
确定样本量
根据研究目的、总体规模和精度 要求等因素,确定合适的样本量。
高中数学知识点:系统抽样
高中数学知识点:系统抽样
1、系统抽样的概念:
当总体中的个体比较多时,将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分中抽取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样,也称作等距抽样.
2、系统抽样的特征:
(1)当总体容量N较大时,采用系统抽样;
(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样;
(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号.
3、系统抽样的一般步骤:
(1)采用随机的方法将总体中的N个个体编号;
(2)将编号按间隔k分段,当N
n 是整数时,取N
k
n
=,当
N
n
不是整
数时,从总体中剔除一些个体,使剩下的总体中个体的个数'N能被n 整除,这时取'N
k
n
=,并将剩下的总体重新编号;
(3)在第一段用简单随机抽样确定起始个体的编号()
l l N l k
∈≤
,;
(4)按照一定的规则抽取样本,通常是将编号为
2(1)
l l k l k l n k
+++-
,,,,的个体取出.
要点诠释:
1、从系统抽样的步骤可以看出,系统抽样是把一个问题划分成
若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想.
2、系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段中进行抽样时,采用的是简单随机抽样.
抽样技术第6章_系统抽样
精度比较
简单随机抽样估计量的方差与分层(一列 为层)随机抽样的方差结果分别为16.6176 与10.1344. 由于系统抽样(群)内方差小于总体方差, 因此系统抽样的效果不如简单随机抽样, 更不如分层随机抽样。
(2)随机排列
总体单元按随机顺序重新排列后行列平均数与方差
1 1 2 3 4 5 层平均 层内方差 39 19 30 12 25 25.0 106.5 2 28 18 36 39 48 33.8 129.2 3 40 29 33 44 28 34.8 48.7 4 36 26 52 28 24 33.2 131.2 5 29 46 50 34 29 37.6 96.3 群平均 群内方 差 34.4 27.6 40.2 31.4 30.8 32.88 102.38 103.86 31.3 127.3 102.2 152.8 96.7
13
四.等距抽样的特点 (1)将总体各单元按一定的顺序排列后再抽样, 使得样本单元的分布更加均匀,因而样本也就更 具代表性,比简单随机抽样更精确,在某些场合 下甚至可以不用抽样框。 (2)等距抽样简单明了,快速经济,操作灵活 方便,使用面广,是单阶段抽样中变化最多的一 种抽样技术。
14
(3)当N=nk时,等距抽样就等同于每层只抽一 个单元的分层抽样或群的大小相等时只抽一个群 的整群抽样。 (4)等距抽样的样本常被视为一个集体单元, 一般不计算样本调查变量的方差,所以它只能抽 象地进行理论分析,而不能对抽样方差进行估计。
第六章抽样案例
样本评估实例
1 用小学生中独生子女的比重这一指标来衡量。在现有 资料,有两个结果与本研究所抽取的小学生样本口径一 致成或相似,可用作比较的参考对象。
2 章永生1989年对北京两所小学1-6年级12个班及三所 中学18个班的调查结果,独生子女在小学生中的比重为 51.9%,非独生子女比重为48.1%,而在风笑天研究的小 学生样本中,二者的比重分别为56.9%和43.1%,相差不 大。
参数值/总体值
——是关于总体中某一变量的综合描述,或者说 是总体中所有元素的某种特征的综合数量表现。 例如:全国妇女平均受教育年限
参数值只有通过总体的每一个元素都进行调查 或测量才到。
统计值/样本值
——是关于调查样本中的某一变量的综合描述。
是从样本中计算出来的 是作为总体值的估计值 例如:从一个样本中得到的妇女平均受教育年限。
第四章 抽样
置信水平与置信区间
(1)置信水平(Confidence Level) 也称置信度,指的是总体参数值落在样本统计值某一区间内的 概率。
(2)置信区间(Confidence Interval) 是指在一定范围的置信水平下,样本统计值与总体参数值之间 的误差范围
(3)置信水平与置信区间的关系
抽样技术第6章_系统抽样
解:已给出 Y 32.88, S 2 103.86 (1)自然排列(上表) 5个可能系统样本的均值分别为
y1 22.4, y2 30.0, y3 32.4, y4 38.4, y5 41.2
根据方差定义,
1 V ( ysy ) 5
1 ( yr Y ) [ yr2 5Y 2 ] 5 r 1 r 1
1 n y r y rj , r 1, , k n j1
假设起始值为r,则系统抽样时,总体均值的估计量为:
1 y sy y r n
j 1
n
1 yrj n
Y
j 1
n
rj
Yr
性质 : E ( ysy ) Y
估计量的方差 如前所述,如果总体单元是按无关标志排列 的,则其方差可按简单随机抽样去做。若总体单 元是按有关标志排列的,则此时的等距抽样可以 看作是整群抽样或分层抽样的特例,因此,等距 抽样估计量的方差可以比照整群抽样或分层抽样 的方法构造,有几种表示方法:
E ( yrj y. j )( yru y.u ) E ( yrj y. j )2
r 1 j u
k
n
( yrj y. j )( yru y.u )
2 Swst
是等距样本内单位对关于层平均值的相关系数。
24
第六章 系统抽样
系统抽样设计效应
比较简单随机抽样和系统抽样(等概率情形)的 方差
N 1 2 k (n 1) 2 1 f 2 V ysy V y sys S S wsy S N N n N nk n 1 2 ( S 2 Swsy ) n
若使系统抽样的方差小于简单随机抽样的方差,则应满 足条件:
注:第一个样本点随机,其余不是随机的 ——类似整群抽样?
系统抽样的特点
优点:
简便易行 使样本单元在总体中分布均匀 应用广泛 缺点: 样本量有时不唯一
系统抽样定义
定义6.1:设总体中的 N 个单元按某种顺 序排列,编号为1,2,…,N。抽样程序是 首先抽取一个或一组起始单元的编号,然 后按某种确定的规则选取其他单元的编号, 直到满 n 个为止。
n
n
•总体总值的估计量
ˆ Y Nysy nkysy
均值估计量的方差I
y sy
是
Y
的U.E. ,估计量的方差为
2 1 k V y sy y r Y k r 1 N 1 2 k ( n 1) 2 S S wsy N N
其中:
S 为总体方差,S 为“系统样本”群内方差
等距系统抽样
定义6.2:系统抽样中抽样规则是按照固定 间隔 k 选取其他单元的编号,直到满 n 个 为止,简称等距抽样。
第6章 系统抽样
Systematic sampling
第一节 概述
一 什么是系统抽样
总体中的N个单元按一定顺序排列, 抽取一个起始单元, 按某种规则选取其它单元直到满n个为止
等距抽样:按照固定的间隔选取
(一)直线等距抽样:
总体中的N个单元已按某种确定顺序编号 为 1,2,, N , N nk 。先从头K个单元编号中 随机抽出一个单元编号,然后每隔K个单元 编号抽出一个单元编号, 直到抽出n个单元 编号为止。
E( ysy ) 0.4( y1 ) 0.3( y2 ) 0.3( y3 ) Y
(3) 修正估计量
k y' N
y
n
i
E( y ' ) Y
3 y1 ' (Y1 Y 4 Y 7 Y10 ) 10
3 y2 ' (Y 2 Y5 Y8 ) 10
3 y3 ' (Y3 Y6 Y9 ) 10
2 K ( n 1) S wsy
2 ( y y ) rj r 代入(1)式
k
n
便有
( N 1) S nKV ( y sy ) K ( n 1) S
2
2 wsy
( N 1) S K ( n 1) 2 得: V ( y sy ) S wsy N N
《概率论与数理统计》第六章样本及抽样分析
第六章 样本及抽样分析
抽样分布
(二)t-分布 X ~ N (0,1), Y ~ 2(n), X , Y 相互独立,
则称随机变量
T X Y /n
服从自由度为 n 的 t-分布 T ~ t(n)。
第六章 样本及抽样分析
抽样分布
性质:
•对称性: t1 (n) t (n)
• n →∞,密度函数趋 向标准正态分布;
Xi
X
2
n i 1
Xi
X
1
n i 1
Xi
nX 0
只有 n—1 个独立的 随机变量
n i 1
Xi
X
2
~
2(n
1)
第六章 样本及抽样分析
正态总体统计量的分布
X n ~ t(n 1)
S
X
t1 (n) t (n)
第六章 样本及抽样分析
正态总体统计量的分布
X1, X2 ,, Xn来自正态总体 N (, 2 ) 的样本,其样 本均值和样本方差
X
1 n
n i 1
Xi,
S2
1 n1
n i 1
(Xi
X )2
第六章 抽样调查作业 参考答案
第六章抽样调查参考答案
一、选择题(1个或者多个答案)
1、对于抽样调查,下面说法正确的是 ABCD
A 非全面调查
B 用样本特征推断总体特征
C 抽样遵循随机原则
D 一定会产生误差,但可以计算和控制
E 一定会产生误差,但是可以完全消除
2、描述总体的最基本特征一般采用 CD
A 总量指标
B 强度相对指标
C 平均指标
D 标准差
E 数量指标
3、一般来说,抽样调查中根据所研究的问题特点,将总体分为 AB
A 属性总体
B 变量总体
C 全及总体
D 抽样总体
4、下列说法正确的是 AD
A 全及指标是未知的,但却是确定的
B 全及指标是未知的,因此是不确定的
C 样本指标是已知的,因此是确定的
D 样本指标是已知的,但却是不确定的
E 全及指标和样本指标是否确定,依据情况而定
5、确定抽样单位数的依据有 ACD
A 总体标志的变动程度
B 样本容量
C 抽样方式
D 推断的可靠程度和精度 E样本可能数目
6、当总体方差未知时,估计总体方差的方法有 ABCD
A 历史资料的方差
B 样本方差
C 预估资料的方差
D 小规模调查资料的方差
7、抽样调查可能存在 ABCDE
A 登记性误差
B 偏差
C 代表性误差
D 偶然性误差
E 随机误差
8、下列说法错误的是 BE
A 普查中不存在代表性误差
B 抽样调查可以完全控制误差
C 抽样调查一定存在误差
D 理论上登记性误差是可以完全消除的
E 普查一定比抽样调查要精确
9、影响抽样平均误差的因素有 BCDE
A 样本内单位的差异程度
B 全及总体内单位的差异程度
C 样本单位数的多少
D 抽样的方式
E 抽样的组织形式
二、计算题
抽样调查第6章 整群抽样与系统抽样
基本单元 群(初级单元)
住宅 城市居民 离开的旅客
学生
街区 住宅区 航班
班级
成年村民
村
土地所有者 分类台帐页
目标量的估计
将整群抽样看作二阶抽样的特例
定理6.1 对简单随机抽样的整群抽样,总体总数Y的估
计有
(1)Y的无偏估计为YˆCSE
(2)YˆCSE的均方偏差为
K k
k i 1
Ni
Yi j
j 1
YˆCP
P
S
2
j 1
也可将整群抽样看作单阶抽样,同样可以得到上述 两个定理
目标量的估计
例1 在一次针对某城市大学生月生活费支出的调查中, 以小组为群进行整群抽样。每个小组有8名大学生, 采用简单随机抽样在510个组中抽取12个小组,全部 96个样本大学生月生活费支出数据如表.试估计该城市 大学生人均月生活费及其95%的置信区间.
C =1
N N 1
S内2 S2
1
S内2 S2
一般有S内2 S 2,所以 C介于0,1之间
群内相关系数方便计算的另一表达式
K Ni
2
K
(Yij Y )
Ni
(Yij Y )2
Hale Waihona Puke Baidui1 j1
C
K
i1 j1
Ni
(Ni 1) (Yij Y )2
应用统计学 第六章 抽样及抽样分布.
应用统计学
卡方分布性质的验证
2019年8月6日星期二4时44分52秒
第六章 抽样与抽样分布
应用统计学
2019年8月6日星期二4时44分52秒
1.样本均值之差的抽样 分布
2.样本比例之差的抽样 分布
3.样本方差比的抽样分 布
第六章 抽样与抽样分布
( x1 x2 )
N
1
2
,
2 1
方便调查的实施 缺点是估计的精度较差
应用统计学
2019年8月6日星期二4时44分52秒
第六章 抽样与抽样分布
应用统计学
2019年8月6日星期二4时44分52秒
1.总体分布 2.样本分布 3.抽样分布
第六章 抽样与抽样分布 分布通常是未知的
应用统计学
2019年8月6日星期二4时44分52秒
应用统计学
中心极限定理的验证
2019年8月6日星期二4时44分52秒
第六章 抽样与抽样分布
1.样本均值的抽样分 布
2.样本比例的抽样分 布
3.样本方差的抽样分 布
总体分布
非正态分布
大样本
小样本
样本均值 正态分布
样本均值 非正态分布
正态分布
样本均值 正态分布
应用统计学
2019年8月6日星期二4时44分52秒
高中数学系统抽样教案
高中数学系统抽样教案
教学目标:
1. 理解系统抽样的概念和原理。
2. 掌握系统抽样的方法和步骤。
3. 能够运用系统抽样进行统计调查。
教学重点:
1. 理解系统抽样的概念和方法。
2. 掌握系统抽样的步骤。
教学难点:
1. 理解系统抽样和随机抽样的区别。
2. 运用系统抽样进行具体问题的解决。
教学准备:
1. 讲义、课件、黑板、彩色笔。
2. 学生配备纸和笔。
教学过程:
一、导入
老师简要介绍抽样的概念和在统计学中的应用,引入系统抽样的概念。
二、讲解
1. 介绍系统抽样的定义和原理。
2. 分析系统抽样与随机抽样的区别。
3. 详细讲解系统抽样的步骤和方法。
三、实例分析
老师通过实际例子演示系统抽样的具体操作过程,让学生理解系统抽样的实际应用。
四、练习
1. 学生自行完成一道系统抽样的练习题。
2. 老师随机抽取几位学生上台解答,帮助学生加深对系统抽样的理解。
五、总结
老师对系统抽样的概念、原理、步骤进行总结,并强调学生掌握系统抽样方法的重要性。
六、作业
布置系统抽样的作业,要求学生能够独立完成相关问题,并在下节课上交。
教学反思:
系统抽样是统计学中常用的一种抽样方法,它能够在一定程度上减少抽样误差,提高统计结果的准确性。在教学中,要注重让学生理解系统抽样的原理和方法,引导他们能够熟练运用系统抽样进行实际问题的解决。
系统抽样_精品文档
系统抽样
一、引言
在统计学中,抽样是一种常用的数据收集方法,通过从总体中选择部分样本进行观察和分析,从而推断总体的特征和属性。系统抽样是抽样方法中的一种重要方式,它基于一个系统性的策略,按照一定的规则从总体中选择样本,以确保样本能够代表整体。本文将深入探讨系统抽样的原理、应用、优缺点以及如何进行样本量确定等相关内容。
二、系统抽样的原理
系统抽样的原理是基于总体的有序结构,通过选择一个起始点,然后按照固定的间隔选取样本。这个间隔通常用总体容量除以样本容量来计算,以保证选取的样本能够均匀地分布在总体中。例如,若总体容量为N,样本容量为n,则每隔N/n个元素选取一个样本。
三、系统抽样的应用
系统抽样广泛应用于各个领域,特别适用于大规模的调查和研究。以下是系统抽样的几个典型应用:
1. 民意调查:在政治选举、市场调研等方面,使用系统抽样可以有效地代表总体,从而推断出人们对候选人或产品的态度和偏好。
2. 质量控制:在生产过程中,可以使用系统抽样来检验产品质量是否符合标准,通过取样检查可以发现潜在的问题并进行修正。
3. 教育评估:在教育领域中,使用系统抽样可以评估学生对知识和技能的掌握程度,从而改进教学方法和提供个性化的教育支持。
4. 医学研究:在医学研究中,系统抽样可以帮助研究人员选择适当的样本,以研究特定疾病或治疗方法的有效性。
四、系统抽样的优缺点
1. 优点:
(1)代表性:系统抽样可以确保样本从总体中均匀地抽取,从而更好地代表总体的特征。
(2)效率高:相对于简单随机抽样,系统抽样在样本容量相同时,能够提供更精确的结果。
统计学第六章抽样法
3
实例三
某社会科学研究机构想要了解某地区居 民对某项政策的支持程度,计划通过抽 样调查的方式收集数据。根据研究的精 度要求和总体的离散程度,以及考虑到 可用的资源和时间限制,最终确定样本 量为800个。
感谢您的观看
THANKS
等距抽样
系统抽样中最常用的一种方法,它是按照某 种顺序给总体中的各个体编号,然后随机地 抽取一个编号作为第一调查个体,其他的调 查个体则按照某种确定的规则“系统地”抽 取出来。
周期性
系统抽样中,样本的抽取具有周期性,即每 隔一定的间隔就抽取一个样本。
随机起点
系统抽样的起点是随机选择的,以消除任何 可能的模式或偏见。
样本量确定实例分析
1
实例一
某市场调查公司想要了解消费者对某款 新产品的接受程度,计划通过抽样调查 的方式收集数据。根据历史经验和允许 的误差范围,初步确定样本量为500个。
2
实例二
某医学研究机构想要研究某种新药物对 某种疾病的治疗效果,计划通过临床试 验的方式收集数据。根据置信水平和置 信区间的要求,以及考虑到患者的异质 性和脱落情况,最终确定样本量为1000 个。
统计学第六章抽样法
目录
• 抽样法基本概念与原理 • 简单随机抽样 • 系统抽样 • 分层抽样 • 整群抽样 • 多阶段抽样 • 抽样误差与样本量确定
01
抽样法基本概念与原理
6-2 第六章 抽 样(习题解答)
第六章抽样
一、辨析题
1、一般来说,任意抽样技术适用于正式的实际调查。
错误。适用于非正式的探测性调查,或调查前的准备工作。
2、一般说来,总体中各单位之间标志值的变异程度越大,需要抽样的样本数目越多;反之,需要抽样的样本数目越少。
正确
3、分层最佳抽样法指的是等比例分层抽样。
错误。这是非比例分层抽样。
4、一般而言,抽样的样本占总体的比例同抽样误差成反向关系,即抽样比例越大,抽样误差相对越小。
正确
5、抽样误差是随机抽样调查中必然发生的代表性误差,所以平均误差是不可避免的。而且,这种误差一般包括了技术性误差,即调查工作中的误差。
错误。这种误差一般不包括技术性误差即调查工作中的误差。
6、总体单位之间标志变异程度越大,抽样误差越大;反之则越
小。
正确
7、样本单位数目越多,抽样误差越大,反之则越小。
错误。样本单位数目越多,抽样误差越小,反之则大。
8、一般来说,简单随机抽样比分层、分群抽样误差大,不重复抽样比重复抽样误差大。
错误。重复抽样比不重复抽样误差大。
9、点值估计是考虑了抽样误差,直接以样本指标作为总体指标的估计值,作近似的估计。
错误,不考虑抽样误差。
二、名词解释
1、抽样调查
抽样调查也称为抽查,是指从调查总体中抽选出一部分要素作为样本,对样本进行调查,并根据抽样所得的结果推断总体的一种专门性的调查活动。
2、抽样
抽样是指在抽样调查时采用一定的方法,抽选具有代表性的样本,以及各种抽样操作技巧和工作程序等的总称。
3、随机抽样
随机抽样又称为概率抽样或机率抽样,是对总体中每一个体都给予平等的抽取机会的抽样技术。在随机抽样的条件下,每个个体抽中或抽不中完全凭机遇,
第六章系统抽样
• 总体单位排序与其标志值的大小有某种周期性的关系。
对某个商场的日销售额进行系统抽样时,设抽样距离为7天,样本日销售 额正好都是星期天。 在直线系统抽样(线性系统抽样)应注意避免抽样的规律与现象变动的周 期一致。
• 总体单位排序有线性趋势
总体呈现这种“线性趋势”(“单调上升或下降趋势”) 可以证明:其抽样估值精度虽优于简单随机抽样,但劣于分层随机抽样。 其原因在于对有线性趋势的总体,采用直线系统抽样法 采用中心位置的系统抽样法或对称的系统抽样法,可以大大地改善系统抽 样法的估值精度。
2
பைடு நூலகம்
7
12
17
2
3 4 5
3
4 5 6
7
8 9 10
8
9 10 11
12
13 14 15
13
14 15 17
17
18 19 20
19
19 20 20
解: 抽取的样本编号为: 2号, 7号, 14号,19号。 1 46 y (3 8 15 20) 4 4
例如:某学院要共200个学生,要抽10个学生做样本。怎么 进行直线等距抽样?
(二)循环等距抽样
• 当N不是n的整数倍,即抽样间距k=N/n不是整数 时,应采取什么方法? • 总体有21个单元,拟抽取n=4,怎么抽取样本? • D.B.拉希里(D.B.Lahiri) 于1952年提出了一种 改进的系统抽样法——循环系统抽样。 • 将总体N个单位的排序看作为一个首尾相连的圆圈, 取最接近N/n 的整数为k , 在总体N个单位中随机 地抽取一个单位为随机起点i,沿圆圈按顺时针方 向每隔k 个单位抽取一个单位,直到抽出n个单位 为止。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
四.估计量
设系统抽样的随机起点值为r,则其相应系统样本的均值为:
1 n 1 n y sy yrj Yrj n j 1 n j 1
为总体均值 Y 的估计量。 当N=n k时,可以证明这个估计量是无偏的。
E y sy
1 k 1 yr k r 1 nk
y
r 1 j 1
k
n
rj
Y
系统抽样与整群抽样和分层抽样的关系
• 特殊的整群抽样 • 特殊的分层抽样
五、问题的改进(1) • 当总体呈线性趋势时,样本观测值可能会偏低或偏高,产生 “趋向性的偏差”,对此统计学家们采用了很多方法来弥补这一 不足。 • (一)首尾校正法(1948年 耶茨《皇家学会会刊》发表名为《系统抽样》
目录 一、系统抽样的基本思想 二、系统抽样的基本方式
直线等距抽样 循环等距抽样 不等概率系统抽样
三、总体单元的排序 四、问题的改进
首尾校正法 中心位置抽样法 对称系统抽样法
问题的提出
• 各种抽样方法都有优点和不足 • 难题:在一个连续的生产线上进行产品质 量抽样检查。 • 设计:在开始的时候先抽取一个样本点, 然后按照某种规律顺次得到整个样本的一 种抽样组织方式。 • 系统抽样:等距抽样,机械抽样,规律性 抽样
• 总体单位排序与其标志值的大小有某种周期性的关系。
对某个商场的日销售额进行系统抽样时,设抽样距离为7天,样本日销售 额正好都是星期天。 在直线系统抽样(线性系统抽样)应注意避免抽样的规律与现象变动的周 期一致。
• 总体单位排序有线性趋势
总体呈现这种“线性趋势”(“单调上升或下降趋势”) 可以证明:其抽样估值精度虽优于简单随机抽样,但劣于分层随机抽样。 其原因在于对有线性趋势的总体,采用直线系统抽样法 采用中心位置的系统抽样法或对称的系统抽样法,可以大大地改善系统抽 样法的估值精度。
2
7
12
17
2
3 4 5
3
4 5 6
7
8 9 10
8
9 10 11
12
13 14 15
13
14 15 17
17
18 19 20
19
19 20 20
解: 抽取的样本编号为: 2号, 7号, 14号,19号。 1 46 y (3 8 15 20) 4 4
的文章提出。)
假设总体单元数为N,样本容量为n, N是n的整数倍。 抽取 r,r+k,r+2k,…,r+(n-1)k,这n个单元为样本,每单元的权重 都1/n,改变第一个单元和第n个单元的权重
第一个单元 r 的权重 n 2r k 1 1+ 2 n 1 k n 2r k 1 12 n 1 k
9
9
10
17
18
19
19
26
27
25
26
解: 抽取的样本编号为: 5号, 14号, 23号。 1 44 y (6 15 23) 3 3
问题的改进(3)
• 对称系统抽样法 N/n=k • (1)Sethi对称系统抽样
将总体分成 n/2 (n为偶数时)组,每组有2k个单元,在组内对 称。 • (2)Singn对称系统抽样 • 总体对称
例子:用Sethi对称系统抽样,从20个学生中,抽取四个学 生,并且求他们的平均零花钱。设随机数为2
样本 编号 1 Y 样本 编号 6 Y 样本 编号 11 Y 样本 编号 16 Y
2
7
12
17
2
3 4 5
3
4 5 6
7
8 9 10
8
9 10 11
12
13 14 15
13
14 15 17
17
18 19 20
(一)直线等距抽样(线性系统抽样)
假设总体单元数为N,样本容量为n, N是n的整数倍。 首先计算抽样间距 k=N/n, 把总体分为n段,每段k个 单元,然后,在第一段的k个单元中随机抽取一个单元, 假设为r,然后每隔k个单元抽取一个单元,即抽取 r,r+k,r+2k,…,r+(n-1)k,这n个单元为样本。 抽样模型为: r + (j-1)k (j = 1,2,„,n; r为随机数)
一、系统抽样的基本思想
对于一个容量为N的总体,首先,将总 体中各单位按某种顺序编为从1到A 的号 码。若要从中抽出一个容量为n的样本, 则应先从编号为1到k(k<N)的k个单位中, 随机地抽取一个单位,然后,按照一定 的规律,如每隔k个单位抽出一个单位等, 顺次地抽出n个样本单位。
• 优点: 样本分布比较均匀,在现实生活中比较容易接受 样本单位抽取简便,有很高适用价值
例如:某学院要共200个学生,要抽10个学生做样本。怎么 进行直线等距抽样?
(二)循环等距抽样
• 当N不是n的整数倍,即抽样间距k=N/n不是整数 时,应采取什么方法? • 总体有21个单元,拟抽取n=4,怎么抽取样本? • D.B.拉希里(D.B.Lahiri) 于1952年提出了一种 改进的系统抽样法——循环系统抽样。 • 将总体N个单位的排序看作为一个首尾相连的圆圈, 取最接近N/n 的整数为k , 在总体N个单位中随机 地抽取一个单位为随机起点i,沿圆圈按顺时针方 向每隔k 个单位抽取一个单位,直到抽出n个单位 为止。
• 工业企业为检查产品质量,在连续生产线上每隔2 小时抽选一个或若干个样品进行检验;农作物产量 实测或对农作物害虫进行调查,对一大片农田每隔 一定距离抽取一块进行测量或调查等等,都是系统 抽样的直观案例。
系统抽样的特点
优点:简便易行,简化抽样手续。 简便易行,容易确定抽样单元。其他抽样方法在抽取样本前需 要对总体单元编号,然后再利用随机数表等方法进行抽取样本。 而系统抽样,只需要总体单元的顺序排列,只要随机确定初始 单元。 整个样本就确定了,在某些场合甚至不用编制抽样框。比如要 对杭州市区的机动车辆进行调查,抽样比为1%,则可以在尾 数00~99中随机抽取一个整数,比如是63,则只需对车辆牌 照号末位为63的号进行调查。容易为非专业人员掌握。而且容 易保存抽样的原始记录。 缺点:如果单元的排列存在周期性的变化,而抽样者对此缺乏 了解或处理经验,抽取的样本可能代表性很差。系统抽样的方 差很复杂,对估计带来很大困难。
二、系统抽样的基本方式
系统抽样与其他抽样方法所不同的一个最 显著的特点,就是系统抽样只需要抽取一个 样本单位,然后按照某种规律,顺次地得到 整个样本。 “某种规律”,就是指样本单位抽取的一种 事先的规定和安排。在此基础上,系统抽样 又可以划分为若干种具体的系统抽样方法。 其中,线性系统抽样是一种最基本的方法 。
• 例子:27个学生抽取3个学生做样本,用中心位置抽样 法,求学生的平均零花钱。
样本编号 1 Y 2 样本编号 10 Y 11 样本编号 19 Y 20
2
Hale Waihona Puke Baidu3 4
3
4 5
11
12 13
12
13 14
20
21 22
20
21 22
5
6 7
6
7 8
14
15 16
15
17 17
23
24 25
23
25 25
8
N=21,n=4,取 k=5。 设随机起点为 i=3,则应 抽取的样本单位编号依次 为:3,8,13,18, 如下图所示, ○表示随机起点,□表示 所抽中的其它样本单位。
三 总体单元的排序
• 按无关标志排序(总体单位随机排序)
o 各单元的排序顺序与所研究的内容无关。 o 要调查学生的视力情况,按学号顺序排列。要调查职工平均年龄, 按职工姓氏笔画排列。 o 无序系统排列
第一个单元 r ( n 1) k 的权重
问题的改进(2) • 中心位置抽样法(麦多 1953年《数理统计年刊》发表 《论系统抽样的理论III:中心起点与随机起点系统抽样 的比较》) • 论文提出:当总体为单调上升趋势时,中心系统抽样法 优于随机起点系统抽样法(直线系统抽样法)。 • 初始样本不是随机产生,取第一段的中间位置。
• 按有关标志排列
o 各单元的排序顺序与所研究的内容有关。 o 要调查学生的平均身高,按照学生入学时体检的身高顺序排列。 要对农产品产量进行调查,按当年的估产或前几年的实产由高到 低排列。这样称为有序系统抽样
• 处于两者之间 工厂中的工人名单按原有的工资名册顺 序排列。主要是为了调查方便。
排序可能出现的问题
• 总体各单位按某种“负相关”的趋势排列
分为两种情况:一种是总体各单位的标志值奇数层顺排 列而偶数层反排列;另一种是总体中上一半单位的标志 值顺排列而下一半单位的标志值反排列。 这种负相关趋势排列的情况下,线性系统抽样法的估值 精度最高。
• 对线性趋势总体下的系统抽样或称为有序排列 下的系统抽样的研究是十分重要的。
19
19 20 20
解: 抽取的样本编号为: 2号, 9号, 12号,19号。 1 46 y (3 10 13 20) 4 4
例子:用singn对称系统抽样,从20个学生中,抽取四个学 生,并且求他们的平均零花钱。设随机数为2
样本 编号 1 Y 样本 编号 6 Y 样本 编号 11 Y 样本 编号 16 Y