(抽样检验)第七章整群抽样最全版
抽样技术第七章整群抽样ppt课件
11
三、群内相关系数与设计效应
群内相关系数
c
E(Yij Y E(Yij
)(Yik Y Y )2
)
上式中的分子为
NM
(Yij Y )(Yik Y )
i1 jk
NM (M 1) 2
12
上式中的分母为
NM
i1
(Yij Y )2
j 1
NM
1S2
1N
1N
Y
M0
i1
Yij
j 1
M0
Yi
i1
M0
M iYi
i1
21
二、按简单随机抽样抽群
1.简单估计 2.比估计 3.总体比例的估计
22
1.简单估计
在大多数情形,群大小Mi是不相等的。此时,若Mi 相差不多,则仍可按§7.2中的方法处理,用平均群
大 则小这种M方法N1精iN1度M较i 差代。替M。反之,若Mi相差较多,
n
1 n
n 1 i1
yi y 2
1 f nM
sb2
其中f=n/N为抽样比。可见,sb2 是Sb2的无偏估计。
8
当n足够大时,总体均值Y 的置信度为1−α的置信区 间为:
y u 2s y
例7.1 在一次某城市居民小区居民食品消费量调查 中,以每个楼层(相当于居民小组)为群进行整群抽 样。每个楼层都有M=8个住户。用简单随机抽样在 全部N=510个楼层中抽取n=12个楼层。全部96个 样本户人均月食品消费额yij及按楼层的平均数yi 与 标准差si ,如下表所示。试估计该居民小区人均食 品消费额的户平均值 ,并给出其0.95的置信区间。
抽样技术第七章整群抽样ppt课件
NM
NM
故有 可推得
NM
2
(Yij Y )(Yik Y )
c
i1 jk
(M 1)(NM 1)S 2
c
1
NMSw2 (NM 1)S 2
1
Sw2 S2
13
ρc可估计为
ˆc
sb2
sb2 (M
sw2 1) sw2
y 的方差可写成如下形式:
《抽样技术》第七章
1
第七章 整群抽样
§7.1 概述 §7.2 群大小相等的情形 §7.3 群大小不相等的情形 §7.4 按与群大小成比例的不等概率抽样抽群
2
§7.1 概述
设总体由N个大单元,即初级单元组成,每个初级 单元又由若干个较小的次级单元或二级单元组成。 从总体中按某种方式抽取n个初级单元,观测其中所 包含的所有次级单元。这种抽样称为整群抽样。确 切地说,应称为单阶整群抽样。
1N N 1 i1
Yi Y
2 1 f nM
Sb2
s2 y 1 f
n
1 n
n 1 i1
yi y 2
1 f nM
sb2
其中f=n/N为抽样比。可见,sb2 是Sb2的无偏估计。
8
当n足够大时,总体均值Y 的置信度为1−α的置信区 间为:
y u 2s y
例7.1 在一次某城市居民小区居民食品消费量调查 中,以每个楼层(相当于居民小组)为群进行整群抽 样。每个楼层都有M=8个住户。用简单随机抽样在 全部N=510个楼层中抽取n=12个楼层。全部96个 样本户人均月食品消费额yij及按楼层的平均数yi 与 标准差si ,如下表所示。试估计该居民小区人均食 品消费额的户平均值 ,并给出其0.95的置信区间。
抽样调查-整群抽样
抽样调查-整群抽样引言在实际的数据分析与研究过程中,我们常常需要通过抽样调查的方式来获取数据样本,进而对总体进行推断和分析。
在选择抽样方法时,整群抽样是一种常用且有效的方法之一。
本文将对整群抽样方法进行详细介绍,并探讨其优势和适用情况。
什么是整群抽样?整群抽样(Cluster Sampling)是一种多阶段抽样方法,在该方法中,研究者将总体分为若干非重叠的群组(cluster),然后从这些群组中随机选择一部分群组作为样本,再从所选群组中抽取全部或部分个体作为样本。
这种抽样方法常用于调查大规模总体,能够有效减少调查成本和提高调查效率。
整群抽样与分层抽样相似,但两者在抽样阶段的区别比较大。
整群抽样是在第一阶段就将总体分成若干群组,然后再从群组中抽取样本;而分层抽样是先将总体按照特定的属性分为各个层次,然后从每个层次中抽取样本。
整群抽样的步骤整群抽样主要包括以下步骤:1.将总体划分为群组:将总体按照一定的特征划分为若干群组,确保各个群组之间的特征差异较大,同时群组内的差异较小。
2.随机选择群组:从划分好的群组中使用随机抽样方法选择部分群组作为样本群组。
3.从样本群组中抽样:从所选的样本群组中再次使用随机抽样方法,抽取全部或部分个体作为最终样本。
4.数据采集与分析:对抽取的样本进行数据采集,并进行相应的分析与推断。
整群抽样的关键在于群组的选择和抽样,因此在设计抽样方案时需要充分考虑这两个因素。
整群抽样的优势相比其他抽样方法,整群抽样具有以下优势:1.减少调查成本:整群抽样将总体划分为群组,在第一阶段只需要抽取部分群组,相对于一次抽取全部样本的方法而言,可以大大减少调查成本。
2.提高调查效率:由于从已选择的群组中再次抽样,相比于一次抽样全部样本,可以提高调查效率,并减少时间成本。
3.管理简便:整群抽样通过选择群组进行抽样,相比于逐个个体抽样,管理起来较为简便。
整群抽样的适用情况整群抽样适用于以下情况:1.总体分布较为集中:当总体中的个体在某些特征上呈现较高的聚集性时,可以选择整群抽样方法。
(抽样检验)第七章整群抽样
第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:- 抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;- 从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
因此,群间差异的大小直接影响到抽样误差的大小,而群内差异的大小则不影响抽样误差。
抽样调查-整群抽样培训课件
总体中第i群的个体均值:
Y i Yi M
样本中第i群的群均值:
yi
yi M
总体中的群均值:
Y n Yi
N i 1
样本中的群均值:
y
n
yi
n i 1
总体中的个体均值:
N Mi
Y
Yij
M i1 j1
0
总体方差: 样本方差:
S2M 0 11iN 1jM 1(YijY)2
s2 n 1
n mi
名学生。用简单随机抽样在全部N=315间宿舍中抽取
n=8间宿舍。全部48个学生上周每人的零花钱 及
相关计算数据如下表。试估计该学校学生平均每周
y ij
的零花钱 ,并名学生每周零花钱支出额
i
y ij
yi
s
2 i
解:已知 故
N31 ,n5 8,M6,fn0.02,54 N
二、群的划分
整群抽样中的群大致可分为两类:
一类是根据行政或地域形成的群体,如学校企业和街道,对此采 用整群调查是为了方便调查,节约费用。 另一类群则是调查人员人为确定的,如将一大块面积划分若干块 较小面积的群,这时就需要考虑如何划分群,以使在相同调查费 用下调查误差最小。
群划分的一般原则 为了提高精度,划分群时应力争使同一群内各单元之间的差异尽可 能大,以避免同一群内各单元提供重复信息.这个原则与分层抽样中 划分层的原则恰好相反.由此看来,整群抽样和分层抽样是针对不同 总体结构而提出的两种不同抽样方法.
Vsr(sy)(1N nM M )n S2M 1nfM S2
但如果该整体被等分为N个规模为M的群,定义
为群内相关系数,描述同一群内成对个体单元之间
第七章抽样
第七章抽样一、抽样与抽样调查抽样:是一种选择调查对象的程序和方法。
抽样调查:就是从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特征。
优点:社会学中第一次采用抽样方法的调查是A.L.Bowleg于第一次世界大战前在英格兰和威尔士所做的五城镇调查。
二战后,随着计算机技术的发展抽样调查法得到迅速推广,目前已成为社会调查的主流。
与整体调查(普查)比,抽样调查具有下列优越性。
第一、调查费用低。
抽样调查由于调查的仅仅是整体的一部分,因此,所需费用较整体调查低。
例如,我国第三次人口普查,动用普查人员710万,正式调查期间还动员了1000万干部群众参加,耗资约4亿元。
第二、速度快。
时间往往是最重要的,特别是某些社会现象需要及时了解,随时掌握。
第三、范围广。
由于上述两个特点,抽样调查可广泛用于各个领域,各种课题。
第四、可获得内容丰富的资料。
普查通常只了解少量项目,无法进行深入分析。
例如人口普查,我国1953年的第一次人口普查,只有姓名与户主的关系、性别、年龄、民族、住址六个项目,1982年的第三次人口普查,调查项目也只增加到19个。
第五、准确性高。
整体调查往往需要大批访问员,而这些访问员,有许多是缺乏经验和专业训练的,这往往会降低调查质量。
4、注意事项:抽样调查的成功首先要求所选取的样本能够代表总体,所谓代表性就是说,所选取的样本从调查要研究的总体特征看,能再现总体的结构。
在社会研究中,任何个体之间都存在着差异,任何部分都无法完全代表总体,因此,无论采用什么样的选取部分的方法,无论做得多么仔细,没有也不可能抽出毫无偏差的代表总体的所有特点和关系的样本。
这也就是说,在用样本来概括总体时,总要有误差,它的大小可以反映出样本代表性的高低。
对于研究人员来说,重要的不是没有误差,而是能知道误差的大小和控制它的大小。
有两个因素可以减少抽样误差。
首先,大样本比小样本产生的误差小。
其次,从同质的总体中抽取样本比从异质总体中抽取样本所产生的抽样误差要小。
7第7章 质量检验及抽样技术
27
二、抽样检验常用术语
7.不合格品:有一个或一个以上不合格的单位产品。
不合格品类型 A类 含义 又叫致命不合格品。有一个或一个以上A类不合格的 单位产品,也可能其中还有B类和/或C类不合格。 又叫严重不合格品。有一个或一个以上B类不合格的 单位产品,也可能其中还有C类不合格,但没有A类 不合格。 又叫轻微或一般不合格品。有一个或一个以上C类不 合格的单位产品,但没有A类和B类不合格。
32
二、抽样检验常用术语
13、接收质量限AQL:当一个连续系列批被提交验 收抽样时,可允许的最差过程平均质量水平。 • 接收质量限是对生产方的过程质量提出的要求, 是允许的生产方过程平均(不合格品率)的最大 值。 14、连续批: 待检批可利用最近已检批所提供质量 信息的连续提交检查批 ,称为连续批。 15、孤立批:指脱离已生产或汇集的批系列,不属 于当前检验批系列的批次,如:虽然连续生产20 批,但被20个客户购买,对每个客户而言,都是 得到1个孤立批。
11、批每百单位产品不合格数(计点):批中每百个单位产
品平均包含的不合格数,即C(批中的不合格数) / N(总体
或批量) ×100
30
二、抽样检验常用术语
12、过程平均不合格品率:在规定的时段或生产 量内平均的过程质量水平,即一系列初次交检 批的平均质量。
• 假设有k批产品,其批量分别为N1,N2,…,Nk, 经检验,其不合格品数分别为D1,D2,…,Dk, 则过程平均不合格率为:
抽样检验是本章讨论的主要内容。
10
四、质量检验的分类
3、按最多抽取的样本数分
• 一次抽样检验:就是从检验批中只抽取一个样本就能够对 该批产品做出是否接收的判断; • 二次抽样检验:最多抽取两个样本就能够对该批产品做出 是否接收的判断; • 多次抽样:在我国,允许最多抽取5个样本就能够对检验 批作出接收与否的判断; • 序贯抽样检验:不限制抽样次数,每次只抽取一个单位产 品(即样本量为1 ),直至能够判断批产品是否合格为止。
经济统计学第7章抽样调查
参数的假设检验是根据样本,对总体参数某种假设的正确性作出判断。 可以分别提出两种假设: 前一种不能轻易拒绝的假设为原假 设,后一种为备选假设。假设检验就是根据样本,检验 是否成立, 不成立就接受备选假设 。
一、基本思想: 小概率原则:认为在一次实验中 小概率事件几乎是不可能发生的,小概率事件的概率为显著性水平 。
一个总体的检验
Z 检验 (单尾和双尾)
t 检验 (单尾和双尾)
Z 检验 (单尾和双尾)
2检验 (单尾和双尾)
均值
一个总体
比例
方差
总体方差已知时的均值检验 (双尾 Z 检验)
均值的双尾 Z 检验 (2 已知)
假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 原假设为:H0: =0;备择假设为:H1: 0
单侧检验 (原假设与备择假设的确定) 例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上
除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的 建立的原假设与备择假设应为
H0: 1000 H1: < 1000
第二节
一个正态总体参数的假设检验
-10
100
20
25
-5
25
30
30
0
0
离差
40
35
5
25
50
40
10
100
10
25
-5
25
20
30
0
0
30
35
5
25
40
40
10
100
50
45
15
(标准抽样检验)第七章整群抽样
(标准抽样检验)第七章整群抽样第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
质量管理07-抽样检验-2008
2000版ISO9000族标准
第七章 抽样检验方法
质量管理学
. 1.
第一节 抽样检验的基本概念
一、概念
抽样检验 利用所抽取的样本对产品或过程进行 检验。
—— 通过检验所抽取的样本对这批产 品的质量进行估计,以便对这批产品作出 合格与否,能否接收的判断的抽样检验。
质量管理学 .2.
抽样检验适用场合 —— 破坏性检查验收; —— 批量很大; —— 测量对象是流程性材料; ——全数检验不适用成本经济。
质量管理学
.3.
抽样检验特点 —— 对象:一批产品 —— 方法:应用数理统计原理 —— 目的:推断产品批合格与否 —— 缺点:接收批不等于批中每 个产品都是合格品;拒收批不等于批中 全部产品都是不合格品。
质量管理学
.4.
抽样检验分类 —— 计量抽样检验 —— 计数抽样检验 计件抽样检验
计点抽样检验
ISO 2859-1:1999
GB/T 2828.1-20003/ISO 2859-1:1999
质量管理学
.38.
4.GB/T 2828.1-2003的主要特点 (1)主要适用于连续批检验 (2)接收质量限(AQL)
当一个连续批被提交验收抽样时,可允 许的最差过程平均质量水平
AQL用不合格品百分数或每百单位产品 不合格数表示
质量管理学
.36.
3.调整型抽样检验标准发展概况
MIL-STD-105D(1963)(美、英、加三国 联合制订) BS-9001(1963)(英民用工业); DEF-131-A(1963)(英军用工业)
105-GP-1(1963)(加民用工业);
CA-G115(1963)(加军用工业)
(抽样检验)第七章第一次课抽样原理与方法
(抽样检验)第七章第⼀次课抽样原理与⽅法第⼀节抽样⽅案的制定在科学研究中,除了进⾏控制试验外,有时也要进⾏调查研究。
调查研究是对已有的事实通过各种⽅式进⾏了解,然后⽤统计的⽅法对所得数据进⾏分析,从⽽找出其中的规律性。
例如,了解畜禽品种及⽔产资源状况;探索和分析对某种疾病有效的防治规律、措施以及新的检验⼿段和⽅法等。
由于现场调查⽴⾜于⽣产实际,所以它是研究和解决实际问题的⼀种重要研究⽅法。
同时,控制试验的研究课题,往往是在调查研究的基础上确定的;试验研究的成果,⼜必须在其推⼴应⽤后经调查得以验证。
为了使调查研究⼯作有⽬的、有计划、有步骤地顺利开展,必须事先拟定⼀个详细的调查计划。
调查计划应包括以下⼏个内容:(⼀) 调查研究的⽬的任何⼀项调查研究都要有明确的⽬的,即通过调查了解什么问题,解决什么问题。
例如,家畜健康状况的调查的⽬的是评定家畜健康⽔平;畜禽品种资源调查的⽬的是了解畜禽品种的数量、分布与品种特征特性等情况。
同时,调查研究的⽬的还应该突出重点,⼀次调查应针对主要问题收集必要的数据,深⼊分析,为主要问题的解决提出相应的措施和办法。
(⼆) 调查的对象与范围根据调查的⽬的,确定调查的对象、地区和范围,划清调查总体的同质范围、时间范围和地区范围。
例如,四川省家禽品种资源调查,调查地区为四川省,调查总体和对象为全省各市、县的家禽,调查时间从2000年1⽉到2000年12⽉。
(三) 调查的项⽬调查项⽬的确定要紧紧围绕调查⽬的。
调查项⽬确定的正确与否直接关系到调查的质量。
因此,项⽬应尽量齐全,重要的项⽬不能漏掉;项⽬内容要具体、明确,不能模棱两可。
应按不同的指标顺序以表格形式列⽰出来,以达到顺利完成搜集资料的⽬的。
例如,家禽品种资源调查项⽬有:种类(鸡、鸭、鹅等)、品种(柴鸡、来航、⽩洛克等),数量、体重、产蛋性能等项⽬。
调查项⽬有⼀般项⽬和重点项⽬之分。
⼀般项⽬主要是指调查对象的⼀般情况,⽤于区分和查找,如畜主姓名、住址及编号等。
抽样调查方法与技术:整群抽样
需要估计: Y(按小单元平均的总体均值)、 Y(总体总值)
二、估计量及其性质
由于 及YY仅相差一个常数NM,故仅需讨论
的估Y 计量及其性质即可,Y的估计量及其性质 很容易由 的结Y果得到。
(一)总体均值( 按Y小单元计算的总体均 值)
1、
E(y) Y
y是Y的无偏估计
即Y = y= y nM
1 nM
(按小单元计算的总体群间方差)(定义)
(13)
Si2
1 M 1
M
(Yi j
j 1
Yi )2
:第i个群的总体
群内方差。 (当然按小单元计)
一、简单随机抽样(等概率抽样)下记号
(13) Sw2
1 N
N
Si2
i 1
1 N (M 1)
ห้องสมุดไป่ตู้
N i 1
M
(Yi j Yi )2 :总体
j 1
群内方差(已经是个平均数了)。(定义)
则: (1)N:总体的群数为N i=1,2,3,…,N (2)M:每个群内含有M个调查单位(小单元)
j=1,2,3,…,M (3)NM:全部总体单位(小单元)总数 (4)n:从N群中随机抽n群
第二节 群大小相等的整群抽样
一、简单随机抽样(等概率抽样)下记号
(5)f=n/N
群抽样比
=nM/NM 调查单位抽样比
自己去证明以下三者之间的关系:
S(2 总方差)、S(b2 总体群间方差)、S(w2 总体群内方差)
对于n群样本的记号
①yij : 样本中第i群第j个单位的标志值 (i 1, 2,...,n; j 1, 2,..., M )
M
②yi yij j 1
第七章市场调查方式(抽样技术)
具体做法: A、抽签法(有重复和不重复抽样两种选择)
先给调查总体的每个单位编号,然后将号码写在卡片上搅拌均匀, 任意从中抽选,抽到一个号码,就对上一个单位,直到抽足预先 规定的项目为止。适用于总体单位较少的情况。
B、乱数表(随机数表)法 优点:完全排除了抽样中主观因素的干扰、简单易行 缺点:在调查总体单位差异小(同质总体)情况下,调查结果 具有代表性,否则会产生较大误差 适用范围:总体单位明确、总体单位数较少、总体各单位间差 异程度较小
14
1
合 计
1 30
50
20
100
第四步:具体抽样 优点:较简单易行、准确度较高;节省费用, 能较快地获得市场信息 缺点:若调查者对调查总体不了解,会产生较 大误差 适用范围:调查者对调查总体了解
(二)随机抽样
严格按随机原则从调查总体中 抽取样本单位的调查方式。
1、简单随机抽样(纯随机抽样)
含义:在总体单位中,不进行任何有目的 的选择,完全按随机原则抽取样本单位 的方式。
具体做法:
第一步:对样本总体进行分类; 第二步:确定每类样本的分配数额; 第三步:编制样本交叉配额分配表; 第四步:具体抽样 仍以上例为例,采用相互控制配额抽样 第一步、第二步(略) 第三步:编制样本交叉配额分配表
高收入 民族 汉 族 回 族 其他民族
中收入
低收入
合计
21 8
35
14 6 0
70 28 2
2、分层随机抽样(类型随机抽样、分类 随机抽样)
( 1 )含义:将总体单位按某一标准(有关标 志)分组,然后在各个类型组中,按随机原 则抽取样本单位的方式。 (2)具体做法: 第一步:选择有关标志对总体进行划分; 第二步:确定各组的样本分配数额 方法:等比例和不等比例 等比例:ni = n× (Ni / N) 不等比例: ni = n×(Ni· Si /∑Ni· S i)
第七章抽样习题
一、填空题1.总体参数估计有和两种。
2.抽样调查的组织方式一般有、、和四种。
3.样本指标是一个变量。
4.在简单随机抽样条件下,抽样误差受、和、等因素的影响。
5.在其他条件不变的情况下,抽取单位越多,抽样平均误差。
6.类型抽样的抽样平均误差受方差的影响,而整群抽样的抽样平均误差受方差的影响。
7.抽样调查是按原则抽取样本,用推断的一种非全面调查。
8. 在假设检验中,第Ⅰ类错误就是弃真错误,弃真是指_____状况;第Ⅱ类错误就是纳伪(取伪)错误,纳伪是指______状况。
9.抽样成数是指样本中具有某一标志表现的占的比重。
10.抽样方法按抽取样本的方式不同分为和。
11、正态总体均值的假设检验,H0:u =u0,H1:u≠u0,若总体方差已知,样本量为n,则其检验的统计量为_______,其公式为_________,若显著性水平为a,接受域为_________。
12、假设检验中若其他条件不变,显著性水平a的取值越小,接受H0的可能性______,原假设为真而被拒绝的概率____。
13、假设检验是利用_____资料来检验事先对总体某些数量特征所作的____是否可信的一种统计分析方法。
14、在假设检验过程中,依据显著性水平a 的大小把概率分布划分为两个区间:小于给定标准的概率区间称为_____;大于给定标准的概率区间称为_____。
15、假设一般包括两部分即___和____。
二、判断题1.抽样误差大小与总体各单位标志值的差异程度成正比。
()2.抽样误差大小与样本单位数目的平方根成反比。
()3.不重复抽样的抽样误差小于重量复抽样的抽样误差。
()4.抽样误差范围是一个绝对可靠的范围。
()5.抽样单位数越多,抽样误差越大。
6.通常所说的抽样误差一般是指抽样平均误差。
()7.抽样误差是人的主观因素造成,因此应该避免。
()8.如果不知道总体方差或标准差,就无法计算抽样平均误差。
()9.整群抽样一般采取不重复抽样。
10.纯随机抽样时,所有可能的样本平均数的平均数等于总体平均数。
第七章 整群抽样(抽样理论与方法,河南财政学院)
( NM 1)S 2 N(M 1 )S w ( N 1)S b N(M 1 )S w ( N 1)S b 2 S NM 1 2 2 n( M 1 )s w (n 1)s b 同理:s 2 nM 1 (s 2 不是S 2的无偏估计。 )
2 2
2
M N 2
2 ( y Y ) ij i 1 j1 N M
NM 2 ( y ij Y )( y ik Y )
i 1 j k 2 ( y Y ) ij j1 N M N M
Hale Waihona Puke 2 ( y ij Y )( y ik Y )
i 1 j k
群间方差
(Yij Y )
2 i 1 j1
N
M
N 1
2 ( y y ) ij i 1 j1
n
M
n1
NM 1 nM 1 2 2 2 2 并且s w 是S w 的无偏估计,s b 是S b 的无偏估计。
方差
河南财经学院
总体离差平方和的分解:
2 ( Y Y ) ( Y Y Y Y ) i i ij ij 2 i 1 j1 N i 1 j1 N 2 2 (Yij Y ) M(Y i Y ) i i 1 j1 i 1 M N M N M
2 b N 2 N M
2
(NM 1 )S 2 ( y ij Y )( y ik Y )
2 i 1 j k 2 得 : 2 ( y ij Y )( y ik Y ) M( N 1)S b (NM 1 )S 2 i 1 jk N M
N
M
M( N 1 )S b (NM 1 )S 2 c (NM 1 )(M 1 )S 2
第七章 抽样
第七章抽样一、抽样与抽样调查1、抽样:是一种选择调查对象的程序和方法。
2、抽样调查:就是从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特征。
3、优点:社会学中第一次采用抽样方法的调查是A.L.Bowleg于第一次世界大战前在英格兰和威尔士所做的五城镇调查。
二战后,随着计算机技术的发展抽样调查法得到迅速推广,目前已成为社会调查的主流。
与整体调查(普查)比,抽样调查具有下列优越性。
第一、调查费用低。
抽样调查由于调查的仅仅是整体的一部分,因此,所需费用较整体调查低。
例如,我国第三次人口普查,动用普查人员710万,正式调查期间还动员了1000万干部群众参加,耗资约4亿元。
第二、速度快。
时间往往是最重要的,特别是某些社会现象需要及时了解,随时掌握。
第三、范围广。
由于上述两个特点,抽样调查可广泛用于各个领域,各种课题。
第四、可获得内容丰富的资料。
普查通常只了解少量项目,无法进行深入分析。
例如人口普查,我国1953年的第一次人口普查,只有姓名与户主的关系、性别、年龄、民族、住址六个项目,1982年的第三次人口普查,调查项目也只增加到19个。
第五、准确性高。
整体调查往往需要大批访问员,而这些访问员,有许多是缺乏经验和专业训练的,这往往会降低调查质量。
4、注意事项:抽样调查的成功首先要求所选取的样本能够代表总体,所谓代表性就是说,所选取的样本从调查要研究的总体特征看,能再现总体的结构。
在社会研究中,任何个体之间都存在着差异,任何部分都无法完全代表总体,因此,无论采用什么样的选取部分的方法,无论做得多么仔细,没有也不可能抽出毫无偏差的代表总体的所有特点和关系的样本。
这也就是说,在用样本来概括总体时,总要有误差,它的大小可以反映出样本代表性的高低。
对于研究人员来说,重要的不是没有误差,而是能知道误差的大小和控制它的大小。
有两个因素可以减少抽样误差。
首先,大样本比小样本产生的误差小。
其次,从同质的总体中抽取样本比从异质总体中抽取样本所产生的抽样误差要小。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(抽样检验)第七章整群抽样第七章整群抽样第壹节整群抽样概述壹、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取壹部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元能够分成多级,则能够对前几级单元采用多阶抽样,而在最后壹阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的俩个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中且不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括俩步:首先,总体被分为群;然后,在总体中抽取群的样本且访问群中的所有单元。
如果总体单元是自然分成组或群的,创建壹个这种关于群的抽样框且对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而能够创建地域框。
群的抽取能够采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样壹样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有俩个问题:壹是如何定义群,即当群且非是壹个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取壹部分群进行调查,且在抽中的群内作全面调查。
因此,群间差异的大小直接影响到抽样误差的大小,而群内差异的大小则不影响抽样误差。
在这里抽样单元是各个不同的群体,所以“群实际上是扩大了的总体单元”。
所以,对于前壹个问题,群的划分应该是:尽量扩大群内差异,而缩小群间差异。
按此原则分群,则能保证每个群对总体都具有足够好的代表性。
作为极端情况,假定各群之间总体单元的分布完全相同,即群间不存在任何差异,那么只需抽取壹个群进行调查就能充分满足抽样估计精确度的要求,整群抽样的效率就很高。
这就是说,整群抽样特别适合于群内差异大、而群间差异小的情况。
这样,每个群都具有足够好的代表性。
如果所有的群都相似,那么抽少数群就可获得相当好的精度;反之,若群内的单元比较相似,而群和群之间的差别较大,则整群抽样的效率就低。
所以分群的原则使“群内差异大、群间差异小”和分层的原则使“层内差异小,层间差异大”是恰好相反的。
然在使用自然群时,同壹个群内的单元通常非常相似,从而导致这种抽样策略的效率比简单随机抽样低。
下图直观表明了理想的分群和分层,其中同壹字母表示观测值相近的单元。
至于群的规模的选择,壹是取决于精度和费用之间的平衡,二是从抽样实施的组织管理等因素来考虑。
当相邻单元相似时,抽数量较多的小群比抽少量较大的群的统计效率高。
然而,如果采用面访,样本的分布越广,调查的费用越高。
这表明:群的规模选得大,则费用省而精度差;群的规模选得小,则精度高而费用大。
所以,需要选择最优的群数量和大小,同时使总费用最小。
这方面除了依靠实践经验外,仍可对假定的方差函数和费用函数作理论上的最优选择。
整群抽样可能有壹些具体的困难。
如果用地图作为地域框,可能很难决定某个住所是否在壹个特定的群内。
必须建立壹个基本的原则以决定哪些单元在壹个群内。
例如,规定“住所属于它的正门所在的群”这么壹条原则,就能解决大多数问题。
如果壹个住所似乎平等地跨越俩个群,则采用掷硬币的方法来确定,以避免产生任何抽选的偏差。
三、整群抽样的特点同其他抽样组织形式相比较,整群抽样具有如下特点:1.在大规模抽样调查中,常常没有或很难编制出包括总体所有次级单元在内的抽样框,而整群抽样则不需要编制庞大的抽样框。
当总体单元自然聚合成群(例如:住户、学校)时,整群抽样比简单随机抽样或系统抽样更容易。
2.在样本单元数相同的条件下,整群抽样和简单随机抽样相比,样本单元的分布相对较集中,虽然样本的代表性较差,但调查组织实施过程更加便利,同时仍能够大大地节省调查费用。
因此,实际工作中,在权衡费用和精度之后,有时宁可适当增加壹些样本单元数,也采用整群抽样方法。
如果对于调查变量而言,群内单元差异较大,而不同群的差异较小,整群抽样策略比简单随机抽样的统计效率更高。
(例如为估计性别比采用按户的整群抽样)。
3.整群抽样的随机性体当下群和群间不重叠,也无遗漏,群的抽选按概率确定。
4.如果把每壹个群见作壹个单位,则整群抽样能够被理解为是壹种特殊的简单随机抽样。
5.整群抽样也是多阶段抽样的前提和基础。
6.整群抽样有特殊的用途。
有些现象的研究,如果直接调查作为基本单元的个体,很难说明问题,必须以壹定范围所包括的基本单元为群体,进行整群抽样,才能满足调查的目的。
如人口普查后的复查、要想估计出普查的差错率,只有通过对壹定地理区域内的人口群体作全面调查才行。
类似地诸如人口出生率、流动率等调查都需要采用整群抽样。
7.整群抽样要求分群后各群所含次级单元数目应该确知,否则会给抽样推断带来不便。
整群抽样的缺点有:-对调查变量,若群内单元有趋同性,则整群抽样的统计效率比简单随机抽样低,(这正是通常遇到的情况),但对此项效率的损失可通过增加群的抽取个数来弥补;-通常无法提前知道调查总样本量,因为在进行调查前,我们通常不知道壹个群内到底有多少个单元;-调查的组织比其他方法复杂;-方差估计可能比简单随机抽样更为复杂。
四、关于群大小的计量整群抽样中,如何有效地对群的大小进行计量,直接关系到抽样估计效率的高低。
研究表明,对群的大小的最优计量尺度是各群在所研究标志上的标志总量大小。
但在实际工作中,它是未知的。
因此通常选择和所研究标志高度线性相关的另壹辅助标志作为计量尺度。
为此,要求掌握关于辅助标志的更进壹步细致的资料,而这又会带来壹系列新的问题,如增加工作量及费用等。
所以,在整群抽样的实际应用中,经常选择以各群所含次级单元数的多少作为群大小的计量尺度。
当各群所含次级单元数相等时,就称群的大小相等;当各群所含次级单元数不相等时,就称群的大小不相等。
整群样本(图示)第二节等概率整群抽样的情形整群抽样中对群的抽取有多种方式,本节只讨论按简单随机抽样抽群,即等概率抽样,也称PPF抽样的情形,下节讨论不等概率的情形。
壹、预备知识(壹)有关符号的涵义为总体群数;为各群所含次级单元数;为第群中第个次级单元的观则值;为总体所含次级单元总数;为样本所含次级单元总数;为第群各次级单元观测值总和;为第群的均值;为总体各次级单元观测值总和;为样本各次级单元观测值总和;为总体各群的均值;为样本各群的均值;为总体均值;为样本均值;为总体方差;为样本方差;为总体群间方差;为样本群间方差;为总体平均群内方差;为样本平均群内方差;为抽样比。
(二)群内、群间差异的定量刻划正如前面所分析的,整群抽样的精度在很大程度上取决于群内各次级单元间差异程度的大小。
那么如何有效地对分群后各群内次级单元间的差异和各群之间的差异加以测定?也就是对群内差异和群间差异怎样做定量刻划?通常有俩种不同的思路:1、离差平方和的分解——群内方差和群间方差的测定先分析总体的情况:对于总体,对离差的总平方和可作如下分解:式中第壹项为群内离差平方和,用其除以即为平均群内方差,也可直接称之为群内方差,用表示,则:<为自由度>式中的第二项为群间离差平方和,用其除以即为群间方差,用表示,则:由此,依总体方差的定义及总体离差平方和分解能够得出:同理,可得样本的方差及其分解如下:需要注意的是,由于群的抽取是简单随机的,因此,能够证明和分别是和的无偏估计。
但从次级单元角度而言,样本且不是简单随机的,因此,不是的无偏估计。
的壹个无偏估计可构造如下当N充分大时,另壹方面,当也足够大时,可见作是的近似无偏估计。
2、群内相关系数群内相关系数是反映总体中群内各次级单元间相关程度的壹个统计分析指标。
是同壹群内不同次级单元的观测值对总体均值离差乘积的平均和总体所有次级单元观测值对总体均值离差平方的平均之比,记作的取值在范围内。
当时,表明群完全是随机组成的。
值愈大,表明群内的单元愈相似;值愈小,则群内单元的差异愈大。
当时,表明这个差异比随机分组时群内的差异更大。
也可用群间方差和群内方差表示,此时或在实际应用中,当群的大小不等时,可用平均群的大小代替,用上式估计.二、群的大小相等时(壹)估计量整群抽样是以群为单位进行抽样,如果群的抽取是简单随机的,则当群的大小都相等时,能够将简单随机抽样理解为是壹种特殊的整群抽样,特别当总体分群后的每个群都只包括壹个次级单元时,整群抽样和简单随机抽样壹致。
因此,整群抽样的估计量能够比照简单随机抽样方式来构造。
1、总体均值的估计由于总体均值是各群均值的平均,而是样本各群均值的平均,所以根据简单随机抽样的基本思路可得此时总体均值的无偏估计量应为样本均值,即:2、总体总和的估计同理可得总体总和的无偏估计量为3、总体比例P的估计令为第群中具有所研究特性的次级单元数,则表示第群中具有所研究特性的次级单元所占的比例,总体中具有所研究特性的次级单元所占的比例为如果是按简单随机抽样方式抽群,则有的无偏估计量为(二)估计量的方差及其估计由于群是按简单随机方法抽取的,因此,估计量和的方差及方差的无偏估计量可直接按第三章的方法构造,无需专门推导。
结果如下:≈≈三、群的大小不等时在许多情况下,总体各群的大小是不完全相等,或完全不相等的。
若各群的大小相差不大时,总体参数的估计量可按简单估计或比估计来确定:(壹)简单估计如果群的抽取是简单随机的,则可将每个群的总和见作是第群的指标,于是总体总和的简单估计可依照简单随机抽样的情形来做,即:能够证明,是的无偏估计,其方差为:方差估计量为:为无偏估计。
有了总体总和的估计量,则可得出总体均值的无偏估计量为其中为总体各群次级单元之和,应事先已知,为第群所含次级单元数;为总体平均每群所含次级单元数,估计量的方差为:方差的估计量为:(二)比估计当群的大小不等时,在对群进行简单随机抽样的情况下,,我们注意到它同比率形式上完全相同,只不过在这里是将各群的大小作为辅助变量。
因此,可采用比估计的方法得出有关参数的比估计量。
按前面的论述,比估计量是有偏的,但当充分大时,其偏差能够很小,近似无偏。