抽样技术考试重点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分层抽样、整群抽样和二阶段抽样的区别和联系
分层抽样:是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。其分层要求各层之间差异大,层内个体间差异小。
整群抽样:将总体中若干个单位合并为组,这样的组称为群。抽样时,直接抽取群。然后对中选群的所有单位全部实施调查。其分群要求群与群之间差异小,群内个体间差异大。
二阶段抽样:从总体行所有一阶单元中抽取一部分单位,相当于从总体所有群众抽取部分群的整群抽样,而再每个抽中的一阶单元中分别抽取部分二阶单元,就相当于分层抽样,即先整群,后分层抽样。其实质是分层抽样与整群抽样的有机结合。
分层抽样样本量的分配
比例分配:是指各层按各层单位数占总体单位数的比例,也就是按各层的层全进行分配,即。最优分配:是指在分层随机抽样中,如何将样本量分配到各层,使得在总费用给定的条件下,估计量的方差最小,即。尼曼分配:最优分配在每层抽样费用相同时的特例,即。
什么是πPS抽样,如何实现
如果我们事先对总体中的每一个单位都有一个度量其规模大小的指标值,则记
。对于固定的样本量,若总体中每个单位入样概率——一阶包含概率与其规模大
小严格称比例,我们称这种不放回的与单位规模大小成比率的概率抽样为严格的
πPS抽样。实现方法:严格,n=2布鲁尔方法、德宾方法,n>2水野方法、布鲁尔方法、拉奥-桑福特方法;非严格:耶茨-格伦迪方法、拉奥-哈特利-科克伦方法、泊松抽样。
系统抽样对线性排列趋势的调整方法
首位校正法:即将不加权的均值估计量改变为加权的估计,加权时样本中所有中间单位的权数都是1,但对样本的第一个和最后一个单位分别赋予的权。其中i为1~k中所抽样本,+为首,—为尾。中心系统抽样法:在总体的第一组中,将位置居中的单位作为抽样起点,其抽样模型为:{k/2+jk}(j=0,1,…,n-1)。平衡系统抽样法(分组对
称抽样法):对号码1~k随机抽取一个单位,若第r号单位入样,则其抽样模型为{r+2jk,2(j+1)k-r+1}(j=0,1,…,n/2-1)。修正系统抽样法(总体对称抽样法):对号码1~k 随机抽取一个单位,若第r号单位入样,其抽样模型为:当n为偶数时,{r+jk,N-r-jk+1}(j=0,1,…,n/2-1);当n为奇数时,{r+jk,N-r-jk+1,r+(n-1)k/2}(j=0,1,…,(n-1)/2-1)。
二阶段抽样不等概率抽样的加权估计方法
设总体中第i个初级单位被抽中的概率为,初级单位的抽取方式为重复抽样。按等概率不重复的抽样方式从被抽中的初级单位中抽取二级样本单位,则全部二级单位的总体均值的无偏估计量为:。如果,即以各初级单位所包含的二级单位数占总体全部二级单位数的比重来确定各初级单位被抽取的概率,则上式可简化为:。
1.常用的概率抽样方式有:简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样
2.样本中所包含的调查单位数称为:样本容量
3.均方误差等于估计量方差加:偏差平方
4.抽样概率度是指:抽样极限误差与抽样标准误差之比的系数
5.简单随机抽样中,样本均值的方差等于:
6.比率估计、回归估计需要有样本容量较大才能保证估计的有效,因为它们都是有偏估计。
7.回归估计的应用条件要求辅助变量的总体总量或总体均值应该是已知的。
8.分层抽样中样本分配方法有:比例分配、最优分配、尼曼分配
9.PPS抽样的实施方法有:代码法、拉稀里法
10.有限总体校正系数fps是指:1-f
1.非概率抽样主要由:随意抽样、判断抽样、定额抽样、流动总体抽样
2.抽样框是指:根据抽样单位所编制的名录,是抽样总体的具体表现
3.放回简单随机抽样的样本设定系数为:
4.分层随机抽样下,总体均值的简单估计量为:
5.系统抽样中,当N是n的整数倍时,可以采用线性系统抽样;当N不是n的整数倍时,可以采用圆圈系统抽样。
6.整群抽样中群的划分要求尽可能使群间的差异小,群内的差异大,从而提高估计的精度。
7.分层抽样中样本量的分配方式有:比例分配、最优分配、尼曼分配
8.回归估计的应用条件要求辅助变量的总体总值或总体均值应该是已知的。
9.比率估计量优于简单估计量的条件是:时,调查变量与辅助变量有较高的正相关性。
10.PPS抽样的实施方法有:代码法、拉希里法
11.样本轮换是为了解决样本老化和更换全部样本单位导致的不经济及影响资料的前后时期对照比较等问题而广泛采用的一种抽样方法
12.随机截尾模型是针对定量的敏感性问题提出的一种调查方法。
1.抽样有非概率抽样和概率抽样之分,两者的根本区别在于样本的抽取是否遵循随机原则,即总体中的单位是否有非零的、事先已知或可以计算的概率被抽中。
2.非概率抽样主要有:(1)随意抽样;(2)判断抽样;(3)定额抽样;(4)流动总体抽样。其样本的抽取具有主观随意性,抽样误差难以计算和控制。
3.概率抽样的三大特点:(1)随机抽样;(2)概率估计;(3)抽样误差可以计算和控制。其可分为等概率抽样和不等概率抽样。
4.常用的概率抽样方式:1简单随机抽样;2分层抽样;3系统抽样;4整群抽样;5多阶段抽样。
5.抽样调查的基本程序:(1)设计抽样方案;(2)编制抽样框和设计调查表;(3)试抽样调查;(4)正式抽样调查;(5)数据处理;(6)推断分析;(7)总结评估。
6.抽样技术的作用:(1)节约费用;(2)增强时效性;(3)提高调查数据质量;(4)承担全面调查难以胜任的调查;(5)与其他统计调查结合互补;(6)对总体数量特征进行假设检验。
1.总体:有目标总体与调查总体之分。目标总体由符合研究目的的所有具有相同属性或特征的单位所组成,是抽样推断的目标所在。调查总体由已被人们所掌握、能对其加以排序或编号的单位所组成,是真正从中抽取样本的总体。
2.单位:有调查单位与抽样单位之分。调查单位是调查项目的承担者,一般是最基本的单位;抽样单位是用以抽选调查单位计入样本的中介单位,在多阶段抽样中还可以分级。
3.抽样框:是根据抽样单位所编制的名录,是抽样总体的具体表现。一个好的抽样框有两个基本标准:一是与目标总体保持一致,即抽样框中的单位与目标总体中的单位能够完全一一对应;二是能够提供与调查目的有关的尽量多准确、完整的辅助信息。抽样框有名单抽样框、区域抽样框和时间抽样框等形式。
4.样本:是总体的一部分,是从抽样总体中按一定方法和程序抽取的部分调查单位的集合,也称为子样。样本中所包含的调查单位数称为样本容量,样本容量与总体容量之比称为抽样比。一次抽样,样本容量需要多大,要根据总体的情况和抽样的要求来确定,并且与抽样方法和估计方法等因素有关,并不是越大越好。从一个总体中最多可以抽取的不同样本的数目,称为样本个数,样本个数的多少除了与样本容量有关,还与抽样方式、方法有关。
5.估计量:是以样本指标为基础构造的、用以估计总体指标的规则或形式。优良估计量有三个标准:无偏性、一致性和有效性。当无偏性和有效性之间矛盾时,我们选择有效性。
6.均方误差等于估计量的方差与估计量的偏差平和之和。
7.抽样误差:由于抽样的非全面性和随机性所引起的偶然性的代表性误差。非抽样误差:由于抽样框不够准确(与目标总体不一致)、有些单位的观察资料无法取得、已取得的一些资料不真实等原因引起的样本观察数据非同质、或残缺、或不真实而产生的误差。
8.影响抽样误差大小的因素:1总体内在差异;2样本容量;3抽样方法、方式;4估计量。
9.抽样极限误差:是指以样本估计总体在某种概率意义下所允许的最大误差范围,也即在一次抽样估计时,估计量所允许的最高值和最低值与总体指标之间的绝对离差,通常用
来表示,即。与之比被称为抽样相对允许误差,一般表示为。1减去抽样相对误差被称为抽样估计精度。
简单随机抽样: