抽样技术期末知识点(附考点大题)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样期末知识点汇总
一.绪论
(一)抽样调查
抽样调查是指非全面调查的总称。只要是从研究的对象中抽取部分单位加以调查,用来说明全体,就统称为抽样调查。(广义)
选样方法:非概率抽样&概率抽样
1.非概率抽样
抽样方法:目的抽样、判断抽样、任意抽样、方便抽样、配额抽样(盖洛普民意测验、自愿样本
原因:
(1)受客观条件限制,无法进行严格的随机抽样。
(2)为了快速获得调查结果。
(3)在调查对象不确定,或无法确定的情况下采用,例如,对某一突发(偶然)事件进行现场调查等。
(4)总体各单位间离散程度不大,且调查员具有丰富的调查经验时。
优点:成本低,而且容易完成;
缺点:不能对估计的精度作出客观、准确的说明。
2.概率抽样(狭义抽样调查)
按照概率统计的原理,从研究的总体中按随机原则来抽选样本,通过对样本的调查获取数据,以此来对总体的特征作出估计推断;对推断中可能出现的抽样误差可以从概率的意义上加以控制。
特点:
(1)对于一个具体的调查,要求总体中的每一个单元都有一个已知的非零概率被抽中。
(2)抽取样本的方法必须是随机的。
(3)根据样本来计算估计值的方法,应符合抽样的方法确定合适的估计量。
(4)能够以一定的概率控制抽样误差的范围。
概率抽样:等概率抽样&不等概率抽样
(二)抽样调查的常用概念
1. 目标总体:可简称为总体,是指所要研究对象的全体,或者说是希望从中获取信息的总体,它是由研究对象中所有性质相同的个体所组成,组成总体的各个个体称作总体单元或单位。
2.抽样总体:指从中抽取样本的总体。
3.抽样框:抽样总体的具体表现。通常抽样框是一份包含所有抽样单元的名单。
4.总体参数:总体的特征。
5. 统计量(估计量):样本观察值的函数。
6.抽样误差:由于抽样的非全面性和随机性所引起的偶然性误差。
7.非抽样误差:由随机抽样的偶然性因素以外的原因所引起的误差。
8.抽样误差表现形式:抽样实际误差、抽样标准误和抽样极限误差。
9. 抽样标准误(S ),抽样方差(V ),V=S 2
10.偏差:样本估计量的数学期望与总体真值间的离差,ˆˆE()-()ˆB θθθ=。 11.均方误差:22ˆˆˆ()()()MSE E θ
-θV θB θ==+。 12.精确度:每次抽样结果之间差别大小
13.精度:估计量的抽样标准误差或方差与待估计参数之比。 14.可靠性:置信度(1-a )
15.抽样效率:两个抽样方案在样本量相同的情况下的抽样方差之比。
16.设计效果:ˆ()ˆ()D SRS V Deff V θθ
=
SRS
ˆ()ˆ()D V V θ
θ表示某设计方案的方差,表示相同样本量下简单随机抽样的方差。
17. 1-f 称为有限总体校正系数(finite population correction ,简记为fpc ),当抽样比f 很小时,1-f 就接近于1,这样抽样比对y 的精度就没有直接影响;一般地,当抽样比小于5%,甚至小于10%时,fpc 可以忽略不计,即认为1-f 为1;事实上略去fpc 的影响是使()V y 高了一些 18.抽样调查步骤
确定调研问题——抽样方案设计——问卷设计 ——实施调查过程 ——数据处理分析——撰写调查报告
二.简单随机抽样SRS
(一)定义:从容量为N的总体中抽取一个容量为n的样本,若所有可能的
n
N
C个
样本中的每一个被抽到的概率都相等,即每个可能样本被抽中的概率均为1
n
N C,
这种抽样方法称为不放回的简单随机抽样,简称简单随机抽样,所得的样本称为不放回的简单随机样本,简称简单随机样本
(二)实施方法:将总体中的单元依次从1到N进行编号,然后利用抽签法或随机数法来进行简单随机抽样。
(三)优点:简单直观。在抽样框完整时,可以直接从中抽选样本,由于抽选的概率相同,用样本统计量对目标量进行估计及计算抽样误差都比较方便。(四)局限性:它要求将包括所有总体单元的名单作为抽样框,当N很大时,构造这样的抽样框并不容易;根据这种方法抽出的单元很分散,给实施调查增加了困难;这种方法没有利用其他辅助信息以提高估计的效率。所以在规模较大的调查中,很少直接采用简单随机抽样,一般是把这种方法与其他抽样方法结合在起使用。
(五)估计
(1)总体均值
对于简单随机抽样,Y y 是的无偏估计。即Y y E =)
( 对于简单随机抽样,2
21V S n
f S nN n N y y -=-=)
(的方差为: ()2
1)(s n
f y v y V -=
的无偏估计为: 的近似置信区间为的置信度为α-1Y (s n f u
y ---
12
1α
,s n f
u y -+-12
1α)
(2)总体总量(∑==
=N
1
i i Y Y N Y n
N
)
对于简单随机抽样,()
Y Y
ˆE Y =的无偏估计,即是Y ()
()()2221y V N Y ˆV Y ˆS
n
f N -==的方差为:()()
()()22
2
1ˆˆs n
f N y v N Y v Y
V -==的无偏估计为: (3)总体比例
设N 2101Y ,,,,,其他征个单元具有所考虑的特
,若第 =⎩⎨
⎧=i i i ,总体中有A 个单元具有这个特征,即∑==N
i i Y 1A ,总体中具有某种特征的单元在总体中所占的比例P 即
是Y 的均值:Y Y N
i i ===∑=1
N 1N A Y ;
总体方差为:()⎪⎭⎫ ⎝⎛--=--=∑∑==N i i N i i Y N Y N Y Y N S 1222
121111,由于i Y 的取值为0或1 ,所以∑∑===N
i i N
i i Y Y 1
1
2
,即()
P Q
PQ N N NP NP N S -=-=--=
1ˆ1
1122,其中. 相应地,样本比例为y n
y
n
a
p n
i i
==
=∑=1
,