抽样技术期末知识点(附考点大题)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

抽样期末知识点汇总

一.绪论

(一)抽样调查

抽样调查是指非全面调查的总称。只要是从研究的对象中抽取部分单位加以调查,用来说明全体,就统称为抽样调查。(广义)

选样方法:非概率抽样&概率抽样

1.非概率抽样

抽样方法:目的抽样、判断抽样、任意抽样、方便抽样、配额抽样(盖洛普民意测验、自愿样本

原因:

(1)受客观条件限制,无法进行严格的随机抽样。

(2)为了快速获得调查结果。

(3)在调查对象不确定,或无法确定的情况下采用,例如,对某一突发(偶然)事件进行现场调查等。

(4)总体各单位间离散程度不大,且调查员具有丰富的调查经验时。

优点:成本低,而且容易完成;

缺点:不能对估计的精度作出客观、准确的说明。

2.概率抽样(狭义抽样调查)

按照概率统计的原理,从研究的总体中按随机原则来抽选样本,通过对样本的调查获取数据,以此来对总体的特征作出估计推断;对推断中可能出现的抽样误差可以从概率的意义上加以控制。

特点:

(1)对于一个具体的调查,要求总体中的每一个单元都有一个已知的非零概率被抽中。

(2)抽取样本的方法必须是随机的。

(3)根据样本来计算估计值的方法,应符合抽样的方法确定合适的估计量。

(4)能够以一定的概率控制抽样误差的范围。

概率抽样:等概率抽样&不等概率抽样

(二)抽样调查的常用概念

1. 目标总体:可简称为总体,是指所要研究对象的全体,或者说是希望从中获取信息的总体,它是由研究对象中所有性质相同的个体所组成,组成总体的各个个体称作总体单元或单位。

2.抽样总体:指从中抽取样本的总体。

3.抽样框:抽样总体的具体表现。通常抽样框是一份包含所有抽样单元的名单。

4.总体参数:总体的特征。

5. 统计量(估计量):样本观察值的函数。

6.抽样误差:由于抽样的非全面性和随机性所引起的偶然性误差。

7.非抽样误差:由随机抽样的偶然性因素以外的原因所引起的误差。

8.抽样误差表现形式:抽样实际误差、抽样标准误和抽样极限误差。

9. 抽样标准误(S ),抽样方差(V ),V=S 2

10.偏差:样本估计量的数学期望与总体真值间的离差,ˆˆE()-()ˆB θθθ=。 11.均方误差:22ˆˆˆ()()()MSE E θ

-θV θB θ==+。 12.精确度:每次抽样结果之间差别大小

13.精度:估计量的抽样标准误差或方差与待估计参数之比。 14.可靠性:置信度(1-a )

15.抽样效率:两个抽样方案在样本量相同的情况下的抽样方差之比。

16.设计效果:ˆ()ˆ()D SRS V Deff V θθ

=

SRS

ˆ()ˆ()D V V θ

θ表示某设计方案的方差,表示相同样本量下简单随机抽样的方差。

17. 1-f 称为有限总体校正系数(finite population correction ,简记为fpc ),当抽样比f 很小时,1-f 就接近于1,这样抽样比对y 的精度就没有直接影响;一般地,当抽样比小于5%,甚至小于10%时,fpc 可以忽略不计,即认为1-f 为1;事实上略去fpc 的影响是使()V y 高了一些 18.抽样调查步骤

确定调研问题——抽样方案设计——问卷设计 ——实施调查过程 ——数据处理分析——撰写调查报告

二.简单随机抽样SRS

(一)定义:从容量为N的总体中抽取一个容量为n的样本,若所有可能的

n

N

C个

样本中的每一个被抽到的概率都相等,即每个可能样本被抽中的概率均为1

n

N C,

这种抽样方法称为不放回的简单随机抽样,简称简单随机抽样,所得的样本称为不放回的简单随机样本,简称简单随机样本

(二)实施方法:将总体中的单元依次从1到N进行编号,然后利用抽签法或随机数法来进行简单随机抽样。

(三)优点:简单直观。在抽样框完整时,可以直接从中抽选样本,由于抽选的概率相同,用样本统计量对目标量进行估计及计算抽样误差都比较方便。(四)局限性:它要求将包括所有总体单元的名单作为抽样框,当N很大时,构造这样的抽样框并不容易;根据这种方法抽出的单元很分散,给实施调查增加了困难;这种方法没有利用其他辅助信息以提高估计的效率。所以在规模较大的调查中,很少直接采用简单随机抽样,一般是把这种方法与其他抽样方法结合在起使用。

(五)估计

(1)总体均值

对于简单随机抽样,Y y 是的无偏估计。即Y y E =)

( 对于简单随机抽样,2

21V S n

f S nN n N y y -=-=)

(的方差为: ()2

1)(s n

f y v y V -=

的无偏估计为: 的近似置信区间为的置信度为α-1Y (s n f u

y ---

12

,s n f

u y -+-12

1α)

(2)总体总量(∑==

=N

1

i i Y Y N Y n

N

对于简单随机抽样,()

Y Y

ˆE Y =的无偏估计,即是Y ()

()()2221y V N Y ˆV Y ˆS

n

f N -==的方差为:()()

()()22

2

1ˆˆs n

f N y v N Y v Y

V -==的无偏估计为: (3)总体比例

设N 2101Y ,,,,,其他征个单元具有所考虑的特

,若第 =⎩⎨

⎧=i i i ,总体中有A 个单元具有这个特征,即∑==N

i i Y 1A ,总体中具有某种特征的单元在总体中所占的比例P 即

是Y 的均值:Y Y N

i i ===∑=1

N 1N A Y ;

总体方差为:()⎪⎭⎫ ⎝⎛--=--=∑∑==N i i N i i Y N Y N Y Y N S 1222

121111,由于i Y 的取值为0或1 ,所以∑∑===N

i i N

i i Y Y 1

1

2

,即()

P Q

PQ N N NP NP N S -=-=--=

1ˆ1

1122,其中. 相应地,样本比例为y n

y

n

a

p n

i i

==

=∑=1

相关文档
最新文档