抽样调查-第2章简单随机抽样

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一方面是求样本均值对所有可能样本的数学期望
(检验估计量是否无偏)。
另一方面是求样本均值对所有可能样本的方差
(检验估计量误差的大小)。
返回
为了讨论简单估计的性质,首先我们来看两 个引理:
引理一 从大小为N的总体中抽取一个样本量 为n的简单随机样本,则总体中每个特定单元的 入样概率为:
n N
两个特定单元都入样的概率为:
E(aia j ) 1 N (N 1) 0 (1 N (N 1) N (N 1)
V (ai )
E[ai
E(ai )]2
(1
f )2
n N
(0
f )2 (1
n) N
f
(1
f)
cov(ai , a j )

E(aia j ) E(ai )E(a j )
C n2 N 2 CNn

n N
n 1 N 1
返回
引理一的证明:在N个单元中取n个单元为样本,
共有
C
n N
个样本。在
C
n N
个样本中,包含某
个特定单元 Yi
的样本数为:C11C
n 1 N 1
每个样本被
抽中的概率为:CNn11 / CNn

n N

同时包含两个特定单元 Yi Y j 的样本数为
(不放回简单随机抽样所有可能的样本)
1,2
2,3
1,3
3,4
2,4
4,5
1,4
3,5
2,5
1,5
在实际工作中,更多地采用不放回简单随机抽样,所以 以下讨论的简单随机抽样一般都指不放回简单随机抽样.
返回
二、符号
大写字母表示总体单元的标志值:如 Y1,Y2 ,,YN
小写字母表示样本单元的标志值:如 y1, y2 ,, yn
y

1 n
n i1
yi

1 n
N i1
aiYi
E(y)
1 n
N
YiE(ai )
i1
1 n
N i1
Yi
(
n N
)

1 n nN
N
Yi
i1
Y
返回
第二种方法证明
E(y) Y
证明:对于一个大小为N的总体,样本量为n的
简单随机样本有CNn 个,因此
返回
E( y) 1
法称为不放回简单随机抽样。
返回
注意
1.简单随机抽样是等概抽样,即每个总体单元 都有相同的入样概率;
2.随机抽取是有严格要求的,不是随便抽取, 必须按照某一随机原则进行。
返回
【例 2.1】设总体有5个单元(1,2,3,4,5),按 放回简单随机抽样的方式抽2个单元,则所有可 能的样本为 52 25 个(考虑样本单元的顺序)
i 1
n N
n
(Yi Y )2
i 1
E[ i j
( yi
Y)(y j
Y)]
n(n 1) N(N 1)
i j
(Yi
Y )(Yj
Y)
返回
因此有
V (y)

1 n2
n
E[
i1
( yi
Y )2 ]
1 n2
E[
i j
( yi
Y)(y j
Y )]
N2 1
f
S2
n

V (P)
V ( p)

1
f
1 NP(1 P)
n n 1
返回
总体总量的估计量方差是总体均值方差的直接 推导,下面我们来推导总体比例估计量的方差。
1 f 1
V (P)
NP(1 P)
n N 1
只需证明此时S 2 1 NP(1 P)即可。 N 1
返回
设N个样本单元中有N1个具有某一特 性,即有N1个单元取值为1,有N-N1个单元 取值为0.
f ) 2 YiY j [
i j
n N
(1 f ) ]} N 1
1 n2
n (1 N
f
N
)[
i 1
Yi 2
2
1
N
(
N 1 i j
YiY j )
1 f nN
[N N 1
N
Yi 2
i 1

1 N 1
(
N i 1
Yi
)2
]

1 f
N
[
n( N 1) i1
§2.1 定义与符号
一、定义
简单随机抽样:从含有N个单元的总体中随机
抽取n个单元组成样本。
1.若抽样是放回的,则所有可能的样本有 N n
个,每个样本被抽中的概率为 法称为放回简单随机抽样。
N1n,这种抽样方
2.若抽样是不放回的,则所有可能的样本有
C
n N
个,每个样本被抽中的概率为
1 CNn
,这种抽样方
可以看出,影响估计量方差的因素有:
①样本量n;
②总体方差 S 2;
③总体未入样比率1-f
分析见教材P38,39
返回
注意
N通常很大,当f<0.05时,可将1f近似取为1,这时影响估计量方差的
主要因素是样本量n和总体方差S2 。S2
的大小是我们无法改变的,因此,要 提高估计量的精度就只有加大样本量。
返回
返回
证明方法二:由定义
V (y)

E(y
Y )2

E(1ຫໍສະໝຸດ Baidun
n i1
yi
Y )2

1 n2
n
E[
i1
( yi
Y )]2

1 n2
n
E[
i1
( yi
Y )2 ]
1 n2
E[
i j
( yi
Y )(y j
Y )]

n
E[ ( yi Y )2 ]
C
n N
C
n N
i 1
1 n
(
y1

y2

yn
)
1
nCNn
C
n N
(Yi1 Yi2
i 1
Yin )

1 nCNn
[n(CNn11Y1

CNn11Y2

CNn11YN
)]

1 N
N
Yi
i 1
Y
返回
其他几个估计量的无偏性可容易推出:
1、对于总体总量
N i1
(Yi
Y )2
N 2
N 1
返回
总体指标值上面带符号“ ”的表示由样本得
到的总体指标的估计。如

Y ,Y , P, R 称为 Y ,Y , P, R 的估计。

估计量的方差用V表示,如 V (Y );


标准差用S表示,如 S(Y ) V (Y ).

V

(Y
Yi 2

N( 1 N
N
Yi )2 ]
i 1
返回

1 n( N
f 1)
[
N i 1
Yi 2

2
NY ]

1 f n( N 1)
N
(Yi 2
Y
2
)
i 1

1 f n( N 1)
N
(Yi
i 1
Y )2
S 2 (1 f ) n
即 V (y) 1 f S 2 n
n(n 1) N (N 1)

f
2


f
( f 1) N 1
返回
简单估计量的性质
性质1 y 是 Y 的无偏估计,即
E(y) Y
下面我们用两种与数理统计中不同的方法 来证明这一性质。思考:为什么不能用数理 统计中常用的方法?
返回
有了这些准备,我们很容易证明
E(y) Y
根据前面提到的关于 ai的定义,有下式
由二项分布可知:
返回
P{ai
1}
n N
, P{ai

0} 1
n N
P{aia j
1}
n(n 1) N (N 1)
, P{aia j

0} 1
n(n 1) N (N 1)
所以,不难推出:
E(ai ) 1
n N
0 (1
n) N
f
n(n 1)
n(n 1) n(n 1)
n N 1
返回
同样下面我们从关系式
v( y) 1 f s2 n
可以推出

v(Y
)

v(N
y)

N
2
1

f
s2
n

1 f 1
1 f
v(P) v( p)
np(1 p) p(1 p)
n n 1
n 1
返回
估计量的方差 V ( y)是衡量估计量精度的度量。 从式 V ( y) 1 f S 2 n
返回
总体
N
Y Yi Y1 Y2 YN
i1
Y

1 N
N
Yi
i1

Y1
Y2
YN N
样本
将左边式子中 的大写字母改 为小写字母。
P

A N

1 N
N
Yi
i1
(Yi 0或1 )
N
Yi
R
i1 N
Xi

Y X

Y X
i1
,S 2

1
N
1
1 [ n(N 1) S 2 n N n S 2 ]
n 1 N
nN
S 2 [n(N 1) (N n)] S 2 N (n 1)
返回
下面我们从关系式
V ( y) 1 f S 2 n
可以推出其他几个估计量的方差

V (Y ) V (N y) N 2V ( y)
N i 1
(Yi
Y)2]
返回

1 nN
(1
n 1) N 1
N i1
(Yi
Y)2

n 1 [ N 1
N i1
(Yi

Y
)]2



1 nN
N n N 1
N
(Yi
i 1
Y)2

1 n
N n N
1 N 1
N i 1
(Yi
Y)2

N n nN
S2

1 N
1
[
N1
(1

N1 )2 N

(N

N1
)(
N1 N
)
2
]
1 N1(N N1) N N1 N N1
N 1 N
N 1 N N
1 NP(1 P) N 1
返回
同理对样本方差有
s 1 np(1 p) n 1
因此

V (P)

1
f
1 NP(1 P)
S2
即 V ( y) 1 f S 2 n
返回
性质3 V( y )的无偏估计为:
v( y) 1 f s2 式中,s2 为样本方差。
n
证明:将s 2 改写成:
s 2

1 n 1
n i 1
( yi

y)2

1[ n 1
n i1
( yi
Y
)2

n( y
Y
)2]
返回
由前面性质1证明用过的对称论证法有:
调查的总体目标量主要有:
总体总量 Y;总体均值 Y ;总体某一指标的
比例 P;两个总体总量的比率 R。 对估计精度进行计算时,要涉及到总体方差和
样本方差等。下面分别列出:
返回
总体方差
S2

1
N
1
N i1
(Yi
Y )2
样本方差
s 2

1 n 1
n i 1
( yi

y)2
还有一些其他符号,分别说明如下:
n
E[ ( yi Y )2 ]
i 1
n N
N
(Yi Y )2
i 1

n(N 1) S 2 N
由性质2有:
E(y Y)2 1 f S2 N n S2
n
nN
返回
E(s2 )

1 {E[ n 1
n i 1
( yi
Y )2 ]
nE( y
Y )2}
有限总体校正系数。
返回
证明方法一
1 n
1N
V ( y) V[ n
i 1
yi ] V [ n
aiYi ]
i 1

1 n2
N
N
[ Yi 2V (ai ) 2
i 1
i j
YiY j
c ov(ai , a j )]

1 n2
{
N i 1
Yi 2
n N
(1
N


Y N y, E(Y ) E(N y) NY Y
2、对于总体比例


P p, E(P) E( p) P
返回
性质2 对于简单随机抽样,y 的方差为:
V( y)=N n S 2 1 f S 2 (2.5)
Nn
n
式中,n为样本量;f= n 为抽样比;1-f为 N

1 n2
n N
n
(Yi
i 1
Y)2

1 n2
n(n 1) N(N 1)
(Yi
i j
Y )(Yj
Y)

1 nN
N
(Yi
i1
Y)2

1 n2
(n 1) (N 1)
i j
(Yi
Y )(Yj
Y)

n 1 N 1
N i 1
(Yi
Y)2

n 1 N 1
(放回简单随机抽样所有可能的样本)
1,1
2,1
3,1
4,1
5,1
1,2
2,2
3,2
4,2
5,2
1,3
2,3
3,3
4,3
5,3
1,4
2,4
3,4
4,4
5,4
1,5
2,5
3,5
4,5
5,5
返回
【例 2.2】设总体有5个单元(1,2,3,4,5),按 不放回简单随机抽样的方式抽2个单元,则所有可
能的样本为 CNn 10 个。
【例2.3】我们从某个N=100的总体中抽出一个
大小为n=10的简单随机样本,要估计总体平均水 平并给出置信度95%的置信区间。
序号i 1 2 3 4 5 6 7 8 9 10
C C2 n2 2 N 2
每个样本被抽中的概率为:
C C2 n2 2 N 2
/
CNn

n(n 1) N (N 1)
返回
引理二 从总体规模为N的总体中抽取一个样 本量为n的简单随机样本。若对总体中的每个单
元 Yi ,引进随机变量 ai 如下:
ai

1,
若Yi入样

0,若Yi不入样(i 1,2,, N )
)


的样本估计不用 V (Y ) 而用 v(Y )



S(Y )的估计用s(Y ) v(Y )表示.

n N 为抽样比,记为f.
返回
§2.2 简单估计量及其性质
无论调查对象是何种总体参数,其实所有估计 量通常都是样本均值的某种线性组合,因此在抽样 中不管讨论何种估计的基本性质,都只围绕样本均 值进行。而对样本均值这个核心估计量的研究则分 为两个方面:
相关文档
最新文档