抽样调查-第2章 简单随机抽样
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
调查的总体目标量主要有: 总体总量 Y;总体均值 Y ;总体某一指标的 比例 P;两个总体总量的比率 R。 对估计精度进行计算时,要涉及到总体方差和
样本方差等。下面分别列出:
.
返回
总体方差
S2N11 iN 1(Yi Y)2
样本方差
s2
1 n n1i1
(yi
y)2
还有一些其他符号,分别说明如下:
.
个C Nn样本中,包含某
个特定单元
Y
的样本数为:
i
C11CN每n11个样本被
抽中的概率为:CNn11
/
CNn
。 n
N
同时包含两个特定单元 Y i Y j 的样本数为
C22CNn22 每个样本被抽中的概率为:
C22CN n22/CN n N n((nN11))
.
返回
引理二 从总体规模为N的总体中抽取一个样 本量为n的简单随机样本。若对总体中的每个单
N
有限总体校正系数。
.
返回
证明方法一
V ( y ) V [ 1 n
n i1
yi]
V [1 n
N
a iY i ]
i1
1 n2
[
来自百度文库
N i1
Y i 2V
(ai)
2
N
Y iY
i j
j
cov(
a i , a j )]
1 n2
{
N i1
Yi2
.
返回
第二种方法证明
E(y)Y
证明:对于一个大小为N的总体,样本量为n的
简单随机样本有C
n N
个,因此
.
返回
1
1 C
n N
E(y)
C
n N
i1 n ( y1 y2
yn)
1 C
n N
nC
n N
(Yi1 Yi2
i1
Yin )
1
nC
n N
[
n
(
C
n N
Y 1
1 1
C
n N
11Y
2
到的总体指标的估计。如
Y,Y,P,R 称为 Y,Y,P,R 的估计。
估计量的方差用V表示,如 V (Y );
标准差用S表示,如 S(Y) V(Y).
对
V
(Y
)
的样本估计不用 V (Y ) 而用 v (Y )
S(Y)的估 s(Y计 )v(用 Y)表.示
称
n N
为抽样比,记为f.
.
返回
§2.2 简单估计量及其性质
C
Y n 1
N 1 N
)]
1 N
N
Yi Y
i1
.
返回
其他几个估计量的无偏性可容易推出:
1、对于总体总量
YN y,E (Y)E (N y)N YY
2、对于总体比例
Pp,E(P)E(p)P
.
返回
性质2 对于简单随机抽样,y 的方差为:
V( y )=NnS21f S2 (2.5)
Nn n 式中,n为样本量;f= n 为抽样比;1-f为
(不放回简单随机抽样所有可能的样本)
1,2
2,3
1,3
3,4
2,4
4,5
1,4
3,5
2,5
1,5
在实际工作中,更多地采用不放回简单随机抽样,所以 以下讨论的简单随机抽样一般都指不放回简单随机抽样.
.
返回
二、符号
大写字母表示总体单元的标志值:如
Y1,Y2,,YN
小写字母表示样本单元的标志值:如
y1,y2,,yn
§2.1 定义与符号
一、定义
简单随机抽样:从含有N个单元的总体中随机
抽取n个单元组成样本。
1.若抽样是放回的,则所有可能的样本有 N n
个,每个样本被抽中的概率为 法称为放回简单随机抽样。
1 N
n ,这种抽样方
2.若抽样是不放回的,则所有可能的样本有
C
n N
个,每个样本被抽中的概率为
1
C
n N
,这种抽样方
无论调查对象是何种总体参数,其实所有估计 量通常都是样本均值的某种线性组合,因此在抽样 中不管讨论何种估计的基本性质,都只围绕样本均 值进行。而对样本均值这个核心估计量的研究则分 为两个方面:
一方面是求样本均值对所有可能样本的数学期望
(检验估计量是否无偏)。
另一方面是求样本均值对所有可能样本的方差
(检验估计量误差的大小)。
返回
总体
N
YYi Y1Y2YN
i1
YN 1 iN 1YiY 1Y2 N YN
样本
将左边式子中 的大写字母改 为小写字母。
P
A N
N1 iN1Yi
(Yi 0或1)
N
Yi
R
i 1 N
Xi
Y X
Y X
i 1
,S2N11 iN 1(Yi Y)2
N 2
.
N 1
返回
总体指标值上面带符号“ ”的表示由样本得
(放回简单随机抽样所有可能的样本)
1,1
2,1
3,1
4,1
5,1
1,2
2,2
3,2
4,2
5,2
1,3
2,3
3,3
4,3
5,3
1,4
2,4
3,4
4,4
5,4
1,5
2,5
3,5
4,5
5,5
.
返回
【例 2.2】设总体有5个单元(1,2,3,4,5),按 不放回简单随机抽样的方式抽2个单元,则所有可 能的样本为 CNn 10个。
.
返回
为了讨论简单估计的性质,首先我们来看两 个引理:
引理一 从大小为N的总体中抽取一个样本量 为n的简单随机样本,则总体中每个特定单元的 入样概率为:
n N
两个特定单元都入样的概率为:
Cn2 N2 CN n
n N
n 1 N 1
.
返回
引理一的证明:在N个单元中取n个单元为样本,
共有
C
n N
个样本。在
法称为不放回简单随机抽样。
.
返回
注意
1.简单随机抽样是等概抽样,即每个总体单元 都有相同的入样概率;
2.随机抽取是有严格要求的,不是随便抽取, 必须按照某一随机原则进行。
.
返回
【例 2.1】设总体有5个单元(1,2,3,4,5),按 放回简单随机抽样的方式抽2个单元,则所有可
能的样本为 52 25个(考虑样本单元的顺序)
E(y)Y
下面我们用两种与数理统计中不同的方法 来证明这一性质。思考:为什么不能用数理 统计中常用的方法?
.
返回
有了这些准备,我们很容易证明
E(y) Y
a 根据前面提到的关于 的定义,有下式 i
y1 n
ni1
yi
1niN 1aiYi
E(y)1niN 1YiE(ai)1niN 1Yi(Nn)1nNniN 1Yi Y
)
1
n(n1) N(N1)
0(1
n(n1) N(N1)
n(n1) N(N1)
V(ai
)
E[ai
E(ai
)]2
(1
f
)2
n N
(0
f
)2
(1
n) N
f
(1
f
)
cov(ai
,
aj
)
E(aiaj
)
E(ai
)E(aj
)
n(n1) N(N1)
f
2
f
( f 1) N1
.
返回
简单估计量的性质
性质1 y 是 Y 的无偏估计,即
元 Y i ,引进随机变量 a i 如下:
ai 1,若Yi入样 0,若 Yi不入样 i( 1,2,,N)
由二项分布可知:
.
返回
n
n
P{ai 1}N,P{ai 0}1N
P{aiaj
1}N n((nN11)),P{aiaj
0}1n(n1) N(N1)
所以,不难推出:
E(ai
)
1
n N
0(1
n) N
f
E(aiaj
样本方差等。下面分别列出:
.
返回
总体方差
S2N11 iN 1(Yi Y)2
样本方差
s2
1 n n1i1
(yi
y)2
还有一些其他符号,分别说明如下:
.
个C Nn样本中,包含某
个特定单元
Y
的样本数为:
i
C11CN每n11个样本被
抽中的概率为:CNn11
/
CNn
。 n
N
同时包含两个特定单元 Y i Y j 的样本数为
C22CNn22 每个样本被抽中的概率为:
C22CN n22/CN n N n((nN11))
.
返回
引理二 从总体规模为N的总体中抽取一个样 本量为n的简单随机样本。若对总体中的每个单
N
有限总体校正系数。
.
返回
证明方法一
V ( y ) V [ 1 n
n i1
yi]
V [1 n
N
a iY i ]
i1
1 n2
[
来自百度文库
N i1
Y i 2V
(ai)
2
N
Y iY
i j
j
cov(
a i , a j )]
1 n2
{
N i1
Yi2
.
返回
第二种方法证明
E(y)Y
证明:对于一个大小为N的总体,样本量为n的
简单随机样本有C
n N
个,因此
.
返回
1
1 C
n N
E(y)
C
n N
i1 n ( y1 y2
yn)
1 C
n N
nC
n N
(Yi1 Yi2
i1
Yin )
1
nC
n N
[
n
(
C
n N
Y 1
1 1
C
n N
11Y
2
到的总体指标的估计。如
Y,Y,P,R 称为 Y,Y,P,R 的估计。
估计量的方差用V表示,如 V (Y );
标准差用S表示,如 S(Y) V(Y).
对
V
(Y
)
的样本估计不用 V (Y ) 而用 v (Y )
S(Y)的估 s(Y计 )v(用 Y)表.示
称
n N
为抽样比,记为f.
.
返回
§2.2 简单估计量及其性质
C
Y n 1
N 1 N
)]
1 N
N
Yi Y
i1
.
返回
其他几个估计量的无偏性可容易推出:
1、对于总体总量
YN y,E (Y)E (N y)N YY
2、对于总体比例
Pp,E(P)E(p)P
.
返回
性质2 对于简单随机抽样,y 的方差为:
V( y )=NnS21f S2 (2.5)
Nn n 式中,n为样本量;f= n 为抽样比;1-f为
(不放回简单随机抽样所有可能的样本)
1,2
2,3
1,3
3,4
2,4
4,5
1,4
3,5
2,5
1,5
在实际工作中,更多地采用不放回简单随机抽样,所以 以下讨论的简单随机抽样一般都指不放回简单随机抽样.
.
返回
二、符号
大写字母表示总体单元的标志值:如
Y1,Y2,,YN
小写字母表示样本单元的标志值:如
y1,y2,,yn
§2.1 定义与符号
一、定义
简单随机抽样:从含有N个单元的总体中随机
抽取n个单元组成样本。
1.若抽样是放回的,则所有可能的样本有 N n
个,每个样本被抽中的概率为 法称为放回简单随机抽样。
1 N
n ,这种抽样方
2.若抽样是不放回的,则所有可能的样本有
C
n N
个,每个样本被抽中的概率为
1
C
n N
,这种抽样方
无论调查对象是何种总体参数,其实所有估计 量通常都是样本均值的某种线性组合,因此在抽样 中不管讨论何种估计的基本性质,都只围绕样本均 值进行。而对样本均值这个核心估计量的研究则分 为两个方面:
一方面是求样本均值对所有可能样本的数学期望
(检验估计量是否无偏)。
另一方面是求样本均值对所有可能样本的方差
(检验估计量误差的大小)。
返回
总体
N
YYi Y1Y2YN
i1
YN 1 iN 1YiY 1Y2 N YN
样本
将左边式子中 的大写字母改 为小写字母。
P
A N
N1 iN1Yi
(Yi 0或1)
N
Yi
R
i 1 N
Xi
Y X
Y X
i 1
,S2N11 iN 1(Yi Y)2
N 2
.
N 1
返回
总体指标值上面带符号“ ”的表示由样本得
(放回简单随机抽样所有可能的样本)
1,1
2,1
3,1
4,1
5,1
1,2
2,2
3,2
4,2
5,2
1,3
2,3
3,3
4,3
5,3
1,4
2,4
3,4
4,4
5,4
1,5
2,5
3,5
4,5
5,5
.
返回
【例 2.2】设总体有5个单元(1,2,3,4,5),按 不放回简单随机抽样的方式抽2个单元,则所有可 能的样本为 CNn 10个。
.
返回
为了讨论简单估计的性质,首先我们来看两 个引理:
引理一 从大小为N的总体中抽取一个样本量 为n的简单随机样本,则总体中每个特定单元的 入样概率为:
n N
两个特定单元都入样的概率为:
Cn2 N2 CN n
n N
n 1 N 1
.
返回
引理一的证明:在N个单元中取n个单元为样本,
共有
C
n N
个样本。在
法称为不放回简单随机抽样。
.
返回
注意
1.简单随机抽样是等概抽样,即每个总体单元 都有相同的入样概率;
2.随机抽取是有严格要求的,不是随便抽取, 必须按照某一随机原则进行。
.
返回
【例 2.1】设总体有5个单元(1,2,3,4,5),按 放回简单随机抽样的方式抽2个单元,则所有可
能的样本为 52 25个(考虑样本单元的顺序)
E(y)Y
下面我们用两种与数理统计中不同的方法 来证明这一性质。思考:为什么不能用数理 统计中常用的方法?
.
返回
有了这些准备,我们很容易证明
E(y) Y
a 根据前面提到的关于 的定义,有下式 i
y1 n
ni1
yi
1niN 1aiYi
E(y)1niN 1YiE(ai)1niN 1Yi(Nn)1nNniN 1Yi Y
)
1
n(n1) N(N1)
0(1
n(n1) N(N1)
n(n1) N(N1)
V(ai
)
E[ai
E(ai
)]2
(1
f
)2
n N
(0
f
)2
(1
n) N
f
(1
f
)
cov(ai
,
aj
)
E(aiaj
)
E(ai
)E(aj
)
n(n1) N(N1)
f
2
f
( f 1) N1
.
返回
简单估计量的性质
性质1 y 是 Y 的无偏估计,即
元 Y i ,引进随机变量 a i 如下:
ai 1,若Yi入样 0,若 Yi不入样 i( 1,2,,N)
由二项分布可知:
.
返回
n
n
P{ai 1}N,P{ai 0}1N
P{aiaj
1}N n((nN11)),P{aiaj
0}1n(n1) N(N1)
所以,不难推出:
E(ai
)
1
n N
0(1
n) N
f
E(aiaj