第二章(简单随机抽样)

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

样本编号 1 2 3 4 5 6 7 8 9 10 平均方差单元一 0 0 0 0 1 1 1 3 3 5 单元二 1 3 5 6 3 5 6 5 6 6 样本均值 0.5 1.5 2.5 3 2 3 3.5 4 4.5 5.5 3 1.95 样本偏差 -2.5 -1.5 -0.5 0 -1 0 0.5 1 1.5 2.5 0 样本偏差的平方 6.25 2.25 0.25 0 1 0 0.25 1 2.25 6.25 1.95 样本方差 0.5 4.5 12.5 18 2 8 12.5 2 4.5 0.5 6.5
1 ∑ Yi = N i =1
N
∑Y
i =1
N
i
=Y
性质二
ຫໍສະໝຸດ Baidu
对于简单随机抽样，V（y） =
1− f 2 n S , 其中f = ，为抽样比。 n N
证明：
n 1 n 1 2 V（y） E ( y − Y ) = E[ ∑ yi − Y ] = 2 E[∑ ( yi − Y )]2 = n i =1 n i =1 2
引入一个0 引入一个0-1变量
αi
1 i ∈s = 0 i ∉s
n P(αi =1) = = f N
n E(αi ) = E(α ) = N
2 i
n n n n 2 V(αi ) = E(αi ) − E(αi ) = − = (1− ) = f (1− f ) N N N N
ˆ ˆ s (Y ) = v(Y ) ≈ 1.3115
• 由置信度95%对应的t = 1.96 ，因此，可95% 的把握说总体平均水平大约在 5 ± 1.96 × 1.3115 之间，即2.4295和7.5705之间。
例子
• 我们从某个Ｎ＝100的总体中抽出一个大小为n=10的简单随机样本，要估计总体平均水平并给出置信度为95%的区间估计。如表：
n
∑Y
i =1
N
i
1 1 1 E[∑ ( yi − Y )2 ] = [(1 − Y )2 + (2 − Y )2 ] × + [(1 − Y )2 + (3 − Y )2 ]× + [(3 − Y )2 + (2 − Y )2 ]× 3 3 3 i =1 2 = [(3 − Y )2 + (2 − Y )2 + (1 − Y )2 ] 3 n N = ∑ (Yi − Y )2 N i =1
1 n( N − 1) 2 N −n 2 = S −n S ] = S2 [ n −1 N nN
1− f 2 1− f 1− f 2 2 所以，E[v( y )] = E ( )s = E (s ) = S n n n
• 大样本下，抽样调查估计量渐进正态
θˆ − θ ~ N (0,1) ˆ) S (θ
• 简单随机抽样的抽取原则：
– （1）按随机原则取样； – （2）每个抽样单元被抽中的概率都是已知的或事先确定的； – （3）每个抽样单元被抽中的概率都是相等的。
2、不放回抽样和放回抽样、
a) 对于一个大小为N的总体，抽取一个样本量为n的样本，若全部可能样本每个被抽中的概率都相等（？）则这种抽样称为不放回的简单随机抽样，所得的样本称为不放回的简单随机样本(simple random sampling without replacement)。
1 N n −1 2 = [∑ (Yi − Y ) + ∑ (Yi − Y )(Y j − Y ) nN i =1 N −1 i≠ j n −1 N n −1 N + (Yi − Y ) 2 − (Yi − Y ) 2 ] ∑ ∑ N − 1 i =1 N − 1 i =1
1 n −1 N n −1 N 2 = {(1 − )∑ (Yi − Y ) + [∑ (Yi − Y )]2 } N − 1 i =1 N − 1 i =1 nN
序号１ yi 4 ２ 5 ３ 2 简单随机样本的指标值４５６７ 2 3 4 5 ８ 4 ９ 13 １０ 6
n 1 1 2 = 2 E[∑ ( yi − Y ) ] + 2 E[∑ ( yi − Y )( y j − Y )] n n i =1 i≠ j
n 1 = N n2
n(n − 1) 1 ∑ (Yi − Y ) + N ( N − 1) n 2 i =1
N 2
∑ (Y − Y )(Y
i≠ j i
j
−Y )
二、估计量总体均值的估计总体均值的期望总体均值的方差总体总量的估计总体均值的期望总体均值的方差总体比例的估计总体均值的期望总体均值的方差
E ( y ) V ( y)
ˆ E ( y)
ˆ V (y)
2
E ( p) D ( p)
V ( y) = S ?
总体均值的估计
统计量
1 Y = N
N N N 1 n 1 2 2 = (1 − ) ( N − 1)∑ Yi − (∑ Yi ) + ∑ Yi 2 n N N ( N − 1) i =1 i =1 i =1
N 1 n 1 N 2 2 = (1 − ) N ∑ Yi − (∑ Yi ) n N N ( N − 1) i =1 i =1
1 N −n N = (Yi − Y ) 2 ∑ nN N − 1 i =1
N − n 2 1− f 2 = S = S nN n
利用0 利用0-1变量来证明性质二
N N 1 N 1 N 2 V ( y) = 2 V ∑αiYi = 2 ∑Yi V (αi ) + ∑∑YiYj covV (αi ,α j ) n i=1 i =1 j ≠i n i=1
9 0
10 8
yi
1 n 50 y = ∑ yi = =5 n i =1 10
1 n 172 s = ( yi − y ) 2 = ≈ 19.1111 ∑ n − 1 i =1 9
2
解：
ˆ = y =5 Y
ˆ ) = 1 − f s 2 = 1 − 0.1 × 19.1111 ≈ 1.72 v(Y n 10
简单估计量的三大性质
性质一：对于简单随机抽样，y是Y 的无偏估计，即E ( y ) = Y 。
性质二：对于简单随机抽样，V（y） =
1− f 2 n S , 其中f = ，为抽样比。 n N
性质三：V（y）的样本无偏估计v( y ) =
1− f 2 s , 即E[v( y )] = V ( y)。 n
简单随机抽样在抽样理论中的地位
优点：简单随机抽样在抽样理论中占有重要地位，它是其它抽样方法的基础，其理论也最为成熟。其它许多方法都是建立在简单随机抽样的基础上。缺点：要求每一个单元都有一个号码，这意味着必须有一个包含所有单元的完整抽样框，而当N很大时，这点常常是不具备的；由此得到的样本很分散，不利于调查。例如，对全国进行人口调查，总体单元超过12亿，要对全国每个人都编上号，编制一个完整的抽样框实际上是不可能的。即使可能，当抽到一个人也很难找到。
b) 考虑放回情形，此时样本中的单元有可能重复出现，如果每个
被随机抽样抽中的概率也相等，则称为放回的简单随机抽样放回的简单随机抽样 (simple random sampling with replacement)。
思考：两者之间的比较。思考：两者之间的比较。
【例2.1】例2.1 • 设总体有5个单元（1、2、3、4、5），按放回简单随机抽样的方式抽取2个单元，则所有可能的样本为25个（考虑样本单元的顺序）：
性质一
对于简单随机抽样，y是Y 的无偏估计，即E ( y ) = Y 。
证明：由对称法可以得到 n 引理一：E (∑ yi ) = N i =1
n
n
∑Y
i =1
N
i
N
n 引理二：E[∑ ( yi − Y ) 2 ] = N i =1
(Yi − Y ) 2 ∑
i =1
n 1 1 n 所以E ( y ) = E (∑ yi ) = n i =1 nN
1 = 2 n
n n N 2 N N n n 1 (1 − )∑ Yi − ∑∑ YiY j (1 − ) N N i =1 N N N − 1 i =1 j ≠ i
1 n n N 2 1 N N = 2 (1 − ) ∑ Yi − ∑∑i YiY j n N N i =1 N − 1 i =1 j ≠
∑Y
i =1
N
i
1 n y = ∑ yi n i =1
简单估计量：在没有其他总体信息的条件下，对总体的估计。用样本估计总体，是抽样调查的最基本思想。
例：设总体{0,1,3,5,6}，计算可得总体均值Y = 3, 总体方差σ 2 = 5.2，总体修正方差S2 = 6.5.给出n = 2的全部样本。并且验证E ( y ) = Y , E ( s 2 ) = S 2。
1，2 ， 1，3 ， 1，4 ， 1，5 ， 2，3 ， 2，4 ， 2，5 ， 3，4 ， 3，5 ， 4，5 ，
3、随机抽选方法、
• 抽签法实质就是盒子模型，用上述两种方法之一从盒子中抽取n张签。 • 随机抽取 a 随机数骰子 b 随机数表 c 计算机产生 d 物理方法例：设N=872，n=10,利用随机抽取一个简单随机样本。例：设N=327，n=5,利用随机抽取一个简单随机样本。
关于证明方法的两大说明
• 对性性原理
• 引进0-1变量
对称法的说明
例子：在总体（例子：在总体（１，２，３）中，取n=2 的样本。的样本。
n
样本编号１２３
样本１，２１，３２，３
样本均值 1.5 2 2.5
1 1 1 2 n E (∑ yi ) = (1 + 2) × + (1 + 3) × + (2 + 3) × = × (1 + 2 + 3) = 3 3 3 3 N i =1
1，1 ， 1，2 ， 1，3 ， 1，4 ， 1，5 ， 2，1 ， 2，2 ， 2，3 ， 2，4 ， 2，5 ， 3，1 ， 3，2 ， 3，3 ， 3，4 ， 3，5 ， 4，1 ， 4，2 ， 4，3 ， 4，4 ， 4，5 ， 5，1 ， 5，2 ， 5，3 ， 5，4 ， 5，5 ，
【例2.2】例2.2 • 设总体有5个单元（1、2、3、4、5），按不放回简单随机抽样的方式抽取2个单元，则所有可能的样本为个：
2
[
]
2
n n −1 ) E(αiα j ) = p(αi =1&α j =1 = ) ( N N −1
cov(αi ,α j ) = E(αiα j ) − E(αi )E(α j )
n n n = (1− ) − N N N
2
1 n n f (1− f ) (1− ) = − =− N −1 N N N −1
| θˆ − θ | P( ≤ µα ) = 1 − α ˆ) S (θ
[θ ± µ S (θˆ)]
α
【例2.3】例2.3
• 我们从某个N=100的总体中抽出一个大小为 n=10的简单随机样本，要估计总体平均水平并给出置信度为95%的区间估计。
序号
i
1 4
2 5
3 2
4 0
5 4
6 6
7 6
8 15
S2 = (1 − f ) n
性质三
1− f 2 V（y）的样本无偏估计v( y ) = s , 即E[v( y )] = V ( y)。 n 证明：
1 n E ( s 2 ) = E[ ( yi − y ) 2 ] ∑ n − 1 i =1
n 1 = {E[∑ ( yi − Y ) 2 ] − nE ( y − Y ) 2 } n −1 i =1
抽样调查课----简单随机抽样抽样调查课简单随机抽样
单位: 浙江财经学院数统学院课程: 抽样调查课教师: 张锐
目录
一、简单抽样的概念和抽选方法二、估计量三、样本量的确定四、简单抽样的其他问题
一、简单随机抽样的概念和抽选方法
1、简单介绍 2、不放回随机抽样和放回随机抽样 3、随机抽选方法
1、抽样方法简介
１、简单随机抽样(simple 简单随机抽样 random sampling) 从总体中随机无放回地，等概率地抽取样本。
特点：各组样本被抽到的可能性相等特点：各组样本被抽到的可能性相等。最简单的抽样方式，抽样理论最完善，是抽样理论的基础。当总体相当大时，由于组织工作与具体技巧上的困难而很少直接采用，但它是其它随机抽样的基础。但实际当中直接采用该方法的并不多。