第二章(简单随机抽样)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本编号 1 2 3 4 5 6 7 8 9 10 平均 方差 单元一 0 0 0 0 1 1 1 3 3 5 单元二 1 3 5 6 3 5 6 5 6 6 样本均值 0.5 1.5 2.5 3 2 3 3.5 4 4.5 5.5 3 1.95 样本偏差 -2.5 -1.5 -0.5 0 -1 0 0.5 1 1.5 2.5 0 样本偏差的 平方 6.25 2.25 0.25 0 1 0 0.25 1 2.25 6.25 1.95 样本方差 0.5 4.5 12.5 18 2 8 12.5 2 4.5 0.5 6.5
1 ∑ Yi = N i =1
N
∑Y
i =1
N
i
=Y
性质二
ຫໍສະໝຸດ Baidu
对于简单随机抽样,V(y) =
1− f 2 n S , 其中f = ,为抽样比。 n N
证明:
n 1 n 1 2 V(y) E ( y − Y ) = E[ ∑ yi − Y ] = 2 E[∑ ( yi − Y )]2 = n i =1 n i =1 2
引入一个0 引入一个0-1变量
αi
1 i ∈s = 0 i ∉s
n P(αi =1) = = f N
n E(αi ) = E(α ) = N
2 i
n n n n 2 V(αi ) = E(αi ) − E(αi ) = − = (1− ) = f (1− f ) N N N N
ˆ ˆ s (Y ) = v(Y ) ≈ 1.3115
• 由置信度95%对应的t = 1.96 ,因此,可95% 的把握说总体平均水平大约在 5 ± 1.96 × 1.3115 之间,即2.4295和7.5705之间。
例子
• 我们从某个N=100的总体中抽出一个大小 为n=10的简单随机样本,要估计总体平均 水平并给出置信度为95%的区间估计。如 表:
n
∑Y
i =1
N
i
1 1 1 E[∑ ( yi − Y )2 ] = [(1 − Y )2 + (2 − Y )2 ] × + [(1 − Y )2 + (3 − Y )2 ]× + [(3 − Y )2 + (2 − Y )2 ]× 3 3 3 i =1 2 = [(3 − Y )2 + (2 − Y )2 + (1 − Y )2 ] 3 n N = ∑ (Yi − Y )2 N i =1
1 n( N − 1) 2 N −n 2 = S −n S ] = S2 [ n −1 N nN
1− f 2 1− f 1− f 2 2 所以,E[v( y )] = E ( )s = E (s ) = S n n n
• 大样本下,抽样调查估计量渐进正态
θˆ − θ ~ N (0,1) ˆ) S (θ
• 简单随机抽样的抽取原则:
– (1)按随机原则取样; – (2)每个抽样单元被抽中的概率都是已知的 或事先确定的; – (3)每个抽样单元被抽中的概率都是相等的。
2、不放回抽样和放回抽样 、
a) 对于一个大小为N的总体,抽取一个样本量为n的样本,若全 部可能样本每个被抽中的概率都相等(?)则这种抽样称为 不放回的简单随机抽样,所得的样本称为不放回的简单随机 样本(simple random sampling without replacement)。
1 N n −1 2 = [∑ (Yi − Y ) + ∑ (Yi − Y )(Y j − Y ) nN i =1 N −1 i≠ j n −1 N n −1 N + (Yi − Y ) 2 − (Yi − Y ) 2 ] ∑ ∑ N − 1 i =1 N − 1 i =1
1 n −1 N n −1 N 2 = {(1 − )∑ (Yi − Y ) + [∑ (Yi − Y )]2 } N − 1 i =1 N − 1 i =1 nN
序号1 yi 4 2 5 3 2 简单随机样本的指标值 4 5 6 7 2 3 4 5 8 4 9 13 10 6
n 1 1 2 = 2 E[∑ ( yi − Y ) ] + 2 E[∑ ( yi − Y )( y j − Y )] n n i =1 i≠ j
n 1 = N n2
n(n − 1) 1 ∑ (Yi − Y ) + N ( N − 1) n 2 i =1
N 2
∑ (Y − Y )(Y
i≠ j i
j
−Y )
二、估计量 总体均值的估计 总体均值的期望 总体均值的方差 总体总量的估计 总体均值的期望 总体均值的方差 总体比例的估计 总体均值的期望 总体均值的方差
E ( y ) V ( y)
ˆ E ( y)
ˆ V (y)
2
E ( p) D ( p)
V ( y) = S ?
总体均值的估计
统计量
1 Y = N
N N N 1 n 1 2 2 = (1 − ) ( N − 1)∑ Yi − (∑ Yi ) + ∑ Yi 2 n N N ( N − 1) i =1 i =1 i =1
N 1 n 1 N 2 2 = (1 − ) N ∑ Yi − (∑ Yi ) n N N ( N − 1) i =1 i =1
1 N −n N = (Yi − Y ) 2 ∑ nN N − 1 i =1
N − n 2 1− f 2 = S = S nN n
利用0 利用0-1变量来证明性质二
N N 1 N 1 N 2 V ( y) = 2 V ∑αiYi = 2 ∑Yi V (αi ) + ∑∑YiYj covV (αi ,α j ) n i=1 i =1 j ≠i n i=1
9 0
10 8
yi
1 n 50 y = ∑ yi = =5 n i =1 10
1 n 172 s = ( yi − y ) 2 = ≈ 19.1111 ∑ n − 1 i =1 9
2
解:
ˆ = y =5 Y
ˆ ) = 1 − f s 2 = 1 − 0.1 × 19.1111 ≈ 1.72 v(Y n 10
简单估计量的三大性质
性质一:对于简单随机抽样,y是Y 的无偏估计,即E ( y ) = Y 。
性质二:对于简单随机抽样,V(y) =
1− f 2 n S , 其中f = ,为抽样比。 n N
性质三:V(y)的样本无偏估计v( y ) =
1− f 2 s , 即E[v( y )] = V ( y)。 n
简单随机抽样在抽样理论中的地位
优点:简单随机抽样在抽样理论中占有重要地位, 它是其它抽样方法的基础,其理论也最为成熟。其它 许多方法都是建立在简单随机抽样的基础上。 缺点:要求每一个单元都有一个号码,这意味着必须有 一个包含所有单元的完整抽样框,而当N很大时,这点常 常是不具备的;由此得到的样本很分散,不利于调查。例 如,对全国进行人口调查,总体单元超过12亿,要对全国 每个人都编上号,编制一个完整的抽样框实际上是不可能 的。即使可能,当抽到一个人也很难找到。
b) 考虑放回情形,此时样本中的单元有可能重复出现,如果每个
被随机抽样抽中的概率也相等,则称为放回的简单随机抽样 放回的简单随机抽样 (simple random sampling with replacement)。
思考:两者之间的比较。 思考:两者之间的比较。
【例2.1】 例2.1 • 设总体有5个单元(1、2、3、4、5),按 放回简单随机抽样的方式抽取2个单元,则 所有可能的样本为25个(考虑样本单元的 顺序):
性质一
对于简单随机抽样,y是Y 的无偏估计,即E ( y ) = Y 。
证明:由对称法可以得到 n 引理一:E (∑ yi ) = N i =1
n
n
∑Y
i =1
N
i
N
n 引理二:E[∑ ( yi − Y ) 2 ] = N i =1
(Yi − Y ) 2 ∑
i =1
n 1 1 n 所以E ( y ) = E (∑ yi ) = n i =1 nN
1 = 2 n
n n N 2 N N n n 1 (1 − )∑ Yi − ∑∑ YiY j (1 − ) N N i =1 N N N − 1 i =1 j ≠ i
1 n n N 2 1 N N = 2 (1 − ) ∑ Yi − ∑∑i YiY j n N N i =1 N − 1 i =1 j ≠
∑Y
i =1
N
i
1 n y = ∑ yi n i =1
简单估计量:在没有其他总体信息的条件下,对总体的估计。 用样本估计总体,是抽样调查的最基本思想。
例:设总体{0,1,3,5,6},计算可得总体均值Y = 3, 总体方差σ 2 = 5.2, 总体修正方差S2 = 6.5.给出n = 2的全部样本。并且验证E ( y ) = Y , E ( s 2 ) = S 2。
1,2 , 1,3 , 1,4 , 1,5 , 2,3 , 2,4 , 2,5 , 3,4 , 3,5 , 4,5 ,
3、随机抽选方法 、
• 抽签法 实质就是盒子模型,用上述两种方法之一从 盒子中抽取n张签。 • 随机抽取 a 随机数骰子 b 随机数表 c 计算机产生 d 物理方法 例:设N=872,n=10,利用随机抽取一个简单随机样本。 例:设N=327,n=5,利用随机抽取一个简单随机样本。
关于证明方法的两大说明
• 对性性原理
• 引进0-1变量
对称法的说明
例子:在总体( 例子:在总体(1, 2,3)中,取n=2 的样本。 的样本。
n
样本编号 1 2 3
样本 1,2 1,3 2,3
样本均值 1.5 2 2.5
1 1 1 2 n E (∑ yi ) = (1 + 2) × + (1 + 3) × + (2 + 3) × = × (1 + 2 + 3) = 3 3 3 3 N i =1
1,1 , 1,2 , 1,3 , 1,4 , 1,5 , 2,1 , 2,2 , 2,3 , 2,4 , 2,5 , 3,1 , 3,2 , 3,3 , 3,4 , 3,5 , 4,1 , 4,2 , 4,3 , 4,4 , 4,5 , 5,1 , 5,2 , 5,3 , 5,4 , 5,5 ,
【例2.2】 例2.2 • 设总体有5个单元(1、2、3、4、5),按 不放回简单随机抽样的方式抽取2个单元, 则所有可能的样本为个:
2
[
]
2
n n −1 ) E(αiα j ) = p(αi =1&α j =1 = ) ( N N −1
cov(αi ,α j ) = E(αiα j ) − E(αi )E(α j )
n n n = (1− ) − N N N
2
1 n n f (1− f ) (1− ) = − =− N −1 N N N −1
| θˆ − θ | P( ≤ µα ) = 1 − α ˆ) S (θ
[θ ± µ S (θˆ)]
α
【例2.3】 例2.3
• 我们从某个N=100的总体中抽出一个大小为 n=10的简单随机样本,要估计总体平均水 平并给出置信度为95%的区间估计。
序号
i
1 4
2 5
3 2
4 0
5 4
6 6
7 6
8 15
S2 = (1 − f ) n
性质三
1− f 2 V(y)的样本无偏估计v( y ) = s , 即E[v( y )] = V ( y)。 n 证明:
1 n E ( s 2 ) = E[ ( yi − y ) 2 ] ∑ n − 1 i =1
n 1 = {E[∑ ( yi − Y ) 2 ] − nE ( y − Y ) 2 } n −1 i =1
抽样调查课----简单随机抽样 抽样调查课 简单随机抽样
单位: 浙江财经学院数统学院 课程: 抽样调查课 教师: 张锐
目录
一、简单抽样的概念和抽选方法 二、估计量 三、样本量的确定 四、简单抽样的其他问题
一、简单随机抽样的概念和抽选方法
1、简单介绍 2、不放回随机抽样和放回随机抽样 3、随机抽选方法
1、抽样方法简介
1、简单随机抽样(simple 简单随机抽样 random sampling) 从总体中随机无放回地,等概 率地抽 取样本。
特点:各组样本被抽到的可能性相等 特点:各组样本被抽到的可能性相等。 最简单的抽样方式,抽样理论最 完善,是抽样理论的基础。当总体相 当大时,由于组织工作与具体技巧上 的困难而很少直接采用,但它是其它 随机抽样的基础。但实际当中直接采 用该方法的并不多。
相关文档
最新文档