简单随机抽样
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关符号
总体: N {Y1,Y2,L ,YN }
抽中的号码:i1, i2,L , in
样本:y (Yi1 ,Yi2 ,L ,Yin ) ( y1, y2,L , yn )
抽样比(Sampling fraction) f n N 1 n N
有关指标与符号
指标 总值 均值 比例
比率
有限总体方差 无限总体方差
根据抽样单位是否放回可分为放回简单随机抽样和
不放回简单随机抽样。
1
• 放回简单随机抽样:每个样本抽中的概率 N n
• 不放回简单随机抽样:每个样本抽中的概率 1
实 践 中 , 考 虑 不 放 回 的简 单 随 机 抽 样 。
C
n N
二、实施方法 简单随机样本的抽选,首先要将总体从1到 N
编号,每个单位对应一个号;然后从所编的号 中抽号,如果抽到某个号,则对应的那个单位 入样,直到抽够 n 个单位为止。
两种抽取的方法是等价的。每个样本的被抽中的概率
都是
1
/
C
n N
第2)种
取
法
中
样
本
入
样
的
概率
为
什
么
是1 CnN
?
第二种抽取中,不妨假设Yi1 Y, i2, K K ,Yin先后入样,则
P (Yi1 Y, i2 , ,Yin ) P(Yi1 )P(Yi2 |Yi1 )P(Yi3 |Y Yi1 i2 )L L P(Yin |Y Yi1 i2 L Y ) in1
①抽签法
②随机数法
① 抽签法:简单随机抽样就是从盛有N张票子的盒子
里随机无放回地摸取n(<N)张票,它可以有两种取法:
1)从盒子中一次性摸取n张票
2)从盒子中随机地摸取一张票,相应的单元入样后, 票不放回盒子;从余下的N-1张票中再随机地摸取一张 票,相应的单元也入样且票也不放回盒子;依次实施,
直到第n个样本入样。
简单随机抽样在抽样理论中的地位
优点:简单随机抽样在抽样理论中占有重要地位, 它是其它抽样方法的基础,其理论也最为成熟。其它 许多方法都是建立在简单随机抽样的基础上。
缺点:要求每一个单元都有一个号码,这意味着必 须有一个包含所有单元的完整抽样框,而当N很大 时,这点常常是不具备的;由此得到的样本很分散, 不利于调查。例如,对全国进行人口调查,总体单 元超过12亿,要对全国每个人都编上号,编制一个 完整的抽样框实际上是不可能的。即使可能,当抽 到一个人也很难找到。
Chapter 2 简单随机抽样 (Simple Random Sampling)
➢简单随机抽样的定义与抽选方法 ➢简单估计量及其性质 ➢比率估计量及其性质 ➢回归估计量及其性质 ➢样本量的确定原则 ➢若干问题的补充
1 简单随机抽样的定义
与抽选方法
一、定义
从大小为N的总体抽取样本量为n的样本,若全部 可能的样本被抽中的概率都相等,则称这样的抽样为简 单随机抽样。
1)
n N
, P(ai
0)
1
n N
于是E ai
n N
f
Var ai
由引理1,P ( ai a j
1)
n(n 1) N (N 1)
n N
N n N
f
1
f
f 1 f
cov ai , aj E(aiaj ) E(ai )E(aj ) N 1
§2.2 简单估计量及其性质
➢简单估计量的定义 ➢简单估计量 y 的性质 ➢放回简单随机抽样的简单估计 ➢设计效应 ➢影响估计量精度的因素
(1)利用随机数表进行抽选。
随机数表是一张由0,1,2,…,9这十个数 字组成的,一般常用的是五位数的随机数字表, 10个数字在表中出现的顺序是随机的,每个数字 都有同样的机会被抽中。
(2)利用随机数骰子进行抽选。 (3)利用摇奖机进行抽选。 (4)利用计算机产生的伪随机数进行抽选。通
常产生的伪随机数有循环周期。 Excel、SPSS等都有随机数发生器等
1 1 1 N N 1 N n1
(N n)! N!
Y Y i1, i2, ,Yin这组样本与其入样的先后顺序无关, 得 到 这 组 的 样 本 的 个 数有n!
样本(Yi1 Y, i2 , ,Yin)入样的概率为
n!(N n)!/ N! 1
N n
1 CNn
.
②随机数法
当总体较大时,抽签法实施起来比较困难, 这时可以利用随机数表、随机数骰子、摇奖机、 计算机产生的伪随机数进行抽样。
一、简单估计量的定义
N
(Yi Y )(Yj Y )
i j
引理2:从大小为N的总体中抽取一个样本容量为n的简
单随机样本。若令:
则:1 E ai
n N
f
ai
2
1 0
V ai
百度文库
Yi入样 否则
n N NN
n
f
1
f
3 cov ai , aj
n
N N 1
1
n N
f
1 f
N 1
,i
j
证 明 : 由 引 理1,P (ai
1
N
(Y Y )2
N
2
N 1 i1
N 1
s2
1 n
1
n i1
(
yi
y)2
2 1
N
(Y Y )2
N j1
引理
引理1:从大小为N的总体中抽取一个样本容量为n的简单 随机样本,则总体中每个特定的单元入样的概率为n/N, 两个特定单元入样的概率为n(n-1)/N(N-1)。
证明:样本总数CNn ;
总体
样本
N
n
Y Yi
y yi
i 1
i 1
Y
1 N
N
Yi
i 1
y
1 n
n i 1
yi
P
N1 N
N
1 N
N
Yi(, Yi
i 1
1或 0) p
n1 n
1 n
n i 1
yi , ( yi
1或 0)
R
Yi
i 1 N
Xi
Y X
Y X
i 1
n
Rˆ
yi
i 1 n
xi
y x
y x
i 1
S2
总体中每个单元Yi都出现了CNn11次,因此
n
N
yi
C n1 N 1
Yi
取遍所有样本 i1
i 1
求 平 均 值(或 求 期 望 )
n
即E( yi )
i1
n N
N
Yi
i 1
n
取遍所有样本 i1 CNn
yi
n N
N
Yi
i 1
问
:E
n i j
(
yi
Y
)(
yj
Y
)
n(n 1) N ( N 1)
特
定
单
元Yi入
样
的
样
本
数
为
C11C
n1 N 1
两个特定单元Yi,Yj (i
j
)入样的样本数为C22C
n2 N 2
由古典概型的计算公式
一个特定单元入样的概率
C11CNn11 CNn
n N
两个特定单元入样的概率
C22CNn22 CNn
n(n 1) N (N 1)
n
求E( yi )
i 1
样本( y1, y2,L , yn ),将所有可能出现的样本求和,