抽样调查第2章 简单随机抽样
第2章简单随机抽样
称简单随机抽样,所得的样本称为不放回的
简单随机样本,简称简单随机样本
精选可编辑ppt
2
简单随机抽样的实施方法:将总体中的单元 依次从1到N进行编号,然后利用抽签法或随 机数法来进行简单随机抽样
抽签法:一般用于总体所含单元不多的情况, 首先做N个签并依次写上1至N的号码,然后 将签充分混合均匀,再一次抽取其中的n个 签或逐个不放回地抽取n个签,则编号为这n 个签上的号码的单元就构成一个简单随机样 本
注3: V(y),V(Yˆ) 中的 S
2 Y
一般是未知的,因此需要通
过样本进行估计
精选可编辑ppt
14
定理2.2.3
在简单随机抽样中,样本方差
s
2 y
是总体方差
S
2 Y
的无偏估计量,样本协方差 s y x
是总体协方差 S Y X 的无偏估计量
推论2.2.1 在简单随机抽样中,
Vˆ(y) ˆ 1 f n
在一定条件下,利用辅助指标的信息可以提 高对主要指标的估计的精度
一般地,辅助指标可以是主要指标的前期资 料,也可以是表示单元规模的量,或者是单 元的某个易测指标,等等
精选可编辑ppt
31
如果主要指标Y与辅助指标X之间有正相关关 系,就可以构造比估计量
在简单随机抽样中,称 YˆR ˆ yR ˆ RˆX 为总体均 值 Y 的比估计量,称 YˆRˆ NyRRˆX为总体总 值 Y 的比估计量,其中 X 或 X 必须已知
sy2
是
V
(
y
) 的无偏估计量
Vˆ(Yˆ)ˆ N21f n
sy2 是 V
( Yˆ )
的无偏估计量
注:把 Vˆ(y), Vˆ(Yˆ) 分别作为 V(y), V(Yˆ) 的估计 量,都称为标准差估计量
简单随机抽样
[ p z 2 v( p), p z 2 v( p)] [0.2846,0.4154]
2.3 比率估计量及其性质
当存在与我们调查的主要变量高度相关 的所谓其他辅助变量的有效信息,且这些 辅助变量的信息质量较好时,利用这些信 息无疑将有助于提高估计的精度。
主要变量为Y,另一个与Y有关的辅助变量 为X,对简单随机抽样的一个样本中的每 一个单元获得了Y和X的调查值yi和xi,而X 的总体总值是已知的。
总体比例的简单估计
性质1. E(Pˆ) E( p) P
性质2.V (Pˆ) 1 f S 2 1 f 1 NP(1 P)
n
n N 1
证明:S 2
1 N -1
N i 1
(Yi
Y )2
1 N -1
N i 1
(Yi 2
2YYi
Y
2)
1 N -1
N i 1
Yi 2
NY
2
1 (NP NP2 ) 1 NP(1 P)
[P z 2
1 f n
1 N 1
Np(1
p),
P
z
2
1 f 1 Np(1 p)] n N 1
2.4 某大学有10000名本科生,现欲估计在暑期间参加
了各类英语培训的学生所占的比例。随机抽取了200名
学生进行调查,得到p 0.35。试估计该大学所有本科
生中暑假参加培训班的比例的95%的置信区间。
解:利用去年化肥总产量X 2135,今年化肥总产量 Y的估计值为
YˆR
XRˆ
X
y x
2135 22 25
2426.14.
引理2.3 对于简单随机抽样,n较大时, =; 二是说在某种条件下, 是近似无偏的。
抽样调查理论与方法 金勇进(第二版)-第2章-简单随机抽样
X
2
n
N
1
i 1
(Y i R X i )
2
定理 的方差为:
Y 2.7:对于简单随机抽样,n较大时, R N y R
N 1 2 1 f 2 V (Y R ) N (Yi R X i ) n N 1 i 1
推论 2.12:对于简单随机抽样,n较大时, Y y 的方差为:
n N
n N
【例2.1】
设总体有5个单元(1、2、3、4、5), 按不放回简单随机抽样的方式抽取2个单 元,则所有可能的样本为个:
1,2
1,3 1,4 1,5
2,3
2,4 2,5
3,4
3,5
4,5
【例2.2】
设总体有5个单元(1、2、3、4、5),按放回 简单随机抽样的方式抽取2个单元,则所有可 能的样本为25个(考虑样本单元的顺序):
i
Y X
Y X
r
n
yi xi
i 1
y x
i 1
i 1
简单估计量
1 Y y n
n
yi
y1 y 2 y n n
i 1
N Y Ny n
n
yi
i 1
a 1 P p n n
n
yi y Y
i 1
ˆ R
【例2.5】
根据例【2.4】的数据和结果,比较两种思路下对应的 方差估计结果。
2.4 回归估计量及其性质
属于简单估计量,不属于比率估计量。
引理 的期望为:
2.3:对于简单随机抽样,n较大时, R r
抽样技术第二章_简单随机抽样
目前,世界上已编有许多种随机数表。其中较 大的有兰德公司编制,1955年出版的100万数 字随机数表,它按五位一组排列,共有20万组 ;肯德尔和史密斯编制,1938年出版的10万 数字随机数表,它也按五位一组排列,共有 25000组。我国常用的是中国科学院数学研究 所概率统计室编印的《常用数理统计表》中的 随机数表。
率都等于1/ CNn,这种抽样称为简单随机抽样。
注意:定义2.1与定义2.3是等价的。
三个定义之间的联系
简单随机抽样的具体实施方法
常用的有抽签法和随机数法两种。 (一)抽签法 抽签法是先对总体N个抽样单元分别编上1到N的号码,再制作与
之相对应的N个号签并充分摇匀后,从中随机地抽取n个号签(可以 是一次抽取n个号签,也可以一次抽一个号签,连续抽n次),与抽 中号签号码相同的n个单元即为抽中的单元,由其组成简单随机样 本。 抽签法在技术上十分简单,但在实际应用中,对总体各单元编号 并制作号签的工作量可能会很繁重,尤其是当总体容量比较大时 ,抽签法并不是很方便,而且也往往难以保证做到等概率。因此 ,实际工作中常常使用随机数法。
s2 / n
s(y)
y
t
1
2
s(y),y
t
1
2
s(y)
概述
一、简单随机抽样(或单纯随机抽样) 本书一般局限于不放回随机抽样
二、实施方法 三、地位、作用
是其他抽样方法基础
2.1定义与符号
定义2.1 从总体的N个单元中,一次整批抽取n 个单元,使任何一个单元被抽中的概率都相等 ,任何n个不同单元组成的组合被抽中的概率 也都相等,这种抽样称为简单随机抽样.
此外,简单随机抽样要求在抽样前编制出抽样 框,并对每一个总体抽样单元进行编号,而且 当总体抽样单元的分布比较分散时,样本也可 能会比较分散,这些都会给简单随机抽样方法 的运用造成许多的不便,甚至在某些情况下干 脆无法使用。因此,在此基础上研究其它抽样 技术显得更加重要。
第二章 简单随机抽样
2.1 定义与符号
总体:( )具体总体;( ;(2)有限总体; 总体:(1)具体总体;( )有限总体; :( (3)与样本框存在一一对应关系的所谓实查总体或被称为 ) 抽样总体的样本框本身。 抽样总体的样本框本身。 单元:总是指构成抽样总体的样本单元(样品、样本点) 单元:总是指构成抽样总体的样本单元(样品、样本点) 抽样单元并不总是等同于个体, 抽样单元并不总是等同于个体,有时抽样单元甚至包含几个或 多个个体 个体:最小的不可再分的单元 个体: 设抽样总体由N个抽样单元组成 个抽样单元组成, 是已知整数 表示总体规模 是已知整数, 总体规模; 设抽样总体由 个抽样单元组成,N是已知整数,表示总体规模; 欲在其中抽取n个抽样单元构成样本 个抽样单元构成样本。 欲在其中抽取 个抽样单元构成样本。 n是一个事先人为确定的不大于 ,不小于 的正整数,称为样本容 是一个事先人为确定的不大于N,不小于1的正整数 称为样本容 的正整数, 是一个事先人为确定的不大于 简称样本量或样品数,表示样本规模。 量,简称样本量或样品数,表示样本规模。 样本容量相对于总体规模的比例f=n/N,称为抽样比 样本容量相对于总体规模的比例 ,称为抽样比
n CN
简单随机抽样的三个等价定义: 简单随机抽样的三个等价定义:
定义2.1 从总体的 个单元中,一次整批抽取 个单元,使任何一个 从总体的N个单元中 一次整批抽取n个单元 个单元中, 个单元, 定义 单元被抽中的概率都相等,任何n个不同单元组成的组合被抽中的概 单元被抽中的概率都相等,任何 个不同单元组成的组合被抽中的概 率也相等,这种抽样称为简单随机抽样。 率也相等,这种抽样称为简单随机抽样。 定义2.2从总体的 个单元中,逐个不放回地抽取单元,每次抽取到 从总体的N个单元中 定义 从总体的 个单元中,逐个不放回地抽取单元, 尚未入样的任何一个单元的概率都相等,直到抽足n个单元为止 个单元为止, 尚未入样的任何一个单元的概率都相等,直到抽足 个单元为止,这 样所得的n个单元组成一个简单随机样本 个单元组成一个简单随机样本。 样所得的 个单元组成一个简单随机样本。 定义2.3 按照从总体的 个单元中抽取 个单元的所有可能不同的组 按照从总体的N个单元中抽取 个单元中抽取n个单元的所有可能不同的组 定义 n n 个样本数, 个样本随机抽取一个样本, 合构造所有可能的 CN个样本数,从 CN 个样本随机抽取一个样本,使 n 这种抽样称为简单随机抽样。 每个样本被抽中的概率都等于1/ CN ,这种抽样称为简单随机抽样。 n N
抽样调查简单随机抽样
(三)简单随机抽样是等概率抽样(※※※)
1、从样本来看是等概率抽样
每个可能样本的被抽中的概率:
1
(1)考虑顺序的重复抽样时:N n
1
(2)考虑顺序的不重复抽样时:C
n N
n1
(3)不考虑顺序的重复抽样时:(NN!n)! (4)不考虑顺序的不重复抽样时:1 2、从抽样单元看是等概率抽样 CNn
第一节 抽样方式
一、什么是简单随机抽样 为什么叫“简单”随机抽样? ①估计总体参数时使用简单估计量; ②“单纯”抽样,从总体中直接抽个体;(不是
抽群,不是抽大类,抽前不进行任何处理) ③其他抽样都包含简单随机抽样的成分; ④生活中有时抓“机会”、“归属”时采用,
有“容易操作”的意思。
第一节 抽样方式
抽签法
一次抽n个单位 一次抽1个单位连抽n次
简单随机样本抽取方法
随机数法
随机数字表法() 随机数色子法 摇奖机法 伪随机数法
利用随机数字表抽选简单随机样本
随机数表是一张由0,1,2,…,9这十个数 字组成的,一般常用的是五位数的随机数字表, 10个数字在表中出现的顺序是随机的,每个数 字都有同样的机会被抽中。
一、什么是简单随机抽样
根据抽样单位放回否分为放回简单随机抽样 (Simple Random Sampling with Replacement,SRSWR)和不放回简单随 机抽样(Simple Random Sampling without Replacement,SRSWOR) 。
简单随机抽样
一、估计量的种类
• 根据构造方法不同划分:
• ①简单估计量(直接估计量)
• 直接以调查变量的样本指标作为总体指标的 估计量。如样本均值作为总体均值的估计量。 简单估计量是线性估计量,往往也是无偏估 计量。
抽样调查-第2章简单随机抽样
N2 1
f
S2
n
V (P)
V ( p)
1
f
1 NP(1 P)
n n 1
返回
总体总量的估计量方差是总体均值方差的直接 推导,下面我们来推导总体比例估计量的方差。
1 f 1
V (P)
NP(1 P)
n N 1
只需证明此时S 2 1 NP(1 P)即可。 N 1
返回
设N个样本单元中有N1个具有某一特 性,即有N1个单元取值为1,有N-N1个单元 取值为0.
Yi 2
N( 1 N
N
Yi )2 ]
i 1
返回
1 n( N
f 1)
[
N i 1
Yi 2
2
NY ]
1 f n( N 1)
N
(Yi 2
Y
2
)
i 1
1 f n( N 1)
N
(Yi
i 1
Y )2
S 2 (1 f ) n
即 V (y) 1 f S 2 n
C C2 n2 2 N 2
每个样本被抽中的概率为:
C C2 n2 2 N 2
/
CNn
n(n 1) N (N 1)
返回
引理二 从总体规模为N的总体中抽取一个样 本量为n的简单随机样本。若对总体中的每个单
元 Yi ,引进随机变量 ai 如下:
ai
1,
若Yi入样
0,若Yi不入样(i 1,2,, N )
N i1
(Yi
Y )2
N 2
N 1
返回
总体指标值上面带符号“ ”的表示由样本得
2简单随机抽样的方法
5年至10年 10年以上
人数
300
500
200
试利用上述资料设计一个抽样比为1/10的抽样方法。
23
练习、在1000个有机会中奖的号码(编号为 000~999)中,在公证部门的监督下,按随机抽 取的方法确定最后两位数为88的号码为中奖号码, 这是运用那种抽样方法确定中奖号码的?依次写 出这10个中奖号码。
1%的学生进行调
你认为哪些因素影响学生视 查,你认为应当怎
力?抽样要考虑和因素? 样抽取样本? 13
2.1.3 分层抽样
14
一、分层抽样的定义。 一般地,在抽样时,将总体分成互不交叉
的层,然后按照一定的比例,从各层独立地抽 取一定数量的个体,将各层取出的个体合在一 起作为样本,这种抽样的方法叫分层抽样。
号可能是( B )
A.5,10,15,20,25 B、3,13,23,33,43 C、1, 2, 3, 4, 5 D、2, 4, 6, 16,32
10
例3:从2005个编号中抽取20个号码入样,采
用系统抽样的方法,则抽样的间隔为
( C)
A.99
B、99.5
C.100 D、100.5
例4:某小礼堂有25排座位,每排20个座位,一次 心理学讲座,礼堂中坐满了学生,会后为了了解 有关情况,留下座位号是15的所有25名学生进行
分层抽样抽取容量为45的样本,那么高一、高
二、高三各年级抽取的人数分别为(D )
A.15,5,25
B.15,15,15
C.10,5,30
D15,10,20
例2:一个地区共有5个乡镇,人口3万人, 其中人口比例为3:2:5:2:3,从3万人中抽 取一个300人的样本,分析某种疾病的发病率, 已知这种疾病与不同的地理位置及水土有关, 问应采取什么样的方法?并写出具体过程。
简单的随机抽样
反思与感悟
解析答案
④是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐 个进行抽取的,是不放回、等可能的抽样. ⑤不是简单随机抽样,因为它是有放回抽样. 综上,只有④是简单随机抽样. 答案 B
反思与感悟
跟踪训练1 在简单随机抽样中,某一个体被抽到的可能性( B ) A.与第几次抽样有关,第一次抽到的可能性大一些 B.与第几次抽样无关,每次抽到的可能性都相等 C.与第几次抽样有关,最后一次抽到的可能性要大些 D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性
题型探究
重点突破
题型一 简单随机抽样的判断
例1 下列5个抽样中,简单随机抽样的个数是( ) ①从无数个个体中抽取50个个体作为样本; ②仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查; ③某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴青海参加抗震 救灾工作;
④一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出 6个号签. ⑤箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中, 从中任意取出1个零件进行质量检验后,再把它放回箱子里.
问题:怎样获取样本呢?
原则:样本要具1.简单的随机抽样 2.系统抽样 3.分层抽样
特点 步骤 适用范围 共同点
联系
知识点一 统计的相关概念
名称
定义
总体 样本 个体
所要_考__察__对__象__的全体叫做总体 从总体中抽取出的_若__干__个__个__体__组成的集合叫做总体 的一个样本
规律与方法
1.简单随机抽样是一种简单、基本、不放回的抽样方法,常用的简单随 机抽样方法有抽签法和随机数法. 2.抽签法的优点是简单易行,缺点是当总体的容量大时,费时、费力, 并且标号的签不易搅拌均匀,这样会导致抽样不公平;随机数法的优点 也是简单易行,缺点是当总体容量大时,编号不方便.两种方法只适合 总体容量较少的抽样类型. 3.简单随机抽样每个个体入样的可能性都相等,均为n/N,但要将每个 个体入样的可能性与第n次抽取时每个个体入样的可能性区分开,避免 在解题中出现错误.
抽样调查第2章简单随机抽样ppt课件
将读取到的随机数对应的个体作为样本,并记录其编号。
计算机模拟法
编号
选择随机数生成器
设置参数
生成随机数
筛选样本
将总体的个体编号,并将 编号数据输入计算机。
在计算机中选择一个合适 的随机数生成器。
根据需要设置随机数生成 器的参数,如生成随机数 的范围、数量等。
使用随机数生成器生成 一定数量的随机数。
详细记录每个被抽中样本的信息和特征,如 姓名、性别、年龄、职业等。
处理异常情况
保密原则
如遇到无法联系或拒绝接受调查的样本,需 按照预先设定的方案进行处理,如替换或重 新抽取等。
在整个抽样过程中,需严格遵守保密原则, 确保被调查者的隐私不被泄露。
05
数据分析与结果解读
数据整理与初步分析
1 2
数据来源与采集方式
根据生成的随机数,从总 体中筛选出对应的个体作 为样本,并记录其编号。 如果需要,还可以对样本 进行进一步的处理和分析。
03
样本容量确定与误差控制
样本容量确定原则及方法
原则
在满足调查精度和可靠性的前提下, 尽可能减少样本容量,以节约成本和 提高效率。
方法
根据总体大小、总体方差、调查精度要 求等因素,采用适当的统计公式或经验 法则来确定样本容量。
01
介绍点估计和区间估计的概念、方法和应用场景,并比较其优
缺点。
假设检验的基本原理
02
阐述假设检验的基本原理和步骤,包括原假设和备择假设的设
定、检验统计量的选择、显著性水平的确定等。
常用统计检验方法
03
介绍常用的统计检验方法,如t检验、F检验、卡方检验等,并
说明其应用场景和注意事项。
第二章 简单随机抽样
n
!(
N! N
n)!
C62
6! 15 2!4!
例2.2 N=8,其总体单元数值为:2,4,4,4,6,6,6,18
从中抽取n=3的简单随机样本个数
C83
8! 3!5!
56
用大写字母和小写字母分别表示有关总体和样本的量
关于总体变量Y的N个变量值记为 Y1,Y2,,YN
总体均值:Y
Y N
1 N
N
(1)简单随机抽样中用于估计总体均值的统计量是样本均值,而 待估总体参数与用于估计的统计量两者“同形同构”; (2)简单随机抽样直接从总体抽取个体; (3)简单随机抽样是任何其他概率抽样的核心(任何其他概率抽 样方式都或多或少包含简单随机抽样的成分) (4)容易操作。
随机抽样的形式
随机抽样分为四种形式:放回有序;放回无序;不放回有序;不放回 无序
不放回无序的随机抽样其所有可能样本数是最少的,实际操作最简单, 简称不放回简单随机抽样(SRSWOR)
放回有序的所有可能样本数最多,但理论结果最简单,简称放回简单 随机抽样(SRSWR)
简单随机抽样指不放回简单随机抽样
2.1 定义与符号
总体:(1)具体总体;(2)有限总体; (3)与样本框存在一一对应关系的所谓实查总体或被称为
定义2.3 按照从总体的N个单元中抽取n个单元的所有可能不同的组
合构造所有可能的
CNn个样本数,从
C
n N
个样本随机抽取一个样本,使
每个样本被抽中的概率都等于1 / CNn ,这种抽样称为简单随机抽样。
n
100
400
100
400
N
5 000
5 000 10 000
10 000
第二章统计简单随机抽样知识梳理简...
第二章统计2.1 随机抽样2.1.1 简单随机抽样知识梳理:1.简单随机抽样的含义一般地,设一个总体含有N个个体,从中________地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会________,就把这种抽样方法叫做简单随机抽样。
2.简单随机抽样的方法(1)抽签法(抓阄法)一般地,抽签法就是________,把号码写在号签上,把号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
(2)随机数法随机数法:利用________、________或________产生的随机数进行抽样。
思考探究:1.简单随机抽样有哪些特点?2.在用随机数法抽样时,如果题目所给的编号数不一致,该如何处理?自主测评:1.某校期末考试后,为了分析该校高一年级1000名学生的学习成绩,从中随机抽取了100名学生的成绩单,就这个问题来说,下面说法中正确的是()A.1 000名学生是总体B.每名学生是个体C.每名学生的成绩是所抽取的一个样本D.样本的容量是1002.在简单随机抽样中,某一个个体被抽到的可能性()A.与第几次抽样有关,第一次抽到的可能性最大B.与第几次抽样有关,第一次抽到的可能性最小C.与第几次抽样无关,每一次抽到的可能性相等D.与第几次抽样无关,与抽取几个样本有关3.抽签法中确保样本代表性的关键是()A.制签B.搅拌均匀C.逐一抽取D.抽取不放回4.某工厂的质检人员对生产的100件产品,采用随机数法抽取10件进行检查,对100件产品采用下面编号方法:①01,02,03,…,100;②001,002,003,…,100;③00,01,02,…99。
其中最恰当的序号是________。
典例探究突破:类型一:简单随机抽样的概念例1:下面抽取样本的方式是简单随机抽样吗,为什么?(1)从无限多个个体中抽取50个个体作为样本;(2)箱子里共有100个零件,今从中选取10个零进行检验,在抽样操作时,从中任意地拿出一个零件进行质量检验后再把它放回箱子里;(3)从50个个体中一次性抽取5个个体作为样本;(4)某班45名同学指定个子最高的5名同学参加学校组织的某项活动。
第二章(简单随机抽样)
1 ∑ Yi = N i =1
N
∑Y
i =1
N
i
=Y
性质二
对于简单随机抽样,V(y) =
1− f 2 n S , 其中f = ,为抽样比。 n N
证明:
n 1 n 1 2 V(y) E ( y − Y ) = E[ ∑ yi − Y ] = 2 E[∑ ( yi − Y )]2 = n i =1 n i =1 2
引入一个0 引入一个0-1变量
αi
1 i ∈s = 0 i ∉s
n P(αi =1) = = f N
n E(αi ) = E(α ) = N
2 i
n n n n 2 V(αi ) = E(αi ) − E(αi ) = − = (1− ) = f (1− f ) N N N N
| θˆ − θ | P( ≤ µα ) = 1 − α ˆ) S (θ
[θ ± µ S (θˆ)]
α
【例2.3】 例2.3
• 我们从某个N=100的总体中抽出一个大小为 n=10的简单随机样本,要估计总体平均水 平并给出置信度为95%的区间估计。
序号
i
1 4
2 5
3 2
4 0
5 4
6 6
7 6
8 15
序号1 yi 4 2 5 3 2 简单随机样本的指标值 4 5 6 7 2 3 4 5 8 4 9 13 10 6
1 n( N − 1) 2 N −n 2 = S −n S ] = S2 [ n −1 N nN
1− f 2 1− f 1− f 2 2 所以,E[v( y )] = E ( )s = E (s ) = S n n n
• 大样本下,抽样调查估计量渐进正态
抽样调查第2章简单随机抽样
有限总体分布估计
了解有限总体指标量的分布情况,即要估计 总体中具有某种特征的个体所占比例,可令
(t Yi ) 10,当,当YYi it;t 则有限总体分布可表示为
1 N
F (t)
N
(t Yi )
i 1
F (t)是量(t Yi )的平均值,可用样本 {(t yi ),i 1,2,, n}的均值来估计
有限总体分布估计
F (t)的估计量为
Fn (t)
1 n
n i 1
(t
yi )
该估计的方差的估计为
v(Fn (t))
1 1 n 1
n N
Fn (t)(1
Fn (t))
Wald-Wolfowitz定理 区间估计 样本量的确定
Wald-Wolfowitz定理
定理2.4.1 设{aN1,, aNN }和{xN1,, xNN }(N 1,2,)是 两个实数序列的集合,满足:对r 3,4及大的N,有
定义2 按照从总体的N个单元抽取n个单元的所有 可能不同组合构造所有可能的CNn个样本,从CNn 个样本随机抽取1个,使每个样本被抽中的概率等 于1/ CNn ,这种抽样成为简单随机抽样。
定义3 从总体的N个单元中,一次整批地抽取n个 单元,使任何一个单元被抽中的概率都相等,任 何n个不同单元组成的组合被抽中的概率也都相 等,这种抽样称为简单随机抽样。
9
6 7
0 3
顶视图
随机数法
u永久随机数法
抽样者给总体的第i个个体赋予一个[0,1]上的 随机数Ri,Ri与第i个个体永久对应,抽样设计时, 确定好抽样比f,Ri<f的对应单元入样。
特点: (1)可保证多次抽样中有大量相同单元; (2)缺点是样本量不完全确定
讲稿2-简单随机抽样
n
(1
N
N
1 n n n ) (1 ) N N 1 N N N n
i 1
N
Y iY j cov V ( i , j ) ji ) N 1 1
i 1 ji
N
N
Y iY j
N
n N
N
(1
n N
1 n n 1
2
N n 1 2 (1 ) Y N N i 1 i N 1
i 1 N
Y iY j ji
p a n
2
1 N
i 1
N
Yi
Y i 0或 1
N N 1
1
n
n
yi
n
y i 0或 1
y
2
i 1
S
2
Y 1
i 1
i
Y
2
2
s
y n 1
i 1
1
i
Y
R
i 1
N
i
i 1
N
X
i
Y X
Y X
ˆ R
i 1
n
yi xi
y x
三、地位与作用
优点
简单直观 理论基础 N很大时难以获得抽样框 样本分散不易实施,调查费用高
三种抽样方法之简单随机抽样
这15000名学生的视力情况就组成一个样本
样本中的个体的数目叫做样本的容量。15000
简单随机抽样
回顾(初中知识):总体、个体、样本、样本容 量
的概念. 总体:所要考察对象的全体。 个体:总体中的每一个考察对象。
样本:从总体中抽取的一部分个体叫做这个总 体的一个样本。
思 考:样本一定能准确地反应总体吗? 样本 估计 总体
第一种重要的科学的抽样方法
2.1.1简单随机抽样
简单随机抽样
思考
问题: 如何科学地抽取样本?
使得样本能比较准确地反映总体
搅拌均匀 使得每个个体被抽取的机会均等
合理、公平
简单随机抽样
实例一
现从我校高二(29)班41名同 学中任选取10名参加元旦文艺汇演, 为保证选取的公平性,你打算如何 操作?
简单随机抽样
简单随机抽样的概 念 设一个总体含有N个个体 ,从中逐个不放
回地抽取n个个体作为样本 (n≤N),如果每次抽 取时总体内的各个个体被抽到的机会都相等, 这种抽样方法叫做简单随机抽样。
注意以下四点: (1)它要求被抽取样本的总体的个体数有限; (2)它是从总体中逐个进行抽取; (3)它是一种不放回抽样; (4)它是一种等概率抽样 (每个个体入样的概率 n/N)。
(2)将这N个号码写在形状、 大小相 同的号签上;
(3)将号签放在同一箱中,并 搅拌均匀;
(4)从箱中每次抽出1个号签, 连续抽出n次;
制作编号为制0到签53的号签
将41个号搅签匀搅拌均匀
随机从中逐一抽抽签出10个签 让对应号取码出的个学体生参加
(5)将总体中与抽到的号签编 号一致的n个个体取出。
第二章第一节简单随机抽样
第二章第一节简单随机抽样一、重点难点:1.正确理解随机抽样的概念,会描述抽签法、随机数表法的一般步骤.2.能够根据样本的具体情况选择适当的方法进行抽样.二、知识点讲解:一、简单随机抽样的概念:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。
思考:简单随机抽样的每个个体入样的可能性为多少?(n/N)二、抽签法和随机数法:1、抽签法一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
抽签法的一般步骤:(1)将总体的个体编号;(2)连续抽签获取样本号码.思考:你认为抽签法有什么优点和缺点;当总体中的个体数很多时,用抽签法方便吗?解析:操作简便易行,当总体个数较多时工作量大,也很难做到“搅拌均匀”2、随机数法利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法.怎样利用随机数表产生样本呢?下面通过例子来说明,假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,可以按照下面的步骤进行。
第一步,先将800袋牛奶编号,可以编为000,001, (799)第二步,在随机数表中任选一个数,例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行)。
16 22 77 94 39 49 54 43 54 82 17 37 93 23 7884 42 17 53 31 57 24 55 06 88 77 04 74 47 6763 01 63 78 59 16 95 55 67 19 98 10 50 71 7533 21 12 34 29 78 64 56 07 82 52 42 07 44 3857 60 86 32 44 09 47 27 96 54 49 17 46 09 6287 35 20 96 43 84 26 34 91 6421 76 33 50 25 83 92 12 06 7612 86 73 58 07 44 39 52 38 7915 51 00 13 42 99 66 02 79 5490 52 84 77 27 08 02 73 43 28第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉,按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出,这样我们就得到一个容量为60的样本。
《抽样技术》第二章-简单随机抽样
1
f
公式V y S 2 1 f 的说明
n
(1)V y 主要取决于S 2和n,与f 关系不大;
(2)当f n 5%时,1 f 可忽略,即V y S 2 ;
N
n
(3)V y S 2 1 f 2 N n 放回时的V y 2 。
n
n N 1
n
❖ 推论2 y 的标准误
Xi——第i个家庭的成年女子数 Yi——第i个家庭成年女子化妆品的总费用 i=1,2,⋯,N
每个成年女子化妆品的平均费用为
N
总的费用 R 总的成年女子数
Yi
i1 N
Xi
Y X
Y X
i1
比率的例子
❖ (3)在某住宅小区的房价调查中,要估计该小区的平 均房屋单价。令
Xi——第i套住宅的建筑面积 Yi——第i套住宅的市场价格 i=1,2,⋯,N
1, 1
2, 3
3, 4
4, 5
1, 2
2, 4
3, 5
1, 3
2, 5
1, 4
二、简单随机抽样的抽选
❖ 首先将容量为N的有限总体中的所有单元从1 到N编好号码,然后从这N个编号中抽取n个。
❖ 具体的抽取方式一般有: (1)抽签法; (2)随机数表法; (3)计算机产生伪随机数法。
随机数表法
❖ 随机数表是由0, 1, 2, ⋯, 9这十个数字组成的,书中 表3.2给出了由2500个一位数字组成的随机数表。这 个随机数表是这样产生的:在这2500个位置上分别 独立地做一次等可能地产生0, 1, 2, ⋯, 9的随机试验。 因此,在任意一个位置上0~9这十个数字出现的可 能性都相同,在任意两个位置上00~99这一百个数 字出现的可能性也都是相同的,在任意三个位置上 000~999这一千个数字出现的可能性也都是相同的, 依次类推。
简单随机抽样
整理课件
14
一、简单估计量的定义
对于简单随机抽样,在没有其它信息的条件 下,最简单的估计是利用样本均值作为总体均值 的估计,即总体均值的简单估计量为:
Yˆ
y
1 n
n i 1
yi
也就是说,样本均值是总体均值的简单估计量。
Yˆ NYˆ
N n n i1
yi估
计
总
体Y总
和
由于总体均值 和和 的总 估 整理课件体 计N总 , 只着 相重 差 1y5 .研
当总体较大时,抽签法实施起来比较困难, 这时可以利用随机数表、随机数骰子、摇奖机、 计算机产生的伪随机数进行抽样。
(1)利用随机数表进行抽选。
随机数表是一张由0,1,2,…,9这十个数 字组成的,一般常用的是五位数的随机数字表, 10个数字在表中出现的顺序是随机的,每个数字 都有同样的机会被抽中。
整理课件
整理课件
20
回顾
➢简单随机抽样的定义与抽选方法 ➢简单随机抽样的实施方法 ➢两个引理 ➢简单估计量的定义 ➢样本均值是总体均值的无偏估计。
定2理 .1:对 于 简 单y是 随 Y的 机无 抽偏 样E 估 (, y) 计 Y
定 理 2.2:对 于 简 单 随 机 本抽 均样 y值 的, 方样 差
V(y)NnS21f S2
V(y)
n(1N f1)NN 1iN 1Yi2N 2iN jYiYj
1f n(N1)
N
(Yi Y)2
i1
于V 是 (y)1f S2 n
于V 是 (Ny)N21fS2
整理课件
n
18
证明:(方法二:对称性证法)
V(y)EyE (y)2E (n 1i n1yiY)2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
均方偏差的无偏估计量 为 1 n 2 1 n v( p) 1 s 1 p(1 p) n N n 1 N
思考: 总体具有某特征的个体总数该如何估计?
比例估计
例 2 某大学有 1 万名本科生,现欲估计暑假期间参 加了各类英语培训的学生所占比例,随机抽取了 200名学生调查,得到p=0.35,估计全校参加培训学 生比例P及 该估的标准差。 练习2 利用例1的数据估计该社区人均收入低于500 元的户数N1,并估计其均方偏差。
例题与练习
例3 从某地区15786位老人中,抽出一个含525位老 人的简单随机样本,调查每位老人的性别及生活能 否自理,结果如下:
性别 能否自理 能
不能
男
女
211
31
263
20
(1)估计该地区生活不能自理的老人人数及该估计的 均方偏差; (2)估计该地区生活不能自理的男性老人人数及该估 计的均方偏差;
则Z Z i即具有该特征的子总体 的总值,对
i 1 N
样本作同样处理,则样 本为 ( z1 , z 2, , z n ) ( y1 , y2 , , yn1 ,0, ,0)
部分估计
按简单估值法, Z的估计量为 N n N Nz zi n i 1 n 该估计的均方偏差为
62180
63447 26619 78740 61996 63434 47269 92933 69507 05977 60829 48817 31262
32361
89809 96244 92558 24476 56074 56088 81257 24726 88443 41925 76031 00327
使用随机数表
随机数表是数字 0~9 随 机 排 列 而 成 的,这些数字在表 中的一位数、两位 数、三位数等随机 出现并有相同的概 率。
例 : 从 N=345 的 总体中抽取一个 n=15的简单随机 样本。
35161
11756
31582
58790
随机数法
使用计算机随机数 开始抽样 使用随机数骰子
D {D1, D2 ,, DN }指示了一个具体样本
定义与符号
线性估计与非线性估计
不借助任何辅助变量,对总体进行直接估 计,用样本特征的线性组合估计总体特征称为 线性估计;而借助辅助变量,用样本特征的非 线性组合表示总体特征,称为非线性估计。
简单估计
对简单随机抽样的线性估计有“简单线性估 计(Simple linear estimate)”之称,简称简单估计。
7 1 2 6 5 4 2 8 5 1 0 6 7 3 8 3 4 9
9
0
顶视图
底视图
随机数法
永久随机数法
抽样者给总体的第 i 个个体赋予一个 [0 , 1] 上的 随机数 Ri , Ri 与第 i 个个体永久对应,抽样设计时, 确定好抽样比f,Ri<f的对应单元入样。
特点: (1)可保证多次抽样中有大量相同单元; (2)缺点是样本量不完全确定
如:Y的SLE为y, Y的SLE为y
几个基本定理
定理1 对简单随机抽样,有:
n P{Di 1} , i 1,2, , N N n(n 1) , i j , i, j 1,2, , N P{Di 1, D j 1} N ( N 1)
定义与符号
易于 易于 操作 操作 易于 揭示 操作 本质
定义1
定义2
易于 综合 操作 两者
定义3
定义与符号
符号
有限总体 {Y1 , Y2 ,, YN } 1 N 1 n 总体均值 Y Yi , 样本均值 y yi N i 1 n i 1
抽样的示性函数
1, 第i个单元 Yi 被抽中 Di 0, 第i个单元 Yi未被抽中
3(n 1)(N n)(N n 1) 1 2 3 Yi O 2 n N ( N 1)(N 2)(N 3) i 1 n
N
2
Y 0不是本质条件,只是为 了使定理形式 较简洁.
几个基本定理
一般情况下 (Y 0)有:
(1) E ( y ) Y ;
n 每一单元的入样概率为 , N n(n 1) 任意两单元同时入样的 概率为 , N ( N 1) Di与Dj不独立
几个基本定理
定理2 对简单随机抽样,有:
n n n E ( Di ) N , var( Di ) N 1 N , i 1,2,, n n n cov( D , D ) 1 , i j, i, j 1,2,, n i j N ( N 1) N
2
y
i 1
n1
i
N2 n 1 N 2 E( Nz Z ) ( Z Z ) 1 i n N N 1 i 1 均方偏差的估计量为
N2 n 2 N2 n 1 N 2 ( z z ) 1 s 1 i n N n N n 1 i 1 2 n1 n1 N ( N n) 1 2 yi yi n(n 1) i 1 n i 1
放回无序、不放回有序通常没有使用价值; “放回有序”又称“放回简单随机抽样 (SRSWR)”,所有可能样本数量最多,但理论结 果简单; “不放回无序”又称“不放回简单随机抽样 (SRSWOR)”,所有可能样本数量最少,操作最 简单; 本书的简单随机抽样指的是SRSWOR.
定义与符号
定义1 从一个单元数为N的总体中逐个抽取单元 且无放回,每次都在所有尚未进入样本的单元中 等概率地抽取直到n个单元抽完,这种抽样称为简 单随机抽样。 定义2 按照从总体的N个单元抽取n个单元的所有 可能不同组合构造所有可能的 CNn 个样本,从 CNn 个样本随机抽取1个,使每个样本被抽中的概率等 于1/ CNn ,这种抽样成为简单随机抽样。 定义3 从总体的N个单元中,一次整批地抽取n 个单元,使任何一个单元被抽中的概率都相等, 任何 n 个不同单元组成的组合被抽中的概率也都 相等,这种抽样称为简单随机抽样。
随机数法
65547 38844 76684 79311
95846
05630 36056 53454 05602 58225 79596 69398 56323 77938 29639 61103 34313
75837
54244 02112 43644 11326 78627 95072 04569 62258 11661 91665 91058 65698
1 n 2 1 (2) var(y ) 1 SY (1 f ) SY2 n N n
抽样理论 核心定理
其中称1-f 为有限总体校正系数 (finite population correction factor, fpc)
抽签法 统计软件抽样 随机数法 其它方法
抽签法
一个样本量为 n的简单随机样本,则样 本均值 1 n 1 y yi 是总体均值 Y n i 1 N
2
Y 的无偏估计 .
i 1 i
N
该估计 y的均方偏差为(无偏时 即为方差) 1 n 2 V ( y ) E ( y Y ) 1 S n N N 1 2 2 其中 S (Yi Y ) . N 1 i 1
2
Y
i 1
N
i
0,则:
几个基本定理
( N n)(N 2n) N 3 1 (3) E ( y ) 2 Yi O 2 n N ( N 1)(N 2) i 1 n
3
2 2 N ( N n )[ N ( 6 n 1 ) N 6 n ] 4 (4) E ( y 4 ) Y i 3 n N ( N 1)(N 2)(N 3) i 1
练习 1 为合理调配电力资源,某市欲了解 5 万户居 民日用电量.用简单随机抽样抽取了300户进行调查, 得到日用电量平均值为9.5kwh,样本方差为206.估 计用电量平均值与该估计的均方偏差.
部分估计
估计总体U中具有某一特征的“子总体”的 数量参数,可令
Yi , 第i个个体具有该特征 Zi 0, 第i个个体不具有该特征
估值定理
系 Ny是总体 Y Yi的无偏估计 , 其均方偏差
i 1 N
为 N2 n 2 V ( Ny ) 1 S n N
估值定理
定理2 在简单随机抽样下,样本方差
n 1 2 s2 ( y y ) . i n 1 i 1
是总体方差 S 的无偏估计量 .从而 1 n 2 v ( y ) 1 s n N 是估计量 y的均方偏差 V ( y )的无偏估计 .
做 N个签,分别编上1到N号,完全均匀 混合后,一次同时抽取 n个签 ,或一次抽 取一个签但不把这个签放回,接着抽第 2 个、第3个、……,直到抽足n个为止。 缺点: (1)实施较麻烦,N较大时更不实用; (2)等概率性很大程度依赖于抽样个体 是否摇匀。
统计软件抽样
例:某校为了解学生身体素质的基本情况, 从全校学生总数 N=1003 人中抽选一个简 单随机样本n=100人进行体检。 开始抽样
几个基本定理
定理3
设y1 , y2 , , yn是来自总体{Y1 ,Y2 , ,YN } 的简单随 机样本,Yi有界,即存在一个与N无关的数M, 1 使 | Yi | M (i =1, 2, , N )且Y N
(1) E( y) Y 0;
1 1 2 1 (2) E ( y ) SY O ; n N n
§2.1 简单随机抽样的几个基本定理 §2.2 简单随机抽样的实现 §2.3 简单估值法 §2.4 区间估计与样本量的确定 §2.5 比估计 §2.6 差估计与回归估计