第2章-简单随机抽样

合集下载

第2章简单随机抽样

第2章简单随机抽样

称简单随机抽样,所得的样本称为不放回的
简单随机样本,简称简单随机样本
精选可编辑ppt
2
简单随机抽样的实施方法:将总体中的单元 依次从1到N进行编号,然后利用抽签法或随 机数法来进行简单随机抽样
抽签法:一般用于总体所含单元不多的情况, 首先做N个签并依次写上1至N的号码,然后 将签充分混合均匀,再一次抽取其中的n个 签或逐个不放回地抽取n个签,则编号为这n 个签上的号码的单元就构成一个简单随机样 本
注3: V(y),V(Yˆ) 中的 S
2 Y
一般是未知的,因此需要通
过样本进行估计
精选可编辑ppt
14
定理2.2.3
在简单随机抽样中,样本方差
s
2 y
是总体方差
S
2 Y
的无偏估计量,样本协方差 s y x
是总体协方差 S Y X 的无偏估计量
推论2.2.1 在简单随机抽样中,
Vˆ(y) ˆ 1 f n
在一定条件下,利用辅助指标的信息可以提 高对主要指标的估计的精度
一般地,辅助指标可以是主要指标的前期资 料,也可以是表示单元规模的量,或者是单 元的某个易测指标,等等
精选可编辑ppt
31
如果主要指标Y与辅助指标X之间有正相关关 系,就可以构造比估计量
在简单随机抽样中,称 YˆR ˆ yR ˆ RˆX 为总体均 值 Y 的比估计量,称 YˆRˆ NyRRˆX为总体总 值 Y 的比估计量,其中 X 或 X 必须已知
sy2

V
(
y
) 的无偏估计量
Vˆ(Yˆ)ˆ N21f n
sy2 是 V
( Yˆ )
的无偏估计量
注:把 Vˆ(y), Vˆ(Yˆ) 分别作为 V(y), V(Yˆ) 的估计 量,都称为标准差估计量

简单随机抽样

简单随机抽样

【预习自测】 1.简单随机抽样的结果( ) A.完全由抽样方式所决定 B.完全由随机性所决定 C.完全由人为因素所决定 D.完全由计算方法所决定
【解析】选B.根据简单随机抽样的定义,总体中每个个 体被抽到的机会相等,因此抽样结果只与随机性有关.
2.简单随机抽样中,某一个个体被抽中的机会是( ) A.与第n次抽样有关,第一次抽中的机会要大些 B.与第n次抽样无关,每次抽中的机会都相等 C.与第n次抽样有关,最后一次抽中的机会大些 D.该个体被抽中的机会无法确定 【解析】选B.由简单随机抽样的定义可知:每个个体被 抽到的机会都相等,与第几次抽到无关.
4.下列抽样试验中,适合用抽签法的是( ) A.从某工厂生产的3 000件产品中抽取600件进行质量 检验 B.从某工厂生产的两箱(每箱15件)产品中抽取6件进行 质量检验 C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件 进行质量检验 D.从某厂生产的3 000件产品中抽取10件进行质量检验
2.某校有40个班,每班50人,要求每班随机选派3人参加
“学生代表大会”.在这个问题中样本容量是( )
A.40
B.50
C.120
D.150
【解析】选C.由于样本容量即样本的个数,故抽取的样
本的个数为40×3=120.
【补偿训练】1.一个总体中共有10个个体,用简单随机
抽样的方法从中抽取一个容量为3的样本,则某特定个
3.在问题2的基础上,若想得到样本饼干,则应如何摸取? 提示:从中不放回地摸取并且每次只摸一个. 4.在上述抽样过程中,某一包饼干第一次被抽到与第二 次被抽到的机会相等吗? 提示:相等.
结论: 1.抽样涉及的基本概念(以某地区高一学生身高为例) 为了了解某地区高一学生身高的情况,我们找到了该地 区高一8 000名学生的体检表,从中随机抽取了150张, 表中有体重、身高、血压、肺活量等15类数据,那么总 体是指_该__地__区__高__一__8__0_0_0_名__学__生__的__身__高__数__据__,个体是指 _该__地__区__高__一__某__个__学__生__的__身__高__,样本是指_被__抽__到__的__1_5_0_个__ _学__生__的__身__高__,样本容量是_1_5_0_.

第二章 简单随机抽样-2.1-2.2-1

第二章 简单随机抽样-2.1-2.2-1

3 估计量的性质
(3)比例估计量的性质
性质8
ˆ E ( P) E ( p) P
N n P(1 P) 性质9 样本比例p的方差为 V ( p) N 1 n
性质10 V(p)的无偏估计为
1 f v( p ) p(1 p) n 1
作业
设总体单元为N=6,单元的取值分别为3、4、
第二章 简单随机抽样
第一节 第二节 第三节 第四节 引言 估计量及其性质 样本量的确定 子总体的估计
第一节 引言
1 简单随机抽样的定义 2 简单随机样本的性质 3 简单随机样本的实现方法
1 简单随机抽样的定义 定义: 每次都是从剩下的总体单元中随机抽 取1个单元,相继依次抽取n次,得到n个单 元组成的样本,叫做不放回简单随机样本。
1
1 简单随机抽样的几个重要结论
(1)单元入样概率的一个重要结论
定理1 :对总体 U {Y1 ,, YN } 的一个样本量为n的无重 复样本,有
(1) k n
k 1 N
(2) kj (n 1) j , 对固定的j
k 1 k j
N
1 简单随机抽样的几个重要结论
(2) 简单估计量
设 y1 ,, yn 是总体{Y1 , ,YN }的一个简单随机样本,则
ˆ (1) Y
y
ˆ (2)Y Ny ˆ (3)P p
3 估计量的性质
(1)均值估计量的性质
性质1
设y1 ,, yn 是总体{Y1 , ,YN }的一个简单随机样本,则
ˆ ) E( y ) Y E (Y
3 简单随机样本的实现方法
首先将N个总体单元编号为:1,2,,N,每一单元对应 一个号码,若抽到某号,则相应单元入样。

抽样调查理论与方法 金勇进(第二版)-第2章-简单随机抽样

抽样调查理论与方法 金勇进(第二版)-第2章-简单随机抽样
N
X
2
n
N
1
i 1
(Y i R X i )
2
定理 的方差为:

Y 2.7:对于简单随机抽样,n较大时, R N y R
N 1 2 1 f 2 V (Y R ) N (Yi R X i ) n N 1 i 1

推论 2.12:对于简单随机抽样,n较大时, Y y 的方差为:
n N
n N
【例2.1】

设总体有5个单元(1、2、3、4、5), 按不放回简单随机抽样的方式抽取2个单 元,则所有可能的样本为个:
1,2
1,3 1,4 1,5
2,3
2,4 2,5
3,4
3,5
4,5
【例2.2】

设总体有5个单元(1、2、3、4、5),按放回 简单随机抽样的方式抽取2个单元,则所有可 能的样本为25个(考虑样本单元的顺序):
i
Y X

Y X
r

n
yi xi
i 1
y x
i 1

i 1
简单估计量
1 Y y n

n
yi
y1 y 2 y n n
i 1
N Y Ny n

n
yi
i 1
a 1 P p n n

n
yi y Y
i 1
ˆ R

【例2.5】

根据例【2.4】的数据和结果,比较两种思路下对应的 方差估计结果。
2.4 回归估计量及其性质
属于简单估计量,不属于比率估计量。

引理 的期望为:
2.3:对于简单随机抽样,n较大时, R r

抽样技术第二章_简单随机抽样

抽样技术第二章_简单随机抽样

目前,世界上已编有许多种随机数表。其中较 大的有兰德公司编制,1955年出版的100万数 字随机数表,它按五位一组排列,共有20万组 ;肯德尔和史密斯编制,1938年出版的10万 数字随机数表,它也按五位一组排列,共有 25000组。我国常用的是中国科学院数学研究 所概率统计室编印的《常用数理统计表》中的 随机数表。
率都等于1/ CNn,这种抽样称为简单随机抽样。
注意:定义2.1与定义2.3是等价的。
三个定义之间的联系
简单随机抽样的具体实施方法
常用的有抽签法和随机数法两种。 (一)抽签法 抽签法是先对总体N个抽样单元分别编上1到N的号码,再制作与
之相对应的N个号签并充分摇匀后,从中随机地抽取n个号签(可以 是一次抽取n个号签,也可以一次抽一个号签,连续抽n次),与抽 中号签号码相同的n个单元即为抽中的单元,由其组成简单随机样 本。 抽签法在技术上十分简单,但在实际应用中,对总体各单元编号 并制作号签的工作量可能会很繁重,尤其是当总体容量比较大时 ,抽签法并不是很方便,而且也往往难以保证做到等概率。因此 ,实际工作中常常使用随机数法。
s2 / n
s(y)
y
t
1
2
s(y),y
t
1
2
s(y)
概述
一、简单随机抽样(或单纯随机抽样) 本书一般局限于不放回随机抽样
二、实施方法 三、地位、作用
是其他抽样方法基础
2.1定义与符号
定义2.1 从总体的N个单元中,一次整批抽取n 个单元,使任何一个单元被抽中的概率都相等 ,任何n个不同单元组成的组合被抽中的概率 也都相等,这种抽样称为简单随机抽样.
此外,简单随机抽样要求在抽样前编制出抽样 框,并对每一个总体抽样单元进行编号,而且 当总体抽样单元的分布比较分散时,样本也可 能会比较分散,这些都会给简单随机抽样方法 的运用造成许多的不便,甚至在某些情况下干 脆无法使用。因此,在此基础上研究其它抽样 技术显得更加重要。

第二章 简单随机抽样

第二章 简单随机抽样

2.1 定义与符号
总体:( )具体总体;( ;(2)有限总体; 总体:(1)具体总体;( )有限总体; :( (3)与样本框存在一一对应关系的所谓实查总体或被称为 ) 抽样总体的样本框本身。 抽样总体的样本框本身。 单元:总是指构成抽样总体的样本单元(样品、样本点) 单元:总是指构成抽样总体的样本单元(样品、样本点) 抽样单元并不总是等同于个体, 抽样单元并不总是等同于个体,有时抽样单元甚至包含几个或 多个个体 个体:最小的不可再分的单元 个体: 设抽样总体由N个抽样单元组成 个抽样单元组成, 是已知整数 表示总体规模 是已知整数, 总体规模; 设抽样总体由 个抽样单元组成,N是已知整数,表示总体规模; 欲在其中抽取n个抽样单元构成样本 个抽样单元构成样本。 欲在其中抽取 个抽样单元构成样本。 n是一个事先人为确定的不大于 ,不小于 的正整数,称为样本容 是一个事先人为确定的不大于N,不小于1的正整数 称为样本容 的正整数, 是一个事先人为确定的不大于 简称样本量或样品数,表示样本规模。 量,简称样本量或样品数,表示样本规模。 样本容量相对于总体规模的比例f=n/N,称为抽样比 样本容量相对于总体规模的比例 ,称为抽样比
n CN
简单随机抽样的三个等价定义: 简单随机抽样的三个等价定义:
定义2.1 从总体的 个单元中,一次整批抽取 个单元,使任何一个 从总体的N个单元中 一次整批抽取n个单元 个单元中, 个单元, 定义 单元被抽中的概率都相等,任何n个不同单元组成的组合被抽中的概 单元被抽中的概率都相等,任何 个不同单元组成的组合被抽中的概 率也相等,这种抽样称为简单随机抽样。 率也相等,这种抽样称为简单随机抽样。 定义2.2从总体的 个单元中,逐个不放回地抽取单元,每次抽取到 从总体的N个单元中 定义 从总体的 个单元中,逐个不放回地抽取单元, 尚未入样的任何一个单元的概率都相等,直到抽足n个单元为止 个单元为止, 尚未入样的任何一个单元的概率都相等,直到抽足 个单元为止,这 样所得的n个单元组成一个简单随机样本 个单元组成一个简单随机样本。 样所得的 个单元组成一个简单随机样本。 定义2.3 按照从总体的 个单元中抽取 个单元的所有可能不同的组 按照从总体的N个单元中抽取 个单元中抽取n个单元的所有可能不同的组 定义 n n 个样本数, 个样本随机抽取一个样本, 合构造所有可能的 CN个样本数,从 CN 个样本随机抽取一个样本,使 n 这种抽样称为简单随机抽样。 每个样本被抽中的概率都等于1/ CN ,这种抽样称为简单随机抽样。 n N

第二章 简单随机抽样

第二章 简单随机抽样

第二章简单随机抽样§2.1 引言§2.2 估计量§2.3 样本量的确定§2.4 其他问题§2.1 引言➢简单随机抽样也称为纯随机抽样.从抽样框内的N个抽样单元中随机地、逐个抽取n个单元组成样本,在每次抽选时,总体中每个单元入样的概率都相等,这n个被抽中的单元就构成了简单随机样本。

➢简单随机样本也可以从总体中一次取得全部n 个单元,要求全部可能的样本每种样本被抽得的概率都相等。

➢放回抽样与不放回抽样⏹抽选方法➢抽签法当总体不大时,可以用均匀同质的材料制作N个签,将其充分混合,然后一次抽取n个签,或一次抽取一个签但不放回,接着抽下一个签直到第n个签为止,则这n个签上所示的号码表示入样的单元号。

➢随机数法当总体较大时,抽签法实施起来很困难,这时可以利用随机数表、随机数骰子、计算机产生的伪随机数进行抽样。

※随机数表随机数表是由数字0,1,…,9组成的表,每个数字都有同样的机会被抽中。

常用的做法:根据总体大小N的位数决定在随机数表中随机抽取几列,如N=678,要取n=5的样本,则在随机数表中随机抽取3列,顺序往下,选出头5个001~678之间互不相同的数,如果这3列随机数字不够,可另选其他3列继续,直到抽满n个单元为止。

※随机数骰子随机数骰子是由均匀材料制成的正20面体,面上标有0~9的数字各2个。

我国“运筹”牌随机数骰子一盒有6个不同颜色的骰子,使用时,根据总体大小N的位数,如N=327的位数是3,则将3个不同颜色的骰子放入盒中,并规定每种颜色所代表的位数,如红色代表个位数,蓝色代表十位数,黄色代表百位数等,盖上盒盖,摇动盒子,使骰子充分旋转,然后打开盒盖,读出骰子所表示的数字,重复上述步骤,直到产生n个不同的随机数。

※计算机产生伪随机数不少统计软件都有现成的产生随机数的程序,利用计算机产生的随机数具有快捷、方便的特点,但需要注意的事,利用计算机产生的随机数是伪随机数,并不能保证其随机性。

抽样调查-第2章简单随机抽样

抽样调查-第2章简单随机抽样

N2 1
f
S2
n

V (P)
V ( p)

1
f
1 NP(1 P)
n n 1
返回
总体总量的估计量方差是总体均值方差的直接 推导,下面我们来推导总体比例估计量的方差。
1 f 1
V (P)
NP(1 P)
n N 1
只需证明此时S 2 1 NP(1 P)即可。 N 1
返回
设N个样本单元中有N1个具有某一特 性,即有N1个单元取值为1,有N-N1个单元 取值为0.
Yi 2

N( 1 N
N
Yi )2 ]
i 1
返回

1 n( N
f 1)
[
N i 1
Yi 2

2
NY ]

1 f n( N 1)
N
(Yi 2
Y
2
)
i 1

1 f n( N 1)
N
(Yi
i 1
Y )2
S 2 (1 f ) n
即 V (y) 1 f S 2 n
C C2 n2 2 N 2
每个样本被抽中的概率为:
C C2 n2 2 N 2
/
CNn

n(n 1) N (N 1)
返回
引理二 从总体规模为N的总体中抽取一个样 本量为n的简单随机样本。若对总体中的每个单
元 Yi ,引进随机变量 ai 如下:
ai

1,
若Yi入样

0,若Yi不入样(i 1,2,, N )
N i1
(Yi
Y )2
N 2
N 1
返回
总体指标值上面带符号“ ”的表示由样本得

抽样调查第2章简单随机抽样ppt课件

抽样调查第2章简单随机抽样ppt课件
记录样本
将读取到的随机数对应的个体作为样本,并记录其编号。
计算机模拟法
编号
选择随机数生成器
设置参数
生成随机数
筛选样本
将总体的个体编号,并将 编号数据输入计算机。
在计算机中选择一个合适 的随机数生成器。
根据需要设置随机数生成 器的参数,如生成随机数 的范围、数量等。
使用随机数生成器生成 一定数量的随机数。
详细记录每个被抽中样本的信息和特征,如 姓名、性别、年龄、职业等。
处理异常情况
保密原则
如遇到无法联系或拒绝接受调查的样本,需 按照预先设定的方案进行处理,如替换或重 新抽取等。
在整个抽样过程中,需严格遵守保密原则, 确保被调查者的隐私不被泄露。
05
数据分析与结果解读
数据整理与初步分析
1 2
数据来源与采集方式
根据生成的随机数,从总 体中筛选出对应的个体作 为样本,并记录其编号。 如果需要,还可以对样本 进行进一步的处理和分析。
03
样本容量确定与误差控制
样本容量确定原则及方法
原则
在满足调查精度和可靠性的前提下, 尽可能减少样本容量,以节约成本和 提高效率。
方法
根据总体大小、总体方差、调查精度要 求等因素,采用适当的统计公式或经验 法则来确定样本容量。
01
介绍点估计和区间估计的概念、方法和应用场景,并比较其优
缺点。
假设检验的基本原理
02
阐述假设检验的基本原理和步骤,包括原假设和备择假设的设
定、检验统计量的选择、显著性水平的确定等。
常用统计检验方法
03
介绍常用的统计检验方法,如t检验、F检验、卡方检验等,并
说明其应用场景和注意事项。

第二章 简单随机抽样

第二章 简单随机抽样

n
!(
N! N
n)!
C62
6! 15 2!4!
例2.2 N=8,其总体单元数值为:2,4,4,4,6,6,6,18
从中抽取n=3的简单随机样本个数
C83
8! 3!5!
56
用大写字母和小写字母分别表示有关总体和样本的量
关于总体变量Y的N个变量值记为 Y1,Y2,,YN
总体均值:Y
Y N
1 N
N
(1)简单随机抽样中用于估计总体均值的统计量是样本均值,而 待估总体参数与用于估计的统计量两者“同形同构”; (2)简单随机抽样直接从总体抽取个体; (3)简单随机抽样是任何其他概率抽样的核心(任何其他概率抽 样方式都或多或少包含简单随机抽样的成分) (4)容易操作。
随机抽样的形式
随机抽样分为四种形式:放回有序;放回无序;不放回有序;不放回 无序
不放回无序的随机抽样其所有可能样本数是最少的,实际操作最简单, 简称不放回简单随机抽样(SRSWOR)
放回有序的所有可能样本数最多,但理论结果最简单,简称放回简单 随机抽样(SRSWR)
简单随机抽样指不放回简单随机抽样
2.1 定义与符号
总体:(1)具体总体;(2)有限总体; (3)与样本框存在一一对应关系的所谓实查总体或被称为
定义2.3 按照从总体的N个单元中抽取n个单元的所有可能不同的组
合构造所有可能的
CNn个样本数,从
C
n N
个样本随机抽取一个样本,使
每个样本被抽中的概率都等于1 / CNn ,这种抽样称为简单随机抽样。
n
100
400
100
400
N
5 000
5 000 10 000
10 000

示范教案( 简单随机抽样)

示范教案(  简单随机抽样)

诚西郊市崇武区沿街学校第二章统计本章教材分析现代社会是信息化的社会,数字信息随处可见,因此专门研究如何搜集、整理、分析数据的科学——统计学就备受重视.统计学是研究如何搜集、整理、分析数据的科学,它可以为人们制定决策提供根据.在客观世界中,需要认识的现象无穷无尽.要认识某现象的第一步就是通过观察或者者试验获得观测资料,然后通过分析这些资料来认识此现象.如何获得有代表性的观测资料并可以正确地加以分析,是正确地认识未知现象的根底,也是统计所研究的根本问题.本章主要介绍最根本的获取样本数据的方法,以及几种从样本数据中提取信息的统计方法,其中包括用样本估计总体分布、数字特征和线性回归等内容.从义务教育阶段来看,统计知识的教学从小学到初中分为三个阶段,在每个阶段都要学习搜集、整理、描绘和分析数据等处理数据的根本方法,教学目的随着学段的升高逐渐进步.在义务教育阶段的统计与概率知识的根底上,课程标准要求通过实际问题及情境,进一步介绍随机抽样、样本估计总体、线性回归的根本方法,理解用样本估计总体及其特征的思想,体会统计思维与确定性思维的差异;通过实习作业,较为系统地经历数据搜集与处理的全过程,进一步体会统计思维与确定性思维的差异.本章教学时间是是约需7课时,详细分配如下〔仅供参考〕:随机抽样2.1.1简单随机抽样整体设计教学分析教材是以探究一批小包装饼干的卫生是否达标为问题导向,逐步引入简单随机抽样概念.并通过实例介绍了两种简单随机抽样方法:抽签法和随机数法.值得注意的是为了使学生获得简单随机抽样的经历,教学中要注意增加学生理论的时机.例如,用抽签法决定班里参加某项活动的代表人选,用随机数法从全年级同学中抽取样本计算平均身高等等.三维目的1.能从现实生活或者者其他学科中推出具有一定价值的统计问题,进步学生分析问题的才能.2.理解随机抽样的必要性和重要性,进步学生学习数学的兴趣.3.学会用抽签法和随机数法抽取样本,培养学生的应用才能.重点难点教学重点:理解随机抽样的必要性和重要性,用抽签法和随机数法抽取样本.教学难点:抽签法和随机数法的施行步骤.课时安排1课时教学过程导入新课抽样的方法很多,某个抽样方法都有各自的优越性与局限性,针对不同的问题应中选择适当的抽样方法.教师点出课题:简单随机抽样.推进新课新知探究提出问题(1)在1936年美国总统选举前,一份颇有名气的杂志(LiteraryDigest)的工作人员做了一次民意测验.调查兰顿(ndon)(当时任堪萨斯州州长)和罗斯福(F.D.Roosevelt)(当时的总统)中谁将中选下一届总统.为了理解公众意向,调查者通过簿和车辆登记簿上的名单给一大批人发了调查表(注意在1936年和汽车只有少数富人拥有).通过分析收回的调查表,显示兰顿非常受欢迎,于是此杂志预测兰顿将在选举中获胜.实际选举结果正好相反,最后罗斯福在选举中获胜,其数据如下:你认为预测结果出错的原因是什么?由此可以总结出什么教训?〔2〕假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进展卫生达标检验,你准备怎样做?显然,你只能从中抽取一定数量的饼干作为检验的样本.那么,应当怎样获取样本呢?〔3〕请总结简单随机抽样的定义.讨论结果:(1)预测结果出错的原因是:在民意测验的过程中,即抽取样本时,抽取的样本不具有代表性.1936年拥有和汽车的美国人只是一小部分,那时大部分人还很穷.其调查的结果只是富人的意见,不能代表穷人的意见.由此可以看出,抽取样本时,要使抽取出的样本具有代表性,否那么调查的结果与实际相差较大.(2)要对这批小包装饼干进展卫生达标检查,只能从中抽取一定数量的饼干作为检验的样本,用样本的卫生情况来估计这批饼干的卫生情况.假设对这批饼干全部检验,那么费时费力,等检查完了,这批饼干可能就超过保质期了,再就是会破坏这批饼干的质量,导致无法出售.获取样本的方法是:将这批小包装饼干,放入一个不透明的袋子中,搅拌均匀,然后不放回地摸取〔这样可以保证每一袋饼干被抽到的可能性相等〕,这样就可以得到一个样本.通过检验样本来估计这批饼干的卫生情况.这种抽样方法称为简单随机抽样.(3)一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),假设每次抽取时总体内的各个个体被抽到的时机都相等,就把这种抽样方法叫做简单随机抽样.最常用的简单随机抽样方法有两种:抽签法和随机数法.提出问题(1)抽签法是大家最熟悉的,也许同学们在做某种游戏,或者者者选派一部分人参加某项活动时就用过抽签法.例如,高一(2)班有45名学生,现要从中抽出8名学生去参加一个座谈会,每名学生的时机均等.我们可以把45名学生的学号写在小纸片上,揉成小球,放到一个不透明袋子中,充分搅拌后,再从中逐个抽出8个号签,从而抽出8名参加座谈会的学生.请归纳抽签法的定义.总结抽签法的步骤.(2)你认为抽签法有什么优点和缺点?当总体中的个体数很多时,用抽签法方便吗?(3)随机数法是利用随机数表或者者随机骰子或者者计算机产生的随机数进展抽样.我们仅学习随机数表法即利用随机数表产生的随机数进展简单随机抽样的方法.怎样利用随机数表产生样本呢下面通过例子来说明.假设我们要考察某公司消费的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进展检验.利用随机数表抽取样本时,可以按照下面的步骤进展.第一步,先将800袋牛奶编号,可以编为000,001, (799)第二步,在随机数表中任选一个数.例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行.)16227794394954435482173793237887352096438426349164 84421753315724550688770474476721763350258392120676 63016378591695556719981050717512867358074439523879 33211234297864560782524207443815510013429966027954 57608632440947279654491746096290528477270802734328第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉.按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出.这样我们就得到一个容量为60的样本.请归纳随机数表法的步骤.(4)当N=100时,分别以0,3,6为起点对总体编号,再利用随机数表抽取10个号码.你能说出从0开始对总体编号的好处吗?(5)请归纳随机数表法的优点和缺点.讨论结果:(1)一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.抽签法的步骤是:1°将总体中个体从1—N编号;2°将所有编号1—N写在形状、大小一样的号签上;3°将号签放在一个不透明的容器中,搅拌均匀;4°沉着器中每次抽取一个号签,并记录其编号,连续抽取n次;5°从总体中将与抽取到的签的编号相一致的个体取出.(2)抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,假设标号的签搅拌得不均匀,会导致抽样不公平.因此说当总体中的个体数很多时,用抽签法不方便.这时用随机数法.(3)随机数表法的步骤:1°将总体中个体编号;2°在随机数表中任选一个数作为开始;3°规定从选定的数读取数字的方向;4°开始读取数字,假设不在编号中,那么跳过,假设在编号中那么取出,依次取下去,直到取满为止;5°根据选定的号码抽取样本.(4)从0开始编号时,号码是00,01,02,…,99;从3开始编号时,号码是003,004,…,102;从6开始编号时,号码是006,007,…,105.所以以3,6为起点对总体编号时,所编的号码是三位,而从0开始编号时,所编的号码是两位,在随机数表中读数时,读取两位比读取三位要时,所以从0开始对总体编号较好.(5)综上所述可知,简单随机抽样有操作简便易行的优点,在总体个数不多的情况下是行之有效的.但是,假设总体中的个体数很多时,对个体编号的工作量太大,即使用随机数表法操作也并不方便快捷.另外,要想“搅拌均匀〞也非常困难,这就容易导致样本的代表性差.应用例如例1某车间工人加工一种轴一一共100件,为了理解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?分析:简单随机抽样有两种方法:抽签法和随机数表法,所以有两种思路.解法一〔抽签法〕:①将100件轴编号为1,2, (100)②做好大小、形状一样的号签,分别写上这100个号码;③将这些号签放在一个不透明的容器内,搅拌均匀;④逐个抽取10个号签;⑤然后测量这10个号签对应的轴的直径的样本.解法二〔随机数表法〕:①将100件轴编号为00,01,…99;②在随机数表中选定一个起始位置,如取第22行第1个数开始(见教材附录1:随机数表);③规定读数的方向,如向右读;④依次选取10个为68,34,30,13,70,55,74,77,40,44,那么这10个号签相应的个体即为所要抽取的样本.点评:此题主要考察简单随机抽样的步骤.抽签法的关键是为了保证每个个体被抽到的可能性相等而必须搅拌均匀,当总体中的个体无差异,并且总体容量较小时,用抽签法;用随机数表法读数时,所编的号码是几位,读数时相应地取连续的几个数字,当总体中的个体无差异,并且总体容量较多时,用抽签法.变式训练1.以下抽样的方式属于简单随机抽样的有____________.〔1〕从无限多个个体中抽取50个个体作为样本.〔2〕从1000个个体中一次性抽取50个个体作为样本.〔3〕将1000个个体编号,把号签放在一个足够大的不透明的容器内搅拌均匀,从中逐个抽取50个个体作为样本.〔4〕箱子里一一共有100个零件,从中选出10个零件进展质量检验,在抽样操作中,从中任意取出一个零件进展质量检验后,再把它放回箱子.〔5〕福利彩票用摇奖机摇奖.解析:〔1〕中,很明显简单随机抽样是从有限多个个体中抽取,所以〔1〕不属于;〔2〕中,简单随机抽样是逐个抽取,不能是一次性抽取,所以〔2〕不属于;很明显〔3〕属于简单随机抽样;〔4〕中,抽样是放回抽样,但是简单随机抽样是不放回抽样,所以〔4〕不属于;很明显〔5〕属于简单随机抽样.答案:〔3〕〔5〕2.要从某厂消费的30台机器中随机抽取3台进展测试,写出用抽签法抽样样本的过程.分析:由于总体容量和样本容量都较小,所以用抽签法.解:抽签法,步骤:第一步,将30台机器编号,号码是01,02, (30)第二步,将号码分别写在一张纸条上,揉成团,制成号签.第三步,将得到的号签放入不透明的袋子中,并充分搅匀.第四步,从袋子中依次抽取3个号签,并记录上面的编号.第五步,所得号码对应的3台机器就是要抽取的样本.例2人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?解:简单随机抽样的本质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始张,其他各张牌虽然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样.点评:判断简单随机抽样时,要紧扣简单随机抽样的特征:逐个、不放回抽取且保证每个个体被抽到的可能性相等.变式训练如今有一种“够级〞游戏,其用具为四副扑克,包括大小鬼〔又称为花〕在内一一共216张牌,参与人数为6人并坐成一圈.“够级〞开始时,从这6人中随机指定一人从已经洗好的扑克牌中随机抽取一张牌〔这叫开牌〕,然后按逆时针方向,根据这张牌上的数字来确定谁先抓牌,这6人依次从216张牌中抓取36张牌,问这种抓牌方法是否是简单随机抽样?解:在这里只有抽取的第一张扑克牌是随机抽取的,其他215张牌已经确定,即这215张扑克牌被抽取的可能性与第一张扑克牌可能性不一样,所以不是简单随机抽样.知能训练1.为了理解全校240名学生的身高情况,从中抽取40名学生进展测量,以下说法正确的选项是〔〕A.总体是240B.个体C.样本是40名学生D.样本容量是40答案:D2.为了理解所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是〔〕A.总体B.个体C.总体的一个样本D.样本容量答案:C3.一个总体中一一共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,那么某一特定个体被抽到的可能性是____________.1答案:104.为了检验某种产品的质量,决定从40件产品中抽取10件进展检查,如何用简单随机抽样抽取样本?解:方法一〔抽签法〕:①将这40件产品编号为1,2, (40)②做好大小、形状一样的号签,分别写上这40个号码;③将这些号签放在一个不透明的容器内,搅拌均匀;④连续抽取10个号签;⑤然后对这10个号签对应的产品检验.方法二〔随机数表法〕:①将40件产品编号,可以编为00,01,02,…,38,39;②在随机数表中任选一个数作为开始,例如从第8行第9列的数5开始,;③从选定的数5开始向右读下去,得到一个两位数字号码59,由于59>39,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34.至此,10个样本号码已经取满,于是,所要抽取的样本号码是16,19,10,12,07,39,38,33,21,34.拓展提升现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进展质量检验.如何用随机数法设计抽样方案?分析:重新编号,使每个号码的位数一样.解:方法一:第一步,将元件的编号调整为010,011,012,...,099,100, (600)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比方,选第6行第7个数“9〞,向右读.第三步,从数“9”开始,向右读,每次读取三位,凡不在010—600中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到544,354,378,520,384,263.第四步,以上这6个号码所对应的6个元件就是所要抽取的对象.方法二:第一步,将每个元件的编号加100,重新编号为110,111,112,...,199,200, (700)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比方,选第8行第1个数“6〞,向右读.第三步,从数“6〞开始,向右读,每次读取三位,凡不在110—700中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到630,163,567,199,507,175.第四步,这6个号码分别对应原来的530,63,467,99,407,75.这些号码对应的6个元件就是要抽取的对象.课堂小结1.简单随机抽样是一种最简单、最根本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法.2.抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,假设标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法一样,缺点是当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适宜总体容量较小的抽样类型.3.简单随机抽样每个个体入样的可能性都相等,均为N n ,但是这里一定要将每个个体入样的可能性、第n 次每个个体入样的可能性、特定的个体在第n 次被抽到的可能性这三种情况区分开来,防止在解题中出现错误.作业课本本节练习2、3.设计感想本节教学设计以课程标准的要求为指导,重视引导学生参与到教学中,表达了学生的主体地位.同时,根据高考的要求,适当拓展了教材,做到了用教材,而不是教教材.。

第二章(简单随机抽样)

第二章(简单随机抽样)

1 ∑ Yi = N i =1
N
∑Y
i =1
N
i
=Y
性质二
对于简单随机抽样,V(y) =
1− f 2 n S , 其中f = ,为抽样比。 n N
证明:
n 1 n 1 2 V(y) E ( y − Y ) = E[ ∑ yi − Y ] = 2 E[∑ ( yi − Y )]2 = n i =1 n i =1 2
引入一个0 引入一个0-1变量
αi
1 i ∈s = 0 i ∉s
n P(αi =1) = = f N
n E(αi ) = E(α ) = N
2 i
n n n n 2 V(αi ) = E(αi ) − E(αi ) = − = (1− ) = f (1− f ) N N N N
| θˆ − θ | P( ≤ µα ) = 1 − α ˆ) S (θ
[θ ± µ S (θˆ)]
α
【例2.3】 例2.3
• 我们从某个N=100的总体中抽出一个大小为 n=10的简单随机样本,要估计总体平均水 平并给出置信度为95%的区间估计。
序号
i
1 4
2 5
3 2
4 0
5 4
6 6
7 6
8 15
序号1 yi 4 2 5 3 2 简单随机样本的指标值 4 5 6 7 2 3 4 5 8 4 9 13 10 6
1 n( N − 1) 2 N −n 2 = S −n S ] = S2 [ n −1 N nN
1− f 2 1− f 1− f 2 2 所以,E[v( y )] = E ( )s = E (s ) = S n n n
• 大样本下,抽样调查估计量渐进正态

抽样调查第2章简单随机抽样

抽样调查第2章简单随机抽样

有限总体分布估计
了解有限总体指标量的分布情况,即要估计 总体中具有某种特征的个体所占比例,可令
(t Yi ) 10,当,当YYi it;t 则有限总体分布可表示为
1 N
F (t)
N
(t Yi )
i 1
F (t)是量(t Yi )的平均值,可用样本 {(t yi ),i 1,2,, n}的均值来估计
有限总体分布估计
F (t)的估计量为
Fn (t)
1 n
n i 1
(t
yi )
该估计的方差的估计为
v(Fn (t))
1 1 n 1
n N
Fn (t)(1
Fn (t))
Wald-Wolfowitz定理 区间估计 样本量的确定
Wald-Wolfowitz定理
定理2.4.1 设{aN1,, aNN }和{xN1,, xNN }(N 1,2,)是 两个实数序列的集合,满足:对r 3,4及大的N,有
定义2 按照从总体的N个单元抽取n个单元的所有 可能不同组合构造所有可能的CNn个样本,从CNn 个样本随机抽取1个,使每个样本被抽中的概率等 于1/ CNn ,这种抽样成为简单随机抽样。
定义3 从总体的N个单元中,一次整批地抽取n个 单元,使任何一个单元被抽中的概率都相等,任 何n个不同单元组成的组合被抽中的概率也都相 等,这种抽样称为简单随机抽样。
9
6 7
0 3
顶视图
随机数法
u永久随机数法
抽样者给总体的第i个个体赋予一个[0,1]上的 随机数Ri,Ri与第i个个体永久对应,抽样设计时, 确定好抽样比f,Ri<f的对应单元入样。
特点: (1)可保证多次抽样中有大量相同单元; (2)缺点是样本量不完全确定

讲稿2-简单随机抽样

讲稿2-简单随机抽样
N N 1 2 V y 2 V iY i 2 Y V ( i ) n n i 1 i i 1 N 1 n n 2 2 (1 ) Y n N N i 1 i
n
(1
N
N
1 n n n ) (1 ) N N 1 N N N n

i 1
N
Y iY j cov V ( i , j ) ji ) N 1 1

i 1 ji
N
N
Y iY j
N
n N
N
(1
n N

1 n n 1
2
N n 1 2 (1 ) Y N N i 1 i N 1

i 1 N
Y iY j ji
p a n
2

1 N

i 1
N
Yi
Y i 0或 1
N N 1

1
n
n
yi
n
y i 0或 1
y
2
i 1
S
2

Y 1
i 1
i
Y

2


2
s

y n 1
i 1
1
i
Y
R
i 1
N
i

i 1
N
X
i
Y X

Y X
ˆ R

i 1
n
yi xi
y x

三、地位与作用

优点

简单直观 理论基础 N很大时难以获得抽样框 样本分散不易实施,调查费用高

三种抽样方法之简单随机抽样

三种抽样方法之简单随机抽样
从总体中取出的一部分个体的集体叫做这个总 体的一个样本。
这15000名学生的视力情况就组成一个样本
样本中的个体的数目叫做样本的容量。15000
简单随机抽样
回顾(初中知识):总体、个体、样本、样本容 量
的概念. 总体:所要考察对象的全体。 个体:总体中的每一个考察对象。
样本:从总体中抽取的一部分个体叫做这个总 体的一个样本。
思 考:样本一定能准确地反应总体吗? 样本 估计 总体
第一种重要的科学的抽样方法
2.1.1简单随机抽样
简单随机抽样
思考
问题: 如何科学地抽取样本?
使得样本能比较准确地反映总体
搅拌均匀 使得每个个体被抽取的机会均等
合理、公平
简单随机抽样
实例一
现从我校高二(29)班41名同 学中任选取10名参加元旦文艺汇演, 为保证选取的公平性,你打算如何 操作?
简单随机抽样
简单随机抽样的概 念 设一个总体含有N个个体 ,从中逐个不放
回地抽取n个个体作为样本 (n≤N),如果每次抽 取时总体内的各个个体被抽到的机会都相等, 这种抽样方法叫做简单随机抽样。
注意以下四点: (1)它要求被抽取样本的总体的个体数有限; (2)它是从总体中逐个进行抽取; (3)它是一种不放回抽样; (4)它是一种等概率抽样 (每个个体入样的概率 n/N)。
(2)将这N个号码写在形状、 大小相 同的号签上;
(3)将号签放在同一箱中,并 搅拌均匀;
(4)从箱中每次抽出1个号签, 连续抽出n次;
制作编号为制0到签53的号签
将41个号搅签匀搅拌均匀
随机从中逐一抽抽签出10个签 让对应号取码出的个学体生参加
(5)将总体中与抽到的号签编 号一致的n个个体取出。

第二章第一节简单随机抽样

第二章第一节简单随机抽样

第二章第一节简单随机抽样一、重点难点:1.正确理解随机抽样的概念,会描述抽签法、随机数表法的一般步骤.2.能够根据样本的具体情况选择适当的方法进行抽样.二、知识点讲解:一、简单随机抽样的概念:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。

思考:简单随机抽样的每个个体入样的可能性为多少?(n/N)二、抽签法和随机数法:1、抽签法一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。

抽签法的一般步骤:(1)将总体的个体编号;(2)连续抽签获取样本号码.思考:你认为抽签法有什么优点和缺点;当总体中的个体数很多时,用抽签法方便吗?解析:操作简便易行,当总体个数较多时工作量大,也很难做到“搅拌均匀”2、随机数法利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法.怎样利用随机数表产生样本呢?下面通过例子来说明,假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,可以按照下面的步骤进行。

第一步,先将800袋牛奶编号,可以编为000,001, (799)第二步,在随机数表中任选一个数,例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行)。

16 22 77 94 39 49 54 43 54 82 17 37 93 23 7884 42 17 53 31 57 24 55 06 88 77 04 74 47 6763 01 63 78 59 16 95 55 67 19 98 10 50 71 7533 21 12 34 29 78 64 56 07 82 52 42 07 44 3857 60 86 32 44 09 47 27 96 54 49 17 46 09 6287 35 20 96 43 84 26 34 91 6421 76 33 50 25 83 92 12 06 7612 86 73 58 07 44 39 52 38 7915 51 00 13 42 99 66 02 79 5490 52 84 77 27 08 02 73 43 28第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉,按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出,这样我们就得到一个容量为60的样本。

《简单随机抽样》教学设计

《简单随机抽样》教学设计

《简单随机抽样》的教学设计课时:1课时,教材版本:人教B版《高中数学》必修三教材内容分析简单随机抽样是人教B版《高中数学》必修三的第二章“统计”的第一节“随机抽样”的第一课时,其主要内容是介绍简单随机抽样的概念以及如何实施简单随机抽样.从知识类型角度分析,“简单随机抽样”属于程序性知识,是一个结构清晰的动手操作程序.对它的学习要求,学生尽可能回忆有关的程序性知识.通过本节内容的学习能促进学生对“用样本估计总体”的统计思想的认识,本节知识既是初中统计知识的延伸,也是学习系统抽样、分层抽样两种抽样方法的知识与思维基础,更是落实数据分析核心素养的重要载体,因此确定本节的教学重点是:对统计思想的认识.抽样方法的提炼与归纳.“课标”的要求是能从现实生活或其他学科中提出具有一定价值的统计问题;结合具体的实际问题情境,理解随机抽样的必要性和重要性;在参与解决统计问题的过程中,学会用简单随机抽样方法从总体中抽取样本.体现了本节内容的学习要与现实生活.实际问题相联系,在问题解决的过程中获取知识.“课改”则要求教师既要以学生为主体,更要面向全体学生,以学生已有的认知经验为基础,让学生主动地参与新知的探究活动,要求通过学生的自主与合作探究,切实经历知识的发生.发展过程,体会其所蕴含的思维方法,初步形成运用统计的思想和方法来思考问题和解决问题的习惯.从教材编写角度看,本节课是在学生初中已学习了统计初步知识的基础上,系统学习统计的基本方法,体验统计思想的第一课时,本节课的内容确定为随机抽样单元引入.2.1.1简单随机抽样的教学.通过随机抽样单元引入的教学,让学生认识随机抽样的必要性和重要性,明确随机抽样的意义;通过简单随机抽样的教学,让学生理解简单随机抽样的含义与特点,归纳并掌握抽签法.随机数表法的抽样方法,能根据具体问题的特点合理选择具体的抽样方法,以提升学生的数学能力.教学目标:知识与技能:能独立(或合作)归纳抽样方法,能说明简单随机抽样的意义与特点,知道学习随机抽样的必要性和重要性,能合理选择抽样方法对简单问题进行抽样.过程与方法:通过对实际问题情境的分析体会随机抽样的必要性和重要性,通过抽签法.随机数表法的学习,培养学生的归纳概括能力,通过抽样方法的合理选择培养学生的数学优化意识.情感.态度与价值观:进一步感受统计知识在生产.生活中的广泛应用,体会统计学用样本估计总体的思维策略,强化合作意识.教学重点与难点:教学的重点:理解随机抽样的必要性和重要性,用抽签法和随机数法抽取样本.教学难点:抽签法和随机数法的实施步骤.学情分析:由于在初中已学过样本.容量.样本容量等概念,因此学生对统计的学习已具有一定的知识基础和思维基础.但是初中没有系统研究具体的抽样方法,且本节是章的起始课,特别是单元的引入内容文字量较大,要给予学生足够的信心去阅读.分析教材,随机抽样的“每一个个体被抽到的机会是均等的”等可能性是很难理解的,应引导学生充分体会.抽签法.随机数表法在教材中并没有较为明确的陈述,是通过对具体问题的解决方式呈现的,即具体的方法蕴含在问题解决的过程中,这需要教师引导学生通过小组合作的方式,逐步的归纳.概括,特别是两种方法的常用选择策略,对学生的能力要求较高,需要教师给予必要的讲解.综上分析确定本节的难点是:对“随机抽样的必要性.重要性及等可能性”的理解,抽签法.随机数表法的归纳.概括与选择.突破策略为:教师引导学生分析多个具体实例;给足时间让学生在独立思考的基础上再充分合作交流;让学生代表展示其思维过程,强化全体学生对思维过程的感悟;教师在学生展示思维过程的基础上再进行提升与点拨.教学策略分析教学中遵循“学生为主体,教师为主导,问题解决为主线”的指导思想,给学生创设自主探究.合作交流的时间与空间,引导学生经历数学知识再发现的过程,让学生在参与中获取知识,发展思维,感悟数学.在知识内容的处理方面,增加了三个实际问题情境,通过分析问题的解决策略,让学生重点体会用样本估计总体及随机抽样的必要性和重要性,促进学生的理性思维;对随机抽样的“每一个个体被抽到的机会是均等的”等可能性这一难点,教师给予必要的讲解;通过补充例题.习题,让学生充分理解抽签法.随机数表法的具体操作程序及根据问题特点合理选择具体方法.课堂教学过程中,根据学生的思维水平,首先引导同学们回顾初中所学相关知识,再自主阅读教材内容,引导学生发现学习;其次是在一定的自主探究基础上,让学生们进行充分的合作学习,归纳概括新知识,体验成功的快乐;最后是教师对学生的思维活动进行概括.提升,并对重点与难点进行适当的精讲.点拨,以提高课堂教学效率.教学模式为:情境感悟,引入新课——温故知新,获得新知——例题讲解,内化新知——成果展示,应用新知——归纳总结,完善认知.针对学生中存在的客观差异,我以发挥各数学课堂学习小组中思维水平较好的学生作用为主,尽可能给他们在课堂充分展示的机会;教师在学生自主及合作学习过程中,有针对性的进行指导,努力使全体学生在本节的学习过程中,知识与能力都能得到不同程度的提升.教学过程教学反思与评价:简单随机抽样是生活中最为常用的一种方法,最重要的特点是等可能性,应从每次抽取的个体及整个抽样过程来理解,只有通过实践才可能深入理解.大数据是当今社会出现频率最高的词汇,善于收集数据、整理数据,分析数据是当下社会一位社会人都应具备的素质,因此学好简单抽样是我们获得准确的先决条件。

《抽样技术》第二章-简单随机抽样

《抽样技术》第二章-简单随机抽样

1
f
公式V y S 2 1 f 的说明
n
(1)V y 主要取决于S 2和n,与f 关系不大;
(2)当f n 5%时,1 f 可忽略,即V y S 2 ;
N
n
(3)V y S 2 1 f 2 N n 放回时的V y 2 。
n
n N 1
n
❖ 推论2 y 的标准误
Xi——第i个家庭的成年女子数 Yi——第i个家庭成年女子化妆品的总费用 i=1,2,⋯,N
每个成年女子化妆品的平均费用为
N
总的费用 R 总的成年女子数
Yi
i1 N
Xi
Y X
Y X
i1
比率的例子
❖ (3)在某住宅小区的房价调查中,要估计该小区的平 均房屋单价。令
Xi——第i套住宅的建筑面积 Yi——第i套住宅的市场价格 i=1,2,⋯,N
1, 1
2, 3
3, 4
4, 5
1, 2
2, 4
3, 5
1, 3
2, 5
1, 4
二、简单随机抽样的抽选
❖ 首先将容量为N的有限总体中的所有单元从1 到N编好号码,然后从这N个编号中抽取n个。
❖ 具体的抽取方式一般有: (1)抽签法; (2)随机数表法; (3)计算机产生伪随机数法。
随机数表法
❖ 随机数表是由0, 1, 2, ⋯, 9这十个数字组成的,书中 表3.2给出了由2500个一位数字组成的随机数表。这 个随机数表是这样产生的:在这2500个位置上分别 独立地做一次等可能地产生0, 1, 2, ⋯, 9的随机试验。 因此,在任意一个位置上0~9这十个数字出现的可 能性都相同,在任意两个位置上00~99这一百个数 字出现的可能性也都是相同的,在任意三个位置上 000~999这一千个数字出现的可能性也都是相同的, 依次类推。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2

推论 2.12:对于简单随机抽样,n较大时, YR yR 的方差为:
1 f 1 N 2 V ( yR ) ( Y RX ) i i n N 1 i1
设:

S yx SS x
是Y和X的总体相关系数 Y的相对方差(变异系数)
SS x YX
2 S C2 2 Y
C yx
是总体协方差
S yx
的无偏估计。
2.3 比率估计量及其性质

主要变量 Y 与Y有关的辅助变量 X



辅助变量必须与主要变量高度相关 辅助变量与主要变量之间的相关关系整体上相当 稳定 辅助变量的总体总值或总体均值必须是已知的, 或是容易获得的 辅助变量的信息质量更好,或信息更容易取得即 调查成本更低。 比率估计量一般用来估计主要 变量的总体总值和总体均值
【例2.4】

在20世纪90年代初的一项工资研究中,人们发现IT行 业中,从业者的现薪与起薪之间相关系数 高达0.88, 已知某IT企业474名员工的平均起薪为17016.00/年, 现根据对100个简单随机抽样方式选出的员工现薪的调 查结果,估计该企业员工的现薪平均水平。
【例2.5】

根据例【2.4】的数据和结果,比较两种思路下对应的 方差估计结果。
第2章 简单随机抽样(SRS)
2.1概述
抽样总体

样本容量

简单随机抽样也称为纯随机抽样。 从含有 N 个单元的总体中抽取 n 个单元组成 样本,如果抽样是不放回的,则所有可能的样 本有 C 个,若每个样本被抽中的概率相同,都 为 1 C ,这种抽样方法就是简单随机抽样。 称 n N 为抽样比,记为 f 。
(i, j 1, 2,...., N ; i j )

定理 2.1:对于简单随机抽样,作为 Y 的简单估计, Y y 是无偏的,即
E (Y ) E y Y
始终成立。

Y 推论 2.1:对于简单随机抽样, 为: E (Y ) E Ny NY Y
Ny

定理 2.4:简单随机抽样的方差
n 1 2 2 s yi y n 1 i1
2 S 是总体方差 的无偏估计。

推论 2.7:对于简单随机抽样,
V (Y ) v( y ) 1 f 2 s n
是 V ( y ) 的无偏估计。

推论 2.8:
V (Y ) v( Ny ) N 2 (1 f ) 2 s n

比率估计、回归估计需要有足够的样本量才能 保证估计的有效性。

有偏估计:当样本量足够大时,估计的偏倚趋于0。
符号定义
总体均值的比率估计量:
y 1 YR yR X XR x N
总体总值的比率估计量:
YR NYR NyR X y XR x
R 属于简单估计量,不属于比率估计量。
2
比率估计量的方差估计
1 f 2 ˆ R ˆ 2s2 ) v1 ( yR ) ( s 2Rs xy x n X 2 1 f 2 ˆ R ˆ 2s2 ) v2 ( yR ) 2 ( s 2Rs xy x x n
1 f 2 ˆ R ˆ 2s2 ) ( s 2 Rs xy x n 2 X 1 f 2 ˆ R ˆ 2s2 ) v2 (YR ) N 2 2 (s 2Rs xy x x n v1 (YR ) N 2
是 V (Y ) 的无偏估计。

推论 2.9:对于简单随机抽样,
1 f 2 1 f V ( P) v( p) v( y01 ) sp p(1 p) n n 1

推论 2.10:对于简单随机抽样,当n较大时, 有
1 1 f 1 n 2 V ( R) v(r ) 2 yi rxi x n n 1 i1
引理2.4 :对于简单随机抽样, n较大时, Rr 的方差为: V ( R) V (r ) 1 1 f 1 N (Y RX )2 i i 2

X
n
N 1 i1
YR NyR 定理 2.7:对于简单随机抽样,n较大时, 的方差为:

1 f 1 N 2 V (YR ) N ( Y RX ) i i n N 1 i1

引理 2.3:对于简单随机抽样,n较大时, R r 的期望为:
E ( R) E r R
(1) R 不是无偏的; (2)但在某种条件下,R 是近似无偏的。
定理 2.6:对于简单随机抽样,n较大时,YR yR 的期望为: E ( y ) XR Y

R

推论 2.11:对于简单随机抽样, n较大时, YR NyR 的期望为: E (YR ) NXR NY Y



定义2.1 从总体的N个单元中,一次整批抽取n个单元 ,使任何一个单元被抽中的概率都相等,任何n个不同 单元组成的组合被抽中的概率也都相等,这种抽样称为 简单随机抽样。 定义2.2 从总体的N个单元中,逐个不放回地抽取单元 ,每次抽取到尚未入样的任何一个单元的概率都相等, 直到抽足n个单元为止,这样所得的n个单元组成一个简 单随机样本。 定义2.3 按照从总体的N个单元中抽取n个单元的所有 n n 可能不同的组合构造所有可能的 CN 个样本,从 CN 个样 本随机抽取1个样本,使每个样本被抽到的概率都等于 n , 这种抽样称为简单随机抽样。 1 CN
的期望

推论 2.2:对于简单随机抽样, P p 的期望 为:
E ( P) E p P

推论 2.3:对于简单随机抽样,n较大时, Rr 的期望为:
E ( R) E r R

对于有限总体的方差定义 :
1 2 N

Y Y
i i 1
N
2
2 1 N S Yi Y N 1 i1 2

引理2.2 从总体规模为N的总体中抽取一个样本量为n 的简单随机样本,若对总体中的每个单元 Yi ,引进 ai 1 ; Yi 不入样, ai 0 ),则 随机变量 a i(Yi 入样,
n f (i 1, 2,...., N ) N n N n V (ai ) f (1 f ) (i 1, 2,...., N ) N N n n f (1 f ) cov(ai , a j ) (1 ) N ( N 1) N N 1 E (ai )

Y 推论 2.4:对于简单随机抽样, 为: 2 1 f 2
Ny
的方差
V (Y ) N
n
S

推论 2.5:对于简单随机抽样, P p 的方差 为: 1 f 1
V ( P) n N 1 NP (1 P )

推论 2.6:对于简单随机抽样,当n较大时, R 的方差为:
1 1 f 1 N 2 V ( R) 2 ( Y RX ) i i X n N 1 i1
符号
1 Y N
N N

大写符号表示总体的标志值, 用小写符号表示样本的标志值

y
n
总 体
Y Y2 YN Yi 1 N i 1

y y2 yn 1 n yi 1 n i 1 n y1 y 2 y n
Y Yi Y1 Y2 YN
i 1 i 1 n
n
总体指标值 上面带符号 “^”的表 示由样本得 到的总体指 标的估计。i Nhomakorabea
y x
i
2.2 简单估计量及其性质

引理 2.1:从大小为N的总体中抽取一个样本量为n的 简单随机样本,则总体中每个特定单元入样的概率为 n/N,两个特定单元都入样的概率为: n n 1
N N 1
v y 1.3115
由置信度95%对应的 z 1.96,因此,可以 以95%的把握说总体平均水平大约在 5 1.96 1.3115 之间,即 2.4295 和 7.5705 之间。

/2

定理 2.5:简单随机抽样的协方差
1 n s yx yi y xi x n 1 i1
i 1
y
i 1
i
A 1 P N N
2
Y
i 1
N
i
Yi 0或1
a 1 n p yi n n i 1
2
yi 0或1
2 1 N S Yi Y N 1 i 1
1 n yi y 2 s n 1 i 1
R
Y
i 1 N i 1
协方差定义:cov( y , x ) E y E ( y ) x E ( x )

定理 2.3:对于简单随机抽样,有
1 f cov( y , x ) S yx n
1 N 式中, S yx N 1 Yi Y X i X i 1
为总体协方差。
定理2.2:对于简单随机抽样,y 的方差
1 f 2 V y S n
评价调查成功 与否的重要指标
其中, 1 f 称为有限总体校正系数。(未入样率)

估计量的方差 V y 是衡量估计量精度的 度量。影响估计量方差的因素主要是样本量n, 未入样率 1-f和总体方差 。 S2
在简单随机抽样的条件下,只有通过加大 样本量来提高估计量的精度。
N
i
X
Y Y X X
i
r
y x
i 1 i 1 n
n
i

y x
i
简单估计量
y y2 1 n Y y yi 1 n i1 n yn
相关文档
最新文档