简单随机抽样
Chap03简单随机抽样
N i j
(Yi
Y
)(Yj
Y
)
1 nN
1
n 1 N 1
N i 1
(Yi
Y
)2
n 1 N 1
N i 1
(Yi
Y
2 )
1 n
N N
n
1 N 1
N i 1
(Yi
Y
)2
1 f S2
n
证明Ⅱ:仍引进随机变量 ai :
N 1 n 1
N n
n N
ˆ
f
E(ai )
n N
f
(3.5)
借助 ai ,样本均值 y 可以表示成:
y
1 n
N i 1
aiYi
(3.6)
E( y) 1
n
N
E(ai )Yi
i 1
1 n
n N
N
Yi
i 1
Y
推论: Y 的简单估计量Yˆ Ny 也是无偏的,即: E(Ny ) Y
所有可能的样本求平均: E( y)
N 1 y n
N n
个样本中,包含特定单元
Yi
的样
本数为
N 1 n 1
,也有同样多样
本含有任何其他单元,因此
y 1
n
( y1
y2
yn )
1 n
N 1 n 1
数,则编号为这些随机数的 n 个单元组成一个简单随机样本。
随机数的产生可使用随机数骰子或随机数表。
图 3.1 随机数骰子 随机数骰子:标上 0~9 数字的正 20 面体(每个数字出现在两面)
简单随机抽样
一、知识概述1、简单随机抽样:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的机会相等,就称这样的抽样为简单随机抽样.注:(1)一般地,用简单随机抽样从含有N个个体的总体中抽取一个容量为的样本时,每次抽取一个个体时任一个体被抽到的概率为;在整个抽样过程中各个个体被抽到的概率为;(2)简单随机抽样的特点是,逐个抽取,且各个个体被抽到的概率相等;(3)简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.介绍:抽样方法在统计学中很多,如果按照抽取样本时总体中的每个个体被抽取的概率是否相等来进行分类,可分为:等概率抽样和不等概率抽样.在等概率抽样中,又可以分为不放回抽样和放回抽样.在实际应用中,使用较多的是不放回抽样,相对来说,放回抽样在理论研究中显得更为重要.2、简单随机抽样的实施方法:(1)抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本.适用范围:总体的个体数不多时.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.(2)随机数表法:1°.制定随机数表;2°.给总体中各个个体编号;3°.按照一定的规则确定所要抽取的样本的号码.随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.3、简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样.注:抽签法与随机数表法的比较:共同点:(1)抽签法和随机数表法都是简单随机抽样的方法,并且要求被抽取样本的总体的个数有限;(2)抽签法和随机数表法都是从总体中逐个地进行抽取,都是不放回抽样.不同点:(1)抽签法相对于随机数表法简单,随机数表法较抽签法稍麻烦一点;(2)随机数表法更适用于总体中的个体数较多的时候,而抽签法适用于总体中的个数相对较少的时候,所以当总体中的个数较多时,应当选用随机数表法,这样可以节约大量的人力和制作号签的成本与精力.二、例题讲解例1、某次考试有70000名学生参加,为了了解这70000名考生的数学成绩,从中抽取1000名考生的数学成绩进行统计分析,在这个问题中,有以下四种说法:(1)1000名考生是总体的一个样本;(2)1000名考生数学成绩的平均数是总体平均数;(3)70000名考生是总体;(4)样本容量是1000,其中正确的说法有()A.1种B.2种C.3种D.4种解:(3)(4)对,故选B.例2、现要从20名学生中抽取5名进行阅卷调查,写出抽取样本的过程.解:①先将20名学生进行编号,从1编到20;②把号码写在形状、大小均相同的号签上;③将号签放在一个箱子中进行充分搅拌,力求均匀,然后从箱子中抽取5个号签,这5个号签上的号码对应的学生,即为所求的样本.例3、为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,写出用随机数表法抽取样本的过程.解:第一步,先将40件产品编号,可以编为00,01,02,…,38,39.第二步,利用本节教材中提供的随机数表,任选一个数作为开始,例如从第10行第6列的数字开始.第三步,从选定的数6开始,从左往右读,依次得到样本号码是:24,29,05,28,27,34,32,38,20,00.这10个号码所对应的产品为样本.例4、上海某中学从40名学生中选1人作为上海男篮拉拉队的成员,采用下面两种选法:选法一将这40名学生从1~40进行编号,相应地制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选.选法二将39个白球与1个红球混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为拉拉队成员.试问这两种选法是否都是抽签法?为什么?这两种选法有何异同?解:选法二不是抽签法.因为抽签法要求所有的号签编号互不相同,而选法二中39个白球无法相互区分.这两种选法相同之处在于每名学生被选中的概率都相等,等于.例5、某市通过电话进行民意测验实施某项调查,该市的电话号码有7位,其中首两位为区域代码,只能为2,3,5,7的任意两两组合,后5位取自0~9这10个数字.现在任意选择3个区域,每个区域随机选取5个号码进行调查.请你设计一种抽取方案,选出这15个电话号码.解:首先列出所有由2,3,5,7两两组合而成的区域代码共16个,用抽签法随机选取3个;然后制作一张0~99999的随机数表,方法是用抽签法或计算机生成法产生若干个0~9之间的随机整数,5个一组,构成0~99999之间的随机数表;最后用随机数表法选出15个5位号码,分成3组,第1组前加上用抽签法选出的第1个区域代码,第2,3组前分别加上选出的第2,3个区域代码.。
第2章简单随机抽样
称简单随机抽样,所得的样本称为不放回的
简单随机样本,简称简单随机样本
精选可编辑ppt
2
简单随机抽样的实施方法:将总体中的单元 依次从1到N进行编号,然后利用抽签法或随 机数法来进行简单随机抽样
抽签法:一般用于总体所含单元不多的情况, 首先做N个签并依次写上1至N的号码,然后 将签充分混合均匀,再一次抽取其中的n个 签或逐个不放回地抽取n个签,则编号为这n 个签上的号码的单元就构成一个简单随机样 本
注3: V(y),V(Yˆ) 中的 S
2 Y
一般是未知的,因此需要通
过样本进行估计
精选可编辑ppt
14
定理2.2.3
在简单随机抽样中,样本方差
s
2 y
是总体方差
S
2 Y
的无偏估计量,样本协方差 s y x
是总体协方差 S Y X 的无偏估计量
推论2.2.1 在简单随机抽样中,
Vˆ(y) ˆ 1 f n
在一定条件下,利用辅助指标的信息可以提 高对主要指标的估计的精度
一般地,辅助指标可以是主要指标的前期资 料,也可以是表示单元规模的量,或者是单 元的某个易测指标,等等
精选可编辑ppt
31
如果主要指标Y与辅助指标X之间有正相关关 系,就可以构造比估计量
在简单随机抽样中,称 YˆR ˆ yR ˆ RˆX 为总体均 值 Y 的比估计量,称 YˆRˆ NyRRˆX为总体总 值 Y 的比估计量,其中 X 或 X 必须已知
sy2
是
V
(
y
) 的无偏估计量
Vˆ(Yˆ)ˆ N21f n
sy2 是 V
( Yˆ )
的无偏估计量
注:把 Vˆ(y), Vˆ(Yˆ) 分别作为 V(y), V(Yˆ) 的估计 量,都称为标准差估计量
简单随机抽样(创新设计)
03
创新设计在简单随机抽 样中的应用
利用创新技术提高抽样的效率
01
02
03
自动化技术
利用自动化设备或软件进 行随机抽样,减少人工操 作,提高抽样的速度和准 确性。
大数据技术
利用大数据分析技术,对 大量数据进行快速处理和 分析,提高抽样的效率。
云计算技术
利用云计算平台进行分布 式计算,提高数据处理和 存储的效率,加速抽样过 程。
要点一
总结词
要点二
详细描述
简单随机抽样将拓展到其他领域,为不同领域的研究和实 践提供支持。
简单随机抽样作为一种基础统计方法,不仅在统计学领域 有广泛应用,还将拓展到其他领域,如社会学、经济学、 政治学等。通过与其他领域的结合,简单随机抽样将为各 领域的研究和实践提供有力支持,促进跨学科的发展和应 用。
特点
简单随机抽样具有简单易行、误差小、 代表性强的特点,适用于各种类型的 调查对象,尤其适用于样本量较大、 总体各单位之间差异不大的情况。
简单随机抽样的应用场景
市场调研
在市场调研中,简单随机抽样常 用于了解消费者需求、品牌认知 度、市场份额等方面的情况。
社会调查
在社会调查中,简单随机抽样用 于了解社会现象、人口特征、民 意倾向等方面的情况。
总结词
详细描述
人工智能技术将为简单随机抽样提供更智能、 自动化的方法,提高抽样的效率和精度。
人工智能技术,如机器学习和深度学习,可 以应用于简单随机抽样中,实现自动化抽样 和数据分析。通过训练模型,可以自动识别 和筛选符合条件的样本,减少人为干预和误 差,提高抽样的准确性和可靠性。
简单随机抽样的跨领域应用
总结词
原创1:9.1.1 简单随机抽样
2.抽签法确保样本代表性的关键是
A.制签
B.搅拌均匀
C.逐一抽取
D.抽取不放回
解
若样本具有很好的代表性,则每一个个体被抽取的机会相等,
故需要对号签搅拌均匀.
3.使用简单随机抽样从1 000件产品中抽出50件进行某项检查,合适的抽样方法是
A.抽签法
B.随机数法
C.随机抽样法
D.以上都不对
解
由于总体相对较大,样本容量较小,故采用随机数法较为合适.
4.某地有2 000人参加自学考试,为了了解他们的成绩,从中抽取一个样本,若每个
考生被抽到的概率都是0.04,则这个样本的容量是______.
解
n
设样本容量为 n,根据简单随机抽样,得
=0.04,解得 n=80.
Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以
1
写成加权平均数的形式 Y
N
k
f Y
i 1
i
i
.
新知探索
样本均值
样本均值
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,
则称 y
yy
1
2
n
y
n
1 n
y 为样本均值,又称样本平均数.
(1)从无限多个个体中抽取100个个体作为样本.
(2)从20个零件中一次性抽取3个进行质量检验.
(3)从班上50名同学中选数学成绩最好的2名同学参加数学竞赛.
(4)某班45名同学,指定个子最高的5名同学参加学校组织的某项活动.
(5)中国福利彩票30选7,得到7个彩票中奖号码.
简单随机抽样
证明三:
从规模为N的总体中抽取一个样本量为n的简 单随机样本,对总体中的每个单元 Y,有 i
1, 若Yi 入样 ai 0,若Yi不入样
i 1, 2,
,N
1 N y aiYi n i 1 1 N 1 n N E ( y ) Yi E (ai ) Yi Y n i 1 n N i 1
1 1 f 1 N 2 2 ( G ) i X n N 1 i 1 1 1 f 1 N 2 2 ( Y RX ) i i X n N 1 i 1
ˆ Ny 的方差 Y 对于简单随机抽样,n较大时, R R 为
N 1 f 1 2 2 ˆ V (YR ) N (Yi RX i ) n N 1 i 1 ˆ y 的方差 对于简单随机抽样,n较大时, Y R R 为
Y NY
N
i 1
Yi
N ˆ Y Ny n
y
i 1
n
i
ˆ ) E ( Ny ) NE ( y ) NY Y E (Y
N (1 f ) 2 2 ˆ V (Y ) N V ( y ) S n
N (1 f ) 2 2 ˆ ˆ V (Y ) 的无偏估计为 v(Y ) N v( y ) s n
因此对总体比例的估计就是对总体均值的估计, 对总体中具有所研究特征单位的总个数A的估计是 对总体总值估计的一个特例。
利用简单随机抽样的方式随机抽取 n 个单位组成 样本,其中 a 个具有某种属性,则样本比例(样本均 值) n yi p a i 1 y n 就是总体比例 P A / N 的简单估计量; ˆ Np A 就是总体中具有某种属性单位的总个数 A 的简单估 计量。
随机抽样 - 简单 - 讲义
随机抽样知识讲解一、统计中的相关概念总体:所考察对象的某一数值指标的全体构成的集合看作总体.个体:构成总体的每一个元素作为个体.样本:从总体中抽出若干个体所组成的集合叫做样本.样本容量:样本中个体的数目叫样本容量.统计的基本思想方法:用样本估计总体,即通常不去直接去研究总体,而是通过从总体中随机抽取一个样本,根据样本的情况去估计总体的相应情况.二、简单随机抽样1.简单随机抽样的概念概念:一般地,从元素个数为N的总体中不放回地抽取容量为n样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.2.简单随机抽样的特点1)被抽取样本的总体的个数有限;2)从总体中逐个地进行抽取,使抽样便于在实践中操作;3)它是不放回抽样,使其具有广泛的应用性;4)它是等可能抽样,每个个体被抽到的可能性都是nN,保证了抽样方法的公平性.3.常用的简单随机抽样方法1)抽签法:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一张号签,连续抽取n次,就得到一个容量为n的样本.抽签法的步骤:a.编号,即给总体中的所有个体编号,号码可以从1到N.b.制签,即将1~N这N个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作).c搅拌均匀,即将号签放在一个不透明的容器中,搅拌均匀..d逐个不放回抽取,即从容器中每次抽取一个号签,并记录其编号,连续抽取n次.抽签法的优缺点:.a优点:简单易行..b缺点:当总体的容量非常大时,费时、费力又不方便.况且,如果号签搅拌的不均匀,可能导致抽样的不公平.2)随机数表法:随机数表是由0,1,2,,9L这10个数字组成的数表,并且表中的每一位置出现各个数字的可能性相同.通过,随机数表,根据实际需要和方便使用的原则,将几个数组合成一组,然后通过随机数表抽取样本.随机数表法的步骤:.a编号,即将总体中的所有个体进行编号(每个号码位数一致);.b在随机数表中任选一个数作为起始号码;.c从选定的数开始按一定的方向读下去,得到的号码若不在编号中,则跳过,若再编号中,则取出,如果得到的号码前面已经取出,也跳过,如此继续下去,直到取满为止;随机数表法的优缺点:.a优点:简单易行,它很好的解决了用抽签法当总体中的个体数较多时制签难的问题..b缺点:当总体中的个体数很多,需要的样本容量也很大时,用随机数表法抽取仍不方便.4.简单随机抽样的应用应用:常用的简单随机抽样方法有抽签法和随机数表法.抽签法一般适用于容量较小的总体,易于操作;随机数表法解决了制签比较麻烦的问题,但在利用“随机数表法”进行简单随机抽样时,要严格按照课本中介绍的步骤,否则易出错误.结合具体的问题,我们应灵活使用这两种方法.三、系统抽样1.系统抽样的概念概念:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样.(由于抽样样的间隔相等,因此系统抽样也被称作等距抽样)2.系统抽样的步骤:1)编号,即将总体中的个体编号.为方便起见,也可直接利用个体所带有的号码,如准考证号、门牌号等;2)分段,即为将整个的编号进行分段,要确定分段的间隔k .当N n 是整数时,N k n =;当Nn不是整数时,则可用简单随机抽样的方法从总体中剔除一些个体,使剩下的总体中个体个数'N 能被n 整除,这时'N k n=. 3)确定起始个体编号,即由数字1~k 中随机抽取一个数S .4)按照预先确定的规则抽取样本,即通常是将S 依次加上间隔k 的倍数,这样样本的编号依次是:,,2,,(1).S S k S k S n k +++-L3.系统抽样的公平性当N n 是整数时,N k n =;当Nn不是整数时,则可用简单随机抽样的方法从总体中剔除一些个体,使剩下的总体中个体个数'N 能被n 整除,这时'N k n=,上述过程中,总体的每个个体被剔除的可能性相同,也就是说每个个体不被剔除的可能性相同,所以在整个抽样过程中每个个体抽取的可能性仍然相同.4.系统抽样的特点1)适用于总体容量较大的情况;2)剔除多余个体及第一段抽样都用简单随机抽样,因而与简单随机抽样有密切联系; 3)它是等可能抽抽样,每个个体被抽到的可能性都是nN. 四、分层抽样1.分层抽样的概念概念:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,我们经常将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这样的抽样方法叫做分层抽样.2.分层抽样的步骤1)分层,即将总体中各个个体按某种特征分成若干个互不重叠的几部分; 2)按比例确定每层抽取个体的个数;3)各层抽样,即各层中采用简单随机抽样或系统抽样抽取相应的个数; 4)汇合成样本.3.分层抽样的特点1)适用于总体由差异明显的几部分组成的情况;2)更充分的反映了总体的情况;3)它是等可能抽样,每个个体被抽到的可能性都是nN .五、三种抽样方式的区别与联系典型例题一.选择题(共5小题)1.(2015•湖北)我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.134石B.169石C.338石D.1365石【解答】解:由题意,这批米内夹谷约为1534×≈169石,故选:B.2.(2014•重庆)某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100 B.150 C.200 D.250【解答】解:分层抽样的抽取比例为=,总体个数为3500+1500=5000,∴样本容量n=5000×=100.故选:A.3.(2014•广东)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50 B.40 C.25 D.20【解答】解:∵从1000名学生中抽取40个样本,∴样本数据间隔为1000÷40=25.故选:C.4.(2014•湖南)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为P1,P2,P3,则()A.P1=P2<P3B.P2=P3<P1C.P1=P3<P2D.P1=P2=P3【解答】解:根据简单随机抽样、系统抽样和分层抽样的定义可知,无论哪种抽样,每个个体被抽中的概率都是相等的,即P1=P2=P3.故选:D.5.(2013•湖南)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=()A.9 B.10 C.12 D.13【解答】解:∵甲、乙、丙三个车间生产的产品件数分别是120,80,60,∴甲、乙、丙三个车间生产的产品数量的比依次为6:4:3,丙车间生产产品所占的比例,因为样本中丙车间生产产品有3件,占总产品的,所以样本容量n=3÷=13.故选:D.二.填空题(共2小题)6.(2017•江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取18件.【解答】解:产品总数为200+400+300+100=1000件,而抽取60件进行检验,抽样比例为=,则应从丙种型号的产品中抽取300×=18件,故答案为:187.(2012•江苏)某学校高一、高二、高三年级的学生人数之比为3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取15名学生.【解答】解:∵高一、高二、高三年级的学生人数之比为3:3:4,∴高二在总体中所占的比例是=,∵用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,∴要从高二抽取,故答案为:15三.解答题(共3小题)8.从2开始的200个偶数,即2、4、6、8…400中,用系统抽样的办法抽取20个偶数作样本.【解答】解:S1:编号,把2、4、6、8…400这200个偶从002到400按偶数次序编号;S2:分段,计算分间隔为k==10,把编号从小到大依次分成20段,每段10个号;S3:定首号,在第一段002~020的10个号中,用简单随机抽样的方法,抽取一个号码,假设抽中的是008;S4:取余号,依次抽取008,028,048,068,088,108,128,148,168,188,208,228,248,268,288,308,328,348,368,388.9.某校组织高一学生对所在市的居民中拥有电视机、电冰箱、组合音响的情况进行一次抽样调查,调查结果:3户特困户三种全无;有一种的:电视机1090户,电冰箱747户,组合音响850户;有两种的:电视机、组合音响570户,组合音响、电冰箱420户,电视机、电冰箱520户;“三大件”都有的265户.调查组的同学在统计上述数字时,发现没有记下被调查的居民总户数,你能避免重新调查而解决这个问题吗?【解答】解:由题意,抽样调查总数3+265+255+265+72+305+155+125=1445户,∴有两种的有1445﹣3﹣747﹣265=430户,故比例为3:747:430:265,利用分层抽样即可解决.10.某地区工人的平均工资是15元/小时,标准差为4元/小时.若从该地区抽取n=50个工厂,问所取得样本的平均工资的期望和方差各是多少?平均工资的抽样分布是什么?【解答】解:∵某地区工人的平均工资是15元/小时,∴抽取的样本的期望是15.∵标准差为4元/小时,∴抽取样本的方差是16.抽样分布符合二项分布,即X~N(15,16).。
抽样调查简单随机抽样
(三)简单随机抽样是等概率抽样(※※※)
1、从样本来看是等概率抽样
每个可能样本的被抽中的概率:
1
(1)考虑顺序的重复抽样时:N n
1
(2)考虑顺序的不重复抽样时:C
n N
n1
(3)不考虑顺序的重复抽样时:(NN!n)! (4)不考虑顺序的不重复抽样时:1 2、从抽样单元看是等概率抽样 CNn
第一节 抽样方式
一、什么是简单随机抽样 为什么叫“简单”随机抽样? ①估计总体参数时使用简单估计量; ②“单纯”抽样,从总体中直接抽个体;(不是
抽群,不是抽大类,抽前不进行任何处理) ③其他抽样都包含简单随机抽样的成分; ④生活中有时抓“机会”、“归属”时采用,
有“容易操作”的意思。
第一节 抽样方式
抽签法
一次抽n个单位 一次抽1个单位连抽n次
简单随机样本抽取方法
随机数法
随机数字表法() 随机数色子法 摇奖机法 伪随机数法
利用随机数字表抽选简单随机样本
随机数表是一张由0,1,2,…,9这十个数 字组成的,一般常用的是五位数的随机数字表, 10个数字在表中出现的顺序是随机的,每个数 字都有同样的机会被抽中。
一、什么是简单随机抽样
根据抽样单位放回否分为放回简单随机抽样 (Simple Random Sampling with Replacement,SRSWR)和不放回简单随 机抽样(Simple Random Sampling without Replacement,SRSWOR) 。
简单随机抽样
一、估计量的种类
• 根据构造方法不同划分:
• ①简单估计量(直接估计量)
• 直接以调查变量的样本指标作为总体指标的 估计量。如样本均值作为总体均值的估计量。 简单估计量是线性估计量,往往也是无偏估 计量。
简单随机抽样ppt完整版
实现方式
优点与局限性
简单随机抽样具有操作简单、易于理 解等优点;但在总体个体差异较大或 样本量较小时,可能导致抽样误差较 大。
通过随机数生成器或随机表等方式, 从总体中随机抽取一定数量的样本。
02
简单随机抽样方法
有放回简单随机抽样
01
02
03
抽样过程
每次从总体中随机抽取一 个样本,记录后将其放回 总体,再进行下一次抽取。
参数估计 利用样本数据对总体参数进行估计, 包括点估计和区间估计。
假设检验
提出原假设和备择假设,通过计算检 验统计量和P值,判断原假设是否成 立。
方差分析
研究不同因素对因变量的影响程度, 通过计算F值和P值,判断因素对因 变量是否有显著影响。
回归分析
探究自变量和因变量之间的线性关系, 建立回归方程并检验其显著性。
结果可视化呈现技巧
图表类型选择
数据标签使用
根据数据类型和分析目的,选择合适的图表 类型,如柱状图、折线图、散点图等。
在图表中添加数据标签,使观众能够快速了 解数据点的具体数值。
颜色搭配
动画效果运用
运用合适的颜色搭配,突出重要信息,提高 图表的视觉效果。
适当使用动画效果,引导观众关注重点信息, 增强演示的吸引力。
调研目的
了解消费者对某品牌手机的认知度和购买意愿。
调研对象
该品牌手机的目标消费群体,即18-35岁的年轻人。
调研方法
采用简单随机抽样的方法,在目标消费群体中抽 取一定数量的样本进行调查。
调研过程回顾
样本抽取 根据目标消费群体的特征,确定抽样框,并按照一定的抽 样比例进行简单随机抽样,最终抽取了500个样本。
分层抽样等。
简单随机抽样的方法
简单随机抽样的方法
简单随机抽样是一种抽样方式,它是指从总体中以任意的、等概率的方式随机抽取n个样本,使得每个个体都有相同的被抽取概率。
以下是简单随机抽样的方法:
1.概率抽样法:将所有个体从总体中标号为1、2、3、…、N。
使用计算机或随机数字表等随机数生成器生成n个随机数,每个随机数对应一个个体,就是样本。
2.抽签法:将所有个体的编号写在同样大小的纸片上,放进一个容器中,摇匀后抽取n个纸片,就是样本。
3.数表抽样法:将所有个体从总体中标号为1、2、3、…、N。
按照取样比例计算出要取多少个样本,然后从以1~N为首项的数列中隔行抽样取得样本。
4.等距抽样法:将总体中每个个体按照一定的顺序排列,然后按照一定的间隔(例如每隔k个个体抽取一个样本)抽取样本。
需要注意的是,简单随机抽样的方法不适用于总体变异系数较大的情形,因为此时抽样可能会出现偏差;对于总体变异系数较小的总体,简单随机抽样是比较可
靠的抽样方法。
简单随机抽样
简单随机抽样
注意以下点: 注意以下点: (1)它要求被抽取样本的总体的个体数有限; )它要求被抽取样本的总体的个体数有限; (2)它是从总体中逐个进行抽取; )
(3)它是一种不放回抽样; )它是一种不放回抽样;
( 4) 它是一种等概率抽样 。 ) 它是一种等概率抽样。 简单随机抽样是在特定总体中抽取样本, 简单随机抽样是在特定总体中抽取样本,总体中 每一个体被抽取的可能性是等同的, 每一个体被抽取的可能性是等同的,而且任何个体之 间彼此被抽取的机会是独立的。如果用从个体数为N 间彼此被抽取的机会是独立的。如果用从个体数为 的总体中抽取一个容量为n的样本 的样本, 的总体中抽取一个容量为 的样本 , 那么每个个体被 n . 抽取的概率等于
2.简单随机抽样的法: 简单随机抽样的法: 简单随机抽样的法 抽签法 随机数表法
注:随机抽样并不是随意或随便抽取,因为随意或 随机抽样并不是随意或随便抽取,
随便抽取都会带有主观或客观的影响因素. 随便抽取都会带有主观或客观的影响因素
问题
春节联欢晚会结束后, 春节联欢晚会结束后,中央电视台想 在较短时间内得到节目的收视率, 在较短时间内得到节目的收视率,请 为什么真实的结果 问如何调查得出合理的结果呢? 问如何调查得出合理的结果呢? 和预测的结果相反
呢? 侯选人 罗斯福 兰顿 预测结果% 选举结果 选举结果% 预测结果 43 57 62 38
简单随机抽样
一般地,设一个总体的个体数为N, 一般地,设一个总体的个体数为 ,如果 通过逐个不放回 不放回地抽取的方法从中抽取 通过逐个不放回地抽取的方法从中抽取 n (n N) 个样本,且每次抽取时各个个体被 个样本, ≤ 抽到的概率相等 就称这样的抽样为简单随 相等, 抽到的概率 相等 , 就称这样的抽样为 简单随 机抽样。 机抽样。
简单随机抽样
行判断.
依据简单随机抽样的概念及特点进
【解】
(1) 不是简单随机抽样.因为简单随机抽
样要求被抽取的样本总体的个数是有限的.
(2)不是简单随机抽样.虽然“一次性抽取”和
“逐个抽取”不影响个体被抽到的可能性,但简单
随机抽样要求的是“逐个抽取”.
(3)不是简单随机抽样.因为这50名官兵是从中
挑选出来的,是最优秀的,每个个体被抽到的
简单随机抽样
问题提出 假如你是一名食品卫生工作人员,要对某一超 市内的一批小包装饼干进行卫生达标检验,你 准备怎么做?显然,不可能对所有的饼干进行 一一检验,只能从中抽取一定数量的饼干作为 检验的样本.为了使得到的结果更加真实可靠, 我们不能按顺序来抽取,而往往采用随机抽样 的方法来进行抽取.如何获得比较合理的样本? 这就是我们本节课要研究的问题.
开始 开始
编号 47名同学从 1到47编号
制签 制作1到47个号签 搅匀 将47个号签搅拌均匀 抽签 10个签 随机从中抽出 取出个体 对对应号码的学生检查 结束 结束
自我挑战2 学校举办元旦晚会,需要从每班选 10名男生,8名女生参加合唱节目,某班有男生 32名,女生28名,试用抽签法确定该班参加合 唱的同学. 解:第一步:将32名男生从0到31进行编号. 第二步:用相同的纸条做成 32 个号签,在每个 号签上写上这些编号. 第三步:将写好的号签放在一个容器内摇匀, 不放回地逐个从中抽出10个号签. 第四步:相应编号的男生参加合唱. 第五步:用相同的办法从28名女生中选出8名, 则此8名女生参加合唱.
自我挑战3
(1)从个体编号为00,01,„,59的60个个体中抽取
10 个,请从随机数表的第 7 行第 5 个数开始按从左
随机抽样1简单随机抽样
2.简单随机抽样的分类 简单随机抽样抽 随签 机法 数法
3.随机数法的类型 随机数表法
随机数法随机数骰子 计算机产生的随机数
思考讨论 有同学认为:“随机数表只有一张,并且读数时只能按 照从左向右的顺序读取,否则产生的随机样本就不同了,对 总体的估计就不准确了”,你认为正确吗?
2.使用随机抽样方法抽取样本应注意的几个问题 (1)目标要准确. 必须清楚地知道要收集的数据是什么.例如,在食品质
量检验中,为了了解一批袋装牛奶(总体)的细菌超标情况, 从中随机抽取了 n 袋,并测出了每一袋的细菌含量 ai(i= 1,2,…,n),这里 ai(i=1,2,…,n)就是我们要收集的数据.
例 4 一个学生在一次竞赛中要回答的 8 道题是这样产 生的:从 15 道物理题中随机抽取 3 道;从 20 道化学题中随 机抽取 3 道;从 12 道生物题中随机抽取 2 道.请选用合适 的方法确定这个学生所要回答的三门学科的题的序号(物理 题的编号为 1~15,化学题的编号为 16~35,生物题的编号 为 36~47).
变式训练 2
某大学为了选拔世博会志愿者,现从报名的 18 名同学 中选取 6 人组成志愿小组,请用抽签法确定志愿小组成员.
[解] 第一步,将 18 名同学编号,号码是 01,02,…,18; 第二步,将号码分别写在一张纸条上,揉成团,制成号签; 第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀; 第四步,从袋子中依次抽取 6 个号签,并记录上面的编号; 第五步,所得号码对应的同学就是志愿小组的成员.
[解法二] 随机数表法
第一步,将物理题的编号对应地改成 01,02,…,15, 其余两门学科的题的编号不变;
第二步,在随机数表中任选一个数作为开始,任选一个 方向作为读数方向,例如选出第 10 行第 2 列的数 7,向右读;
高中数学课件1:简单随机抽样
控制抽样误差的方法
合理确定样本容量、采用科学 的抽样方法、对抽样过程进行 严格控制等。
控制偏差的方法
采用标准化操作流程、对操作 者进行培训、使用高精度的测 量仪器等。
重要定理及证明过程
01
简单随机抽样的基本性质
每个样本单位被抽中的概率相等,且每个样本单位被抽中与否相互独立
。
02
重要定理
在简单随机抽样下,样本均值是总体均值的无偏估计量;样本方差是总
实际应用中的简单随机抽样
如彩票中奖号码的产生、民意调查中的电话访问 等。
思考题布置及解答提示
• 思考题1:某校有2000名学生,现要从中抽取100名学生进行问卷调查,如何采用简单随机抽样方法进行抽样 ?
• 解答提示:首先确定总体和样本容量,然后对2000名学生进行编号,再利用随机数表或计算机随机抽取100个 编号,最后根据编号找到对应的学生进行问卷调查。
应用场景举例
选举投票
在政治选举中,为了保证选举的公正性和代表性,通常会 采用简单随机抽样的方法对选民进行抽样调查。
医学研究
在医学研究中,为了评估某种药物或治疗方法的效果,研 究人员可以通过简单随机抽样的方法选取一部分患者进行 试验,以得出科学可靠的结论。
市场调研
在市场调研中,为了了解消费者的需求和市场趋势,企业 可以通过简单随机抽样的方法抽取一部分消费者进行调查 ,以推断整个市场的状况。
准备工具
适用范围
能够避免抽签法中可能出现的不公平因素,但需要随 机数表作为辅助工具,操作相对复杂。
优缺点
适用于总体容量较大,需要抽取较多样本的情况。
计算机模拟法
准备工具
操作步骤
适用范围
优缺点
需要使用计算机和相关软件。
简单随机抽样
C
四个特点: 总体个数有限; 四个特点:①总体个数有限;②逐个抽取 不放回; 每个个体机会均等, ;③不放回;④每个个体机会均等,与先 后无关。 后无关。
万 载 中 学
1.2.1简单随机抽样
2. 学校要求从我班抽取 名学生的作业进行检查 , 现 学校要求从我班抽取5名学生的作业进行检查 名学生的作业进行检查, 要求利用随机数表选出要被检查的学生的学号。 要求利用随机数表选出要被检查的学生的学号。(初 始位置10列和第 列这两列的第32行开始 列和第11列这两列的第 行开始, 始位置 列和第 列这两列的第 行开始,右下至上 开始选数。 开始选数。)
2.简单随机抽样的方法: 简单随机抽样的方法: 简单随机抽样的方法 抽签法 随机数表法
随机抽样并不是随意或随便抽取, 注:随机抽样并不是随意或随便抽取,因为随意或 随便抽取都会带有主观或客观的影响因素. 随便抽取都会带有主观或客观的影响因素
3.简单随机抽样两种方法优、缺点. 简单随机抽样两种方法优、缺点 简单随机抽样两种方法优
万 载 中 学
1.2.1简单随机抽样
2、用随机数表法进行抽取
万 载 中 学
1.2.1简单随机抽样
万 载 中 学
1.2.1简单随机抽样 问题:为了检验某种产品的质量,决定从 件产品中抽取 件产品中抽取10件 问题 为了检验某种产品的质量,决定从40件产品中抽取 件 为了检验某种产品的质量 由于需要编号,如果总体中的个体数太多, 由于需要编号,如果总体中的个体数太多, 进行检查,如何抽样? 进行检查,如何抽样
万 载 中 学
1.2.1简单随机抽样
练习: 练习:
将全班同学按学号编号,制作相应的卡片号签 放入同 将全班同学按学号编号 制作相应的卡片号签,放入同 制作相应的卡片号签 一个箱子里均匀搅拌,从中抽出 个号签,就相应的 从中抽出15个号签 就相应的15名学 一个箱子里均匀搅拌 从中抽出 个号签 就相应的 名学 生对看足球比赛的喜爱程度(很喜爱 喜爱、一般、 很喜爱、 生对看足球比赛的喜爱程度 很喜爱、喜爱、一般、不喜 进行调查。 爱、很不喜爱 )进行调查。分析并说明整个抽签过程中 每个同学被抽到的概率是相等的。 每个同学被抽到的概率是相等的。
抽样技术简单随机抽样
第一节 概述
一、简单随机抽样的概念
1. 简单随机抽样 也叫纯随机抽样,完全随机抽样。
简单随机抽样是直接从总体的N个 单位中完全随机的抽取n个单位,并使总 体中的每个单位都有同等被抽中概率的 抽样组织形式。
简单随机样本的图示
一、简单随机抽样的概念
2 有重复抽样和不重复抽样两种形 式。 3 严格意义上的简单随机抽样是指 逐个不放回的、即不放回抽样。
4.33 10.33 114.33 184.33 9.33 100.33 165.33 94.33 156 160.33 6.33 93 156.33 86.33 146.33 146.33 66.33 121.33 108.33 86.33 100.8
例:
一、简单估计及其无偏性 N Yi 1 总体均值 Y i 1 N
总体总量
Y N Y
2 简单估计: 用样本均值估计总体均值 总体均值的简单估计
1 ˆ Y y yi n i 1
n
总体总量的简单估计
N ˆ ˆ Y N Y N y yi n
3 样本均值是总体均值的无偏估计
E( y) Y
二、估计量的方差
1 总体方差:
1 (Yi Y ) 2 N 1 2 2 S ( Y Y ) i N 1
i 1 2 3 4 5 6 7 8 9 10 11 12
xi 7 4 5 2 0 4 6 6 15 0 8 6
yi 670 450 370 130 0 250 1230 900 1240 0 1450 540
i 13 14 15 16 17 18 19 20 21 22 23 24
xi 3 10 6 2 1 4 3 2 6 1 4 8
简单随机抽样的概念
简单随机抽样的概念一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。
简单随机抽样一般采用两种方法:抽签法和随机数表法。
例1:人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?例2:某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?1、为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是A.总体是240 B、个体是每一个学生 C、样本是40名学生 D、样本容量是402、为了正确所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是()A、总体B、个体是每一个学生C、总体的一个样本D、样本容量3、一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是。
4、从3名男生、2名女生中随机抽取2人,检查数学成绩,则抽到的均为女生的可能性是。
系统抽样的定义:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。
例题:例1.某单位在职职工共624人,为了调查工人用于上班途中的时间,决定抽取10%的工人进行调查,试采用系统抽样方法抽取所需的样本。
例2.从编号为150的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()C()2,4,6,16,32DA()3,13,23,33,43()5,10,15,20,25B()1,2,3,4,51.从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为()(A)99 (B)99.5 (C)100(D)100.52.从学号为0~50的高一某班50名学生中随机选取5名同学参加数学测试,采用系统抽样的方法,则所选5名学生的学号可能是()(A)1,2,3,4,5 (B)5,16,27,38,49 (C)2, 4, 6, 8 (D)4,13,22,31,403.某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。
简单随机抽样
对于简单随机抽样,总体均值的估计量为:
yi ˆ Y y i 1 n
n
其中,n是样本量,yi是样本中第i个单元的值, 对应某特定样本的值即是估计值。也就是说,将样 本中所有yi的值加起来再除以样本量就得到了总体 平均数的估计值。
26
在简单随机抽样中,y 既是总体均值的一致 估计,也是总体均值 Y 的无偏估计。
29
ˆ 2 的 选 取 , 我 们通 常 使用 样 本 方 对 于估 计 量 S 2 n 差s 。 ( yi y ) 2 可以证明: 2 i
s
N i
n 1
是总体方差 S 2
2 ( y Y ) i
N 1
的无偏估计量。
30
三、其他估计量 当总体为正态分布时,用 Me(中位数)来估 计Y 。 可以证明:
第三章 简单随机抽样(SRS)
第一节 概述
第二节
第三节
估计量及其误差
样本量的确定
1
第一节
一、定义
概述
二、抽取方法
三、方法评估 四、两个试验
2
一、定义
所有概率抽样的出发点和理论基础都是简单 随机抽样。简单随机抽样是一种一步抽样法,它 保证样本量为n的每个可能的样本都有相同的被抽 中的概率p=n/N。
24
如果一个估计量对于所有可能样本计算的估 计值的平均数等于参数的真值,称这个估计量是 无偏的。 另一个所需要的估计量的性质是它的抽样分 布应与其平均数尽可能地靠拢。对这种性质的一 个度量指标是抽样方差。 我们通常希望估计量具有一些好的性质:其 中的一个性质就是估计量应是无偏的或近似无偏 的,另一个是抽样方差较小的估计量被认为是精 确的:抽样方差越小,估计的精度越高。
简单随机抽样 课件
n
分个体,以获得整数间隔k.
答案:(1)√ (2)√ (3)√ (4)√
实施系统抽样的具体方法和步骤
某校高中三年级的295名学生已经编号为 1,2,…,295,为了了解学生的学习情况,要按1∶5的 比例抽取一个样本,用系统抽样的方法进行抽取,并写 出过程.
分析:按1∶5比例抽取样本确定样本容量,再按 系统抽样的步骤进行,关键是确定第1段的编号.
实施简单随机抽样的具体方法和步骤
某车间工人加工一种轴100件,为了了解这 种轴的直径,要从中抽取10件轴在同一条件下测量,如 何采用简单随机抽样的方法抽取样本?
解析:简单随机抽样一般采用两种方法:抽签法和 随机数表法.
法一:(抽签法)将100件轴编号为1,2,…,100,并 做好大小、形状相同的号签,分别写上这100个数,将 这些号签放在一起,进行均匀搅拌,接着连续抽取10个 号签,然后测量这个10个号签对应的轴的直径.
简单随机抽样和系统抽样
基础梳理
1.简单随机抽样定义:一般地,设一个总体含有N个 个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如 果每次抽取时总体内的各个个体被抽到的机会都相等,就 把这种抽样方法叫做简单随机抽样.
2.抽签法的定义:抽签法就是把总体中的N个个体编 号,把号码写在号签上,将号签放在一个容器中,搅拌均 匀后,每次从中抽取一个号签,连续抽取n次,就得到一个 容量为n的样本.
对简单随机抽样的理解
判断下列关于简单随机抽样的描述的正误: (1)简单随机抽样要求被抽取的样本的总体个数N是 有限的. (2)简单随机样本数n小于等于样本总体的个数N. (3)简单随机样本是从总体中逐个抽取的. (4)简单随机抽样是一种不放回的抽样. (5)简单随机抽样的每个个体入样的可能性均为n/N. 答案:(1)√ (2)√ (3)√ (4)√ (5)√
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
简单随机抽样
简答题:
结合实例,简述什么是简单随机抽样。
【参考答案】
(1)简单随机抽样:
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取
n\;(1≤n<N)个个休作为样本,如果抽取是放回的,且每次抽取时总体内
的各个个体被抽到的概率都相等。
我们把这样的抽样方法叫做放回简单随
机抽样;如果抽取是不放回的,目每次抽取时总体内未进入样本的各个个
体被抽到的概率都相等,我们把这样的抽样方法叫作不放回简单随机抽样。
放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样。
特点:每个个体被抽中的可能性相同(概率相等),样本的每个单位
完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其他各种抽
样方法的基础。
通常当总体内的个体之间差异程度较小和数目较少时,采
用这种抽样方法。
简言之,其特点是:①总体个数有限;②逐个抽取;③
等可能抽样。
例如:高一三班52名学生的学号分别是01,52,从中随机挑选2名
学生参加演讲表演,这种抽样方法就是简单随机抽样。
(2)分层随机抽样:
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属
于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把
所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层
随机抽样,每一个子总体称为层。
适用特征:①总体由差异明显的几部分组成;②分成的各层互不重叠;
③各层抽取的比例等于样本在总体中的比例 \frac{n}{N}
例如:初级中学有学生270人,其中初一年级108人,初二、初三年
级各81人,现要抽取10人参加项调查,使用分层抽样时,将学生按初一、初二、初三年级依次统一编号为1,2,…,270,则抽取比例为
\frac{10}{27}=\frac{1}{27} ,所以应分别从初一、初二、初三年级抽
取4人,3人,3人。
重点概念补充说明:
总体:
目标总体与抽样总体
目标总体也简称为总体,是指所有研究对象的全体,或是研究人员希
望从中获取信息的总体,它研究对象中所有性质相同的个体所组。
组成总
体的各个个体称为总体单元或单位。
例如,我们要研究北京市个体商业的
情况,目标总体就是北京市所有从事商业活动的个体经营单位,每个个体
经营单位(或摊位)就是总体单元。
目标总体的划分有时比较容易,有时
比较困难。
以上面的个体商业调查为例,有些个体经营单位主要从事商品
生产活动,同时兼做商品的零售交易,这些单位是否属于个体商业单位,
这就是常说的统计口径问题。
在一项调查中,要对目标总体的范围做出具
体规定。
抽样总体是指从中抽取样本的总体。
通常情况下,抽样总体应该与目
标总体完全一致,但实践中两者不一致的情况却时常发生。
仍以个体商业
调查为例,目标总体是北京市个体商业经营单位,抽样总体则可以有不同
的选择,选择之一是营业执照,即把北京市工商局个体商业的营业执照记
录作为抽样总体,从中抽取样本。
可是,有些人虽然持有营业执照,但早
已不从事商品交易活动,他们已不属于目标总体范围,却出现在抽样总体
当中;还有一些人无照经营,他们应该属于目标总体范围,却没有出现在
抽样总体之中。
这表明,要保证目标总体和抽样总体的完全一致,不是一
件容易的事情。
理想的状态是,抽样总体由目标总体所决定,但在实践中,可以构造的抽样总体却有可能反过来决定调查中的目标总体。
抽样框与抽样单元
抽样单元是构成抽样框的基本要素,抽样单元可以只包含一个个体,
也可以包含若干个个体,抽样单元还可以分级。
在抽样单元分级情况下,
总体由若干个较大规模的抽样单元组成,这些较大规模的抽样单元称为初
级单元,每个初级单元中又可以包含若干个规模较小的单元,称为二级单元。
同样的方法可以定义三级单元、四级单元等。
例如,欲对北京市小学
生的视力状况进行抽样调查,可以把每所小学视为初级单元,把各学校中
的班级视为二级单元,把学生视为三级单元。
抽取样本的顺序为先抽取学校,再抽取班级,最后抽取学生。
单元可以是自然形成的,也可以是人为
划分的。
在一项调查中,单元分成几级也不是固定不变的。
例如在前面的
例子中,如果采用抽取学校,然后在中选的学校中直接抽取接受调查的学
生而越过班级时,学校就是初级单元,学生则成为二级单元。
通常把接受
调查的最小一级的抽样单元称为基本抽样单元。
在上面的例子中,小学生
是基本抽样单元。
抽样单元的不同划分是针对不同抽样方法而言的。
若抽
样单元只包含一个个体,并且没有分级,与之相对应的是简单随机抽样;
若抽样单元中包含若干个个体,与之对应的是整群抽样;在抽样单元分级
情况下,与之对应的是多阶段抽样。
由于抽样单元可以分级,于是就有了
与之相对应的不同级上的抽样框。
抽样实践中,抽选哪个级的抽样单元,
只需有同级的抽样框即可。
简单随机抽样也称纯随机抽样,是从抽样框内的N个抽样单元中随机地、一个一个地抽取n个单元作为样本,在每次抽选中,所有未入样的待
选单元入选样本的概率都相等,这n个被抽中的单元就构成了简单随机样本。
简单随机样本也可以一次从总体(抽样框)中同时抽出,这时全部可
能样本中的每一个样本被抽中的概率也需要相等。
抽样的随机性通过抽样
的随机化程序体现,实施随机化程序可以使用随机数表,也可以使用能产
生符合要求的随机数列的计算机程序。
简单随机抽样是一种最基本的抽样方法,是其他抽样方法的基础。
这
种方法的突出特点是简单直观,在抽样框完整时,可以直接从中抽选样本,由于抽选的概率相同,用样本统计量对目标量进行估计及计算抽样误差都
比较方便。
但实际应用中也有一些局限:首先,它要求将包含所有总体单
元的名单作为抽样框,当N很大时,构造这样的抽样框并不容易;其次,
根据这种方法抽出的单元很分散,给实施调查增加了困难;最后,这种方
法没有利用其他辅助信息以提高估计的效率。
所以在规模较大的调查中,
很少直接采用简单随机抽样,一般是把这种方法与其他抽样方法结合在一
起使用。
分层抽样
分层抽样是将抽样单元按其中一种特征或其中一种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,
对总体的目标量进行估计。
分层抽样有许多优点,例如,这种抽样方法保
证了样本中包含有各种特征的抽样单元,样本的结构与总体的结构比较相近,从而可以有效地提高估计的精度;分层抽样在一定条件下为组织实施
调查提供了方便,例如,如果层的划分是按行业或行政区划进行,组织实施调查就非常容易;分层抽样既可以对总体参数进行估计,也可以对各层的目标量进行估计,等等。
这些优点使分层抽样在实践中得到了广泛的应用。