简单随机抽样.
简单随机抽样
一、知识概述1、简单随机抽样:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的机会相等,就称这样的抽样为简单随机抽样.注:(1)一般地,用简单随机抽样从含有N个个体的总体中抽取一个容量为的样本时,每次抽取一个个体时任一个体被抽到的概率为;在整个抽样过程中各个个体被抽到的概率为;(2)简单随机抽样的特点是,逐个抽取,且各个个体被抽到的概率相等;(3)简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.介绍:抽样方法在统计学中很多,如果按照抽取样本时总体中的每个个体被抽取的概率是否相等来进行分类,可分为:等概率抽样和不等概率抽样.在等概率抽样中,又可以分为不放回抽样和放回抽样.在实际应用中,使用较多的是不放回抽样,相对来说,放回抽样在理论研究中显得更为重要.2、简单随机抽样的实施方法:(1)抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本.适用范围:总体的个体数不多时.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.(2)随机数表法:1°.制定随机数表;2°.给总体中各个个体编号;3°.按照一定的规则确定所要抽取的样本的号码.随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.3、简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样.注:抽签法与随机数表法的比较:共同点:(1)抽签法和随机数表法都是简单随机抽样的方法,并且要求被抽取样本的总体的个数有限;(2)抽签法和随机数表法都是从总体中逐个地进行抽取,都是不放回抽样.不同点:(1)抽签法相对于随机数表法简单,随机数表法较抽签法稍麻烦一点;(2)随机数表法更适用于总体中的个体数较多的时候,而抽签法适用于总体中的个数相对较少的时候,所以当总体中的个数较多时,应当选用随机数表法,这样可以节约大量的人力和制作号签的成本与精力.二、例题讲解例1、某次考试有70000名学生参加,为了了解这70000名考生的数学成绩,从中抽取1000名考生的数学成绩进行统计分析,在这个问题中,有以下四种说法:(1)1000名考生是总体的一个样本;(2)1000名考生数学成绩的平均数是总体平均数;(3)70000名考生是总体;(4)样本容量是1000,其中正确的说法有()A.1种B.2种C.3种D.4种解:(3)(4)对,故选B.例2、现要从20名学生中抽取5名进行阅卷调查,写出抽取样本的过程.解:①先将20名学生进行编号,从1编到20;②把号码写在形状、大小均相同的号签上;③将号签放在一个箱子中进行充分搅拌,力求均匀,然后从箱子中抽取5个号签,这5个号签上的号码对应的学生,即为所求的样本.例3、为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,写出用随机数表法抽取样本的过程.解:第一步,先将40件产品编号,可以编为00,01,02,…,38,39.第二步,利用本节教材中提供的随机数表,任选一个数作为开始,例如从第10行第6列的数字开始.第三步,从选定的数6开始,从左往右读,依次得到样本号码是:24,29,05,28,27,34,32,38,20,00.这10个号码所对应的产品为样本.例4、上海某中学从40名学生中选1人作为上海男篮拉拉队的成员,采用下面两种选法:选法一将这40名学生从1~40进行编号,相应地制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选.选法二将39个白球与1个红球混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为拉拉队成员.试问这两种选法是否都是抽签法?为什么?这两种选法有何异同?解:选法二不是抽签法.因为抽签法要求所有的号签编号互不相同,而选法二中39个白球无法相互区分.这两种选法相同之处在于每名学生被选中的概率都相等,等于.例5、某市通过电话进行民意测验实施某项调查,该市的电话号码有7位,其中首两位为区域代码,只能为2,3,5,7的任意两两组合,后5位取自0~9这10个数字.现在任意选择3个区域,每个区域随机选取5个号码进行调查.请你设计一种抽取方案,选出这15个电话号码.解:首先列出所有由2,3,5,7两两组合而成的区域代码共16个,用抽签法随机选取3个;然后制作一张0~99999的随机数表,方法是用抽签法或计算机生成法产生若干个0~9之间的随机整数,5个一组,构成0~99999之间的随机数表;最后用随机数表法选出15个5位号码,分成3组,第1组前加上用抽签法选出的第1个区域代码,第2,3组前分别加上选出的第2,3个区域代码.。
第2章简单随机抽样
称简单随机抽样,所得的样本称为不放回的
简单随机样本,简称简单随机样本
精选可编辑ppt
2
简单随机抽样的实施方法:将总体中的单元 依次从1到N进行编号,然后利用抽签法或随 机数法来进行简单随机抽样
抽签法:一般用于总体所含单元不多的情况, 首先做N个签并依次写上1至N的号码,然后 将签充分混合均匀,再一次抽取其中的n个 签或逐个不放回地抽取n个签,则编号为这n 个签上的号码的单元就构成一个简单随机样 本
注3: V(y),V(Yˆ) 中的 S
2 Y
一般是未知的,因此需要通
过样本进行估计
精选可编辑ppt
14
定理2.2.3
在简单随机抽样中,样本方差
s
2 y
是总体方差
S
2 Y
的无偏估计量,样本协方差 s y x
是总体协方差 S Y X 的无偏估计量
推论2.2.1 在简单随机抽样中,
Vˆ(y) ˆ 1 f n
在一定条件下,利用辅助指标的信息可以提 高对主要指标的估计的精度
一般地,辅助指标可以是主要指标的前期资 料,也可以是表示单元规模的量,或者是单 元的某个易测指标,等等
精选可编辑ppt
31
如果主要指标Y与辅助指标X之间有正相关关 系,就可以构造比估计量
在简单随机抽样中,称 YˆR ˆ yR ˆ RˆX 为总体均 值 Y 的比估计量,称 YˆRˆ NyRRˆX为总体总 值 Y 的比估计量,其中 X 或 X 必须已知
sy2
是
V
(
y
) 的无偏估计量
Vˆ(Yˆ)ˆ N21f n
sy2 是 V
( Yˆ )
的无偏估计量
注:把 Vˆ(y), Vˆ(Yˆ) 分别作为 V(y), V(Yˆ) 的估计 量,都称为标准差估计量
简单随机抽样(创新设计)
03
创新设计在简单随机抽 样中的应用
利用创新技术提高抽样的效率
01
02
03
自动化技术
利用自动化设备或软件进 行随机抽样,减少人工操 作,提高抽样的速度和准 确性。
大数据技术
利用大数据分析技术,对 大量数据进行快速处理和 分析,提高抽样的效率。
云计算技术
利用云计算平台进行分布 式计算,提高数据处理和 存储的效率,加速抽样过 程。
要点一
总结词
要点二
详细描述
简单随机抽样将拓展到其他领域,为不同领域的研究和实 践提供支持。
简单随机抽样作为一种基础统计方法,不仅在统计学领域 有广泛应用,还将拓展到其他领域,如社会学、经济学、 政治学等。通过与其他领域的结合,简单随机抽样将为各 领域的研究和实践提供有力支持,促进跨学科的发展和应 用。
特点
简单随机抽样具有简单易行、误差小、 代表性强的特点,适用于各种类型的 调查对象,尤其适用于样本量较大、 总体各单位之间差异不大的情况。
简单随机抽样的应用场景
市场调研
在市场调研中,简单随机抽样常 用于了解消费者需求、品牌认知 度、市场份额等方面的情况。
社会调查
在社会调查中,简单随机抽样用 于了解社会现象、人口特征、民 意倾向等方面的情况。
总结词
详细描述
人工智能技术将为简单随机抽样提供更智能、 自动化的方法,提高抽样的效率和精度。
人工智能技术,如机器学习和深度学习,可 以应用于简单随机抽样中,实现自动化抽样 和数据分析。通过训练模型,可以自动识别 和筛选符合条件的样本,减少人为干预和误 差,提高抽样的准确性和可靠性。
简单随机抽样的跨领域应用
总结词
初级1 -第三章简单随机抽样
n
n 1 N 1 n N
n 1 N 1
二、实施方法 • 抽签 制作N个同质的签,充分混合。从中一次抽出n个签, 或者先抽出一个签但不放回,再抽下一个签直到抽 满n个签为止。抽出的这n个签对应的单元入选样本, 这是不放回简单随机抽样;若从充分混合的N个签 中抽取一个,记录后放回,再抽取下一个,如此进 行,直到抽满n个为止,则是放回简单随机抽样。 抽签法的实施起来比较麻烦,尤其是当总体单元数 N较大时,所以该方法的使用场合为当总体单元数 N比较小,签的制作比较方便时。
第三章 简单随机抽样
第一节
基本问题
一、什么是简单随机抽样
从 N个单元的总体中抽取 n个单元组成的样本。总体单元数为 N,
样本量为 n。 若抽样是放回的,每次都是从 个总体单元中随机抽取1个单元,独 立重复抽取n次,得到 个单元组成的样本,叫做放回简单随机抽样。 若抽样是不放回的,每次都是从剩下的总体单元中随机抽取1个单 元,相继依次抽取n次,得到n个单元组成的样本,叫做不放回简单 随机抽样。
精度margin of error
对精度的要求通常以允许最大绝对误差
差限)或允许最大相对误差 (相对误差限)来表 示。
r
d(绝对误
d 1 P
P r 1
样本量足够大时,可用正态分布近似
ˆ tS ˆ d t V
2
第三章 基本概念
N n N 1
N n N
为 修正系数
2
为 S 修正系数
n f ,称抽样比, N
2
令
N n 1 f 有限总体调整系数 故, N 2
S V ( y ) (1 f ) n
第二章 简单随机抽样
2.1 定义与符号
总体:( )具体总体;( ;(2)有限总体; 总体:(1)具体总体;( )有限总体; :( (3)与样本框存在一一对应关系的所谓实查总体或被称为 ) 抽样总体的样本框本身。 抽样总体的样本框本身。 单元:总是指构成抽样总体的样本单元(样品、样本点) 单元:总是指构成抽样总体的样本单元(样品、样本点) 抽样单元并不总是等同于个体, 抽样单元并不总是等同于个体,有时抽样单元甚至包含几个或 多个个体 个体:最小的不可再分的单元 个体: 设抽样总体由N个抽样单元组成 个抽样单元组成, 是已知整数 表示总体规模 是已知整数, 总体规模; 设抽样总体由 个抽样单元组成,N是已知整数,表示总体规模; 欲在其中抽取n个抽样单元构成样本 个抽样单元构成样本。 欲在其中抽取 个抽样单元构成样本。 n是一个事先人为确定的不大于 ,不小于 的正整数,称为样本容 是一个事先人为确定的不大于N,不小于1的正整数 称为样本容 的正整数, 是一个事先人为确定的不大于 简称样本量或样品数,表示样本规模。 量,简称样本量或样品数,表示样本规模。 样本容量相对于总体规模的比例f=n/N,称为抽样比 样本容量相对于总体规模的比例 ,称为抽样比
n CN
简单随机抽样的三个等价定义: 简单随机抽样的三个等价定义:
定义2.1 从总体的 个单元中,一次整批抽取 个单元,使任何一个 从总体的N个单元中 一次整批抽取n个单元 个单元中, 个单元, 定义 单元被抽中的概率都相等,任何n个不同单元组成的组合被抽中的概 单元被抽中的概率都相等,任何 个不同单元组成的组合被抽中的概 率也相等,这种抽样称为简单随机抽样。 率也相等,这种抽样称为简单随机抽样。 定义2.2从总体的 个单元中,逐个不放回地抽取单元,每次抽取到 从总体的N个单元中 定义 从总体的 个单元中,逐个不放回地抽取单元, 尚未入样的任何一个单元的概率都相等,直到抽足n个单元为止 个单元为止, 尚未入样的任何一个单元的概率都相等,直到抽足 个单元为止,这 样所得的n个单元组成一个简单随机样本 个单元组成一个简单随机样本。 样所得的 个单元组成一个简单随机样本。 定义2.3 按照从总体的 个单元中抽取 个单元的所有可能不同的组 按照从总体的N个单元中抽取 个单元中抽取n个单元的所有可能不同的组 定义 n n 个样本数, 个样本随机抽取一个样本, 合构造所有可能的 CN个样本数,从 CN 个样本随机抽取一个样本,使 n 这种抽样称为简单随机抽样。 每个样本被抽中的概率都等于1/ CN ,这种抽样称为简单随机抽样。 n N
简单随机抽样
简单随机抽样简答题:结合实例,简述什么是简单随机抽样。
【参考答案】(1)简单随机抽样:一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n\;(1≤n<N)个个休作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等。
我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,目每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫作不放回简单随机抽样。
放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样。
特点:每个个体被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其他各种抽样方法的基础。
通常当总体内的个体之间差异程度较小和数目较少时,采用这种抽样方法。
简言之,其特点是:①总体个数有限;②逐个抽取;③等可能抽样。
例如:高一三班52名学生的学号分别是01,52,从中随机挑选2名学生参加演讲表演,这种抽样方法就是简单随机抽样。
(2)分层随机抽样:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层。
适用特征:①总体由差异明显的几部分组成;②分成的各层互不重叠;③各层抽取的比例等于样本在总体中的比例 \frac{n}{N}例如:初级中学有学生270人,其中初一年级108人,初二、初三年级各81人,现要抽取10人参加项调查,使用分层抽样时,将学生按初一、初二、初三年级依次统一编号为1,2,…,270,则抽取比例为\frac{10}{27}=\frac{1}{27} ,所以应分别从初一、初二、初三年级抽取4人,3人,3人。
重点概念补充说明:总体:目标总体与抽样总体目标总体也简称为总体,是指所有研究对象的全体,或是研究人员希望从中获取信息的总体,它研究对象中所有性质相同的个体所组。
03第三章 简单随机抽样(SRS)
总体均值的比估计 总体总值的比估计 总体均值的回归估计
ˆ y RX ˆ YR R
ˆ ˆ ˆ YR RX NRX
ˆ Ylr y ( X x )
总体总值的回归估计
ˆ Ylr y ( X x) N y ( X x )
抽样可以是放回的,也可以是不放回的。如果 抽样比非常小,则放回抽样与不放回抽样实际 上是差不多的。一般情况下,不放回抽样的结 果更精确,实际操作也更方便些。在本课程中, 除非特别指明,抽样都是指不放回的。
简单随机抽样一般有抽签法和随机数法 两种实施方法。
7
简单随机抽样的抽样规则:
1)按随机原则取样,在取样时排除任何主 观因素选择抽样单元,避免任何先入为主 的倾向性,防止出现系统误差。 2)每个抽样单元被抽中的概率都是已知或 事先确定的,或者事先可以计算出来。 3)每个抽样单元的概率都相等,即简单随 机抽样属于一种等概率随机抽样。
所有概率抽样的出发点和理论基础都是简单随 机抽样。简单随机抽样是一种一步抽样法,它 保证样本量为n的每个可能的样本都有相同的 被抽中的概率p=n/N。 简单随机抽样有三个相互等价的定义:
4
定义1: 从总体的N个单元中,一次整批抽取n个单元 ,使任何一个单元被抽中的概率都相等,任何n个不同 单元组成的组合被抽中的概率也都相等,这种抽样称 为简单随机抽样。 定义2:从总体中的N个单元中,逐个不放回地抽取单 元,每次抽取到尚未入样的任何一个单元的概率都相 等,直到抽足n个单元为止,这样所得的n个单元组成 一个简单随机样本。 定义3:按照从总体的N个单元中抽取n个单元的所有 n n C N个样本,从C N 个样 可能不同的组合构造所有可能的 本随机抽取1个样本,使每个样本被抽到的概率都等于 n 1/C N ,这种抽样称为简单随机抽样
随机抽样1简单随机抽样
2.简单随机抽样的分类 简单随机抽样抽 随签 机法 数法
3.随机数法的类型 随机数表法
随机数法随机数骰子 计算机产生的随机数
思考讨论 有同学认为:“随机数表只有一张,并且读数时只能按 照从左向右的顺序读取,否则产生的随机样本就不同了,对 总体的估计就不准确了”,你认为正确吗?
2.使用随机抽样方法抽取样本应注意的几个问题 (1)目标要准确. 必须清楚地知道要收集的数据是什么.例如,在食品质
量检验中,为了了解一批袋装牛奶(总体)的细菌超标情况, 从中随机抽取了 n 袋,并测出了每一袋的细菌含量 ai(i= 1,2,…,n),这里 ai(i=1,2,…,n)就是我们要收集的数据.
例 4 一个学生在一次竞赛中要回答的 8 道题是这样产 生的:从 15 道物理题中随机抽取 3 道;从 20 道化学题中随 机抽取 3 道;从 12 道生物题中随机抽取 2 道.请选用合适 的方法确定这个学生所要回答的三门学科的题的序号(物理 题的编号为 1~15,化学题的编号为 16~35,生物题的编号 为 36~47).
变式训练 2
某大学为了选拔世博会志愿者,现从报名的 18 名同学 中选取 6 人组成志愿小组,请用抽签法确定志愿小组成员.
[解] 第一步,将 18 名同学编号,号码是 01,02,…,18; 第二步,将号码分别写在一张纸条上,揉成团,制成号签; 第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀; 第四步,从袋子中依次抽取 6 个号签,并记录上面的编号; 第五步,所得号码对应的同学就是志愿小组的成员.
[解法二] 随机数表法
第一步,将物理题的编号对应地改成 01,02,…,15, 其余两门学科的题的编号不变;
第二步,在随机数表中任选一个数作为开始,任选一个 方向作为读数方向,例如选出第 10 行第 2 列的数 7,向右读;
第2章-简单随机抽样总结
n N
【例2.1】
设总体有5个单元(1、2、3、4、5), 按不放回简单随机抽样的方式抽取2个单 元,则所有可能的样本为10个:
1, 2
1, 3 1, 4 1, 5
2, 3
2, 4 2, 5
3, 4
3, 5
4, 5
【例2.2】
设总体有5个单元(1、2、3、4、5),按放回 简单随机抽样的方式抽取 2 个单元,则所有可 能的样本为25个(考虑样本单元的顺序):
1, 1 1, 2 1, 3 1, 4 1, 5 2, 1 2, 2 2, 3 2, 4 2, 5 3, 1 3, 2 3, 3 3, 4 3, 5 4, 1 4, 2 4, 3 4, 4 4, 5 5, 1 5, 2 5, 3 5, 4 5, 5
简单随机抽样的抽取规则
(1)按随机原则取样; (2)每个抽样单元被抽中的概率都是已知 的或事先确定的; (3)每个抽样单元被抽中的概率都是相等 的。(等概随机抽样)
N
i
X
Y Y X X
i
r
y x
i 1 i 1 n
n
i
y x
i
简单估计量
y y2 1 n Y y yi 1 n i1 n yn
N Y Ny n
y
i 1
n
i
a 1 n P p yi y Y n n i1
ˆ R
y x
i 1 i 1 n
n
总体指标值 上面带符号 “^”的表 示由样本得 到的总体指 标的估计。
i
y x
i
2.2 简单估计量及其性质
引理 2.1:从大小为N的总体中抽取一个样本量为n的 简单随机样本,则总体中每个特定单元入样的概率为 n/N,两个特定单元都入样的概率为: n n 1
简单随机抽样
C
四个特点: 总体个数有限; 四个特点:①总体个数有限;②逐个抽取 不放回; 每个个体机会均等, ;③不放回;④每个个体机会均等,与先 后无关。 后无关。
万 载 中 学
1.2.1简单随机抽样
2. 学校要求从我班抽取 名学生的作业进行检查 , 现 学校要求从我班抽取5名学生的作业进行检查 名学生的作业进行检查, 要求利用随机数表选出要被检查的学生的学号。 要求利用随机数表选出要被检查的学生的学号。(初 始位置10列和第 列这两列的第32行开始 列和第11列这两列的第 行开始, 始位置 列和第 列这两列的第 行开始,右下至上 开始选数。 开始选数。)
2.简单随机抽样的方法: 简单随机抽样的方法: 简单随机抽样的方法 抽签法 随机数表法
随机抽样并不是随意或随便抽取, 注:随机抽样并不是随意或随便抽取,因为随意或 随便抽取都会带有主观或客观的影响因素. 随便抽取都会带有主观或客观的影响因素
3.简单随机抽样两种方法优、缺点. 简单随机抽样两种方法优、缺点 简单随机抽样两种方法优
万 载 中 学
1.2.1简单随机抽样
2、用随机数表法进行抽取
万 载 中 学
1.2.1简单随机抽样
万 载 中 学
1.2.1简单随机抽样 问题:为了检验某种产品的质量,决定从 件产品中抽取 件产品中抽取10件 问题 为了检验某种产品的质量,决定从40件产品中抽取 件 为了检验某种产品的质量 由于需要编号,如果总体中的个体数太多, 由于需要编号,如果总体中的个体数太多, 进行检查,如何抽样? 进行检查,如何抽样
万 载 中 学
1.2.1简单随机抽样
练习: 练习:
将全班同学按学号编号,制作相应的卡片号签 放入同 将全班同学按学号编号 制作相应的卡片号签,放入同 制作相应的卡片号签 一个箱子里均匀搅拌,从中抽出 个号签,就相应的 从中抽出15个号签 就相应的15名学 一个箱子里均匀搅拌 从中抽出 个号签 就相应的 名学 生对看足球比赛的喜爱程度(很喜爱 喜爱、一般、 很喜爱、 生对看足球比赛的喜爱程度 很喜爱、喜爱、一般、不喜 进行调查。 爱、很不喜爱 )进行调查。分析并说明整个抽签过程中 每个同学被抽到的概率是相等的。 每个同学被抽到的概率是相等的。
抽样技术简单随机抽样
第一节 概述
一、简单随机抽样的概念
1. 简单随机抽样 也叫纯随机抽样,完全随机抽样。
简单随机抽样是直接从总体的N个 单位中完全随机的抽取n个单位,并使总 体中的每个单位都有同等被抽中概率的 抽样组织形式。
简单随机样本的图示
一、简单随机抽样的概念
2 有重复抽样和不重复抽样两种形 式。 3 严格意义上的简单随机抽样是指 逐个不放回的、即不放回抽样。
4.33 10.33 114.33 184.33 9.33 100.33 165.33 94.33 156 160.33 6.33 93 156.33 86.33 146.33 146.33 66.33 121.33 108.33 86.33 100.8
例:
一、简单估计及其无偏性 N Yi 1 总体均值 Y i 1 N
总体总量
Y N Y
2 简单估计: 用样本均值估计总体均值 总体均值的简单估计
1 ˆ Y y yi n i 1
n
总体总量的简单估计
N ˆ ˆ Y N Y N y yi n
3 样本均值是总体均值的无偏估计
E( y) Y
二、估计量的方差
1 总体方差:
1 (Yi Y ) 2 N 1 2 2 S ( Y Y ) i N 1
i 1 2 3 4 5 6 7 8 9 10 11 12
xi 7 4 5 2 0 4 6 6 15 0 8 6
yi 670 450 370 130 0 250 1230 900 1240 0 1450 540
i 13 14 15 16 17 18 19 20 21 22 23 24
xi 3 10 6 2 1 4 3 2 6 1 4 8
2.1.1简单随机抽样(三种抽样方法)
上的,由于它充分利用了已知信息,因此它获取的样本更 具代表性,在实用中更为广泛。
第28页,共36页。
2、分层抽样的抽取步骤:
第1页,共36页。
笑一笑,十年少
一天,爸爸叫儿子去买一盒火柴,临出门 前,爸爸嘱咐儿子要买能划燃的火柴,儿子拿 着钱出门了,过了好一会儿,儿子才回到家。
“火柴能划燃吗?”爸爸问。 “都能划燃。” “你这么肯定?”
儿子递过一盒划过的火柴,兴奋地说: “我每根都试过啦。”
问:这则笑话中,儿子采用的是什么调查方式?这其 中的全体是什么?这种调查方式好不好?
性是( )C 。
A.与第几次抽样有关,第一次抽的可能性最大 B.与第几次抽样有关,第一次抽的可能性最小 C.与第几次抽样无关,每次抽到的可能性相等 D.与第几次抽样无关,与抽取几个样本无关
第20页,共36页。
问题某:校高一年级共有20个班,每班有50名学生。
为了了解高一学生的视力状况,从这1000人中抽 取一个容量为100的样本进行检查,应该怎样抽样?
中任意拿出一个零件进行质量检验后,再把它放回盒子里;
4. ③从8台电脑中不放回的随机抽取2台进行质量检验(假设8台电脑已编好号,
对编号随机抽取)
5. A.① B.② C.③
D.以上都不对
四个特点:①总体个数有限;②逐个抽取;③不 放回;④每个个体机会均等,与先后无关。
第10页,共36页。
B 2.在简单随机抽样中,某一个个体被抽中的可能性是( )
为了解1200名学生对学校教改试验的意见打算从中抽取一个容量为30的样本考虑采用系统抽样则分段间隔k2某商场新进3000袋奶粉为检查其三聚氰胺是否超标先采用系统抽样的方法从中抽取150检查若第一组抽取号码是11则第61组抽出的号码2采用系统抽样的方法从个体数为1003的总体中抽取一个容量50的样本则在抽样过程中被剔除的个体数为抽样间隔为1某工厂生产产品用传送带将产品送放下一道工序质检人员每隔十分钟在传送带的某一个位置取一件检验则这种抽样方法是a
简单随机抽样
2.下列4个抽样中,简单随机抽样的个数是
()
①从无数个个体中抽取50个个体作为样本;
②仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;
③某连队从200名党员官兵中,挑选出50名最优秀的官兵参加抗震救灾 工作;
④一彩民选号,从装有36个大小、形状都相同的号签的盒子中逐个抽 出6个号签.
样本量
样本中包含的__个__体__数__
样本与样本量有什么区别?
【提示】样本与样本量是两个不同的概念,样本是从总体中抽取的个 体组成的集合,是研究对象;样本量是样本中个体的数目,是一个 数.
简单随机抽样
1.简单随机抽样的定义和方法
(1)定义:一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽 取n(1≤n≤N)个个体作为样本,如果抽取是放回的,且每次抽取时总
定义
抽签法
方法
随机数
法
总体平均数及样本平
均数
三、导学指导与检测
统计的相关概念
名称 普查
定义 对每一个调查对象都进行调查
总体
所要调查对象的_全_ 体
个体
总体中的每一个调查对象
抽样调查 从总体中抽取__一__部__分__个体进行调查,并以此为依据对总 体的情况作出估计和推断
样本
从总体中抽取的那部分__个__体____
素养点睛:本题考查了数学抽象的核心素养.
【答案】C
【解析】A中不同年级的学生身体发育情况差别较大,B,D的总体容 量较大,C的总体容量较小,适宜用简单随机抽样.
• 简单随机抽样的判断方法 判断所给的抽样是否为简单随机抽样的依据是简单随机抽样的四个特 征:
上述四点特征,如果有一点不满足,就不是简单随机抽样.
简单随机抽样的概念
简单随机抽样的概念一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。
简单随机抽样一般采用两种方法:抽签法和随机数表法。
例1:人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?例2:某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?1、为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是A.总体是240 B、个体是每一个学生 C、样本是40名学生 D、样本容量是402、为了正确所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是()A、总体B、个体是每一个学生C、总体的一个样本D、样本容量3、一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是。
4、从3名男生、2名女生中随机抽取2人,检查数学成绩,则抽到的均为女生的可能性是。
系统抽样的定义:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。
例题:例1.某单位在职职工共624人,为了调查工人用于上班途中的时间,决定抽取10%的工人进行调查,试采用系统抽样方法抽取所需的样本。
例2.从编号为150的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()C()2,4,6,16,32DA()3,13,23,33,43()5,10,15,20,25B()1,2,3,4,51.从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为()(A)99 (B)99.5 (C)100(D)100.52.从学号为0~50的高一某班50名学生中随机选取5名同学参加数学测试,采用系统抽样的方法,则所选5名学生的学号可能是()(A)1,2,3,4,5 (B)5,16,27,38,49 (C)2, 4, 6, 8 (D)4,13,22,31,403.某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。
简单随机抽样
n N
N
(Yi Y )2
i 1
E[ ( yi Y )( yj Y )] i j
n(n 1) N (N 1)
i j
(Yi
Y
)(Yj
Y
)
V ( y)
1 n2
n N
N
(Yi
i 1
Y )2
1 n2
n(n 1) N ( N 1)
(Yi
i j
Y )(Y j
P(Yin | Y Yi1 i2
(N n)! N!
Yi1 Y, i2, ,Yin这组样本与其入样的先后顺序无关,
得 到 这 组 的 样 本 的 个 数有n!
Y ) in1
样本(Yi1 Y, i2 , ,Yin)入样的概率为
n!(N n)!/ N! 1
N n
简单估计量方差的无偏估计
定理2.3:y的方差的无偏估计:v( y) 1 f s2 n
s2为样本方差。
证明:说明样本方差是总体方差的无偏估计即可。
s2EE[[ninnn1(1(y11y1i[ iYni1Yn)1()2y(2]i]yiYnNn)Ey2()iNy21n((YYyin)21YY1))2n2i]n1V根[((n据yy(i)N对NYN称1))性S( 2yn论SY证2)]2法和方差性质
n
n
总 体 有 限 时 , 产 生 了 变化 ,
引 进 因 子N n 1 f。 N
于 是 称1 f对 方 差 ,1 f 对 标 准 差 ( 标 准 误 ) 为有 限 总 体 的 校 正 系 数 。
一般而言,当抽样比小于5%时,fpc 可以忽略不计算,这样 的话估计量的标准差就估计的稍微高一些。
第1部分 第一章 § 2 2.1 简单随机抽样
0,1,…,19.
第二步,将号码分别写在一张纸条上,揉成团,制成 号签. 返回
第三步,将得到的号签放入一个不透明的袋子中,并 充分搅匀. 第四步,从袋子中逐个抽取5个号签,并记录上面的 编号. 第五步,所得号码对应的5架钢琴就是要抽取的对象. [一点通] 利用抽签法抽取样本时应注意以下问题: (1)编号时,如果已有编号(如学号、标号等)可不必重新 编号.(例如该题中这20架钢琴事先有号可不编号)
(2)读数时,编号为两位,两位读取,编号为三位,
则三位读取,如果出现重号,则跳过,接着读取.
(3)当题目所给的编号位数不一致时,不便于直接从
随机数表中读取,这时需要对号码作适当的调整使新编
号位数相同.
返回
5.从10个篮球中任取一个,检查其质量,用随机数法抽取 样本,则应编号为 A.1,2,3,4,5,6,7,8,9,10 B.-5,-4,-3,-2,-1,0,1,2,3,4 C.10,20,30,40,50,60,70,80,90,100 ( )
返回
2.实施步)准备“ 抽签 ”的工具,实施“ 抽签 ”; (3)对样本中每一个个体进行测量或调查.
返回
为了检验某种产品的质量,决定从120件产品中抽取10
件进行检验.检查人员先将120件产品标号为 001,002,003,…,120.然后从随机数表中的某一行、某一列 按某一方向读取,凡不在001~120中的数跳过去不读,前面 已经读过的数也跳过去不读,按照此规则直到取足样本为
返回
某班班长为了从班内50人中选出一人参加春季游园活动, 他将全班同学进行编号,然后将编号置于某一纸箱,搅匀后, 请学习委员从中任意抽出一个,确定出参加游园的人选.
问题1:班长的做法公平吗?
简单随机抽样
简单随机抽样(也叫纯随机抽样)
就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其它各种抽样形式的基础。
通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
等距抽样(也叫机械抽样或系统抽样)
就是将总体各单位按一定标志或次序排列成为图形或一览表式(也就是通常所说的排队),然后按相等的距离或间隔抽取样本单位。
特点是:抽出的单位在总体中是均匀分布的,且抽取的样本可少于纯随机抽样。
等距抽样既可以用同调查项目相关的标志排队,也可以用同调查项目无关的标志排队。
等距抽样是实际工作中应用较多的方法,目前我国城乡居民收支等调查,都是采用这种方式。
类型抽样(也叫分层抽样)
就是将总体单位按其属性特征分成若干类型或层,然后在类型或层中随机抽取样本单位。
特点是:由于通过划类分层,增大了各类型中单位间的共同性,容易抽出具有代表性的调查样本。
该方法适用于总体情况复杂,各单位之间差异较大,单位较多的情况。
整群抽样
就是从总体中成群成组地抽取调查单位,而不是一个一个地抽取调查样本。
特点是:调查单位比较集中,调查工作的组织和进行比较方便。
但调查单位在总体中的分布不均匀,准确性要差些。
因此,在群间差异性不大或者不适宜单个地抽选调查样本的情况下,可采用这种方式。
1.2.1简单随机抽样
作业: 预习2.2
以纤至宏 以德致功
)
D.博尔特从 8 个跑道中随机抽取一个跑道试跑 答案:D
以纤至宏 以德致功
1
2
3
4
5
3.用随机数法进行抽样有以下几个步骤:①将总体中的个体编号; ②获取样 本号码;③选定开始的数字;④确定读数的方向.这些步骤的先后顺序应为 ( ) B.①③④② D.④③①②
A.③④①② C.①④③② 答案:B
以纤至宏 以德致功
以纤至宏 以德致功
3.随机数法 (1)定义 把总体中的 N 个个体依次编上 0,1,…,N-1 的号码,然后利用工具(转盘 或摸球、随机数表、科学计算器或计算机)产生 0,1,…,N-1 中的随机数,产生 的随机数是几,就选几号个体,直至抽到预先规定的样本数.利用产生的随机 数来抽取样本,这种方法称为随机数法. (2)利用随机数表抽取样本的实施步骤 ①将总体中的个体编号; ②在随机数表中任选一个数作为开始; ③规定读取数字的方向; ④开始读取数字,若不在编号中,则跳过,前面已经读过的也跳过,若在 编号中,则取出,依次取下去,直到取满为止,相同的号只取一次; ⑤根据选定的号码抽取样本.
以纤至宏 以德致功
探究一
探究二
探究三
对简单随机抽样概念的理解
1.判断一个抽样是否是简单随机抽样,关键是看这一抽样是否满足简 单随机抽样的定义,是否符合简单随机抽样的几个特点. 2.在简单随机抽样过程中,每一个个体被抽到的可能性都是 ,其中,n 是 样本容量,N 是总体容量.
������ ������
1
2
3
4
5
1.下列关于简单随机抽样的叙述不正确的是( A.一定要逐个抽取 B.它是一种最简单、最基本的抽样方法 C.总体中的个体数必须是有限的 D.先被抽取的个体被抽到的可能性要大 解析:不论先后,每个个体被抽到的可能性都相同. 答案:D
9.1.1简单随机抽样
1.总体、个体、样本等概念 (1)总体:我们所要考察对象的全体叫做总体,其中每一个考察对象 叫做个体. (2)样本:从总体中抽出的若干个个体组成的集合叫做总体的一个 样本,样本中个体的数量叫做样本容量. (3)个体:总体中的每个元素叫做个体. (4)样本容量:样本中个体的数目叫做样本容量.
2.简单随机抽样 (1)概念 一般地,设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个 体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都 相等,就把这种抽样方法叫做简单随机抽样.
的身高,总体容量是 240,样本容量是 40,故答案为 D.
答案:D
2.现从 80 件产品中随机抽出 20 件进行质量检验,在这个问题中,总
体、样本和样本容量分别是
、
、
.
解析:总体是 80 件产品的质量;样本是抽取的 20 件产品的质量;样
本容量是 20.
答案:80 件产品的质量 抽取的 20 件产品的质量 20
1-1 下列问题中,最适合用简单随机抽样方法抽样的是( ) A.某电影院有 32 排座位,每排有 40 个座位,座位号是 1~40.有一次 报告会坐满了听众,报告会结束以后为听取意见,要留下 32 名听众进行 座谈 B.从 10 台冰箱中抽出 3 台进行质量检查 C.某学校有在编人员 160 人,其中行政人员 16 人,教师 112 人,后勤 人员 32 人.教育部门为了解大家对学校机构改革意见,要从中抽取一个 容量为 20 的样本 D.某乡农田有山地 8 000 亩,丘陵 12 000 亩,平地 24 000 亩,洼地 4 000 亩,现抽取农田 480 亩估计全乡农田平均产量
1.为了了解全校 240 名高一学生的身高情况,从中抽取 40 名学生进 行测量.下列说法正确的是( )
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
19
如果度量的单位是诸如米或年这种数量形式, 就称这样的数据为定量数据。定量数据一般是对 “多少”、“多大”这样的问题所作的回答,例 如年龄、孩子的数量、工作的小时数、支出与收 入、血压等等。 对于不同类型的变量,需要使用不同类型的估计。 通常,对定性变量,我们计算比例与总数;对定 量变量,我们计算平均数与总量。
第三章 简单随机抽样(SRS)
第一节 概述
第二节
第三节
估计量及其误差
样本量的确定
1
第一节
一、定义
概述
二、抽取方法
三、方法评估 四、两个试验
2
一、定义
所有概率抽样的出发点和理论基础都是简单 随机抽样。简单随机抽样是一种一步抽样法,它 保证样本量为n的每个可能的样本都有相同的被抽 中的概率p=n/N。
7
与其他抽样技术相比,简单随机抽样有以下优
点: 是最简单的抽样技术; 抽样框不需要其他(辅助)信息,唯一需要的 只是一个关于调查总体所有单元的一个完全的清单 和与其如何联系的信息; 关于样本量的确定、总体估计与方差估计都有 现成的标准公式可以利用,因此技术发展已经成熟。
8
简单随机抽样的缺点是: 抽样框中即使有现成的辅助信息也不加利用, 使得估计的统计效率较其他利用辅助信息的样本设 计低; 由于样本在总体中的地理分布范围比较广,如 果采用面访,费用较高; 有可能抽到一个“差的”样本。原因是这种方 法不对抽中哪一个样本进行控制,所有样本量为n的 样本都有相同的被抽中的机会,因此抽出来的样本 有可能分布不好,不能很好地代表总体; 如果不用计算机,而用随机数表抽一个大样本 将十分单调劳神。
4
二、抽取方法 抽样可以是放回的,也可以是不放回的。如 果抽样比非常小,则放回抽样与不放回抽样实际 上是差不多的。一般情况下,不放回抽样的结果 更精确,实际操作也更方便些。在本课程中,除 非特别指明,抽样都是指不放回的。
简单随机抽样一般有抽签法和随机数法两种 实施方法。
5
三、方法评估 简单随机抽样被用作评估其他抽样策略的效 率的基准,这里抽样策略是指抽样方法与所用估 计量的结合。一个估计量就是一个用来计算估计 值的公式。估计量的抽样误差是通过其抽样方差 来测量的,而抽样方差定义为对采用这种抽样设 计的所有可能样本,估计值距其平均值的差(称 为离差)平方的平均。
简单随机抽样有两个相互等价的定义。
3
随机样本的优点: 1.随机选择可以消除“偏心”;也就是说随机 抽样把偏差给消灭了。 2.如果我们从同一个总体,重复抽取许多大小 一样的随机样本,所有样本的变异状况就会遵循某 种可预测的形态 (pattern) 。从这个可预测的形态 可以得知,由较大样本所得结果的变异.会小于小 样本结果的变异。
9
四、两个试验 也许有人会认为,在抽样时不用随机数表, 而采取随意抽选的办法也可以达到预期的抽样效 果。表面上看,这种想法似乎有一定道理,但实 际试验的结果证明随意抽样不等于随机抽样。以 下是两个有名的试验:
10
试验一:随意数试验
让六个人写下100个自己随意想到的三位数, 将这些数内的 0 、 1 、 2 、 … 、 9 数字列成次数分布 表如下:
22
二、估计量的性质
不同的样本将得到不同的估计值。 一个估计量的抽样分布,是指使用相同的抽样 设计,从同一个总体抽取的所有可能样本的估计值 的分布。 显然,这样的抽样分布依赖于估计量的形式和 所采用的抽样设计(例如简单随机抽样、系统抽样、 分层抽样、多阶抽样等)。
13
14
可见四个人都对颜色存在偏好,如第一个人 偏爱绿色,第二个人偏爱蓝色等。这种由于对颜 色偏好所引起的偏估类型,可称之为颜色偏误。
15
从上述两个试验可以发现,利用人为的随意 抽样方法都会产生偏差。每个试验者均有较为喜 欢的数字和颜色,因此,使得样本变成非随机的, 进而给抽样估计带来困难。
16
11
可以看出,六个人都对数字存在偏好,如第一 个人更加偏好数字 4 、 3 、 0 ;第二个人则偏好数字 1 、 8 、 4 ;等等。这种由于数字偏好所引起的偏估类型 可称之为数字偏误。
12
试验二:着色试验 让四个人将 10×10方格的纸板着色,可供选 择的颜色有蓝、绿、红、白和黄色五种,对每一 个四分象限来说,规定每种颜色只能在每行和每 列出现一次。每个方格以其所在的列号与行号表 示,如(4, 6)代表第四列第六行的方格。请四个 人对这 100 个方格随意选择行列号,而对其着色。 将这些由这四个人着色所得到的资料形成次数分 布表如下:
18
样本单元可以按某些指标划分成不同的类别, 所得的数据就称为分类数据或定性数据。这些变 量中,如性别或婚姻状况,通常只有几个可能的 取值。民意调查中,通常用量表的形式收集所需 的数据也是定性数据,例如很赞成,赞成,既不 赞成也不反对,不赞成,很不赞成。必须注意的 是,这种情况下每个单元属于而且只属于其中一 个类别。 Nhomakorabea20
在估计时,需要考虑的另一个问题是,估计 针对的是总体的什么范围。估计既可以针对整个 调查总体,也可以针对特定的子总体或特定的域。 例如,除需要计算全国估计值外,可能还需要省 及地市的估计值。同时,还可能需要诸如分性别、 年龄、受教育水平等这样的域估计值。
21
对下述问题的回答将有助于决定如何计算估 计值: —— 需要估计什么类型的参数 ? 是比例,均 值,还是总量? —— 数据是什么类型的 ? 是定性数据,还是 定量数据? ——采用怎样的权数?是自加权设计吗? ——需要估计的是什么样的域?
6
如果一种抽样策略的抽样方差比另一种抽样 策略的抽样方差小,我们就称这种抽样策略更有 效率(这种效率也称统计效率)。一个有较小抽 样方差的估计量具有较高的精度。 基什提出用设计效果(Deff)来衡量一种抽 样策略的效率。
一个复杂抽样设计的抽 样方差 Deff 相同样本量的简单随机 抽样的抽样方差
第二节
估计量及其误差
一、数据类型
二、估计量的性质 三、在简单随机抽样条件下的其他估计量 四、抽样误差的其它度量
17
一、数据类型
几乎每项调查都需要计算诸如比例、均值、总 量这样的简单描述统计量,当然也会用到一些更为 复杂的统计量和分析方法。大多数调查都要求收集 很多个指标,这些指标也称作变量。变量既可以是 定性的 ( 或称分类的 ) ,也可以是定量的 ( 或称计量 的 )。