第二章 简单随机抽样
简单随机抽样课本案例
理论迁移
例1 为调查中央电视台春节联欢晚会 收视率,有如下三种调查方案: 方案一:经过互联网调查. 方案二:经过居民小区调查. 方案三:经过电话调查. 上述三种调查方案能取得比较精确旳 收视率吗?为何?
知识探究(二):简朴随机抽样旳措施
数值指标旳全体构成旳集合看作总体。
全国每位高中学 生旳视力情况。
把构成总体旳每一种考察旳对 象叫做个体
这15000名学生旳视力 情况又构成一种集体
15000
从总体中抽出若干个体所构成旳 集体叫做这个总体旳一种样本。
样本中旳个体旳数目叫 做样本旳容量。
[课后练习]:
1. 在12. 某校期末考试后,为了分析该校高一年级1000 名学生旳学习成绩,从中随机抽取了100名学生旳成 绩单,就这个问题来说,下面说法正确旳是﹙ ﹚
A. 1000名学生是总体 C. 100名学生旳成绩是一种个体
B. 每个学生:简朴随机抽样旳基本思想
思索1:从5件产品中任意抽取一件,
则每一件产品被抽到旳概率是多少?
一般地,从N个个体中任意抽取一种, 则每一种个体被抽到旳概率是多少?
思索2:从6件产品中随机抽取一种容量为3旳样本, 能够分三次进行,每次从中随机抽取一件, 抽取旳产品不放回,这叫逐一不放回抽取.
第一步,将总体中旳全部个体编号,并 把号码写在形状、大小相同旳号签上.
第二步,将号签放在一种容器中,并搅 拌均匀.
第三步,每次从中抽取一种号签,连续 抽取n次,就得到一种容量为n旳样本.
思索4:你以为抽签法有哪些优点和缺陷?
优点:简朴易行,当总体个数不多旳时候
搅拌均匀很轻易,个体有均等旳机会被抽中, 从而能确保样本旳代表性.
第2章简单随机抽样
称简单随机抽样,所得的样本称为不放回的
简单随机样本,简称简单随机样本
精选可编辑ppt
2
简单随机抽样的实施方法:将总体中的单元 依次从1到N进行编号,然后利用抽签法或随 机数法来进行简单随机抽样
抽签法:一般用于总体所含单元不多的情况, 首先做N个签并依次写上1至N的号码,然后 将签充分混合均匀,再一次抽取其中的n个 签或逐个不放回地抽取n个签,则编号为这n 个签上的号码的单元就构成一个简单随机样 本
注3: V(y),V(Yˆ) 中的 S
2 Y
一般是未知的,因此需要通
过样本进行估计
精选可编辑ppt
14
定理2.2.3
在简单随机抽样中,样本方差
s
2 y
是总体方差
S
2 Y
的无偏估计量,样本协方差 s y x
是总体协方差 S Y X 的无偏估计量
推论2.2.1 在简单随机抽样中,
Vˆ(y) ˆ 1 f n
在一定条件下,利用辅助指标的信息可以提 高对主要指标的估计的精度
一般地,辅助指标可以是主要指标的前期资 料,也可以是表示单元规模的量,或者是单 元的某个易测指标,等等
精选可编辑ppt
31
如果主要指标Y与辅助指标X之间有正相关关 系,就可以构造比估计量
在简单随机抽样中,称 YˆR ˆ yR ˆ RˆX 为总体均 值 Y 的比估计量,称 YˆRˆ NyRRˆX为总体总 值 Y 的比估计量,其中 X 或 X 必须已知
sy2
是
V
(
y
) 的无偏估计量
Vˆ(Yˆ)ˆ N21f n
sy2 是 V
( Yˆ )
的无偏估计量
注:把 Vˆ(y), Vˆ(Yˆ) 分别作为 V(y), V(Yˆ) 的估计 量,都称为标准差估计量
简单随机抽样
【预习自测】 1.简单随机抽样的结果( ) A.完全由抽样方式所决定 B.完全由随机性所决定 C.完全由人为因素所决定 D.完全由计算方法所决定
【解析】选B.根据简单随机抽样的定义,总体中每个个 体被抽到的机会相等,因此抽样结果只与随机性有关.
2.简单随机抽样中,某一个个体被抽中的机会是( ) A.与第n次抽样有关,第一次抽中的机会要大些 B.与第n次抽样无关,每次抽中的机会都相等 C.与第n次抽样有关,最后一次抽中的机会大些 D.该个体被抽中的机会无法确定 【解析】选B.由简单随机抽样的定义可知:每个个体被 抽到的机会都相等,与第几次抽到无关.
4.下列抽样试验中,适合用抽签法的是( ) A.从某工厂生产的3 000件产品中抽取600件进行质量 检验 B.从某工厂生产的两箱(每箱15件)产品中抽取6件进行 质量检验 C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件 进行质量检验 D.从某厂生产的3 000件产品中抽取10件进行质量检验
2.某校有40个班,每班50人,要求每班随机选派3人参加
“学生代表大会”.在这个问题中样本容量是( )
A.40
B.50
C.120
D.150
【解析】选C.由于样本容量即样本的个数,故抽取的样
本的个数为40×3=120.
【补偿训练】1.一个总体中共有10个个体,用简单随机
抽样的方法从中抽取一个容量为3的样本,则某特定个
3.在问题2的基础上,若想得到样本饼干,则应如何摸取? 提示:从中不放回地摸取并且每次只摸一个. 4.在上述抽样过程中,某一包饼干第一次被抽到与第二 次被抽到的机会相等吗? 提示:相等.
结论: 1.抽样涉及的基本概念(以某地区高一学生身高为例) 为了了解某地区高一学生身高的情况,我们找到了该地 区高一8 000名学生的体检表,从中随机抽取了150张, 表中有体重、身高、血压、肺活量等15类数据,那么总 体是指_该__地__区__高__一__8__0_0_0_名__学__生__的__身__高__数__据__,个体是指 _该__地__区__高__一__某__个__学__生__的__身__高__,样本是指_被__抽__到__的__1_5_0_个__ _学__生__的__身__高__,样本容量是_1_5_0_.
第二章 简单随机抽样-2.1-2.2-1
3 估计量的性质
(3)比例估计量的性质
性质8
ˆ E ( P) E ( p) P
N n P(1 P) 性质9 样本比例p的方差为 V ( p) N 1 n
性质10 V(p)的无偏估计为
1 f v( p ) p(1 p) n 1
作业
设总体单元为N=6,单元的取值分别为3、4、
第二章 简单随机抽样
第一节 第二节 第三节 第四节 引言 估计量及其性质 样本量的确定 子总体的估计
第一节 引言
1 简单随机抽样的定义 2 简单随机样本的性质 3 简单随机样本的实现方法
1 简单随机抽样的定义 定义: 每次都是从剩下的总体单元中随机抽 取1个单元,相继依次抽取n次,得到n个单 元组成的样本,叫做不放回简单随机样本。
1
1 简单随机抽样的几个重要结论
(1)单元入样概率的一个重要结论
定理1 :对总体 U {Y1 ,, YN } 的一个样本量为n的无重 复样本,有
(1) k n
k 1 N
(2) kj (n 1) j , 对固定的j
k 1 k j
N
1 简单随机抽样的几个重要结论
(2) 简单估计量
设 y1 ,, yn 是总体{Y1 , ,YN }的一个简单随机样本,则
ˆ (1) Y
y
ˆ (2)Y Ny ˆ (3)P p
3 估计量的性质
(1)均值估计量的性质
性质1
设y1 ,, yn 是总体{Y1 , ,YN }的一个简单随机样本,则
ˆ ) E( y ) Y E (Y
3 简单随机样本的实现方法
首先将N个总体单元编号为:1,2,,N,每一单元对应 一个号码,若抽到某号,则相应单元入样。
抽样调查理论与方法 金勇进(第二版)-第2章-简单随机抽样
X
2
n
N
1
i 1
(Y i R X i )
2
定理 的方差为:
Y 2.7:对于简单随机抽样,n较大时, R N y R
N 1 2 1 f 2 V (Y R ) N (Yi R X i ) n N 1 i 1
推论 2.12:对于简单随机抽样,n较大时, Y y 的方差为:
n N
n N
【例2.1】
设总体有5个单元(1、2、3、4、5), 按不放回简单随机抽样的方式抽取2个单 元,则所有可能的样本为个:
1,2
1,3 1,4 1,5
2,3
2,4 2,5
3,4
3,5
4,5
【例2.2】
设总体有5个单元(1、2、3、4、5),按放回 简单随机抽样的方式抽取2个单元,则所有可 能的样本为25个(考虑样本单元的顺序):
i
Y X
Y X
r
n
yi xi
i 1
y x
i 1
i 1
简单估计量
1 Y y n
n
yi
y1 y 2 y n n
i 1
N Y Ny n
n
yi
i 1
a 1 P p n n
n
yi y Y
i 1
ˆ R
【例2.5】
根据例【2.4】的数据和结果,比较两种思路下对应的 方差估计结果。
2.4 回归估计量及其性质
属于简单估计量,不属于比率估计量。
引理 的期望为:
2.3:对于简单随机抽样,n较大时, R r
抽样技术第二章_简单随机抽样
目前,世界上已编有许多种随机数表。其中较 大的有兰德公司编制,1955年出版的100万数 字随机数表,它按五位一组排列,共有20万组 ;肯德尔和史密斯编制,1938年出版的10万 数字随机数表,它也按五位一组排列,共有 25000组。我国常用的是中国科学院数学研究 所概率统计室编印的《常用数理统计表》中的 随机数表。
率都等于1/ CNn,这种抽样称为简单随机抽样。
注意:定义2.1与定义2.3是等价的。
三个定义之间的联系
简单随机抽样的具体实施方法
常用的有抽签法和随机数法两种。 (一)抽签法 抽签法是先对总体N个抽样单元分别编上1到N的号码,再制作与
之相对应的N个号签并充分摇匀后,从中随机地抽取n个号签(可以 是一次抽取n个号签,也可以一次抽一个号签,连续抽n次),与抽 中号签号码相同的n个单元即为抽中的单元,由其组成简单随机样 本。 抽签法在技术上十分简单,但在实际应用中,对总体各单元编号 并制作号签的工作量可能会很繁重,尤其是当总体容量比较大时 ,抽签法并不是很方便,而且也往往难以保证做到等概率。因此 ,实际工作中常常使用随机数法。
s2 / n
s(y)
y
t
1
2
s(y),y
t
1
2
s(y)
概述
一、简单随机抽样(或单纯随机抽样) 本书一般局限于不放回随机抽样
二、实施方法 三、地位、作用
是其他抽样方法基础
2.1定义与符号
定义2.1 从总体的N个单元中,一次整批抽取n 个单元,使任何一个单元被抽中的概率都相等 ,任何n个不同单元组成的组合被抽中的概率 也都相等,这种抽样称为简单随机抽样.
此外,简单随机抽样要求在抽样前编制出抽样 框,并对每一个总体抽样单元进行编号,而且 当总体抽样单元的分布比较分散时,样本也可 能会比较分散,这些都会给简单随机抽样方法 的运用造成许多的不便,甚至在某些情况下干 脆无法使用。因此,在此基础上研究其它抽样 技术显得更加重要。
高中数学高考统计知识点总结
第二章:统计 1、抽样方法:①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显)注意:在N 个个体的总体中抽取出n 个个体组成样本, 每个个体被抽到的机会(概率)均为Nn。
2、总体分布的估计: ⑴一表二图:①频率分布表——数据详实 ②频率分布直方图——分布直观③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。
⑵茎叶图:①茎叶图适用于数据较少的情况, 从中便于看出数据的分布, 以及中位数、众位数等。
②个位数为叶, 十位数为茎, 右侧数据按照从小到大书写, 相同的数据重复写。
3、总体特征数的估计:⑴平均数:nx x x x x n++++=Λ321; 取值为n x x x ,,,21Λ的频率分别为n p p p ,,,21Λ, 则其平均数为n n p x p x p x +++Λ2211; 注意:频率分布表计算平均数要取组中值。
⑵方差与标准差:一组样本数据n x x x ,,,21Λ方差:212)(1∑=-=ni ix xns ;标准差:21)(1∑=-=ni ix xns注:方差与标准差越小, 说明样本数据越稳定。
平均数反映数据总体水平;方差与标准差反映数据的稳定水平。
⑶线性回归方程①变量之间的两类关系:函数关系与相关关系; ②制作散点图, 判断线性相关关系 ③线性回归方程:a bx y +=∧(最小二乘法)1221ni i i ni i x y nx y b x nx a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑注意:线性回归直线经过定点),(y x 。
第三章:概率1、随机事件及其概率:⑴事件:试验的每一种可能的结果, 用大写英文字母表示;⑵必然事件、不可能事件、随机事件的特点; ⑶随机事件A 的概率:1)(0,)(≤≤=A P nmA P . 2、古典概型:⑴基本事件:一次试验中可能出现的每一个基本结果;⑵古典概型的特点: ①所有的基本事件只有有限个; ②每个基本事件都是等可能发生。
第二章 简单随机抽样
2.1 定义与符号
总体:( )具体总体;( ;(2)有限总体; 总体:(1)具体总体;( )有限总体; :( (3)与样本框存在一一对应关系的所谓实查总体或被称为 ) 抽样总体的样本框本身。 抽样总体的样本框本身。 单元:总是指构成抽样总体的样本单元(样品、样本点) 单元:总是指构成抽样总体的样本单元(样品、样本点) 抽样单元并不总是等同于个体, 抽样单元并不总是等同于个体,有时抽样单元甚至包含几个或 多个个体 个体:最小的不可再分的单元 个体: 设抽样总体由N个抽样单元组成 个抽样单元组成, 是已知整数 表示总体规模 是已知整数, 总体规模; 设抽样总体由 个抽样单元组成,N是已知整数,表示总体规模; 欲在其中抽取n个抽样单元构成样本 个抽样单元构成样本。 欲在其中抽取 个抽样单元构成样本。 n是一个事先人为确定的不大于 ,不小于 的正整数,称为样本容 是一个事先人为确定的不大于N,不小于1的正整数 称为样本容 的正整数, 是一个事先人为确定的不大于 简称样本量或样品数,表示样本规模。 量,简称样本量或样品数,表示样本规模。 样本容量相对于总体规模的比例f=n/N,称为抽样比 样本容量相对于总体规模的比例 ,称为抽样比
n CN
简单随机抽样的三个等价定义: 简单随机抽样的三个等价定义:
定义2.1 从总体的 个单元中,一次整批抽取 个单元,使任何一个 从总体的N个单元中 一次整批抽取n个单元 个单元中, 个单元, 定义 单元被抽中的概率都相等,任何n个不同单元组成的组合被抽中的概 单元被抽中的概率都相等,任何 个不同单元组成的组合被抽中的概 率也相等,这种抽样称为简单随机抽样。 率也相等,这种抽样称为简单随机抽样。 定义2.2从总体的 个单元中,逐个不放回地抽取单元,每次抽取到 从总体的N个单元中 定义 从总体的 个单元中,逐个不放回地抽取单元, 尚未入样的任何一个单元的概率都相等,直到抽足n个单元为止 个单元为止, 尚未入样的任何一个单元的概率都相等,直到抽足 个单元为止,这 样所得的n个单元组成一个简单随机样本 个单元组成一个简单随机样本。 样所得的 个单元组成一个简单随机样本。 定义2.3 按照从总体的 个单元中抽取 个单元的所有可能不同的组 按照从总体的N个单元中抽取 个单元中抽取n个单元的所有可能不同的组 定义 n n 个样本数, 个样本随机抽取一个样本, 合构造所有可能的 CN个样本数,从 CN 个样本随机抽取一个样本,使 n 这种抽样称为简单随机抽样。 每个样本被抽中的概率都等于1/ CN ,这种抽样称为简单随机抽样。 n N
人教版高中数学必修三 2.1《随机抽样》知识梳理+跟踪检测
人教版高中数学必修三 第二章 统计2.1《随机抽样》知识梳理知识点一:简单随机抽样1.简单随机抽样的定义设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的分类简单随机抽样⎩⎨⎧随机数法抽签法 3.简单随机抽样的优点及适用类型简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的.知识点二:系统抽样1.系统抽样的概念先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本.2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本,步骤为:(1)先将总体的N 个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等.(2)确定分段间隔k ,对编号进行分段.当N n(n 是样本容量)是整数时,取k =N n; (3)在第1段用简单随机抽样确定第一个个体编号l(l ≤k);(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k),再加k 得到第3个个体编号(l +2k),依次进行下去,直到获取整个样本.知识点三:简单随机抽样1.分层抽样的概念 在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.分层抽样的适用条件分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.人教版高中数学必修三第二章统计2.1《随机抽样》跟踪检测一、选择题1.下列哪种工作不能使用抽样方法进行()A.测定一批炮弹的射程B.测定海洋水域的某种微生物的含量C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度D.检测某学校全体高三学生的身高和体重的情况2.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量3.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是()A.分层抽样B.简单随机抽样C.系统抽样D.以上都不对4.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:①采用随机抽样法,将零件编号为00,01,02,,99,抽出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.则()A.不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是1 5B.①②两种抽样方法,这100个零件中每个被抽到的概率都是15,③并非如此C.①③两种抽样方法,这100个零件中每个被抽到的概率都是15,②并非如此 D.采用不同的抽样方法,这100个零件中每个被抽到的概率各不相同5.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽的人数为( )A .16B .14C .28D .126.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y 的值分别为( )A. 2,5B. 5,5C. 5,8D. 8,87.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )A .简单随机抽样法B .抽签法C .随机数法D .分层抽样法[答案] D[解析] 由分层抽样的定义可知,该抽样为按比例的抽样.8.某公司10位员工的月工资(单位:元)为1210,,,x x x ,其均值和方差分别为x 和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A. 22,100x s +B. 22100,100x s ++C. 2,x sD. 2100,x s +9.对于简单随机抽样,下列说法中正确的命题为( )①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概念进行分析;②它是从总体中逐个进行抽取,以便在抽样实践中进行操作;③它是一种不放回抽样;④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.A.①②③B.①②④C.①③④D.①②③④10.下列抽样实验中,最适宜用系统抽样的是()A.某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样B.某厂生产的2 000个电子元件中随机抽取5个入样C.从某厂生产的2 000个电子元件中随机抽取200个入样D.从某厂生产的20个电子元件中随机抽取5个入样11.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93B.123C.137D.16712.一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为()A.2个B.3个C.5个D.13个13.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,614.对某商店一个月(30天)内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A.46,45,56B.46,45,53C.47,45,56D.45,47,5315.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在用分层抽样法抽取20人,则各年龄段人数分别是()A.7,4,6 B.9,5,6 C.6,4,9 D.4,5,916.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为()A.9 B.18 C.27 D.36二、填空题17.在学生人数比例为2∶3∶5的A,B,C三所学校中,用分层抽样的方法招募n名志愿者,若在A学校恰好选出了6名志愿者,那么n=________. 18.博才实验中学共有学生1 600名,为了调查学生的身体健康状况,采用分层抽样法抽取一个容量为200的样本.已知样本容量中女生比男生少10人,则该校的女生人数是________人.19.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户,从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.20.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本、用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取________人.21.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示.人.三、解答题22.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:60人进行更为详细的调查,应当怎样进行抽样?23.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?24.为调查小区平均每户居民的月用水量,下面是3名学生设计的调查方案:学生A:我把这个用水量调查表放在互联网上,只要登录网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快估计出小区平均每户居民的月用水量.学生B:我给我们居民小区的每一个住户发一个用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量.学生C:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们的月用水量,然后就可以估计出小区平均每户居民的月用水量.请问:对上述3种学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?你有什么建议?2.1《随机抽样》跟踪检测解答一、选择题1.下列哪种工作不能使用抽样方法进行()A.测定一批炮弹的射程B.测定海洋水域的某种微生物的含量C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度D.检测某学校全体高三学生的身高和体重的情况[答案] D2.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量[答案] C3.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是()A.分层抽样B.简单随机抽样C.系统抽样D.以上都不对[答案] C[解析]按照一定的规律进行抽取为系统抽样.4.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:①采用随机抽样法,将零件编号为00,01,02,,99,抽出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.则()A.不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是15B.①②两种抽样方法,这100个零件中每个被抽到的概率都是15,③并非如此 C.①③两种抽样方法,这100个零件中每个被抽到的概率都是15,②并非如此 D.采用不同的抽样方法,这100个零件中每个被抽到的概率各不相同[答案] A[解析] 无论采用哪种抽样,每个个体被抽到的概率相等.5.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽的人数为( )A .16B .14C .28D .12[答案] A[解析] 运动员共计98人,抽取比例为2898=27,因此男运动员56人中抽取16人.6.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y 的值分别为( )A. 2,5B. 5,5C. 5,8D. 8,8[答案] C[解析] 由题意得x =15,16.8=51(9+15+10+y +18+24) y =8,选C. 7.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )A .简单随机抽样法B .抽签法C .随机数法D .分层抽样法[答案] D[解析] 由分层抽样的定义可知,该抽样为按比例的抽样.8.某公司10位员工的月工资(单位:元)为1210,,,x x x ,其均值和方差分别为x 和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A. 22,100x s + B. 22100,100x s ++ C. 2,x s D. 2100,x s +[答案] D[解析] 设增加工资后10位员工下月工资均值为'x ,方差为2's , 则平均数()()()12101'10010010010x x x x =++++⋅⋅⋅++⎡⎤⎣⎦ ()1210110010010x x x x =++++=+; ()()()222212101'100'100'100'10s x x x x x x ⎡⎤=+-++-+⋅⋅⋅++-⎣⎦ ()()()22221210110x x x x x x s ⎡⎤=-+-+⋅⋅⋅+-=⎣⎦.故选D . 9.对于简单随机抽样,下列说法中正确的命题为( )①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概念进行分析;②它是从总体中逐个进行抽取,以便在抽样实践中进行操作;③它是一种不放回抽样;④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.A .①②③B .①②④C .①③④D .①②③④[答案] D10.下列抽样实验中,最适宜用系统抽样的是( )A .某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样B .某厂生产的2 000个电子元件中随机抽取5个入样C .从某厂生产的2 000个电子元件中随机抽取200个入样D .从某厂生产的20个电子元件中随机抽取5个入样[答案] C[解析] A 中总体有明显层次,不适用系统抽样法;B 中样本容量很小,适宜用简单随机抽样法中的随机数法;D 中总体数很小,故适宜用抽签法,只有C 比较适用系统抽样法.11.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A.93B.123C.137D.167[答案] C[解析] 由图可知该校女教师的人数为()11070%150160%7760137⨯+⨯-=+= 故选C12.一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为( )A .2个B .3个C .5个D .13个[答案] A[考点]分层抽样方法[分析]由题意,设抽取的进口的标志灯的数量为x 个,则30030=20x ,即可得出结论.解:由题意,设抽取的进口的标志灯的数量为x 个,则30030=20x , ∴x=2,故选A .[点评]本题考查分层抽样,抽样过程中每个个体被抽到的可能性相同,这是解决抽样问题的依据,样本容量、总体个数、每个个体被抽到的概率,这三者可以做到知二求一.13.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,6[答案] D[解析]由题意,各种职称的人数比为160∶320∶200∶120=4∶8∶5∶3,所以抽取的具有高、中、初级职称的人数和其他人员的人数分别为40×4 20=8,40×820=16,40×520=10,40×320=6.14.对某商店一个月(30天)内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A.46,45,56B.46,45,53C.47,45,56D.45,47,53[答案] A[解析]样本中共有30个数据,中位数为4547462+=;显然样本中数据出现次数最多的为45,故众数为45;极差为68-12=56,故选A.15.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在用分层抽样法抽取20人,则各年龄段人数分别是()A.7,4,6 B.9,5,6 C.6,4,9 D.4,5,9[答案] B[解析]各年龄段所选分别为20100×45=9,20100×25=5,20100×30=6.16.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为()A.9 B.18 C.27 D.36[答案] B[解析]设该单位老年职工有x人,从中抽取y人.则160+3x=430⇒x=90,即老年职工有90人,则90160=y32⇒y=18.故选B.二、填空题17.在学生人数比例为2∶3∶5的A,B,C三所学校中,用分层抽样的方法招募n名志愿者,若在A学校恰好选出了6名志愿者,那么n=________. [答案]30[解析]由题意,知22+3+5×n=6,∴n=30.18.博才实验中学共有学生1 600名,为了调查学生的身体健康状况,采用分层抽样法抽取一个容量为200的样本.已知样本容量中女生比男生少10人,则该校的女生人数是________人.[答案]760[解析]设该校女生人数为x,则男生人数为(1 600-x).由已知,2001 600×(1 600-x)-2001 600·x=10,解得x=760.故该校的女生人数是760人.19.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户,从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.[答案] 5.7%[解析]∵990∶99 000=1∶100,∴普通家庭中拥有3套或3套以上住房的大约为50×100=5 000(户).又∵100∶1 000=1∶10,∴高收入家庭中拥有3套或3套以上住房的大约为70×10=700(户).∴3套或3套以上住房的家庭约有5 000+700=5 700(户).故5 700100 000=5.7%.20.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本、用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取________人.[答案]3720[解析]由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.40岁以下的年龄段的职工数为200×0.5=100,则应抽取的人数为40200×100=20(人).21.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示.生活能否自理人数性别男女能178 278不能23 21人.[答案]60[解析]由表知500人中生活不能自理的男性比女性多2人,所以该地区15 000位老人生活不能自理的男性比女性多2×15 000500=60(人).三、解答题22.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:很喜爱喜爱一般不喜爱2 435 4 5673 926 1 07260人进行更为详细的调查,应当怎样进行抽样?解:可用分层抽样方法,其总体容量为12 000.“很喜爱”占2 43512 000,应取60×2 43512 000≈12(人);“喜爱”占4 56712 000,应取60×4 56712 000≈23(人);“一般”占3 92612 000,应取60×3 92612 000≈20(人);“不喜爱”占1 07212 000,应取60×1 07212 000≈5(人).因此采用分层抽样在“很喜爱”、“喜爱”、“一般”和“不喜爱”的2 435人、4 567人、3 926人和1 072人中分别抽取12人、23人、20人和5人.23.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?解:(1)将624名职工用随机方式编号由000至623.(2)利用随机数法从总体中剔除4人.(3)将剩下的620名职工重新编号由000至619.(4)分段,取间隔k=62062=10,将总体分成62组,每组含10人.(5)从第一段,即为000到009号随机抽取一个号l.(6)按编号将l,10+l,20+l,…,610+l,共62个号码选出,这62个号码所对应的职工组成样本.24.为调查小区平均每户居民的月用水量,下面是3名学生设计的调查方案:学生A:我把这个用水量调查表放在互联网上,只要登录网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快估计出小区平均每户居民的月用水量.学生B:我给我们居民小区的每一个住户发一个用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量.学生C:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们的月用水量,然后就可以估计出小区平均每户居民的月用水量.请问:对上述3种学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?你有什么建议?解:学生A的方法得到的样本不能够反映不上网的居民情况,是一种方便样本,所得的结果代表性差,不能很准确地获得平均每户居民的月用水量;学生B 的方法实际上是普查,花费的人力物力要多一些,但是如果统计过程不出错,可以准确地得到平均每户居民的月用水量;在小区的每户居民都装有电话的情况下,学生C的方法是一种随机抽样方法,所得的样本具有代表性,可以比较准确地获得平均每户居民的月用水量.在小区的每户居民都装有电话的情况下,建议用随机抽样的方法获取数据,即用学生C的方法,以节省人力物力,并且可以得到比较精确的结果.5、已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测数据算得的线性回归方程可能为( )A. 0.4.3ˆ2yx =+ B. 2 2.4ˆy x =- C. 9ˆ2.5yx =-+ D. 0.3 4.4ˆy x =-+ [答案] A[解析] 变量x 与y 正相关,可以排除C,D;样本平均数代入可求这组样本数据的回归直线方程.∵变量x 与y 正相关,∴可以排除C,D;样本平均数3x =, 3.5y =,代入A 符合,B 不符合,故选A.。
第二章 简单随机抽样
n
!(
N! N
n)!
C62
6! 15 2!4!
例2.2 N=8,其总体单元数值为:2,4,4,4,6,6,6,18
从中抽取n=3的简单随机样本个数
C83
8! 3!5!
56
用大写字母和小写字母分别表示有关总体和样本的量
关于总体变量Y的N个变量值记为 Y1,Y2,,YN
总体均值:Y
Y N
1 N
N
(1)简单随机抽样中用于估计总体均值的统计量是样本均值,而 待估总体参数与用于估计的统计量两者“同形同构”; (2)简单随机抽样直接从总体抽取个体; (3)简单随机抽样是任何其他概率抽样的核心(任何其他概率抽 样方式都或多或少包含简单随机抽样的成分) (4)容易操作。
随机抽样的形式
随机抽样分为四种形式:放回有序;放回无序;不放回有序;不放回 无序
不放回无序的随机抽样其所有可能样本数是最少的,实际操作最简单, 简称不放回简单随机抽样(SRSWOR)
放回有序的所有可能样本数最多,但理论结果最简单,简称放回简单 随机抽样(SRSWR)
简单随机抽样指不放回简单随机抽样
2.1 定义与符号
总体:(1)具体总体;(2)有限总体; (3)与样本框存在一一对应关系的所谓实查总体或被称为
定义2.3 按照从总体的N个单元中抽取n个单元的所有可能不同的组
合构造所有可能的
CNn个样本数,从
C
n N
个样本随机抽取一个样本,使
每个样本被抽中的概率都等于1 / CNn ,这种抽样称为简单随机抽样。
n
100
400
100
400
N
5 000
5 000 10 000
10 000
示范教案( 简单随机抽样)
诚西郊市崇武区沿街学校第二章统计本章教材分析现代社会是信息化的社会,数字信息随处可见,因此专门研究如何搜集、整理、分析数据的科学——统计学就备受重视.统计学是研究如何搜集、整理、分析数据的科学,它可以为人们制定决策提供根据.在客观世界中,需要认识的现象无穷无尽.要认识某现象的第一步就是通过观察或者者试验获得观测资料,然后通过分析这些资料来认识此现象.如何获得有代表性的观测资料并可以正确地加以分析,是正确地认识未知现象的根底,也是统计所研究的根本问题.本章主要介绍最根本的获取样本数据的方法,以及几种从样本数据中提取信息的统计方法,其中包括用样本估计总体分布、数字特征和线性回归等内容.从义务教育阶段来看,统计知识的教学从小学到初中分为三个阶段,在每个阶段都要学习搜集、整理、描绘和分析数据等处理数据的根本方法,教学目的随着学段的升高逐渐进步.在义务教育阶段的统计与概率知识的根底上,课程标准要求通过实际问题及情境,进一步介绍随机抽样、样本估计总体、线性回归的根本方法,理解用样本估计总体及其特征的思想,体会统计思维与确定性思维的差异;通过实习作业,较为系统地经历数据搜集与处理的全过程,进一步体会统计思维与确定性思维的差异.本章教学时间是是约需7课时,详细分配如下〔仅供参考〕:随机抽样2.1.1简单随机抽样整体设计教学分析教材是以探究一批小包装饼干的卫生是否达标为问题导向,逐步引入简单随机抽样概念.并通过实例介绍了两种简单随机抽样方法:抽签法和随机数法.值得注意的是为了使学生获得简单随机抽样的经历,教学中要注意增加学生理论的时机.例如,用抽签法决定班里参加某项活动的代表人选,用随机数法从全年级同学中抽取样本计算平均身高等等.三维目的1.能从现实生活或者者其他学科中推出具有一定价值的统计问题,进步学生分析问题的才能.2.理解随机抽样的必要性和重要性,进步学生学习数学的兴趣.3.学会用抽签法和随机数法抽取样本,培养学生的应用才能.重点难点教学重点:理解随机抽样的必要性和重要性,用抽签法和随机数法抽取样本.教学难点:抽签法和随机数法的施行步骤.课时安排1课时教学过程导入新课抽样的方法很多,某个抽样方法都有各自的优越性与局限性,针对不同的问题应中选择适当的抽样方法.教师点出课题:简单随机抽样.推进新课新知探究提出问题(1)在1936年美国总统选举前,一份颇有名气的杂志(LiteraryDigest)的工作人员做了一次民意测验.调查兰顿(ndon)(当时任堪萨斯州州长)和罗斯福(F.D.Roosevelt)(当时的总统)中谁将中选下一届总统.为了理解公众意向,调查者通过簿和车辆登记簿上的名单给一大批人发了调查表(注意在1936年和汽车只有少数富人拥有).通过分析收回的调查表,显示兰顿非常受欢迎,于是此杂志预测兰顿将在选举中获胜.实际选举结果正好相反,最后罗斯福在选举中获胜,其数据如下:你认为预测结果出错的原因是什么?由此可以总结出什么教训?〔2〕假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进展卫生达标检验,你准备怎样做?显然,你只能从中抽取一定数量的饼干作为检验的样本.那么,应当怎样获取样本呢?〔3〕请总结简单随机抽样的定义.讨论结果:(1)预测结果出错的原因是:在民意测验的过程中,即抽取样本时,抽取的样本不具有代表性.1936年拥有和汽车的美国人只是一小部分,那时大部分人还很穷.其调查的结果只是富人的意见,不能代表穷人的意见.由此可以看出,抽取样本时,要使抽取出的样本具有代表性,否那么调查的结果与实际相差较大.(2)要对这批小包装饼干进展卫生达标检查,只能从中抽取一定数量的饼干作为检验的样本,用样本的卫生情况来估计这批饼干的卫生情况.假设对这批饼干全部检验,那么费时费力,等检查完了,这批饼干可能就超过保质期了,再就是会破坏这批饼干的质量,导致无法出售.获取样本的方法是:将这批小包装饼干,放入一个不透明的袋子中,搅拌均匀,然后不放回地摸取〔这样可以保证每一袋饼干被抽到的可能性相等〕,这样就可以得到一个样本.通过检验样本来估计这批饼干的卫生情况.这种抽样方法称为简单随机抽样.(3)一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),假设每次抽取时总体内的各个个体被抽到的时机都相等,就把这种抽样方法叫做简单随机抽样.最常用的简单随机抽样方法有两种:抽签法和随机数法.提出问题(1)抽签法是大家最熟悉的,也许同学们在做某种游戏,或者者者选派一部分人参加某项活动时就用过抽签法.例如,高一(2)班有45名学生,现要从中抽出8名学生去参加一个座谈会,每名学生的时机均等.我们可以把45名学生的学号写在小纸片上,揉成小球,放到一个不透明袋子中,充分搅拌后,再从中逐个抽出8个号签,从而抽出8名参加座谈会的学生.请归纳抽签法的定义.总结抽签法的步骤.(2)你认为抽签法有什么优点和缺点?当总体中的个体数很多时,用抽签法方便吗?(3)随机数法是利用随机数表或者者随机骰子或者者计算机产生的随机数进展抽样.我们仅学习随机数表法即利用随机数表产生的随机数进展简单随机抽样的方法.怎样利用随机数表产生样本呢下面通过例子来说明.假设我们要考察某公司消费的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进展检验.利用随机数表抽取样本时,可以按照下面的步骤进展.第一步,先将800袋牛奶编号,可以编为000,001, (799)第二步,在随机数表中任选一个数.例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行.)16227794394954435482173793237887352096438426349164 84421753315724550688770474476721763350258392120676 63016378591695556719981050717512867358074439523879 33211234297864560782524207443815510013429966027954 57608632440947279654491746096290528477270802734328第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉.按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出.这样我们就得到一个容量为60的样本.请归纳随机数表法的步骤.(4)当N=100时,分别以0,3,6为起点对总体编号,再利用随机数表抽取10个号码.你能说出从0开始对总体编号的好处吗?(5)请归纳随机数表法的优点和缺点.讨论结果:(1)一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.抽签法的步骤是:1°将总体中个体从1—N编号;2°将所有编号1—N写在形状、大小一样的号签上;3°将号签放在一个不透明的容器中,搅拌均匀;4°沉着器中每次抽取一个号签,并记录其编号,连续抽取n次;5°从总体中将与抽取到的签的编号相一致的个体取出.(2)抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,假设标号的签搅拌得不均匀,会导致抽样不公平.因此说当总体中的个体数很多时,用抽签法不方便.这时用随机数法.(3)随机数表法的步骤:1°将总体中个体编号;2°在随机数表中任选一个数作为开始;3°规定从选定的数读取数字的方向;4°开始读取数字,假设不在编号中,那么跳过,假设在编号中那么取出,依次取下去,直到取满为止;5°根据选定的号码抽取样本.(4)从0开始编号时,号码是00,01,02,…,99;从3开始编号时,号码是003,004,…,102;从6开始编号时,号码是006,007,…,105.所以以3,6为起点对总体编号时,所编的号码是三位,而从0开始编号时,所编的号码是两位,在随机数表中读数时,读取两位比读取三位要时,所以从0开始对总体编号较好.(5)综上所述可知,简单随机抽样有操作简便易行的优点,在总体个数不多的情况下是行之有效的.但是,假设总体中的个体数很多时,对个体编号的工作量太大,即使用随机数表法操作也并不方便快捷.另外,要想“搅拌均匀〞也非常困难,这就容易导致样本的代表性差.应用例如例1某车间工人加工一种轴一一共100件,为了理解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?分析:简单随机抽样有两种方法:抽签法和随机数表法,所以有两种思路.解法一〔抽签法〕:①将100件轴编号为1,2, (100)②做好大小、形状一样的号签,分别写上这100个号码;③将这些号签放在一个不透明的容器内,搅拌均匀;④逐个抽取10个号签;⑤然后测量这10个号签对应的轴的直径的样本.解法二〔随机数表法〕:①将100件轴编号为00,01,…99;②在随机数表中选定一个起始位置,如取第22行第1个数开始(见教材附录1:随机数表);③规定读数的方向,如向右读;④依次选取10个为68,34,30,13,70,55,74,77,40,44,那么这10个号签相应的个体即为所要抽取的样本.点评:此题主要考察简单随机抽样的步骤.抽签法的关键是为了保证每个个体被抽到的可能性相等而必须搅拌均匀,当总体中的个体无差异,并且总体容量较小时,用抽签法;用随机数表法读数时,所编的号码是几位,读数时相应地取连续的几个数字,当总体中的个体无差异,并且总体容量较多时,用抽签法.变式训练1.以下抽样的方式属于简单随机抽样的有____________.〔1〕从无限多个个体中抽取50个个体作为样本.〔2〕从1000个个体中一次性抽取50个个体作为样本.〔3〕将1000个个体编号,把号签放在一个足够大的不透明的容器内搅拌均匀,从中逐个抽取50个个体作为样本.〔4〕箱子里一一共有100个零件,从中选出10个零件进展质量检验,在抽样操作中,从中任意取出一个零件进展质量检验后,再把它放回箱子.〔5〕福利彩票用摇奖机摇奖.解析:〔1〕中,很明显简单随机抽样是从有限多个个体中抽取,所以〔1〕不属于;〔2〕中,简单随机抽样是逐个抽取,不能是一次性抽取,所以〔2〕不属于;很明显〔3〕属于简单随机抽样;〔4〕中,抽样是放回抽样,但是简单随机抽样是不放回抽样,所以〔4〕不属于;很明显〔5〕属于简单随机抽样.答案:〔3〕〔5〕2.要从某厂消费的30台机器中随机抽取3台进展测试,写出用抽签法抽样样本的过程.分析:由于总体容量和样本容量都较小,所以用抽签法.解:抽签法,步骤:第一步,将30台机器编号,号码是01,02, (30)第二步,将号码分别写在一张纸条上,揉成团,制成号签.第三步,将得到的号签放入不透明的袋子中,并充分搅匀.第四步,从袋子中依次抽取3个号签,并记录上面的编号.第五步,所得号码对应的3台机器就是要抽取的样本.例2人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?解:简单随机抽样的本质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始张,其他各张牌虽然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样.点评:判断简单随机抽样时,要紧扣简单随机抽样的特征:逐个、不放回抽取且保证每个个体被抽到的可能性相等.变式训练如今有一种“够级〞游戏,其用具为四副扑克,包括大小鬼〔又称为花〕在内一一共216张牌,参与人数为6人并坐成一圈.“够级〞开始时,从这6人中随机指定一人从已经洗好的扑克牌中随机抽取一张牌〔这叫开牌〕,然后按逆时针方向,根据这张牌上的数字来确定谁先抓牌,这6人依次从216张牌中抓取36张牌,问这种抓牌方法是否是简单随机抽样?解:在这里只有抽取的第一张扑克牌是随机抽取的,其他215张牌已经确定,即这215张扑克牌被抽取的可能性与第一张扑克牌可能性不一样,所以不是简单随机抽样.知能训练1.为了理解全校240名学生的身高情况,从中抽取40名学生进展测量,以下说法正确的选项是〔〕A.总体是240B.个体C.样本是40名学生D.样本容量是40答案:D2.为了理解所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是〔〕A.总体B.个体C.总体的一个样本D.样本容量答案:C3.一个总体中一一共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,那么某一特定个体被抽到的可能性是____________.1答案:104.为了检验某种产品的质量,决定从40件产品中抽取10件进展检查,如何用简单随机抽样抽取样本?解:方法一〔抽签法〕:①将这40件产品编号为1,2, (40)②做好大小、形状一样的号签,分别写上这40个号码;③将这些号签放在一个不透明的容器内,搅拌均匀;④连续抽取10个号签;⑤然后对这10个号签对应的产品检验.方法二〔随机数表法〕:①将40件产品编号,可以编为00,01,02,…,38,39;②在随机数表中任选一个数作为开始,例如从第8行第9列的数5开始,;③从选定的数5开始向右读下去,得到一个两位数字号码59,由于59>39,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34.至此,10个样本号码已经取满,于是,所要抽取的样本号码是16,19,10,12,07,39,38,33,21,34.拓展提升现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进展质量检验.如何用随机数法设计抽样方案?分析:重新编号,使每个号码的位数一样.解:方法一:第一步,将元件的编号调整为010,011,012,...,099,100, (600)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比方,选第6行第7个数“9〞,向右读.第三步,从数“9”开始,向右读,每次读取三位,凡不在010—600中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到544,354,378,520,384,263.第四步,以上这6个号码所对应的6个元件就是所要抽取的对象.方法二:第一步,将每个元件的编号加100,重新编号为110,111,112,...,199,200, (700)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比方,选第8行第1个数“6〞,向右读.第三步,从数“6〞开始,向右读,每次读取三位,凡不在110—700中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到630,163,567,199,507,175.第四步,这6个号码分别对应原来的530,63,467,99,407,75.这些号码对应的6个元件就是要抽取的对象.课堂小结1.简单随机抽样是一种最简单、最根本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法.2.抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,假设标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法一样,缺点是当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适宜总体容量较小的抽样类型.3.简单随机抽样每个个体入样的可能性都相等,均为N n ,但是这里一定要将每个个体入样的可能性、第n 次每个个体入样的可能性、特定的个体在第n 次被抽到的可能性这三种情况区分开来,防止在解题中出现错误.作业课本本节练习2、3.设计感想本节教学设计以课程标准的要求为指导,重视引导学生参与到教学中,表达了学生的主体地位.同时,根据高考的要求,适当拓展了教材,做到了用教材,而不是教教材.。
第二章(简单随机抽样)
1 ∑ Yi = N i =1
N
∑Y
i =1
N
i
=Y
性质二
对于简单随机抽样,V(y) =
1− f 2 n S , 其中f = ,为抽样比。 n N
证明:
n 1 n 1 2 V(y) E ( y − Y ) = E[ ∑ yi − Y ] = 2 E[∑ ( yi − Y )]2 = n i =1 n i =1 2
引入一个0 引入一个0-1变量
αi
1 i ∈s = 0 i ∉s
n P(αi =1) = = f N
n E(αi ) = E(α ) = N
2 i
n n n n 2 V(αi ) = E(αi ) − E(αi ) = − = (1− ) = f (1− f ) N N N N
| θˆ − θ | P( ≤ µα ) = 1 − α ˆ) S (θ
[θ ± µ S (θˆ)]
α
【例2.3】 例2.3
• 我们从某个N=100的总体中抽出一个大小为 n=10的简单随机样本,要估计总体平均水 平并给出置信度为95%的区间估计。
序号
i
1 4
2 5
3 2
4 0
5 4
6 6
7 6
8 15
序号1 yi 4 2 5 3 2 简单随机样本的指标值 4 5 6 7 2 3 4 5 8 4 9 13 10 6
1 n( N − 1) 2 N −n 2 = S −n S ] = S2 [ n −1 N nN
1− f 2 1− f 1− f 2 2 所以,E[v( y )] = E ( )s = E (s ) = S n n n
• 大样本下,抽样调查估计量渐进正态
第二章 简单随机抽样
尤其是当Cx≈C,只要相关系数ρ>0.5 ,比率估计比简单估计更为 精确
2.4 回归估计量及其性质
2.4.1 回归估计的性质
假如研究发现,Y和X之间存在近似的线性 关系,但这(直)线并不通过Y和X构成的平 面坐标的原点,也就是所谓截距不等于0, 那么这时利用比率估计显然不合适,最好 构造Y对X的线性回归关系进行估计。
第2章 简单随机抽样(SRS)
2.1 2.2 2.3 2.4 2.5 定义及其抽选方法 简单估计量及其性质 比率估计量及其性质 回归估计量及其性质 简单随机抽样的实施
总体均值的简单估计
1 总体均值 Y N
ˆy Y yi n i 1
这样,120头牛现在的平均重量为
ˆ ( X x ) 163 1.368(100 102.6) 159.443. ylr y
习题2.10 (续)
回归估计ylr的方差的估计值为
1 f 2 2 ˆ v( ylr ) s (1 ) n 1 10 120 212.222 (1 0.9712 ) 1.112 10 简单估计y的方差的估计值为
估计该小区平均的文化支出Y , 并给出置信水平95%的置信区间
解:该小区平均的文化支出Y的估计值为
20 1 2890 ˆ Y =y yi 144.5 20 i 1 20 20 1 样本方差计算为 s 2 = ( yi y )2 826.0256 19 i 1
1 f 2 1 20 200 v( y ) s 826.0256 37.1712 n 20
性质1: y是Y的无偏估计, 即 E( y ) Y
1 f 2 n S ,其中,f 称为入样比, 性质2:V ( y ) N n
抽样调查第2章简单随机抽样
有限总体分布估计
了解有限总体指标量的分布情况,即要估计 总体中具有某种特征的个体所占比例,可令
(t Yi ) 10,当,当YYi it;t 则有限总体分布可表示为
1 N
F (t)
N
(t Yi )
i 1
F (t)是量(t Yi )的平均值,可用样本 {(t yi ),i 1,2,, n}的均值来估计
有限总体分布估计
F (t)的估计量为
Fn (t)
1 n
n i 1
(t
yi )
该估计的方差的估计为
v(Fn (t))
1 1 n 1
n N
Fn (t)(1
Fn (t))
Wald-Wolfowitz定理 区间估计 样本量的确定
Wald-Wolfowitz定理
定理2.4.1 设{aN1,, aNN }和{xN1,, xNN }(N 1,2,)是 两个实数序列的集合,满足:对r 3,4及大的N,有
定义2 按照从总体的N个单元抽取n个单元的所有 可能不同组合构造所有可能的CNn个样本,从CNn 个样本随机抽取1个,使每个样本被抽中的概率等 于1/ CNn ,这种抽样成为简单随机抽样。
定义3 从总体的N个单元中,一次整批地抽取n个 单元,使任何一个单元被抽中的概率都相等,任 何n个不同单元组成的组合被抽中的概率也都相 等,这种抽样称为简单随机抽样。
9
6 7
0 3
顶视图
随机数法
u永久随机数法
抽样者给总体的第i个个体赋予一个[0,1]上的 随机数Ri,Ri与第i个个体永久对应,抽样设计时, 确定好抽样比f,Ri<f的对应单元入样。
特点: (1)可保证多次抽样中有大量相同单元; (2)缺点是样本量不完全确定
第二章第一节简单随机抽样
第二章第一节简单随机抽样一、重点难点:1.正确理解随机抽样的概念,会描述抽签法、随机数表法的一般步骤.2.能够根据样本的具体情况选择适当的方法进行抽样.二、知识点讲解:一、简单随机抽样的概念:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。
思考:简单随机抽样的每个个体入样的可能性为多少?(n/N)二、抽签法和随机数法:1、抽签法一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
抽签法的一般步骤:(1)将总体的个体编号;(2)连续抽签获取样本号码.思考:你认为抽签法有什么优点和缺点;当总体中的个体数很多时,用抽签法方便吗?解析:操作简便易行,当总体个数较多时工作量大,也很难做到“搅拌均匀”2、随机数法利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法.怎样利用随机数表产生样本呢?下面通过例子来说明,假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,可以按照下面的步骤进行。
第一步,先将800袋牛奶编号,可以编为000,001, (799)第二步,在随机数表中任选一个数,例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行)。
16 22 77 94 39 49 54 43 54 82 17 37 93 23 7884 42 17 53 31 57 24 55 06 88 77 04 74 47 6763 01 63 78 59 16 95 55 67 19 98 10 50 71 7533 21 12 34 29 78 64 56 07 82 52 42 07 44 3857 60 86 32 44 09 47 27 96 54 49 17 46 09 6287 35 20 96 43 84 26 34 91 6421 76 33 50 25 83 92 12 06 7612 86 73 58 07 44 39 52 38 7915 51 00 13 42 99 66 02 79 5490 52 84 77 27 08 02 73 43 28第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉,按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出,这样我们就得到一个容量为60的样本。
《抽样技术》第二章-简单随机抽样
1
f
公式V y S 2 1 f 的说明
n
(1)V y 主要取决于S 2和n,与f 关系不大;
(2)当f n 5%时,1 f 可忽略,即V y S 2 ;
N
n
(3)V y S 2 1 f 2 N n 放回时的V y 2 。
n
n N 1
n
❖ 推论2 y 的标准误
Xi——第i个家庭的成年女子数 Yi——第i个家庭成年女子化妆品的总费用 i=1,2,⋯,N
每个成年女子化妆品的平均费用为
N
总的费用 R 总的成年女子数
Yi
i1 N
Xi
Y X
Y X
i1
比率的例子
❖ (3)在某住宅小区的房价调查中,要估计该小区的平 均房屋单价。令
Xi——第i套住宅的建筑面积 Yi——第i套住宅的市场价格 i=1,2,⋯,N
1, 1
2, 3
3, 4
4, 5
1, 2
2, 4
3, 5
1, 3
2, 5
1, 4
二、简单随机抽样的抽选
❖ 首先将容量为N的有限总体中的所有单元从1 到N编好号码,然后从这N个编号中抽取n个。
❖ 具体的抽取方式一般有: (1)抽签法; (2)随机数表法; (3)计算机产生伪随机数法。
随机数表法
❖ 随机数表是由0, 1, 2, ⋯, 9这十个数字组成的,书中 表3.2给出了由2500个一位数字组成的随机数表。这 个随机数表是这样产生的:在这2500个位置上分别 独立地做一次等可能地产生0, 1, 2, ⋯, 9的随机试验。 因此,在任意一个位置上0~9这十个数字出现的可 能性都相同,在任意两个位置上00~99这一百个数 字出现的可能性也都是相同的,在任意三个位置上 000~999这一千个数字出现的可能性也都是相同的, 依次类推。
简单随机抽样PPT教学课件
2.1 随机抽样
2.1.1 简单随机抽样
2020/12/10
1
问题提出
t
p
1 2
5730
1.我们生活在一个数字化时代,时 刻都在和数据打交道,例如,产品的合 格率,农作物的产量,商品的销售量, 电视台的收视率等.这些数据常常是通 过抽样调查而获得的,如何从总体中抽 取具有代表性的样本,是我们需要研究 的课题.
2020/12/10
16
理论迁移
例1 为调查央视春节联欢晚会的收 视率,有如下三种调查方案: 方案一:通过互联网调查. 方案二:通过居民小区调查. 方案三:通过电话调查. 上述三种调查方案能获得比较准确的收 视率吗?为什么?
2020/12/10
17
例2 为了检验某种产品的质量,决 定从40件产品中抽取10件进行检查,试 利用简单随机抽样法抽取样本,并简述 其抽样过程.
思考2:从6件产品中随机抽取一个容量
为3的样本,可以分三次进行,每次从中
随机抽取一件,抽取的产品不放回,这
叫做逐个不放回抽取.在这个抽样中,某
一2件020/12产/10 品被抽到的概率是多少?
5
思考3:一般地,从N个个体中随机抽取 n个个体作为样本,则每一个个体被抽 到的概率是多少?
思考4:食品卫生工作人员,要对校园食
2.简单随机抽样有操作简便易行的 优点,在总体个数较小的情况下是行之 有效的抽样方法.
3. 抽签法和随机数表法各有其操作步
骤,首先都要对总体中的所有个体编号,
编202号0/12/1的0 起点不是惟一的.
2020/12/10
7
思考5:根据你的理解,简单随机抽样有 哪些主要特点?
(1)总体的个体数有限;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章简单随机抽样
§2.1 引言
§2.2 估计量
§2.3 样本量的确定§2.4 其他问题
§2.1 引言
➢简单随机抽样也称为纯随机抽样.从抽样框内的N个抽样单元中随机地、逐个抽取n个单元组成样本,在每次抽选时,总体中每个单元入样的概率都相等,这n个被抽中的单元就构成了简单随机样本。
➢简单随机样本也可以从总体中一次取得全部n 个单元,要求全部可能的样本每种样本被抽得的概率都相等。
➢放回抽样与不放回抽样
⏹抽选方法
➢抽签法
当总体不大时,可以用均匀同质的材料制
作N个签,将其充分混合,然后一次抽取n个签,或一次抽取一个签但不放回,接着抽下一个签直到第n个签为止,则这n个签上所示的号码
表示入样的单元号。
➢随机数法
当总体较大时,抽签法实施起来很困难,这时可以利用随机数表、随机数骰子、计算机产生的伪随机数进行抽样。
※随机数表
随机数表是由数字0,1,…,9组成的表,每个数字都有同样的机会被抽中。
常用的做法:根据总体大小N的位数决定在随机数表中随机抽取几列,如N=678,要取n=5的样本,则在随机数表中随机抽取3列,顺序往下,选出头5个001~678之间互不相同的数,如果这3列随机数字不够,可另选其他3列继续,直到抽满n个单元为止。
※随机数骰子
随机数骰子是由均匀材料制成的正20面体,面上标有0~9的数字各2个。
我国“运筹”牌随机数骰子一盒有6个不同颜色的骰子,使用时,根据总体大小N的位数,如N=327的位数是3,则将3个不同颜色的骰子放入盒中,并规定
每种颜色所代表的位数,如红色代表个位数,蓝色代表十位数,黄色代表百位数等,盖上盒盖,摇动盒子,使骰子充分旋转,然后打开盒盖,读出骰子所表示的数字,重复上述步骤,直到产生n个不同的随机数。
※计算机产生伪随机数
不少统计软件都有现成的产生随机数的程序,利用计算机产生的随机数具有快捷、方便的特点,但需要注意的事,利用计算机产生的随机数是伪随机数,并不能保证其随机性。
例2.5:某超市开张一段时间之后,为改进销售服务环境,欲调查附近几个小区居民到该超市购物的满意度。
该超市与附近几个小区居民委员会取得联系,在总体中按简单随机抽样抽取了一个大小为n = 200人的样本。
调查发现对该超市购物环境表示满意或基本满意的居民有130位,要估计对该超市购物环境持肯定态度居民的比例,并在置信度为95%条件下,给出估计的绝对误差和置信区间。
假定这时的抽样比可以忽略。
§1.3 样本量的确定
样本量的确定在抽样调查中是一个十分重要又比较复杂的问题,它受到调查精度以及调查费用的限制。
费、礼品费等。
费用,如调查费、差旅一个样本单元所需的
的可变费用,即每调查为与样本量有关;些费用都与样本量无关织宣传等费用等,这
人员开支、办公费、组为固定费用,如管理为总费用,式中,,设费用函数为:
在简单随机抽样情况下1
1
0c c C n c c C += 费用函数
➢如果deff<1,则所考虑的抽样设计比简单随机抽样的效率高;
➢如果deff>1,则所考虑的抽样设计比简单随机抽样的效率低。
deff n n deff n deff ⨯'=':
,本量为那么复杂抽样所需的样抽样的到,如果可以估计复杂比较容易得机抽样所需的样本量定精度条件下,简单随量有很大的作用,在一对复杂抽样时确定样本。