分层随机抽样(答案)
9.1.2分层随机抽样课件(人教版)
新知探索
在实际抽样调查中,由于实际问题的复杂性,除了要考虑获得的样本的代表性
,还要考虑调查实施中人力、物力、时间等因素,因此通常会把多种抽样方法组合
起来使用.例如,在分层抽样中,不同的层内除了用简单随机抽样外,还可以用其他
的抽样方法,有时层内还需要再进行分层,等等.
思考2:如果想要了解某电视节目在你所在的地区(城市、乡镇或村庄)的收视率,
例3.随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层
的样本量为30,样本平均数为8,则该样本的平均数为_____.
答案:6.
20
30
ഥ=
×3+
× 8 = 6.
20 + 30
20 + 30
练习
方法技巧:
进行分层随机抽样的相关计算时,常用到的3个关系
(1)
样本容量
该层抽取的个体数
答案:×,×,×.
)
新知探索
辨析2:某校高三一班有学生54人,二班有学生42人,现在要用分层随机抽样的
方法从两个班抽取16人参加军训表演,则一班和二班分别被抽取的人数是(
A.9,7
答案:A.
B.10,6
C.8,8
D.12,4
).
练习
题型一:分层随机抽样的概念
例1.下列问题中,最适合用分层随机抽样抽取样本的是(
可以计算出男生、女生中分别应抽取的人数为:
326
386
男 =
× 50 ≈ 23,女 =
× 50 ≈ 27.
712
712
我们按上述方法抽取了一个容量为50的样本,其观测数据(单位:)如下:
男生
173.0
分层抽样(计算详解)
实验题目:1、某居委会辖有三个居民新村,居委会欲对居民购买彩票的情况进行调查。
调查者考虑以新村分层,在每个新村中随机抽取了10个居民户并进行了调查每户最近一个月购买彩票花费的金额(元),下表为每个新村及调查的情况:请估计该小区居民户购买彩票的平均支出,并给出估计的标准差。
给出95%的置信区间,并与简单随机抽样进行精度比较。
2、随着经济发展,某市居民正在悄悄改变过年的习惯,虽然大多数居民除夕夜在家吃年夜饭、看电视节目,但是有些家庭到饭店吃年夜饭,或逛夜市,或用过年的假期到外地旅游。
为研究这种现象,某研究机构以市中心165万居民户作为研究对象,将居民户按6个行政区分层,每个行政区随机抽取了30户居民户进行了调查(各层抽样比可以忽略),每个行政区的情况以及在家吃年夜饭、看电视节目的居民户比例如下表:试估计该市居民在家吃年夜饭的比例,并给出估计的标准差。
9.030273011===a p933.030283022===a p9.030273033===a p 867.030263044===a p933.030283055===a p 967.030293066===a p867.0*09.09.0*14.0933.0*21.09.0*18.0+++==∑pw p hHhst923.0967.0*22.0933.0*16.0≈++06.0*933.0*301*1.0*9.0*301*)1(1)(ˆ21.018.0222+=--=∑p p nf w p hhhhhhstV067.0*933.0*301*133.0*867.0*301*1.0*9.0*301*16.009.014.0222+++838.322.042033.0*967.0*301*-=+P:[)(ˆ96.1p pststV±]=[0.923±1.96*838.34-]=[0.866,0.979]。
6.4.2 分层随机抽样的均值与方差
【问题2】在分层随机抽样中各层抽查的个数不一样,如何求样本的平均数呢?
【答案】分层随机抽样的平均数可以先分层求平均数,再求样本的平均数.
02
问题情境
甲、乙两位同学相约晚上在某餐馆吃饭,他们分别在
A,B两个网站查看同一家餐馆的好评率,甲在网站A
查到好评率98%,而乙在网站B查到好评率是85%,综
合考虑这两个网站的信息,应该如何得到这家餐馆的
总好评率?
【解析】好评率是由好评人数除以总评价人数得到的.98%的好评率意味
Байду номын сангаас
着如果有100个人评价,那么其中98人给了好评.
设在网站A评价该餐馆的人数为n1,其中给出好评的人数为m1,在网站B
m1
评价该餐馆的人数为n2,其中给出好评的人数为m2,由题目条件,n
1
m2
55585%.
n2
98%,
问题情境
综合A,B两个网站的信息,这家餐馆的好评率应该为
化简得
其中
0.98n1 0.85n2
n1
n2
0.98
0.85
n1 n2
n1 n2
n1 n2
n1
n2
和
n1 n2 n1 n2
m1 m2
n1 n2
,
分别是各自的权重,总好评率等于相应
的好评率与其权重乘积的和.
所以除非再知道A,B两个网站评价人数的比例关系,否则并
方差为360.那么甲、乙两班全部90名同学的平均成绩和方差分
别是多少?
解
设甲班50名同学的成绩分别为a1,a2,⋯,a50,那么甲班的
平均成绩、权重和方差分别是
2
简单随机抽样系统抽样分层抽样含答案
2.1.1 简单随机抽样、系统抽样、分层抽样1.简单随机抽样的定义设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的分类简单随机抽样⎩⎨⎧ 抽签法随机数法3.简单随机抽样的优点及适用类型 简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的.4.系统抽样的概念先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本.5.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本,步骤为:(1)先将总体的N个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等.(2)确定分段间隔k,对编号进行分段.当Nn(n是样本容量)是整数时,取k=Nn ;(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.6.分层抽样的概念在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.7.分层抽样的适用条件分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.一、选择题1.抽签法中确保样本代表性的关键是( )A.制签B.搅拌均匀C.逐一抽取D.抽取不放回答案 B 解析由于此问题强调的是确保样本的代表性,即要求每个个体被抽到的可能性相等.所以选B.2.下列抽样实验中,用抽签法方便的有( )A.从某厂生产的3 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D.从某厂生产的3 000件产品中抽取10件进行质量检验答案B解析A总体容量较大,样本容量也较大不适宜用抽签法;B总体容量较小,样本容量也较小可用抽签法;C中甲、乙两厂生产的两箱产品有明显区别,不能用抽签法;D总体容量较大,不适宜用抽签法.3.为调查参加运动会的1 000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是( )A.1 000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是100答案 D 解析:此问题研究的是运动员的年龄情况,不是运动员,故A、B、C错,故选D.4.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性,“第二次被抽到”的可能性分别是( )A.110,110B.310,15C.15,310D.310,310答案A5.某会议室有50排座位,每排有30个座位.一次报告会坐满了听众.会后留下座号为15的所有听众50人进行座谈.这是运用了( )A.抽签法B.随机数表法C.系统抽样D.有放回抽样答案C解析从第1排到第50排每取一个人的间隔人数是相同的,符合系统抽样的定义.6.要从已经编号(1~50)的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射试验,用系统抽样方法确定所选取的5枚导弹的编号可能是( )A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,32答案B解析由题意知分段间隔为10.只有选项B中相邻编号的差为10,选B.7.有40件产品,其中一等品10件,二等品25件,次品5件,现从中抽出8件进行质量分析,问应采取何种抽样方法( )A.抽签法B.随机数表法C.系统抽样D.分层抽样答案D8.某城市有学校700所.其中大学20所,中学200所,小学480所,现用分层抽样方法从中抽取一个容量为70的样本,进行某项调查,则应抽取中学数为( )A.70 B.20 C.48 D.2答案B由于70070=10,即每10所学校抽取一所,又因中学200所,所以抽取200÷10=20(所).9.下列问题中,最适合用分层抽样方法抽样的是( )A.某电影院有32排座位,每排有40个座位,座位号是1~40.有一次报告会坐满了听众,报告会结束以后为听取意见,要留下32名听众进行座谈B.从10台冰箱中抽出3台进行质量检查C.某乡农田有山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩,现抽取农田480亩估计全乡农田平均产量D.从50个零件中抽取5个做质量检验答案C解析A的总体容量较大,宜采用系统抽样方法;B的总体容量较小,用简单随机抽样法比较方便;C总体容量较大,且各类田地的产量差别很大,宜采用分层抽样方法;D与B类似.10.要从其中有50个红球的1 000个球中,采用按颜色分层抽样的方法抽取100个进行分析,则应抽取红球的个数为( )A.5个B.10个C.20个D.45个答案A解析由题意知每1000100=10(个)球中抽取一个,现有50个红球,应抽取5010=5(个).11.在简单随机抽样中,某一个个体被抽到的可能性( )A.与第几次抽样有关,第一次抽到的可能性大一些B.与第几次抽样无关,每次抽到的可能性相等C.与第几次抽样有关,最后一次抽到的可能性大些D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不同答案B解析由简单随机抽样的特点知与第n次抽样无关,每次抽到的可能性相等.二、填空题12.福利彩票的中奖号码是从1~36个号码中选出7个号码来按规则确定中奖情况,这种从36个号码中选7个号码的抽样方法是________.答案抽签法13.用随机数表法进行抽样,有以下几个步骤:①将总体中的个体编号;②获取样本号码;③选定随机数表开始的数字,这些步骤的先后顺序应该是________.(填序号)答案①③②14.某班级共有学生52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号同学在样本中,那么样本中还有一个同学的学号为________.答案16解析用系统抽样的方法是等距离的.42-29=13,故3+13=16.15.某农场在三种地上种玉米,其中平地210亩,河沟地120亩,山坡地180亩,估计产量时要从中抽取17亩作为样本,则平地、河沟地、山坡地应抽取的亩数分别是________.答案7,4,6解析应抽取的亩数分别为210×17510=7,120×17510=4,180×17510=6.16.将一个总体分为A、B、C三层,其个体数之比为5∶3∶2.若用分层抽样方法抽取容量为100的样本,则应从C中抽取________个个体.答案20解析由题意可设A、B、C中个体数分别为5k,3k,2k,所以C中抽取个体数为2k5k+3k+2k×100=20.17.某工厂生产A、B、C、D四种不同型号的产品,产品数量之比依次为2∶3∶5∶1.现用分层抽样方法抽出一个容量为n的样本,样本中A种型号有16件,那么此样本的容量n为________.答案88解析在分层抽样中,每一层所抽的个体数的比例与总体中各层个体数的比例是一致的.所以,样本容量n=2+3+5+12×16=88.。
第三章分层随机抽样作业答案
P111 3.6 样本量应该满足:
在Nh-1≈Nh的条件下,
而其中每层的吃年夜饭的样本比例的方差的估计值为: p 1 p 1 f N n h hn h h hh v p p 1 p h h h n 1 N n 1 hn h h h
则样本比例的方差的估计值为:
6 2 h 6 2 h
p 1 p h h v p W v p W 1 f s t h h n 1 h 1 h 1 h
把相应的数值代入计算可得方差的估计值为v(pst)=3.9601×10-4,
从而可以得到该估计值的标准差为:s(pst)=0.0199。
(2)样本容量的确定
n2 = 0.2028 × 2568 = 520.7904 ≈ 521
n3 = 0.1625 × 2568 = 417.3000 ≈ 417 n4 = 0.1184 × 2568 = 304.0512 ≈ 304 n5 = 0.1544 × 2568 = 396.4992 ≈ 396 n6 = 0.1529 × 2568 = 392.6472 ≈ 393
P110 3.4 ∵ n0/N=2568/1650000=0.00156<0.05 ∴ 不需要修正 按内曼分配,样本量 n = 2568
w h
W 1 ph ) hp h(
w1= 0.0540/0.2584 = 0.2090
W p (1 p )
h1 h h h
k
w2= 0.0524/0.2584 = 0.2028
P110 3.5 解:总体总共分为10个层,每个层中的样本均值已经知道, 层权也得到,从而可以计算得到该开发区居民购买冷冻 食品的平均支出的估计值为: y st
《分层随机抽样》教学设计、导学案、同步练习
《9.1.2 分层随机抽样》教学设计【教材分析】本节《普通高中课程标准数学教科书-必修二(人教A版)第九章《9.1.2 分层抽样》,本节的主要内容在本章的结构上,通过大背景的“串联”,从大背景中不断提出新问题,从而通过问题链进行探究学习,合理选择抽样方法的必要性并掌握分层抽样方法。
从而发展学生的直观想象、逻辑推理、数学建模的核心素养。
【教学目标与核心素养】1.数学建模:结合实际问题情景,理解分层抽样的必要性和重要性;2.逻辑推理:学会用分层抽样的方法从总体中抽取样本;3.直观想象:对简单随机抽样、分层抽样方法进行比较,揭示其相互关系.4.数学运算:总体平均数的估计方法【教学重点】:理解分层抽样的基本思想和适用情形..【教学难点】:掌握分层抽样的实施步骤,会计算总体平均数.【教学过程】抽样调查最核心的问题是样本的代表性,简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比较“极端”的样本,二、问题探究例如,在对树人中学高一年级学生身高的调查中,可能出现样本中50个个体大部分来自高个子或矮个子的情形,这种“极端”样本的平均数会大幅度地偏离总体平均数,从而使得估计出现较大的误差.能否利用总体中的一些额外信息对抽样方法进行改进呢?在对树人中学高一年级学生身高的调查中,采取简单随机抽样的方式抽取了50名学生。
1.抽样调查最核心的问题是什么?2.会不会出现样本中 50 个个体大部分来自高个子或矮个子的情形?3.为什么会出现这种“极端样本”?4.如何避免这种“极端样本”?样本代表性;会;抽样结果的随机性个体差异较大;分组抽样,减少组内差距在树人中学高一年级的 712 名学生中,男生有 326 名、女生有 386 名。
样本量在男生、女生中应如何分配?假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?80604020你认为哪些因素影响学生视力?抽样要考虑哪些因素?分层抽样每一层抽取的样本数=一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样(stratified random sampling),每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.×总样本量做一做1.下列问题中,最适合用分层抽样抽取样本的是( )A.从10名同学中抽取3人参加座谈会B.某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本C.从1 000名工人中,抽取100名调查上班途中所用时间D .从生产流水线上,抽取样本检查产品质量【解析】A 中总体个体无明显差异且个数较少,适合用简单随机抽样;C 和D 中总体个体无明显差异且个数较多,适合用系统抽样;B 中总体个体差异明显,适合用分层抽样. 【答案】 B2.某公司生产三种型号的轿车,产量分别是1 200辆,6 000辆和2 000辆,为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取________辆、________辆、________辆. 【解析】 三种型号的轿车共9 200辆,抽取样本为46辆,则按469 200=1200的比例抽样,所以依次应抽取1 200×1200=6(辆),6 000×1200=30(辆),2 000×1200=10(辆).【答案】 6 30 10 1.分层抽样的步骤2.分层抽样的特点有哪些?【提示】 (1)分层抽样适用于已知总体是由差异明显的几部分组成的;(2)分成的各层互不交叉;(3)各层抽取的比例都等于样本容量在总体中的比例,即nN,其中n 为样本容量,N 为总体容量.3. 计算各层所抽取个体的个数时,若N i ·n N的值不是整数怎么办?【提示】 为获取各层的入样数目,需先正确计算出抽样比n N ,若N i ·nN 的值不是整数,可四舍五入取整,也可先将该层等可能地剔除多余的个体. 探究3 分层抽样公平吗?第1层的总体平均数和样本平均数为:第2层的总体平均数和样本平均数为:总体平均数和样本平均数为:由于用第一层的样本平均数 可以估计第1层的总体平均数 ,第二层的样本平均数 可以估计第2层的总体平均数,因此我们可以用估计总体平均数对各层样本平均数加权(层权)求和;分层随机抽样如何估计总体平均数12m...==X X X X M++11Mii XM =∑12...m x x x x m++==11mi i x m =∑12N ...==Y Y Y Y N++11Ni i Y N =∑12...m y y y y n++==11mi i y n =∑11M Niii i X YM X NY M NW X Y M NM N M N M N==++===+++++∑∑11m ni ii i x ymx ny m nx y m nm n m n m nω==++===+++++∑∑x X y Y Mx Ny M Nx y M N M N M N+=++++W 11M Ni ii i x yw m n==+=+∑∑m nx y m n m n=+++=m n m n M N M N +=+M m M N m n =++N n M N m n =++M Nx y M N M N=+++到男生女生平均身高分别为170.2cm和160.8cm。
抽样技术练习题及答案
习题一1.请列举一些你所了解的以及被接受的抽样调查。
2.抽样调查基础理论及其意义;3.抽样调查的特点。
4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值y与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。
习题二一判断题1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。
2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。
3 抽样单元与总体单元是一致的。
4 偏倚是由于系统性因素产生的。
5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。
6 偏倚与抽样误差一样都是由于抽样的随机性产生的。
7 偏倚与抽样误差一样都随样本量的增大而减小。
8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。
9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。
10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。
11 一个抽样设计方案比另一个抽样设计方案好,是因为它的估计量方差小。
12 抽样误差在概率抽样中可以对其进行计量并加以控制,随着样本量的增大抽样误差会越来越小,随着n越来越接近N,抽样误差几乎可以消除。
分层随机抽样 练习(1)(解析版)
9.1.2 分层随机抽样一、选择题1.分层随机抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体等可能抽样,必须进行()A.每层等可能抽样B.每层可以不等可能抽样C.所有层按同一抽样比等可能抽样D.所有层抽取的个体数量相同【答案】C【解析】保证每个个体等可能入样是三种基本抽样方式的共同特征,为了保证这一点,分层随机抽样时必须在所有层都按同一抽样比等可能抽取.故选:C2.某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为100、200、300、400件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丁种型号的产品中抽取()件.A.24B.18C.12D.6【答案】A【解析】设应从丁种型号的产品中抽取x件,由分层抽样的基本性质可得60 400100200300400x=+++,解得24x=.故选:A.3.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上(包括50岁)的人,用分层随机抽样的方法从中抽取20人,各年龄段分别抽取的人数为()A.7,5,8B.9,5,6C.6,5,9D.8,5,7【答案】B【解析】由于样本量与总体个体数之比为2011005=,故各年龄段抽取的人数依次为14595⨯=,12555⨯=,20956--=.故选:B4.已知某地区中小学生人数和近视情况分别如图1和如图2所示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A .100,20B .200,20C .100,10D .200,10【答案】B【解析】由题意知,样本容量为()3500450020002%200++⨯=,其中高中生人数为20002%40⨯=,高中生的近视人数为4050%20⨯=,故选B.5.(多选题)我校有高一学生850人,高二学生900人,高三学生1200人,学校团委欲用分层抽样的方法抽取30名学生进行问卷调查,则下列判断错误的是( )A .高一学生被抽到的概率最大B .高二学生被抽到的概率最大C .高三学生被抽到的概率最大D .每名学生被抽到的概率相等 【答案】ABC【解析】由抽样的定义知,无论哪种抽样,样本被抽到的概率都相同,故每名学生被抽到的概率相等,故选ABC .6.(多选题)某单位有老年人28人、中年人54人、青年人81人,为了调查他们的身体状况,从中抽取一个容量为36的样本,则不适合抽取样本的方法是( ) A .随机数表法 B .抽签法C .简单随机抽样D .先从老年人中剔除1人,再用分层抽样【答案】ABC【解析】因为总体是由差异明显的三部分组成,所以考虑用分层抽样. 因为总人数为285481163++=,样本容量为36,由于按36163抽样,无法得到整数解,因此考虑先剔除1人,将抽样比变为3621629=. 若从老年人中随机地剔除1人,则老年人应抽取22769⨯=(人),中年人应抽取254129⨯=(人),青年人应抽取281189⨯=(人),从而组成容量为36的样本.二、填空题7.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区有10个特大型销售点,要从中抽取7个销售点调查其销售收入和售后服务等情况,记这项调查为②,则完成①②这两项调查宜采用的抽样方法分别为_____. 【答案】分层随机抽样、简单随机抽样【解析】由调查①可知个体差异明显,故宜用分层随机抽样;调查②中个体较少,且个体没有明显差异,故宜用简单随机抽样.8.防疫站对学生进行身体健康调查,采用分层抽样法抽取,泗县一中高三有学生1600人,抽取一个容量为200的样本,已知女生比男生少抽10人,则该校的女生人数应该有 . 【答案】760【解析】设学校有女生x 人,∵ 对全校男女学生共1600名进行健康调查, 用分层抽样法抽取一个容量为200的样本,∴ 每个个体被抽到的概率是200116008=, 根据抽样过程中每个个体被抽到的概率相等,∵女生比男生少抽了10人,且共抽200人, ∴女生要抽取95人,∴女生共有1957608÷= 9.某高中在校学生2000人.为了响应“阳光体育运动”号召,学校举行了跑步和登山比赛活动.每人都参加而且只参与了其中一项比赛,各年级参与比赛人数情况如表:其中a :b :2c =:3:5,全校参与登山的人数占总人数的35,为了了解学生对本次活动的满意程度,现用分层抽样方式从中抽取一个100个人的样本进行调查,则高二年级参与跑步的学生中应抽取 人 【答案】12【解析】根据题意可知样本中参与跑步的人数为2100405⨯=人,所以高二年级参与跑步的学生中应抽取的人数为3401210⨯=人. 10.小玲家的鱼塘里养了2500条鲢鱼,按经验,鲢鱼的成活率约为80%.现准备打捞出售,为了估计鱼塘中鲢鱼的总质量,从鱼塘中捕捞了3次进行统计,得到的数据如下表:那么,鱼塘中鲢鱼的总质量约是______kg. 【答案】3600【解析】平均每条鱼的质量为()20 1.610 2.210 1.81.8kg 201010⨯+⨯+⨯=++因为成活的鱼的总数约为2500×80%=2000(条) 所以总质量约是()2000 1.83600kg ⨯= 三、解答题11.举例说明简单随机抽样和分层随机抽样两种抽样方法中,无论使用哪种抽样方法,总体中的每个个体被抽到的概率都相等. 【答案】见解析.【解析】袋中有160个小球,其中红球48个,篮球64个,白球16个,黄球32个,从中抽取20个作为一个样本.(1)使用简单随机抽样:每个个体被抽到的概率为2011608=. (2)使用分层随机抽样:四种球的个数比为3:4:1:2.红球应抽320610⨯=个;篮球应抽420810⨯=个;白球应抽120210⨯=个;黄球应抽220410⨯=个. 因为68241486416328====, 所以按颜色区分,每个球被抽到的概率也都是18.所以简单随机抽样和分层随机抽样两种抽样方法中,无论使用哪种抽样方法,总体中的每个个体被抽到的概率都相等.12.某单位2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人? 【答案】(1) 老年4人,中年12人,青年24人 (2) 用分层抽样(3) 系统抽样【解析】试题分析:(1)用分层抽样方法从老年人、中年人和青年人中抽取对应的人数即可;(2)用分层抽样法从管理层、技术开发部、营销部以及生产部抽取对应的人数即可;(3)用分层抽样方法从老年人、中年人和青年人中抽取对应的人数即可解析:(1)用分层抽样,并按老年4人,中年12人,青年24人抽取.(2)用分层抽样,并按管理2人,技术开发4人,营销6人,生产13人抽取.。
分层随机抽样(答案)工科
分层随机抽样一、单选题1、分层抽样设计效应满足(B )A 、1deff =B 、1deff <C 、1deff ≈D 、1deff > 2、分层抽样的特点是(A )A 、层内差异小,层间差异大B 、层间差异小,层内差异大C 、层间差异小D 、层内差异大3、下面的表达式中错误的是(D ) A 、∑=1hfB 、∑=n n hC 、∑=1h WD 、∑=1h N4、在给定费用下估计量的方差)(st y V 达到最小,或者对于给定的估计量方差V 使得总费用达到最小的样本量分配称为(C )A 、常数分配B 、比例分配C 、最优分配D 、奈曼分配5、最优分配(opt V )、比例分配(prop V )的分层随机抽样与相同样本量的简单随机抽样(srs V )的精度之间的关系式为(A )A 、srs prop opt V V V ≤≤B 、srs opt prop V V V ≤≤C 、srs opt prop V V V ≥≥D 、opt prop srs V V V ≤≤ 6、下面哪种样本量分配方式属于比例分配?( A)A 、N nN n h h = B 、hLh hhh h h h c S Nc S N nn ∑==1C 、∑==L h h h h h h S N S N n n 1D 、∑==L h hh h h h S W S W nn 17、下面哪种样本量分配属于一般最优分配?( B)A 、N nN n h h = B 、hLh hhh h h h c S Nc S N nn ∑==1C 、∑==L h h h h h h S N S N n n 1D 、∑==L h hh h h h S W S W nn 1二、多选题1.分层抽样又被称为( BC )A. 整群抽样B. 类型抽样C. 分类抽样D. 系统抽样E. 逆抽样 2.在分层随机抽样中,当存在可利用的辅助变量时,为了提高估计精度,可以采用( BCD ) A. 分层比估计 B. 联合比估计 C. 分别回归估计 D.联合回归估计 E. 分别简单估计 3.样本量在各层的分配方式有( ABCD )A. 常数分配B. 比例分配C. 最优分配D. 奈曼分配E. 等比分配 4.分层抽样的优点有( ABCDE )A. 在调查中可以对各个子总体进行参数估计B. 易于分工组织及逐级汇总C. 可以提高估计量的精度D. 实施方便E. 保证样本更具有代表性 5.关于分层数的确定,下面说法正确的有( CE )A. 层数多一些比较好B. 层数少一些比较好C. 层数一般以不超过6为宜D. 层数一般以4 层为最好E. 应该充分考虑费用和精度要求等因素来确定层数 6.下面哪种样本量分配方式属于奈曼分配? ( CD ) A.h h n nN N =B. 1/h h h h n nN S ==∑ C. 1k h h L h h h n N S n N S ==∑D.1h h h L h h h n W S n W S ==∑E. 1/h h h h nnW S ==∑ 7.事后分层的适用场合有(ABCD )A. 各层的抽样框无法得到B. 几个变量都适宜于分层,而要进行事先的多重交叉分层存在一定困难C. 一个单位到底属于哪一层要等到样本数据收集到以后才知道D. 总体规模太大,事先分层太费事E. 一般场合都可以适用 三、名次解释1. 分层随机抽样2. 自加权3. 最优分配 四、简答题1. 简述分层随机抽样相对于简单随机抽样的优点。
1简单随机抽样、系统抽样、分层抽样含答案
2。
1。
1简单随机抽样、系统抽样、分层抽样1.简单随机抽样的定义设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的分类简单随机抽样错误!3.简单随机抽样的优点及适用类型简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的.4.系统抽样的概念先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本.5.系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本,步骤为:(1)先将总体的N个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等.(2)确定分段间隔k,对编号进行分段.当错误!(n是样本容量)是整数时,取k=错误!;(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加k 得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.6.分层抽样的概念在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.7.分层抽样的适用条件分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.一、选择题1.抽签法中确保样本代表性的关键是()A.制签B.搅拌均匀C.逐一抽取D.抽取不放回答案 B 解析由于此问题强调的是确保样本的代表性,即要求每个个体被抽到的可能性相等.所以选B。
2.下列抽样实验中,用抽签法方便的有()A.从某厂生产的3 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D.从某厂生产的3 000件产品中抽取10件进行质量检验答案B解析A总体容量较大,样本容量也较大不适宜用抽签法;B总体容量较小,样本容量也较小可用抽签法;C中甲、乙两厂生产的两箱产品有明显区别,不能用抽签法;D总体容量较大,不适宜用抽签法.3.为调查参加运动会的1 000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是()A.1 000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是100答案 D 解析:此问题研究的是运动员的年龄情况,不是运动员,故A、B、C错,故选D.4.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到"的可能性,“第二次被抽到"的可能性分别是()A。
分层随机抽样(人教A版2019 必修第二册)
)
B.每层可以不等可能抽样
C.所有层按同一抽样比等可能抽样
D.所有层抽取的个体数量相同
【解析】(1)总体由差异明显的三部分构成,应选用分层随机抽样法.
(2)保证每个个体等可能的被抽取是三种基本抽样方式的共同特征,为了保证这一点,分层随机抽样时必
须在所有层都按同一抽样比等可能抽取.
【答案】(1)D (2)C
重点、难点
1.重点:正确理解分层抽样的定义,灵活应用分层抽样抽取样本。
2.难点:恰当的选择两种抽样方法解决现实生活中的抽样问题
(一)新知导入
某市为调查中小学生的近视情况,在全市范围内对小学生、初中生、高
中生三个群体抽样,进而了解中小学生的总体情况和三个群体近视情况
的差异大小.
【问题】
1.上述问题中总体有什么特征?
答案:1.C
2.C
3.40
4.40
(五)课堂小结
知识总结
学生反思
(1)通过这节课,你学到了什么知识?
(2)在解决问题时,用到了哪些数学思想?
作业布置
完成教材—— 第182页 练习
第1,2,3,4题
第189页 习题9.1 第5,7题
该样本的平均数为
.
2
应从C中抽取100×10=20(个)个体.
(3)
答案:(1)B (2)20 (3)6
(三)典型例题
【类题通法】(1)进行分层随机抽样的相关计算时,
常用到的两个关系:
【巩固练习3】甲校有3 600名学生,乙校有5 400名学生,
丙校有1 800名学生,为统计三校学生某方面的情况,计
(三)典型例题
【类题通法】1.使用分层随机抽样的前提
分层随机抽样的总体按一个或多个变量划分成若干个子总体,并且每一个个体属于且仅属于一个子总体,而
高中数学(人教A版)必修第二册课后习题:分层随机抽样、获取数据的途径【含答案及解析】
第九章统计9.1随机抽样9.1.2分层随机抽样9.1.3获取数据的途径课后篇巩固提升必备知识基础练1.为了了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男、女生视力情况差异不大,在下面抽样方法中,最合理的抽样方法是()A.不放回简单随机抽样B.按性别分层随机抽样C.按学段分层随机抽样D.放回简单随机抽样,而男、女生视力情况差异不大,故选用按学段分层随机抽样的抽样方法.2.2020年某省将实行新高考,考试及录取发生了很大的变化.为了报考理想的大学,小明需要获取近年来我国各大学会计专业录取人数的相关数据,他获取这些数据的最好途径是()A.通过调查获取数据B.通过试验获取数据C.通过观察获取数据D.通过查询获取数据,所以小明获取这些数据的最好途径是通过查询获取数据.3.甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,为统计三校学生某方面的情况,计划采用分层随机抽样的方法抽取一个容量为90的样本,应在这三校分别抽取学生个数为()A.30,30,30B.30,45,15C.20,30,10D.30,50,10,n N =903600+5400+1800=1120,再各层分别抽取,甲校抽取的人数为3 600×1120=30,乙校抽取的人数为5 400×1120=45,丙校抽取的人数为1 800×1120=15,故选B.4.某中学有高中生3 000人,初中生2 000人,男、女生所占的比例如图所示.为了解学生的学习情况,用分层随机抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取女生21人,则从初中生中抽取的男生人数是()A.12B.15C.20D.21,得该中学有高中生3 000人,其中男生人数为3 000×30%=900,女生人数为3000×70%=2 100,初中生2 000人,其中男生人数为2 000×60%=1 200,女生人数为2 000×40%=800,用分层随机抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取女生21人,则n5000=212100,解得n=50,∴从初中生中抽取的男生人数为50×12005000=12.故选A.5.从某地区15 000位老人中按性别分层随机抽取一个容量为500的样本,调查其生活能否自理的情况如下表所示.则该地区生活不能自理的老人中男性比女性多的人数约为()A.60B.100C.1 500D.2 000由分层随机抽样方法知所求人数为23-21500×15 000=60.6.某学校进行数学竞赛,将考生的成绩分成90分及以下、91~120分、121~150分三种情况进行统计,发现三个成绩段的人数之比依次为5∶3∶1.现用分层随机抽样的方法抽取一个容量为m的样本,其中分数在91~120分的人数是45,则此样本的容量m的值为()A.75B.100C.125D.135由已知得35+3+1=45m,得m=135.7.某单位有男、女职工共600人,现用分层随机抽样的方法从所有职工中抽取容量为50的样本,已知从女职工中抽取的人数为15,那么该单位的女职工人数为.n ,则1550=n600,解得n=180,即该单位的女职工人数为180.8.古代科举制度始于隋而成于唐,完备于宋、元.明代则处于其发展的鼎盛阶段,其中表现之一为会试分南卷、北卷、中卷按比例录取,其录取比例为11∶7∶2.若明宣德五年会试录取人数为100.则中卷录取人数为 .,明宣德五年会试录取人数为100,则中卷录取人数为100×211+7+2=10.9.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的14,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层随机抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:(1)游泳组中,青年人、中年人、老年人分别所占的比例; (2)游泳组中,青年人、中年人、老年人分别应抽取的人数.设参加活动的总人数为x ,游泳组中,青年人、中年人、老年人所占比例分别为a ,b ,c ,则 a=42.5%x -x4×50%(1-14)x=40%, b=47.5%x -x4×40%(1-14)x =50%, c=10%x -x4×10%(1-14)x =10%, 故游泳组中青年人、中年人、老年人所占的比例分别为40%,50%,10%.(2)因为是分层随机抽样,所以,游泳组中青年人抽取的人数为200×34×40%=60;中年人抽取的人数为200×34×50%=75;老年人抽取的人数为200×34×10%=15.关键能力提升练10.某校做了一次关于“感恩父母”的问卷调查,从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为:120份,180份,240份,x 份.因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁学生问卷中抽取60份,则在15~16岁学生中抽取的问卷份数为( ) A.60 B.80C.120D.180~12岁回收180份,其中在11~12岁学生问卷中抽取60份,抽样比为13,因为分层抽取的样本容量为300,故回收问卷总数为30013=900(份),故x=900-120-180-240=360(份),360×13=120(份).11.我国古代数学名著《九章算术》中有如下问题“今有北乡算八千七百五十八,西乡算七千二百三十六,南乡算八千三百五十六,凡三乡,发役三百七十八人,欲以算数多少出之,问各几何?”意思是:北乡有8 758人,西乡有7 236人,南乡有8 356人,现要按人数多少从三乡共征集378人,问从各乡征集多少人?在上述问题中,需从西乡征集的人数是( ) A.102 B.112 C.130 D.1368 758人,西乡有7 236人,南乡有8 356人,现要按人数多少从三乡共征集378人,故需从西乡征集的人数是378×7 2368 758+7 236+8 356≈112.12.已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A.200,20B.100,20C.200,10D.100,103 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20.13.下列调查方案中,抽样方法合适、样本具有代表性的是 ( )A.用一本书第1页的字数估计全书的字数B.为调查某校学生对航天科技知识的了解程度,上学期间,在该校门口,每隔2分钟随机调查一位学生C.在省内选取一所城市中学,一所农村中学,向每个学生发一张卡片,上面印有一些科学家的名字,要求每个学生只能在一个喜欢的科学家名字下面画“√”,以了解全省中学生最喜欢的科学家是谁D.为了调查我国小学生的健康状况,共抽取了100名小学生进行调查中,样本缺少代表性(第1页的字数一般较少);B 中,抽样保证了随机性原则,样本具有代表性;C 中,城市中学与农村中学的规模往往不同,学生喜欢的科学家也未必在所列的名单之中,这些都会影响数据的代表性;D 中,总体数量很大,而样本容量太少,不足以体现总体特征.14.研究下列问题:①某城市元旦前后的气温;②某种新型电器元件使用寿命的测定;③电视台想知道某一个节目的收视率.一般通过试验获取数据的是()A.①②B.③C.②D.②③通过观察获取数据,③通过调查获取数据,只有②通过试验获取数据.15.(多选题)某公司生产三种型号的轿车,产量分别为1 200辆,6 000辆和2 000辆.为检验该公司的产品质量,公司质监部门要抽取46辆进行检验,则()A.应采用分层随机抽样抽取B.应采用抽签法抽取C.三种型号的轿车依次抽取6辆、30辆、10辆D.这三种型号的轿车,每一辆被抽到的概率都是相等的,所以应采用分层随机抽样抽取,A正确;设三种型号的轿车依次抽取x辆,y辆,z辆,则有{x1200=y6000=z2000,x+y+z=46,解得{x=6,y=30,z=10.所以三种型号的轿车依次抽取6辆、30辆、10辆,故C正确;由分层随机抽样的意义可知D也正确.16.(多选题)某工厂生产A,B,C三种不同型号的产品,其相应产品数量之比为2∶5∶3,现用分层随机抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,则()A.此样本的容量n为20B.此样本的容量n为80C.样本中B型号产品有40件D.样本中B型号产品有24件A,B,C三种不同型号的产品,其相应产品数量之比为2∶5∶3,现用分层随机抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,设样本为n,则n=16÷2k2k+5k+3k=80,故A错误,B正确;样本中B型号产品有80×5k2k+5k+3k=40件,故C正确,D错误.故选BC.17.某高中针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团,已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:其中x ∶y ∶z=5∶3∶2,且“泥塑”社团的人数占两个社团总人数的35,为了了解学生对两个社团活动的满意程度,从中抽取一个50人的样本进行调查,则从高二年级“剪纸”社团的学生中应抽取 人.“泥塑”社团的人数占总人数的35,故“剪纸”社团的人数占总人数的25,所以“剪纸”社团的人数为800×25=320.因为“剪纸”社团中高二年级人数比例为y x+y+z=32+3+5=310,所以“剪纸”社团中高二年级人数为320×310=96.由题意知,抽样比为50800=116,所以从高二年级“剪纸”社团中抽取的人数为96×116=6.18.某机构对某镇的学生的身体素质状况按年级段进行分层随机抽样调查,得到了如下表所示的数据,则xy z = .,得80016=x15=yz ,即x=750,yz =50,则xyz =37 500.19.为制定本市七、八、九年级男学生校服的生产计划,有关部门准备对180名初中男生的身高做调查,现有三种调查方案:(1)测量少年体校中180名男子篮球、排球队员的身高; (2)网上查阅有关我国其他地市180名男生身高的统计资料;(3)按本市七、八、九年级男学生数目的比例分别从三个年级共抽取180名男生调查其身高. 为了达到估计本市初中这三个年级男生身高分布的目的,则上述调查方案不合理的是 ,合理的是 .(填序号)(3)中,少年体校的男子篮球、排球的运动员的身高一般高于平均水平,因此不能用测量的结果去估计总体的结果,故方案(1)不合理;(2)中,用外地学生的身高也不能准确地反映本地学生身高的实际情况,故方案(2)不合理;(3)中,由于初中三个年级的男生身高是不同的,所以应该用按比例分别抽取的方法从初中三个年级抽取180名男生调查其身高,方案(3)合理. 20.某地气象台记录了本地6月份的日最高气温(如下表所示):气象台获取数据的途径是 ,本地6月份的日最高气温的平均数约为 ℃.(结果保留一位小数)24.3;本地6月份的日最高气温的平均数为y =130×(20×5+22×4+24×6+25×6+26×4+28×2+29×2+30×1)≈24.3(℃).21.一工厂生产了16 800件某种产品,它们分别来自甲、乙、丙3条生产线.为检查这批产品的质量,决定采用分层随机抽样的方法进行抽样.已知从甲、乙、丙3条生产线抽取的产品个数分别是a ,b ,c ,且2b=a+c ,则乙生产线生产了 件产品.3条生产线各生产了T 甲、T 乙、T 丙件产品,则a ∶b ∶c=T 甲∶T 乙∶T 丙,即aT 甲=b T乙=c T丙.又因为2b=a+c ,所以{T 甲+T 丙=2T 乙,T 甲+T 乙+T 丙=16 800,所以T 乙=16 8003=5 600.22.某市四个区共有20 000名学生,且四个区的学生人数之比为3∶2.8∶2.2∶2.现要用分层随机抽样的方法从所有学生中抽取一个容量为200的样本,那么在这四个区中,抽取人数最多的区与抽取人数最少的区的人数差是多少? 抽取人数最多的区的人数为33+2.8+2.2+2×200=310×200=60,抽取人数最少的区的人数为23+2.8+2.2+2×200=210×200=40,则抽取人数最多的区与抽取人数最少的区的人数差为60-40=20.23.某校高中学生有900人,校医务室想对全体高中学生的身高情况做一次调查,为了不影响正常教学活动,准备抽取50名学生作为调查对象.校医务室若从高一年级中抽取50名学生的身高来估计全校高中学生的身高,你认为这样的调查结果会怎样?,校医务室想了解全校高中学生的身高情况,在抽样时应当关注高中各年级学生的身高,并且还要分性别进行抽查.如果只抽取高一的学生,结果是片面的.学科素养创新练24.一个地区共有5个乡镇,共计3万人,其人口比例为3∶2∶5∶2∶3,从这3万人中抽取一个300人的样本,分析某种疾病的发病率.已知这种疾病与不同的地理位置及水土有关,则应采取什么样的抽样方法?并写出具体过程.,所以不同乡镇的发病情况差异明显,因而应采用分层随机抽样的方法.具体过程如下:(1)将3万人分成5层,一个乡镇为一层.(2)按照各乡镇的人口比例随机抽取各乡镇的样本:300×315=60(人),300×215=40(人),300×515=100(人),300×215=40(人),300×315=60(人). 各乡镇分别用分层随机抽样抽取的人数分别为60,40,100,40,60. (3)将抽取的这300人组到一起,即得到一个样本.。
分层抽样练习
一、解答题1.某数学兴趣小组11人的年龄(单位:岁)分别为17,19,22,24,25,28,34,35,36,37,38,这组数据的三个四分位数分别是多少?2.随着移动互联网的发展,与餐饮美食相关的手机软件层出不穷.现从某市使用A款订餐软10,70件的商家中随机抽取100个商家,对它们的“平均配送时间”进行统计,所有数据均在[]范围内,得到如图所示的频率分布直方图.(1)求a的值;(2)试估计该市使用A款订餐软件的商家的“平均配送时间”的第20百分位数.3.“绿水青山就是金山银山”的口号已经深入民心,人们对环境的保护意识日益增强,质检检测部门也会不时地对一些企业的生产污染情况进行排查,并作出相应的处理,本次排查了30个企业,共查出510个污染点,其中造成污染点前10名的企业分别造成的污染点数为58,36,36,35,33,32,28,26,24,22.(1)求这30个企业造成污染点的第80百分位数;(2)已知造成污染点前10名的企业的方差为92.4,其他20个企业造成污染点的方差为44.7,求这30个企业造成污染点的总体方差.4.用分层随机抽样从某校高二年级800名学生的数学成绩(满分为100分,成绩都是整数)中抽取一个样本量为100的样本,其中男生成绩数据40个,女生成绩数据60个.再将40个男生成绩样本数据分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100),绘制得到如图所示的频率分布直方图.(1)估计男生成绩样本数据的第80百分位数;(2)若成绩不低于80分的为“优秀”成绩,用样本的频率分布估计总体,估计高一年级男生中成绩优秀人数;(3)已知男生成绩样本数据的平均数和方差分别为71和187.75,女生成绩样本数据的平均数和方差分别为73.5和119,求总样本的平均数和方差.5.古人云“民以食为天”,某校为了了解学生食堂服务的整体情况,进一步提高食堂的服务质量,营造和谐的就餐环境,使同学们能够获得更好的饮食服务.为此做了一次全校的问卷调查,问卷所涉及的问题均量化成对应的分数(满分100分),从所有答卷中随机抽取100份分数作为样本,将样本的分数(成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如表所示的频数分布表.(1)求频数分布表中a的值,并求样本成绩的中位数和平均数;(2)已知落在[50,60)的分数的平均值为56,方差是7;落在[60,70)的分数的平均值为65,方差是4,求两组成绩的总平均数z和总方差2s.。
1简单随机抽样、系统抽样、分层抽样含答案
2.1.1 简单随机抽样、系统抽样、分层抽样1.简单随机抽样的定义设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的分类简单随机抽样⎩⎨⎧ 抽签法随机数法3.简单随机抽样的优点及适用类型简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的.4.系统抽样的概念先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本.5.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本,步骤为:(1)先将总体的N 个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等.(2)确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =N n; (3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k),再加k 得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.6.分层抽样的概念在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.7.分层抽样的适用条件分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.一、选择题1.抽签法中确保样本代表性的关键是( )A.制签B.搅拌均匀C.逐一抽取D.抽取不放回答案 B 解析由于此问题强调的是确保样本的代表性,即要求每个个体被抽到的可能性相等.所以选B.2.下列抽样实验中,用抽签法方便的有( )A.从某厂生产的3 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D.从某厂生产的3 000件产品中抽取10件进行质量检验答案B解析A总体容量较大,样本容量也较大不适宜用抽签法;B总体容量较小,样本容量也较小可用抽签法;C中甲、乙两厂生产的两箱产品有明显区别,不能用抽签法;D总体容量较大,不适宜用抽签法.3.为调查参加运动会的1 000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是( )A.1 000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是100答案 D 解析:此问题研究的是运动员的年龄情况,不是运动员,故A、B、C错,故选D. 4.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性,“第二次被抽到”的可能性分别是( )A.110,110B.310,15C.15,310D.310,310答案A5.某会议室有50排座位,每排有30个座位.一次报告会坐满了听众.会后留下座号为15的所有听众50人进行座谈.这是运用了( )A.抽签法B.随机数表法C.系统抽样D.有放回抽样答案C解析从第1排到第50排每取一个人的间隔人数是相同的,符合系统抽样的定义.6.要从已经编号(1~50)的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射试验,用系统抽样方法确定所选取的5枚导弹的编号可能是( )A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,32答案B解析由题意知分段间隔为10.只有选项B中相邻编号的差为10,选B.7.有40件产品,其中一等品10件,二等品25件,次品5件,现从中抽出8件进行质量分析,问应采取何种抽样方法( )A.抽签法B.随机数表法C.系统抽样D.分层抽样答案D8.某城市有学校700所.其中大学20所,中学200所,小学480所,现用分层抽样方法从中抽取一个容量为70的样本,进行某项调查,则应抽取中学数为( )A.70 B.20 C.48 D.2答案B由于70070=10,即每10所学校抽取一所,又因中学200所,所以抽取200÷10=20(所).9.下列问题中,最适合用分层抽样方法抽样的是( )A.某电影院有32排座位,每排有40个座位,座位号是1~40.有一次报告会坐满了听众,报告会结束以后为听取意见,要留下32名听众进行座谈B.从10台冰箱中抽出3台进行质量检查C.某乡农田有山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩,现抽取农田480亩估计全乡农田平均产量D.从50个零件中抽取5个做质量检验答案C解析A的总体容量较大,宜采用系统抽样方法;B的总体容量较小,用简单随机抽样法比较方便;C总体容量较大,且各类田地的产量差别很大,宜采用分层抽样方法;D与B类似.10.要从其中有50个红球的1 000个球中,采用按颜色分层抽样的方法抽取100个进行分析,则应抽取红球的个数为( )A.5个B.10个C.20个D.45个答案A解析由题意知每1000100=10(个)球中抽取一个,现有50个红球,应抽取5010=5(个).11.在简单随机抽样中,某一个个体被抽到的可能性( )A.与第几次抽样有关,第一次抽到的可能性大一些B.与第几次抽样无关,每次抽到的可能性相等C.与第几次抽样有关,最后一次抽到的可能性大些D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不同答案B解析由简单随机抽样的特点知与第n次抽样无关,每次抽到的可能性相等.二、填空题12.福利彩票的中奖号码是从1~36个号码中选出7个号码来按规则确定中奖情况,这种从36个号码中选7个号码的抽样方法是________.答案抽签法13.用随机数表法进行抽样,有以下几个步骤:①将总体中的个体编号;②获取样本号码;③选定随机数表开始的数字,这些步骤的先后顺序应该是________.(填序号)答案①③②14.某班级共有学生52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号同学在样本中,那么样本中还有一个同学的学号为________.答案16解析用系统抽样的方法是等距离的.42-29=13,故3+13=16.15.某农场在三种地上种玉米,其中平地210亩,河沟地120亩,山坡地180亩,估计产量时要从中抽取17亩作为样本,则平地、河沟地、山坡地应抽取的亩数分别是________.答案7,4,6解析应抽取的亩数分别为210×17510=7,120×17510=4,180×17510=6.16.将一个总体分为A、B、C三层,其个体数之比为5∶3∶2.若用分层抽样方法抽取容量为100的样本,则应从C中抽取________个个体.答案20解析由题意可设A、B、C中个体数分别为5k,3k,2k,所以C中抽取个体数为2k5k+3k+2k×100=20.17.某工厂生产A、B、C、D四种不同型号的产品,产品数量之比依次为2∶3∶5∶1.现用分层抽样方法抽出一个容量为n的样本,样本中A种型号有16件,那么此样本的容量n为________.答案88解析在分层抽样中,每一层所抽的个体数的比例与总体中各层个体数的比例是一致的.所以,样本容量n=2+3+5+12×16=88.。
9.1.2分层随机抽样 课件(人教版)
个数为( A )
A.5 B.10 C.20 D.45
5.A公司有职工代表120人,B公司有职工代表100人, 现因A,B两公司合并,需用分层抽样的方法在这两 个公司的职工代表中选取11人作为企业资产评估监
2.某林场有树苗 30 000 棵,其中松树苗 4 000 棵.为调查树苗
的生长情况,采用分层随机抽样的方法抽取一个容量为 150
的样本,则样本中松树苗的数量为( )0
D.15
解析:样本中松树苗为
4
000×
150 30 000
=
4
000× 2010 =
20(棵). 答案:C
3.某公司有大量客户,且不同年龄段客户对其服务的评价有 较大差异.为了解客户的评价,该公司准备进行抽样调查, 可供选择的抽样方法有简单随机抽样和分层随机抽样,则 最合适的抽样方法是________.
三、易错防范题 5.某企业三月中旬生产 A,B,C 三种产品共 3 000 件,根据
分层随机抽样的结果,企业统计员制作了如下的统计表格:
由于不小心,表格中 A、C 两种产品的有关数据已被污染 看不清楚了,统计员只记得 A 产品的样本容量比 C 产品的 样本容量多 10,根据以上信息,求 C 产品的数量的件数.
3.某校有足球、篮球、排球三个兴趣小组,共有成 员120人,其中足球、篮球、排球兴趣小组的成员 分别有40人、60人、20人.现用分层抽样的方法 从这三个兴趣小组中抽取24人来调查活动开展情 况,则在足球兴趣小组中应抽取的人数8 为______
注:本来每层的个体数量之比=样本中每层的个体数量之比
学以致用:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
97 7 4 5 4 6 5 5 1
请估计该地区养牛总头数 Y 及其估计量的相 对标准差 s(Yµ) /Yµ 。
8. 一公司希望估计某一个月内由于事故引 起的工时损失。因工人、技术人员及行政管理人 员的事故率不同,故采用分层随机抽样。已知下 列资料:
工 技术人 行政管理
人员
人员
N1 =1 32 =3 S12 6
从商行内抽取由 400 人组成的一个样本,目的是
估计使用某些娱乐设备的人所占的比例。按照粗
略的猜测,这些设备 40%到 50%是由男性使用的,
20%到 30%是由女性使用的,5%到 10%是由管理人
员使用的。请问:
(1)你如何把样本单位分配在这三组人之间?
(2)若真正使用者占的比例分别是 48%,21%
总 1234567891
数
0
1 141 4 8 9 0 1 4 0 1ห้องสมุดไป่ตู้1 0
1 348 04 23
4
2 470 5 1 6 8 8 1 1 1 5 1
5 0427457066
7
804 0
3 255 2 2 1 2 1 1 3 0 6 2
8 2613373 32
8202984
0
4 149 1 3 2 3 3 0 2 7 1 3
好
C. 层数一般以不超过 6 为宜
D. 层数一般以 4 层为最好
E. 应该充分
考虑费用和精度要求等因素来确定层数
6. 下 面 哪 种 样 本 量 分 配 方 式 属 于 奈 曼 分 配 ?
( CD )
A. nh n Nh N
nk NhSh
n
L
NhSh
h1
B. nh NhSh / ch
C.
n
2%。
Wh
层
真 Sh
估计的 Sh
值 (1) (2)
1 0. 30 30 30
2 3 20 20 20
3 0. 10 5 20 6 0. 1
7. 调查某个地区的养牛头数,以村作为抽
样单元。根据村的海拔高度和人口密度划分成四
层,每层抽取 10 个村作为样本单元,经过调查
获得下列数据:
层村
样本村养牛头数
收集到以后才知道
D. 总体规模太大,事先分层太费事
E. 一般场合都可以适用
三、名次解释
1. 分 层 随 机 抽 样
2. 自 加 权
3. 最优分配
四、简答题
1. 简述分层随机抽样相对于简单随机抽样的优
点。
2. 请列举出样本量在各层的三种分配方法,并
说明各种方法的主要思想。
3. 怎样分层能提高精度?
4. 总样本量在各层间分配的方法有哪些?
A、Vopt V prop Vsrs
B、V prop Vopt Vsrs
C、V prop Vopt Vsrs
D、Vsrs V prop Vopt
6、下面哪种样本量分配方式属于比例分配?( A)
A、 nh n Nh N
B、 nh Nh Sh ch
n
L
NhSh ch
h1
C、 nh NhSh
L
NhSh / ch
h1
D. nh WhSh
n
L
Wh Sh
h1
E. nh WhSh / ch
n
L
WhSh / ch
h1
7.事后分层的适用场合有(ABCD )
A. 各层的抽样框无法得到
B. 几个变量都适宜于分层,而要进行事先的多
重交叉分层存在一定困难
C. 一个单位到底属于哪一层要等到样本数据
层,每层取 10 个村作为样本单元,经过调查获
得下列数据
层 村总数 样本村养牛头数
1234567
8 9 10
1 1411
43 84 98 0 10 44 0
2 4705
124 13 0
3 2558
50 147 62 87 84 158 170
4 14997 104 56 160
228 262 110 232 139 178 334
请问:
(1)包含 1000 个住户的样本应该如何在这
两层中分配?
(2) 若调查的目的是估计这两层平均每个
住户拥有财产的差额,样本应如何分配(假定各
层的单位调查费用相等)?
2. 一个县内所有农场按规模大小分层,各
层内平均每个年农场谷物(玉米)的英亩数列在
下表中。
农场规 农场数 平均每一农场的 标准差 Sh
20%(即V ( pprop ) V ( psrs ) =0.8)
(2) 若 P=4% ,其中 W1=0.05 ,P1=45% ;W2=0.2, P2=5%; W3=0.75, P3=1%.则采用按比例分配的分层 抽样比简单随机抽样精度得益有多大?
14. 调查某个地区的养牛头数,以村作为抽
样单元。根据村的海拔高度和人口密度划分成四
th 均为已知数,请证明当总费用固定时,为了使
V
(
yst
)
达到最小值,
nh
必与
(Wh2 t
Sh
2
)2
/
3
成比例。并求出下
h
述条件中,一个含量为 1000 的样本所对应的 nh 。
Wh
Sh
th
层
1 0.4 4
1
2 0.3 5
2
3 0.3 6
4
4. 在一个商行内,62%的雇员是熟练的或不
熟练的男性,31%是办事的女性,7%是管理人员。
现要抽出一个包含 100 个农场的样本,目的是估
计该县平均每个农场的玉米面积,请问:
(1)按比例分配时,各层的样本量为多少?
(2)按最优分配时,各层的样本量为多少?
(假定各层的单位调查费用相等)
(3)分别将比例分配、最优分配的精度与简
单随机抽样的精确度比较。
3.设费用函数具有形式C c0 th nh ,其中 c0 及
样本
平原 去年产量 当年产量(百
(百斤)
斤)
1
204
210
2
143
160
3
82
75
4
256
280
5
275
300
6
198
190
山区
样本
去年产量 当年产量(百
(百斤)
斤)
1
137
150
2
189
200
3
119
125
4
63
60
5
103
110
6
107
100
7
159
180
8
63
75
9
87
90
11. 一公司希望估计某一个月内由于事故引
年龄组 层权 层样本 ph
qh
Wh
量 nh
14—25 0.281 400 0.08 0.917
岁 0.322 650 3 0.826
26—40 0.213 600 0.17 0.690
岁 0.814 350 4 0.536
41—60
0.31
岁
0
61 岁
0.46
以上
4
6. 设计某一类商店销售额的调查,n=550,
下:
工人
技术人员
行政管理人员
8,24,0,0, 4,5,0,24, 1,8
16,32,
8,12,3,2,
6,0,16,7, 1,8
4,4,9,5,8,
18,2,0
试估计总的工时损失数并给出它的置信度为
95%的置信区间。
13. 在估计比例问题时:
(1) 假设 P=0.5,W1=W2=0.5,则 P1 和 P2 为何值 时可以使按比例分配的分层抽样精度可以得益
N2 =92 S22 =25
N3 =27 =9 S32
若总样本量 n=30,试用奈曼分配确定各层
的样本量。
9.上题中若实际调查了 18 个工人、10 个技
术人员、2 个行政人员,其损失的工时数如下:
工人 技术人 行政管理人
员
员
8,24,0, 4,5,0, 1,8 0,16,32,24,8,12, 6,0,16, 3,2,1,8 7,4,4, 9,5,8, 18,2,0
分组
(万元)
1—49
18260 100
80
50—99
4315
250
200
100—249 2233
500
600
250—999 1057
1760
1900
1000 人 以 567
2250
2500
上
(1) 若欲抽取 3000 个工厂作样本来估计产值,
试比较下列各种分配的效率:
(2) 按工厂数多少分配样本;
按最优(奈曼)分配。
模(英亩) Nh
玉米面积Yh
0—40 394
5.4
8.3
41—80 461
16.3
13.3
81—120 391
24.3
15.1
121—16 334
34.5
19.8
0
169
42.1
24.5
161—20 113
50.1
26.0
0
148
63.8
35.2
201—24
0
241
总和或 2010
26.3
--
均值
B、 nh n C、 Wh 1 D、 Nh 1
4、在给定费用下估计量的方差V (yst ) 达到最小,
或者对于给定的估计量方差V 使得总费用达到最