分层抽样 (15)
分层抽样方法
例1、某高中共有900人,其中高一年级300
人,高二年级200人,高三年级400人,现采用
分层抽样抽取容量为45的样本,那么高一、高
二、高三各年级抽取的人数分别为( )
A.15,5,25
B.15,15,15
C.10,5,30
将总体分成 几层,分层 进行抽取
在起始部分 样时采用简 随机抽样
分层抽样时 采用简单随 机抽样或系 统抽样
总体个 数较多
总体由差 异明显的 几部分组 成
课堂练习
练习1. 2. 3
1、某单位有老年人28人,中年人54人,青年人81人,
为了调查他们的身体情况,需从他们中抽取一个容量为
36的样本,则适合的抽取方ห้องสมุดไป่ตู้是 ( )
练习:分层抽样又称类型抽样,即将相似的个
体归入一类(层),然后每层抽取若干个体构
成样本,所以分层抽样为保证每个个体等可能
入样,必须进行
()
A、每层等可能抽样 B、每层不等可能抽样 C、所有层按同一抽样比等可能抽样
注意事项: 1.分层抽样法适用于总体中个体
差异明显的抽样;
2.分层是按总体中个体的明显差 异进行分类;
①抽签法; ②随机数表法.
二、基础训练:
1.中央电视台要从春节联欢晚会的60名热 心观众中随机抽出4名幸运观众,试用抽签法 为其设计产生这4名幸运观众的过程.
2.欲从本班77名学生中随机抽取7名学生参 加数学的基本知识竞赛,试用随机表法确定这7名 学生.
评点:
抽签法——编号、标签、搅拌、抽取,关键是 “搅拌”后的随机性;
A.简单随机抽样 B.系统抽样 C.分层抽样
分层抽样
=
3 5,
1 大型商店有 15 ×1500=100家 1 中型商店有 3 ×1500=500家 3 小型商店有 5 ×1500=900家
1 抽取 50 ×100=2家 1 抽取 50×500=10家 1 抽取 50×900=18家 15
N----总体容量
n----样本容量
Ni----总体中第i层的个体数 ni----样本中第i层的个体数
答:由于不同类型的农田之间的产量有较大差 异,应当采用分层抽样的方法,对不同类型的 农田按其占总数的比例来抽取样本。
8
认识: 1、分层抽样适用于总体由差异明显的 几个部分组成。 2、每个类型中按照所占比例随机抽取 3、在每一层进行抽样时,采用简单随 机抽样或系统抽样; 4、分层抽样也是等概率抽样。
50 1000 150 1000 800 1000
=
中层人员占
一般员工占
=
=
1 20, 3 , 20 4 5,
1 抽取 20 ×100=5名 3 抽取 20×100=15名 4 抽取 5 ×100=80名
13
这样进行抽样后,在对员工的收入情况进行调查
规律方法总结
1、分层抽样的步骤:
(1) 将总体按一定的标准分层; (2)计算各层的个体数与总体的 个体数的比; (3)按各层个体数占总体的个 体数的比确定各层应抽取 的样本容量; (4)在每一层进行抽样;(可用简单 随机抽样或系统抽样) (5)综合每层抽样,组成样本.
答案:省重点中学抽取40人,市重点中学抽取120人, 其余学校抽取60人.
练习2(P12): 某公司有1000名员工,其中:高 层管理人员为50名,属于高收入者;中层管理人 员为150名,属于中等收入者;一般员工为800名, 属于低收入者。要对这个公司员工的收入情况进 行调查,欲抽取100名员工,应当怎样进行抽样? 答:我们可以用分层抽样的方法,按照收入水平 分成三层:高收入者、中等收入者、低收入者. 高层人员占
系统抽样分层抽样
练习:将全班同学按学号编号,制作相应的卡片号签,放入同一个箱子里均匀搅 拌,从中抽出15个号签,就相应的15名学生对看足球比赛的喜爱程度(很喜爱、 喜爱、一般、不喜爱、很不喜爱)进行调查。分析并说明整个抽签过程中每 个同学被抽到的概率是相等的。
第3页/共18页
2、用随机数表法进行抽取
(1)随机数表是统计工作者用计算机生成的随机数,并 保证表中的每个位置上的数字是等可能出现的。
N
(3)确定各层应该抽取的个体数。各层的 抽取数之和应等于样本容量。对于不能取整的 数,求其近似值。
(4)按(3)中确定的数目在各层中随机抽取 个体,合在一起得到容量为n的样本.第12页/共18页 Nhomakorabea注:
(1)分层抽样适用于总体由差异明显的几 部分组成的情况,每一部分称为层,在每一层 中实行简单随机抽样。这种方法较充分地利用 了总体己有信息,是一种实用、操作性强的方 法。而且更具代表性。
(2)分层抽样的一个重要问题是总体如何分 层,分多少层,这要视具体情况而定。总的原则 是:层内样本的差异要小,而层与层之间的差异 尽可能地大,否则将失去分层的意义。
第13页/共18页
例2、一个单位的职工有500人,其中不到35岁的有125人,35~49岁的有280人, 50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽 取100名职工作为样本,应该怎样抽取?
第14页/共18页
分层抽样的抽取步骤: (1)总体与样本容量确定抽取的比例。 (2)由分层情况,确定各层抽取的样本数。 (3)各层的抽取数之和应等于样本容量。 (4)对于不能取整的数,求其近似值。
第15页/共18页
4.三种抽样方法的比较
第16页/共18页
5.课堂练习
分层抽样
能用简单随机抽样或系统抽样法?
总体特点: 总体由差异明显的几部分组成
-- 分层抽样
第二章 2.1 随机抽样
(4)汇总每层抽样,组成样本.
2.抽样比 (1)分层抽样也称“按比例抽样”,这里的“按比例”是指: ①样总本体中中第第nn层层的的个个体体数数=样总本体容容量量; ②总总体体中中第第mn层层的的个个体体数数=样样本本中中第第mn层层的的个个体体数数.
反思与感悟
分层抽样的特点:
(1)适用于总体由差异明显的几部分组成的情况. (2)样本能更充分地反映总体的情况. (3)按比例确定每层抽取个体的个数,等可能抽样,每个个体 被抽到的可能性都相等.
解 用分层抽样来抽取样本,步骤如下:
(1)分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁
的职工;50岁及50岁以上的职工. (2)确定每层抽取个体的个数.抽样比为150000=15,则在不到 35 岁的职工中
抽取 125×15=25(人); 在 35 岁至 49 岁的职工中抽取 280×15=56(人); 在 50 岁及 50 岁以上的职工中抽取 95×15=19(人). (3)在各层分别按系统抽样或随机数法抽取样本.
简单随机抽样、系统抽样、分层抽样的比较
类别
共同点
各自特点
联系
适用 范围
简单 随机 抽样
系统 抽样
分层 抽样ห้องสมุดไป่ตู้
从总体中逐个抽取
总体个数 较少
将总体平均分成几
2021版【南方凤凰台】数学(江苏专用文科)大一轮复习检测评估:第66课 统计初步 Word版含答案
第66课统计初步【自主学习】第66课统计初步(本课时对应同学用书第页)自主学习回归教材1.(必修3P49练习2改编)某学校高一、高二、高三班级的同学人数之比为3∶3∶4,现接受分层抽样的方法从该校高中三个班级的同学中抽取容量为50的样本,则应从高二班级抽取名同学.【答案】15【解析】分层抽样又称分类抽样或类型抽样.将总体划分为若干个同质层,再在各层内随机抽样或系统抽样,分层抽样的特点是将科学分组法与抽样法结合在一起,分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性.因此,由50×3334++=15知应从高二班级抽取15名同学.2.(必修3P52习题2改编)将参与夏令营的600名同学编号为001,002,…,600.接受系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名同学分住在三个营区,从001到300住在第一营区,从301到495住在其次营区,从496到600住在第三营区,则三个营区被抽中的人数依次为.【答案】25,17,8【解析】依题意知在随机抽样中,首次抽到003号,以后每隔12个号抽到一个样本,则分别是003,015,027,…,构成以3为首项、12为公差的等差数列,故抽到的第n个人的编号a n=3+(n-1)×12=12n-9.令1≤12n-9≤300,得1012≤n≤30912,由于n∈Z,所以n有25个取值;令301≤12n-9≤495,所以31012≤n≤50412,由于n∈Z,所以n有17个取值;令496≤12n-9≤600,所以50512≤n≤60912,由于n∈Z,所以n有8个取值.综上,三个营区被抽中的人数依次为25,17,8.3.(必修3P81复习题8改编)一个社会调查机构就某地居民的月收入状况调查了10 000人,并依据所得数据画出样本的频率分布直方图(如图所示).为了分析居民的收入与年龄、学历、职业等方面的关系,再从这10 000人中用分层抽样的方法抽出100人作进一步调查,则在[2 500,3 500)(元/月)收入段应抽出人.【答案】40【解析】(0.000 5+0.000 3)×500×100=40.4.(必修3P67练习3改编)某校进行2021年元旦汇演,七位评委为某班的小品打出的分数的茎叶统计图如图所示,去掉一个最高分和一个最低分,所剩数据的方差为.【答案】1.6【解析】由茎叶图知,去掉一个最高分和一个最低分,所剩数据为84,84,86,84,87,所以由公式得方差为1.6.5.(必修3P50例3改编)某城区有农夫、工人、学问分子家庭共计2 000户,其中农夫家庭1 800户,工人家庭100户.现要从中抽取容量为40的样本调查家庭收入状况,则在整个抽样过程中,可以用到的抽样方法的是.(填序号)①简洁随机抽样;②系统抽样;③分层抽样.【答案】①②③【解析】由于各家庭有明显差异,所以首先应用分层抽样的方法分别从农夫、工人、学问分子这三类家庭中抽出若干户,即36户、2户、2户.又由于农夫家庭户数较多,那么在农夫家庭这一层宜接受系统抽样;而工人、学问分子家庭户数较少,宜接受简洁随机抽样法.故整个抽样过程三种抽样方法都要用到.一、抽样方法1.简洁随机抽样(1)被抽取样本的总体个数N是有限的;(2)抽取方式:逐个不放回抽取;(3)每个个体被抽到的概率相等;(4)常用方法:抽签法和随机数表法.2.系统抽样当总体的个体数较多时,可将总体分成均衡的几个部分,然后依据预先定出的规章,从每个部分抽取一个个体,得到所需的样本,这样的抽样叫作系统抽样.系统抽样的步骤可概括为:(1)接受随机的方式将总体中的个体编号.(2)确定分段的间隔k.当nN是整数时,k=nN;当nN不是整数时,通过从总体中剔除个体使剩下的总体中的个体数n'能被N整除,这时k='nN.(3)在第1段接受简洁随机抽样确定起始的个体编号l.(4)依据事先确定的规章抽取样本.通常是将l加上间隔k得到第2个个体编号l+k,再加k得到第3个个体编号l+2k,依次进行下去,直到猎取整个样本.3.分层抽样当总体由差异明显的几部分组成时,为使样本更充分地反映总体的状况,常将总体分成几部分,然后依据各部分所占的比例进行抽样,这样的抽样方法叫作分层抽样,其中所分成的各部分叫作层,每层抽样时实行简洁随机抽样或系统抽样.二、总体分布特征数的估量1.频率分布表求一组数据的频率分布,可按以下三步进行:(1)数出落在各小组内的数据的个数,即频数;(2)每个小组的频数与样本容量的比值叫作这一小组的频率;(3)列出频率分布表.2.频率分布直方图:图中纵轴是频率组距,每个矩形的面积等于相应组的频率,各个小矩形的面积的和等于1.3.样本平均数x=1n(x1+x2+…+x n),样本方差s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].(其中x n是样本数据,n是样本容量)【要点导学】要点导学各个击破抽样方法例1(1)某学校有男、女同学各500名.为了了解男、女同学在学习爱好与业余爱好方面是否存在显著差异,拟从全体同学中抽取100名同学进行调查,则宜接受的抽样方法是.(2)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品平安检测.若接受分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是.【答案】(1)分层抽样(2)6【解析】(1)由于被抽取的个体的属性具有明显差异,因此宜接受分层抽样法.(2)四种产品的抽样比为4∶1∶3∶2,所以植物油类和果蔬类食品被抽到的种数之和为20×110+20×210=6.【精要点评】本题主要考查抽样方法问题,分层抽样中分多少层,如何分层要视具体状况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠,为了保证每个个体等可能入样,全部层中每个个体被抽到的可能性相同,在每层抽样时,应接受简洁随机抽样或系统抽样的方法进行抽样.变式(2021·苏州期末)某课题组进行城市空气质量监测,按地域将24个城市分成甲、乙、丙三组,对应区域城市数分别为4,12,8.若用分层抽样的方法抽取6个城市,则乙组中应当抽取的城市数为.【答案】3【解析】由题意知,乙组中应抽取6×124128++=3个城市.总体分布的估量例2(2022·南京、盐城二模)某地区训练主管部门为了对该地区模拟考试成果进行分析,随机抽取了150分到450分之间的1 000名同学的成果,并依据这1 000名同学的成果画出样本频率分布直方图(如图),则成果在[300,350)内的同学共有人.【答案】300【解析】由于各组频率之和为50×(0.001×2+0.004+a+0.005+0.003)=1,解得a=0.006,所以成果在[300,350)内的频率为50a=0.3,故同学有300人.【精要点评】用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图把握信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距;(2)频率分布直方图中各长方形高的比也就是其频率之比;(3)直方图中每一个矩形的面积是样本数据落在这个区间上的频率,全部的小矩形的面积之和等于1,即频率之和为1.变式(2022·镇江期末)我市开展的“魅力老师”同学原创网文大赛,各校上传文章的时间为3月1日至30日,评委会把各校上传的文章数按5天一组分组统计,绘制成频率分布直方图如图所示.已知从左至右各长方形的高的比为2∶3∶4∶6∶4∶1,其次组的频数为180,那么本次活动收到的文章数是.(变式)【答案】1 200【解析】文章总数为2346413+++++×180=1200.总体特征数的估量例3 (2021·南京、盐城期末)在一次射箭竞赛中,某运动员5次射箭的环数依次是9,10,9,7,10,则该组数据的方差是 .【思维引导】由均值公式计算平均值,再由方差公式计算方差.【答案】65【解析】由于x=11n i n ∑=x i =15(9+10+9+7+10)=9,故s 2=11n i n ∑=(x i -x )2=15[02+12+02+(-2)2+12] =65.【精要点评】描述数据的数字特征的有平均数、众数、中位数、方差等,其中平均数、众数、中位数描述其集中趋势,方差反映各个数据与其平均数的离散程度.解题时重在理解概念、公式并正确进行计算.变式 一位篮球运动员在最近的8场竞赛中得分的茎叶图如图所示,则他在这8场竞赛中得分的方差是 .(变式) 【答案】14【解析】由题意可得x=201816142121088+++⨯+++=14,所以s 2=18×(62+42+22+02×2+22+42+62)=1128=14.1.(2022·无锡期末)甲、乙两个学习小组各有10名同学,他们在一次数学测验中成果的茎叶图如图所示,则他们在这次测验中成果较好的是 组.【答案】甲 【解析】由题意得x 甲=79.8,x 乙=73.2,所以在这次测验中成果较好的是甲组.2.(2021·南通期末)某中学共有同学2 800人,其中高一班级970人,高二班级930人,高三班级900人,现接受分层抽样的方法,抽取280人进行体育达标检测,则抽取的高二班级同学人数为 . 【答案】93【解析】抽样比为2802800=110,则抽取的高二班级同学人数为930×110=93.3.(2022·苏锡常镇连徐一调)一个容量为20的样本数据分组后,分组与频数分别如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70),2.则样本在[10,50)上的频率是 .【答案】7 10【解析】样本在[10,50)上的频率是234520+++=710.4.(2022·常州期末)某学校选修羽毛球课程的同学中,高一、高二班级分别有80名、50名.现接受分层抽样的方法在这130名同学中抽取一个样本,已知在高一班级同学中抽取了24名,那么在高二班级同学中抽取的人数为.【答案】15【解析】样本中高一班级与高二班级的人数比为8∶5,所以应在高二班级抽取24×58=15名.5.(2021·连云港、徐州、淮安、宿迁四市期末)如图,茎叶图记录了甲、乙两组各3名同学在期末考试中的数学成果,则方差较小的那组同学成果的方差为.(第5题)【答案】14 3【解析】由于x甲=x乙=92,所以2s甲=13[(88-92)2+(92-92)2+(96-92)2]=323,2s乙=13[(90-92)2+(91-92)2+(95-92)2]=143,所以2s乙<2s甲. 所以方差较小的那组同学成果的方差为143.趁热打铁,事半功倍.请老师布置同学们完成《配套检测与评估》中的练习第131~132页.【检测与评估】第66课统计初步一、填空题1.某林场有树苗3 000棵,其中松树苗400棵,为调查树苗的生长状况,接受分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的棵数是.2.某单位有职工52人,现将全部职工随机编号,用系统抽样的方法抽取一个容量为4的样本.已知6号、32号、45号职工在样本中,那么样本中另外一个职工的编号是.3.(2022·扬州期末)某校从高一班级同学中随机抽取100名同学,将他们期中考试的数学成果(均为整数)分成六组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]后得到的频率分布直方图如图所示,则分数在[70,80)内的人数是.(第3题)4.(2022·苏州暑假调查)样本数据18,16,15,16,20的方差s2=.5.(2021·扬州期末)若样本6,7,8,9,m的平均数为8,则标准差是.6.为了了解某校老师使用多媒体进行教学的状况,接受简洁随机抽样的方法从该校400名授课老师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示(如图).据此可估量该校400名老师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为.7.(2022·湖北模拟)有一个容量为200的样本,其频率分布直方图如图所示.依据样本的频率分布直方图估量样本数据落在区间[10,12)内的频数为.(第7题)8.(2022·江南十校联考改编)已知一组正数x1,x2,x3,x4的方差s2=14(21x+22x+23x+24x-16),则数据x1+2,x2+2,x3+2,x4+2的平均数为.二、解答题9.(2022·宁波模拟)甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是:甲:8,6,7,8,6,5,9,10,4,7;乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算两组数据的平均数;(2)分别计算两组数据的方差;(3)依据计算结果估量一下两名战士的射击水平谁更好一些.10.为了增加同学的环保意识,某中学随机抽取了50名同学进行了一次环保学问竞赛,并将本次竞赛的成果(得分均为整数,满分100分)整理制成下表.成果[40,50)[50,60)[60,70)[70,80)[80,90)[90,100]频数231415124(1)作出被抽查同学成果的频率分布直方图;(2)从成果在[40,50)中选1名同学,从成果在[90,100]中选2名同学,这3名同学召开座谈会,求成果在[40,50)中的同学A1和成果在[90,100]中的同学B1同时被选中的概率.11.某学校为预备参与市运动会,对本校甲、乙两个田径队中30名跳高运动员进行了测试,并接受茎叶图(如图)表示本次测试30人的跳高成果(单位:cm),跳高成果在175 cm以上(包括175 cm)定义为“合格”,跳高成果在175 cm以下(不包括175 cm)定义为“不合格”.(1)若用分层抽样的方法从甲、乙两队全部的运动员中共抽取5人,则5人中“合格”与“不合格”的人数各为多少?(2)若从甲队178 cm(包括178 cm)以上的6人中抽取2人,则至少有一人在186 cm以上(包括186 cm)的概率为多少?【检测与评估答案】第66课统计初步1.20 【解析】设抽取的松树苗为n 棵,则400n =1503000,所以n=20.2.19 【解析】设样本中另外一个职工的编号是x ,则用系统抽样抽出的4个职工的号码从小到大依次为6,x ,32,45,它们构成等差数列,所以6+45=x+32,所以x=19,因此另外一个职工的编号是19.3.30 【解析】由于分数在[70,80)内的频率为1-10×(0.005+0.010+0.015×2+0.025)=0.3,所以分数在[70,80)内的人数是0.3×100=30.4.3.2 【解析】x =15(18+16+15+16+20)=17,s 2=15[(18-17)2+(16-17)2×2+(15-17)2+(20-17)2]=3.2.5.2 【解析】x =(6+7+8+9+m )×15=8,得m=10,所以s 2=15×[(6-8)2+(7-8)2+(8-8)2+(9-8)2+(10-8)2]=2,所以s=2.6.160 【解析】由茎叶图可知在20名老师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估量400名老师中,使用多媒体进行教学的次数在[16,30)内的人数为400×820=160.7.36 【解析】设样本数据落在区间[10,12)内的频率与组距的比为x ,则(0.02+0.05+x+0.15+0.19)×2=1,得x=0.09,故样本数据落在区间[10,12)内的频数为0.09×2×200=36.8.4 【解析】由题意知s 2=14(21x +22x +23x +24x-16)=14[(x 1-x )2+(x 2-x )2+(x 3-x )2+(x 4-x )2],所以2x (x 1+x 2+x 3+x 4)-42x =16,所以82x -42x =16,即x =2,所以所求平均数为x +2=4.9.(1)x 甲=110(8+6+7+8+6+5+9+10+4+7)=7,x 乙=110(6+7+7+8+6+7+8+7+9+5)=7. (2)2s 甲=110[(8-7)2+(6-7)2+…+(7-7)2]=3.0,2s乙=110[(6-7)2+(7-7)2+…+(5-7)2]=1.2.(3)由(1)知x 甲=x 乙,说明甲、乙两名战士的平均水平相当; 又由(2)知2s 甲>2s 乙,说明甲战士射击状况波动大,因此乙战士比甲战士射击状况稳定.10.(1)由题意可知各组频率分别为0.04,0.06,0.28,0.30,0.24,0.08,所以图中各组的纵坐标分别为0.004,0.006,0.028,0.030,0.024,0.008,则被抽查同学成果的频率分布直方图如图所示.(第10题)(2)记成果在[40,50)中的同学为A 1,A 2,成果在[90,100]中的同学为B 1,B 2,B 3,B 4,记“A 1和B 1同时被选中”为大事M.由题意可得,全部的基本大事为A 1B 1B 2,A 1B 1B 3,A 1B 1B 4,A 1B 2B 3,A 1B 2B 4,A 1B 3B 4,A 2B 1B 2,A 2B 1B 3,A 2B 1B 4,A 2B 2B 3,A 2B 2B 4,A 2B 3B 4,共12个. 大事M 包含的基本大事为A 1B 1B 2,A 1B 1B 3,A 1B 1B 4,共3个.所以同学A 1和B 1同时被选中的概率P (M )=312=14.11.(1)依据茎叶图可知30人中有12人“合格”,有18人“不合格”.用分层抽样的方法,则5人中“合格”与“不合格”的人数分别为2,3.(2)从甲队178 cm(包括178 cm)以上的6人中抽取2人的基本大事为(178,181),(178,182),(178,184),(178,186),(178,191),(181,182),(181,184),(181,186),(181,191),(182,184),(182,186),(182,191),(184,186),(184,191),(186,191),共15个.其中都小于186 cm的基本大事为(178,181),(178,182),(178,184),(181,182),(181,184),(182,184),共6个.所以都小于186 cm的概率P=615=25,由对立大事的概率公式得至少有一人在186 cm以上(包括186 cm)的概率为1-P=1-25=35.。
高中数学(人教B版)必修第二册:分层抽样【精品课件】
2.下列试验中最适合用分层抽样法抽样的是( ) A.从一箱 3 000 个零件中抽取 5 个入样 B.从一箱 3 000 个零件中抽取 600 个入样 C.从一箱 30 个零件中抽取 5 个入样 D.从甲厂生产的 100 个零件和乙厂生产的 200 个零件中抽取 6 个入样 D [D 选项中甲、乙生产的零件有差异,最适合分层抽样.]
160 [男生人数为 560×5602+80420=160.]14源自合 作探究
释 疑
难
15
分层抽样的概念 【例 1】 (1)下列各项中属于分层抽样的特点的是( ) A.从总体中逐个抽取 B.将总体分成几层,分层进行抽取 C.将总体分成几部分,按事先确定的规则在各部分中抽取 D.将总体随意分成几部分,然后进行随机抽取
(2)分成的各层互不交叉;
(3)各层抽取的比例都等于样本容量在总体中的比例,即Nn ,其中 n 为样本容量,N 为总体容量.
31
2.计算各层所抽取个体的个数时,若 Ni·Nn 的值不是整数怎么 办?
[提示] 为获取各层的入样数目,需先正确计算出抽样比Nn,若 Ni·Nn 的值不是整数,可四舍五入取整,也可先将该层等可能地剔除多 余的个体.
21
(1)④ (2)分层抽样 [(1)①中对四个饲养房抽取的白鼠平均分, 但由于各饲养房所养数量不一,反而造成了每个个体入选的可能性 不相等,是错误的方法.②中保证了每个个体入选的可能性相等, 但由于没有注意到处在四个不同环境会产生不同差异,不如采用分 层抽样可靠性高,且统一编号、统一选择加大了工作量.③中总体 采用了分层抽样,但在每个层次中抽取时有一定的主观性,貌似随 机,实则每个个体被抽到的可能性无法保证相等.
11
3.甲校有 3 600 名学生,乙校有 5 400 名学生,丙校有 1 800 名学生,为统计三校学生某方面的情况,计划采用分层抽样法抽取 一个容量为 90 的样本,应在这三校分别抽取学生( )
统计学概论主要术语
第1章统计学研究什么?主要术语1. 统计学(statistics):收集、处理、分析、解释数据并从数据中得出结论的科学。
2. 描述统计(descriptive statistics):研究数据收集、处理和描述的统计学方法。
3. 推断统计(inferential statistics):研究如何利用样本数据来推断总体特征的统计学方法。
4. 变量(variable):每次观察都会得到不同结果的某种特征。
5. 分类变量(categorical variable):又称无序分类变量,观测结果表现为某种类别的变量。
6. 顺序变量(rank variable):又称有序分类变量,观测结果表现为某种有序类别的变量。
7. 数值变量(metric variable):又称定量变量,观测结果表现为数字的变量。
8. 分类数据(categorical data):只能归于某一类别的非数字型数据。
9. 顺序数据(rank data):只能归于某一有序类别的非数字型数据。
10. 数值型数据(metric data):按数字尺度测量的数据。
11. 总体(population):包含所研究的全部个体(数据)的集合。
12. 样本(sample):从总体中抽取的一部分元素的集合。
13. 样本量(sample size):构成样本的元素的数目。
14. 简单随机抽样(simple random sampling):从含有N个元素的总体中,抽取n个元素组成一个样本,使得总体中的每一个元素都有相同的机会(概率)被抽中。
15. 分层抽样(stratified sampling):也称分类抽样,在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。
16. 系统抽样(systematic sampling):也称等距抽样,先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后每隔一定的间隔抽取一个元素,直至抽取n个元素组成一个样本。
统计学考试试卷A及答案
2012—2013学年第二学期闽江学院考试试卷考试课程:统计学试卷类别:A卷B卷□考试形式:闭卷开卷□适用专业年级:2011级金融学、国际贸易学、保险学专业注明:试题答案请做在答题纸上。
一、单选题(每题1分,共30分,30%)1.下列不属于描述统计问题的是()A根据样本信息对总体进行的推断B了解数据分布的特征C分析感兴趣的总体特征D 利用图,表或其他数据汇总工具分析数据2.根据样本计算的用于推断总体特征的概括性度量值称作()A.参数B.总体C.样本D.统计量3.通过调查或观测而收集到的数据称为()A.观测数据B.实验数据C.时间序列数据D.截面数据4.从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n 个元素为止,这样的抽样方法称为()。
A.重复抽样B.不重复抽样C.分层抽样D.整群抽样5.调查时首先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。
这样的调查方式称为()。
A系统抽样B整群抽样C滚雪球抽样D判断抽样6.下面的哪一个图形最适合于描述结构性问题()A.条形图B.饼图C.雷达图D.直方图7.对于大批量的数据,最适合描述其分布的图形是()A.条形图B.茎叶图C.直方图D.饼图8.将某企业职工的月收入依次分为2000元以下、2000元~3000元,3000元~4000元、4000元~5000元、5000元以上几个组。
最后一组的组中值近似为().7500 C下列关于众数的叙述,不正确的是()A.一组数据可能存在多个众数B.众数主要适用于分类数据C.一组数据的众数是唯一的D.众数不熟极端值的影响10.一组数据的最大值与最小值之差称为()A.平均数B.标准差C.极差D.四分位差11.如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=3,其意义是()A.至少有75%的数据落在平均数加减3个标准差的范围之内B.至少有89%的数据落在平均数加减3个标准差的范围之内C.至少有94%的数据落在平均数加减3个标准差的范围之内D.至少有99%的数据落在平均数加减3个标准差的范围之内12.下列不是次序统计量的是()。
分层抽样
A组 1.p64 A组 5题 2.某企业共有3200名职工, 2.某企业共有3200名职工,其中 中、青、老年 某企业共有3200名职工 职工的比例为5:3:2 5:3:2, 职工的比例为5:3:2,从所有职工中抽取一个 样本容量为400的样本, 400的样本 样本容量为400的样本,采用那种抽样方法更 合理? 老年职工应分别抽取多少人? 合理?中、青、老年职工应分别抽取多少人?
C
一个总体分为A 两层, 5.一个总体分为A,B两层,用分层抽样方法从 一个总体分为 总体中抽取一个容量为10的样本。已知B 10的样本 总体中抽取一个容量为10的样本。已知B层中 每个个体被抽到的概率为1/12 1/12, 每个个体被抽到的概率为1/12,则总体中的 个数为 120
课堂练习
1.某学校青年志愿者协会共有250名成员,其中高一学生 1.某学校青年志愿者协会共有250名成员, 某学校青年志愿者协会共有250名成员 88名 高二学生112 112名 高三学生50 50名 88名,高二学生112名,高三学生50名,为了了解志愿者 活动与学校学习之间的关系,需要抽取50 50名学生进行 活动与学校学习之间的关系,需要抽取50名学生进行 调查,试确定抽取方法,并写出过程. 调查,试确定抽取方法,并写出过程. 答案:由于各年级的学习情况不同,因此采用分层抽样. 由于志愿者由三个年级的学生组成,故分三层进行抽样. 因为50/250=1/5,所以在高一年级抽取88/5=17.6~~18人, 在高二年级抽取112/5=22.4~~22人,在高三年级抽取 50/5=10人.最后将这50个人组合在一个,就得到一个样 本.
D
2.分层抽样又称类型抽样,即将相似的 分层抽样又称类型抽样, 个体归入一层, 个体归入一层,然后每层抽取若干个个体 构成样本, 构成样本,所以分层抽样为保证每个个体 等可能入样,必须进行() 等可能入样,必须进行() A.每层等可能抽样 A.每层等可能抽样 B.每层不等可能抽样 B.每层不等可能抽样 C.所有层按同一抽样比等可能抽样 C.所有层按同一抽样比等可能抽样
统计学考试试卷A及答案
2012—2013学年第二学期闽江学院考试试卷考试课程:统计学试卷类别:A卷□√ B卷□考试形式:闭卷□√开卷□适用专业年级:2011级金融学、国际贸易学、保险学专业注明:试卷答案请做在答题纸上。
一、单选题(每题1分,共30分,30%)1. 下列不属于描述统计问题的是()A根据样本信息对总体进行的推断B了解数据分布的特征C分析感兴趣的总体特征D利用图,表或其他数据汇总工具分析数据2. 根据样本计算的用于推断总体特征的概括性度量值称作()A.参数 B. 总体C.样本 D. 统计量3. 通过调查或观测而收集到的数据称为()A.观测数据 B. 实验数据C.时间序列数据 D. 截面数据4. 从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为()。
A.重复抽样B.不重复抽样C.分层抽样D.整群抽样5. 调查时首先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。
这样的调查方式称为()。
A 系统抽样B 整群抽样C 滚雪球抽样D 判断抽样6. 下面的哪一个图形最适合于描述结构性问题()A.条形图B.饼图C.雷达图D. 直方图7. 对于大批量的数据,最适合描述其分布的图形是( )A.条形图B.茎叶图C.直方图D.饼图8. 将某企业职工的月收入依次分为2000元以下、2000元~3000元,3000元~4000元、4000元~5000元、5000元以上几个组。
最后一组的组中值近似为( ).7500 C9. 下列关于众数的叙述,不正确的是()A.一组数据可能存在多个众数B.众数主要适用于分类数据C.一组数据的众数是唯一的D.众数不熟极端值的影响10. 一组数据的最大值与最小值之差称为()A.平均数B.规范差C.极差D.四分位差11.如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=3,其意义是()A.至少有75%的数据落在平均数加减3个规范差的范围之内B. 至少有89%的数据落在平均数加减3个规范差的范围之内C.至少有94%的数据落在平均数加减3个规范差的范围之内D. 至少有99%的数据落在平均数加减3个规范差的范围之内12. 下列不是次序统计量的是()。
分层抽样
(1)将总体按一定的进行分层;
(2)计算各层中与的比;
(3)按各层确定各层应抽取的个体数量;
(4)在每层进行抽样,组成样本.(各层抽样采用什么方法)
3.当总体是由_______________组成时,往往选用分层抽样的方法.
■合作探究:
【例1】一电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下表所示:
A.15,5,25 B.15,15,15
C.10,5,30 D.15,10,20
2.(2008陕西高考)某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为()
A.30B.25C.20D.15
3.(2009陕西卷文)某单位共有老、中、青职工430人,其中青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为
6.某单位有工程师6人,技术员12人,技工18人,要从这些人
中抽取一个容量为n的样本.如果采用系统抽样和分层抽样方
法抽取,却不用剔除个体;如果样本容量增加1个,则在采用系
统抽样时,需要在总体中先剔除1个个体,求样本容量n.
【知识小结】
4.三种抽样方法的比较
类别
共同点
各自特点
相互联系
适用范围
简单随机
抽样
(3)某学校有160名教职工,其中教师120名,行政人员16名,后勤人员24名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.
【达标测评】
高中数学知识点总结:分层抽样
高中数学知识点总结:分层抽样
分层抽样
1.分层抽样(类型抽样):
先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。
两种方法:
1.先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。
2.先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。
2.分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。
分层标准:
(1)以调查所要分析和研究的主要变量或相关的变量作为分层的标准。
(2)以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。
(3)以那些有明显分层区分的变量作为分层变量。
3.分层的比例问题:
(1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。
(2)不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。
如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。
高中数学知识点总结第 1 页共1 页。
3.分层抽样
解:因为疾病与地理位置和水土均有关系,
所以不同乡镇的发病情况差异明显,因而采用 分层抽样的方法,具体过程如下: (1)将3万人分为5层,其中一个乡镇为一层。 (2)按照样本容量的比例随机抽取各乡镇应 抽取的样本。 300×3/15=60(人),300×2/15=100(人), 300×2/15=40(人),300×2/15=60(人), 因此各乡镇抽取人数分别为60人、40人、100人、 40人、60 人。 (3)将300人组到一起,即得到一个样本。
例4、从编号为1~50的50枚最新研制 的某种型号的导弹中随机抽取5枚来进行发 射实验,若采用每部分选取的号码间隔一 样的系统抽样方法,则所选取5枚导弹的编 号可能是( B ) A.5,10,15,20,25 B、3,13,23,33,43 C、1, 2, 3, 4, 5 D、2, 4, 6, 16,32
16
例6:采用系统抽样从个体数为83的总体中 抽取一个样本容量为10的样本,那么每个个体
10 人样的可能性为 _________. 83
例7:从2004名学生中选取50名组成参观 团,若采用下面的方法选取:先用简单随机抽 样从2004人中剔除4人,剩下的2000个再按系 统抽样的方法进行,则每人入选的机会( C)
7
〖说明〗(1)分段间隔的确定:
剔除几个个体,使得总体中剩余的个体数能被样
N 本容量整除.通常取k= n
N N 当 是整数时,取k= ; n n N 当 不是整数时,可以先从总体中随机地 n
(2)从系统抽样的步骤可以看出,系统抽样 是把一个问题划分成若干部分分块解决,从而 把复杂问题简单化,体现了数学转化思想。
22
2、某高中共有900人,其中高一年级300人, 高二年级200人,高三年级400人,现采用分层 抽样抽取容量为45的样本,那么高一、高二、 高三各年级抽取的人数分别为( ) D A.15,5,25 15,15,15 C.10,5,30 D15,10,20 3:一个地区共有5个乡镇,人口3万人,其中人 口比例为3:2:5:2:3,从3万人中抽取一个 300人的样本,分析某种疾病的发病率,已知这 种疾病与不同的地理位置及水土有关,问应采 取什么样的方法?并写出具体过程。
分层抽样
二,分层抽样的步骤: 分层抽样的步骤: (1)分层:将总体按某种特征分成若干部分. 分层:将总体按某种特征分成若干部分. 确定比例: (2)确定比例:计算各层的个体数与总体的 个体数的比. 个体数的比. 确定各层 各层应 取的样本容量. 样本容量 (3)确定各层应抽取的样本容量. 在每一层进行抽样( (4)在每一层进行抽样(各层分别按简单随 机抽样或系统抽样的方法抽取),综合每层抽 ),综合 机抽样或系统抽样的方法抽取),综合每层抽 组成样本. 样,组成样本. 练习:某校高一,高二和高三年级分别有学生 练习:某校高一, 1000,800,700名 1000,800,700名,为了了解全校学生的 视力情况,从中抽取容量为100的样本, 100的样本 视力情况,从中抽取容量为100的样本,怎样 抽取较为合理? 抽取较为合理?
应用举例
3 某科研单位有科研人员 某科研单位有科研人员160人,其中具有高级 人 其中具有高级 以上职称的24人 中级职称 中级职称48人 其余均为初级以下 以上职称的 人,中级职称 人,其余均为初级以下 职称,现要抽取一个容量为 的样本,试确定抽样方 现要抽取一个容量为20的样本 职称 现要抽取一个容量为 的样本 试确定抽样方 并写出抽样过程. 法,并写出抽样过程 并写出抽样过程 宜采用分层抽样的抽取方法
分层抽样
一个单位的职工500 500人 其中不到35岁的有125 35岁的有125人 问题 一个单位的职工500人,其中不到35岁的有125人,35 49岁的有280人 50岁以上的有95人 岁的有280 岁以上的有95 到49岁的有280人,50岁以上的有95人。为了了解这个单位职 工与身体状况有关的某项指标,要从中抽取一个容量为100 100的 工与身体状况有关的某项指标,要从中抽取一个容量为100的 样本。由于职工年龄与这项指标有关,试问: 样本。由于职工年龄与这项指标有关,试问:应用什么方法 抽取?能在500人中任意取100个吗?能将100 500人中任意取100个吗 100个份额均分到这 抽取?能在500人中任意取100个吗?能将100个份额均分到这 三部分中吗? 三部分中吗? 抽样比 解:(1)确定样本容量与总体的个体数之比100:500=1:5 :(1 确定样本容量与总体的个体数之比100:500=1: 样本容量 之比100 (2)利用抽样比确定各年龄段应抽取的个体数, 利用抽样比确定各年龄段应抽取的个体数, 利用抽样比确定各年龄段应抽取的个体数 利用抽样比确定各年龄段应抽取的个体数, 抽样比确定各年龄段应抽取的个体数 依次为
说明 分层抽样又称类型抽样,应用分层抽样应遵循以下要求: 分层抽样又称类型抽样,应用分层抽样应遵循以下要求: 分层:将相似的个体归人一类,即为一层, (1)分层:将相似的个体归人一类,即为一层,分层要求每 层的各个个体互不交叉,即遵循不重复、不遗漏的原则。 层的各个个体互不交叉,即遵循不重复、不遗漏的原则。 分层抽样为保证每个个体等可能入样, (2)分层抽样为保证每个个体等可能入样,需遵循在各层中 进行简单随机抽样, 进行简单随机抽样,每层样本数量与每层个体数量的比与这 层个体数量与总体容量的比相等 分层抽样的步骤: 分层抽样的步骤: (1)分层:按某种特征将总体分成若干部分。 分层:按某种特征将总体分成若干部分。 比例确定每层抽取个体的个数。 (2)按比例确定每层抽取个体的个数。 确定每层抽取个体的个数 各层分别按简单随机抽样的方法抽取。 (3)各层分别按简单随机抽样的方法抽取。 综合每层抽样,组成样本。 (4)综合每层抽样,组成样本。
分层随机抽样(答案)
分层随机抽样一、单选题1、分层抽样设计效应满足(B )A 、1deff =B 、1deff <C 、1deff ≈D 、1deff > 2、分层抽样的特点是(A )A 、层内差异小,层间差异大B 、层间差异小,层内差异大C 、层间差异小D 、层内差异大3、下面的表达式中错误的是(D ) A 、∑=1hfB 、∑=n n hC 、∑=1h WD 、∑=1h N4、在给定费用下估计量的方差)(st y V 达到最小,或者对于给定的估计量方差V 使得总费用达到最小的样本量分配称为(C )A 、常数分配B 、比例分配C 、最优分配D 、奈曼分配5、最优分配(opt V )、比例分配(prop V )的分层随机抽样与相同样本量的简单随机抽样(srs V )的精度之间的关系式为(A )A 、srs prop opt V V V ≤≤B 、srs opt prop V V V ≤≤C 、srs opt prop V V V ≥≥D 、opt prop srs V V V ≤≤ 6、下面哪种样本量分配方式属于比例分配?( A)A 、N nN n h h = B 、hLh hhh h h h c S Nc S N nn ∑==1C 、∑==L h h h h h h S N S N n n 1D 、∑==L h hh h h h S W S W nn 17、下面哪种样本量分配属于一般最优分配?( B)A 、N nN n h h = B 、hLh hhh h h h c S Nc S N nn ∑==1C 、∑==L h h h h h h S N S N n n 1D 、∑==L h hh h h h S W S W nn 1二、多选题1.分层抽样又被称为( BC )A. 整群抽样B. 类型抽样C. 分类抽样D. 系统抽样E. 逆抽样 2.在分层随机抽样中,当存在可利用的辅助变量时,为了提高估计精度,可以采用( BCD ) A. 分层比估计 B. 联合比估计 C. 分别回归估计 D.联合回归估计 E. 分别简单估计 3.样本量在各层的分配方式有( ABCD )A. 常数分配B. 比例分配C. 最优分配D. 奈曼分配E. 等比分配 4.分层抽样的优点有( ABCDE )A. 在调查中可以对各个子总体进行参数估计B. 易于分工组织及逐级汇总C. 可以提高估计量的精度D. 实施方便E. 保证样本更具有代表性 5.关于分层数的确定,下面说法正确的有( CE )A. 层数多一些比较好B. 层数少一些比较好C. 层数一般以不超过6为宜D. 层数一般以4 层为最好E. 应该充分考虑费用和精度要求等因素来确定层数 6.下面哪种样本量分配方式属于奈曼分配? ( CD ) A.h h n nN N =B. 1/h h h h n nN S ==∑ C. 1k h h L h h h n N S n N S ==∑D.1h h h L h h h n W S n W S ==∑E. 1/h h h h nnW S ==∑ 7.事后分层的适用场合有(ABCD )A. 各层的抽样框无法得到B. 几个变量都适宜于分层,而要进行事先的多重交叉分层存在一定困难C. 一个单位到底属于哪一层要等到样本数据收集到以后才知道D. 总体规模太大,事先分层太费事E. 一般场合都可以适用 三、名次解释1. 分层随机抽样2. 自加权3. 最优分配 四、简答题1. 简述分层随机抽样相对于简单随机抽样的优点。
高中数学必修三:分层抽样
统抽样
成10
1、某高中共有900人,其中高一年级300人,
高二年级200人,高三年级400人,现采用分层
抽样抽取容量为45的样本,那么高一、高二、
高三各年级抽取的人数分别为D( )
A.15,5,25
B.15,15,15
C.10,5,30
D 15,10,20
11
2、一个地区共有5个乡镇,人口15万人,其中人口比 例为3:2:5:2:3,现从15万人中抽取一个1500 人的样本,分析某种疾病的发病率,已知这种疾病与 不同的地理位置及水土有关,问应采取什么样的方法 抽样?并写出具体过程。
中小学生中抽取1%的学生进行调查,你认为
应当怎样抽取样本?
【分析】本问题中不同年龄段的学生的近视情况可能有
明显差异而且三个部分的学生数相差较大,所以我们采
用另一种抽样方法——分层抽样。因为样本容量与总体
中的个体数的比是1:100,所以样本中包含的各部分的
个体数分别是2400/100,10900/100 ,11000/100,
②这两项调查采用的抽样方法依次B是( )
A.分层抽样法,系统抽样法
B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法
D.简单随机抽样法,分层抽样法 14
3、某单位有职工160人,其中业务员有104人,管 理人员32人,后勤24人,现用分层抽样从中抽取一
容量为20的样本,则抽取管理人员(B )人
12
反馈练习
1、下列问题中,采用怎样的抽样方法比较合理:
①从10台冰箱中抽取3台进行质量检查; ①简单随机抽样 ②某电影院有32排座位,每排有40个座位,座位号为1~ 40。
有一次报告会坐满了听众,会议结束后为听取意见,留下座位
2015年高考-概率与统计试题(有详细答案)详解
2015年高考-概率与统计试题1.(15北京理科)A,B两组各有7位病人,他们服用某种药物后的康复时间(单位:天)记录如下:A组:10,11,12,13,14,15,16B组:12,13,15,16,17,14,a假设所有病人的康复时间互相独立,从A,B两组随机各选1人,A组选出的人记为甲,B组选出的人记为乙.(Ⅰ) 求甲的康复时间不少于14天的概率;(Ⅱ) 如果25a=,求甲的康复时间比乙的康复时间长的概率;(Ⅲ) 当a为何值时,A,B两组病人康复时间的方差相等?(结论不要求证明)【答案】(1)37,(2)1049,(3)11a=或182.(15北京文科)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本的老年教师人数为()A.90 B.100 C.180 D.300类别人数老年教师900中年教师1800青年教师1600合计4300【答案】C【解析】试题分析:由题意,总体中青年教师与老年教师比例为1600169009=;设样本中老年教师的人数为x,由分层抽样的性质可得总体与样本中青年教师与老年教师的比例相等,即320169x=,解得180x=.考点:分层抽样.3.(15北京文科)某辆汽车每次加油都把油箱加满,下表记录了该车相邻两次加油时的情况.加油时间加油量(升)加油时的累计里程(千米)2015年5月1日12350002015年5月15日4835600注:“累计里程“指汽车从出厂开始累计行驶的路程,在这段时间内,该车每100千米平均耗油量为()A.6升 B.8升 C.10升D.12升【答案】B【解析】试题分析:因为第一次邮箱加满,所以第二次的加油量即为该段时间内的耗油量,故耗油量48V=升. 而这段时间内行驶的里程数3560035000600S=-=千米. 所以这段时间内,该车每100千米平均耗油量为481008600⨯=升,故选B.考点:平均耗油量.4.(15北京文科)高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ; ②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 . 【答案】乙、数学 【解析】试题分析:①由图可知,甲的语文成绩排名比总成绩排名靠后;而乙的语文成绩排名比总成绩排名靠前,故填乙.②由图可知,比丙的数学成绩排名还靠后的人比较多;而总成绩的排名中比丙排名靠后的人数比较少,所以丙的数学成绩的排名更靠前,故填数学. 考点:散点图.5.(15北京文科)某超市随机选取1000位顾客,记录了他们购买甲、乙、丙、丁四种商品的情况,整理成如下统计表,其中“√”表示购买,“×”表示未购买.甲乙丙丁100 √ × √ √ 217 × √ × √ 200√ √ √ × 300√ × √ × 85√ × × × 98×√××(Ⅰ)估计顾客同时购买乙和丙的概率;(Ⅱ)估计顾客在甲、乙、丙、丁中同时购买3中商品的概率;(Ⅲ)如果顾客购买了甲,则该顾客同时购买乙、丙、丁中那种商品的可能性最大? 【答案】(1)0.2;(2)0.3;(3)同时购买丙的可能性最大.商品 顾 客 人 数【解析】试题分析:本题主要考查统计表、概率等基础知识,考查学生的分析问题解决问题的能力、转化能力、计算能力.第一问,由统计表读出顾客同时购买乙和丙的人数200,计算出概率;第二问,先由统计表读出顾客在甲、乙、丙、丁中同时购买3中商品的人数100+200,再计算概率;第三问,由统计表读出顾客同时购买甲和乙的人数为200,顾客同时购买甲和丙的人数为100+200+300,顾客同时购买甲和丁的人数为100,分别计算出概率,再通过比较大小得出结论.试题解析:(Ⅰ)从统计表可以看出,在这1000位顾客中,有200位顾客同时购买了乙和丙,所以顾客同时购买乙和丙的概率可以估计为2000.21000=. (Ⅱ)从统计表可以看出,在在这1000位顾客中,有100位顾客同时购买了甲、丙、丁,另有200位顾客同时购买了甲、乙、丙,其他顾客最多购买了2种商品.所以顾客在甲、乙、丙、丁中同时购买3种商品的概率可以估计为1002000.31000+=.(Ⅲ)与(Ⅰ)同理,可得:顾客同时购买甲和乙的概率可以估计为2000.21000=, 顾客同时购买甲和丙的概率可以估计为1002003000.61000++=,顾客同时购买甲和丁的概率可以估计为1000.11000=,所以,如果顾客购买了甲,则该顾客同时购买丙的可能性最大. 考点:统计表、概率.6.(15年广东理科)已知随机变量X 服从二项分布(),n p B ,若()30E X =,()D 20X =,则p = . 【答案】13. 【解析】依题可得()30E X np ==且()()120D X np p =-=,解得13p =,故应填入13.【考点定位】本题考查二项分布的性质,属于容易题. 7.(15年广东理科)某工厂36名工人的年龄数据如下表。
分层抽样
某社区有500个家庭,其中高收入家庭125户, 中等收入家庭 280 户,低收入家庭 95 户,为了 调查社会购买力的某项指标,要从中抽取 1 个 容量为100户的样本,则采用( )抽样 方法;某校大一有12名女排运动员,要从中抽 取3人调查学习负担情况,则采用( ) 抽样方法。
为了调查某产品的销售情况,销售部门从下属 的 92家销售连锁店中抽取30家了解情况。若采 用系统抽样法,则抽样间隔和随机剔除的个数 分别是( )( )。
系统抽样的效果会受个体编号的影响, 而简单随机抽样的效果不受个体编号的 影响。
二、步骤:
假设要从容量为N的总体中抽取容量为n的样本。 (1)先将总体的N个个体排序,进行连续编号; (2)确定分段间隔 k,对编号进行分段,当N/n是整数时,取 k=N/n;当N/n不是整数时,从N中剔除一些个体,使得其为整 数为止。 (3)在第1段用简单随机抽样确定第一个样本编号l(l≤k);
三、步骤
(1)确认目标总体。 (2)决定样本数。 (3)确定分层的特征,如年龄、性别等。 (4)将总体分成若干个不可重叠的部分,即分层后, 同一层内部的单位尽可能是同质的,不同层之间的单 位尽可能是异质的。 (5)根据一定的方式确定各层应抽取的样本量。 (6)分别采用简单随机抽样或者系统抽样的方式从 各层中抽取相应的样本。
分层随机抽样、分群随 机抽样、系统随机抽样
15五年制电商
§3.2.2、分层随机抽样技术 一、概念
分层随机抽样,又称为分层抽样、 类型随 机 抽 样 , 就是先将总体按一定标准划分为 若干层,然后在各层中随机抽取样本的一 种方式,通过对总体进行分层,可保证样 本的代表性。 分层抽样的抽样误差≤简单随机抽样的抽样 误差。
15-16.分层抽样
共同特点:抽样过程中每个个体被抽取的概率 相等.
简单随机抽样: 从总体中逐个不放回抽取 总体中的个体数较少 系统抽样: 将总体分成均衡几部分,按规则关联抽取 用简单随机抽样抽取起始号码 总体中的个体数较多 分层抽样: 将总体分成几层,按比例分层抽取. 用简单随机抽样或系统抽样对各层抽样. 总体由差异明显的几部分组成.
探究:某地区有高中生2400人,初中生10900人, 小学生11000人.当地教育部门为了了解本地区中小学 生的近视情况及其形成原因,要从本地区的中小学生 中抽取1%的学生进行调查,你认为应当怎样抽取样本?
样本容量与总体个数的比例为1:100,则
高中应抽取人数为2400*1/100=24人, 初中应抽取人数为10900*1/100=109人,
小学应抽取人数为11000*1/100=110人.
上述抽样方法从学生人数这个角度来看,获得 的样本结构与这一地区全体中小学生的结构是基本 相同的.不仅保证了抽样的公平性,而且抽取的样 本具有较好的代表性,从而是一种科学、合理的抽 样方法,这种抽样方法称为分层抽样.
一不交叉的层,然后按照一定 的比例,从各层独立地抽取一定数量的个体,再将 各层取出的个体合在一起作为样本,这种抽样的方 法是一种分层抽样.
2.1.3 分层抽样
探究:某地区有高中生2400人,初中生10900人, 小学生11000人.当地教育部门为了了解本地区中小学 生的近视情况及其形成原因,要从本地区的中小学生 中抽取1%的学生进行调查,你认为应当怎样抽取样本? 设计科学、合理的抽样方法,其核心问题是保证 抽样公平,并且样本具有好的代表性.影响学生视力 的因素是很复杂的,例如,不同年龄段的学生的近视 情况可能存在明显差异.故用简单随机抽样或系统抽 样,都可能使样本不具有好的代表性.对于此类抽样 问题,我们需要一个更好的抽样方法来解决.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章
统 计(必修3)
返回目录
1.1 随机抽样 1.1.3 分层抽样
返回目录
课前 教材预案 课堂 深度拓展 课末 随堂演练 课后 限时作业
返回目录
课前教材预案
要点一 分层抽样的概念 1.定义 一般地,在抽样时,将总体分成_互_不__交__叉__的层,然 后按照__一__定__的_比__例_____,从各层__独__立_地___抽取一定数量 的个体,将各层取出的个体合在一起作为样本,这种抽 样方法叫分层抽样.
【例题3】 一个单位有职工500人,其中不到35岁的 有125人,35岁至49岁的有280人,50岁以上的有95人, 为了了解与身体状况有关的某项指标,要从所有职工中 抽 取 100 名 职 工 作 为 样 本 , 若 职 工 年 龄 与 这 项 指 标 有 关,应该怎样抽取?
思维导引: 观察特征 → 确定抽样方法 → 求出比例
班抽出16人参加军训表演,则一班和二班分别被抽取的
人数是( )
A.8,8
B.10,6
C.9,7
D.12,4
答案 C
返回目录
解析 抽样比为541+642=16,则一班和二班分别被抽 取的人数是 54×16=9,42×16=7.
返回目录
3.(分层抽样中的有关计算)某大学为了解在校本科 生对参加某项社会实践活动的意向,拟采用分层抽样的 方法,从该校四个年级的本科生中抽取一个容量为300 的样本进行调查.已知该校一年级、二年级、三年级、 四年级的本科生人数之比为4∶5∶5∶6,则应从一年级 本科生中抽取____________名学生.
方法一:将140人从1~140编号,然后制作出标有 1~140的形状、大小相同的号签,并将号签放入同一箱 子里搅拌均匀,然后从中抽出20个号签,编号与号签相 同的20个人被选出.
返回目录
方法二:按20∶140=1∶7的比例,从教师中抽出 13人,从教辅行政人员中抽出4人,从总务后勤人员中 抽出3人.从各类人员中抽取所需人员时,均采用随机 数表法,可抽到20人.
→ 确定各层样本数 → 从各层中抽样 → 成样
返回目录
解析 用分层抽样来抽取样本,步骤是: (1)分层.按年龄将 500 名职工分成三层:不到 35 岁 的职工,35 岁至 49 岁的职工,50 岁以上的职工. (2)确定每层抽取个体的个数.抽样比为150000=15,则 在不到 35 岁的职工中抽 125×15=25(人);在 35 岁至 49 岁的职工中抽 280×15=56(人);在 50 岁以上的职工中抽 95×15=19(人).
返回目录
(3)在各层分别按抽签法或随机数法抽取样本. (4)综合每层抽样,组成样本.
返回目录
【变式3】 某城市有210家百货商店,其中大型商店 20家,中型商店40家,小型商店150家.为了掌握各商 店的营业情况,计划抽取一个容量为21的样本,按照分 层抽样方法抽取时,各种百货商店分别要抽取多少家? 写出抽样过程.
返回目录
2.适用范围 当总体是由_差__异__明__显_的几个部分组成时,往往采用 分层抽样.
返回目录
要点二 分层抽样的步骤
1.根据已掌握的信息,将总体分成_若__干_部__分__. 2.根据总体中的个体数 N 和样本容量 n 计算出抽样 比__k_=__Nn___.
返回目录
3.根据抽样比 k 计算出各层中应抽取的个体数: n _N__·N_i__(其中 Ni 为第 i 层所包含的个体总数).
思维导引:
变量y ―→ A,C产品数量间的关系 ―→
样本容量和各层中的样本数 ―→ 求出变量y
返回目录
解析 因为 C 产品的数量为 y,则 A 产品的数量为 x =3 000-1 300-y=1 700-y,又 C 产品的样本容量为 n, 则 A 产品的样本容量为 m=10+n,由分层抽样的定义可 知mx =1n7+001-0 y=ny=1133000,解得 y=800.
______按比 例抽取
每层抽样
时采用 _简__单__随_机__ __抽__样____
_总__体__由__差_
_异__明__显__的_
若干部分
___组__成___ ________
返回目录
思考: 计算各层所抽取个体的个数时,若 Ni·Nn的 值不是整数怎么办,分层抽样公平吗?
提示 为获取各层的入样数目,需先正确计算出抽样
比Nn,若 Ni·Nn的值不是整数,可四舍五入取整,也可先将 该层等可能地剔除多余的个体.分层抽样中,每个个体 被抽到的可能性是相等的,与层数、分层无关.
返回目录
课堂深度拓展
考点一 分层抽样的判断
分层抽样使用的前提是总体可以分层,层与层之间 有明显区别,而层内个体间的差异较小,每层中抽取的 个体数可按各层个体数在总体的个体数中所占比例抽 取.
各自特点
相互联 适用范
系
围
从总体中逐 个抽取
最基本 的抽样 方法
_总__体__容__量 _较__少_
返回目录
类别
共同点 各自特点 相互联系 适用范围
分层抽 样
_抽__样__过__程_中__各_ _个__个__体__被_抽__到_
的机会相等,
_且__都__是__不_放__回_ _____抽__取____
课末随堂演练
1.(抽样方法的选择)某公司在甲、乙、丙、丁四个 地区分别有150个、120个、180个、150个销售点.公司 为了调查产品销售的情况,需从这600个销售点中抽取 一个容量为100的样本,记这项调查为①;在丙地区中 有20个特大型销售点,要从中抽取7个调查其销售收入 和售后服务情况,记这项调查为②,则完成①②这两项 调查宜采用的抽样方法依次是( )
返回目录
思维导引:根据小学、初中、高中三个学段学生的 视力差异性比较大和男女生视力差异不大可确定抽样方 法.
答案 C 解析 由于该地区的中小学生人数比较多,不能采用 简单随机抽样,所以排除A项;由于该地区小学、初 中、高中三个学段学生的视力情况有较大差异,可采取 按照学段进行分层抽样,而男女生视力情况差异不大, 不能按照性别进行分层抽样,所以排除B,D项.
返回目录
A.分层抽样法、分层抽样法 B.分层抽样法、简单随机抽样法 C.简单随机抽样法、分层抽样法 D.简单随机抽样法、简单随机抽样法 答案 B 解析 依题意,第①项调查应采用分层抽样法,第② 项调查应采用简单随机抽样法.故选B项.
返回目录
2.(分层抽样中的有关计算)某校高三一班有学生54
人,二班有学生42人,现在要用分层抽样的方法从两个
返回目录
【例题2】 某企业三月中旬生产A,B,C三种产品 共3 000件,根据分层抽样的结果,该企业统计员制作 了如下的统计表.
产品类别 A B C 产品数量/件 x 1 300 y
样本容量 m 130 n
返回目录
由于不小心,表格中A,C产品的有关数据丢失, 统计员记得A产品的样本容量比C产品的样本容量多10. 根据以上信息,可得C产品的数量是________件.
返回目录
考点三 分层抽样的应用
(1)分层抽样实质是利用已知信息尽量使样本结构与 总体结构相似.在实际操作时,并不排斥与其他抽样方 法联合使用.
(2)在分层抽样的过程中,为了保证每个个体被抽到 的可能性是相同的,这就要求各层所抽取的个体数与该 层所包含的个体数之比等于样本容量与总体容量之比.
返回目录
返回目录
解析 由分层抽样的方法可得,应从一年级本科生中 抽取的学生人数为 300×4+5+4 5+6=60.
答案 60
返回目录
4.(分层抽样的应用)一个地区共有5个乡镇,总人 口3万人,其人口比例为3∶2∶5∶2∶3,从3万人中抽 取一个300人的样本,分析某种疾病的发病率,已知这 种疾病与不同的地理位置及水土有关,则应采取什么样 的方法?并写出具体过程.
中选出3名参加座谈会.
方法:Ⅰ.随机抽样法;Ⅱ.分层抽样法.
其中问题与方法能配对的是( )
A.①Ⅰ,②Ⅱ
B.①Ⅰ,②Ⅰ
C.①Ⅱ,②Ⅰ
D.①Ⅱ,②Ⅱ
返回目录
答案 C 解析 ①总体数比较大,且是由差异比较明显的三个 部分组成,故可用分层抽样来抽取样本;②总体与样本 都较少,可用随机抽样法.故选C项.
返回目录
答案 800
返回目录
【变式2】 某中学有高中生3 500人,初中生1 500 人,为了解学生的学习情况,用分层抽样的方法从该校
学生中抽取一个容量为n的样本,已知从高中生中抽取
70人,则n为( )
A.100
B.150
C.200
D.250
答案 A
解析 n=(3 500+1 500)×3 75000=100.故选 A 项.
返回目录
C.从1 000名工人中,抽取100人调查上班途中所 用时间
D.从生产流水线上,抽取样本检查产品质量 答案 B 解析 A项中总体所含个体无差异且个数较少,适合 用简单随机抽样;C项和D项中总体所含个体无差异, 不适合用分层抽样;B项中总体所含个体差异明显,适 合用分层抽样.
返回目录
考点二 分层抽样中各层样本容量的计算
解决分层抽样中有关抽样比问题的计算方法 对于分层抽样中的比值问题,常利用以下关系式巧 解: (1)总样体本的容个量数nN=该层 该抽 层取 的的 个个 体体 数数;
返回目录
(2)总体中某两层的个体数之比等于样本中这两层抽 取的个体数之比.
对于分层抽样中求某层个体数,或某层要抽取的样 本个体数,都可以通过上边两个等量关系求解.
返回目录
解析 因为疾病与地理位置和水土均有关系,所以不 同乡镇的发病情况差异明显,因而采用分层抽样的方法, 具体过程如下:①将 3 万人分为 5 层,其中一个乡镇为 一层;②按照样本容量的比例随机抽取各乡镇应抽取的 样本,300×135=60(人),300×125=40(人),300×155= 100(人),300×125=40(人),300×135=60(人),因此各乡 镇抽取人数分别为 60,40,100,40,60;③将 300 人组 到一起,即得到一个样本.