2016高考数学大一轮复习 11.2用样本估计总体教师用书 理 苏教版
高考数学第一轮知识点总复习 第二节 用样本估计总体
平.因为公司中少数人的月工资额与大多数人的月工资额差别较大,
这样导致了平均数与中位数的偏差较大,所以平均数不能客观真实
地反映这个公司员工的工资水平.
题型四 综合问题
【例4】(12分)某种瓶装溶液,因为装瓶机的不稳定性,所以很可能每 瓶装的容量都不是标准的容量.我们随机抽出了20瓶,测得它们的容量 (单位:百毫升)如下: 12.1 11.9 12.2 12.2 12.0 12.1 12.9 12.1 12.3 12.5 11.7 12.4 12.3 11.8 11.3 12.1 11.4 11.6 11.2 12.2
1
(2)频率分布直方图如图:
(3)电子元件寿命在100 h~400 h以内的频数为130,则频率 为 13=00.65. 200
(4)寿命在400 h以上的电子元件的频数为70,则频率 为 =700.35. 200
学后反思利用样本的频率分布可近似地估计总体的分布.从本例可 以看出,要比较准确地反映出总体70 分布的情况,必须准确地作出
[140,15 0)
人数
4
8
x
5
3
生产能 力分组 人数
表2:
[110, 120)
6
[120,130) [130,14 0)
y
36
[140,15 0)
18
(1)先确定x、y,再完成下列频率分布直方图,就生产能力而言, A类工人中个体间的差异程度与B类工人中个体间的差异程度哪 个更小?(不用计算,可通过观察直方图直接回答结论)
比;所有组距的频率之和为1;每一组距的频率是频率分布直方图中该
组距所对应的矩形的面积.
解
(1)M=0.102
=50,m=50-(1+4+20+15+8)=2n,N =m1,
苏教版江苏专版版高考数学一轮复习第十一章统计与概率第一节抽样方法用样本估计总体教案文解析版
1.简单随机抽样(1)抽取方式:逐个不放回抽取;(2)特点:每个个体被抽到的概率相等;(3)常用方法:抽签法和随机数表法.2.分层抽样(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.3.系统抽样的步骤(1)采用随机的方式将总体中的N个个体编号;(2)将编号按间隔k分段,当错误!是整数时,取k=错误!;当错误!不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N′能被n整除,这时取k=错误!,并将剩下的总体重新编号;(3)在第一段中用简单随机抽样确定起始的个体编号l;(4)按照一定的规则抽取样本,通常将编号为l,l+k,l+2k,…,l+(n—1)k的个体抽出.4.作频率分布直方图的步骤(1)求全距;(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.5.茎叶图的优点茎叶图的优点是不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.[提醒] 茎叶图中茎是指中间的一列数,叶是从茎的旁边生长出来的数.6.样本的数字特征(1)众数、中位数、平均数(2)标准差、方差1标准差:样本数据到平均数的一种平均距离,一般用s表示,s=错误!.2方差:标准差的平方s2s2=错误![(x1—错误!)2+(x2—错误!)2+…+(x n—错误!)2],其中x i(i=1,2,3,…,n)是样本数据,n是样本容量,错误!是样本平均数.[小题体验]1.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生3000人,则该校学生总人数是________.解析:设该校学生总人数为n,则1—错误!=错误!,解得n=7 500.答案:7 5002.某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为[35,40),[40,45),[45,50),[50,55),[55,60],由此得到频率分布直方图如图,则这80名教师中年龄小于45岁的有________人.解析:由频率分布直方图可知45岁以下的教师的频率为5×(0.040+0.080)=0.6,所以共有80×0.6=48(人).答案:483.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.解析:5个数的平均数错误!=错误!=5.1,所以它们的方差s2=错误![(4.7—5.1)2+(4.8—5.1)2+(5.1—5.1)2+(5.4—5.1)2+(5.5—5.1)2]=0.1.答案:0.11.简单随机抽样中易忽视样本是从总体中逐个抽取,是不放回抽样,且每个个体被抽到的概率相等.2.系统抽样中,易忽视抽取的样本数也就是分段的段数,当错误!不是整数时,注意剔除,剔除的个体是随机的,各段入样的个体编号成等差数列.3.在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.[小题纠偏]1.已知某商场新进3000袋奶粉,为检查其三聚氰胺是否超标,现采用系统抽样的方法从中抽取150袋检查,若第一组抽出的号码是11,则第六十一组抽出的号码为________.解析:每组袋数:d=错误!=20,由题意知这些号码是以11为首项,20为公差的等差数列.a61=11+60×20=1211.答案:12112.如图是甲、乙两名篮球运动员在五场比赛中所得分数的茎叶图,则在这五场比赛中得分较为稳定(方差较小)的那名运动员得分的方差为________.解析:由茎叶图知,得分较为稳定的那名运动员是乙,他在五场比赛中得分分别为8,9,10,13,15,所以错误!乙=错误!=11,s错误!=错误!×[(8—11)2+(9—11)2+()2+(13—11)2+(15—11)2]=6.8.答案:6.8错误!错误![题组练透]1.总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为________.7816 657208026314070243699728 01983204923449358200 36234869 6938 7481解析:由随机数表法的随机抽样的过程可知选出的5个个体是08,02,14,07,01,所以第5个个体的编号是01.答案:012.采用系统抽样方法从1000人中抽取50人做问卷调查,将他们随机编号1,2,…,1000.适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.若抽到的50人中,编号落入区间[1,400]的人做问卷A,编号落入区间[401,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C 的人数为________.解析:根据系统抽样的特点可知,所有做问卷调查的人的编号构成首项为8,公差d=错误!=20的等差数列{a n},所以通项公式a n=8+20(n—1)=20n—12,令751≤20n—12≤1000,得错误!≤n≤错误!,又因为n∈N*,所以39≤n≤50,所以做问卷C的共有12人.答案:123.(2019·南京调研)某高校甲、乙、丙、丁四个专业分别有150,150,400,300名学生.为了解学生的就业倾向,用分层抽样的方法从该校这四个专业中抽取40名学生进行调查,则应从丙专业抽取的学生人数为________.解析:由题意得,应从丙专业抽取的学生人数为40×错误!=16.答案:164.某企业三月中旬生产A、B、C三种产品共3000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:由于不小心,表格中A、C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C的产品数量是________件.解析:设样本容量为x,则错误!×1300=130,所以x=300.所以A产品和C产品在样本中共有300—130=170(件).设C产品的样本容量为y,则y+y+10=170,所以y=80.所以C产品的数量为错误!×80=800(件).答案:800[谨记通法]三种抽样方法的比较分层抽样将总体分成几层,分层按比例进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成错误!错误![典例引领]1.(2019·启东模拟)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x +y的值为________.解析:由茎叶图知,甲组的中位数为65,当乙组的中位数也为65时,y=5,此时乙组的平均数为错误!=66,所以x=66×5—(56+65+62+74+70)=3,所以x+y=8.答案:82.(2018·海安质量测试)某校高一年级共有800名学生,根据他们参加某项体育测试的成绩得到了如图所示的频率分布直方图,则成绩不低于80分的学生人数为________.解析:由题设中提供的频率分布直方图可以看出:不低于80分的学生人数为(0.02+0.01)×10×800=240.答案:2403.(2018·苏州测试)为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,其频率分布直方图如图所示,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为12,则报考飞行员的学生人数为________.解析:设报考飞行员的学生人数为x,则错误!=(1—0.037×5—0.013×5)×错误!,解得x=48,即报考飞行员的学生人数为48.答案:48[由题悟法]1.茎叶图中的3个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.2.由频率分布直方图进行相关计算时,需掌握的2个关系式(1)错误!×组距=频率.(2)错误!=频率,此关系式的变形为错误!=样本容量,样本容量×频率=频数.[即时应用]1.(2018·苏北四市期末)某次比赛甲得分的茎叶图如图所示,若去掉一个最高分,去掉一个最低分,则剩下4个分数的方差为________.错误!错误!解析:剩下的4个分数是42,44,46,52,则其平均数是46,故方差为错误!×(16+4+0+36)=14.答案:142.随着社会的发展,食品安全问题渐渐成为社会关注的热点,为了提高学生的食品安全意识,某学校组织全校学生参加食品安全知识竞赛,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若该校的学生总人数为3000,则成绩不超过60分的学生人数大约为________.解析:由频率分布直方图知,成绩不超过60分的学生的频率为(0.005+0.01)×20=0.3,所以成绩不超过60分的学生人数大约为0.3×3000=900.答案:900错误!错误![锁定考向]样本的数字特征常与频率分布直方图、茎叶图等知识交汇命题.常见的命题角度有:(1)样本的数字特征与直方图交汇;(2)样本的数字特征与茎叶图交汇;(3)样本的数字特征与优化决策问题.[题点全练]角度一:样本的数字特征与直方图交汇1.(2019·苏州调研)样本容量为100的频率分布直方图如图所示,根据样本频率分布直方图估计平均数为________ .解析:平均数为错误!×(6×10+20×12+40×14+24×16+10×18)=14.24.答案:14.24角度二:样本的数字特征与茎叶图交汇2.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示.则7个剩余分数的方差为________.解析:根据茎叶图,去掉1个最低分87,1个最高分99,则错误![87+94+90+91+90+(90+x)+91]=91,所以x=4.所以s2=错误![(87—91)2+(94—91)2+(90—91)2+(91—91)2+(90—91)2+(94—91)2+(91—91)2]=错误!.答案:错误!角度三:样本的数字特征与优化决策问题3.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲108999乙1010799解析:因为错误!甲=错误!乙=9,s错误!=错误!×[(9—10)2+(9—8)2+(9—9)2+(9—9)2+(9—9)2]=错误!,s错误!=错误!×[(9—10)2+(9—10)2+(9—7)2+(9—9)2+(9—9)2]=错误!>s错误!,故甲更稳定.答案:甲[通法在握]1.利用频率分布直方图估计样本的数字特征的方法(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值.(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.(3)众数:最高的矩形的中点的横坐标.2.利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.[演练冲关]1.(2019·常州调研)用茎叶图记录甲、乙两名同学高三前5次数学测试的成绩,如图.他们在分析对比成绩变化时,发现乙同学成绩的一个数字看不清楚了.若已知乙的平均成绩低于甲的平均成绩,则看不清楚的数字为________.解析:甲的平均成绩为错误!×(99+100+101+102+103)=101,设看不清楚的数字为x,则由题意得错误!×(93+94+97+110+110+x)<101,解得x<1.因为x≥0,x∈N,所以x=0,即看不清楚的数字为0.答案:02.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.解析:不妨设样本数据为x1,x2,x3,x4,x5,且x1<x2<x3<x4<x5,则由样本方差为4,知(x1—7)2+(x2—7)2+(x3—7)2+(x4—7)2+(x5—7)2=20.若5个整数的平方和为20,则这5个整数的平方只能在0,1,4,9,16中选取(每个数最多出现2次),当这5个整数的平方中最大的数为16时,分析可知,总不满足和为20;当这5个整数的平方中最大的数为9时,0,1,1,9,9这组数满足要求,此时对应的样本数据为x1=4,x2=6,x3=7,x4=8,x5=10;当这5个整数的平方中最大的数不超过4时,总不满足要求,因此不存在满足条件的另一组数据.答案:10一抓基础,多练小题做到眼疾手快1.(2019·南通中学高三学情调研)一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):轿车A轿车B轿车C舒适型100150z标准型300450600按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆,则z的值为________.解析:由题意知错误!=错误!,解得z=400.答案:4002.(2018·泰州调研)某校在高三年级的1000名学生中随机抽出100名学生的数学成绩作为样本进行分析,得到样本频率分布直方图如图所示,则估计该校高三学生中数学成绩在[110,140)之间的人数为________.解析:由样本频率分布直方图知该校高三学生中数学成绩在[110,140)之间的频率为(0.02+0.026+0.02)×10=0.66,所以估计该校高三学生中数学成绩在[110,140)之间的人数为1000×0.66=660.答案:6603.某校高三年级500名学生中,血型为O型的有200人,A型的有125人,B型的有125人,AB型的有50人.为研究血型与色弱之间的关系,现用分层抽样的方法从这500名学生中抽取一个容量为60的样本,则应抽取________名血型为AB的学生.解析:在整个抽样过程中,每个个体被抽到的概率为错误!=错误!,所以血型为AB的学生应抽取的人数为50×错误!=6.答案:64.已知一组数据:87,x,90,89,93的平均数为90,则该组数据的方差为________.解析:由题意知错误!×(87+x+90+89+93)=90,解得x=91,所以方差s2=错误!×[(87—90)2+(91—90)2+(90—90)2+(89—90)2+(93—90)2]=4.答案:45.(2019·启东第一中学月考)某厂共有1000名员工,准备选择50人参加技术评估,现将这1000名员工编号为1到1000,准备用系统抽样的方法抽取.已知随机抽取到的员工最小的编号是15,那么抽取到的员工最大的编号是________.解析:样本间隔为1000÷50=20,∵随机抽取到的最小的编号是15,∴在抽取到的员工中最大的编号是15+49×20=995.答案:9956.(2018·苏州期末)若一组样本数据9,8,x,10,11的平均数为10,则该组样本数据的方差为________.解析:由错误!=10,得x=12,故方差s2=错误!=2.答案:2二保高考,全练题型做到高考达标1.(2018·通州期末)如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为17,则x的值为________.答案:72.(2019·如皋检测)从编号为01,02,…,50的50个产品中用系统抽样的方法抽取一个样本,已知样本中的前两个编号分别为03,08(编号按从小到大的顺序排列),则样本中最大的编号是________.解析:由题意知,抽样间隔是5,∴样本中最大的编号是3+5×9=48.答案:483.(2018·南京学情调研)为了解某一段公路汽车通过时的车速情况,现随机抽测了通过这段公路的200辆汽车的时速,所得数据均在区间[40,80]中,其频率分布直方图如图所示,则在抽测的200辆汽车中,时速在区间[40,60)内的汽车有________辆.解析:根据频率分布直方图得,时速在区间[40,60)内的频率为(0.01+0.03)×10=0.4,故时速在区间[40,60)内的汽车有0.4×200=80(辆).答案:804.用分层抽样的方法从某高中学生中抽取一个容量为45的样本,其中高一年级抽20人,高三年级抽10人,已知该校高二年级共有学生300人,则该校学生的总人数为________.解析:样本中高二年级抽45—20—10=15(人),设该校学生的总人数为n,则错误!=错误!,所以n=900.答案:9005.(2018·扬州期末)某学校从高三年级共800名男生中随机抽取50名测量身高.根据测量结果可知被测学生身高全部介于155cm和195cm之间,将测量结果按如下方式分成八组:第一组[155,160),第二组[160,165),…,第八组[190,195].按上述分组方式得到的频率分布直方图的一部分如图所示,估计这所学校高三年级全体男生身高在180 cm以上(含180 cm)的人数为________.解析:这所学校高三年级全体男生身高在180 cm以上(含180 cm)的频率为1—(0.008+0.016+0.04+0.04+0.06)×5=1—0.82=0.18,所以全体男生身高在180 cm以上(含180 cm)的人数为0.18×800=144.答案:1446.(2019·海门中学检测)已知数据x1,x2,…,x10的均值为2,标准差为s,又知数据3x1+2,3x2+2,…,3x10+2的方差为27,则s=________.解析:∵数据x1,x2,…,x10的均值为2,标准差为s,数据3x1+2,3x2+2,…,3x10+2的方差为27,∴9s2=27,解得s=错误!.答案:错误!7.已知x是1,2,3,x,5,6,7这七个数据的中位数且1,2,x2,—y这四个数据的平均数为1,则y—错误!的最小值为________.解析:由题意1+2+x2—y=4,所以y=x2—1.由中位数定义知,3≤x≤5,所以y—错误!=x2—1—错误!.当x∈[3,5]时,函数y=x2—1与y=—错误!均为增函数,所以y=x2—1—错误!在[3,5]上为增函数,所以错误!min=8—错误!=错误!.答案:错误!8.(2018·南通调研)为了了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如图所示.据此可估计上学期该校400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为________.解析:由茎叶图可知,在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为400×错误!=160.答案:1609.某初级中学共有学生2000名,各年级男、女生人数如下表:初一年级初二年级初三年级女生373x y男生377370z已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19.(1)求x的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名?解:(1)因为错误!=0.19,所以x=380.(2)初三年级人数为y+z=2000—(373+377+380+370)=500,现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为:错误!×500=12(名).10.某班100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值.(2)若在同一组数据中,将该组区间的中点值作为这组数据的平均分,根据频率分布直方图,估计这100名学生语文成绩的平均分.(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如表所示,求数学成绩在[50,90)之外的人数.分数段[50,60)[60,70)[70,80)[80,90)x∶y1∶12∶13∶44∶5解:(1)由频率分布直方图知(0.04+0.03+0.02+2a)×10=1,因此a=0.005.(2)估计这次成绩的平均分错误!=55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73.所以这100名学生语文成绩的平均分为73分.(3)分别求出语文成绩在分数段[50,60),[60,70),[70,80),[80,90)的人数依次为0.05×100=5,0.4×100=40,0.3×100=30,0.2×100=20.所以数学成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为5,20,40,25.所以数学成绩在[50,90)之外的人数有100—(5+20+40+25)=10(人).三上台阶,自主选做志在冲刺名校1.(2018·苏州测试)已知等差数列{a n}的公差为d,若a1,a2,a3,a4,a5的方差为8,则d =________.解析:因为数列{a n}为等差数列,所以a1,a2,a3,a4,a5的平均数为a3,所以方差为错误![(—2d)2+(—d)2+0+d2+(2d)2]=2d2=8,解得d=±2.答案:±22.一组数据是19,20,x,43,已知这组数据的平均数是整数,且24<x<28,则这组数据的方差为________.解析:因为错误!(19+20+x+43)=错误!为整数,且24<x<28,所以x=26,所以这组数据的平均数为错误!=27,方差为错误![(19—27)2+(20—27)2+(26—27)2+(43—27)2]=错误!(64+49+1+256)=错误!×370=92.5.答案:92.53.(2017·北京高考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等,试估计总体中男生和女生人数的比例.解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1—0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100—100×0.9—5=5.所以总体中分数在区间[40,50)内的人数估计为400×错误!=20.(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×错误!=30.所以样本中的男生人数为30×2=60,女生人数为100—60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.。
2016届高考数学大一轮复习课时跟踪检测(六十)用样本估计总体文(含解析)
课时跟踪检测(六十) 用样本估计总体(分A、B卷,共3页)A卷:夯基保分一、选择题1.(2015·辽宁五校联考)对于一组数据x i(i=1,2,3,…,n),如果将它们改变为x i +C(i=1,2,3,…,n),其中C≠0,则下列结论正确的是( )A.平均数与方差均不变B.平均数变,方差保持不变C.平均数不变,方差变D.平均数与方差均发生变化2.某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a的值为()A.0.006 B.0.005C.0.004 5 D.0.002 53.如图是Ⅰ,Ⅱ两组各7名同学体重(单位:kg)数据的茎叶图.设Ⅰ,Ⅱ两组数据的平均数依次为x1和x2,标准差依次为s1和s2,那么( )A.x1>x2,s1>s2B.x1>x2,s1<s2C.x1<x2,s1>s2D.x1<x2,s1<s24.(2015·沈阳质量检测)某大学对1 000名学生的自主招生水平测试成绩进行统计,得到样本频率分布直方图(如图),则这1 000名学生在该次自主招生水平测试中成绩不低于70分的学生数是( )A .300B .400C .500D .6005.(2015·郑州第一次质量预测)PM2.5是指大气中直径小于或等于 2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据某地某日早7点到晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是( )A .甲B .乙C .甲、乙相等D .无法确定6.如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40),[40,45]的上网人数呈递减的等差数列分布,则网民年龄在[35,40)的频率为( )A .0.04B .0.06C .0.2D .0.3二、填空题7.(2014·江苏高考)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.8.下图茎叶图是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率为________.9.(2015·南昌一模)在一次演讲比赛中,6位评委对一名选手打分的茎叶图如图所示,若去掉一个最高分和一个最低分,得到一组数据x i (1≤i≤4),在如图所示的程序框图中,x 是这4个数据的平均数,则输出的v 的值为________.10.(2015·武汉调研)为组织好“市九运会”,组委会征集了800名志愿者,现对他们的年龄抽样统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得:(1)年龄在[25,30)内对应小长方形的高度为________; (2)这800名志愿者中年龄在[25,35)内的人数为________. 三、解答题11.(2015·合肥质检)某电视台举办青年歌手大奖赛,有十名评委打分,已知甲、乙两名选手演唱后的得分如茎叶图所示:(1)从统计的角度,你认为甲与乙比较,演唱水平怎样?(2)现场有三名点评嘉宾A 、B 、C ,每位选手可以从中选两位进行指导,若选手选每位点评嘉宾的可能性相等,求甲、乙两选手选择的点评嘉宾恰有一人重复的概率.12.(2015·广州调研)某单位N 名员工参加“社区低碳你我他”活动.他们的年龄在25岁至50岁之间.按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.下表是年龄的频率分布表.(2)现要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,则年龄在第1,2,3组的人数分别是多少?(3)在(2)的条件下,从这6人中随机抽取2人参加社区宣传交流活动,求恰有1人在第3组的概率.B 卷:增分提能1.(2015·广东七校联考)甲、乙两位学生参加数学竞赛培训,在培训期间,他们参加的5次预赛成绩记录如下:甲 82 82 79 95 87 乙 95 75 80 90 85 (1)用茎叶图表示这两组数据;(2)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率; (3)①求甲、乙两人的成绩的平均数与方差;②若现要从中选派一人参加数学竞赛,根据你的计算结果,你认为选派哪位学生参加合适?2.(2015·潍坊联考)交通指数是交通拥堵指数的简称,是综合反映道路网畅通或拥堵的概念,记交通指数为T ,其范围为[0,10],分别有五个级别:T ∈[0,2)畅通;T ∈[2,4)基本畅通;T ∈[4,6)轻度拥堵;T ∈[6,8)中度拥堵;T ∈[8,10]严重拥堵.晚高峰时段(T ≥2),从某市交通指挥中心选取了市区20个交通路段,依据其交通指数数据绘制的部分直方图如图所示.(1)请补全直方图,并求出轻度拥堵、中度拥堵、严重拥堵路段各有多少个; (2)用分层抽样的方法从交通指数在[4,6),[6,8),[8,10]的路段中共抽取6个路段,求依次抽取的三个级别路段的个数;(3)从(2)中抽出的6个路段中任取2个,求至少1个路段为轻度拥堵的概率. 3.(2015·长春二模)国家环境标准制定的空气质量指数与空气质量等级对应关系如下表:由全国重点城市环境监测网获得2月份某五天甲城市和乙城市的空气质量指数数据用茎叶图表示如下:(1)试根据上面的统计数据,判断甲、乙两个城市的空气质量指数的方差的大小关系(只需写出结果);(2)试根据上面的统计数据,估计甲城市某一天空气质量等级为2级良的概率; (3)分别从甲城市和乙城市的统计数据中任取一个,试求这两个城市空气质量等级相同的概率.答 案A 卷:夯基保分1.选B 由平均数的定义,可知每个个体增加C ,则平均数也增加C ,方差不变,故选B.2.选B 由题意知,a =1-+0.03+0.042×10=0.005.3.选D 由题中茎叶图可得x 1=61,x 2=62,s 1=3167,s 2=3427,故选D. 4.选D 依题意得,题中的1 000名学生在该次自主招生水平测试中成绩不低于70分的学生数是1 000×(0.035+0.015+0.010)×10=600,选D.5.选A 从茎叶图上可以观察到:甲监测点的样本数据比乙监测点的样本数据更加集中,因此甲地浓度的方差较小.6.选C 由已知得网民年龄在[20,25)的频率为0.01×5=0.05,在[25,30)的频率为0.07×5=0.35.因为年龄在[30,35),[35,40),[40,45]的上网人数呈递减的等差数列分布,所以其频率也呈递减的等差数列分布,又年龄在[30,45]的频率为1-0.05-0.35=0.6,所以年龄在[35,40)的频率为0.2.故选C.7.解析:由频率分布直方图可得树木底部周长小于100 cm 的频率是(0.025+0.015)×10=0.4,又样本容量是60,所以频数是0.4×60=24.答案:248.解析:由图可知,甲的5次成绩分别是88,89,90,91,92,易知甲的平均分为90.乙的成绩分别是83,83,87,99,其中被污损的成绩为90到99中的某一个.设被污损的那次成绩为x ,由甲的平均成绩超过乙的平均成绩,得83+83+87+x +995<90.所以x <98.又x是90到99的十个整数中的其中一个,其中有8个整数小于98,所以x <98的概率为810=45.答案:459.解析:根据题意得到的数据为78,80,82,84,则x =81.该程序框图的功能是求以上数据的方差,故输出的v 的值为-2+-2+-2+-24=5.答案:510.解析:(1)因为各个小长方形的面积之和为1,所以年龄在[25,30)内对应小长方形的高度为15[1-(5×0.01+5×0.07+5×0.06+5×0.02)]=0.04.(2)年龄在[25,35)内的频率为0.04×5+0.07×5=0.55,人数为0.55×800=440. 答案:(1)0.04 (2)44011.解:(1)由茎叶图可得:x 甲=87.5,x 乙=86.7,x 甲>x 乙,所以甲演唱水平更高一点,但甲的方差较大,即评委对甲的水平认可存在较大的差异.(2)依题意,共有9个基本事件:其中,甲、乙两选手选择的点评嘉宾恰重复一人包含6个基本事件. 所以所求概率为69=23.12.解:(1)由频率分布直方图可知,[25,30)与[30,35)两组的人数相同,所以a =25. 且b =25×0.080.02=100.总人数N =250.02×5=250.(2)因为第1,2,3组共有25+25+100=150人,利用分层抽样在150名员工中抽取6人,每组抽取的人数分别为:第1组的人数为6×25150=1,第2组的人数为6×25150=1,第3组的人数为6×100150=4,所以第1,2,3组分别抽取1人,1人,4人.(3)由(2)可设第1组的1人为A ,第2组的1人为B ,第3组的4人分别为C 1,C 2,C 3,C 4,则从6人中抽取2人的所有可能结果为:(A ,B ),(A ,C 1),(A ,C 2),(A ,C 3),(A ,C 4),(B ,C 1),(B ,C 2),(B ,C 3),(B ,C 4),(C 1,C 2),(C 1,C 3),(C 1,C 4),(C 2,C 3),(C 2,C 4),(C 3,C 4),共有15种.其中恰有1人年龄在第3组的所有结果为:(A ,C 1),(A ,C 2),(A ,C 3),(A ,C 4),(B ,C 1),(B ,C 2),(B ,C 3),(B ,C 4),共有8种.所以恰有1人年龄在第3组的概率为815.B 卷:增分提能1.解:(1)作出茎叶图如下:(2),y )表示基本事件: (82,95),(82,75),(82,80),(82,90),(82,85), (82,95),(82,75),(82,80),(82,90),(82,85), (79,95),(79,75),(79,80),(79,90),(79,85), (95,95),(95,75),(95,80),(95,90),(95,85), (87,95),(87,75),(87,80),(87,90),(87,85), 基本事件总数n =25.记“甲的成绩比乙高”为事件A ,事件A 包含基本事件:(82,75),(82,80),(82,75),(82,80),(79,75),(95,75),(95,80),(95,90),(95,85),(87,75),(87,80),(87,85),事件A 包含的基本事件数m =12,所以P (A )=m n =1225,所以甲的成绩比乙高的概率为1225.(3)①x 甲=15(70×1+80×3+90×1+9+2+2+7+5)=85,x 乙=15(70×1+80×2+90×2+5+0+5+0+5)=85,s 2甲=15[(79-85)2+(82-85)2+(82-85)2+(87-85)2+(95-85)2]=31.6,s 2乙=15[(75-85)2+(80-85)2+(85-85)2+(90-85)2+(95-85)2]=50,②因为x 甲=x 乙,s 2甲<s 2乙,所以甲的成绩较稳定,派甲参赛比较合适.2.解:(1)补全直方图如图:由直方图可知:(0.1+0.2)×1×20=6, (0.25+0.2)×1×20=9, (0.1+0.05)×1×20=3.∴这20个路段中,轻度拥堵、中度拥堵、严重拥堵的路段分别为6个、9个、3个. (2)由(1)知拥堵路段共有6+9+3=18个,按分层抽样从18个路段中选出6个,每种情况分别为:618×6=2,618×9=3,618×3=1,即这三个级别路段中分别抽取的个数为2,3,1.(3)记(2)中选取的2个轻度拥堵路段为A 1,A 2,选取的3个中度拥堵路段为B 1,B 2,B 3,选取的1个严重拥堵路段为C 1,则从6个路段选取2个路段的可能情况如下:(A 1,A 2),(A 1,B 1),(A 1,B 2),(A 1,B 3),(A 1,C 1),(A 2,B 1),(A 2,B 2),(A 2,B 3),(A 2,C 1),(B 1,B 2),(B 1,B 3),(B 1,C 1),(B 2,B 3),(B 2,C 1),(B 3,C 1),共15种可能.其中至少有1个轻度拥堵的有:(A 1,A 2),(A 1,B 1),(A 1,B 2),(A 1,B 3),(A 1,C 1),(A 2,B 1),(A 2,B 2),(A 2,B 3),(A 2,C 1),共9种可能.∴所选2个路段中至少1个路段轻度拥堵的概率为915=35.3.解:(1)甲城市的空气质量指数的方差大于乙城市的空气质量指数的方差. (2)根据题中的统计数据,可得在这五天中甲城市空气质量等级为2级良的频率为35,则估计甲城市某一天的空气质量等级为2级良的概率为35.(3)设事件A “从题中甲城市和乙城市的统计数据中分别任取一个,这两个城市的空气质量等级相同”,由题意可知,从甲城市和乙城市的监测数据中分别任取一个,共有25个结果,分别记为:(29,43),(29,41),(29,55),(29,58),(29,78),(53,43),(53,41),(53,55),(53,58),(53,78),(57,43),(57,41),(57,55),(57,58),(57,78),(75,43),(75,41),(75,55),(75,58),(75,78),(106,43),(106,41),(106,55),(106,58),(106,78).其数据表示两城市空气质量等级相同的包括同为1级优的为甲29,乙41,乙43,同为2级良的为甲53,甲57,甲75,乙55,乙58,乙78.则空气质量等级相同的为:(29,41),(29,43),(53,55),(53,58),(53,78),(57,55),(57,58),(57,78),(75,55),(75,58),(75,78),共11个结果.由古典概型可得P (A )=1125.所以这两个城市空气质量等级相同的概率为1125.。
高考数学一轮总复习课件:随机抽样、用样本估计总体
6.(2020·天津)从一批零件中抽取 80 个,测量其直径(单位: mm),将所得数据分为 9 组:[5.31,5.33),[5.33,5.35),…,[5.45, 5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽 取的零件中,直径落在区间[5.43,5.47)内的个数为( B )
n 的样本进行调查,其中从丙车间的产品中抽取了 3 件,则 n=
(D ) A.9
B.10
C.12
D.13
【解析】 由分层抽样可得630=2n60,解得 n=13.
【讲评】 进行分层抽样的相关计算时,常利用以下关系式 巧解:
①总样体本的容个量数nN=该层该抽层取的的个个体体数数; ②总体中某两层的个体数之比等于样本中这两层抽取的个 体数之比.
5.对某商店一个月内每天的顾客人数进行了统计,得到样本 的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( A )
A.46,45,56 B.46,45,53 C.47,45,56 D.45,47,53
解析 从茎叶图中可以看出样本数据的中位数为中间两个数的 平均数,即45+2 47=46,众数是 45,极差为 68-12=56,故选择 A.
状元笔记
(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否 方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都 较小时可用抽签法.
(2)在使用随机数表时,如遇到取两位数或三位数,可从选择 的随机数表中的某行某列的数字计起,每两个或每三个作为一个 单位,自左向右选取,有超过总体号码或出现重复号码的数字舍 去.
个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9 个
原始评分相比,不变的数字特征是( A )
高考数学大一轮复习11.2用样本估计总体教师用书理苏教版【含答案】
§11.2 用样本估计总体1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差). (2)决定组距与组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连结频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. (2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.4.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.平均数:样本数据的算术平均数,即x =1n(x 1+x 2+…+x n ).在频率分布直方图中,中位数左边和右边的直方图的面积应该相等. (2)样本方差、标准差 标准差s =1nx 1-x2+x 2-x2+…+x n -x2],其中x n 是样本数据的第n 项,n 是样本容量,x 是平均数.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差. [知识拓展]1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×频率组距.(2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. 2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2. 【思考辨析】判断下面结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × ) (3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × )1.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是________. 答案 91.5,91.5解析 这组数据由小到大排列为87,89,90,91,92,93,94,96, ∴中位数为12×(91+92)=91.5.平均数为18×(87+89+90+91+92+93+94+96)=91.5.2.一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12 [35.5,39.5) 7 [39.5,43.5) 3根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是________. 答案 13解析 由已知,样本容量为66,而落在[31.5,43.5)内的样本数为12+7+3=22,故所求概率为2266=13.3.(2014·四川改编)在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是________. 答案 总体解析 调查的目的是“了解某地5 000名居民某天的阅读时间”,所以“5 000名居民的阅读时间的全体”是调查的总体.4.某中学为了了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.答案 600解析 由直方图易得数学考试中成绩小于60分的频率为(0.002+0.006+0.012)×10=0.2,所以所求分数小于60分的学生数为3 000×0.2=600.题型一 频率分布直方图的绘制与应用例1 某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.思维点拨图中各小长方形的面积和等于1.解(1)设分数在[70,80)内的频率为x,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,可得x=0.3,所以频率分布直方图如图所示.(2)平均分:45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).思维升华(1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.(2013·陕西改编)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为________.答案0.45解析设区间[25,30)对应矩形的另一边长为x,则所有矩形面积之和为1,即(0.02+0.04+0.06+0.03+x)×5=1,解得x=0.05.产品为二等品的概率为0.04×5+0.05×5=0.45. 题型二茎叶图的应用例2 如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则一定有________.①a1>a2;②a2>a1;③a 1=a 2;④a 1,a 2的大小与m 的值有关.思维点拨 去掉第一行和第三行的数,只计算第二行叶上的数即可. 答案 ②解析 去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a 2>a 1.思维升华 由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表试题时,就要充分使用这个图表提供的数据进行相关的计算或者对某些问题作出判断.(2013·山东)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:8 7 7 9 4 0 1 0 x 9 1则7个剩余分数的方差为________. 答案367解析 由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2] =17(16+9+1+0+1+9+0)=367. 题型三 用样本的数字特征估计总体的数字特征例3 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价. 思维点拨 (1)先通过图象统计出甲、乙二人的成绩;(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价.解 (1)由题图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.x 甲=10+13+12+14+165=13,x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由s 2甲>s 2乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.(2013·江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员 第1次 第2次 第3次 第4次 第5次 甲 87 91 90 89 93 乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为________. 答案 2解析 x 甲=15(87+91+90+89+93)=90,x 乙=15(89+90+91+88+92)=90,s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,s 2乙=15[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.高考中频率分布直方图的应用典例:(2014·山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.答案 12解析 志愿者的总人数为20+=50,所以第三组人数为50×0.36=18, 所以有疗效的人数为18-6=12.温馨提醒 本题的难点是对频率分布直方图意义的理解以及利用这个图提供的数据对所提问题的计算,频率分布直方图中纵轴上的数据是频率除以组距,组距越大该数据越小,在解答这类问题时要特别注意.方法与技巧1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.若取值x 1,x 2,…,x n 的频率分别为p 1,p 2,…,p n ,则其平均值为x 1p 1+x 2p 2+…+x n p n ;若x 1,x 2,…,x n 的平均数为x ,方差为s 2,则ax 1+b ,ax 2+b ,…,ax n +b 的平均数为a x +b ,方差为a 2s 2. 失误与防范频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.A组专项基础训练(时间:40分钟)1.(2013·重庆改编)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的概率为________.189212279300 3答案0.4解析10个数据落在区间[22,30)内的数据有22,22,27,29共4个,因此,所求的频率为4 10=0.4.2.(2014·陕西改编)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为________.答案x+100,s2解析x1+x2+…+x1010=x,y i=x i+100,所以y1,y2,…,y10的均值为x+100,方差不变.3.(2013·辽宁)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是________.答案50解析由频率分布直方图,知低于60分的频率为(0.01+0.005)×20=0.3.∴该班学生人数n =150.3=50.4.将容量为n 的样本中的数据分成6组,绘制频率分布直方图.若第一至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n 等于________. 答案 60解析 设第一至第六组数据的频数分别为2x,3x,4x,6x,4x ,x ,则2x +3x +4x =27,解得x =3,故n =20x =60.5.(2013·湖北)某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为________; (2)命中环数的标准差为________. 答案 (1)7 (2)2解析 (1)x =110(7+8+7+9+5+4+9+10+7+4)=7010=7. (2)s 2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4, ∴命中环数的标准差为2.6.某中学高三年级从甲、乙两个班级各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则x +y 的值为________.答案 8解析 依题意,甲班学生的平均分85=78+79+85+80+92+96+80+x 7,故x =5.乙班学生成绩的中位数是83,故其成绩为76,81,81,83,91,91,96, ∴y =3,∴x +y =8.7.在样本频率分布直方图中,共有5个小长方形,已知中间一个小长方形的面积是其余4个小长方形面积之和的13,且中间一组的频数为10,则这个样本的容量是________.答案 40解析 设中间小长方形的面积为S , 则S =13(1-S ),3S =1-S ,∴S =14,即频率=14.∵频数=10,∴样本容量=频数频率=1014=40. 8.若某产品的直径长与标准值的差的绝对值不超过1 mm 时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:分组 频数频率 [-3,-2)0.10 [-2,-1) 8(1,2]0.50 (2,3] 10(3,4]合计501.00(1)将上面表格中缺少的数据填在相应位置;(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率; (3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.解 (1)如下表所示频率分布表.分组 频数 频率 [-3,-2) 5 0.10 [-2,-1) 8 0.16 (1,2] 25 0.50 (2,3] 10 0.20 (3,4] 2 0.04 合计501.00(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率约为 0.50+0.20=0.70.(3)设这批产品中的合格品数为x件,依题意505 000=20x+20,解得x=5 000×2050-20=1 980.所以该批产品的合格品件数大约是1 980件.9.(2014·广东)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据上述数据得到样本的频率分布表如下:分组频数频率[25,30]30.12(30,35]50.20(35,40]80.32(40,45]n1f1(45,50]n2f2(1)确定样本频率分布表中n1,n2,f1和f2的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率.解(1)由所给数据知,落在区间(40,45]内的有7个,落在(45,50]内的有2个,故n1=7,n2=2,所以f1=n125=725=0.28,f2=n225=225=0.08.(2)样本频率分布直方图如图.(3)根据样本频率分布直方图,每人的日加工零件数落在区间(30,35]的概率为0.2,设所取的4人中,日加工零件数落在区间(30,35]的人数为ξ,则ξ~B(4,0.2),P(ξ≥1)=1-P(ξ=0)=1-(1-0.2)4=1-0.409 6=0.590 4,所以在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率为0.590 4.B组专项能力提升(时间:25分钟)1.(2013·四川)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是________.0 7 31 7 6 4 4 3 02 7 5 5 43 2 038 5 43答案 ①解析 由于频率分布直方图的组距为5,排除③④,又[0,5),[5,10)两组各一人,排除②,应选①.2.(2013·安徽)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是________. ①这种抽样方法是一种分层抽样; ②这种抽样方法是一种系统抽样;③这五名男生成绩的方差大于这五名女生成绩的方差; ④该班男生成绩的平均数小于该班女生成绩的平均数. 答案 ③解析 x 男=15(86+94+88+92+90)=90,x 女=15(88+93+93+88+93)=91,s 2男=15[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8,s 2女=15[(88-91)2+(93-91)2+(93-91)2+(88-91)2+(93-91)2]=6.故③正确.3.如果数据x 1,x 2,…,x n 的平均数为x ,方差为s 2,则2x 1+3,2x 2+3,…,2x n +3的平均数和方差分别为________. 答案 2x +3,4s 2解析 方法一 平均数为1n (2x 1+3+2x 2+3+…+2x n +3)=1n[2(x 1+x 2+…+x n )+3n ]=2x +3;方差为1n{[(2x 1+3)-(2x +3)]2+[(2x 2+3)-(2x +3)]2+…+[(2x n +3)-(2x +3)]2}=1n[4(x 1-x )2+4(x 2-x )2+…+4(x n -x )2]=4s 2.方法二 原数据乘以2加上3得到一组新数据,则由平均数、方差的性质可知得到的新数据的平均数、方差分别是2x +3和4s 2.4.(2014·江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.答案 24解析 底部周长在[80,90)的频率为0.015×10=0.15, 底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm 的株数为(0.15+0.25)×60=24. 5.某高校在2013年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下表所示.组号 分组 频数 频率 第1组 [160,165) 5 0.050 第2组 [165,170) ① 0.350 第3组 [170,175) 30 ② 第4组 [175,180) 20 0.200 第5组 [180,185]10 0.100 合计1001.00(1)请先求出频率分布表中①、②位置相应数据,再完成下列频率分布直方图;(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样的方法抽取6名学生进入第二轮面试,则第3、4、5组每组各抽取多少名学生进入第二轮面试? (3)在(2)的前提下,学校决定在6名学生中随机抽取2名学生接受A 考官进行面试,求:第4组至少有一名学生被考官A 面试的概率.解 (1)由题意可知,第2组的频数为0.35×100=35, 第3组的频率为30100=0.300,频率分布直方图如图所示:(2)因为第3、4、5组共有60名学生,所以利用分层抽样在60名学生中抽取6名学生,每组分别为第3组:3060×6=3人,第4组:2060×6=2人,第5组:1060×6=1人.所以第3、4、5组分别抽取3人、2人、1人. (3)设第3组的3位同学为A 1,A 2,A 3, 第4组的2位同学为B 1,B 2, 第5组的1位同学为C 1,则从六位同学中抽两位同学有15种可能如下:(A 1,A 2),(A 1,A 3),(A 1,B 1),(A 1,B 2),(A 1,C 1),(A 2,A 3),(A 2,B 1),(A 2,B 2),(A 2,C 1),(A 3,B 1),(A 3,B 2),(A 3,C 1),(B 1,B 2),(B 1,C 1),(B 2,C 1).其中第4组的2位同学至少有一位同学入选的有(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2),(B 1,C 1),(B 2,C 1)9种可能,所以第4组的2位同学至少有一位同学入选的概率为9 15=3 5.。
【师说】2016届高考数学(理)一轮课件:10-2用样本估计总体
答案:①频率分布 ⑤等于1 ⑨百分比 ⑭相等
②数字特征 ⑦组数
频率 ③ 组距
④面积
⑥样本容量
⑧总体密度曲线 1 ⑬ n (x1+x2+…+xn)
⑩最多 ⑮平均数
⑪最中间 ⑯接近
⑫中位数
1.作频率分布直方图的步骤: (1)求极差;(2)确定组距和组数;(3)将数据分组;(4)列频率分 布表;(5)画频率分布直方图. 频率分布直方图能很容易地表示大量数据,非常直观地表明 分布的形状.
答案:0.14 65.5
一、频率分布直方图 1.通常我们对总体作出的估计一般分成两种.一种是用样本 的①____________估计总体的分布.另一种是用样本的② __________估计总体的数字特征. 2.在频率分布直方图中,纵轴表示③__________,数据落在 各小组内的频率用各小长方形的④______表示.各小长方形的面 积总和⑤__________.
3.连接频率分布直方图中各小长方形上端的中点,就得到频 率分布折线图.随着⑥__________的增加,作图时所分的⑦ __________增加,相应的频率分布折线图就会越来越接近于一条 光滑的曲线,统计中称之为⑧____________,它能够更加精细的 反映出总体在各个范围内取值的⑨________. 4.当样本数据较少时,用茎叶图表示数据的效果较好,它不 但可以保留所有信息,而且可以随时记录,给数据的记录和表示 都带来方便.
1.已知一个样本中的数据为0.12,0.15,0.13,0.15,0.14,0.17, 0.15,0.16,0.13,0.14,则该样本的众数、中位数分别是( A.0.14,0.15 C.0.15,0.15 B.0.15,0.14 D.0.15,0.145 )
解析:把样本中的数据按从小到大排列为: 0.12,0.13,0.13,0.14,0.14,0.15,0.15,0.15,0.16,0.17, ∴该样本的众数是0.15, 0.14+0.15 中位数字 =0.145. 2
苏教版版高考数学一轮复习第九章统计与统计案例用样本估计总体教学案
1.常用统计图表(1)作频率分布直方图的步骤:1求极差(即一组数据中最大值与最小值的差).2决定组距与组数.3将数据分组.4列频率分布表.5画频率分布直方图.(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示错误!,每个小矩形的面积表示样本数据落在该组内的频率.各小矩形的面积和为1.(3)频率分布折线图和总体密度曲线1频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到频率分布折线图.2总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把错误!=错误!称为x1,x2,…,x n这n个数的平均数.(4)标准差与方差:设一组数据x1,x2,x3,…,x n的平均数为错误!,则这组数据的标准差和方差分别是s=错误!;s2=错误![(x1—错误!)2+(x2—错误!)2+…+(x n—错误!)2].错误!1.频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.2.平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为错误!,那么mx1+a,mx2+a,mx3+a,…,mx n+a 的平均数是m错误!+a.(2)数据x1,x2,…,x n的方差为s2.1数据x1+a,x2+a,…,x n+a的方差也为s2;2数据ax1,ax2,…,ax n的方差为a2s2.一、思考辨析(正确的打“√”,错误的打“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()(2)一组数据的方差越大,说明这组数据越集中. ()(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.()(4)已知样本数据x1,x2,…,x n的均值错误!=5,则样本数据2x1+1,2x2+1,…,2x n +1的均值为10.()[答案](1)√(2)×(3)√(4)×二、教材改编1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为()A.4B.8 C.12D.16B[设频数为n,则错误!=0.25,∴n=32×错误!=8.]2.若某校高一年级8个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是()A.91.5和91.5B.91.5和92C.91和91.5D.92和92A[∵这组数据为87,89,90,91,92,93,94,96,∴中位数是错误!=91.5,平均数错误!=错误!=91.5.]3.(2019·盐城模拟)已知一组数据x1,x2,x3,x4,x5的方差是2,则数据2x1,2x2,2x3,2x4,2x5的标准差为.2错误![由s2=错误!(x i—错误!)2=2,则数据2x1,2x2,2x3,2x4,2x5的方差是8,标准差为2错误!.]4.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有人.25[0.5×0.5×100=25.]考点1样本的数字特征的计算与应用利用样本的数字特征解决决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.1.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差A[设9位评委评分按从小到大排列为x1<x2<x3<x4...<x8<x9,则原始中位数为x5,去掉最低分x1,最高分x9后剩余x2<x3<x4 (x8)中位数仍为x5,∴A正确.]2.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()甲乙A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差C[根据条形统计图可知甲的中靶情况为4环、5环、6环、7环、8环;乙的中靶情况为5环、5环、5环、6环、9环.错误!甲=错误!(4+5+6+7+8)=6,错误!乙=错误!(5×3+6+9)=6,甲的成绩的方差为错误!=2,乙的成绩的方差为错误!=2.4;甲的成绩的极差为4环,乙的成绩的极差为4环;甲的成绩的中位数为6环,乙的成绩的中位数为5环,综上可知C正确,故选C.]3.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x—y|的值为()A.1B.2C.3D.4D[由题意可知错误!∴错误!∴(x+y)2=x2+y2+2xy,即208+2xy=400,∴xy=96.∴(x—y)2=x2+y2—2xy=16,∴|x—y|=4,故选D.]4.(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分[—0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)组企业数22453147(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:错误!≈8.602.[解](1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为错误!=0.21.产值负增长的企业频率为错误!=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)错误!=错误!(—0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s2==错误![(—0.40)2×2+(—0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6,s=错误!=0.02×错误!≈0.17,所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.方差的简化计算公式:s2=错误![(x错误!+x错误!+…+x错误!)—n错误!2],或写成s 2=错误!(x错误!+x错误!+…+x错误!)—错误!2,即方差等于原数据平方的平均数减去平均数的平方.考点2频率分布直方图频率、频数、样本容量的计算方法(1)错误!×组距=频率.(2)错误!=频率,错误!=样本容量,样本容量×频率=频数.(1)(2019·益阳模拟)为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是()A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5C.该校九年级学生1分钟仰卧起坐的次数超过30的人数约为320D.该校九年级学生1分钟仰卧起坐的次数少于20的人数约为32(2)(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比,根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.1求乙离子残留百分比直方图中a,b的值;2分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).(1)D[由频率分布直方图可知,中位数是频率分布直方图面积等分线对应的数值,是26.25;众数是最高矩形的中间值27.5;1分钟仰卧起坐的次数超过30的频率为0.2,所以估计1分钟仰卧起坐的次数超过30的人数为320;1分钟仰卧起坐的次数少于20的频率为0.1,所以估计1分钟仰卧起坐的次数少于20的人数为160.故D错误.](2)[解] 1由已知得0.70=a+0.20+0.15,故a=0.35.b=1—0.05—0.15—0.70=0.10.2甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.频率分布直方图的纵坐标是错误!,而不是频率,切莫与条形图混淆.[教师备选例题](2018·全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)[解](1)如图所示:(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为错误!1=错误!(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为错误!2=错误!(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计使用节水龙头后,一年可节省水(0.48—0.35)×365=47.45(m3).1.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为()A.64B.54C.48 D.27B[前两组中的频数为100×(0.05+0.11)=16.因为后五组频数和为62,所以前三组为38.所以第三组频数为22.又最大频率为0.32,对应的最大频数为0.32×100=32.所以a=22+32=54.]2.某城市100户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解](1)(0.002+0.009 5+0.011+0.0125+x+0.005+0.0025)×20=1,解得x=0.007 5.即直方图中x的值为0.007 5.(2)月平均用电量的众数是错误!=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5,(0.002+0.009 5+0.011+0.0125)×20=0.7>0.5,∴月平均用电量的中位数在[220,240)内.设中位数为a,则0.45+0.0125×(a—220)=0.5,解得a=224,即中位数为224.(3)月平均用电量在[220,240)的用户有0.0125×20×100=25(户).同理可得月平均用电量在[240,260)的用户有15户,月平均用电量在[260,280)的用户有10户,月平均用电量在[280,300]的用户有5户,故抽取比例为错误!=错误!.∴月平均用电量在[220,240)的用户中应抽取25×错误!=5(户).。
高考数学大一轮复习 第十一章 概率 11.2 古典概型教师用书 文 苏教版(2021年最新整理)
(江苏专用)2018版高考数学大一轮复习第十一章概率11.2 古典概型教师用书文苏教版编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望((江苏专用)2018版高考数学大一轮复习第十一章概率11.2 古典概型教师用书文苏教版)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为(江苏专用)2018版高考数学大一轮复习第十一章概率11.2 古典概型教师用书文苏教版的全部内容。
11.2 古典概型1.基本事件的特点(1)任何两个基本事件是互斥的;(2)任何事件(除不可能事件)都可以表示成基本事件的和.2.古典概型具有以下两个特点的概率模型称为古典概率模型,简称古典概型.(1)所有的基本事件只有有限个;(2)每个基本事件的发生都是等可能的.3.如果1次试验的等可能基本事件共有n个,那么每一个等可能基本事件发生的概率都是错误!。
如果某个事件A包含了其中m个等可能基本事件,那么事件A发生的概率为P(A)=错误!。
4.古典概型的概率公式P(A)=A包含的基本事件的个数基本事件的总数.【思考辨析】判断下列结论是否正确(请在括号中打“√”或“×”)(1)“在适宜条件下,种下一粒种子观察它是否发芽”属于古典概型,其基本事件是“发芽与不发芽”.( ×)(2)掷一枚硬币两次,出现“两个正面”“一正一反”“两个反面”,这三个结果是等可能事件.( ×)(3)从市场上出售的标准为500±5 g的袋装食盐中任取一袋,测其重量,属于古典概型.( ×)(4)(教材改编)有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为错误!。
高考(新课标)数学(理)一轮复习教师用书§11.2 用样本估计总体 Word版含解析
§用样本估计总体.用样本的频率分布估计总体分布()通常我们对总体作出的估计一般分成两种:一种是用样本的估计总体的;另一种是用样本的估计总体的.()在频率分布直方图中,纵轴表示,数据落在各小组内的频率用表示.各小长方形的面积总和等于.()连接频率分布直方图中各小长方形上端的中点,就得到频率分布.随着样本容量的增加,作图时所分的增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称之为,它能够更加精细地反映出.()当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以,而且可以,给数据的记录和表示都带来方便..用样本的数字特征估计总体的数字特征()众数,中位数,平均数众数:在一组数据中,出现次数的数据叫做这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或者最中间两个数据的)叫做这组数据的中位数.平均数:样本数据的算术平均数,即=.在频率分布直方图中,中位数左边和右边的直方图的面积应该.()样本方差,样本标准差标准差=,其中是,是,是.标准差是反映总体的特征数,样本方差是样本标准差的.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.自查自纠.()频率分布分布数字特征数字特征()各小长方形的面积()折线图组数总体密度曲线总体在各个范围内取值的百分比()保留所有信息随时记录.()最多平均数(++…+) 相等()样本数据的第项样本容量平均数波动大小平方在频率分布直方图中,各个长方形的面积表示( ).落在相应各组的数据的频数.相应各组数据的频率.该样本所分成的组数.该样本的样本容量解:在频率分布直方图中,小长方形面积=组距×=频率,所以每个小长方形的面积是相应各组数据的频率.故选.()某中学初中部共有名教师,高中部共有名教师,其性别比例如图所示,则该校女教师的人数为()....解:由扇形统计图可得,该校女教师人数为×+×(-)=.故选.有一个容量为的样本,数据的分组及各组的频数如下:[,) [,) [,)[,) [,)[,)[,) [,)根据样本的频率分布估计,数据落在[,)的概率约是( )解:落在[,)的频数为,所以概率约为.故选.()某学校高一年级男生人数占该年级学生人数的.在一次考试中,男、女生平均分数分别为,,则这次考试该年级学生平均分数为.解:该年级学生平均分数为=×+×=.故填.()在一次马拉松比赛中,名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为~号,再用系统抽样方法从中抽取人,则其中成绩在区间[,]上的运动员人数是.解:由题意可知,这名运动员的分组情况为,第一组(,,,,),第二组(,,,,),第三组(,,,,),第四组(,,,,),第五组(,,,,),第六组(,,,,),第七组(,,,,),故成绩在区间[,]上的运动员恰有组,故所求人数为.故填.类型一数字特征及其应用()某工厂名工人的年龄数据如下表:。
高考数学一轮复习 11.2 用样本估计总体 理 苏教版
11.2 用样本估计总体一、选择题1.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是____,____. 解析 平均数增加,方差不变. 答案 62.8,3.62.对某校400 名学生的体重(单位:kg )进行统计,得到如图所示的频率分布直方图,则学生体重在60kg 以上的人数为 人.解析 60kg 以频率为0.04050.01050.25⨯+⨯=,故人数为4000.25100⨯=(人). 答案 1003.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为 . 解析 由题可知样本的平均值为1, 所以a +0+1+2+35=1,解得a =-1,所以样本的方差为15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2. 答案 24.为了了解某地区10 000名高三男生的身体发育情况,抽查了该地区100名年龄为17~18岁的高三男生体重(kg),得到频率分布直方图如图.根据图示,请你估计该地区高三男生中体重在[56.5,64.5]的学生人数是 人.解析 依题意得,该地区高三男生中体重在[56.5,64.5]的学生人数是 10 000×(0.03+2×0.05+0.07)×2=4 000. 答案 4 0005.甲、乙两名同学学业水平考试的9科成绩如茎叶图所示,请你根据茎叶图判断谁的平均分高________.(填“甲”或“乙”)解析 由茎叶图可以看出,x 甲=19(92+81+89×2+72+73+78×2+68)=80,x 乙=19(91+83+86+88+89+72+75+78+69)≈81.2, x 乙>x 甲,故乙的平均数大于甲的平均数. 答案 乙6.如图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是 .解析 由给定的茎叶图可知,这10位同学身高的中位数为161+1632=162(cm).答案 162 cm7.从甲、乙两种树苗中各抽测了10株树苗的高度,其茎叶图如图.根据茎叶图,下列描述正确的是 .①甲种树苗的平均高度大于乙种树苗的平均高度,且甲种树苗比乙种树苗长得整齐 ②甲种树苗的平均高度大于乙种树苗的平均高度,但乙种树苗比甲种树苗长得整齐 ③乙种树苗的平均高度大于甲种树苗的平均高度,且乙种树苗比甲种树苗长得整齐 ④乙种树苗的平均高度大于甲种树苗的平均高度,但甲种树苗比乙种树苗长得整齐 解析 根据茎叶图计算得甲种树苗的平均高度为27,而乙种树苗的平均高度为30,但乙种树苗的高度分布不如甲种树苗的高度分布集中. 答案 ④8.对某种电子元件的使用寿命进行跟踪调查,所得样本的频率分布直方图如图所示,由图可知,这一批电子元件中使用寿命在100~300 h 的电子元件的数量与使用寿命在300~600 h 的电子元件的数量的比是 .解析 寿命在100~300 h 的电子元件的频率为⎝ ⎛⎭⎪⎫12 000+32 000×100=420=15;寿命在300~600 h 的电子元件的频率为⎝ ⎛⎭⎪⎫1400+1250+32 000×100=45. ∴它们的电子元件数量之比为15∶45=14.答案 149.世界卫生组织(WHO)证实,英国葛兰素史克(GSK)药厂生产的甲型流感疫苗在加拿大种植后造成多人出现过敏症状的情况,下面是加拿大五个地区有过敏症状人数(单位:个)的茎叶统计图,则该组数据的标准差为解析 由茎叶图,得该组数据的平均数为x =90,则该组数据的标准差为 s =15-2+-2+-2+-2+-2=2.答案 210.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.解析 根据样本的频率分布直方图,成绩小于60分的学生的频率为(0.002+0.006+0.012)×10=0.20,所以可推测3 000名学生中成绩小于60分的人数为600名.答案 60011. 如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为_________.0891035(注:方差2222121()()()n s x x x x x x n⎡⎤=-+-++-⎣⎦,其中x 为x 1,x 2,…,x n 的平均数)答案 6.812.某校开展“爱我青岛,爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x 应该是________.解析 当x≥4时,89+89+92+93+92+91+947=6407≠91,∴x<4,则89+89+92+93+92+91+x +907=91,∴x=1.答案 113.某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h ,1 020 h ,1 032 h ,则抽取的100件产品的使用寿命的平均值为_______h.解析9801 1 0202 1 0321x 1 013.4⨯+⨯+⨯==答案 1 013二、解答题14.某校从参加高三模拟考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六组[90,100),[100,110),…,[140,150)后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:(1)求分数在[120,130)内的频率;(2)若在同一组数据中,将该组区间的中点值(如:组区间[100,110)的中点值为100+1102=105.)作为这组数据的平均分,据此,估计本次考试的平均分;(3)用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,将该样本看成一个总体,从中任取2人,求至多有1人在分数段[120,130)内的概率. 解析 (1)分数在[120,130)内的频率为1-(0.1+0.15+0.15+0.25+0.05)=1-0.7=0.3. (2)估计平均分为x =95×0.1+105×0.15+115×0.15+125×0.3+135×0.25+145×0.05=121.(3)由题意,[110,120)分数段的人数为60×0.15=9(人).[120,130)分数段的人数为60×0.3=18(人).∵用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本, ∴需在[110,120)分数段内抽取2人,并分别记为m ,n ;在[120,130)分数段内抽取4人,并分别记为a ,b ,c ,d ;设“从样本中任取 2人,至多有1人在分数段[120,130)内”为事件A ,则基本事件共有(m ,n ), (m ,a ),…,(m ,d ),(n ,a ),…,(n ,d ),(a ,b ),…,(c ,d )共15种.则事件A 包含的基本事件有(m ,n ),(m ,a ),(m ,b ),(m ,c ),(m ,d ),(n ,a ),(n ,b ),(n ,c ),(n ,d )共9种. ∴P (A )=915=35.15.某制造商3月生产了一批乒乓球,随机抽取100个进行检查,测得每个球的直径(单位:mm ),将数据进行分组,得到如下频率分布表:(1)补充完成频率分布表(结果保留两位小数),并在上图中画出频率分布直方图;(2)若以上述频率作为概率,已知标准乒乓球的直径为40.00 mm,试求这批乒乓球的直径误差不超过0.03 mm的概率;(3)统计方法中,同一组数据常用该组区间的中点值(例如区间[39.99,40.01)的中点值是40.00)作为代表.据此估计这批乒乓球直径的平均值(结果保留两位小数).解析(1)频率分布表如下:频率颁布直方图如图:(2)误差不超过0.03 mm,即直径落在[39.97,40.03]内,其概率为0.2+0.5+0.2=0.9.(3)整体数据的平均值为39.96×0.10+39.98×0.20+40.00×0.50+40.02×0.20=40.00(mm).16.某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品.现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:A配方的频数分布表(2)已知用B 配方生产的一件产品的利润y(单位:元)与其质量指标值t 的关系式为y =⎩⎪⎨⎪⎧-2,t <94,2,94≤t<102,4,t≥102.估计用B 配方生产的一件产品的利润大于0的概率,并求用B 配方生产的上述100件产品平均一件的利润.解析 (1)由试验结果知,用A 配方生产的产品中优质品的频率为22+8100=0.3,所以用A 配方生产的产品的优质品率的估计值为0.3.由试验结果知,用B 配方生产的产品中优质品的频率为32+10100=0.42,所以用B 配方生产的产品的优质品率的估计值为0.42.(2)由条件知,用B 配方生产的一件产品的利润大于0当且仅当其质量指标值t≥94,由试验结果知,质量指标值t≥94的频率为0.96.所以用B 配方生产的一件产品的利润大于0的概率估计值为0.96.用B 配方生产的产品平均一件的利润为 1100×[4×(-2)+54×2+42×4]=2.68(元). 17.某市2010年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82, 64,79,86,85,75,71,49,45. 样本频率分布表:(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.解析(1)频率分布表:(2)频率分布直方图:(3)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的115.有26天处于良的水平,占当月天数的1315.处于优或良的天数共有28天,占当有月数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115.污染指数在80以上接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.18.某良种培育基地正在培育一种小麦新品种A ,将其与原有的一个优良品种B 进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A :357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427, 430,430,434,443,445,445,451,454;品种B :363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403, 406,407,410,412,415,416,422,430. (1)画出茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A 与B 的亩产量及其稳定性进行比较,写出统计结论. [思路] (1)按照茎叶图的作法、对照数据解决;(2)根据茎叶图的特点写结论;(3)根据样本数据的平均值和方差作结论,但我们只是对“A 与B 的亩产量及其稳定性进行比较”,写出比较优劣的结论即可. 解析 (1)茎叶图如图所示:(2)用茎叶图处理现有的数据不仅可以看出数据的分布状况,而且可以看出每组中的具体数据.(3)通过计算,可以发现品种A 的平均每亩产量约为411.1千克,品种B 的平均亩产量为397.8千克.由此可知,品种A 的平均亩产量比品种B 的平均亩产量高.但通过观察茎叶图可知品种A 的亩产量不够稳定,而品种B 的亩产量比较集中在平均产量附近.[点评] 用茎叶图表示数据时,不会损失原始信息,所有的数据信息都可以从茎叶图中得到.因此,可以根据样本数据中的“叶”的分布估计总体分布,但样本数据较多时茎叶图就显得不太方便了.当把数据制成茎叶图后,这组数据中的每一个数据都反映在这个图中,这些数据的分布情况也反映在这个图中,当两组数据的平均水平和稳定性有比较大的差异时,我们也可以从这个图上对两组数据的平均数和方差作出定性的大小判断.。
高考数学江苏新攻略总复习课标通用练习:第十一章第二节 用样本估计总体 含解析
第二节用样本估计总体课时作业练1.某同学一个学期内各次数学测验成绩的茎叶图如图所示,则该组数据的中位数是.答案83解析茎叶图中共有10个数据,从小到大排列后中间的两个数为82和84,所以中位数为82+842=83.2.(2018江苏泰州中学3月检测)在某个样本容量为300的频率分布直方图中,共有九个小长方形.若中间一个小长方形的面积等于其他八个小长方形面积和的15,则中间一组的频数为.答案50解析在频率分布直方图中,小长方形的面积等于该组数的频率,且小长方形的面积之和为1.设中间一个小长方形的面积为x,则x=15(1-x),解得x=16.所以中间一组的频数为16×300=50.3.已知一组数据为82,91,89,88,90,则这组数据的方差为.答案10解析数据82,91,89,88,90的平均数是88,则这组数据的方差是36+9+1+0+45=10.4.(2019南通模拟)已知一组数据x1,x2,…,xn的方差为3,若数据ax1+b,ax2+b,…,axn+b(a,b∈R)的方差为12,则a的值为.答案±2解析由题意可得3a2=12,a2=4,a=±2.5.在检验某产品直径尺寸的过程中,将尺寸分成若干组,[a,b)是其中的一组,抽查出的个体数在该组上的频率为m,该组在频率分布直方图上的高为h,则|a-b|= .答案mℎ解析根据频率分布直方图的概念可知|a-b|·h=m,所以|a-b|=mℎ.6.一次数学考试后,某老师从自己所带的两个班级中各抽取6人,记录他们的考试成绩,得到如图所示的茎叶图.已知甲班6名同学成绩的平均数为82,乙班6名同学成绩的中位数为77,则x-y= .答案4解析已知甲班6名同学成绩的平均数为82,即80+16×(-3-8+1+x+6+10)=82,解得x=6.乙班6名同学成绩的中位数为77,即12×(70+y+82)=77,解得y=2.所以x-y=6-2=4.7.(2019江苏南通模拟)抽样统计甲、乙两名学生的5次训练成绩(单位:分),结果如下:学生第1次第2次第3次第4次第5次甲6580708575乙8070758070则成绩较为稳定(方差较小)的那位学生的成绩的方差为.答案20解析根据题意得。
2021-2022年高考数学大一轮复习 11.2用样本估计总体试题 理 苏教版
2021-2022年高考数学大一轮复习 11.2用样本估计总体试题理苏教版一、填空题1.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如图),已知从左到右各长方形高的比为2∶3∶5∶6∶3∶1,则该班学生数学成绩在(80,100)之间的学生人数是________.解析80~100之间两个长方形高占总体的比例为5+62+3+5+6+3+1=1120,即为频数之比,∴x60=1120,∴x=33.答案332.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.解析∵小矩形的面积等于频率,∴除[120,130)外的频率和为0.700,∴a=1-0.70010=0.030.由题意知,身高在[120,130),[130,140),[140,150]的学生分别为30人,20人,10人,∴由分层抽样可知抽样比为1860=310,∴在[140,150]中选取的学生应为3人.答案0.030 33.某人5次上班途中所花的时间(单位:分钟)分别为8,12,10,11,9,估计此人每次上班途中平均花费的时间为________.解析依题意,估计此人每次上班途中平均花费的时间为8+12+10+11+95=10分钟.答案 10分钟4.将某班的60名学生编号为:01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是________.解析依据系统抽样方法的定义知,将这60名学生依次按编号每12人作为一组,即01~12、13~24、…、49~60,当第一组抽得的号码是04时,剩下的四个号码依次是16,28,40,52(即其余每一小组所抽出来的号码都是相应的组中的第四个号码).答案 16,28,40,525.某市要对两千多名出租车司机的年龄进行调查,现从中随机取出n名司机,已知抽到的司机年龄都在[20,45)岁,根据调查结果得出司机的年龄情况的部分频率分布直方图如图所示,则由该图可以估计年龄在[25,30)岁的司机约占该市司机总数的________.解析由频率分布直方图可知年龄在[25,30)岁的频率是1-(0.01+0.07+0.06+0.02)×5=0.2,故可以估计年龄在[25,30)岁的司机约占该市司机总数的20%.答案 20%6.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{a n},若a3=8,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是________.解析设等差数列{a n}的公差为d(d≠0),a3=8,a1a7=(a3)2=64,(8-2d)(8+4d)=64,(4-d)(2+d)=8,2d-d2=0,又d≠0,故d=2,故样本数据为4、6、8、10、12、14、16、18、20、22,样本的平均数为4+22×510=13,中位数为12+142=13.答案 13,137. xx年的NBA全明星赛于美国当地时间2012年2月26日在佛罗里达州奥兰多市举行.如图是参加此次比赛的甲、乙两名篮球运动员以往几场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是________.解析依题意得,甲、乙两人这几场比赛得分的中位数分别是28、36,因此甲、乙两人这几场比赛得分的中位数之和是64.答案 648.如果数据x1,x2,x3,…,x n的平均数是10,则数据6x1-2,6x2-2,6x3-2,…,6x n-2的平均数为________.解析原有数据平均数为10,变换后平均数为6×10-2=58.答案589.对某种花卉的开放花期追踪调查,调查情况如下:解析x=1100(12×20+15×40+18×30+21×10)=16(天).答案1610.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是________.①甲地:总体均值为3,中位数为4;②乙地:总体均值为1,总体方差大于0;③丙地:中位数为2,众数为3;④丁地:总体均值为2,总体方差为3.解析根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,①中,中位数为4,可能存在大于7的数;同理,在③中也有可能;②中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;④中,根据方差公式,如果有大于7的数存在,那么方差不会为3,故填④.答案④二、解答题11.假设甲乙两种品牌的同类产品在某地区市场上销售量相等,为了解他们的使用寿命,现从这两种品牌的产品中分别随机抽取100个进行测试,结果统计如下:(1)估计甲品牌产品寿命小于200小时的概率;(2)这两种品牌产品中,某个产品已使用了200小时,试估计该产品是甲品牌的概率.解 (1)甲品牌产品寿命小于200小时的频率为5+20100=14,用频率估计概率,所以甲品牌产品寿命小于200小时的概率为1 4 .(2)根据抽样结果,寿命大于200小时的产品共有75+70=145(个),其中甲品牌产品是75个,所以在样本中,寿命大于200小时的产品是甲品牌的频率是75145=1529,用频率估计概率,所以已使用了200小时的该产品是甲品牌的概率为15 29.12.某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售.如果当天卖不完,剩下的玫瑰花作垃圾处理.(1)若花店一天购进17枝玫瑰花,求当天的利润y(单位:元)关于当天需求量n(单位:枝,n∈N)的函数解析式;(2)花店记录了100天玫瑰花的日需求量(单位:枝),整理得下表:(单位:元)的平均数;②若花店一天购进17枝玫瑰花,以100天记录的各需求量的频率作为各需求量发生的概率,求当天的利润不少于75元的概率.解 (1)当日需求量n≥17时,利润y=85.当日需求量n<17时,利润y=10n-85.所以y关于n的函数解析式为y =⎩⎨⎧10n -85,n <17,85, n ≥17,(n ∈N).(2)①这100天中有10天的日利润为55元,20天的日利润为65元,16天的日利润为75元,54天的日利润为85元,所以这100天的日利润的平均数为1100(55×10+65×20+75×16+85×54)=76.4 ②利润不低于75元当且仅当日需求量不少于16枝,故当天的利润不少于75元的概率为P =0.16+0.16+0.15+0.13+0.1=0.7. 13. 某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.解 (1)设分数在[70,80)内的频率为x ,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,可得x=0.3,所以频率分布直方图如图所示.(2)平均分为:x=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).14.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中x的值;(2)从成绩不低于80分的学生中随机选取2人,该2人中成绩在90分以上(含90分)的人数记为ξ,求ξ的数学期望.解(1)图中x所在组为[80,90]即第五组.∵f5=1-10×(0.054+0.01+3×0.006)=1-0.82=0.18,∴x=0.018(2)成绩不低于80分的学生所占的频率为f=10×(0.018+0.006)=0.24,∴成绩不低于80分的学生有:50f=50×0.24=12(人)成绩不低于90分的学生人数为:50×10×0.006=3(人)∴ξ的取值为0,1,2.P(ξ=0)=C2 9C2 12=6 11,P(ξ=1)=C19×C13C212=922,P(ξ=2)=C2 3C2 12=1 22.∴ξ的分布列为:∴ξ的数学期望E(ξ)=0×22+1×22+2×22=2.39817 9B89 鮉"U38477 964D 降30887 78A7 碧-Qh5精品文档37862 93E6 鏦?%O36607 8EFF 軿实用文档。
高考数学大一轮复习 11.1随机抽样教师用书 理 苏教版-苏教版高三全册数学试题
§11.1 随机抽样1.简单随机抽样(1)定义:设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样的方法:抽签法和随机数法. 2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本. (1)先将总体的N 个个体编号;(2)确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =N n; (3)在第1段用简单随机抽样确定第一个个体编号l (l ≤k );(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ),依次进行下去,直到获取整个样本. 3.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样. (2)分层抽样的应用X 围:当总体是由差异明显的几个部分组成时,往往选用分层抽样. 【思考辨析】判断下面结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样是一种不放回抽样.( √)(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( ×)(3)系统抽样在起始部分抽样时采用简单随机抽样.( √)(4)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( ×)(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( ×)1.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为________.答案25,56,19解析因为125∶280∶95=25∶56∶19,所以抽取人数分别为25人,56人,19人.2.为了调查某产品的销售情况,销售部门从下属的92家销售连锁店中抽取30家了解情况.若用系统抽样法,则抽样间隔和随机剔除的个体数分别为________.答案3,2解析92被30除余数为2,故需剔除2个数,90÷30=3,∴间隔为3.3.某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型产品有16件,那么此样本容量n=________. 答案80解析依题意A、B、C三种不同型号样本个数之比为2∶3∶5,∴样本中B型产品有24件,C型产品有40件,∴n=16+24+40=80.4.一支田径队有男运动员48人,女运动员36人.若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.答案12解析样本的抽取比例为2148+36=14,所以应抽取男运动员48×14=12(人).题型一 简单随机抽样例1 下列抽取样本的方式是否属于简单随机抽样? (1)从无限多个个体中抽取100个个体作为样本.(2)盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里. (3)从20件玩具中一次性抽取3件进行质量检验.(4)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛. 思维点拨 由简单随机抽样的特征判断.解 (1)不是简单随机抽样.因为被抽取的样本总体的个体数是无限的,而不是有限的. (2)不是简单随机抽样.因为它是放回抽样.(3)不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取. (4)不是简单随机抽样.因为不是等可能抽样.思维升华 (1)简单随机抽样需满足:①被抽取的样本总体的个体数有限;②逐个抽取;③是不放回抽取;④是等可能抽取.(2)简单随机抽样常有抽签法(适用总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).(2013·某某)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为________.7816 6572 0802 6314 0702 4369 9728 0198 32049234493582003623486969387481答案 解析 从第1行第5列和第6列组成的数65开始由左到右依次选出的数为08,02,14,07,01,所以第5个个体编号为01. 题型二 系统抽样例2 将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为________.思维点拨 根据“等距”抽样确定各营区被抽中的人数. 答案 25,17,8解析 由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N *)组抽中的是3+12(k -1). 令3+12(k -1)≤300得k ≤1034,因此第Ⅰ营区被抽中的人数是25; 令300<3+12(k -1)≤495得1034<k ≤42,因此第Ⅱ营区被抽中的人数是42-25=17,第Ⅲ营抽取人数为50-25-17=8人.思维升华 (1)系统抽样适用的条件是总体容量较大,样本容量也较大.(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔.(3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定.(2013·某某改编)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为________. 答案 12解析 由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12(人). 题型三 分层抽样例3 (2014·某某改编)已知某地区中小学生人数和近视情况分别如图(1)和图(2)所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________.答案 200,20解析 该地区中小学生总人数为 3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20. 思维升华 进行分层抽样的相关计算时,常利用以下关系式巧解: (1)样本容量n 总体的个数N =该层抽取的个体数该层的个体数; (2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.(2013·某某改编)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n 的样本进行调查,其中从丙车间的产品中抽取了3件,则n =________. 答案 13解析 ∵360=n 120+80+60,∴n =13.五审图表找规律典例:(14分)某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:人数 管理 技术开发 营销 生产 共计 老年 40 40 40 80 200 中年 80 120 160 240 600 青年 40 160 280 720 1 200 共计1603204801 0402 000(1)若要抽取40(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?(3)若要抽20人调查对某某亚运会举办情况的了解,则应怎样抽样?抽取40人调查身体状况↓(观察图表中的人数分类统计情况) 样本人群应受年龄影响↓(表中老、中、青分类清楚,人数确定) 要以老、中、青分层,用分层抽样 ↓要开一个25人的座谈会 ↓(讨论单位发展与薪金调整)样本人群应受管理、技术开发、营销、生产方面的影响 ↓(表中管理、技术开发、营销、生产分类清楚,人数确定) 要以管理、技术开发、营销、生产人员分层,用分层抽样 ↓要抽20人调查对某某亚运会举办情况的了解↓可认为亚运会是大众体育盛会,一个单位人员对情,况了解相当 将单位人员看作一个整体↓(从表中数据看总人数为2 000人) 人员较多,可采用系统抽样 规X 解答解 (1)按老年、中年、青年分层,用分层抽样法抽取,[2分] 抽取比例为402 000=150.[4分]故老年人,中年人,青年人各抽取4人,12人,24人.[6分] (2)按管理、技术开发、营销、生产分层,用分层抽样法抽取,[8分] 抽取比例为252 000=180,[10分]故管理,技术开发,营销,生产各部门抽取2人,4人,6人,13人.[12分] (3)用系统抽样,对全部2 000人随机编号,从0001~2000,每100号分为一组,从第一组中用随机抽样抽取一个,然后将这个分别加100,200,…,1 900,共20人组成一个样本.[14分]温馨提醒(1)本题审题的关键有两点,一是对图表中的人员分类情况和数据要审视清楚;二是对样本的功能要审视准确.(2)本题易错点是,对于第(2)问,由于对样本功能审视不准确,按老、中、青三层分层抽样.方法与技巧1.简单随机抽样的特点:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小;用简单随机抽样法抽取的个体带有随机性;个体间无固定间距.2.系统抽样的特点:适用于元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始部分抽样时,采用简单随机抽样.3.分层抽样的特点:适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.失误与防X进行分层抽样时应注意几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.A组专项基础训练(时间:30分钟)1.(2013·课标全国Ⅰ改编)为了了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是________.①简单随机抽样;②按性别分层抽样;③按学段分层抽样;④系统抽样.答案③解析 不同的学段在视力状况上有所差异,所以应该按照学段分层抽样.2.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为________. 答案 8解析 设样本容量为N ,则N ×3070=6,∴N =14,∴高二年级所抽学生人数为14×4070=8.3.网络上流行一种“QQ 农场游戏”,这种游戏通过虚拟软件模拟种植与收获的过程.为了了解本班学生对此游戏的态度,高三(6)班计划在全班60人中展开调查,根据调查结果,班主任计划采用系统抽样的方法抽取若干名学生进行座谈,为此先对60名学生进行编号1,2,3,…,60,已知抽取的学生中最小的两个编号为3,9,则抽取的学生中最大的编号为________. 答案 57解析 由最小的两个编号为3,9可知,抽样间距为6,因此抽取人数的比例为16,即抽取10名同学,其编号构成首项为3,公差为6的等差数列,故最大编号为3+(10-1)×6=57. 4.为规X 学校办学,省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应为________. 答案 20解析 抽样间隔为46-33=13, 故另一位同学的编号为7+13=20.5.某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生是高一学生的两倍,高二学生比高一学生多300人,现在按1100的抽样比例用分层抽样的方法抽取样本,则高一学生应抽取的人数为________. 答案 8解析 设高一学生有x 人,则高三学生有2x 人,高二学生有(x +300)人,学校共有4x +300=3 500(人),解得x =800(人),由此可得按1100的抽样比例用分层抽样的方法抽取样本,高一学生应抽取的人数为1100×800=8(人).6.已知某商场新进3 000袋奶粉,为检查其三聚氰胺是否达标,现采用系统抽样的方法从中抽取150袋检查,若第一组抽出的是11,则61组抽出的为________. 答案 1211解析 每组袋数:d =3 000150=20,由题意知这些是以11为首项,20为公差的等差数列,a 61=11+60×20=1211.7.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个为04,则剩下的四个依次是________. 答案 16,28,40,52解析 编号组数为5,间隔为605=12,因为在第一组抽得04号:4+12=16,16+12=28,28+12=40,40+12=52, 所以其余4个为16,28,40,52.8.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生. 答案 15解析 抽取比例与学生比例一致.设应从高二年级抽取x 名学生,则x ∶50=3∶10.解得x =15.9.某校共有学生2 000名,各年级男、女学生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为________.答案 16解析 依题意可知二年级的女生有380人,那么三年级的学生人数应该是2 000-373-377-380-370=500,即总体中各个年级的人数比为3∶3∶2,故在分层抽样中应在三年级抽取的学生人数为64×28=16.10.用系统抽样法从160名学生中抽取容量为20的样本,将160名学生从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的为123,则第2组中应抽出个体的是________. 答案 11解析 由题意可知,系统抽样的组数为20,间隔为8,设第1组抽出的为x ,则由系统抽样的法则可知,第n 组抽出个体的应该为x +(n -1)×8,所以第16组应抽出的为x +(16-1)×8=123,解得x =3,所以第2组中应抽出个体的为3+(2-1)×8=11.B 组 专项能力提升 (时间:25分钟)1.(2014·某某改编)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则下列结论正确的是________.①p 1=p 2<p 3;②p 2=p 3<p 1;③p 1=p 3<p 2;④p 1=p 2=p 3. 答案 ④解析 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p 1=p 2=p 3. 2.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为________. 答案 10解析 由系统抽样的特点知:抽取的间隔为96032=30,抽取的依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人.3.某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为________. 答案 160解析 关键是确定样本的抽取比例. 男生人数为560×280560+420=160.4.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用word系统抽样方法,按1~200编号分为40组,分别为1~5,6~10,…,196~200,第5组抽取为22,第8组抽取为________.若采用分层抽样,40岁以下年龄段应抽取________人. 答案 37 20解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取为22,则第8组抽取的应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x 人,则40200=x 100,解得x =20. 5.一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的为m ,那么在第k 组中抽取的个位数字与m +k 的个位数字相同,若m =8,则在第8组中抽取的是________.答案 76解析 由题意知:m =8,k =8,则m +k =16,也就是第8组抽取的个位数字为6,十位数字为8-1=7,故抽取的为76.6.某公路某某有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体.如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n .解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为36n ,分层抽样的比例是n 36,抽取的工程师人数为n 36×6=n 6,技术员人数为n 36×12=n 3,技工人数为n 36×18=n 2,所以n 应是6的倍数,36的约数,即n =6,12,18.当样本容量为(n +1)时,总体容量是35人,系统抽样的间隔为35n +1,因为35n +1必须是整数,所以n 只能取6.即样本容量n =6.。
高考数学一轮复习10.2用样本估计总体理湘教版
2016届高考数学一轮复习 10.2用样本估计总体 理 湘教版一、选择题1.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m o ,平均值为x -,则( )A .m e =m o =x -B .m e =m o <x -C .m e <m o <x -D .m o <m e <x -【解析】 30个数中第15个数是5,第16个数是6,所以中位数m e =5+62=5.5,众数m o =5,平均值x -=3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230=17930.【答案】 D2.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数登记错了,甲实得80分,却记了50分,乙实得70分,却记了100分,更正后平均分和方差分别是( )A .70,75B .70,50C .75,1.04D .62,2.35【解析】 因甲少记了30分,乙多记了30分,故平均分不变,设更正后的方差为s 2,则由题意可得:s 2=148[(x 1-70)2+(x 2-70)2+…+(80-70)2+(70-70)2+…+(x 48-70)2],而更正前有75=148[(x 1-70)2+(x 2-70)2+…+(50-70)2+(100-70)2+…+(x 48-70)2],化简整理得s 2=50. 【答案】 B3.关于统计数据的分析,有以下几个结论:①一组数不可能有两个众数;②将一组数据中的每个数据都减去同一个数后,方差没有变化;③调查剧院中观众观看感受时,从50排(每排人数相同)中任意抽取一排的人进行调查,属于分层抽样;④一组数据的方差一定是正数;⑤如图是随机抽取的200辆汽车通过某一段公路时的时速分布直方图,根据这个直方图,可以得到时速在[50,60)的汽车大约是60辆.则这5种说法中错误的个数是( )A.2 B.3C.4 D.5【解析】一组数中可以有两个众数,故①错;根据方差的计算法可知②正确;③属于简单随机抽样,故③错误;④错误,因为方差可以是零;⑤正确.故错误的说法有3个.【答案】 B4.某地居民的月收入调查所得数据的频率分布直方图如图,居民的月收入的中位数大约是( )A .2 100B .2 400C .2 500D .2 600【解析】 从频率分布直方图,可以知道要使得两边的面积相等,平分面积的直线应该在2 000~2 500之间,设该直线的方程为x =a ,则500×(0.000 2+0.000 4)+0.000 5×(a -2 000)=0.000 5×(2 500-a )+500×(0.000 5+0.000 3+0.000 1),解得a =2 400,即居民的月收入的中位数大约是2 400.【答案】 B5.(2014·黄冈中学高三适应性考试)茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中有一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率是( )A.25B.710C.45D.910【解析】 记其中被污损的数字为x ,由题知甲的5次综合测评的平均成绩是15×(80×2+90×3+8+9+2+1+0)=90,乙的5次综合测评的平均成绩是15×(80×3+90×2+3+3+7+x +9)=442+x 5,令90>442+x5,解得x <8,即x 的取值可以是0~7,因此甲的平均成绩超过乙的平均成绩的概率是810=45.【答案】 C6.某班50名学生在一次百米测试中,成绩全部在[13,18]内,将测试结果按如下方式分成五组:第一组[13,14);第二组[14,15);…;第五组[17,18].如图是按上述分组方法得到的频率分布直方图.且第一组,第二组,第四组的频数成等比数列,则成绩在[13,15)内的学生人数为( )A.12 B.14C.16 D.10【解析】由图知第一、三、五小组的频率分别为0.08,0.38,0.06,∴其频数分别为4,19,3,∴第二、四组的频数和为50-4-19-3=24.∵第一、二、四组的频数成等比数列,设其公比为q,则第二、四组的频数为4q,4q2.∴4q+4q2=24,解得q=2或q=-3(舍去),∴第二小组的频数为4q=8,∴成绩在[13,15)内的学生有4+8=12(人).【答案】 A二、填空题7.某校从参加高一年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如下图所示的部分频率分布直方图.在统计方法中,同一组数据常用该组区间的中点值作为代表,观察图形的信息,据此估计本次考试的平均分为________.【解析】 由频率分布直方图中,所有小长方形的面积和为1,设[70,80)的小长方形面积为x ,则(0.01+0.015×2+0.025+0.005)×10+x =1,解得x =0.3,即数学成绩落在[70,80)的频率为0.3,所以本次考试的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.【答案】 71 8.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是________.①甲地:总体均值为3,中位数为4; ②乙地:总体均值为1,总体方差大于0; ③丙地:中位数为2,众数为3;④丁地:总体均值为2,总体方差为3. 【解析】 根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,①中,中位数为4,可能存在大于7的数;同理,在③中也有可能;②中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;④中,根据方差公式,如果有大于7的数存在,那么方差不会为3,故填④.【答案】 ④9.(2014·安徽“江南十校”联考)某次摄影比赛,9位评委为某参赛作品给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91分.复核员在复核时,发现有一个数字(茎叶图中的x )无法看清.若记分员计算无误,则数字x 是________.【解析】 由茎叶图知,最高分为94,最低分为88, 由题意知89+89+92+93+90+x +92+917=91.解得x =1. 【答案】 110.把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数的等比数列,则剩下三组中频数最高的一组的频数为________.【解析】 已知前七组的累积频率为0.79,而要研究后三组的问题,因此应先求出后三组的频率之和为1-0.79=0.21,进而求出后三组的共有频数,或者先求前七组共有频数后,再计算后三组的共有频数.由已知知前七组的累积频数为0.79×100=79,故后三组共有的频数为21,依题意,a1(1-q3)1-q=21.∴a1(1+q+q2)=21,∴a1=1,q=4.∴后三组频数最高的一组的频数为16.【答案】16三、解答题11.某学校为了了解学生的日平均睡眠时间(单位:h),随机选择了n名同学进行调查.下表是这n名同学的日睡眠时间的频率分布表.(1)求n(2)统计方法中,同一组数据常用该组区间的中点值(例如区间[4,5)的中点值是4.5)作为代表.若据此计算的上述数据的平均值为6.52,求a,b的值,并由此估计该学校学生的日平均睡眠时间在7小时以上的概率.【解析】(1)由频率分布表可得n=60.12=50.频率分布直方图如下:(2)由题意 ⎩⎪⎨⎪⎧150(6×4.5+10×5.5+a ×6.5+b ×7.5+4×8.5)=6.52,6+10+a +b +4=50,解得a =15,b =15.设“该学校学生的日平均睡眠时间在7小时以上”为事件A , 则P (A )≈15+450=0.38.答:该学校学生的日平均睡眠时间在7小时以上的概率约为0.38. 12.某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min 抽取一包产品,称其重量,分别记录抽查数据如下:甲:102,101,99,98,103,98,99; 乙:110,115,90,85,75,115,110. (1)这种抽样方法是哪一种? (2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间的产品较稳定. 【解析】 (1)因为间隔时间相同,故是系统抽样. (2)茎叶图如下:(3)甲车间:平均值:x 1=17(102+101+99+98+103+98+99)=100,方差:s 21=17[(102-100)2+(101-100)2+…+(99-100)2]≈3.43.乙车间:平均值:x 2=17(110+115+90+85+75+115+110)=100,方差:s22=17[(110-100)2+(115-100)2+…+(110-100)2]≈228.57.∵x1=x2,s21<s22,∴甲车间的产品较稳定.13.(2013·济南诊断)从某校高三年级800名男生中随机抽取50名学生测量其身高,据测量被测学生的身高全部在155 cm到195 cm之间.将测量结果按如下方式分成8组:第一组[155,160),第二组[160,165),…,第八组[190,195),如下图是按上述分组得到的频率分布直方图的一部分.已知第一组与第八组的人数相同,第六组、第七组和第八组的人数依次成等差数列.频率分布直方图:(1)求下列频率分布表中所标字母的值,并补充完成频率分布直方图.(2)x,y,求满足:|x-y|≤5的事件的概率.【解析】(1)由频率分布直方图可得前5组的频率是(0.008+0.016+0.04+0.04+0.06)×5=0.82,第8组的频率是0.04,所以第6、7组的频率是1-0.86=0.14,所以样本中第6、7组的总人数为7人.由已知得:x+m=7.①∵x,m,2成等差数列,∴x=2m-2,②由①②得:m=3,x=4,∴y=0.08,n=0.06,z=0.016,p=0.012.频率分布直方图如图所示.(2)由(1)知,身高在[180,185)内的有4人,设为a,b,c,d,身高在[190,195]内的有2人,设为A,B.若x,y∈[180,185),则有ab,ac,ad,bc,bd,cd共6种情况;若x,y∈[190,195],则有AB共1种情况;若x∈[190,195],y∈[180,185)或x∈[180,185),y∈[190,195],则有aA,bA,cA,dA,aB,bB,cB,dB共8种情况.∴基本事件总数为6+1+8=15种.又事件“|x-y|≤5”所包含的基本事件总数为6+1=7种,∴P(|x-y|≤5)=715 .。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§11.2 用样本估计总体1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差). (2)决定组距与组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连结频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. (2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.4.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.平均数:样本数据的算术平均数,即x =1n(x 1+x 2+…+x n ).在频率分布直方图中,中位数左边和右边的直方图的面积应该相等. (2)样本方差、标准差 标准差s =1n[ x 1-x 2+ x 2-x 2+…+ x n -x 2],其中x n 是样本数据的第n 项,n 是样本容量,x 是平均数.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差. [知识拓展]1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×频率组距.(2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. 2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2. 【思考辨析】判断下面结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × ) (3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × )1.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是________. 答案 91.5,91.5解析 这组数据由小到大排列为87,89,90,91,92,93,94,96, ∴中位数为12×(91+92)=91.5.平均数为18×(87+89+90+91+92+93+94+96)=91.5.2.一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12 [35.5,39.5) 7 [39.5,43.5) 3根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是________. 答案 13解析 由已知,样本容量为66,而落在[31.5,43.5)内的样本数为12+7+3=22,故所求概率为2266=13.3.(2014·四川改编)在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是________. 答案 总体解析 调查的目的是“了解某地5 000名居民某天的阅读时间”,所以“5 000名居民的阅读时间的全体”是调查的总体.4.某中学为了了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.答案 600解析 由直方图易得数学考试中成绩小于60分的频率为(0.002+0.006+0.012)×10=0.2,所以所求分数小于60分的学生数为3 000×0.2=600.题型一 频率分布直方图的绘制与应用例1 某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.思维点拨图中各小长方形的面积和等于1.解(1)设分数在[70,80)内的频率为x,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,可得x=0.3,所以频率分布直方图如图所示.(2)平均分:45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).思维升华(1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.(2013·陕西改编)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为________.答案0.45解析设区间[25,30)对应矩形的另一边长为x,则所有矩形面积之和为1,即(0.02+0.04+0.06+0.03+x)×5=1,解得x=0.05.产品为二等品的概率为0.04×5+0.05×5=0.45. 题型二茎叶图的应用例2 如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则一定有________.①a1>a2;②a2>a1;③a 1=a 2;④a 1,a 2的大小与m 的值有关.思维点拨 去掉第一行和第三行的数,只计算第二行叶上的数即可. 答案 ②解析 去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a 2>a 1.思维升华 由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表试题时,就要充分使用这个图表提供的数据进行相关的计算或者对某些问题作出判断.(2013·山东)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:8 7 7 9 4 0 1 0 x 9 1则7个剩余分数的方差为________. 答案367解析 由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2] =17(16+9+1+0+1+9+0)=367. 题型三 用样本的数字特征估计总体的数字特征例3 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价. 思维点拨 (1)先通过图象统计出甲、乙二人的成绩;(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价.解 (1)由题图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.x 甲=10+13+12+14+165=13,x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由s 2甲>s 2乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.(2013·江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员 第1次 第2次 第3次 第4次 第5次 甲 87 91 90 89 93 乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为________. 答案 2解析 x 甲=15(87+91+90+89+93)=90,x 乙=15(89+90+91+88+92)=90,s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,s 2乙=15[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.高考中频率分布直方图的应用典例:(2014·山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.答案 12解析 志愿者的总人数为200.16+0.24 ×1=50,所以第三组人数为50×0.36=18, 所以有疗效的人数为18-6=12.温馨提醒 本题的难点是对频率分布直方图意义的理解以及利用这个图提供的数据对所提问题的计算,频率分布直方图中纵轴上的数据是频率除以组距,组距越大该数据越小,在解答这类问题时要特别注意.方法与技巧1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.若取值x 1,x 2,…,x n 的频率分别为p 1,p 2,…,p n ,则其平均值为x 1p 1+x 2p 2+…+x n p n ;若x 1,x 2,…,x n 的平均数为x ,方差为s 2,则ax 1+b ,ax 2+b ,…,ax n +b 的平均数为a x +b ,方差为a 2s 2. 失误与防范频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.A组专项基础训练(时间:40分钟)1.(2013·重庆改编)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的概率为________.189212279300 3答案0.4解析10个数据落在区间[22,30)内的数据有22,22,27,29共4个,因此,所求的频率为4 10=0.4.2.(2014·陕西改编)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为________.答案x+100,s2解析x1+x2+…+x1010=x,y i=x i+100,所以y1,y2,…,y10的均值为x+100,方差不变.3.(2013·辽宁)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是________.答案50解析由频率分布直方图,知低于60分的频率为(0.01+0.005)×20=0.3.∴该班学生人数n =150.3=50.4.将容量为n 的样本中的数据分成6组,绘制频率分布直方图.若第一至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n 等于________. 答案 60解析 设第一至第六组数据的频数分别为2x,3x,4x,6x,4x ,x ,则2x +3x +4x =27,解得x =3,故n =20x =60.5.(2013·湖北)某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为________; (2)命中环数的标准差为________. 答案 (1)7 (2)2解析 (1)x =110(7+8+7+9+5+4+9+10+7+4)=7010=7. (2)s 2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4, ∴命中环数的标准差为2.6.某中学高三年级从甲、乙两个班级各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则x +y 的值为________.答案 8解析 依题意,甲班学生的平均分85=78+79+85+80+92+96+80+x 7,故x =5.乙班学生成绩的中位数是83,故其成绩为76,81,81,83,91,91,96, ∴y =3,∴x +y =8.7.在样本频率分布直方图中,共有5个小长方形,已知中间一个小长方形的面积是其余4个小长方形面积之和的13,且中间一组的频数为10,则这个样本的容量是________.答案 40解析 设中间小长方形的面积为S , 则S =13(1-S ),3S =1-S ,∴S =14,即频率=14.∵频数=10,∴样本容量=频数频率=1014=40. 8.若某产品的直径长与标准值的差的绝对值不超过1 mm 时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:分组 频数频率 [-3,-2)0.10 [-2,-1) 8(1,2]0.50 (2,3] 10(3,4]合计501.00(1)将上面表格中缺少的数据填在相应位置;(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率; (3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.解 (1)如下表所示频率分布表.分组 频数 频率 [-3,-2) 5 0.10 [-2,-1) 8 0.16 (1,2] 25 0.50 (2,3] 10 0.20 (3,4] 2 0.04 合计501.00(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率约为 0.50+0.20=0.70.(3)设这批产品中的合格品数为x件,依题意505 000=20x+20,解得x=5 000×2050-20=1 980.所以该批产品的合格品件数大约是1 980件.9.(2014·广东)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据上述数据得到样本的频率分布表如下:分组频数频率[25,30]30.12(30,35]50.20(35,40]80.32(40,45]n1f1(45,50]n2f2(1)确定样本频率分布表中n1,n2,f1和f2的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率.解(1)由所给数据知,落在区间(40,45]内的有7个,落在(45,50]内的有2个,故n1=7,n2=2,所以f1=n125=725=0.28,f2=n225=225=0.08.(2)样本频率分布直方图如图.(3)根据样本频率分布直方图,每人的日加工零件数落在区间(30,35]的概率为0.2,设所取的4人中,日加工零件数落在区间(30,35]的人数为ξ,则ξ~B(4,0.2),P(ξ≥1)=1-P(ξ=0)=1-(1-0.2)4=1-0.409 6=0.590 4,所以在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率为0.590 4.B组专项能力提升(时间:25分钟)1.(2013·四川)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是________.0 7 31 7 6 4 4 3 02 7 5 5 43 2 038 5 43答案 ①解析 由于频率分布直方图的组距为5,排除③④,又[0,5),[5,10)两组各一人,排除②,应选①.2.(2013·安徽)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是________. ①这种抽样方法是一种分层抽样; ②这种抽样方法是一种系统抽样;③这五名男生成绩的方差大于这五名女生成绩的方差; ④该班男生成绩的平均数小于该班女生成绩的平均数. 答案 ③解析 x 男=15(86+94+88+92+90)=90,x 女=15(88+93+93+88+93)=91,s 2男=15[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8,s 2女=15[(88-91)2+(93-91)2+(93-91)2+(88-91)2+(93-91)2]=6.故③正确.3.如果数据x 1,x 2,…,x n 的平均数为x ,方差为s 2,则2x 1+3,2x 2+3,…,2x n +3的平均数和方差分别为________. 答案 2x +3,4s 2解析 方法一 平均数为1n (2x 1+3+2x 2+3+…+2x n +3)=1n[2(x 1+x 2+…+x n )+3n ]=2x +3;方差为1n{[(2x 1+3)-(2x +3)]2+[(2x 2+3)-(2x +3)]2+…+[(2x n +3)-(2x +3)]2}=1n[4(x 1-x )2+4(x 2-x )2+…+4(x n -x )2]=4s 2.方法二 原数据乘以2加上3得到一组新数据,则由平均数、方差的性质可知得到的新数据的平均数、方差分别是2x +3和4s 2.4.(2014·江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.答案 24解析 底部周长在[80,90)的频率为0.015×10=0.15, 底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm 的株数为(0.15+0.25)×60=24. 5.某高校在2013年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下表所示.组号 分组 频数 频率 第1组 [160,165) 5 0.050 第2组 [165,170) ① 0.350 第3组 [170,175) 30 ② 第4组 [175,180) 20 0.200 第5组 [180,185]10 0.100 合计1001.00(1)请先求出频率分布表中①、②位置相应数据,再完成下列频率分布直方图;(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样的方法抽取6名学生进入第二轮面试,则第3、4、5组每组各抽取多少名学生进入第二轮面试? (3)在(2)的前提下,学校决定在6名学生中随机抽取2名学生接受A 考官进行面试,求:第4组至少有一名学生被考官A 面试的概率.解 (1)由题意可知,第2组的频数为0.35×100=35, 第3组的频率为30100=0.300,频率分布直方图如图所示:(2)因为第3、4、5组共有60名学生,所以利用分层抽样在60名学生中抽取6名学生,每组分别为第3组:3060×6=3人,第4组:2060×6=2人,第5组:1060×6=1人.所以第3、4、5组分别抽取3人、2人、1人. (3)设第3组的3位同学为A 1,A 2,A 3, 第4组的2位同学为B 1,B 2, 第5组的1位同学为C 1,则从六位同学中抽两位同学有15种可能如下:(A 1,A 2),(A 1,A 3),(A 1,B 1),(A 1,B 2),(A 1,C 1),(A 2,A 3),(A 2,B 1),(A 2,B 2),(A 2,C 1),(A 3,B 1),(A 3,B 2),(A 3,C 1),(B 1,B 2),(B 1,C 1),(B 2,C 1).其中第4组的2位同学至少有一位同学入选的有(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2),(B 1,C 1),(B 2,C 1)9种可能,所以第4组的2位同学至少有一位同学入选的概率为9 15=3 5.。