高考题型之 频率分布直方图
高中数学频率分布直方图
频率分布直方图作频率分布直方图的方法为:(1)把横轴分成若干段,每一线段对应一个组的组距;(2)以此线段为底作矩形,它的高等于该组的组距频率,这样得出一系列的矩形;(3)每个矩形的面积恰好是该组上的频率.频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图.作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.知识点1:利用频率分布直方图分析总体分布例题1: 2000辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,时速在[50,60)的汽车大约有 A .30辆 B .60辆 C .300辆 D .600辆变式:某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是 [96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是A.90B.75C. 60D.45变式:某初一年级有500名同学,将他们的身高(单位:cm )数据绘制成频率分布直方图(如图),若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[)130,140内的学生中选取的人数为 .知识点2:用样本分估计总体例题2某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,96 98 100 102 104 106 0.1500.125 0.1000.0750.050 克 频率/组距100 110 120130 140 150 身高频率|组距0.0050.0100.020a0.035(Ⅰ) 完成频率分布表;(Ⅱ)作出频率分布直方图;(Ⅲ)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染。
高考题型之-频率分布直方图
高考题型之-频率分布直方图
频率分布直方图是用来表示数据分布情况的一种统计图,其中的每一条柱状图代表了某个特定变量的频率分布。
这种图形能够很好地显示出数据分布的大致特征,帮助研究者更快更有效地理解和提取数据中的信息。
高考中,频率分布直方图会用于帮助考生分析一组数据,从而确定其分布范围,比例和密度。
此外,它还可以用来比较不同数据集之间的差异,以及分析数据集的变化趋势,从而帮助考生更好地掌握数据分析的基本原理。
高中数学复习概率统计题型归纳与讲解03 频率分布直方图
高中数学复习概率统计题型归纳与讲解专题3频率分布直方图例1.要调查某地区高中学生身体素质,从高中生中抽取100人进行跳高测试,根据测试成绩制作频率分布直方图如图,现从成绩在[120,140)之间的学生中用分层抽样的方法抽取5人,应从[120,130)间抽取人数为b,则()A.a=0.2,b=2B.a=0.025,b=3C.a=0.3,b=4D.a=0.030,b=3【解析】解:由题得10×(0.005+0.035+a+0.020+0.010)=1,所以a=0.030.在[120,130)之间的学生人数为:100×10×0.030=30人,在[130,140)之间的学生人数为:100×10×0.020=20人,在[120,140)之间的学生人数为:100×(10×0.030+0.020)=50人,又用分层抽样的方法在[120,140)之间的学生50人中抽取5人,即抽取比例为:110,所以成绩在[120,130)之间的学生中抽取的人数应,30×110=3,即b=3,故选:D.例2.从某企业生产的某种产品中随机抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值分组[70,80) [80,90) [90,100) [100,110) 110,120)频数 14 20 36 18 12估计这种产品质量指标值的平均数为(同一组中的数据用该组区间的中点值作代表)( )A .100B .98.8C .96.6D .94.4【解析】解:平均数x →=0.14×75+0.20×85+0.36×95+0.18×105+0.12×115=94.4.故选:D .例3.“新冠肺炎”席卷全球,我国医务工作者为了打好这次疫情阻击战,充分发挥优势,很快抑制了病毒,据统计老年患者治愈率为71%,中年患者治愈率为85%,青年患者治愈率为91%.如果某医院有30名老年患者,40名中年患者,50名青年患者,则估计该医院的平均治愈率是( )A .86%B .83%C .90%D .84%【解析】解:利用求加权平均数的公式解得:30×71%+40×85%+50×91%30+40+50=0.84=84%,故选:D .例4.已知样本数据x 1,x 2,…,x n (n ∈N *)的平均数与方差分别是a 和b ,若y i =﹣2x i +3(i =1,2,…n ),且样本数据y 1,y 2,…,y n 的平均数与方差分别是b 和a ,则a ﹣b =( )A .1B .2C .3D .4【解析】解:由题意得:{−2a +3=b a =4b ,解得:{a =43b =13,故a ﹣b =1, 故选:A .例5.下面定义一个同学数学成绩优秀的标志为:“连续5次考试成绩均不低于120分”.现有甲、乙、丙三位同学连续5次数学考试成绩的记录数据(记录数据都是正整数):①甲同学:5个数据的中位数为127,众数为120;②乙同学:5个数据的中位数为125,总体均值为127;③丙同学:5个数据的中位数为135,总体均值为128,总体方差为19.8.则可以判定数学成绩优秀同学为( )A .甲、乙B .乙、丙C .甲、丙D .甲、乙、丙【解析】解:在①中,甲同学:5个数据的中位数为127,众数为120,所以前三个数为120,120,127,则后两个数肯定大于127,故甲同学数学成绩优秀,故①成立;在②中,5个数据的中位数为125,总体均值为127,可以找到很多反例,如:118,119,125,128,145,故乙同学数学成绩不优秀,故②不成立;在③中,5个数据的中位数为135,总体均值为128,总体方差为19.8设x 1<x 2<x 3<x 4,则丙的方差为15[(x 1﹣128)2+(x 2﹣128)2+(x 3﹣128)2+(x 4﹣128)2+(135﹣128)2]=19.8, ∴(x 1﹣128)2+(x 2﹣128)2+(x 3﹣128)2+(x 4﹣128)2=50,∴(x 1﹣128)2≤50,得|x 1﹣128|≤5,∴x 1≥128﹣5>120,∴丙同学数学成绩优秀,故③成立.∴数学成绩优秀有甲和丙2个同学.故选:C .例6.若数据x 1,x 2,…,x n 的平均数x =3,方差s 2=1,则数据2x 1+3,2x 2+3,…,2x n +3的平均数和方差分别为( )A.6,6B.9,2C.9,6D.9,4【解析】解:由题意若数据x1,x2,…,x n的平均数x=3,方差s2=1,可得x1+x2+…+x n=3n,则:2x1+3+x2+3+…+x n+3=2(x1+x2+…+x n)+3n=9n,所以数据2x1+3,2x2+3,…,2x n+3的平均数为9.又S2=1n[(x1﹣3)2+(x2﹣3)2+…+(x n﹣3)2]=1,所以[(x1﹣3)2+(x2﹣3)2+…+(x n﹣3)2]=n,所以1n [(2x1+3﹣9)2+(2x2+3﹣9)2+…+(2x n+3﹣9)2]=4n[(x1﹣3)2+(x2﹣3)2+…+(x n﹣3)2]=4,则数据2x1+3,2x2+3,…,2x n+3的平均数和方差分别为9,4.故选:D.例7.随着城镇化的不断发展,老旧小区的改造及管理已经引起了某市政府的高度重视,为了了解本市甲,乙两个物业公司管理的小区住户对其服务的满意程度,现从他们所服务的小区中随机选择了40个住户,根据住户对其服务的满意度评分,得到A区住户满意度评分的频率分布直方图和B 区住户满意度评分的频率分布表.B区住户满意度评分的频率分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数4610128(Ⅰ)在图2中作出B区住户满意度评分的频率分布直方图,并通过频率分布直方图计算两区住户满意度评分的平均值及分散程度(其中分散程度不要求计算出具体值,给出结论即可);(Ⅱ)根据住户满意度评分,将住户和满意度分为三个等级:满意度评分低于70分,评定为不满意;满意度评分在70分到89分之间,评定为满意;满意度评分不低于90分,评定为非常满意.试估计哪个地区住户的满意度等级为不满意的概率大?若是要选择一个物业公司来管理老旧小区的物业,从满意度角度考虑,应该选择哪一个物业公司?说明理由.【解析】解:(Ⅰ)作出如图所示的频率分布直方图,B区住户满意度评分的频率分布直方图如图所示A区住户满意度评分的平均值为45×0.1+55×0.2+65×0.3+75×0.2+85×0.15+95×0.05=67.5;B区住户满意度评分的平均值为55×0.1+65×0.15+75×0.25+85×0.3+95×0.2=78.5.通过比较两区住户满意度评分的频率分布直方图可以看出,B区住户满意度评分比较集中,而A 区住户满意度评分比较分散.(Ⅱ)记D表示事件:“A区住户的满意度等级为不满意”,记E表示事件:“B区住户的满意度等级为不满意”,则P(D)=(0.010+0.020+0.030)×10=0.6,P(E)=(0.010十0.015)×10=0.25,所以A区住户的满意度等级为不满意的概率较大.若是要选择一个物业公司来管理老旧小区的物业,从满意度等级为满意来考虑,应该选择乙物业公司来为小区服务,这样的话小区住户满意度会高一些.例8.某校在一次期末数学测试中,为统计学生的考试情况,从学校的2000名学生中随机抽取50名学生的考试成绩,被测学生成绩全部介于65分到145分之间(满分150分),将统计结果按如下方式分成八组:第一组[65,75),第二组[75,85),……第八组[135,145],如图是按上述分组方法得到的频率分布直方图的一部分.(1)求第七组的频率,并完成频率分布直方图;(2)用样本数据估计该校的2000名学生这次考试成绩的平均分(同一组中的数据用该组区间的中点值代表该组数据平均值);(3)若从样本成绩属于第六组和第八组的所有学生中随机抽取2名,求他们的分差的绝对值小于10分的概率.【解析】解:(1)由频率分布直方图得第七组的频率为:1﹣(0.004+0.012+0.016+0.030+0.020+0.006+0.004)×10=0.08.完成频率分布直方图如下:(2)用样本数据估计该校的2000名学生这次考试成绩的平均分为:70×0.004×10+80×0.012×10+90×0.016×10+100×0.030×10+110×0.020×10+120×0.006×10+130×0.008×10+140×0.004×10=102.(3)样本成绩属于第六组的有0.006×10×50=3人,样本成绩属于第八组的有0.004×10×50=2人,从样本成绩属于第六组和第八组的所有学生中随机抽取2名,基本事件总数n=C52=10,他们的分差的绝对值小于10分包含的基本事件个数m=C32+C22=4,∴他们的分差的绝对值小于10分的概率p=mn=410=25.例9.我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准x,用水量不超过x的部分按平价收费,超出x的部分按议价收费.下面是居民月均用水量的抽样频率分布直方图.①求直方图中a的值;②试估计该市居民月均用水量的众数、平均数;③设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;④如果希望85%的居民月均用水量不超过标准x ,那么标准x 定为多少比较合理?【解析】解:①由概率统计相关知识,各组频率之和的值为1,∵频率=(频率/组距)*组距,∴0.5×(0.08+0.16+0.4+0.52+0.12+0.08+0.04+2a )=1,解得:a =0.3,∴a 的值为0.3;②由频率分布直方图估计该市居民月均用水量的众数为2+2.52=2.25(吨),估计该市居民月均用水量的平均数为:0.5(0.25×0.08+0.75×0.16+1.25×0.3+1.75×0.4+2.25×0.52+2.75×0.3+3.25×0.12+3.75×0.08+4.25×0.04)=2.035(吨).③由图,不低于3吨人数所占百分比为0.5×(0.12+0.08+0.04)=12%,∴全市月均用水量不低于3吨的人数为:30×12%=3.6(万);④由频率分布直方图得月均用水量低于2.5吨的频率为:0.5×(0.08+0.16+0.3+0.4+0.52)=0.73<85%,月均用水量低于3吨的频率为:0.5×(0.08+0.16+0.3+0.4+0.52+0.3)=0.88>85%,∴x=2.5+0.5×0.85−0.730.3×0.5=2.9(吨).例10.如图是某校高三(1)班的一次数学知识竞赛成绩的基叶图(图中仅列出[50,60),[90,100)的数据)和频率分布直方图.(1)求全班人数以及频率分布直方图中的x,y;(2)估计学生竞赛成绩的平均数和中位数(保留两位小数).【解析】解:(1)分数在[50,60)的频率为0.020×10=0.2,由茎叶图知,分数在[50,60)之间的频数为5,所以全班人数为50.2=25(人);分数在[90,100)之间的频数为2,由225=10y,解得y=0.008;又10x=1﹣10×(0.036+0.024+0.020+0.008),解得x=0.012.(2)由频率分布直方图,计算平均数为x=55×0.2+65×0.24+75×0.36+85×0.12+95×0.08=71.4,由0.2+0.24+0.36=0.80,所以中位数在[70,80)内,设中位数为m,则0.20+0.24+(m﹣70)×0.036=0.5,解得m≈71.67,所以中位数约为71.67.例11.某高中数学建模兴趣小组的同学为了研究所在地区男高中生的身高与体重的关系,从若干个高中男学生中抽取了1000个样本,得到如下数据.数据一:身高在[170,180)(单位:cm)的体重频数统计体重(kg)[50,55)[55,60)[60,65)[65,70)[70,75)[75,80)[80,85)[85,90)人数206010010080201010数据二:身高所在的区间含样本的个数及部分数据身高x(cm)[140,150)[150,160)[160﹣170)[170﹣180)[180﹣190)平均体重y(kg)4553.66075(Ⅰ)依据数据一将下面男高中生身高在[170﹣180)(单位:cm)体重的频率分布直方图补充完整,并利用频率分布直方图估计身高在[170﹣180)(单位:cm)的中学生的平均体重;(保留小数点后一位)(Ⅱ)依据数据一、二,计算身高(取值为区间中点)和体重的相关系数约为0.99,能否用线性回归直线来刻画中学生身高与体重的相关关系,请说明理由;若能,求出该回归直线方程;(Ⅲ)说明残差平方和或相关指数R2与线性回归模型拟合效果之间关系.(只需写出结论,不需要计算)参考公式:b=∑ni=1(x i−x)(y i−y)∑n i=1(x i−x)2=∑ni=1x i y i−nx⋅y∑n i=1x i2−nx2,a=y−b x.参考数据:(1)145×45+155×53.6+165×60+185×75=38608;(2)1452+1552+1652+1752+1852﹣5×1652=1000.(3)663×175=116025,664×175=116200,665×175=116375.(4)728×165=120120.【解析】解:(1)身高在[170,180)的总人数为:20+60+100+100+80+20+10+10=400,体重在[55﹣60)的频率为:60400=0.15,体重在[70﹣75)的频率为:80400=0.2,平均体重为:52.5×0.05+57.5×0.15+62.5×0.25+67.5×0.25+72.5×0.2+77.5×0.05+82.5×0.025+87.5×0.025≈66.4,(2)因为r=0.99→1,线性相关很强,故可以用线性回归直线来刻画中学生身高与体重的相关,x=145+155+165+175+1855=165,y=45+75+60+53.6+66.45=60,b=∑8i=1x i y i−8x⋅y∑8i=1x i2−8x2=38608+175×66.4−5×165×601000=0.728,a=y−b x=60−0.728×165=−60.12,所以回归直线方程为:y=0.728x−60.12,(3)残差平方和越小或相关指数R2越接近于1,线性回归模型拟合效果越好.例12.市政府为了节约用水,调查了100位居民某年的月均用水量(单位:t),频数分布如下:分组[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]频数4815222514642(1)根据所给数据将频率分布直方图补充完整(不必说明理由);(2)根据频率分布直方图估计本市居民月均用水量的中位数;(3)根据频率分布直方图估计本市居民月均用水量的平均数(同一组数据由该组区间的中点值作为代表).【解析】解:(1)频率分布直方图如图所示:(2)∵0.04+0.08+0.15+0.22=0.49<0.5,∴中位数为2+0.5−0.490.25×0.5=2.02,(3)由频率分布直方图得平均数为:0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.02=2.02.例13.某地区100居民的人均用水量(单位:t)的分组的频数如下:[0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22;[2,2.5),25;[2.5,3),14;[3,3.5),6;[3.5,4),4;[4,4.5),2.(1)列出样本的频率分布表;(2)画出频率分布直方图,并根据直方图估计这组数据的众数;(坐标轴单位自定)(3)当地政府制订了人均月用水量为3t的标准,若超出标准加倍收费,当地政府解释说,85%以上的居民不超出这个标准,这个解释对吗?为什么?【解析】解:(1 )分组频数频率[0,0.5 )40.04[0.5,1 )80.08[1,1.5 )150.15[1.5,2 )220.22[2,2.5 )250.25[2.5,3 )140.14[3,3.5 )60.06[3.5,4 )40.04[4,4.5 )20.02(2):频率分布直方图如下图,由图知,这组数据的众数为2.25.(3)人均月用水量在3t以上的居民的比例为6%+4%+2%=12%,即大约是有12%的居民月均用水量在3t以上,88%的居民月均用水量在3t以下,因此,政府的解释是正确的.例14.某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60)…[90,100]后画出如下频率分布直方图.观察图形的信息,回答下列问题:(Ⅰ)估计这次考试的众数m与中位数n(结果保留一位小数);(Ⅱ)估计这次考试的及格率(60分及以上为及格)和平均分.【解析】解:(Ⅰ)众数是最高小矩形中点的横坐标,所以众数为m=75(分);(3分)前三个小矩形面积为0.01×10+0.015×10+0.015×10=0.4,∵中位数要平分直方图的面积,∴n=70+0.5−0.40.03=73.3(7分)(Ⅱ)依题意,60及以上的分数所在的第三、四、五、六组,频率和为(0.015+0.03+0.025+0.005)*10=0.75所以,抽样学生成绩的合格率是75% (11分)利用组中值估算抽样学生的平均分45•f1+55•f2+65•f3+75•f4+85•f5+95•f6=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71估计这次考试的平均分是71分.(14分)例15.为应对新冠疫情,重庆市于2020年1月24日启动重大突发公共卫生事件一级响应机制,要求市民少出门,少聚集,于是快递业务得到迅猛发展.为满足广大市民的日常生活所需,某快递公司以优厚的条件招聘派送员,现给出了两种日薪薪酬方案,甲方案:底薪100元,每派送一单奖励1元;乙方案:底薪150元,每日前55单没有奖励,超过55单的部分每单奖励10元.(Ⅰ)请分别求出这两种薪酬方案中日薪y(单位:元)与送货单数n的函数关系式;(Ⅱ)根据该公司所有派送员10天的派送记录,发现派送员的日平均派送单数与天数满足以下表格:日均派送单数5054565860频数(天)23221回答下列问题:①根据以上数据,设每名派送员的日薪为X(单位:元),试分别求出这10天中甲、乙两种方案的日薪X的平均数及方差;②结合①中的数据,根据统计学的思想,若你去应聘派送员,选择哪种薪酬方案比较合适,并说明你的理由.(参考数据:172=289,372=1369)【解析】解:(1)甲方案,y =100+n ;乙方案,y ={150,n ≤5510n −400,n >55.(2),①甲方案中,根据已知表格可计算出日平均派送单数为2×50+3×54+2×56+2×58+6010=55,方差为0.2×(50﹣55)2+0.3×(54﹣55)2+0.2×(56﹣55)2+0.2×(58﹣55)2+0.1×(60﹣55)2=9.8,所以,由(1)中变量之间的关系,可以指,甲方案的日薪X 的平均数为155,方差为9.8. 乙方案中,日薪X 的平均数为[5×150+160×2+180×2+200]×0.1=163,日薪方差为0.5×(150﹣163)2+0.2×(160﹣163)2+0.2×(180﹣163)2+0.1×(200﹣163)2=213.4.(3)若去应聘派送员,我会选择乙方案,从平均数的角度来看,乙方案的平均薪酬更高,同时更有激励作用.例16.2019年起,全国地级及以上城市全面启动生活垃圾分类工作,垃圾分类投放逐步成为居民的新时尚.为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收垃圾、有害垃圾和其他垃圾四类,并分别设置了相应的垃圾箱.为调查居民生活垃圾分类投放情况,现随机抽取了某市三类垃圾箱中总计1000吨生活垃圾,数据统计如下(单位:吨):“厨余垃圾”箱 “可回收垃圾”箱 “有害垃圾”箱“其他垃圾”箱厨余垃圾 300 70 30 80 可回收垃圾 30 210 30 30 有害垃圾 20 20 60 20 其他垃圾10201060(1)分别估计厨余垃圾和有害垃圾投放正确的概率;(2)假设厨余垃圾在“厨余垃圾”箱、“可回收垃圾”箱、“有害垃圾”箱、“其他垃圾”箱的投放量分别为a,b,c,d,其中a>0,a+b+c+d=800.当数据a,b,c,d的方差s2最大时,写出a,b,c,d的值(结论不要求证明),并求此时s2的值.【解析】解:(1)根据题意,厨余垃圾共300+70+30+80=480吨,其中投放正确的有300吨,则厨余垃圾投放正确的概率P1=300480=58,有害垃圾共20+20+60+20=120吨,其中投放正确的有60吨,则害垃圾投放正确的概率P2=60120=12;(2)根据题意,厨余垃圾在四种垃圾箱的投放量分别为a,b,c,d,其中a>0,a+b+c+d=800,则其平均数x=8004=200,则其方差S2=14[(a﹣200)2+(b﹣200)2+(c﹣200)2+(d﹣200)2],当a=600,b=c=d=0时,s2最大,而x=a+b+c+d4=200,此时s2=14[(600﹣200)2+(0﹣200)2+(0﹣200)2+(0﹣200)2]=120000例17.某市教育局为了解全市高中学生在素质教育过程中的幸福指数变化情况,对8名学生在高一,高二不同学习阶段的幸福指数进行了一次跟踪调研.结果如表:学生编号12345678高一阶段幸福指数9593969497989695学生编号12345678高二阶段幸福指数9497959695949396(1)根据统计表中的数据情况,分别计算出两组数据的平均值及方差;(2)请根据上述结果,就平均值和方差的角度分析,说明在高一,高二不同阶段的学生幸福指数状况,并发表自己观点.【解析】解:(1)8名学生在高一阶段的幸福指数的平均数为:x=18(95+93+96+94+97+98+96+95)=95.5,方差为:S12=18∑8i=1(x i−x1)2=2.25,8名学生在高二阶段的幸福指数的平均数为:y=18(94+97+95+96+95+94+93+96)=95,方差为:S22=18∑8i=1(y i−y)2=1.5;(2)①∵x>y,∴可以认为这8名学生在高一的平均幸福指数大于在高二的平均幸福指数,②∵S12>S22,∴可以认为这8名学生在高二的幸福指数的稳定性大于在高一的幸福指数的稳定性.例18.2020年1月,教育部《关于在部分高校开展基础学科招生改革试点工作的意见》印发,自2020年起,在部分高校开展基础学科招生改革试点(也称“强基计划”).强基计划聚焦高端芯片与软件、智能科技、新材料、先进制造和国家安全等关键领域以及国家人才紧缺的人文社会科学领域,选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生.新材料产业是重要的战略性新兴产业,如图是我国2011﹣2019年中国新材料产业市场规模及增长趋势图.其中柱状图表示新材料产业市场规模(单位:万亿元),折线图表示新材料产业市场规模年增长率(%).(1)求从2012年至2019年,每年新材料产业市场规模年增长量的平均数(精确到0.1);(2)从2015年至2019年中随机挑选两年,求两年中至少有一﹣年新材料产业市场规模年增长率超过20%的概率;(3)由图判断,从哪年开始连续三年的新材料产业市场规模的方差最大.(结论不要求证明)【解析】解:(1)从2012年起,每年新材料产业市场规模的年增加值依次为:0.3,0.2,0.3,0.5,0.6,0.4,0.8,0.6,(单位:万亿元),∴年增加的平均数为:0.3+0.2+0.3+0.5+0.6+0.4+0.8+0.68=0.5万亿元.(2)设A表示事件“从2015年至2019年中随机挑选两个,两年中至少有一年新材料产业市场规模增长率超过20%”,依题意P(A)=1−C22C52=910.(3)从2017年开始连续三年的新材料产业市场规模的方差最大.。
高考题型之 频率分布直方图
高考题型之频率分布直方图典型例题:......................................................................答案............................................................................知识点:典型例题:1.某工厂对一批产品进行了抽样检测.有图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是(A)90(B)75(C)60(D)452.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……第六组,成绩大于等于18秒且小于19秒。
右图是按上述分组方法得到的频率分布直方图。
设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为(A)0.9,35(B)0.9,45(C)0.1,35(D)0.1,453.某个小区住户共200户,为调查小区居民的7月份用水量,用分层抽样的方法抽取了50户进行调查,得到本月的用水量(单位:m3)的频率分布直方图如图所示,则小区内用水量超过15m3的住户的户数为A.10B.50C.60D.1404.某时段内共有100辆汽车经过某一雷达地区,时速频率分布直方图如右图所示,则时速超过60 km/h的汽车数量为_____________;5.某个容量为100的样本的频率分布直方图如下,则在区间[4,5)上的数据的频数..为.6.某地区教育主管部门为了对该地区模拟考试成绩进行分析,抽取了总成绩介于350分到650分之间的10000名学生成绩,并根据这10000名学生的总成绩画了样本的频率分布直方图.为了进一步分析学生的总成绩与各科成绩等方面的关系,要从这10000名学生中,再用分层抽样方法抽出200人作进一步调查,则总成绩在[400,500)内共抽出()A.100人B.90人C.65人D.50人7.济南交警部门随机测量了顺河高架桥南下口某一时间段经过的2000辆汽车的时速,时速频率分布直方图如图所示,则时速超过70km/h的汽车数量为_______8.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg),得到频率分布直方图如下:根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是()(A)20(B)30(C)40(D)509.一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在[2500,3000)(元)月收入段应抽出人.10.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图)。
频率分布直方图
风险评估和预测模型构建
风险等级划分
01
在金融、保险等领域中,频率分布直方图可以用于划分风险等
级,评估不同风险水平下的损失分布情况。
预测模型构建
02
在构建预测模型时,频率分布直方图可以帮助确定输入变量的
分布特征,从而选择合适的模型类型和建模方法。
蛋白质表达水平
将蛋白质表达量按不同 水平分组,并通过直方 图呈现各组频数,有助 于分析蛋白质功能与疾 病的关系。
代谢物浓度分布
利用频率分布直方图展 示生物样本中代谢物的 浓度分布情况,为代谢 组学研究和疾病诊断提 供参考。
THANKS
感谢观看
处理异常值
在绘制频率分布直方图之前,可以对数据进行预处理,例如采用箱线图等方法识别并处理 异常值,以减少异常值对直方图形状的影响。同时,也可以在直方图上标注出异常值的位 置和数值,以便观察者更好地了解数据的分布情况。
06
案例:频率分布直方图在医学领域应
用
疾病发病率分布情况展示
发病率地域分布
通过频率分布直方图展示不同地区的疾病发病率,帮助医学研究 者识别高发区域和潜在风险因素。
图形表示不同
条形图用条形的长度表示各类别数 据的频数或频率,而频率分布直方 图用矩形的面积表示各组数据的频 数或频率。
横轴意义不同
条形图的横轴表示类别,而频率分 布直方图的横轴表示数据范围。
02
绘制频率分布直方图步骤
数据收集与整理
收集数据
根据研究目的确定需要收集的数据,并确保数据的准确性和 完整性。
频率分布直方图
汇报人:XX
• 频率分布直方图基本概念 • 绘制频率分布直方图步骤 • 频率分布直方图解读技巧 • 频率分布直方图在数据分析中应用 • 频率分布直方图优缺点及改进措施 • 案例:频率分布直方图在医学领域应
2023年高考数学复习----《统计图表》规律方法与典型例题讲解
2023年高考数学复习----《统计图表》规律方法与典型例题讲解【规律方法】1、制作频率分布直方图的步骤.第一步:求极差,决定组数和组距,组距=极差组数第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表;第四步:画频率分布直方图.2、解决频率分布直方图问题时要抓住3个要点.(1)直方图中各小矩形的面积之和为1;(2)直方图中纵轴表示频率组距,故每组样本的频率为组距⨯频率组距(3)直方图中每组样本的频数为频率⨯总体个数.3、用频率分布直方图估计众数、中位数、平均数的方法.(1)众数为频率分布直方图中最高矩形底边中点的横坐标;(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;(3)平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和.【典型例题】例1.(2022·云南昆明·昆明一中模拟预测)为了响应教育部门疫情期间“停课不停学”的号召,某校实施网络授课,为了检验学生上网课的效果,在高三年级进行了一次网络模拟考试,从中抽取了100人的数学成绩,绘制成频率分布直方图(如下图所示),其中数学成绩落在区间[110,120),[120,130),[130,140]的频率之比为4:2:1.(1)根据频率分布直方图求学生成绩在区间[110,120)的频率,并求抽取的这100名同学数学成绩的中位数(2)若将频率视为概率,从全校高三年级学生中随机抽取3个人,记抽取的3人成绩在[100,130)内的学生人数为X ,求X 的分布列与数学期望.【解析】(1)由直方图可知,数学成绩落在区间[70,110)内的频率为(0.0040.0120.0190.030)10+++⨯=0.65,所以数学成绩落在区间[110,140]内的频率为10.650.35−=,因为数学成绩落在区间[110,120),[120,130),[130,140]的频率之比为4:2:1,所以数学成绩落在区间[110,120)的频率为40.35421⨯++0.2=, 数学成绩落在区间[70,100)的频率为(0.0040.0120.019)100.35++⨯=, 所以中位数落在区间[100,110)内,设中位数为x ,则(100)0.0300.50.35x −⨯=−,解得105x =, 所以抽取的这100名同学数学成绩的中位数为105.(2)由(1)知,数学成绩落在区间[100,130)内的频率为0.0310⨯+0.2+20.35421⨯++0.6=,由题意可知,3~(3,)5X B ,X 的所有可能取值为0,1,2,3,033338(0)C ()(1)55125P X ==⋅−=,12333(1)C (1)55P X ==⋅⋅−36125=, 22333(2)C ()(1)55P X ==⋅⋅−54125=,330333(3)C ()(1)55P X ==⋅−27125=,所以X 的分布列为:所以数学期望8365427()0123125125125125E X =⨯+⨯+⨯+⨯95=.例2.(2022·贵州贵阳·贵阳六中校考一模)某校组织1000名学生进行科学探索知识竞赛,成绩分成5组:[)50,60,[)60,70,[)70,80,[)80,90,[]90,100,得到如图所示的频率分布直方图.若图中未知的数据a ,b ,c 成等差数列,成绩落在区间[)60,70内的人数为400.(1)求出直方图中a ,b ,c 的值;(2)估计中位数(精确到0.1)和平均数(同一组中的数据用该组区间的中点值代替); (3)若用频率估计概率,设从这1000人中抽取的6人,得分在区间[]90,100内的学生人数为X ,求X 的数学期望.【解析】(1)依题意可得:4001000100.04a =÷÷=,又a ,b ,c 成等差数列,所以2b a c =+且(0.0050.005)101a b c ++++⨯=,解得:0.02,0.03c b == 所以0.04,0.03,0.02a b c ===.(2)因为(0.0050.04)100.450.5+⨯=<,设中位数为x , 则[70,80)x ∈,所以()()0.0050.0410700.030.5x +⨯+−⨯=,解得:71.7x ≈,即中位数约为71.7,平均数为(550.005650.04750.03850.02950.005)1073⨯+⨯+⨯+⨯+⨯⨯=. (3)由题意可知:得分在区间[]90,100内概率为10.0051020⨯=, 根据条件可知:X 的所有可能值为0,1,2,3,4,5,6,且1(6,)20X ,所以1()60.320E X np ==⨯=.例3.(2022·全国·高三专题练习)为丰富学生课外生活,某市组织了高中生钢笔书法比赛,比赛分两个阶段进行:第一阶段由评委为所有参赛作品评分,并确定优胜者;第二阶段为附加赛,参赛人员由组委会按规则另行确定.数据统计员对第一阶段的分数进行了统计分析,这些分数X 都在[75,100)内,再以5为组距画分数的频率分布直方图(设“Y=频率组距”)时,发现Y 满足:7,15,15019,16,30011,16,1520n Y n k n n ⎧=⎪⎪⎪==⎨⎪⎪−⋅>⎪−⎩,55(1)n N n X n *∈≤<+. (1)试确定n 的所有取值,并求k ;(2)组委会确定:在第一阶段比赛中低于85分的同学无缘获奖也不能参加附加赛;分数在[95,100)内的同学评为一等奖;分数在[90,95)内的同学评为二等奖,但通过附加赛有111的概率提升为一等奖;分数在[85,90)内的同学评为三等奖,但通过附加赛有17的概率提升为二等奖(所有参加附加赛的获奖人员均不降低获奖等级,且附加赛获奖等级在第一阶段获奖等级基础上,最多升高一级).已知学生A 和B 均参加了本次比赛,且学生A 在第一阶段获得二等奖.①求学生B 最终获奖等级不低于学生A 最终获奖等级的概率;②已知学生A 和B 都获奖,记A ,B 两位同学最终获得一等奖的人数为ξ,求ξ的分布列和数学期望.【解析】(1)根据题意,X 在[75,100)内,按5为组距可分成5个小区间, 分别是[75,80),[80,85),[85,90),[90,95),[95,100),因为75100X ≤<,由55(1)n X n ≤<+,n N *∈,所以15,16,17,18,19n =.每个小区间的频率值分别是7,15,30195,1660115,17,18,19320n P Y n k n n ⎧=⎪⎪⎪===⎨⎪⎪−⋅=⎪−⎩由719111511306032k ⎛⎫++−++= ⎪⎝⎭,解得350k =. (2)①由于参赛学生很多,可以把频率视为概率.由(1)知,学生B 的分数属于区间[75,80),[80,85),[85,90),[90,95),[95,100)的概率分别是:730,1960,1460,1160,260.我们用符号ijA (或ijB )表示学生A (或B )在第一轮获奖等级为i ,通过附加赛最终获奖等级为j ,其中(,1,2,3)j i i j ≤=记“学生B 最终获奖等级不低于学生A 的最终获奖等级”为事件W , 则()12122223222()P W P B B B A B A =+++()()()()()()12122223222P B P B P B P A P B P A =+++2111111010141105160601160111160711220=+⋅+⋅⋅+⋅⋅=.②学生A 最终获得一等奖的概率是111A P =,学生B 最终获得一等奖的概率是21112116060272711272796060B P =+⋅=+=,1180(0)1111999P ξ⎛⎫⎛⎫==−−= ⎪⎪⎝⎭⎝⎭,111118(1)1111911999P ξ⎛⎫⎛⎫==⋅−+−⋅=⎪ ⎪⎝⎭⎝⎭, 111(2)11999P ξ==⋅=.所以ξ的分布列为:801812001299999999E ξ=⋅+⋅+⋅=.。
频率分布直方图高考真题教师版
频率分布直方图一.选择题(共10小题)1.(2020•天津)从一批零件中抽取80个,测量其直径(单位:)mm,将所得数据分为9组:[5.31,5.33),[5.33,5.35), ,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为()A.10B.18C.20D.362.(2016•山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.1403.(2014•广东)已知某地区中小学学生的近视情况分布如图1和图2所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.200,20B.100,20C.200,10D.100,104.(2014•山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第)一组,第二组,⋯,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.185.(2013•四川)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),⋯,[30,35),[35,40]时,所作的频率分布直方图是()A.B.C.D.6.(2013•辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45B.50C.55D.607.(2013•陕西)对一批产品的长度(单位:)mm进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09B.0.20C.0.25D.0.458.(2013•福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588B.480C.450D.1209.(2012•安徽)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差10.(2011•湖北)有一个容量为200的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为()A.18B.36C.54D.72二.填空题(共8小题)11.(2015•湖北)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a .(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.12.(2014•江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:)cm,所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm.13.(2013•湖北)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示:(Ⅰ)直方图中x的值为;(Ⅱ)在这些用户中,用电量落在区间[100,250)内的户数为.︒数据得到的样本频率分布直方图,其中14.(2012•山东)如图是根据部分城市某年6月份的平均气温(单位:C)平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5C︒的城市个数为11,则样本中平均气温不︒的城市个数为.低于25.5C15.(2011•浙江)某小学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图3000名学生在该次数学考试中成绩小于60分的学生数是.16.(2010•福建)将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,则n等于.17.(2010•北京)从某小学随机抽取100名同学,将他们身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为.18.(2010•江苏)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有根棉花纤维的长度小于20mm.三.解答题(共12小题)19.(2017•北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),[80⋯,90],并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.20.(2016•四川)我国是世界上严重缺水的国家.某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),⋯,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(Ⅰ)求直方图中a的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(Ⅲ)估计居民月均水量的中位数.21.(2016•北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如图频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当3w=时,估计该市居民该月的人均水费.22.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?23.(2015•安徽)某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为[40,50],[50,60], ,[80,90],[90,100](1)求频率分布图中a的值;(2)估计该企业的职工对该部门评分不低于80的概率;(3)从评分在[40,60]的受访职工中,随机抽取2人,求此2人评分都在[40,50]的概率.24.(2014•北京)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(Ⅱ)求频率分布直方图中的a,b的值;(Ⅲ)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写结论)25.(2014•广东)随机观测生产某种零件的某工作厂25名工人的日加工零件个数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据上述数据得到样本的频率分布表如下:1212(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率.26.(2010•湖北)为了了解一个小水库中养殖的鱼有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:千克),并将所得数据分组,画出频率分布直方图(如图所示)(Ⅰ)在表格中填写相应的频率;(Ⅱ)估计数据落在(1.15,1.30)中的概率为多少;(Ⅲ)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再120条鱼,其中带有记号的鱼有6条,请根据这一情况来估计该水库中鱼的总条数.27.(2010•广东)某食品厂为了检查一条自动包装流水线的生产情况,随机抽取该流水线上的40件产品作为样本称出它们的重量(单位:克),重量的分组区间为(490,495],(495,500], ,(510,515],由此得到样本的频率分布直方图,如图所示.(1)根据频率分布直方图,求重量超过505克的产品数量.(2)在上述抽取的40件产品中任取2件,设Y为重量超过505克的产品数量,求Y的分布列.(3)从流水线上任取5件产品,求恰有2件产品合格的重量超过505克的概率.28.(2010•陕西)为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行抽样检查,测得身高情况的统计图如下:(Ⅰ)估计该校男生的人数;(Ⅱ)估计该校学生身高在170~185cm之间的概率;(Ⅲ)从样本中身高在180~190cm之间的男生中任选2人,求至少有1人身高在185~190cm之间的概率.29.(2010•湖南)如图是某城市通过抽样得到的居民某年的月均用水量(单位:吨)的频率分布直方图.(Ⅰ)求直方图中x的值.(Ⅱ)若将频率视为概率,从这个城市随机抽取3位居民(看作有放回的抽样),求月均用水量在3至4吨的居民数X的分布列和数学期望.30.(2010•安徽)某市2010年4月1日4 月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,(Ⅰ)完成频率分布表;(Ⅱ)作出频率分布直方图;(Ⅲ)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.频率分布直方图参考答案与试题解析一.选择题(共10小题)1.(2020•天津)从一批零件中抽取80个,测量其直径(单位:)mm,将所得数据分为9组:[5.31,5.33),[5.33,5.35),⋯,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为()A.10B.18C.20D.36【解答】解:直径径落在区间[5.43,5.47)的频率为(6.255)0.020.225+⨯=,则被抽取的零件中,直径落在区间[5.43,5.47)内的个数为0.2258018⨯=个,故选:B.2.(2016•山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140【解答】解:自习时间不少于22.5小时的频率为:(0.160.080.04) 2.50.7++⨯=,故自习时间不少于22.5小时的频数为:0.7200140⨯=,故选:D.3.(2014•广东)已知某地区中小学学生的近视情况分布如图1和图2所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.200,20B.100,20C.200,10D.100,10【解答】解:由图1知:总体个数为35002000450010000++=,∴样本容量100002%200=⨯=,分层抽样抽取的比例为150,∴高中生抽取的学生数为40,∴抽取的高中生近视人数为4050%20⨯=.故选:A.4.(2014•山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:)kPa的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,⋯,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.18【解答】解:由直方图可得分布在区间第一组与第二组共有20人,分布在区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人,第三组的频率为0.36,所以第三组的人数:18人,第三组中没有疗效的有6人,第三组中有疗效的有12人.故选:C.5.(2013•四川)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),⋯,[30,35),[35,40]时,所作的频率分布直方图是()A.B.C.D.【解答】解:根据题意,频率分布表可得:故选:A.6.(2013•辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45B.50C.55D.60【解答】解:成绩低于60分有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20,则成绩低于60分的频率(0.0050.010)200.3P=+⨯=,又低于60分的人数是15人,则该班的学生人数是1550 0.3=.故选:B.7.(2013•陕西)对一批产品的长度(单位:)mm进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09B.0.20C.0.25D.0.45【解答】解:由频率分布直方图知识可知:在区间[15,20)和[25,30)上的概率为0.045[1(0.020.04⨯+-++0.060.03)5]0.45+⨯=.故选:D .8.(2013•福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A .588B .480C .450D .120【解答】解:根据频率分布直方图,成绩不低于60(分)的频率为110(0.0050.015)0.8-⨯+=.由于该校高一年级共有学生600人,利用样本估计总体的思想,可估计该校高一年级模块测试成绩不低于60(分)的人数为6000.8480⨯=人.故选:B .9.(2012•安徽)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差【解答】解:()14567865x =⨯++++=甲, ()15556965x =⨯++++=乙, 甲的成绩的方差为221(2212)25⨯⨯+⨯=, 以的成绩的方差为221(1331) 2.45⨯⨯+⨯=. 故选:C .10.(2011•湖北)有一个容量为200的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为()A.18B.36C.54D.72【解答】解:观察直方图易得数据落在[10,12)的频率(0.020.050.150.19)20.82=+++⨯=;数据落在[10,12)外的频率10.820.18=-=;⨯=,∴样本数落在[10,12)内的频数为2000.1836故选:B.二.填空题(共8小题)11.(2015•湖北)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=3.(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.【解答】解:(1)由题意,根据直方图的性质得(1.5 2.5 2.00.80.2)0.11+++++⨯=,解得3aa=(2)由直方图得(3 2.00.80.2)0.1100006000+++⨯⨯=故答案为:(1)3 (2)600012.(2014•江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:)cm,所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有24株树木的底部周长小于100cm.【解答】解:由频率分布直方图知:底部周长小于100cm的频率为(0.0150.025)100.4+⨯=,⨯=(株).∴底部周长小于100cm的频数为600.424故答案为:24.13.(2013•湖北)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示:(Ⅰ)直方图中x的值为0.0044;(Ⅱ)在这些用户中,用电量落在区间[100,250)内的户数为.【解答】解:(Ⅰ)依题意及频率分布直方图知,⨯+⨯+⨯+⨯+⨯+⨯=,x0.0024500.0036500.006050500.0024500.0012501解得0.0044x=.()II样本数据落在[100,150)内的频率为0.0036500.18⨯=,样本数据落在[150,200)内的频率为0.006500.3⨯=.样本数据落在[200,250)内的频率为0.0044500.22⨯=,故在这些用户中,用电量落在区间[100,250)内的户数为(0.180.300.22)10070++⨯=.故答案为:0.0044;70.︒数据得到的样本频率分布直方图,其中14.(2012•山东)如图是根据部分城市某年6月份的平均气温(单位:C)平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5C︒的城市个数为11,则样本中平均气温不︒的城市个数为9.低于25.5C【解答】解:平均气温低于22.5C ︒的频率,即最左边两个矩形面积之和为0.1010.1210.22⨯+⨯=,所以总城市数为110.2250÷=,平均气温不低于25.5C ︒的频率即为最右面矩形面积为0.1810.18⨯=,所以平均气温不低于25.5C ︒的城市个数为500.189⨯=.故答案为:9.15.(2011•浙江)某小学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图3000名学生在该次数学考试中成绩小于60分的学生数是 600 .【解答】解:由频率分布直方图成绩小于60 的学生的频率为10(0.0020.0060.012)0.2++=,所以成绩小于60分的学生数是30000⨯,2600=故答案为:60016.(2010•福建)将容量为n 的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,则n 等于 60 .【解答】解:设第一组至第六组数据的频率分别为2x ,3x ,4x ,6x ,4x ,x ,则234641x x x x x x +++++=, 解得120x =, 所以前三组数据的频率分别是234,,202020, 故前三组数据的频数之和等于23427202020n n n ++=, 解得60n =.故答案为60.17.(2010•北京)从某小学随机抽取100名同学,将他们身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a = 0.03 .若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为.【解答】解:直方图中各个矩形的面积之和为1,10(0.0050.0350.020.01)1a∴⨯++++=,解得0.03a=.由直方图可知三个区域内的学生总数为10010(0.030.020.01)60⨯⨯++=人.其中身高在[140,150]内的学生人数为10人,所以身高在[140,150]范围内抽取的学生人数为1810360⨯=人.故答案为:0.03,3.18.(2010•江苏)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有30根棉花纤维的长度小于20mm.【解答】解:由图可知,棉花纤维的长度小于20mm段的频率为0.010.010.04++,则频数为100(0.010.010.04)530⨯++⨯=.故答案为:30.三.解答题(共12小题)19.(2017•北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),[80⋯,90],并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【解答】解:(Ⅰ)由频率分布直方图知:分数小于70的频率为:1(0.040.02)100.4-+⨯=故从总体的400名学生中随机抽取一人,估计其分数小于70的概率为0.4;(Ⅱ)已知样本中分数小于40的学生有5人,故样本中分数小于40的频率为:0.05,则分数在区间[40,50)内的频率为:1(0.040.020.020.01)100.050.05-+++⨯-=,估计总体中分数在区间[40,50)内的人数为4000.0520⨯=人,(Ⅲ)样本中分数不小于70的频率为:0.6,由于样本中分数不小于70的男女生人数相等.故分数不小于70的男生的频率为:0.3,由样本中有一半男生的分数不小于70,故男生的频率为:0.6,即女生的频率为:0.4,即总体中男生和女生人数的比例约为:3:2.20.(2016•四川)我国是世界上严重缺水的国家.某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),⋯,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(Ⅰ)求直方图中a的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(Ⅲ)估计居民月均水量的中位数.【解答】解:()1(0.080.160.420.500.120.080.04)0.5=++++++++⨯,I a a整理可得:2 1.42a=+,a=.∴解得:0.3II估计全市居民中月均用水量不低于3吨的人数为3.6万,理由如下:()由已知中的频率分布直方图可得月均用水量不低于3吨的频率为(0.120.080.04)0.50.12++⨯=,又样本容量为30万,则样本中月均用水量不低于3吨的户数为300.12 3.6⨯=万.(Ⅲ)根据频率分布直方图,得;⨯+⨯+⨯+⨯=<,0.080.50.160.50.300.50.420.50.480.5+⨯=>,0.480.50.50.730.5∴中位数应在[2,2.5)组内,设出未知数x,令0.080.50.160.50.300.50.420.50.50.5⨯+⨯+⨯+⨯+⨯=,x解得0.04x=;+=.∴中位数是20.04 2.0421.(2016•北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如图频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当3w=时,估计该市居民该月的人均水费.【解答】解:(1)由频率分布直方图得:用水量在[0.5,1)的频率为0.1,用水量在[1,1.5)的频率为0.15,用水量在[1.5,2)的频率为0.2,用水量在[2,2.5)的频率为0.25,用水量在[2.5,3)的频率为0.15,用水量在[3,3.5)的频率为0.05,用水量在[3.5,4)的频率为0.05,用水量在[4,4.5)的频率为0.05,用水量小于等于3立方米的频率为85%,∴为使80%以上居民在该用的用水价为4元/立方米,w∴至少定为3立方米.(2)当3w=时,该市居民的人均水费为:(0.110.15 1.50.220.25 2.50.153)40.05340.050.5100.05340.051100.05340.05 1.51010.5⨯+⨯+⨯+⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=,∴当3w=时,估计该市居民该月的人均水费为10.5元.22.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?【解答】解:(1)由直方图的性质可得(0.0020.00950.0110.01250.0050.0025)201x++++++⨯=,解方程可得0.0075x=,∴直方图中x的值为0.0075;(2)月平均用电量的众数是2202402302+=,(0.0020.00950.011)200.450.5++⨯=<,∴月平均用电量的中位数在[220,240)内,设中位数为a,由(0.0020.00950.011)200.0125(220)0.5a++⨯+⨯-=可得224a=,∴月平均用电量的中位数为224;(3)月平均用电量为[220,240)的用户有0.01252010025⨯⨯=,月平均用电量为[240,260)的用户有0.00752010015⨯⨯=, 月平均用电量为[260,280)的用户有0.0052010010⨯⨯=, 月平均用电量为[280,300)的用户有0.0025201005⨯⨯=, ∴抽取比例为11125151055=+++,∴月平均用电量在[220,240)的用户中应抽取12555⨯=户. 23.(2015•安徽)某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为[40,50],[50,60],⋯,[80,90],[90,100](1)求频率分布图中a 的值;(2)估计该企业的职工对该部门评分不低于80的概率;(3)从评分在[40,60]的受访职工中,随机抽取2人,求此2人评分都在[40,50]的概率.【解答】解:(1)因为(0.0040.0180.02220.028)101a +++⨯+⨯=,解得0.006a =;(2)由已知的频率分布直方图可知,50名受访职工评分不低于80的频率为(0.0220.018)100.4+⨯=,所以该企业职工对该部门评分不低于80的概率的估计值为0.4;(3)受访职工中评分在[50,60)的有:500.006103⨯⨯=(人),记为1A ,2A ,3A ;受访职工评分在[40,50)的有:500.004102⨯⨯=(人),记为1B ,2B . 从这5名受访职工中随机抽取2人,所有可能的结果共有10种,分别是1{A ,2}A ,1{A ,3}A ,1{A ,1}B ,1{A ,2}B ,2{A ,3}A ,2{A ,1}B ,2{A ,2}B ,3{A ,1}B ,3{A ,2}B ,1{B ,2}B ,又因为所抽取2人的评分都在[40,50)的结果有1种,即1{B ,2}B , 故所求的概率为110P =. 24.(2014•北京)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(Ⅱ)求频率分布直方图中的a,b的值;(Ⅲ)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写结论)【解答】解:(Ⅰ)由频率分布表知:1周课外阅读时间少于12小时的频数为681722251290+++++=,1∴周课外阅读时间少于12小时的频率为900.9 100=;(Ⅱ)由频率分布表知:数据在[4,6)的频数为17,∴频率为0.17,0.085a∴=;数据在[8,10)的频数为25,∴频率为0.25,0.125b∴=;(Ⅲ)数据的平均数为10.0630.0850.1770.2290.25110.12130.06150.02170.027.68⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=(小时),∴样本中的100名学生该周课外阅读时间的平均数在第四组.25.(2014•广东)随机观测生产某种零件的某工作厂25名工人的日加工零件个数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据上述数据得到样本的频率分布表如下:1212(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率. 【解答】解:(1)(40,45]的频数17n =,频率10.28f =;(45,50]的频数22n =,频率20.08f =; (2)频率分布直方图:(3)设在该厂任取4人,没有一人的日加工零件数落在区间(30,35]为事件A ,则至少有一人的日加工零件数落在区间(30,35]为事件A ,已知该厂每人日加工零件数落在区间(30,35]的概率为15,P ∴(A )0441256(1)5625C =-=, ()1P A P ∴=-(A )369625=, ∴在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率为369625.26.(2010•湖北)为了了解一个小水库中养殖的鱼有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:千克),并将所得数据分组,画出频率分布直方图(如图所示) (Ⅰ)在表格中填写相应的频率;。
统计高考真题大题解析答案
统计高考真题大题解析答案高考是每年千万考生都期盼和紧张的时刻,而统计学科也是其中一门相对较难的科目之一。
无论是对于广大考生还是对于家长和老师们来说,了解和掌握高考统计真题的解析答案,对于备考也是非常重要的。
本文将为大家解析一些高考统计学科的典型题目,帮助大家更好地理解和应对这门科目。
第一题:某校700位高三学生体重信息的频率分布如下图所示。
学校要求体重指数在18.5至23.9之间的学生视为健康范围内,请计算该校健康体重范围内的学生人数。
此题是一个统计数据的频率分布问题,可以通过绘制频率分布直方图来进行解答。
将体重范围分成若干个组,并计算每个组的频率,然后求出健康体重范围内的频率之和即可得到答案。
第二题:某城市男性和女性的身高数据如下表所示,请计算男性和女性身高的平均值和标准差,并判断两者之间的差异是否具有统计学意义。
此题是一个比较两组数据差异的问题,需要计算平均值和标准差,并进行假设检验来判断差异是否显著。
对于两组数据,分别计算其平均值和标准差,然后应用t检验或方差分析等方法来判断差异是否具有统计学意义。
如果计算得到的显著性水平小于设定的显著性水平(通常为0.05),则可以认为差异具有统计学意义。
第三题:某厂生产的汽车零部件自然寿命数据如下图所示,请根据数据判断该厂生产的零部件的寿命服从正态分布还是指数分布。
此题是一个判断数据分布的问题,需要根据给定的数据来确定数据的分布类型。
对于给定的数据,可以绘制直方图或者QQ图,通过观察数据的分布形态来判断其是否符合正态分布或指数分布。
如果数据的直方图呈现正态分布的形态或者QQ图上的数据点接近于一条直线,则可以判断该数据符合正态分布。
反之,如果数据的直方图呈现指数分布的形态,则可以判断该数据符合指数分布。
通过以上三个例题的解析,我们可以看到高考统计学科的试题常常涉及到数据的处理和分析,需要掌握一定的计算方法和统计原理。
在备考过程中,除了熟悉考纲和掌握基本概念外,还需要多做真题并进行解析,尤其是那些典型的大题。
高中数学频率分布直方图
频率分布直方图作频率分布直方图的方法为:(1)把横轴分成若干段,每一线段对应一个组的组距;(2)以此线段为底作矩形,它的高等于该组的组距频率,这样得出一系列的矩形;(3)每个矩形的面积恰好是该组上的频率.频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图.作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.知识点1:利用频率分布直方图分析总体分布例题1:2000辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,时速在[50,60)的汽车大约有A.30辆B.60辆C.300辆D.600辆变式:某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是A.90B.75C. 60D.45变式:某初一年级有500名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图),若要从身高在[)120,130,[)130,140,[]140,150三100 110 120 130 140 150 身高.组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[)130,140内的学生中选取的人数为.知识点2:用样本分估计总体例题2某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,(Ⅰ) 完成频率分布表;(Ⅱ)作出频率分布直方图;(Ⅲ)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染。
频率分布直方图
例1:青少年“心理健康”问题引起社会关注,希望中学对全校600名
学生进行了一次“心理健康”知识测试,并从中抽取了部分学生的成 绩(得分取正整数,满分100分)作为样本, (1)填写频率分布表中的空格(2)画频率分布直方图 (3)若成绩在90分以上(不含90分)
为优秀,试估计该校成绩优秀
的有多少人
设抽取的学生人数为n,由已知条 件可得:
2
2
n 0.04, n 0.04 50
0.2
16
0.32
50
练习 1
1.某雷达测速区规定:凡车速大于或等于 70 km/h 的汽车视为“超速”,并将受到处罚, 如图是某路段的一个检测点对 200 辆汽车的车 速进行检测所得结果的频率分布直方图,则从 图中可以看出被处罚的汽车大约有( )
A.30 辆 B.40 辆 C.60 辆 D.80 辆
④列___频__率___分__布___表; ⑤画__频__率___分__布___直__方__图.
频率
在频率分布直方图中,纵轴表示 组距,数据落在各小 组内的频率用小长方形的面积表示,各小长方形的面积总
和等于 1 .
在频率分布直方图中,小矩形的高表示频率,对吗?
不对.小矩形的高表示“频率/组距”,小矩形的面积表示 频率.
A.6 B.8 C.12 D.18
解析:设样本容量为 n,
由题意,得(0.24+0.16)×1×n=20,解得 n=50.
所以第三组频数为 0.36×1×50=18.
因为第三组中没有疗效的有 6 人,所以第三组中有疗效的有 12
人.
答案:C
例【3例 2】 如图是根据部分城市某年 6 月份的平均气温(单位:℃)数据得到
练习 2 (2014·山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的
高考数学频率分布直方图大题训练题(含答案)
频率分布直方图大题训练题一、解答题(共18题;共205分)1.(2020·龙岩模拟)某电讯企业为了了解某地区居民对电讯服务质量评价情况,随机调查100 名用户,根据这100名用户对该电讯企业的评分,绘制频率分布直方图,如图所示,其中样本数据分组为,,…… .(1)估计该地区用户对该电讯企业评分不低于70分的概率,并估计对该电讯企业评分的中位数;(2)现从评分在的调查用户中随机抽取2人,求2人评分都在的概率.2.(2020·芜湖模拟)某学校为了了解该校高三年级学生寒假在家自主学习的情况,随机对该校300名高三学生寒假的每天学习时间(单位:h)进行统计,按照,,,,的分组作出频率分布直方图如图所示.参考公式:,其中.参考附表:0.050 0.010 0.001(Ⅰ)根据频率分布直方图计算该校高三年级学生的平均每天学习时间(同一组中的数据用该组区间中点值代表);(Ⅱ)该校规定学习时间超过4h为合格,否则不合格.已知这300名学生中男生有140人,其中合格的有70人,请补全下表,根据表中数据,能否有99.9%的把握认为该校高三年级学生的性别与学习时长合格有关?3.(2020·泰安模拟)某水果批发商经销某种水果(以下简称A水果),购入价为300元/袋,并以360元/袋的价格售出,若前8小时内所购进的A水果没有售完,则批发商将没售完的A水果以220元/袋的价格低价处理完毕(根据经验,2小时内完全能够把A水果低价处理完,且当天不再购进).该水果批发商根据往年的销量,统计了100天A水果在每天的前8小时内的销售量,制成如下频数分布条形图.现以记录的100天的A水果在每天的前8小时内的销售量的频率作为A水果在一天的前8小时内的销售量的概率,记X表示A水果一天前8小时内的销售量,n表示水果批发商一天批发A水果的袋数.(1)求X的分布列;(2)以日利润的期望值为决策依据,在与中选其一,应选用哪个?4.(2020·南昌模拟)某产品自生产并投入市场以来,生产企业为确保产品质量,决定邀请第三方检测机构对产品进行质量检测,并依据质量指标Z来衡量产品的质量.当时,产品为优等品;当时,产品为一等品;当时,产品为二等品.第三方检测机构在该产品中随机抽取500件,绘制了这500件产品的质量指标Z的条形图.用随机抽取的500件产品作为样本,估计该企业生产该产品的质量情况,并用频率估计概率.(1)从该企业生产的所有产品中随机抽取4件,求至少有1件优等品的概率;(2)现某人决定购买80件该产品.已知每件成本1000元,购买前,邀请第三方检测机构对要购买的80件产品进行抽样检测,买家、企业及第三方检测机构就检测方案达成以下协议:从80件产品中随机抽出4件产品进行检测,若检测出3件或4件为优等品,则按每件1600元购买,否则按每件1500元购买,每件产品的检测费用250元由企业承担.记企业的收益为X元,求X的分布列与数学期望.5.(2020·南昌模拟)在“挑战不可能”的电视节目上,甲、乙、丙三个人组成的解密团队参加一项解密挑战活动,规则是由密码专家给出题目,然后由3个人依次出场解密,每人限定时间是1分钟内,否则派下一个人.3个人中只要有一人解密正确,则认为该团队挑战成功,否则挑战失败.根据甲以往解密测试情况,抽取了甲100次的测试记录,绘制了如下的频率分布直方图.(1)若甲解密成功所需时间的中位数为47,求a、b的值,并求出甲在1分钟内解密成功的频率;(2)在“挑战不可能”节目上由于来自各方及自身的心理压力,甲,乙,丙解密成功的概率分别为,其中表示第个出场选手解密成功的概率,并且定义为甲抽样中解密成功的频率代替,各人是否解密成功相互独立.①求该团队挑战成功的概率;②该团队以从小到大的顺序按排甲、乙、丙三个人上场解密,求团队挑战成功所需派出的人员数目X 的分布列与数学期望.6.(2020·江西模拟)冠状病毒是一个大型病毒家族,可引起感冒以及中东呼吸综合征(MERS)和严重急性呼吸综合征(SARS)等较严重疾病.出现的新型冠状病毒(nCoV)是从未在人体中发现的冠状病毒新毒株.人感染了新型冠状病毒后常见体征有呼吸道症状、发热、咳嗽、气促和呼吸困难等.在较严重病例中,感染可导致肺炎、严重急性呼吸综合征、肾衰竭,甚至死亡.某医院为筛查冠状病毒,需要检测血液中的指标A.现从采集的血液样品中抽取500份检测指标A的值,由测量结果得下侧频率分布直方图:(1)求这500份血液样品指标A值的平均数和样本方差(同一组数据用该区间的中点值作代表,记作);(2)由频率分布直方图可以认为,这项指标的值X服从正态分布,其中近似为样本平均数,近似为样本方差.在统计学中,把发生概率小于3‰的事件称为小概率事件(正常条件下小概率事件的发生是不正常的).该医院非常关注本院医生健康状况,随机抽取20名医生,独立的检测血液中指标A的值,结果发现4名医生血液中指标A的值大于正常值20.03,试根据题中条件判断该院医生的健康率是否正常,并说明理由.附:参考数据与公式:,,;若,则① ;② ;③.,,,.7.(2020·江西模拟)年前某市质监部门根据质量管理考核指标对本地的500家食品生产企业进行考核,然后通过随机抽样抽取其中的50家,统计其考核成绩(单位:分),并制成如下频率分布直方图.(1)求这50家食品生产企业考核成绩的平均数(同一组中的数据用该组区间的中点值为代表)及中位数a(精确到0.01)(2)该市质监部门打算举办食品生产企业质量交流会,并从这50家食品生产企业中随机抽取4家考核成绩不低于88分的企业发言,记抽到的企业中考核成绩在的企业数为X,求X的分布列与数学期望(3)若该市食品生产企业的考核成绩X服从正态分布其中近似为50家食品生产企业考核成绩的平均数,近似为样本方差,经计算得,利用该正态分布,估计该市500家食品生产企业质量管理考核成绩高于90.06分的有多少家?(结果保留整数).附参考数据与公式:则,.8.(2020·漯河模拟)十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康.经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入、实现2020年脱贫的工作计划,该地扶贫办统计了2019年50位农民的年收入并制成如下频率分布直方图:附参考数据:,若随机变量X服从正态分布,则,,.(1)根据频率分布直方图,估计50位农民的平均年收入(单位:千元);(同一组数据用该组数据区间的中点值表示);(2)由频率分布直方图,可以认为该贫困地区农民年收入X服从正态分布,其中近似为年平均收入,近似为样本方差,经计算得=6.92,利用该正态分布,求:①在扶贫攻坚工作中,若使该地区约有占总农民人数的的农民的年收入高于扶贫办制定的最低年收入标准,则最低年收入标准大约为多少千元?②为了调研“精准扶贫,不落一人”的政策要求落实情况,扶贫办随机走访了1000位农民.若每位农民的年收入互相独立,问:这1000位农民中的年收入不少于12.14千元的人数最有可能是多少?9.(2017·黑龙江模拟)某学生社团在对本校学生学习方法开展问卷调查的过程中发现,在回收上来的1000份有效问卷中,同学们背英语单词的时间安排共有两种:白天背和晚上临睡前背.为研究背单词时间安排对记忆效果的影响,该社团以5%的比例对这1000名学生按时间安排粪型进行分层抽样,并完成一项实验,实验方法是,使两组学生记忆40个无意义音节(如xIQ、GEH),均要求在刚能全部记清时就停止识记,并在8小时后进行记忆测验.不同的是,甲组同学识记结束后一直不睡觉,8小时后测验;乙组同学识记停止后立刻睡觉,8小时后叫醒测验.两组同学识记停止8小时后的准确回忆(保持)情况如图(区间含左端点而不舍右端点)(1)估计1000名被调查的学生中识记停止后8小时40个音节的保持率大于等于60%的人数;(2)从乙组准确回忆结束在|12,24)范围内的学生中随机选3人,记能准确回忆20个以上(含20)的人数为随机变量x.求X分布列及数学期望;(3)从本次实验的结果来看,上述两种时间安排方法中哪种方法背英语单词记忆效果更好?计算并说明理由.10.(2018·南宁模拟)在某单位的食堂中,食堂每天以10元/斤的价格购进米粉,然后以4.4元/碗的价格出售,每碗内含米粉0.2斤,如果当天卖不完,剩下的米粉以2元/斤的价格卖给养猪场.根据以往统计资料,得到食堂某天米粉需求量的频率分布直方图如图所示,若食堂购进了80斤米粉,以(斤)(其中)表示米粉的需求量,(元)表示利润.(1)估计该天食堂利润不少于760元的概率;(2)在直方图的需求量分组中,以区间中间值作为该区间的需求量,以需求量落入该区间的频率作为需求量在该区间的概率,求的分布列和数学期望.11.(2020·辽宁模拟)某城市100户居民的月平均用电量(单位:度),以,,,,,,分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为,,,的四组用户中,用分层抽样的方法抽取户居民,则月平均用电量在的用户中应抽取多少户?12.(2020·大连模拟)某校从参加高三模拟考试的学生中随机抽取名学生,将其数学成绩(均为整数)分成六段后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:(1)求分数在内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分;(3)用分层抽样的方法在分数段为的学生中抽取一个容量为的样本,将该样本看成一个总体,从中任取个,求至多有人在分数段内的概率.13.(2020·莆田模拟)为了解某地网民浏览购物网站的情况,从该地随机抽取100名网民进行调查,其中男性、女性人数分别为45和55.下面是根据调查结果绘制的网民日均浏览购物网站时间的频率分布直方图,将日均浏览购物网站时间不低于40分钟的网民称为“网购达人”,已知“网购达人”中女性有10人.参考公式:,其中.参考数据:0.102.7063.841 5.024 6.635 7.879 10.828(1)根据已知条件完成下面的列联表,并判断是否有90%的把握认为是否为“网购达人”与性别有关;(2)将上述调査所得到的频率视为概率,现在从该地的网民中随机抽取3名,记被抽取的3名网民中的“网购达人”的人数为X,求X的分布列、数学期望和方差.14.(2020·长春模拟)笔、墨、纸、砚是中国独有的文书工具,即“文房四宝”.笔、墨、纸、砚之名,起源于南北朝时期,其中的“纸”指的是宣纸,宣纸“始于唐代,产于泾县”,而唐代泾县隶属于宣州府管辖,故因地而得名“宣纸”,宣纸按质量等级,可分为正牌和副牌(优等品和合格品),某公司年产宣纸10000刀(每刀100张),公司按照某种质量标准值给宣纸确定质量等级,如下表所示:公式在所生产的宣纸中随机抽取了一刀(100张)进行检验,得到频率分布直方图如图所示,已知每张正牌纸的利润是10元,副牌纸的利润是5元,废品亏损10元.(1)估计该公式生产宣纸的年利润(单位:万元);(2)该公司预备购买一种售价为100万元的机器改进生产工艺,这种机器的使用寿命是一年,只能提高宣纸的质量,不影响产量,这种机器生产的宣纸的质量标准值的频率,如下表所示:其中为改进工艺前质量标准值的平均值,改进工艺后,每张正牌和副牌宣纸的利润都下降2元,请判断该公司是否应该购买这种机器,并说明理由.15.(2020·蚌埠模拟)随着网购人数的日益增多,网上的支付方式也呈现一种多样化的状态,越来越多的便捷移动支付方式受到了人们的青睐,更被网友们评为“新四大发明”之一.随着人们消费观念的进步,许多人喜欢用信用卡购物,考虑到这一点,一种“网上的信用卡”横空出世——蚂蚁花呗.这是一款支付宝和蚂蚁金融合作开发的新支付方式,简单便捷,同时也满足了部分网上消费群体在支付宝余额不足时的“赊购”消费需求.为了调查使用蚂蚁花呗“赊购”消费与消费者年龄段的关系,某网站对其注册用户开展抽样调查,在每个年龄段的注册用户中各随机抽取100人,得到各年龄段使用蚂蚁花呗“赊购”的人数百分比如图所示.参考答案:,.(1)由大数据可知,在18到44岁之间使用花呗“赊购”的人数百分比y与年龄x成线性相关关系,利用统计图表中的数据,以各年龄段的区间中点代表该年龄段的年龄,求所调查群体各年龄段“赊购”人数百分比y与年龄x的线性回归方程(回归直线方程的斜率和截距保留两位有效数字);(2)该网站年龄为20岁的注册用户共有2000人,试估算该网站20岁的注册用户中使用花呗“赊购”的人数;(3)已知该网店中年龄段在18-26岁和27-35岁的注册用户人数相同,现从18到35岁之间使用花呗“赊购”的人群中按分层抽样的方法随机抽取8人,再从这8人中简单随机抽取2人调查他们每个月使用花呗消费的额度,求抽取的两人年龄都在18到26岁的概率.16.(2020·辽宁模拟)港珠澳大桥是一座具有划时代意义的大桥.它连通了珠海香港澳门三地,大大缩短了三地的时空距离,盘活了珠江三角洲的经济,被誉为新的世界七大奇迹.截至2019年10月23日8点,珠海公路口岸共验放出入境旅客超过1400万人次,日均客流量已经达到4万人次,验放出入境车辆超过70万辆次,2019年春节期间,客流再次大幅增长,日均客流达8万人次,单日客流量更是创下11.3万人次的最高纪录.2019年从五月一日开始的连续100天客流量频率分布直方图如下(1)①同一组数据用该区间的中点值代替,根据频率分布直方图.估计客流量的平均数.②求客流量的中位数.(2)设这100天中客流量超过5万人次的有天,从这天中任取两天,设为这两天中客流量超过7万人的天数.求的分布列和期望.17.(2020·江门模拟)2019年7月1日到3日,世界新能源汽车大会在海南博鳌召开,大会着眼于全球汽车产业的转型升级和生态环境的持续改善.某汽车公司顺应时代潮流,最新研发了一款新能源汽车,并在出厂前对100辆汽车进行了单次最大续航里程(理论上是指新能源汽车所装载的燃料或电池所能够提供给车行驶的最远里程)的测试.现对测试数据进行分析,得到如图的频率分布直方图.(1)估计这100辆汽车的单次最大续航里程的平均值(同一组中的数据用该组区间的中点值代表);(2)根据大量的汽车测试数据,可以认为这款汽车的单次最大续航量程X近似地服从正态分布,经计算第(1)问中样本标准差s的近似值为50.用样本平均数作为的近似值,用样本标准差s作为的估计值,现任取一辆汽车,求它的单次最大续航里程恰在250千米到400千米之间的概率;(3)某汽车销售公司为推广此款新能源汽车,现面向意向客户推出“玩游戏,送大奖”活动,客户可根据抛掷硬币的结果,操控微型遥控车在方格图上行进,若遥控车最终停在“胜利大本营”,则可获得购车优惠券.已知硬币出现正,反面的概率都是,方格图上标有第0格、第1格、第2格……第50格.遥控车开始在第0格,客户每掷一次硬币,遥控车向前移动一次,若掷出正面,遥控车向前移动一格(从k到),若掷出反面,遥控车向前移动两格(从k到),直到遥控车移到第49格(胜利大本营)或第50格(失败大本营)时,游戏结束.设遥控车移到第n格的概率为,试证明是等比数列,并解释此方案能否成功吸引顾客购买该款新能源汽车.参考数据:若随机变量服从正态分布,则,,.18.(2020·肇庆模拟)某公司新上一条生产线,为保证新的生产线正常工作,需对该生产线进行检测,现从该生产线上随机抽取100件产品,测量产品数据,用统计方法得到样本的平均数,标准差,绘制如图所示的频率分布直方图,以频率值作为概率估值.(1)从该生产线加工的产品中任意抽取一件,记其数据为,依据以下不等式评判(表示对应事件的概率)①②③评判规则为:若至少满足以上两个不等式,则生产状况为优,无需检修;否则需检修生产线,试判断该生产线是否需要检修;(2)将数据不在内的产品视为次品,从该生产线加工的产品中任意抽取2件,次品数记为,求的分布列与数学期望.答案解析部分一、解答题1.【答案】(1)解:由题意,该地区用户对该电讯企业评分的频率分布如下表:因此可估计评分不低于70分的概率为;对该电讯企业评分的中位数设为x,可得,则,解得,所以可估计对该电讯企业评分的中位数为;(2)解:受调查用户评分在的有人,若编号依次为1,2,3,4,从中选2人的事件有、、、、、,共有个基本事件;受调查用户评分在的有人,若编号依次为1,2,3,..9,10,从中选2人,可得共有个基本事件;因此2人评分都在的概率.【解析】【分析】(1)由题意列出频率分布表,求和即可估计该地区用户对该电讯企业评分不低于70分的概率;利用中位数两侧的概率和相等列方程即可估计对该电讯企业评分的中位数;(2)由题意计算出受调查用户评分在、的人数,求出总的基本事件个数及满足要求的基本事件的个数,由古典概型概率公式即可得解.2.【答案】解:(Ⅰ)高三年级学生平均每天的学习时间为:(h);(Ⅱ)300名学生中合格的人数为(人),故补全表格如下:所以所以有99.9%的把握认为该校高三年级学生的性别与学习时长合格有关.【解析】【分析】(Ⅰ)根据频率分布直方图直接计算平均值即可;(Ⅱ)先求出300名学生中合格的人数,再补全表格,然后根据表格数据和公式计算,最后将与进行比较,进而得出结论.3.【答案】(1)解:由题意知,根据条形图,可得A水果在每天的前8小时内的销售量分别为14,15,16,17的频率分别是0.2,0.3,0.4和0.1 ,所以X的分布列为140.2(2)解:当时,设Y为水果批发商的日利润,则Y的可能取值为760,900,可得,所以期望,当时,设Z为水果批发商的日利润,则Z的可能取值为680,820,960,可得,所以期望.因为,综上可知,当时的日利润期望值大于时的日利润期望值,故答案为:.【解析】【分析】(1)由题意知,根据条形图,得到销售量分别为14,15,16,17的频率,进而得到随机变量X的分布列;(2)分别求得当和时,利润的数学期望,比较即可得到结论.4.【答案】(1)解:由题意知,500件产品中共有优等品件,则从样本中随机取一件为优等品的概率为,所以从该企业生产的所有产品中随机抽取4件,没有一件是优等品的概率为,则随机抽取4件,至少有1件优等品的概率为.(2)解:检测出3件或4件为优等品时,检测出的优等品低于3件时,,由题意知,,故X的分布列为所以数学期望.【解析】【分析】(1)先求出从样本中随机取一件为优等品的概率,再求从该企业生产的所有产品中随机抽取4件,没有一件是优等品的概率,从而可求出至少有一件是优等品的概率.(2)由题意求出检测出3件或4件为优等品时及检测出的优等品低于3件时的X的值,结合第一问求出,,从而可得X的分布列,即可计算其数学期望5.【答案】(1)解:甲解密成功所需时间的中位数为47,,解得,,解得,由频率分布直方图知,甲在分钟内解密成功的频率是;(2)解:①由题意及(1)可知第一个出场选手解密成功的概率为,第二个出场选手解密成功的概率为,第三个出场选手解密成功的概率为,所以该团队挑战成功的概率为;②由①可知按从小到大的顺序的概率分别、、,根据题意知的取值为、、,则,,,所以所需派出的人员数目的分布列为:因此,.【解析】【分析】(1)根据中位数左右两边的矩形面积之和均为0.5可求得a、b的值,并根据频率分布直方图求得甲在1分钟内解密成功的频率;(2)①由(1)得出,求出、的值,由此得出该团队挑战成功的概率为;②由题意可得出随机变量X的可能取值有1、2、3,利用独立事件的概率乘法公式计算出随机变量X在不同取值下的概率,据此可得出随机变量X的分布列,结合期望公式可计算出X的数学期望值.6.【答案】(1)解:根据题意,由频率分布直方图可知,500份血液样品指标A值的平均数为:,500份血液样品指标A值的样本方差为:.(2)解:由题意知:指标的值服从正态分布,,,则,所以,.随机抽取20名医生独立检测血液中指标的值,就相当于进行了20次独立重复试验,记“20名医生中出现4名医生血液中指标的值大于正常值20,03”为事件,则,所以从血液中指标的值的角度来看:该院医生的健康率是正常的.【解析】【分析】(1)由频率分布直方图,直接利用平均数和方差公式,求出500份血液样品指标值的平均数和样本方差;(2)由(1)得出指标的值服从正态分布,从而可求出,在根据独立重复试验中的概率求法,求出20名医生中出现4名医生血液中指标的值大于正常值20.03的概率,即可判断该院医生的健康率是否正常7.【答案】(1)解:由题意,这50家食品生产企业考核成绩的平均数为:(分),由频率分布图可知内,所以,解得分.(2)解:根据题意,这50家食品生产企业中考核成绩不低于88分的企业有:(家),其中考核成绩在内的企业有(家),所以X可能取值有0,1,2,3,4则,,,,,所以X的分布列为所以.(3)解:由题意得,所以,所以,所以(家),所以500家食品生产企业质量管理考核成绩高于90.06分的有79家.【解析】【分析】(1)利用频率分布直方图的性质能求出这50家食品生产企业考核成绩的平均数和中位数;(2)由已知得到考核成绩在内的企业有5家,得出随机变量的可能取值,分别求出相应的概率和分布列,求得数学期望;(3)根据题意得,由此估计该市500家食品生产企业质量管理考核成绩高于90.06分的企业个数.8.【答案】(1)解:千元.故估计50位农民的年平均收入为17.40千元.(2)解:由题意知,① ,所以时,满足题意,即最低年收入大约为14.77千元.②由,每个农民的年收入不少于12.14千元的事件的概率为0.9773,记1000个农民的年收入不少于12.14千元的人数为则,其中于是恰好有k个农民的年收入不少于12.14千元的事件概率为,。
高三 复习 频率分布直方图
总体密度曲线
总体密度曲线反映了总体在各个范围内取值的 百分比,精确地反映了总体的分布规律。 用样本分布直方图去估计相应的总体分布时 ,一般样本容量越大,频率分布折线图就会无限 接近总体密度曲线,就越精确地反映了总体的分 布规律,即越精确地反映了总体在各个范围内取 值百分比。
茎叶图
某赛季甲、乙两名篮球运动员每场比赛得分的原 始记录如下:
引入
我国是世界上严重缺水的国家之一, 城市缺水问题较为突出。
2000年全国主要城市中缺水情况排在前10位的城市
政府为了节约生活用水,计划在本市试行居民生 活用水定额管理,即确定一个居民月用水量标准a , 用水量不超过a的部分按平价收费,超过a的部 分按议价收费。
①如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?
组距:指每个小组的两个端点的距离,
极差 4.1 组数= = 8.2 = 组距 0.5 3.将数据分组(左闭右开) [0,0.5 ),[0.5,1 ),…,[4,4.5]
4.列频率分布表
频率分布表一般分“分 组”,“频数累计”( 可省),“频数”,“ 频率”, “ 频率/组距 ””五列,最后一行是 频数 合计
助学微博
一个对比
频率分布表:优点:能看出分布规律.缺点:不直观. 频率分布直方图:优点:很直观且能看出分布规律.缺点: 数据的轻微变化都要重新作图. 茎叶图:优点:很直观,能看出分布规律,还可以添加新 数据.缺点:数据少时方便,数据较多时不方便.
两个特性
(1)在频率分布表中,频数的和等于样本容量,每一小组的频 率等于这一组的频数除以样本容量,各小组频率的和等于 1; (2)在频率分布直方图中,小矩形的高等于每一组的频率/组 距,每个小矩形的面积等于该组的频率,所有小矩形的面积 之和为 1.
频率分布直方图如下
(1)解:如图:茎为成绩的整环数,叶为小数点后的数字
甲
乙
85 2 74
7
1
8
57
4
9
112 78
8751
10
11
(2)乙成绩大致对称,甲成绩的中位数为9.05, 乙成绩的中位数为9.15,所以乙成绩较甲好, 乙成绩较集中于峰值,甲成绩分散
所以乙发挥的稳定性好,甲波动大
练习2:课本71页练习第三题
作业:课本71页练习1,上面的练习1和2。
优化设计
小结:1.什么是频率折线图
2.什么是总体密度曲线及其意义 3.1)认识茎叶图,如何做茎叶图 2)分析茎叶图,3)茎叶图的优缺点
频率分布直方图如下:
频率
连接频率分布直方图
组距
中各小长方形上端的
中点,得到频率分布折
线图
0.50
0.40
0.30
0.20
0.10
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
利用样本频率分布对总体分布进行相应估计
(1)上例的样本容量为100,如果增至1000, 其频率分布直方图的情况会有什么变化?假如增 至10000呢?
26
思考: 数据大于俩位数的整数时又如何选茎,叶?
数据为小数时又如何选茎,叶?
结论:1>当数据为整数时:通常个位数字在叶上, 其他位数在茎上(一位数时,茎为0)
2>当数据为小数时:通常小数部分在叶上, 整数部分在茎上
甲的茎叶图画法
也可以画一组数据的茎叶图,竖线左边为茎,
右边为叶。
茎
叶
08
1 364
甲的中位数为26,乙的中位数为36,所以乙较甲成绩要好, 另,乙的叶较甲的更集中于峰值附近,所以乙较甲发挥 更稳定
频率分布直方图和折线图
(4)为了了解某学校学生的身体发育情况,抽查了该校 100名高中男生的体重情况,根据所得数据画出样本的频 率分布直方图如右图所示.根据此图,估计该校2000名高 中男生中体重大于70.5公斤的人数为( B ) A.300 B.360 C.420 D.450
频率.05 0.04 0.03 0.02 0.01
3从频率分布表可以看出, 该样本中小于100的频
率为0.01 0.02 0.04 0.14 0.21不 . 小于120的频 率为 0.11 0.06 0.02 0.19故, 可以估计该片经济 树林中底部周长小于100cm的树木约占21%, 周长 不小于120的树木约占19% .
四、课堂练习 (1)教材56页第2题. (2)一个高中研究性学习小组对本地区2000年至2002年 快餐公司发展情况进行了调查,制成了该地区快餐公司个 数情况的条形图和快餐公司盒饭年销售量的平均数情况条 形图(如图),根据图中提供的信息可以得出这三年中该 地区每年平均销售盒饭 85 万盒.
快餐公司饭盒年平均数图
频率折 线图
0.08
频率直方
0.06
图
0.04
0.02
150.5 153.5
162.5 165.5
180.5
身高/cm
折线图反映了数据的变化趋势;若组距取得越小,则
频率折线的光滑程度会怎样?
越光滑
频率折线图的 优点是它反映 了数据的变化
频率/组距 0.08
趋势.如果把样
0.06
本容量取得足
0.04
够大, 分组的组 0.02
距取得足够小,
则相应的频率 折线图将趋于
150
155
160
165
高考数学频率分布直方图大题训练题(含答案)
频率分布直方图大题训练题一、解答题(共18题;共205分)1.(2020·龙岩模拟)某电讯企业为了了解某地区居民对电讯服务质量评价情况,随机调查100 名用户,根据这100名用户对该电讯企业的评分,绘制频率分布直方图,如图所示,其中样本数据分组为,,…… .(1)估计该地区用户对该电讯企业评分不低于70分的概率,并估计对该电讯企业评分的中位数;(2)现从评分在的调查用户中随机抽取2人,求2人评分都在的概率.2.(2020·芜湖模拟)某学校为了了解该校高三年级学生寒假在家自主学习的情况,随机对该校300名高三学生寒假的每天学习时间(单位:h)进行统计,按照,,,,的分组作出频率分布直方图如图所示.参考公式:,其中.参考附表:0.050 0.010 0.001(Ⅰ)根据频率分布直方图计算该校高三年级学生的平均每天学习时间(同一组中的数据用该组区间中点值代表);(Ⅱ)该校规定学习时间超过4h为合格,否则不合格.已知这300名学生中男生有140人,其中合格的有70人,请补全下表,根据表中数据,能否有99.9%的把握认为该校高三年级学生的性别与学习时长合格有关?3.(2020·泰安模拟)某水果批发商经销某种水果(以下简称A水果),购入价为300元/袋,并以360元/袋的价格售出,若前8小时内所购进的A水果没有售完,则批发商将没售完的A水果以220元/袋的价格低价处理完毕(根据经验,2小时内完全能够把A水果低价处理完,且当天不再购进).该水果批发商根据往年的销量,统计了100天A水果在每天的前8小时内的销售量,制成如下频数分布条形图.现以记录的100天的A水果在每天的前8小时内的销售量的频率作为A水果在一天的前8小时内的销售量的概率,记X表示A水果一天前8小时内的销售量,n表示水果批发商一天批发A水果的袋数.(1)求X的分布列;(2)以日利润的期望值为决策依据,在与中选其一,应选用哪个?4.(2020·南昌模拟)某产品自生产并投入市场以来,生产企业为确保产品质量,决定邀请第三方检测机构对产品进行质量检测,并依据质量指标Z来衡量产品的质量.当时,产品为优等品;当时,产品为一等品;当时,产品为二等品.第三方检测机构在该产品中随机抽取500件,绘制了这500件产品的质量指标Z的条形图.用随机抽取的500件产品作为样本,估计该企业生产该产品的质量情况,并用频率估计概率.(1)从该企业生产的所有产品中随机抽取4件,求至少有1件优等品的概率;(2)现某人决定购买80件该产品.已知每件成本1000元,购买前,邀请第三方检测机构对要购买的80件产品进行抽样检测,买家、企业及第三方检测机构就检测方案达成以下协议:从80件产品中随机抽出4件产品进行检测,若检测出3件或4件为优等品,则按每件1600元购买,否则按每件1500元购买,每件产品的检测费用250元由企业承担.记企业的收益为X元,求X的分布列与数学期望.5.(2020·南昌模拟)在“挑战不可能”的电视节目上,甲、乙、丙三个人组成的解密团队参加一项解密挑战活动,规则是由密码专家给出题目,然后由3个人依次出场解密,每人限定时间是1分钟内,否则派下一个人.3个人中只要有一人解密正确,则认为该团队挑战成功,否则挑战失败.根据甲以往解密测试情况,抽取了甲100次的测试记录,绘制了如下的频率分布直方图.(1)若甲解密成功所需时间的中位数为47,求a、b的值,并求出甲在1分钟内解密成功的频率;(2)在“挑战不可能”节目上由于来自各方及自身的心理压力,甲,乙,丙解密成功的概率分别为,其中表示第个出场选手解密成功的概率,并且定义为甲抽样中解密成功的频率代替,各人是否解密成功相互独立.①求该团队挑战成功的概率;②该团队以从小到大的顺序按排甲、乙、丙三个人上场解密,求团队挑战成功所需派出的人员数目X 的分布列与数学期望.6.(2020·江西模拟)冠状病毒是一个大型病毒家族,可引起感冒以及中东呼吸综合征(MERS)和严重急性呼吸综合征(SARS)等较严重疾病.出现的新型冠状病毒(nCoV)是从未在人体中发现的冠状病毒新毒株.人感染了新型冠状病毒后常见体征有呼吸道症状、发热、咳嗽、气促和呼吸困难等.在较严重病例中,感染可导致肺炎、严重急性呼吸综合征、肾衰竭,甚至死亡.某医院为筛查冠状病毒,需要检测血液中的指标A.现从采集的血液样品中抽取500份检测指标A的值,由测量结果得下侧频率分布直方图:(1)求这500份血液样品指标A值的平均数和样本方差(同一组数据用该区间的中点值作代表,记作);(2)由频率分布直方图可以认为,这项指标的值X服从正态分布,其中近似为样本平均数,近似为样本方差.在统计学中,把发生概率小于3‰的事件称为小概率事件(正常条件下小概率事件的发生是不正常的).该医院非常关注本院医生健康状况,随机抽取20名医生,独立的检测血液中指标A的值,结果发现4名医生血液中指标A的值大于正常值20.03,试根据题中条件判断该院医生的健康率是否正常,并说明理由.附:参考数据与公式:,,;若,则① ;② ;③.,,,.7.(2020·江西模拟)年前某市质监部门根据质量管理考核指标对本地的500家食品生产企业进行考核,然后通过随机抽样抽取其中的50家,统计其考核成绩(单位:分),并制成如下频率分布直方图.(1)求这50家食品生产企业考核成绩的平均数(同一组中的数据用该组区间的中点值为代表)及中位数a(精确到0.01)(2)该市质监部门打算举办食品生产企业质量交流会,并从这50家食品生产企业中随机抽取4家考核成绩不低于88分的企业发言,记抽到的企业中考核成绩在的企业数为X,求X的分布列与数学期望(3)若该市食品生产企业的考核成绩X服从正态分布其中近似为50家食品生产企业考核成绩的平均数,近似为样本方差,经计算得,利用该正态分布,估计该市500家食品生产企业质量管理考核成绩高于90.06分的有多少家?(结果保留整数).附参考数据与公式:则,.8.(2020·漯河模拟)十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康.经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入、实现2020年脱贫的工作计划,该地扶贫办统计了2019年50位农民的年收入并制成如下频率分布直方图:附参考数据:,若随机变量X服从正态分布,则,,.(1)根据频率分布直方图,估计50位农民的平均年收入(单位:千元);(同一组数据用该组数据区间的中点值表示);(2)由频率分布直方图,可以认为该贫困地区农民年收入X服从正态分布,其中近似为年平均收入,近似为样本方差,经计算得=6.92,利用该正态分布,求:①在扶贫攻坚工作中,若使该地区约有占总农民人数的的农民的年收入高于扶贫办制定的最低年收入标准,则最低年收入标准大约为多少千元?②为了调研“精准扶贫,不落一人”的政策要求落实情况,扶贫办随机走访了1000位农民.若每位农民的年收入互相独立,问:这1000位农民中的年收入不少于12.14千元的人数最有可能是多少?9.(2017·黑龙江模拟)某学生社团在对本校学生学习方法开展问卷调查的过程中发现,在回收上来的1000份有效问卷中,同学们背英语单词的时间安排共有两种:白天背和晚上临睡前背.为研究背单词时间安排对记忆效果的影响,该社团以5%的比例对这1000名学生按时间安排粪型进行分层抽样,并完成一项实验,实验方法是,使两组学生记忆40个无意义音节(如xIQ、GEH),均要求在刚能全部记清时就停止识记,并在8小时后进行记忆测验.不同的是,甲组同学识记结束后一直不睡觉,8小时后测验;乙组同学识记停止后立刻睡觉,8小时后叫醒测验.两组同学识记停止8小时后的准确回忆(保持)情况如图(区间含左端点而不舍右端点)(1)估计1000名被调查的学生中识记停止后8小时40个音节的保持率大于等于60%的人数;(2)从乙组准确回忆结束在|12,24)范围内的学生中随机选3人,记能准确回忆20个以上(含20)的人数为随机变量x.求X分布列及数学期望;(3)从本次实验的结果来看,上述两种时间安排方法中哪种方法背英语单词记忆效果更好?计算并说明理由.10.(2018·南宁模拟)在某单位的食堂中,食堂每天以10元/斤的价格购进米粉,然后以4.4元/碗的价格出售,每碗内含米粉0.2斤,如果当天卖不完,剩下的米粉以2元/斤的价格卖给养猪场.根据以往统计资料,得到食堂某天米粉需求量的频率分布直方图如图所示,若食堂购进了80斤米粉,以(斤)(其中)表示米粉的需求量,(元)表示利润.(1)估计该天食堂利润不少于760元的概率;(2)在直方图的需求量分组中,以区间中间值作为该区间的需求量,以需求量落入该区间的频率作为需求量在该区间的概率,求的分布列和数学期望.11.(2020·辽宁模拟)某城市100户居民的月平均用电量(单位:度),以,,,,,,分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为,,,的四组用户中,用分层抽样的方法抽取户居民,则月平均用电量在的用户中应抽取多少户?12.(2020·大连模拟)某校从参加高三模拟考试的学生中随机抽取名学生,将其数学成绩(均为整数)分成六段后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:(1)求分数在内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分;(3)用分层抽样的方法在分数段为的学生中抽取一个容量为的样本,将该样本看成一个总体,从中任取个,求至多有人在分数段内的概率.13.(2020·莆田模拟)为了解某地网民浏览购物网站的情况,从该地随机抽取100名网民进行调查,其中男性、女性人数分别为45和55.下面是根据调查结果绘制的网民日均浏览购物网站时间的频率分布直方图,将日均浏览购物网站时间不低于40分钟的网民称为“网购达人”,已知“网购达人”中女性有10人.参考公式:,其中.参考数据:0.102.7063.841 5.024 6.635 7.879 10.828(1)根据已知条件完成下面的列联表,并判断是否有90%的把握认为是否为“网购达人”与性别有关;(2)将上述调査所得到的频率视为概率,现在从该地的网民中随机抽取3名,记被抽取的3名网民中的“网购达人”的人数为X,求X的分布列、数学期望和方差.14.(2020·长春模拟)笔、墨、纸、砚是中国独有的文书工具,即“文房四宝”.笔、墨、纸、砚之名,起源于南北朝时期,其中的“纸”指的是宣纸,宣纸“始于唐代,产于泾县”,而唐代泾县隶属于宣州府管辖,故因地而得名“宣纸”,宣纸按质量等级,可分为正牌和副牌(优等品和合格品),某公司年产宣纸10000刀(每刀100张),公司按照某种质量标准值给宣纸确定质量等级,如下表所示:公式在所生产的宣纸中随机抽取了一刀(100张)进行检验,得到频率分布直方图如图所示,已知每张正牌纸的利润是10元,副牌纸的利润是5元,废品亏损10元.(1)估计该公式生产宣纸的年利润(单位:万元);(2)该公司预备购买一种售价为100万元的机器改进生产工艺,这种机器的使用寿命是一年,只能提高宣纸的质量,不影响产量,这种机器生产的宣纸的质量标准值的频率,如下表所示:其中为改进工艺前质量标准值的平均值,改进工艺后,每张正牌和副牌宣纸的利润都下降2元,请判断该公司是否应该购买这种机器,并说明理由.15.(2020·蚌埠模拟)随着网购人数的日益增多,网上的支付方式也呈现一种多样化的状态,越来越多的便捷移动支付方式受到了人们的青睐,更被网友们评为“新四大发明”之一.随着人们消费观念的进步,许多人喜欢用信用卡购物,考虑到这一点,一种“网上的信用卡”横空出世——蚂蚁花呗.这是一款支付宝和蚂蚁金融合作开发的新支付方式,简单便捷,同时也满足了部分网上消费群体在支付宝余额不足时的“赊购”消费需求.为了调查使用蚂蚁花呗“赊购”消费与消费者年龄段的关系,某网站对其注册用户开展抽样调查,在每个年龄段的注册用户中各随机抽取100人,得到各年龄段使用蚂蚁花呗“赊购”的人数百分比如图所示.参考答案:,.(1)由大数据可知,在18到44岁之间使用花呗“赊购”的人数百分比y与年龄x成线性相关关系,利用统计图表中的数据,以各年龄段的区间中点代表该年龄段的年龄,求所调查群体各年龄段“赊购”人数百分比y与年龄x的线性回归方程(回归直线方程的斜率和截距保留两位有效数字);(2)该网站年龄为20岁的注册用户共有2000人,试估算该网站20岁的注册用户中使用花呗“赊购”的人数;(3)已知该网店中年龄段在18-26岁和27-35岁的注册用户人数相同,现从18到35岁之间使用花呗“赊购”的人群中按分层抽样的方法随机抽取8人,再从这8人中简单随机抽取2人调查他们每个月使用花呗消费的额度,求抽取的两人年龄都在18到26岁的概率.16.(2020·辽宁模拟)港珠澳大桥是一座具有划时代意义的大桥.它连通了珠海香港澳门三地,大大缩短了三地的时空距离,盘活了珠江三角洲的经济,被誉为新的世界七大奇迹.截至2019年10月23日8点,珠海公路口岸共验放出入境旅客超过1400万人次,日均客流量已经达到4万人次,验放出入境车辆超过70万辆次,2019年春节期间,客流再次大幅增长,日均客流达8万人次,单日客流量更是创下11.3万人次的最高纪录.2019年从五月一日开始的连续100天客流量频率分布直方图如下(1)①同一组数据用该区间的中点值代替,根据频率分布直方图.估计客流量的平均数.②求客流量的中位数.(2)设这100天中客流量超过5万人次的有天,从这天中任取两天,设为这两天中客流量超过7万人的天数.求的分布列和期望.17.(2020·江门模拟)2019年7月1日到3日,世界新能源汽车大会在海南博鳌召开,大会着眼于全球汽车产业的转型升级和生态环境的持续改善.某汽车公司顺应时代潮流,最新研发了一款新能源汽车,并在出厂前对100辆汽车进行了单次最大续航里程(理论上是指新能源汽车所装载的燃料或电池所能够提供给车行驶的最远里程)的测试.现对测试数据进行分析,得到如图的频率分布直方图.(1)估计这100辆汽车的单次最大续航里程的平均值(同一组中的数据用该组区间的中点值代表);(2)根据大量的汽车测试数据,可以认为这款汽车的单次最大续航量程X近似地服从正态分布,经计算第(1)问中样本标准差s的近似值为50.用样本平均数作为的近似值,用样本标准差s作为的估计值,现任取一辆汽车,求它的单次最大续航里程恰在250千米到400千米之间的概率;(3)某汽车销售公司为推广此款新能源汽车,现面向意向客户推出“玩游戏,送大奖”活动,客户可根据抛掷硬币的结果,操控微型遥控车在方格图上行进,若遥控车最终停在“胜利大本营”,则可获得购车优惠券.已知硬币出现正,反面的概率都是,方格图上标有第0格、第1格、第2格……第50格.遥控车开始在第0格,客户每掷一次硬币,遥控车向前移动一次,若掷出正面,遥控车向前移动一格(从k到),若掷出反面,遥控车向前移动两格(从k到),直到遥控车移到第49格(胜利大本营)或第50格(失败大本营)时,游戏结束.设遥控车移到第n格的概率为,试证明是等比数列,并解释此方案能否成功吸引顾客购买该款新能源汽车.参考数据:若随机变量服从正态分布,则,,.18.(2020·肇庆模拟)某公司新上一条生产线,为保证新的生产线正常工作,需对该生产线进行检测,现从该生产线上随机抽取100件产品,测量产品数据,用统计方法得到样本的平均数,标准差,绘制如图所示的频率分布直方图,以频率值作为概率估值.(1)从该生产线加工的产品中任意抽取一件,记其数据为,依据以下不等式评判(表示对应事件的概率)①②③评判规则为:若至少满足以上两个不等式,则生产状况为优,无需检修;否则需检修生产线,试判断该生产线是否需要检修;(2)将数据不在内的产品视为次品,从该生产线加工的产品中任意抽取2件,次品数记为,求的分布列与数学期望.答案解析部分一、解答题1.【答案】(1)解:由题意,该地区用户对该电讯企业评分的频率分布如下表:因此可估计评分不低于70分的概率为;对该电讯企业评分的中位数设为x,可得,则,解得,所以可估计对该电讯企业评分的中位数为;(2)解:受调查用户评分在的有人,若编号依次为1,2,3,4,从中选2人的事件有、、、、、,共有个基本事件;受调查用户评分在的有人,若编号依次为1,2,3,..9,10,从中选2人,可得共有个基本事件;因此2人评分都在的概率.【解析】【分析】(1)由题意列出频率分布表,求和即可估计该地区用户对该电讯企业评分不低于70分的概率;利用中位数两侧的概率和相等列方程即可估计对该电讯企业评分的中位数;(2)由题意计算出受调查用户评分在、的人数,求出总的基本事件个数及满足要求的基本事件的个数,由古典概型概率公式即可得解.2.【答案】解:(Ⅰ)高三年级学生平均每天的学习时间为:(h);(Ⅱ)300名学生中合格的人数为(人),故补全表格如下:所以所以有99.9%的把握认为该校高三年级学生的性别与学习时长合格有关.【解析】【分析】(Ⅰ)根据频率分布直方图直接计算平均值即可;(Ⅱ)先求出300名学生中合格的人数,再补全表格,然后根据表格数据和公式计算,最后将与进行比较,进而得出结论.3.【答案】(1)解:由题意知,根据条形图,可得A水果在每天的前8小时内的销售量分别为14,15,16,17的频率分别是0.2,0.3,0.4和0.1 ,所以X的分布列为140.2(2)解:当时,设Y为水果批发商的日利润,则Y的可能取值为760,900,可得,所以期望,当时,设Z为水果批发商的日利润,则Z的可能取值为680,820,960,可得,所以期望.因为,综上可知,当时的日利润期望值大于时的日利润期望值,故答案为:.【解析】【分析】(1)由题意知,根据条形图,得到销售量分别为14,15,16,17的频率,进而得到随机变量X的分布列;(2)分别求得当和时,利润的数学期望,比较即可得到结论.4.【答案】(1)解:由题意知,500件产品中共有优等品件,则从样本中随机取一件为优等品的概率为,所以从该企业生产的所有产品中随机抽取4件,没有一件是优等品的概率为,则随机抽取4件,至少有1件优等品的概率为.(2)解:检测出3件或4件为优等品时,检测出的优等品低于3件时,,由题意知,,故X的分布列为所以数学期望.【解析】【分析】(1)先求出从样本中随机取一件为优等品的概率,再求从该企业生产的所有产品中随机抽取4件,没有一件是优等品的概率,从而可求出至少有一件是优等品的概率.(2)由题意求出检测出3件或4件为优等品时及检测出的优等品低于3件时的X的值,结合第一问求出,,从而可得X的分布列,即可计算其数学期望5.【答案】(1)解:甲解密成功所需时间的中位数为47,,解得,,解得,由频率分布直方图知,甲在分钟内解密成功的频率是;(2)解:①由题意及(1)可知第一个出场选手解密成功的概率为,第二个出场选手解密成功的概率为,第三个出场选手解密成功的概率为,所以该团队挑战成功的概率为;②由①可知按从小到大的顺序的概率分别、、,根据题意知的取值为、、,则,,,所以所需派出的人员数目的分布列为:因此,.【解析】【分析】(1)根据中位数左右两边的矩形面积之和均为0.5可求得a、b的值,并根据频率分布直方图求得甲在1分钟内解密成功的频率;(2)①由(1)得出,求出、的值,由此得出该团队挑战成功的概率为;②由题意可得出随机变量X的可能取值有1、2、3,利用独立事件的概率乘法公式计算出随机变量X在不同取值下的概率,据此可得出随机变量X的分布列,结合期望公式可计算出X的数学期望值.6.【答案】(1)解:根据题意,由频率分布直方图可知,500份血液样品指标A值的平均数为:,500份血液样品指标A值的样本方差为:.(2)解:由题意知:指标的值服从正态分布,,,则,所以,.随机抽取20名医生独立检测血液中指标的值,就相当于进行了20次独立重复试验,记“20名医生中出现4名医生血液中指标的值大于正常值20,03”为事件,则,所以从血液中指标的值的角度来看:该院医生的健康率是正常的.【解析】【分析】(1)由频率分布直方图,直接利用平均数和方差公式,求出500份血液样品指标值的平均数和样本方差;(2)由(1)得出指标的值服从正态分布,从而可求出,在根据独立重复试验中的概率求法,求出20名医生中出现4名医生血液中指标的值大于正常值20.03的概率,即可判断该院医生的健康率是否正常7.【答案】(1)解:由题意,这50家食品生产企业考核成绩的平均数为:(分),由频率分布图可知内,所以,解得分.(2)解:根据题意,这50家食品生产企业中考核成绩不低于88分的企业有:(家),其中考核成绩在内的企业有(家),所以X可能取值有0,1,2,3,4则,,,,,所以X的分布列为所以.(3)解:由题意得,所以,所以,所以(家),所以500家食品生产企业质量管理考核成绩高于90.06分的有79家.【解析】【分析】(1)利用频率分布直方图的性质能求出这50家食品生产企业考核成绩的平均数和中位数;(2)由已知得到考核成绩在内的企业有5家,得出随机变量的可能取值,分别求出相应的概率和分布列,求得数学期望;(3)根据题意得,由此估计该市500家食品生产企业质量管理考核成绩高于90.06分的企业个数.8.【答案】(1)解:千元.故估计50位农民的年平均收入为17.40千元.(2)解:由题意知,① ,所以时,满足题意,即最低年收入大约为14.77千元.②由,每个农民的年收入不少于12.14千元的事件的概率为0.9773,记1000个农民的年收入不少于12.14千元的人数为则,其中于是恰好有k个农民的年收入不少于12.14千元的事件概率为,。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高考题型之频率分布直方图
知识点:............................................................................................................................................................................... - 1 -典型例题:........................................................................................................................................................................... - 1 -答案....................................................................................................................................................................................... - 1 -
知识点:
典型例题:
1.某工厂对一批产品进行了抽样检测.有图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100), [100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是
(A)90 (B)75 (C)60 (D)45
2.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……第六组,成绩大于等于18秒且小于19秒。
右图是按上述分组方法得到的频率分布直方图。
设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为
(A)0.9,35(B)0.9,45(C)0.1,35(D)0.1,45
3.某个小区住户共200户,为调查小区居民的7月份用水量,用分层抽样的方法抽取了50户进行调查,得到本月的用水量(单位:m3)的频率分布直方图如图所示,则小区内用水量超过15m3的住户的户数为
A.10
B.50
C.60
D.140
4.某时段内共有100辆汽车经过某一雷达地区,时速频率分布直方图如右图所示,则时速超过60km/h的汽车数量为_____________;
5.某个容量为100的样本的频率分布直方图如下,则在区间[4,5)上的数据的频数
..为.
6.某地区教育主管部门为了对该地区模拟考试成绩进行分析,抽取了总成绩介于350分到650分之间的10000名学生成绩,并根据这10000名学生的总成绩画了样本的频率分布直方图.为了进一步分析学生的总成绩与各科成绩等方面的关系,要从这10000名学生中,再用分层抽样方法抽出200人作进一步调查,则总成绩在[400,500)内共抽出( )
A.100人
B.90人
C.65人
D.50人
7.济南交警部门随机测量了顺河高架桥南下口某一时间段经过的2000辆汽车的时速,时速频率分布直方图如图所示,则时速超过70km/h的汽车数量为_______
8.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:
根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是 ( )
(A)20 (B)30 (C)40 (D)50
9.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2500,3000)(元)月收入段应抽出人.
10.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图)。
由图中数据
可知a=。
若要从身高在[ 120 , 130),[130 ,140) , [140 , 150]三组内的学生中,用分层抽样的方法选取
18人参加一项活动,则从身高在[140 ,150]内的学生中选取的人数应为。
11.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则其抽样的100根中,有____根在棉花纤维的长度小于20mm 。
本类题的特征是:__________________________________________________________________________________ __________________________________________________________________________________________________ 本类题的做法是:__________________________________________________________________________________ __________________________________________________________________________________________________
答案
1.【解析】:产品净重小于100克的概率为(0.050+0.100)×2=0.300, 已知样本中产品净重小于100克的个数是36,设样本容量为n ,则300.036=n
,所以120=n ,净重大于或等于98克并且小于104克的产品的概率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.故选A.
2. A .【分析】:从频率分布直方图上可以看出0.9x =,35y =.
3.C 【解析】以50为样本容量可计算出超过3
15m 用水量的户数为()50.050.015015,⨯+⨯=所以可估算200户居民超过3
15m 用水量的户数60.
4. 38
5. 30
6.B
7.200
8.C
9.25 10.答案:0.030 3
11. [解析]考查频率分布直方图的知识。
100×(0.001+0.001+0.004)×5=30。