高考数学复习点拨 频率分布直方图典型例题析

合集下载

频数(率)分布直方图(详细解析+考点分析+名师点评)-1.doc

频数(率)分布直方图(详细解析+考点分析+名师点评)-1.doc

频数(率)分布直方图(详细解析+考点分析+名师点评)-1.doc答案与评分标准一、选择题(共20小题)1、夷昌中学开展“阳光体育活动”,九年级一班全体同学在2011年4月18日16时分别参加了巴山舞、乒乓球、篮球三个项目的活动,陈老师在此时统计了该班正在参加这三项活动的人数,并绘制了如图所示的频数分布直方图和扇形统计图.根据这两个统计图,可以知道此时该班正在参加乒乓球活动的人数是()A、50B、25C、15D、102、为了支援地震灾区同学,某校开展捐书活动,九(1)班40名同学积极参与.现将捐书数量绘制成频数分布直方图如图所示,则捐书数量在5.5~6.5组别的频率是()A、0.1B、0.2C、0.3D、0.4考点:频数(率)分布直方图。

分析:频率=,从直方图可知在5.5~6.5组别的频数是8,总数是40可求出解.解答:解:∵在5.5~6.5组别的频数是8,总数是40,∴=0.2.故选B.点评:本题考查频数分布直方图,从直方图上找出该组的频数,根据频率=,可求出解.3、某学校为了了解九年级体能情况,随机选取20名学生测试一分钟仰卧起坐次数,并绘制了如图的直方图,学生仰卧起坐次数在25~30之间的频率为()A、0.1B、0.17C、0.33D、0.4考点:频数(率)分布直方图。

专题:应用题;图表型。

分析:首先根据频数分布直方图可以知道仰卧起坐次数在25~30之间的频数,然后除以总次数(30)即可得到仰卧起坐次数在25~30之间的频率.解答:解:∵从频数率分布直方图可以知道仰卧起坐次数在25~30之间的频数为12,而仰卧起坐总次数为:3+10+12+5=30,∴学生仰卧起坐次数在25~30之间的频率为12÷30=0.4.故选D.点评:本题考查读频数分布直方图的能力和利用统计图获取信息的能力;利用统计图获取信息时,必须认真观察、分析、研究统计图,才能作出正确的判断和解决问题.4、学校为了解七年级学生参加课外兴趣小组活动情况,随机调查了40名学生,将结果绘制成了如图所示的频数分布直方图,则参加绘画兴趣小组的频率是()A、0.1B、0.15C、0.25D、0.3考点:频数(率)分布直方图。

高中数学复习概率统计题型归纳与讲解03 频率分布直方图

高中数学复习概率统计题型归纳与讲解03 频率分布直方图

高中数学复习概率统计题型归纳与讲解专题3频率分布直方图例1.要调查某地区高中学生身体素质,从高中生中抽取100人进行跳高测试,根据测试成绩制作频率分布直方图如图,现从成绩在[120,140)之间的学生中用分层抽样的方法抽取5人,应从[120,130)间抽取人数为b,则()A.a=0.2,b=2B.a=0.025,b=3C.a=0.3,b=4D.a=0.030,b=3【解析】解:由题得10×(0.005+0.035+a+0.020+0.010)=1,所以a=0.030.在[120,130)之间的学生人数为:100×10×0.030=30人,在[130,140)之间的学生人数为:100×10×0.020=20人,在[120,140)之间的学生人数为:100×(10×0.030+0.020)=50人,又用分层抽样的方法在[120,140)之间的学生50人中抽取5人,即抽取比例为:110,所以成绩在[120,130)之间的学生中抽取的人数应,30×110=3,即b=3,故选:D.例2.从某企业生产的某种产品中随机抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值分组[70,80) [80,90) [90,100) [100,110) 110,120)频数 14 20 36 18 12估计这种产品质量指标值的平均数为(同一组中的数据用该组区间的中点值作代表)( )A .100B .98.8C .96.6D .94.4【解析】解:平均数x →=0.14×75+0.20×85+0.36×95+0.18×105+0.12×115=94.4.故选:D .例3.“新冠肺炎”席卷全球,我国医务工作者为了打好这次疫情阻击战,充分发挥优势,很快抑制了病毒,据统计老年患者治愈率为71%,中年患者治愈率为85%,青年患者治愈率为91%.如果某医院有30名老年患者,40名中年患者,50名青年患者,则估计该医院的平均治愈率是( )A .86%B .83%C .90%D .84%【解析】解:利用求加权平均数的公式解得:30×71%+40×85%+50×91%30+40+50=0.84=84%,故选:D .例4.已知样本数据x 1,x 2,…,x n (n ∈N *)的平均数与方差分别是a 和b ,若y i =﹣2x i +3(i =1,2,…n ),且样本数据y 1,y 2,…,y n 的平均数与方差分别是b 和a ,则a ﹣b =( )A .1B .2C .3D .4【解析】解:由题意得:{−2a +3=b a =4b ,解得:{a =43b =13,故a ﹣b =1, 故选:A .例5.下面定义一个同学数学成绩优秀的标志为:“连续5次考试成绩均不低于120分”.现有甲、乙、丙三位同学连续5次数学考试成绩的记录数据(记录数据都是正整数):①甲同学:5个数据的中位数为127,众数为120;②乙同学:5个数据的中位数为125,总体均值为127;③丙同学:5个数据的中位数为135,总体均值为128,总体方差为19.8.则可以判定数学成绩优秀同学为( )A .甲、乙B .乙、丙C .甲、丙D .甲、乙、丙【解析】解:在①中,甲同学:5个数据的中位数为127,众数为120,所以前三个数为120,120,127,则后两个数肯定大于127,故甲同学数学成绩优秀,故①成立;在②中,5个数据的中位数为125,总体均值为127,可以找到很多反例,如:118,119,125,128,145,故乙同学数学成绩不优秀,故②不成立;在③中,5个数据的中位数为135,总体均值为128,总体方差为19.8设x 1<x 2<x 3<x 4,则丙的方差为15[(x 1﹣128)2+(x 2﹣128)2+(x 3﹣128)2+(x 4﹣128)2+(135﹣128)2]=19.8, ∴(x 1﹣128)2+(x 2﹣128)2+(x 3﹣128)2+(x 4﹣128)2=50,∴(x 1﹣128)2≤50,得|x 1﹣128|≤5,∴x 1≥128﹣5>120,∴丙同学数学成绩优秀,故③成立.∴数学成绩优秀有甲和丙2个同学.故选:C .例6.若数据x 1,x 2,…,x n 的平均数x =3,方差s 2=1,则数据2x 1+3,2x 2+3,…,2x n +3的平均数和方差分别为( )A.6,6B.9,2C.9,6D.9,4【解析】解:由题意若数据x1,x2,…,x n的平均数x=3,方差s2=1,可得x1+x2+…+x n=3n,则:2x1+3+x2+3+…+x n+3=2(x1+x2+…+x n)+3n=9n,所以数据2x1+3,2x2+3,…,2x n+3的平均数为9.又S2=1n[(x1﹣3)2+(x2﹣3)2+…+(x n﹣3)2]=1,所以[(x1﹣3)2+(x2﹣3)2+…+(x n﹣3)2]=n,所以1n [(2x1+3﹣9)2+(2x2+3﹣9)2+…+(2x n+3﹣9)2]=4n[(x1﹣3)2+(x2﹣3)2+…+(x n﹣3)2]=4,则数据2x1+3,2x2+3,…,2x n+3的平均数和方差分别为9,4.故选:D.例7.随着城镇化的不断发展,老旧小区的改造及管理已经引起了某市政府的高度重视,为了了解本市甲,乙两个物业公司管理的小区住户对其服务的满意程度,现从他们所服务的小区中随机选择了40个住户,根据住户对其服务的满意度评分,得到A区住户满意度评分的频率分布直方图和B 区住户满意度评分的频率分布表.B区住户满意度评分的频率分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数4610128(Ⅰ)在图2中作出B区住户满意度评分的频率分布直方图,并通过频率分布直方图计算两区住户满意度评分的平均值及分散程度(其中分散程度不要求计算出具体值,给出结论即可);(Ⅱ)根据住户满意度评分,将住户和满意度分为三个等级:满意度评分低于70分,评定为不满意;满意度评分在70分到89分之间,评定为满意;满意度评分不低于90分,评定为非常满意.试估计哪个地区住户的满意度等级为不满意的概率大?若是要选择一个物业公司来管理老旧小区的物业,从满意度角度考虑,应该选择哪一个物业公司?说明理由.【解析】解:(Ⅰ)作出如图所示的频率分布直方图,B区住户满意度评分的频率分布直方图如图所示A区住户满意度评分的平均值为45×0.1+55×0.2+65×0.3+75×0.2+85×0.15+95×0.05=67.5;B区住户满意度评分的平均值为55×0.1+65×0.15+75×0.25+85×0.3+95×0.2=78.5.通过比较两区住户满意度评分的频率分布直方图可以看出,B区住户满意度评分比较集中,而A 区住户满意度评分比较分散.(Ⅱ)记D表示事件:“A区住户的满意度等级为不满意”,记E表示事件:“B区住户的满意度等级为不满意”,则P(D)=(0.010+0.020+0.030)×10=0.6,P(E)=(0.010十0.015)×10=0.25,所以A区住户的满意度等级为不满意的概率较大.若是要选择一个物业公司来管理老旧小区的物业,从满意度等级为满意来考虑,应该选择乙物业公司来为小区服务,这样的话小区住户满意度会高一些.例8.某校在一次期末数学测试中,为统计学生的考试情况,从学校的2000名学生中随机抽取50名学生的考试成绩,被测学生成绩全部介于65分到145分之间(满分150分),将统计结果按如下方式分成八组:第一组[65,75),第二组[75,85),……第八组[135,145],如图是按上述分组方法得到的频率分布直方图的一部分.(1)求第七组的频率,并完成频率分布直方图;(2)用样本数据估计该校的2000名学生这次考试成绩的平均分(同一组中的数据用该组区间的中点值代表该组数据平均值);(3)若从样本成绩属于第六组和第八组的所有学生中随机抽取2名,求他们的分差的绝对值小于10分的概率.【解析】解:(1)由频率分布直方图得第七组的频率为:1﹣(0.004+0.012+0.016+0.030+0.020+0.006+0.004)×10=0.08.完成频率分布直方图如下:(2)用样本数据估计该校的2000名学生这次考试成绩的平均分为:70×0.004×10+80×0.012×10+90×0.016×10+100×0.030×10+110×0.020×10+120×0.006×10+130×0.008×10+140×0.004×10=102.(3)样本成绩属于第六组的有0.006×10×50=3人,样本成绩属于第八组的有0.004×10×50=2人,从样本成绩属于第六组和第八组的所有学生中随机抽取2名,基本事件总数n=C52=10,他们的分差的绝对值小于10分包含的基本事件个数m=C32+C22=4,∴他们的分差的绝对值小于10分的概率p=mn=410=25.例9.我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准x,用水量不超过x的部分按平价收费,超出x的部分按议价收费.下面是居民月均用水量的抽样频率分布直方图.①求直方图中a的值;②试估计该市居民月均用水量的众数、平均数;③设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;④如果希望85%的居民月均用水量不超过标准x ,那么标准x 定为多少比较合理?【解析】解:①由概率统计相关知识,各组频率之和的值为1,∵频率=(频率/组距)*组距,∴0.5×(0.08+0.16+0.4+0.52+0.12+0.08+0.04+2a )=1,解得:a =0.3,∴a 的值为0.3;②由频率分布直方图估计该市居民月均用水量的众数为2+2.52=2.25(吨),估计该市居民月均用水量的平均数为:0.5(0.25×0.08+0.75×0.16+1.25×0.3+1.75×0.4+2.25×0.52+2.75×0.3+3.25×0.12+3.75×0.08+4.25×0.04)=2.035(吨).③由图,不低于3吨人数所占百分比为0.5×(0.12+0.08+0.04)=12%,∴全市月均用水量不低于3吨的人数为:30×12%=3.6(万);④由频率分布直方图得月均用水量低于2.5吨的频率为:0.5×(0.08+0.16+0.3+0.4+0.52)=0.73<85%,月均用水量低于3吨的频率为:0.5×(0.08+0.16+0.3+0.4+0.52+0.3)=0.88>85%,∴x=2.5+0.5×0.85−0.730.3×0.5=2.9(吨).例10.如图是某校高三(1)班的一次数学知识竞赛成绩的基叶图(图中仅列出[50,60),[90,100)的数据)和频率分布直方图.(1)求全班人数以及频率分布直方图中的x,y;(2)估计学生竞赛成绩的平均数和中位数(保留两位小数).【解析】解:(1)分数在[50,60)的频率为0.020×10=0.2,由茎叶图知,分数在[50,60)之间的频数为5,所以全班人数为50.2=25(人);分数在[90,100)之间的频数为2,由225=10y,解得y=0.008;又10x=1﹣10×(0.036+0.024+0.020+0.008),解得x=0.012.(2)由频率分布直方图,计算平均数为x=55×0.2+65×0.24+75×0.36+85×0.12+95×0.08=71.4,由0.2+0.24+0.36=0.80,所以中位数在[70,80)内,设中位数为m,则0.20+0.24+(m﹣70)×0.036=0.5,解得m≈71.67,所以中位数约为71.67.例11.某高中数学建模兴趣小组的同学为了研究所在地区男高中生的身高与体重的关系,从若干个高中男学生中抽取了1000个样本,得到如下数据.数据一:身高在[170,180)(单位:cm)的体重频数统计体重(kg)[50,55)[55,60)[60,65)[65,70)[70,75)[75,80)[80,85)[85,90)人数206010010080201010数据二:身高所在的区间含样本的个数及部分数据身高x(cm)[140,150)[150,160)[160﹣170)[170﹣180)[180﹣190)平均体重y(kg)4553.66075(Ⅰ)依据数据一将下面男高中生身高在[170﹣180)(单位:cm)体重的频率分布直方图补充完整,并利用频率分布直方图估计身高在[170﹣180)(单位:cm)的中学生的平均体重;(保留小数点后一位)(Ⅱ)依据数据一、二,计算身高(取值为区间中点)和体重的相关系数约为0.99,能否用线性回归直线来刻画中学生身高与体重的相关关系,请说明理由;若能,求出该回归直线方程;(Ⅲ)说明残差平方和或相关指数R2与线性回归模型拟合效果之间关系.(只需写出结论,不需要计算)参考公式:b=∑ni=1(x i−x)(y i−y)∑n i=1(x i−x)2=∑ni=1x i y i−nx⋅y∑n i=1x i2−nx2,a=y−b x.参考数据:(1)145×45+155×53.6+165×60+185×75=38608;(2)1452+1552+1652+1752+1852﹣5×1652=1000.(3)663×175=116025,664×175=116200,665×175=116375.(4)728×165=120120.【解析】解:(1)身高在[170,180)的总人数为:20+60+100+100+80+20+10+10=400,体重在[55﹣60)的频率为:60400=0.15,体重在[70﹣75)的频率为:80400=0.2,平均体重为:52.5×0.05+57.5×0.15+62.5×0.25+67.5×0.25+72.5×0.2+77.5×0.05+82.5×0.025+87.5×0.025≈66.4,(2)因为r=0.99→1,线性相关很强,故可以用线性回归直线来刻画中学生身高与体重的相关,x=145+155+165+175+1855=165,y=45+75+60+53.6+66.45=60,b=∑8i=1x i y i−8x⋅y∑8i=1x i2−8x2=38608+175×66.4−5×165×601000=0.728,a=y−b x=60−0.728×165=−60.12,所以回归直线方程为:y=0.728x−60.12,(3)残差平方和越小或相关指数R2越接近于1,线性回归模型拟合效果越好.例12.市政府为了节约用水,调查了100位居民某年的月均用水量(单位:t),频数分布如下:分组[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]频数4815222514642(1)根据所给数据将频率分布直方图补充完整(不必说明理由);(2)根据频率分布直方图估计本市居民月均用水量的中位数;(3)根据频率分布直方图估计本市居民月均用水量的平均数(同一组数据由该组区间的中点值作为代表).【解析】解:(1)频率分布直方图如图所示:(2)∵0.04+0.08+0.15+0.22=0.49<0.5,∴中位数为2+0.5−0.490.25×0.5=2.02,(3)由频率分布直方图得平均数为:0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.02=2.02.例13.某地区100居民的人均用水量(单位:t)的分组的频数如下:[0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22;[2,2.5),25;[2.5,3),14;[3,3.5),6;[3.5,4),4;[4,4.5),2.(1)列出样本的频率分布表;(2)画出频率分布直方图,并根据直方图估计这组数据的众数;(坐标轴单位自定)(3)当地政府制订了人均月用水量为3t的标准,若超出标准加倍收费,当地政府解释说,85%以上的居民不超出这个标准,这个解释对吗?为什么?【解析】解:(1 )分组频数频率[0,0.5 )40.04[0.5,1 )80.08[1,1.5 )150.15[1.5,2 )220.22[2,2.5 )250.25[2.5,3 )140.14[3,3.5 )60.06[3.5,4 )40.04[4,4.5 )20.02(2):频率分布直方图如下图,由图知,这组数据的众数为2.25.(3)人均月用水量在3t以上的居民的比例为6%+4%+2%=12%,即大约是有12%的居民月均用水量在3t以上,88%的居民月均用水量在3t以下,因此,政府的解释是正确的.例14.某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60)…[90,100]后画出如下频率分布直方图.观察图形的信息,回答下列问题:(Ⅰ)估计这次考试的众数m与中位数n(结果保留一位小数);(Ⅱ)估计这次考试的及格率(60分及以上为及格)和平均分.【解析】解:(Ⅰ)众数是最高小矩形中点的横坐标,所以众数为m=75(分);(3分)前三个小矩形面积为0.01×10+0.015×10+0.015×10=0.4,∵中位数要平分直方图的面积,∴n=70+0.5−0.40.03=73.3(7分)(Ⅱ)依题意,60及以上的分数所在的第三、四、五、六组,频率和为(0.015+0.03+0.025+0.005)*10=0.75所以,抽样学生成绩的合格率是75% (11分)利用组中值估算抽样学生的平均分45•f1+55•f2+65•f3+75•f4+85•f5+95•f6=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71估计这次考试的平均分是71分.(14分)例15.为应对新冠疫情,重庆市于2020年1月24日启动重大突发公共卫生事件一级响应机制,要求市民少出门,少聚集,于是快递业务得到迅猛发展.为满足广大市民的日常生活所需,某快递公司以优厚的条件招聘派送员,现给出了两种日薪薪酬方案,甲方案:底薪100元,每派送一单奖励1元;乙方案:底薪150元,每日前55单没有奖励,超过55单的部分每单奖励10元.(Ⅰ)请分别求出这两种薪酬方案中日薪y(单位:元)与送货单数n的函数关系式;(Ⅱ)根据该公司所有派送员10天的派送记录,发现派送员的日平均派送单数与天数满足以下表格:日均派送单数5054565860频数(天)23221回答下列问题:①根据以上数据,设每名派送员的日薪为X(单位:元),试分别求出这10天中甲、乙两种方案的日薪X的平均数及方差;②结合①中的数据,根据统计学的思想,若你去应聘派送员,选择哪种薪酬方案比较合适,并说明你的理由.(参考数据:172=289,372=1369)【解析】解:(1)甲方案,y =100+n ;乙方案,y ={150,n ≤5510n −400,n >55.(2),①甲方案中,根据已知表格可计算出日平均派送单数为2×50+3×54+2×56+2×58+6010=55,方差为0.2×(50﹣55)2+0.3×(54﹣55)2+0.2×(56﹣55)2+0.2×(58﹣55)2+0.1×(60﹣55)2=9.8,所以,由(1)中变量之间的关系,可以指,甲方案的日薪X 的平均数为155,方差为9.8. 乙方案中,日薪X 的平均数为[5×150+160×2+180×2+200]×0.1=163,日薪方差为0.5×(150﹣163)2+0.2×(160﹣163)2+0.2×(180﹣163)2+0.1×(200﹣163)2=213.4.(3)若去应聘派送员,我会选择乙方案,从平均数的角度来看,乙方案的平均薪酬更高,同时更有激励作用.例16.2019年起,全国地级及以上城市全面启动生活垃圾分类工作,垃圾分类投放逐步成为居民的新时尚.为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收垃圾、有害垃圾和其他垃圾四类,并分别设置了相应的垃圾箱.为调查居民生活垃圾分类投放情况,现随机抽取了某市三类垃圾箱中总计1000吨生活垃圾,数据统计如下(单位:吨):“厨余垃圾”箱 “可回收垃圾”箱 “有害垃圾”箱“其他垃圾”箱厨余垃圾 300 70 30 80 可回收垃圾 30 210 30 30 有害垃圾 20 20 60 20 其他垃圾10201060(1)分别估计厨余垃圾和有害垃圾投放正确的概率;(2)假设厨余垃圾在“厨余垃圾”箱、“可回收垃圾”箱、“有害垃圾”箱、“其他垃圾”箱的投放量分别为a,b,c,d,其中a>0,a+b+c+d=800.当数据a,b,c,d的方差s2最大时,写出a,b,c,d的值(结论不要求证明),并求此时s2的值.【解析】解:(1)根据题意,厨余垃圾共300+70+30+80=480吨,其中投放正确的有300吨,则厨余垃圾投放正确的概率P1=300480=58,有害垃圾共20+20+60+20=120吨,其中投放正确的有60吨,则害垃圾投放正确的概率P2=60120=12;(2)根据题意,厨余垃圾在四种垃圾箱的投放量分别为a,b,c,d,其中a>0,a+b+c+d=800,则其平均数x=8004=200,则其方差S2=14[(a﹣200)2+(b﹣200)2+(c﹣200)2+(d﹣200)2],当a=600,b=c=d=0时,s2最大,而x=a+b+c+d4=200,此时s2=14[(600﹣200)2+(0﹣200)2+(0﹣200)2+(0﹣200)2]=120000例17.某市教育局为了解全市高中学生在素质教育过程中的幸福指数变化情况,对8名学生在高一,高二不同学习阶段的幸福指数进行了一次跟踪调研.结果如表:学生编号12345678高一阶段幸福指数9593969497989695学生编号12345678高二阶段幸福指数9497959695949396(1)根据统计表中的数据情况,分别计算出两组数据的平均值及方差;(2)请根据上述结果,就平均值和方差的角度分析,说明在高一,高二不同阶段的学生幸福指数状况,并发表自己观点.【解析】解:(1)8名学生在高一阶段的幸福指数的平均数为:x=18(95+93+96+94+97+98+96+95)=95.5,方差为:S12=18∑8i=1(x i−x1)2=2.25,8名学生在高二阶段的幸福指数的平均数为:y=18(94+97+95+96+95+94+93+96)=95,方差为:S22=18∑8i=1(y i−y)2=1.5;(2)①∵x>y,∴可以认为这8名学生在高一的平均幸福指数大于在高二的平均幸福指数,②∵S12>S22,∴可以认为这8名学生在高二的幸福指数的稳定性大于在高一的幸福指数的稳定性.例18.2020年1月,教育部《关于在部分高校开展基础学科招生改革试点工作的意见》印发,自2020年起,在部分高校开展基础学科招生改革试点(也称“强基计划”).强基计划聚焦高端芯片与软件、智能科技、新材料、先进制造和国家安全等关键领域以及国家人才紧缺的人文社会科学领域,选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生.新材料产业是重要的战略性新兴产业,如图是我国2011﹣2019年中国新材料产业市场规模及增长趋势图.其中柱状图表示新材料产业市场规模(单位:万亿元),折线图表示新材料产业市场规模年增长率(%).(1)求从2012年至2019年,每年新材料产业市场规模年增长量的平均数(精确到0.1);(2)从2015年至2019年中随机挑选两年,求两年中至少有一﹣年新材料产业市场规模年增长率超过20%的概率;(3)由图判断,从哪年开始连续三年的新材料产业市场规模的方差最大.(结论不要求证明)【解析】解:(1)从2012年起,每年新材料产业市场规模的年增加值依次为:0.3,0.2,0.3,0.5,0.6,0.4,0.8,0.6,(单位:万亿元),∴年增加的平均数为:0.3+0.2+0.3+0.5+0.6+0.4+0.8+0.68=0.5万亿元.(2)设A表示事件“从2015年至2019年中随机挑选两个,两年中至少有一年新材料产业市场规模增长率超过20%”,依题意P(A)=1−C22C52=910.(3)从2017年开始连续三年的新材料产业市场规模的方差最大.。

高考数学复习点拨 频率分布直方图典型例题析

高考数学复习点拨 频率分布直方图典型例题析

频率分布直方图典型例题析频率分布直方图是表达和分析数据的重要工具,还可以直观、准确地理解相应的有用的信息,所以成为新高考的重点,我们必须总结其重要题型及有关计算。

一、基本概念类例1、关于频率 分布直方图的下列说法中,正确的是( )(A )、直方图的高表示某数的频率;(B )、直方图的高表示该组上的个体在样本中出现的频率;(C )、直方图的高表示该组上的个体与组距的比值;(D )、直方图的高表示该组上的个体在样本中出现的频率与组距的比值;解析:在频率分布直方图中,每一个小矩形都是等宽的,即等于组距,其面积表示数据的取值落在相应区间上的频率,因此每一个小矩形的高表示该组上的个体在样本中出现的频率与组距的比值,所以选(D )。

二、识图计算类例2、为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这100名学生中体重在[56.5,64.5)的学生人数是 ( )(A)20 (B)30(C)40 (D )50解:本题主要考查频率分布直方图和总体分布的估计等知识,同时考查图形的识别能力。

由频率直方图可知组距为2,故学生中体重在[56.5,64.5)的频率为:(0.03+0.05+0.05+0.07)×2=0.4,所以100名学生中体重在[56.5,64.5)的学生人数有: 0. 4×100=40人。

故选择C 点评:在频率分布直方图中,每一个小矩形都是等宽的,即等于组距,高是,所以有:×组距=频率;即可把所求范围内的频率求出,进而求该范围的人数。

例3:某校高一某班共有64名学生,下图是该班某次数学考试成绩的频率分布直方图,根据该图可知,成绩在110120间的同学大约有( )A 、 10B 、11C 、13D 、16解析:通过直方图可知:成绩在110120的频率是:2.023.015.01.005.01=----,所以成绩在110120之间的同学大约有:64×0.2=12.813≈人。

第63讲根据频率分布直方图求中位数众数和平均数 高中数学常见题型解法归纳反馈训练(含答案)

第63讲根据频率分布直方图求中位数众数和平均数 高中数学常见题型解法归纳反馈训练(含答案)

【知识要点】一、用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计总体的数字特征),需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本容量越大,估计的结果也就越精确,分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.二、频率分布是指一个样本数据在各个小范围内所占比例的大小.一般是用频率分布直方图反映样本频率分布.三、样本的数字特征众数:就是数据中出现次数最多的那个,比其他的都多,如果几个数据出现的次数都是最多,则它们都是众数;每个数据都只有一次,那么数据没有众数.所以众数可以不止一个或者没有.中位数:就是这些数据排列好了以后中间的那个数字,那么如果有偶数个数据,那么就是中间两个数字的平均数,如果有奇数个数据,则中间那个就是数据的中位数.所以数据的中位数不一定在数据中.平均数:这个就是把所有数据相加,除以个数,就是数据的平均数. nx n++(n x x ++-2)(n x x x n++-四、茎叶图茎叶图又称“枝叶图”,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少.当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出的叶子,因此通常把这样的图叫做茎叶图.【方法讲评】【例1】对某小区100户居民的月均用水量进行统计,得到样本的频率分布直方图如图,则估计此样本的众数、中位数分别为()A. 2.25,2.5 B.2.25,2.02 C.2,2.5 D.2.5,2.25【点评】(1)求频率分布图中的众数,一般先计算出频率分布直方图中的每个小矩形的面积,找到面积最大的那个矩形,取该矩形的横边中点对应的数为众数.(2)求众数也可以直接找最高矩形的横边的中点.【反馈检测1】某学校900名学生在一次百米测试中,成绩全部介于13秒与18秒之间,抽取其中50个样本,将测试结果按如下方式分成五组:第一组[13,14],第二组[14,15),…,第五组[17,18],如图是按上述分组方法得到的频率分布直方图.(1)若成绩小于14秒认为优秀,求该样本在这次百米测试中成绩优秀的人数;(2)请估计学校900名学生中,成绩属于第四组的人数;(3)请根据频率分布直方图,求样本数据的众数和中位数.【例2】高二某班50名学生在一次百米测试中,成绩全部都介于13秒到18秒之间,将测试结果按如下方式分成五组,第一组[13,14),第二组[14,15)…第五组[17,18],如图是按上述分组方法得到的频率分布直方图.(1)若成绩大于等于14秒且小于16秒规定为良好,求该班在这次百米测试中成绩为良好的人数. (2)请根据频率分布直方图,估计样本数据的众数和中位数(精确到0.01).(3)设n m ,表示该班两个学生的百米测试成绩,已知[)[]18,1714,13, ∈n m ,.6个基本事件组成.【点评】求频率分布直方图中的中位数,一般先计算出每个小矩形的面积,通过解方程找到左边面积为0.5的点P ,点P 对应的数就是中位数.【反馈检测2】某公路段在某一时刻内监测到的车速频率分布直方图如图所示. (Ⅰ)求纵坐标中参数h 的值及第三个小长方形的面积; (Ⅱ)求车速的众数1v ,中位数2v 的估计值;1122n n xx p x p x p 计算.的中点对应的数,n p 代表第n 个矩形的面积【例3】某校从参加考试的学生中抽出60名学生,将其成绩(均为整数)分成六组[40,50),[50,60)...[90,100]后画出如下部分频率分布直方图.观察图形的信息,回答下列问题: (Ⅰ)求成绩落在[70,80)上的频率,并补全这个频率分布直方图; (Ⅱ) 估计这次考试的及格率(60分及以上为及格)和平均分;(Ⅲ) 从成绩是70分以上(包括70分)的学生中选两人,求他们在同一分数段的概率.【解析】(Ⅰ)成绩落在[70,80)上的频率是0.3,频率分布直方图如下图.(Ⅲ) 成绩是70分以上(包括70分)的学生人数为(0.03+0.025+0.005)×10×60=36 所以所求的概率为【点评】求频率分布直方图中的平均数,1122n n x x p x p x p 计算.其中nx 代表第n 个矩形的横边的中点对应的数,n p 代表第n 个矩形的面积.【反馈检测3】某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100]. (1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[50,90)之外的人数.高中数学常见题型解法归纳及反馈检测第63讲: 根据频率分布直方图求中位数众数和平均数参考答案【反馈检测1答案】(1)3;(2)288;(3)15.5,15.74.【反馈检测2答案】(1)0.01h =,第三个小长方形的面积为65;(2)1265,62.5v v ==;(3【反馈检测2详细解析】(Ⅰ)∵所有小长形面积之和为1,∴10h +10×3h +10×4h +10×2h =1, 解得h =0.01, ∴第三个小长方形的面积为:10×4h =10×0.04=0.4. (Ⅱ)车速的众数1v =,车速的中位数是两边直方图的面积相等, 于是得:10×0.01+10×0.03+(2v ﹣60)×0.04=0.5,解得2v =62.5.×10×45+0.03×10×55+0.04×10×65+0.02×10×75=62. 【反馈检测3答案】(1)005.0=a ;(2)73;(3)10.【反馈检测3详细解析】(1)依题意得,()104.003.002.0210=+++a ,解得005.0=a(2)这100名学生语文成绩的平均分为:()分7305.0952.0853.0754.06505.055=⨯+⨯+⨯+⨯+⨯ (3)数学成绩在[50,60)的人数为:100×0.05=5数学成绩在[60,70[70,80数学成绩在[80,90所以数学成绩在[50,90)之外的人数为:102540205100=----。

高考数学统计与概率大题解题模板

高考数学统计与概率大题解题模板

统计与概率大题解题模板 一、随机抽样和用样本估计总体模板一、频率分布直方图1、频率分布直方图的性质:(1)小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小; (2)在频率分布直方图中,各小矩形的面积之和等于1; (3)频数/相应的频率=样本容量.2、频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.3、频率分布直方图中的纵坐标为频率组距,而不是频率值.例1-1.某城市100户居民月平均用电量(单位:度),以[160180),、[180200),、[200220),、[220240),、[240260),、[260280),、]280[300,分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220240),、[240260),、[260280),、]280[300,的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220240),的用户中应抽取多少户? 【解析】(1)由(0.0020.00950.0110.01250.0050.0025)201x ++++++⨯=得:0.0075x =,∴直方图中x 的值是0.0075;(2)月平均用电量的众数是2202402302+=,∵(0.0020.00950.011)200.450.5++⨯=<,∴月平均用电量的中位数在[220240),内,设中位数为a , 由(0.0020.00950.011)200.0125(220)0.5a ++⨯+⨯-=得:224a =, ∴月平均用电量的中位数是224;(3)月平均用电量为[220240),的用户有0.01252010025⨯⨯=户, 月平均用电量为[240260),的用户有0.00752010015⨯⨯=户, 月平均用电量为[260280),的用户有0.0052010010⨯⨯=户, 月平均用电量为]280[300,的用户有0.0025201005⨯⨯=户, 抽取比例11125151055==+++,∴月平均用电量在[220,240)的用户中应抽取12555⨯=户.模板二、茎叶图1、绘制茎叶图的关键是分清茎和叶,如数据是两位数,十位数字为“茎”,个位数字为“叶”;如果是小数时,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶.2、利用茎叶图进行数据分析时,一般从数据分布的对称性、中位数、稳定性等几个方面来考虑. 例1-2.某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下: 甲:95、81、75、91、86、89、71、65、76、88、94、110、107; 乙:83、86、93、99、88、103、98、114、98、79、78、106、101. 画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较. 【解析】甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图上可以看出,乙同学的得分情况是大致对称的, 中位数是98;甲同学的得分情况,也大致对称,中位数是88, 乙同学的成绩比较稳定,总体情况比甲同学好.模板三、散点图1、两个变量的关系2、散点图:将样本中n 个数据点()i i x y ,(1i =,2,…,n )描在平面直角坐标系中得到的图形.3、正相关与负相关:(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关. 4、最小二乘法:设x 、y 的一组观察值为()i i x y ,(1i =,2,…,n ),且回归直线方程为ˆˆˆybx a =+.当x 取值i x (1i =,2,…,n )时,y 的观察值为i y ,差ˆi i y y -(1i =,2,…,n )刻画了实际观察值i y 与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即21()ni i i Q y a bx ==--∑作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q 取最小值的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法. 5、回归直线方程的系数计算公式例1-3.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:(1)y 与x 是否具有线性相关关系?(2)如果y 与x 具有线性相关关系,求y 关于x 的回归直线方程. 审题路线图:→→→【解析】(1)画散点图如下:由图可知y 与x 具有线性相关关系;(2)列表、计算:1102211055950105591.70.66838500105520ˆ1iii ii x y x ybxx ==⋅-⋅⋅-⨯⨯==≈-⨯-⋅∑∑,91.70.668ˆ55.6ˆ549ay bx =-=-⨯=,即所求的回归直线方程为:0.66859ˆ 4.6y x =+.构建答题模板:第一步:列表i x 、i y 、i i x y ;第二步:计算x ,y ,21ni i x =∑,1ni i i x y =∑;第三步:代入公式计算ˆb 、ˆa 的值; 第四步:写出回归直线方程;第五步:反复回顾,查看是否有重复或遗漏情况,明确规范书写答题.模板四、古典概型例1-4.袋中有五张卡片,其中红色卡片三张,标号为1、2、3;蓝色卡片两张,标号为1、2. (1)从以上五张卡片中任取两张,求这两张卡片颜色不同且标号之和小于4的概率;(2)向袋中再放入一张标号为0的绿色卡片,从这六张卡片中任取两张,求这两张卡片颜色不同且标点之和小于4的概率.审题路线图:确定概率模型→列出所有取卡片的结果(基本事件)→构成事件的基本事件→求概率. 规范解答:【解析】(1)标号为1、2、3的三张红色卡片分别记为A 、B 、C , 标号为1、2的两张蓝色卡片分别记为D 、E , 从五张卡片中任取两张的所有可能的结果为:AB 、AC 、AD 、AE 、BC 、BD 、BE 、CD 、CE 、DE 共10种,由于每一张卡片被取到的机会均等,因此这些基本事件的出现是等可能的, 从五张卡片中任取两张,这两张卡片颜色不同且它们的标号之和小于4的结果为:AD 、AE 、BD ,共3种,∴这两张卡片颜色不同且它们的标号之和小于4的概率为310;(2)记F 是标号为0的绿色卡片,从六张卡中任取两张的所有可能的结果为:AB 、AC 、AD 、AE 、AF 、BC 、BD 、BE 、BF 、CD 、CE 、CF 、DE 、DF 、EF 共15种,用于每一张卡片被取到的机会均等,因此这些基本事件的出现是等可能的, 从六张卡片中任取两张,这两张卡片颜色不同且它们的标号之和小于4的结果为:AD 、AE 、BD 、AF 、BF 、CF 、DF 、EF ,共8种, ∴这两张卡片颜色不同且它们的标号之和小于4的概率为815. 构建答题模板:第一步:列出所有基本事件,计算基本事件总数;第二步:将所求事件分解为若干个互斥的事件或转化为其对立事件(也许不用分解,但分解必要注意互斥);第三步:分别计算每个互斥事件的概率;第四步:利用概率的加法公式求出问题事件的概率;第五步:反复回顾,查看是否有重复或遗漏情况,明确规范书写答题.二、概率与统计之超几何分布与二项分布离散型随机变量的分布列、数学期望与方差1、关于离散型随机变量分布列的计算方法如下: (1)写出ξ的所有可能取值;(2)用随机事件概率的计算方法,求出ξ取各个值的概率; (3)利用(1)、(2)的结果写出ξ的分布列. 2、常见的特殊离散型随机变量的分布列:(1)两点分布,分布列为(0p -、1q -),其中01p <<,且1p q +=;(2)二项分布,分布列为(00p 、11p 、22p 、…、k kp 、…、n np ),其中k k n kk n p C p q -=,0k =、1、2、…、n ,且01p <<,1p q +=,k k n k k n p C p q -=可记为(,,)b k n p .3、对离散型随机变量的期望应注意:(1)期望是算术平均值概念的推广,是概念意义下的平均;(2)()E ξ是一个实数,由ξ的分布列唯一确定,即作为随机变量ξ是可变的,可取不同值,而()E ξ是不变的,它描述ξ取值的平均状态;(3)()1122n n E x p x p x p ξ=++⋅⋅⋅++⋅⋅⋅直接给出了E ξ的求法,即随机变量取值与相应概率值分别相乘后相加.4、对离散型随机变量的方差应注意:(1)()D ξ表示随机变量ξ对()E ξ的平均偏离程度,()D ξ越大表明平均偏离程度越大,说明ξ的取值越分散;反之()D ξ越小,ξ的取值越集中,在()E ξ来描述ξ的分散程度.(2)()D ξ与()E ξ一样也是一个实数,由ξ的分布列唯一确定.模板一、超几何分布——离散型随机变量的分布列、期望与方差(1)超几何分布的特征:①在小范围内不放回的随机抽取;②每次抽取相互影响;③每次抽取的可能性一直变化;(2)超几何分布的题型:在含有M 件次品的N 件产品中任取n 件(n M N ≤≤),其中恰有X 件次品;(3)超几何分布的分布列、期望与方差:①分布列:()k n k M N MnNC C P X k C --⋅==,012k n =⋅⋅⋅,,,,,k ∈N ;②期望:0()[()]nk nME X k P X k N ===⋅=∑; ③{}22()()()[()]()(1)nk nM N M N n D X k E x P X k N N =--==-⋅=-∑. 例2-1.已知一个袋中装有3个白球和3个红球,这些球除颜色外完全相同.(1)每次从袋中取一个球,取出后不放回,直到取到一个红球为止,求取球次数ξ的分布列和数学期望()E ξ;(2)每次从袋中取一个球,取出后放回接着再取一个球,这样取3次,求取出红球次数η的分布列、数学期望和方差()D η.审题路线图:取到红球为止→取球次数的所有可能1、2、3、4→求对应次数的概率→列分布列→求()E ξ.取出后放回,这是条件→每次取到红球的概率相同→三次独立重复试验→利用公式. 规范解答:【解析】(1)ξ的可能取值为1、2、3、4,31(1)62P ξ===,333(2)6510P ξ==⨯=, 3233(3)65420P ξ==⨯⨯=,32131(4)654320P ξ==⨯⨯⨯=,故ξ的分布列为:17()123421020204E ξ=⨯+⨯+⨯+⨯=;(2)取出后放回,取球3次,可看作3次独立重复试验,∴1~(2)2B η,,η的可能取值为0、1、2、3,0033111(0)()()228P C η==⋅⋅=,1123113(1)()()228P C η==⋅⋅=,2213113(2)()()228P C η==⋅⋅=,3303111(4)()()228P C η==⋅⋅=,故ξ的分布列为:∴()322E η=⨯=,113()3224D η=⨯⨯=. 构建答题模板:第一步:确定离散型随机变量的所有可能性; 第二步:求出每个可能性的概率; 第三步:画出随机变量的分布列; 第四步:求期望和方差;第五步:反复回顾,查看是否有重复或遗漏情况,明确规范书写答题.如本题可重点查看随机变量的所有可能值是否正确;根据分布列性质检查概率是否正确.模板二、二项分布及其应用(1)二项分布的特征:①在小范围内有放回的随机抽取或在大范围内任意随机抽取;②每次抽取相互独立;③每次抽取的可能性保持不变;(2)二项分布的题型:在n 次独立重复试验中,设事件A 发生的次数为X ,在每次试验中事件A 发生的概率为p ;(3)二项分布的分布列、期望与方差:①分布列:~(,)X B n p ,n 为试验次数,p 为试验成功率,()(1)k kn k n P X k C p p -==-,0,1,2,,k n =⋅⋅⋅,k ∈N ;②期望:()E X np =; ③()(1)D X np p =-.例2-2.某联欢晚会举行抽奖活动,举办方设置了甲、乙两种抽奖方案,方案甲的中奖率为23,中奖可以获得2分;方案乙的中奖率为25,中奖可以获得3分;未中奖则不得分.每人有且只有一次抽奖机会,每次抽奖中奖与否互不影响,晚会结束后凭分数兑换奖品.(1)若小明选择方案甲抽奖,小红选择方案乙抽奖,记他们的累计得分为X ,求3≤X 的概率; (2)若小明、小红两人都选择方案甲或都选择方案乙进行抽奖,问:他们选择何种方案抽奖,累计得分的数学期望较大?【解析】(1)由已知得,小明中奖的概率为23,小红中奖的概率为25,且两人中奖与否互不影响,记“这2人的累计得分3≤X ”的事件为A ,则事件A 的对立事件为“5X =”, ∵224(5)3515P X ==⨯=,∴11()1(5)15P A P X =-==, 即这两人的累计得分3≤X 的概率为1115; (2)设小明小红都选择方案甲抽奖中奖次数为1X ,都选择方案乙抽奖中奖次数为2X ,则这两人选择方案甲抽奖累计得分的数学期望为1()2E X ⨯, 选择方案乙抽奖累计得分的数学期望为2()3E X ⨯,由已知可得12~(2)3X B ,,22~(2)5X B ,,∴124()233E X =⨯=,224()255E X =⨯=,从而18()23E X ⨯=,212()35E X ⨯=,∴12()2()3E X E X ⨯>⨯,∴他们都选择方案甲进行抽奖时,累计得分的数学期望较大.模板三、统计概率的综合应用例2-3.某食品厂为了检查一条自动包装流水线的生产情况,随即抽取该流水线上40件产品作为样本算出他们的重量(单位:克)重量的分组区间为,(495500],,…,(510515],,由此得到样本的频率分布直方图,如图所示.(1)根据频率分布直方图,求重量超过505克的产品数量.(2)在上述抽取的40件产品中任取2件,设X 为重量超过505克的产品数量,求X 的分布列及期望.(3)在上述抽取的40件产品中任取5件产品,求恰有2件产品的重量超过505克的概率. 【解析】(1)重量超过505克的产品数量是40(0.0550.015)12⨯⨯+⨯=件; (2)X 的所有可能取值为0、1、2,021********(0)130C C P X C ⋅===,11122824056(1)130C C P X C ⋅===,20122824011(2)130C C P X C ⋅===, X 的分布列为:X 的期望561139()01213013013065E X =⨯+⨯+⨯=; (3)设在上述抽取的40件产品中任取5件产品,恰有2件产品的重量超过505克为事件A ,则322812540231()703C C P A C ⋅==. 变式1:第三问改为:从流水线上任取5件产品,设Y 为重量超过505克的产品数量,求Y 的分布列、期望、方差.【解析】从流水线上任取5件产品服从二项分布:Y 可取:0、1、2、3、4、5;超过505克的产品发生的概率为0.3p =,则~(50.3)Y B ,, 005055(0)(1)0.70.16807P Y C p p -==-==, 115111455(1)(1)0.30.70.36015P Y C p p C -==-=⨯=,225222355(2)(1)0.30.70.3087P Y C p p C -==-=⨯=,335333255(3)(1)0.30.70.1323P Y C p p C -==-=⨯=,44544455(4)(1)0.30.70.02835P Y C p p C -==-=⨯=,555555(5)(1)0.30.00243P Y C p p -==-==,则Y 的分布列为:Y 的期望()50.3 1.5E Y =⨯=,方差()50.30.7 1.05D Y =⨯⨯=.变式2:某食品厂为了检查甲乙两条自动包装流水线的生产情况,随即在这两条抽流水线上各抽取40件产品作为样本算出他们的重量(单位:克).重量落在(495510],的产品为合格品,否则为不合格.表一为甲流水线样本频率分布表,图一为乙流水线样本的频率分布直方图.(1)根据上表数据在答题卡上作出甲流水线样本的频率分布直方图;(2)若以频率作为概率,试估计从乙流水线上任取5件产品,恰有3件产品为合格品的概率;(3)由以上统计数据完成下面22⨯列联表,并回答有多大的把握认为“产品的包装质量与两条自动包装流水线的选择有关”.附:下面的临界值表供参考:(参考公式:22()()()()()n ad bcKa b a c c d b d-=++++,其中n a b c d=+++).在平面直角坐标系中做出频率分布直方图,甲流水线样本的频率分布直方图如下:(2)由图1知,乙样本中合格品为:(0.060.090.03)54036++⨯⨯=,故合格品的频率为360.940=, ∴可估计从乙流水线上任取一件产品该产品为合格品的概率0.9P =,设ξ为从乙流水线上任取5件产品中的合格品数,则~(50.9)B ξ,, ∴3325(3)0.90.10.0729P C ξ===,即从乙流水线上任取5件产品,恰有3件产品为合格品的概率为0.0729; (3)22⨯列联表如下:∵22()80(120360) 3.117 2.706()()()()66144040n ad bc K a b a c c d b d -⨯-==≈>++++⨯⨯⨯, ∴有90%的把握认为“产品的包装质量与两条自动包装流水线的选择有关”.课后作业1. 某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.)(1)根据茎叶图,帮助这位学生说明其亲属30人的饮食习惯;(2)根据以上数据完成下列22⨯列联表:(3)能否有99%的把握认为其亲属的饮食习惯与年龄有关,并写出简要分析.【答案】(1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主;(2)表格见解析;(3)有,分析见解析.【解析】【分析】(1)根据茎叶图,分析题中数据即可得出结果.(2)根据茎叶图,补充完善列联表,计算观测值即可求解.【详解】(1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主;(2)补全22⨯列联表:(3)230(42168)10 6.63512182010K ⨯⨯-⨯==>⨯⨯⨯,有99%的把握认为其亲属的饮食习惯与年龄有关.2. 某网站就“民众是否支持加大修建城市地下排水设施的资金投入”进行投票.按照北京暴雨前后两个时间收集有效投票,暴雨后的投票收集了50份,暴雨前的投票也收集了50份,所得统计结果如下表:已知工作人员从所有投票中任取一个,取到“不支持投入”的投票的概率为25. (1)求列联表中的数据x 、y 、A 、B 的值;(2)绘制条形统计图,通过图形判断本次暴雨是否影响到民众对加大修建城市地下排水设施的投入的态度?(3)能够有多大把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关? 【答案】(1)40x =,10y =,60A =,40B =;(2)条形统计图答案见解析,暴雨影响到民众对加大修建城市地下排水设施的投入的态度;(3)有99.9%把握.【解析】【分析】(1)先求出y的值,再求,,B x A的值;(2)先求出暴雨前后的支持率和不支持率,画出条形统计图,再通过图形判断本次暴雨是否影响到民众对加大修建城市地下排水设施的投入的态度.(3)利用独立性检验求解即可.【详解】(1)设“从所有投票中抽取一个,取到不支持投入的投票”为事件A,由已知得302()1005yP A+==,∴10y=,40B=,40x=,60A=;(2)由(1)知北京暴雨后支持为404505=,不支持率为41155-=,北京暴雨前支持率为202505=,不支持率为23155-=,条形统计图如图:由图可以看出暴雨影响到民众对加大修建城市地下排水设施的投入的态度;(3)22100(30402010)5016.7810.828505040603K⨯⨯-⨯==≈>⨯⨯⨯,故至少有99.9%把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关.【点睛】方法点睛:独立性检验的解题步骤:(1)2*2列联表;(2)提出假设:设p与q没有关系;(3)根据列联表中的数据2K计算的值;(4)根据计算得到的随机变量2K的观测值作出判断.3. 电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的22⨯列联表,并据此资料判断是否有95%的把握认为“体育迷”与性别有关?(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:22()()()()()n ad bcKa b a c c d b d-=++++【答案】(1)列联表答案见解析,没有95%的把握认为“体育迷”与性别有关;(2)7 10 .【解析】 【分析】(1)根据频率分布直方图,计算体育迷的人数,再结合条件依次填入22⨯列联表,并计算2K ,并和临界值3.841比较后进行判断;(2)首先由频率分布直方图计算“超级体育迷”的人数,在通过编号列举的方法,利用古典概型的计算公式计算概率.【详解】(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而完成22⨯列联表如下:将22⨯列联表中的数据代入公式计算,得22100(30104515)100 3.030 3.8417525455533K ⨯⨯-⨯==≈<⨯⨯⨯,∴没有95%的把握认为“体育迷”与性别有关;(2)由频率分布直方图可知“超级体育迷”为5人,设123,,a a a 是3名男超级体育迷,12,b b 是2名女超级体育迷,从而一切可能结果所组成基本事件为:12()a a ,、13()a a ,、23()a a ,、11()a b ,、12()a b ,、 21()a b ,、22()a b ,、31()a b ,、32()a b ,、12()b b ,,则由10个基本事件组成,而且这些基本事件的出现是等可能的, 用A 表示“任选2人中,至少有1人是女性”这一事件,则A 由11()a b ,、12()a b ,、21()a b ,、22()a b ,、31()a b ,、32()a b ,、12()b b , 这7个基本事件组成,因而7()10P A =.4. 2015年7月9日21时15分,台风“莲花”在我国广东省陆丰市甲东镇沿海登陆,给当地人民造成了巨大的财产损失,适逢暑假,大学生小张调查了当地某小区的100户居民由于台风造成的经济损失,将收集的数据分成[02000),、[2000,4000)、[4000,6000)、[6000,8000)、[800010000],五组作出频率分布直方图,如图:(1)台风后居委会号召小区居民为台风重灾区捐款,小张调查的100户居民捐款情况如表格,在表格空白处填写正确数字,并说明是否有95%以上的把握认为捐款数额多于或少于500元和自身经济损失是否到4000元有关?(2)将上述调查所得到的频率视为概率.现在从该地区大量受灾居民中,采用随机抽样方法每次抽取1户居民,抽取3次,记被抽取的3户居民中自身经济损失超过4000元的人数为ξ.若每次抽取的结果是相互独立的,求ξ的分布列,期望()E ξ和方差()D ξ.【答案】(1)答案见解析,有;(2)分布列见解析,()0.9E ξ=,()0.63D ξ=. 【解析】【分析】(1)由频率分布直方图可求出抽取的100户中,经济损失不超过4000元的户数,经济损失超过4000元的户数, 从而可补全列联表,进而可求出2K ,得出结论;(2)由题意知ξ的取值可能有0、1、2、3,符合二项分布,则3~(3)10B ξ,,从而利用二项分布的概率公式求出各自对应的概率,进而可得ξ的分布列,期望()E ξ和方差()D ξ. 【详解】(1)由频率分布直方图可知,在抽取的100户中,经济损失不超过4000元的有1002000(0.000150.00020)70⨯⨯+=户,则经济损失超过4000元的有30户, 则表格数据如下:22100(60102010) 4.76280207030K ⨯⨯-⨯=≈⨯⨯⨯,∵4.762 3.841>,2( 3.841)0.05P K ≥=,∴有95%以上把握认为捐款数额是否多于或少于500元和自身经济损失是否到4000元有关; (2)由频率分布直方图可知抽到自身经济损失超过4000元居民的频率为0.3,将频率视为概率,由题意知ξ的取值可能有0、1、2、3,符合二项分布,则3~(3)10B ξ,,003337343(0)()()10101000P C ξ==⋅⋅=,112337441(1)()()10101000P C ξ==⋅⋅=,221337189(2)()()10101000P C ξ==⋅⋅=,33033727(3)()()10101000P C ξ==⋅⋅=,从而ξ的分布列为:3()30.910E np ξ==⨯=,37()(1)30.631010D np p ξ=-=⨯⨯=. 5. 私家车的尾气排放是造成雾霾天气的重要因素之一,因此在生活中我们应该提倡低碳生活,少开私家车,尽量选择绿色出行方式,为预防雾霾出一份力.为此,很多城市实施了机动车车尾号限行,我市某报社为了解市区公众对“车辆限行”的态度,随机抽查了50人,将调查情况进行整理后制成下表:(1)完成被调查人员的频率分布直方图.(2)若从年龄在[15,25)([25,35)的被调查者中各随机选取2人进行追踪调查,求恰有2人不赞成的概率.(3)在(2)在条件下,再记选中的4人中不赞成...“车辆限行”的人数为ξ,求随机变量ξ的分布列和数学期望.【答案】(1)见解析(2(2275(3)见解析 【解析】【详解】试题分析:(1)根据频率等于频数除以总数,再求频率与组距之比得纵坐标,画出对应频率分布直方图.(2)先根据2人分布分类,再对应利用组合求概率,最后根据概率加法求概率,(3)先确定随机变量,再根据组合求对应概率,列表可得分布列,最后根据数学期望公式求期望. 试题解析:(1((2(由表知年龄在[)15,25内的有5人,不赞成的有1人,年龄在[)25,35 内的有10人,不赞成的有4人,恰有2人不赞成的概率为:()11122464442222510510C C C C C 4246666222C C C C 1025104522575P ξ==⋅+⋅=⋅+⋅==((3( ξ的所有可能取值为:0(1(2(3(()226422510C C 45150C C 22575P ξ==⋅==(()21112646442222510510C C C C C 415624102341C C C C 1045104522575P ξ⋅==⋅+⋅=⋅+⋅==( ()124422510C C 461243C C 104522575P ξ==⋅=⋅==( 所以ξ的分布列是:所以ξ的数学期望5E ξ=( 6. 某商场举行的“三色球”购物摸奖活动规定:在一次摸奖中,摸奖者先从装有3个红球与4个白球的袋中任意摸出3个球,再从装有1个蓝球与2个白球的袋中任意摸出1个球,根据摸出4个球中红球与蓝球的个数,设一、二、三等奖如下:其余情况无奖且每次摸奖最多只能获得一个奖级.(1)求一次摸奖恰好摸到1个红球的概率;(2)求摸奖者在一次摸奖中获奖金额x的分布列与期望E(x).【答案】(1)(2)X的分布列为EX==4元【解析】【详解】(1)设A i表示摸到i个红球,B i表示摸到i个蓝球,则与相互独立(i=0,1,2,3)∴P(A1)==(2)X的所有可能取值为0,10,50,200P(X=200)=P(A3B1)=P(A3)P(B1)=P(X=50)=P(A3)P(B0)==P(X=10)=P(A2)P(B1)==P(X=0)=1﹣=∴X的分布列为EX==4元7. 以下茎叶图记录了甲、乙两组个四名同学的植树棵树、乙组记录中有一个数据模糊,无法确认,在图中以X表示.(1)如果8X=,求乙组同学植树棵树的平均数和方差;(2)如果9X=,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵树Y的分布列和数学期望.【答案】(1)平均数为354,方差为1116;(2)分布列答案见解析,数学期望:19.【解析】【分析】(1)利用平均数和方差公式求出即可;(2)根据题意可得Y 的可能取值为17,18,19,20,21,分别求出Y 取不同值的概率,即可得出分布列,求出期望.【详解】(1)当8X =时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10, ∴平均数为889103544x +++==,方差为2222213535353511[(8)(8)(9)(10)]4444416s =-+-+-+-=;(2)当9X =时,由茎叶图可知,甲组同学的植树棵树是:9,9,11,11, 乙组同学的植树棵数是:9,8,9,10,分别从甲、乙两组中随机选取一名同学,共有4416⨯=种可能的结果, 这两名同学植树总棵数Y 的可能取值为17,18,19,20,21,事件“17Y =”等价于“甲组选出的同学植树9棵,乙组选出的同学植树8棵”, ∴该事件有2种可能的结果,21(17)168P Y ===, 事件“18Y =”等价于“甲组选出的同学植树9棵,乙组选出的同学植树9棵”, ∴该事件有4种可能的结果,41(18)164P Y ===, 事件“19Y =”等价于“甲组选出的同学植树9棵,乙组选出的同学植树10棵, 或甲组选出的同学植树11棵,乙组选出的同学植树8棵”, ∴该事件有224+=种可能的结果,41(19)164P Y ===, 事件“20Y =”等价于“甲组选出的同学植树11棵,乙组选出的同学植树9棵”, ∴该事件有4种可能的结果,41(20)164P Y ===, 事件“21Y =”等价于“甲组选出的同学植树11棵,乙组选出的同学植树10棵”, ∴该事件有2种可能的结果,21(21)168P Y ===,∴随机变量Y 的分布列为:∴11()17181920211984448E Y =⨯+⨯+⨯+⨯+⨯=.8. 语文成绩服从正态分布2(100,17.5)N ,数学成绩的频率分布直方图如图,如果成绩大于135的则认为特别优秀.(1)这500名学生中本次考试语文、数学特别优秀的大约各多少人?(2)如果语文和数学两科都特别优秀的共有6人,从(1)中的这些同学中随机抽取3人,设三人中两科都特别优秀的有X 人,求X 的分布列和数学期望.(附公式:若2~(,)X N μσ,则()0.68P X μσμσ-<≤+=,(22)0.96P X μσμσ-<≤+=).【答案】(1)语文有10人,数学有12人;(2)分布列见解析,98.【解析】【分析】(1)利用正态分布的对称性求出语文成绩特别优秀的概率,从而可估计出语文成绩特别优秀人数,由频率分布直方图可求出数学成绩特别优秀的频率,用频率来衡量概率,从而可求出数学成绩特别优秀的人数;(2)结合(1)可知数学语文单科优秀的有10人,则X 的所有可能取值为0、1、2、3,然后求出各自对应的概率即可列出分布列,求得数学期望【详解】(1)∵语文成绩服从正态分布2(10017.5)N ,,∴语文成绩特别优秀概率为11(135)(10.96)0.022P P X =≥=-⨯=, ∴数学成绩特别优秀的概率为230.0016200.0244P =⨯⨯=, ∴语文特别优秀的同学有5000.0210⨯=人,数学特别优秀的同学有5000.02412⨯=人; (2)语文数学两科都优秀的有6人,单科优秀的有10人,X 的所有可能取值为0、1、2、3,3103163(0)14C P X C ===,2110631627(1)56C C P X C ⋅===, 1210631615(2)56C C P X C ⋅===,363161(3)28C P X C ===, ∴X 的分布列为:19()0123145656288E X =⨯+⨯+⨯+⨯=. 9. 张明要参加某单位组织的招聘面试.面试要求应聘者有7次选题答题的机会(选一题答一题),若答对4题即终止答题,直接进入下一轮,否则被淘汰.已知张明答对每一道题的概率都为12. (1)求张明进入下一轮的概率;(2)设张明在本次面试中答题的个数为ξ,试写出ξ的分布列,并求ξ的数学期望. 【答案】(1)12;(2)分布列答案见解析,数学期望:9316. 【解析】 【分析】(1)分情况讨论张明进入下一轮的概率;(2)由条件可知4,5,6,7ξ=,理解随机变量对应的事件,写出概率分布列,计算数学期望.。

2023年高考数学一轮复习(新高考地区专用)6-6 分布列基础(精练)(解析版)

2023年高考数学一轮复习(新高考地区专用)6-6 分布列基础(精练)(解析版)

6.6 分布列基础(精练)(基础版)1.(2022·云南·昆明市第一中学西山学校)国家“双减”政策落实之后,某市教育部门为了配合“双减”工作,做好校园课后延时服务,特向本市小学生家长发放调查问卷了解本市课后延时服务情况,现从中抽取100份问卷,统计了其中学生一周课后延时服务总时间(单位:分钟),并将数据分成以下五组:[)[)[)[)[]100,120,120,140,140,160,160,180,180,200,得到如图所示的频率分布直方图.(1)根据如图估计该市小学生一周课后延时服务时间的众数、平均数、中位数(保留小数点后一位);(2)通过调查分析发现,若服务总时间超过160分钟,则学生有不满情绪,现利用分层随机抽样的方法从样本问卷中随机抽取8份,再从抽取的8份问卷中抽取3份,记其中有不满情绪的问卷份数为X ,求X 的分布列及均值.【答案】(1)150,151,150.9;(2)分布列见解析,34.【解析】(1)众数:150;第1到5组频率分别为:0.05,0.15,0.55,0.2,0.05,平均数:1100.051300.151500.551700.21900.05151x =⨯+⨯+⨯+⨯+⨯=, 设中位数为x ,则中位数在第3组,则()0.21400.02750.5x +-⨯=,150.9x ≈; (2)用分层随机抽样抽取8份问卷,其中学生有不满情绪的有8×(0.2+0.05)=2份,∴X 的可能取值为0,1,2,∴()306238C C 5C 140P X ===,()216238C C 15C 281P X ===,()126238C C 3C 282P X ===,∴X 的分布列为:题组一 超几何分布∴()515330121428284E X =⨯+⨯+⨯=. 2.(2022·北京·高三专题练习)为迎接2022年冬奥会,北京市组织中学生开展冰雪运动的培训活动,并在培训结束后对学生进行了考核.记X 表示学生的考核成绩,并规定85X >为考核优秀.为了了解本次培训活动的效果,在参加培训的学生中随机抽取了30名学生的考核成绩,并作成如下茎叶图:.(1)从参加培训的学生中随机选取1人,请根据图中数据,估计这名学生考核为优秀的概率;(2)从图中考核成绩满足[]70,79X ∈的学生中任取3人,设Y 表示这3人中成绩满足8510X -≤的人数,求Y 的分布列和数学期望;(3)根据以往培训数据,规定当8510.510X P ⎛-⎫≤≥⎪⎝⎭时培训有效.请你根据图中数据,判断此次冰雪培训活动是否有效,并说明理由.【答案】(1)15(2)分布列见解析,()158E Y = (3)有效,理由见解析 【解析】(1)解:设该名学生的考核成绩优秀为事件A ,由茎叶图中的数据可知,30名同学中,有6名同学的考核成绩为优秀,故()15P A =. (2)解:由8510X -≤可得7595X ≤≤,所以,考核成绩满足[]70,79X ∈的学生中满足8510X -≤的人数为5,故随机变量Y 的可能取值有0、1、2、3,()3338C 10C 56P Y ===,()213538C C 151C 56P Y ===,()123538C C 152C 28P Y ===,()3538C 53C 28P Y ===,所以,随机变量Y 的分布列如下表所示:因此,()115155150123565628288E Y =⨯+⨯+⨯+⨯=. (3)解:由85110X -≤可得7595X ≤≤,由茎叶图可知,满足7595X ≤≤的成绩有16个, 所以851610.51030X P ⎛-⎫≤=≥⎪⎝⎭,因此,可认为此次冰雪培训活动有效. 3.(2022·宁夏中卫·三模(理))共享电动车(sharedev )是一种新的交通工具,通过扫码开锁,实现循环共享.某记者来到中国传媒大学探访,在校园喷泉旁停放了10辆共享电动车,这些电动车分为荧光绿和橙色两种颜色,已知从这些共享电动车中任取1辆,取到的是橙色的概率为0.4P =,若从这些共享电动车中任意抽取3辆.(1)求取出的3辆共享电动车中恰好有一辆是橙色的概率;(2)求取出的3辆共享电动车中橙色的电动车的辆数X 的分布列与数学期望. 【答案】(1)12;(2)分布列见解析,数学期望为65.【解析】(1)因为从10辆共享电动车中任取一辆,取到橙色的概率为0.4,所以橙色的电动车有4辆,荧光绿的电动车有6辆.记A 为“从中任取3辆共享单车中恰好有一辆是橙色”,则()2164310C C 1C 2P A ⨯==. (2)随机变量X 的所有可能取值为0,1,2,3.所以()3064310C C 10C 6P X ⨯===,()2164310C C 11C 2P X ⨯===, ()()1264310C C 32C 10P X P A ⨯====,()0364310C C 13C 30P X ⨯===.所以分布列为数学期望()1131601236210305E X =⨯+⨯+⨯+⨯=.4.(2022·广东·华南师大附中三模)“双减”政策实施后,为了解某地中小学生周末体育锻炼的时间,某研究人员随机调查了600名学生,得到的数据统计如下表所示:(1)估计这600名学生周末体育锻炼时间的平均数t ;(同一组中的数据用该组区间的中点值作代表) (2)在这600人中,用分层抽样的方法,从周末体育锻炼时间在[)40,60内的学生中抽取15人,再从这15人中随机抽取3人,记这3人中周末体育锻炼时间在[)50,60内的人数为X ,求X 的分布列以及数学期望()E X . 【答案】(1)58.5;(2)分布列答案见解析,数学期望:95.【解析】(1)估计这600名学生周末体育锻炼时间的平均数 350.1450.2550.3650.15750.15850.158.5t =⨯+⨯+⨯+⨯+⨯+⨯=.(2)依题意,周末体育锻炼时间在[)40,50内的学生抽6人,在[)50,60内的学生抽9人,则()363154091C P X C ===,()216931527191C C P X C ===,()12693152162455C C P X C ===,()3931512365C P X C ===,故X 的分布列为: 则()42721612901239191455655E X =⨯+⨯+⨯+⨯=. 5.(2022·云南保山·模拟预测(理))某高中学校为了解学生的课外体育锻炼时间情况,在全校学生中随机抽取了200名学生进行调查,并将数据分成六组,得到如图所示的频率分布直方图.将平均每天课外体育锻炼时间在[40,60)上的学生评价为锻炼达标,将平均每天课外体育锻炼时间在[0,40)上的学生评价为锻炼不达标(1)根据频率分布直方图估计这200名学生每天课外体育锻炼时间的众数、中位数;(2)为了了解学生课外体育锻炼时间不达标的原因,从上述锻炼不达标的学生中按分层抽样的方法抽取10人,再从这10人中随机抽取3人,记这三人中每天课外体育锻炼时间在[0,20)的人数为ξ,求ξ的分布列和数学期望.【答案】(1)中位数为28.125,众数等于25(2)分布列见解析,0.9【解析】(1)众数就是直方图中最高矩形底边中点的横坐标,则样本众数等于25.由频率分布直方图可得,在[0,10)上的频率为0.08,在[10,20)上的频率为0.16,在[20,30)上的频率为0.32,0.080.160.50.080.160.32<<+++,则中位数在区间[20,30)上.设中位数为0x ,则()00.24200.0320.5+-⨯=x ,028.125x =,即样本中位数为28.125.(2)根据题意,在[0,10),[10,20),[20,30),[30,40)上抽取的人数分别为1,2,4,3,其中在[0,20)上抽取的人数为3,则0ξ=,1,2,3.3127373310103576321(0),(1),1202412040ξξ⨯========C C C P P C C , 2133733310102171(2),(3)12040120C C C P P C C ξξ=====⨯==. 从而得到随机变量ξ的分布列如下表:随机变量ξ的期望72171()01230.9244040120E ξ=⨯+⨯+⨯+⨯=6.(2022·北京市朝阳区人大附中朝阳分校模拟预测)自“新型冠状肺炎”疫情爆发以来,科研团队一直在积极地研发“新冠疫苗”.在科研人员不懈努力下,我国公民率先在2020年年末开始使用安全的新冠疫苗,使我国的“防疫”工作获得更大的主动权.研发疫苗之初,为了测试疫苗的效果,科研人员以白兔为实验对象,进行了一些实验:(1)实验一:选取10只健康白兔,编号1至10号,注射一次新冠疫苗后,再让它们暴露在含有新冠病毒的环境中,实验结果发现:除2号、3号、7号和10号四只白兔仍然感染了新冠病毒,其他白兔未被感染.现从这10只白兔中随机抽取3只进行研究,将仍被感染的白兔只数记作X ,求X 的分布列和数学期望.(2)实验二:疫苗可以再次注射第二针、加强针,但两次疫苗注射时间间隔需大于三个月.科研人员对白兔多次注射疫苗后,每次注射的疫苗对白兔是否有效互相不影响.试问:若将实验一中未被感染新冠病毒的白兔的频率当做疫苗的有效率,那么一只白兔注射两次疫苗后的有效率能否保证达到90%?如若可以,请说明理由;若不可以,请你参考上述实验给出注射疫苗后有效率在90%以上的建议. 【答案】(1)分布列见解析;数学期望()65E X =; (2)无法保证;建议:需要将注射一次疫苗的有效率提高到90%以上. 【解析】(1)由题意得:X 所有可能的取值为0,1,2,3,()3631020101206C P X C ∴====;216431060111202C C P XC ; 1264310363212010C C P X C ;3431041312030C P XC ; X ∴的分布列为:∴数学期望()1131601236210305E X =⨯+⨯+⨯+⨯=; (2)由已知数据知:实验一中未被感染新冠病毒的白兔的频率为0.6,则注射一次疫苗的有效率为0.6, ∴一只白兔注射两次疫苗的有效率为:()2110.60.8484%90%--==<, ∴无法保证一只白兔注射两次疫苗后的有效率达到90%;设每支疫苗有效率至少达到x 才能满足要求,()21190%x ∴--≥,解得:0.990%x ≥=,∴需要将注射一次疫苗的有效率提高到90%以上才能保证一只白兔注射两次疫苗后的有效率达到90%.7.(2022·全国·高三专题练习(理))高二年级某班学生在数学校本课程选课过程中,已知第一小组与第二小组各有六位同学.每位同学都只选了一个科目,第一小组选《数学运算》的有1人,选《数学解题思想与方法》的有5人,第二小组选《数学运算》的有2人,选《数学解题思想与方法》的有4人,现从第一、第二两小组各任选2人分析选课情况.(1)求选出的4 人均选《数学解题思想与方法》的概率;(2)设ξ为选出的4个人中选《数学运算》的人数,求ξ的分布列和数学期望. 【答案】(1)415(2)分布列见解析,期望为1 【解析】(1)解:设“从第一小组选出的2人选《数学解题思想与方法》”为事件A ,“从第二小组选出的2人选《数学解题思想与方法》”为事件B ,由于事 件A 、B 相互独立,且22542266C C 22(),()C 3C 5P A P B ====, 所以选出的4人均选《数学解题思想与方法》的概率为224()()()3515P A B P A P B ⋅=⋅=⨯=.(2)解:由题意,随机变量ξ可能的取值为0,1,2,3,可得4(0)15P ξ==,211125524422226666C C C C C 22(1)C C C C 45P ξ==⋅+⋅=,152266C 11(3)C C 45P ξ==⋅=,2(2)1(0)(1)(3)9P P P P ξξξξ==-=-=-==, 所以随机变量ξ的分布列为:ξ0 1 23 P415224529145所以随机变量ξ的数学期望 42221012311545945E ξ=⨯+⨯+⨯+⨯=. 1.(2022·北京·人大附中三模)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图: 组号分组频数1[)0,262 [)2,48题组二 二项分布每周课外阅读时间小于6小时的学生我们称之为“阅读小白”,大于等于6小时且小于12小时的学生称之为“阅读新手”,阅读时间大于等于12小时的学生称之为“阅读达人”.(1)从样本中随机选取一名学生,已知这名学生的阅读时间大于等于6小时,问这名学生是“阅读达人”概率; (2)从该校学生中选取3人,用样本的频率估计概率,记这3人中“阅读新手和阅读小白”的人数和为X ,求X 的分布列和数学期望;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论) 【答案】(1)1069(2)分布列答案见解析,()2710E X =(3)第4组【解析】(1)解:从样本中随机选取一名学生,其中阅读时间大于等于6小时的学生人数为1003169-=, “阅读达人”的学生人数为10,故所求概率为1069. (2)解:从该校学生中任选一人,该学生是“阅读小白”或“阅读新人”的概率为90910010=, 所以,9~3,10X B ⎛⎫ ⎪⎝⎭,则()3110101000P X ⎛⎫=== ⎪⎝⎭,()397293101000P X ⎛⎫=== ⎪⎝⎭,()21391271C 10101000P X ⎛⎫==⋅⋅= ⎪⎝⎭,()223912432C 10101000P X ⎛⎫==⋅⋅= ⎪⎝⎭, 所以,随机变量X 的分布列如下表所示:()927310100E X =⨯=. (3)解:样本中的100名学生该周课外阅读时间的平均数为10.0630.0850.1770.2290.25110.12130.06150.02170.02⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=7.68.因此,样本中的100名学生该周课外阅读时间的平均数在第4组.2.(2022·安徽·合肥一六八中学模拟预测(理))《关于加快推进生态文明建设的意见》,正式把“坚持绿水青山就是金山银山”的理念写进中央文件,成为指导中国加快推进生态文明建设的重要指导思想.为响应国家号召,某市2020年植树节期间种植了一批树苗,2022年市园林部门从这批树苗中随机抽取100棵进行跟踪检测,得到树高的频率分布直方图如图所示:(1)求树高在225-235cm 之间树苗的棵数,并求这100棵树苗树高的平均值;(2)若将树高以等级呈现,规定:树高在185-205cm 为合格,在205-235为良好,在235-265cm 为优秀.视该样本的频率分布为总体的频率分布,若从这批树苗中机抽取3棵,求树高等级为优秀的棵数ξ的分布列和数学期望.【答案】(1)15;220.5(2)分布列见解析;期望为0.6【解析】(1)树高在225-235cm 之间的棵数为:()10010.00530.0150.02000250.011015⎡⎤⨯-⨯++++⨯=⎣⎦..树高的平均值为:0.051900.152000.22100.252200.152300.12400.052500.05260220.5⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=(2)由(1)可知,树高为优秀的概率为:0.10.050.050.2++=, 由题意可知()~3,0.2B ξ,则ξ的所有可能取值为0,1,2,3,()0330C 0.80.512P ξ===, ()1231C 0.80.20.384P ξ==⨯=, ()2232C 0.80.20.096P ξ==⨯=,()3333C 0.20.008P ξ===,故ξ的分布列为:因为()~3,0.2B ξ,所以()30.20.6E ξ=⨯=3.(2022·新疆克拉玛依·三模(理))第24届北京冬季奥林匹克运动会于2022年2月4日至2月20日在北京和张家口联合举办.这是中国历史上第一次举办冬季奥运会,它掀起了中国人民参与冬季运动的大热潮.某市举办了中学生滑雪比赛,从中抽取40名学生的测试分数绘制成茎叶图和频率分布直方图如下,后来茎叶图受到了污损,可见部分信息如图.(1)求频率分布直方图中的a 值,并根据直方图估计该市全体中学生的测试分数的中位数和平均数(同一组中的数据以这组数据所在区间中点的值作代表,结果保留一位小数);(2)将频率作为概率,若从该市全体中学生中抽取4人,记这4人中测试分数不低于90分的人数为X ,求X 的分布列及数学期望.【答案】(1)0.02a =,中位数为74.3,平均数为74.5;(2)分布列见解析,25.【解析】(1)由频率分布直方图和茎叶图知,测试分数在[50,60),[60,70),[70,80),[90,100]的频率依次为:0.1,0.25,0.35,0.1,因此,测试分数位于[)80,90的频率为10.10.250.350.10.2----=,则0.20.0210a ==, 显然测试分数的中位数t 在区间[70,80)内,则有:()700.0350.50.10.25t -⨯=--,解得:74.3t ≈, 测试分数的平均数为:550.1650.25750.35850.2950.174.5⨯+⨯+⨯+⨯+⨯=. (2)测试分数不低于90分的频率为110,X 的所有可能值是:0,1,2,3,4, 显然1(4,)10XB ,()4419C ()(),N,41010k k k P X k k k -==∈≤, 所以X 的分布列为:数学期望()124105E X =⨯=. 4.(2022·全国·模拟预测)为了中国经济的持续发展制定了从2021年2025年发展纲要,简称“十四五”规划,为了普及“十四五”的知识,某党政机关举行“十四五”的知识问答考试,从参加考试的机关人员中,随机抽取100名人员的考试成绩的部分频率分布直方图,其中考试成绩在[)70,80上的人数没有统计出来.(1)估算这次考试成绩的平均分数;(2)把上述的频率看作概率,把考试成绩的分数在[]80,100的学员选为“十四五”优秀宣传员,若从党政机关所有工作人员中,任选3名工作人员,其中可以作为优秀宣传员的人数为ξ,求ξ的分布列与数学期望.【答案】(1)70.5(2)分布列见解析,数学期望为0.9【解析】(1)设分数在[)70,80内的频率为x ,根据频率分布直方图得,()0.010.0150.020.0250.005101x ++++⨯+=,解得0.25x =,可知分数在[)70,80内的频率为0.25,则考试成绩的平均分数为450.10550.15650.2750.25850.25950.0570.5⨯+⨯+⨯+⨯+⨯+⨯=.(2)根据频率分布直方图可知考试成绩在[]80,100的频率为()0.0250.005100.3+⨯=,则0,1,2,3ξ=.()003334300.30.71000P C ξ==⨯=,()12344110.30.71000P C ξ==⨯=()22318920.30.71000P C ξ==⨯=,()3332730.31000P C ξ===,故随机变量ξ的分布列为因为该分布为二项分布,所以该随机变量的数学期望为()30.30.9E ξ=⨯=.5.(2022·江苏苏州·模拟预测)如图,在数轴上,一个质点在外力的作用下,从原点O 出发,每次等可能地向左或向右移动一个单位,质点到达位置的数字记为X .(1)若该质点共移动2次,位于原点O 的概率;(2)若该质点共移动6次,求该质点到达数字X 的分布列和数学期望. 【答案】(1)12;(2)分布列见解析,0.【解析】(1)质点移动2次,可能结果共有224⨯=种,若质点位于原点O ,则质点需要向左、右各移动一次,共有12C 2=种,故质点位于原点O 的概率2142P ==. (2)质点每次移动向左或向右,设事件A 为“向右”,则A 为“向左”,故1()()2P A P A ==, 设Y 表示6次移动中向左移动的次数,则1(6,)2Y B ,质点到达的数字62X Y =-,所以06611(6)(0)C ()264P X P Y =====,16613(4)(1)C ()232P X P Y =====,266115(2)(2)C ()264P X P Y =====, 36615(0)(3)C ()216P X P Y =====,466115(2)(4)C ()264P X P Y =-====, 56613(4)(5)C ()232P X P Y =-====,66611(6)(6)C ()264P X P Y =-====, 所以X 的分布列为:1()(62)2()626602E X E Y E Y =-=-+=-⨯⨯+=.6.(2022·北京通州·模拟预测)第24届冬季奥林匹克运动会,于2022年2月在北京市和张家口市联合举行.某校寒假期间组织部分滑雪爱好者参加冬令营集训.训练期间,冬令营的同学们都参加了“单板滑雪”这个项目相同次数的训练测试,成绩分别为A 、B 、C 、D 、E 五个等级,分别对应的分数为5、4、3、2、1.甲、乙两位同学在这个项目的测试成绩统计结果如图所示.(1)根据上图判断,甲、乙两位同学哪位同学的单板滑雪成绩更稳定?(结论不需要证明) (2)求甲单板滑雪项目各次测试分数的众数和平均数;(3)若甲、乙再同时参加两次测试,设甲的成绩为4分并且乙的成绩为3分或4分的次数为X ,求X 的分布列(频率当作概率使用).【答案】(1)乙比甲的单板滑雪成绩更稳定 (2)众数为3分,平均数为2.9分 (3)分布列答案见解析【解析】(1)解:由图可知,乙比甲的单板滑雪成绩更稳定.(2)解:因为甲单板滑雪项目测试中4分和5分成绩的频率之和为0.325, 3分成绩的频率为0.375,所以,甲单板滑雪项目各次测试分数的众数为3分,测试成绩2分的频率为10.20.3750.250.0750.1----=,所以,甲单板滑雪项目各次测试分数的平均数为10.220.130.37540.2550.075 2.9⨯+⨯+⨯+⨯+⨯=. (3)解:由题意可知,在每次测试中,甲的成绩为4分,并且乙的成绩为3分或4分的概率为30.250.375216⨯⨯=, 依题意,3~2,16X B ⎛⎫ ⎪⎝⎭,所以,()2131********P X ⎛⎫=== ⎪⎝⎭,()12313391C 1616128P X ==⋅⋅=,()239216256P X ⎛⎫=== ⎪⎝⎭, 所以,随机变量X 的分布列如下表所示:X0 1 2 P1692563912892561.(2022·全国·高三专题练习(理))冰壶是2022年2月4日至2月20日在中国举行的第24届冬季奥运会的比赛项目之一.冰壶比赛的场地如图所示,其中左端(投掷线MN 的左侧)有一个发球区,运动员在发球区边沿的投掷线MN 将冰壶掷出,使冰壶沿冰道滑行,冰道的右端有一圆形的营垒,以场上冰壶最终静止时距离营垒区圆心O 的远近决定胜负,甲、乙两人进行投掷冰壶比赛,规定冰壶的重心落在圆O 中,得3分,冰壶的重心落在圆环A 中,得2分,冰壶的重心落在圆环B 中,得1分,其余情况均得0分.已知甲、乙投掷冰壶的结果互不影响,甲、乙得3分的概率分别为13,14;甲、乙得2分的概率分别为25,12;甲、乙得1分的概率分别为15,16.(1)求甲所得分数大于乙所得分数的概率;(2)设甲、乙两人所得的分数之差的绝对值为X ,求X 的分布列和期望.题组三 独立重复实验【答案】(1)1130(2)分布列见解析,期望为:169180【解析】(1)由题意知甲得0分的概率为1211135515---=,乙得0分的概率为1111142612---=,甲所得分数大于乙所得分数分为:甲得3分乙得2或1或0分,甲得2分乙得1或0分,甲得1分乙得0分所以所求概率为1121111(1)()3456125123011⨯-+⨯++⨯=.(2)X 可能取值为0,1,2,3,()11211111290345256151290P X ==⨯+⨯+⨯+⨯=()112111111111++35565251283246121805P X ==⨯+⨯+⨯+⨯⨯⨯=()11111121231215180P X ==⨯+⨯+⨯+⨯=()11211121545334P X ==⨯+⨯=所以,随机变量X 的分布列为:所以()298331216918001239018018405E X =⨯+⨯+⨯+⨯= 2.(2022·全国·高三专题练习(理))为弘扬奥运精神,某校开展了“冬奥”相关知识趣味竞赛活动.现有甲、乙两名同学进行比赛,共有两道题目,一次回答一道题目.规则如下:∴抛一次质地均匀的硬币,若正面向上,则由甲回答一个问题,若反面向上,则由乙回答一个问题.∴回答正确者得10分,另一人得0分;回答错误者得0分,另一人得5分.∴若两道题目全部回答完,则比赛结束,计算两人的最终得分.已知甲答对每道题目的概率为45,乙答对每道题目的概率为35,且两人每道题目是否回答正确相互独立.(1)求乙同学最终得10分的概率;(2)记X 为甲同学的最终得分,求X 的分布列和数学期望. 【答案】(1)37100(2)分布列见解析,X 的数学期望为10【解析】(1)记“乙同学最终得10分”为事件A ,则可能情况为甲回答两题且错两题;甲、乙各答一题且各对一题;乙回答两题且对一题错一题, 则()1111141313123722252525252525100P A =⨯⨯⨯+⨯⨯⨯⨯+⨯⨯⨯⨯=,所以乙同学得10分的概率是37100. (2)甲同学的最终得分X 的所有可能取值是0,5,10,15,20. ()1111111313131640225252525252510025P X ==⨯⨯⨯+⨯⨯⨯⨯+⨯⨯⨯==,()111213121645222525252510025P X ==⨯⨯⨯⨯+⨯⨯⨯⨯==,()141114*********102225252525252510025P X ==⨯⨯⨯⨯+⨯⨯⨯⨯+⨯⨯⨯==,()1412164152252510025P X ==⨯⨯⨯⨯==,()141416420252510025P X ==⨯⨯⨯==.X 的分布列为()4191105101520102525252525E X =⨯+⨯+⨯+⨯+⨯=,所以X 的数学期望为10. 3.(2022·青海·海东市第一中学模拟预测(理))“民族要复兴,乡村必振兴”,为了加强乡村振兴宣传工作,让更多的人关注乡村发展,某校举办了有关城乡融合发展、人与自然和谐共生的知识竞赛.比赛分为初赛和复赛两部分,初赛采用选手从备选题中选一题答一题的方式进行,每位选手最多有5次答题机会,选手累计答对3题或答错3题即终止比赛,答对3题者直接进入复赛,答错3题者则被淘汰.已知选手甲答对每个题的概率均为35,且相互间没有影响.(1)求选手甲被淘汰的概率;(2)设选手甲在初赛中答题的个数为X ,试求X 的分布列和数学期望. 【答案】(1)9923125(2)分布列见解析,2541625【解析】(1)设“选手甲被淘汰”为事件A ,因为甲答对每个题的概率均为35,所以甲答错每个题的概率均为25.则甲答了3题都错,被淘汰的概率为33328C 5125⎛⎫= ⎪⎝⎭;甲答了4个题,前3个1对2错,被淘汰的概率为22323272C 555625⎛⎫⨯⨯= ⎪⎝⎭;甲答了5个题,前4个2对2错,被淘汰的概率为2224322432C 5553125⎛⎫⎛⎫⋅⨯= ⎪⎪⎝⎭⎝⎭. 所以选手甲被海的概率()87243299212562531253125P A =++=. (2)易知X 的可能取值为3,4,5,对应甲被淘汰或进入复赛的答题个数,则()3333333273C C 5525P X ⎛⎫⎛⎫==+= ⎪ ⎪⎝⎭⎝⎭,()2222333232322344C C 555555625P X ⎛⎫⎛⎫==⨯⨯+⨯⨯=⎪ ⎪⎝⎭⎝⎭, ()2224322165C 55625P X ⎛⎫⎛⎫==⨯=⎪ ⎪⎝⎭⎝⎭. X 的分布列为则()7234216256225413456255625E X =⨯+⨯+⨯=. 4.(2022·湖南·长沙一中模拟预测)某靶场有A ,B 两种型号的步枪可供选用,其中甲使用A B ,两种型号的步枪的命中率分别为14,13;,(1)若出现连续两次子弹脱靶或者子弹打光耗尽的现象便立刻停止射击,若击中标靶至少3次,则可以获得一份精美礼品,若甲使用B 型号的步枪,并装填5发子弹,求甲获得精美礼品的概率;(2)现在A B ,两把步枪中各装填3发子弹,甲打算轮流使用A B ,两种步枪进行射击,若击中标靶,则继续使用该步枪,若未击中标靶,则改用另一把步枪,甲首先使用A 种型号的步枪,若出现连续两次子弹脱靶或者其中某一把步枪的子弹打光耗尽的现象便立刻停止射击,记X 为射击的次数,求X 的分布列与数学期望. 【答案】(1)1381(2)分布列见解析;X 的数学期望为3512.【解析】(1)甲击中5次的概率为513⎛⎫ ⎪⎝⎭1243=,甲击中4次的概率为14511C (1)()33-⋅10243=,甲击中3次的概率为()322511C 3133⎛⎫⎛⎫-⋅- ⎪⎪⎝⎭⎝⎭28243=, 所以甲获得精美礼品的概率为11028391324324324324381++==. (2)X 的所有可能取值为2,3,4,5,(2)P X =11(1)(1)43=--321432=⨯=,(3)P X ==111113(1)(1)14434416⨯--+⨯⨯=,(4)P X ==1111111(1)1(1)(1)(1)4334334-⨯⨯⨯+-⨯⨯-⨯-524=,11111111(5)(1)(1)1(1)(1)144334334P X ==⨯-⨯⨯-⨯+-⨯⨯-⨯⨯1111(1)14433+⨯-⨯⨯⨯548=,所以X 的分布列为:所以1355()23452162448E X =⨯+⨯+⨯+⨯3512=. 5.(2022·全国·二模(理))“百年征程波澜壮阔,百年初心历久弥坚”.为庆祝中国建党一百周年,哈市某高中举办了“学党史、知党情、跟党走”的党史知识竞赛.比赛分为初赛和决赛两个环节,通过初赛选出两名同学进行最终决赛.若该高中A ,B 两名学生通过激烈的竞争,取得了初赛的前两名,现进行决赛.规则如下:设置5轮抢答,每轮抢到答题权并答对则该学生得1分,答错则对方得1分.当分差达到2分或答满5轮时,比赛结束,得分高者获胜.已知A ,B 每轮均抢答且抢到答题权的概率分别为23,13,A ,B 每一轮答对的概率都为12,且两人每轮是否回答正确均相互独立. (1)求经过2轮抢答A 赢得比赛的概率;:(2)设经过抢答了X 轮后决赛结束,求随机变量X 的分布列和数学期望.【答案】(1)14(2)分布列见解析;期望为134【解析】(1)记事件C 为“经过2轮抢答A 赢得比赛” A 学生每轮得一分的概率()2111132322P A =⨯+⨯=,B 学生每轮得一分的概率()1121132322P B =⨯+⨯=,()21124P C ⎛⎫== ⎪⎝⎭,所以经过2轮抢答A 赢得比赛的概率为14.(2)X 的可能取值为2,4,5.2轮比赛甲赢或乙赢的概率为()2221122C 22P X ⎛⎫=== ⎪⎝⎭,4轮比赛甲赢或乙赢的概率为()121111142C 22224P X ==⨯⨯⨯=, 5轮比赛甲赢或乙赢的概率为()11151424P X ==--=.X 的分布列为:()111132452444E X =⨯+⨯+⨯=,数学期望为134.6.(2022·湖南·长沙市明德中学二模)沙滩排球是一项每队由两人组成的两队在由球网分开的沙地上进行比赛的运动.它有多种不同的比赛形式以适应不同人、不同环境下的比赛需求.国家沙滩排球队为备战每年一次的世界沙滩排球巡回赛,在文昌高隆沙湾国家沙滩排球训练基地进行封闭式训练.在某次训练中,甲、乙两队进行对抗赛,每局依次轮流发球(每队不能连续发球),连续赢得2个球的队获胜并结束该局比赛,并且每局不得超过5个球.通过对甲、乙两队过去对抗赛记录的数据分析,甲队发球甲队赢的概率为23,乙队发球甲队赢的概率为12,每一个球的输赢结果互不影响,已知某局甲先发球. (1)求该局第二个球结束比赛的概率;(2)若每赢1个球记2分,每输一个球记0分,记该局甲队累计得分为ξ,求ξ的分布列及数学期望. 【答案】(1)12(2)分布列见解析,18754【解析】(1)记:“甲队发球甲队赢”为事件A ,“乙队发球甲队赢”为事件B ,“第二个球结束比赛”为事件C ,则()23P A =,()12P B =,()()1132P A P B ==,,C AB AB =,因为事件AB 与AB 互斥,所以()()()()P C P ABAB P AB P AB ==+()()()()P A P B P A P B =+2111132322=⨯+⨯=,所以该局第二个球结束比赛的概率为12.(2)依题意知随机变量ξ的所有可能取值为0246,,, ()()()()1110326P P AB P A P B ξ====⨯=;()()()()2P P ABA ABAB P ABA P ABAB ξ===+21111115323323236=⨯⨯+⨯⨯⨯=; ()()4P P AB ABAABABAABABA ξ==()()()()P AB P ABA P ABABA P ABABA=+++21112111112121153++=323233232332323108=⨯+⨯⨯⨯⨯⨯⨯⨯⨯⨯⨯; ()()()()()6P P ABAB ABABA ABABA P ABAB P ABABA P ABABAξ===++21212121211112113232323233232354=⨯⨯⨯+⨯⨯⨯⨯+⨯⨯⨯⨯=. 所以ξ的分布列为ξ0 2 46 P16536531081154故数学期望()15531118702466361085454E ξ=⨯+⨯+⨯+⨯=. 1.(2022·江苏省木渎高级中学模拟预测)2012年国家开始实施法定节假日高速公路免费通行政策,某收费站统计了2021年中秋节前后车辆通行数量,发现该站近几天车辆通行数量2100(,)0N ξσ~,若()(1200,80)01200P a P b ξξ>=<<=,则当82ab b a ≥+时下列说法正确的是( )A .12a =B .14b =C .34a b +=D .12a b -=【答案】C【解析】因2100(,)0N ξσ~,且()(1200,80)01200P a P b ξξ>=<<=,则有122b a +=,即21a b =-,不等式82ab b a ≥+为:24(1)1(21)0b b b -≥⇔-≤,则12b =,14a =, 所以34a b +=,14a b -=-,A ,B ,D 均不正确,C 正确.故选:C2.(2022·江苏·高三专题练习)随机变量()2,XN μσ,已知其概率分布密度函数22()21()e2x f x μσσπ-=在2x =处取得最大值为12π,则(0)P X >=( )附:()0.6827,(22)0.9545P X P X μσμσμσμσ-≤≤+=-≤≤+=. A .0.6827 B .0.84135C .0.97725D .0.9545【答案】B【解析】由题意2μ=,1122σππ=,2σ=,所以2(2)41()e2x f x π-=, (022)0.6827P X ≤≤=,所以1(0)(10.6827)0.158652P X <=-=, (0)10.158650.84135P X ≥=-=.故选:B .3.(2022·河南安阳·模拟预测(理))某房产销售公司有800名销售人员,为了了解销售人员上一个季度的房屋销量,公司随机选取了部分销售人员对其房屋销量进行了统计,得到上一季度销售人员的房屋销量题组四 正态分布(20,4)X N ,则全公司上一季度至少完成22套房屋销售的人员大概有( )附:若随机变量X 服从正态分布()2,N μσ,则()0.6827P X μσμσ-<≤+≈,(22)0.9545P X μσμσ-<≤+≈,(33)0.9973P X μσμσ-<≤+≈.A .254人B .127人C .18人D .36人【答案】B 【解析】因为(20,4)X N ,所以20μ=,2σ=,所以()1()10.6827220.1586522P X P X μσμσ--<≤+-≥===所以全公司上一季度至少完成22套房屋销售的人员大概有8000.15865127⨯≈(人);故选:B4.(2022·广东·大埔县虎山中学高三阶段练习)(多选)已知某校高三年级有1000人参加一次数学模拟考试,现把这次考试的分数转换为标准分,标准分的分数转换区间为(]60,300,若使标准分X 服从正态分布N()180,900,()0.6826P X μσμσ-<≤+=,(22)0.9545P X μσμσ-<≤+=,3309().973P X μσμσ-<≤+=,则( )A .这次考试标准分超过180分的约有450人B .这次考试标准分在(]90,270内的人数约为997C .甲、乙、丙三人恰有2人的标准分超过180分的概率为38D .()2402700.0428P X <≤= 【答案】BC【解析】依题意得180μ=,2900σ=,30σ=,因为()()11802P X P X μ>=>=, 所以这次考试标准分超过180分的约有110005002⨯=人,故A 不正确;()()90270180330180330P X P X <≤=-⨯<≤+⨯(33)P X μσμσ=-<≤+=0.9973,所以这次考试标准分在(]90,270内的人数约为10000.9973997⨯≈人,故B 正确; 依题意可知,每个人的标准分超过180分的概率为12,所以甲、乙、丙三人恰有2人的标准分超过180分的概率为223113C 1228⎛⎫⎛⎫⋅⋅-= ⎪⎪⎝⎭⎝⎭,故C 正确; ()240270P X <≤()180230180330P X =+⨯<≤+⨯()23P X μσμσ=+<≤+。

高中数学复习典型题专题训练118---频率直方图

高中数学复习典型题专题训练118---频率直方图

高中数学复习典型题专题训练118频率直方图列出样本数据的频率分布表和频率分布直方图的步骤: ①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:取组距,用极差组距决定组数;③决定分点:决定起点,进行分组;④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图,知小长方形的面积=组距×频率组距=频率.频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x 来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.题型一 频率分布直方图【例1】 (2010西城二模)某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.知识内容典例分析板块二.频率直方图则这200名同学中成绩大于等于80分且小于90分的学生有______名.【例2】 (2010东城二模)已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内的样本频数为 ,样本数据落在[2,10)内的频率为 .【例3】 (2010北京)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a = .若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[]140,150内的学生中选取的人数应为 .【例4】 (2010江苏高考)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[]540,中,其频率分布直方图如图所示,则其抽样的100根中,有____根在棉花纤维的长度小于20mm .(mm)频率组距【例5】 (2009湖北15)下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[)610,内的频数为 ,数据落在[)210,内的概率约为 .【例6】 (2009福建3)A .0.13B .0.39C .0.52D .0.64【例7】 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( )时间(h)A .0.6hB .0.9hC .1.0hD .1.5h【例8】 为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[)4555,,[)5565,,[)6575,,[)7585,,[)8595,由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)5575,的人数是 .产品数量0.0200.0150.0100.005【例9】 (2009山东8)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96106],,样本数据分组为[)9698,,[)98100,,[)100102,,[)102104,,[104106],.已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A .90B .75C .60D .45【例10】 某路段检查站监控录象显示,在某时段内,有1000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为右图的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90km/h 的车辆数为( )A .200B .600C .500D .300【例11】 (2006年全国II )一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本频率分布直方图,为了分析居民的收入与年龄、学历、职业等方面的联系,要从这10000人中用分层抽样的方法抽出100人做进一步调查,则在[25003000],(元)月收入段应抽出_____人.0.00050.00040.00030.00020.0001频率组距月收入(元)【例12】 如图为某样本数据的频率分布直方图,则下列说法不正确的是( )频率A .[610),的频率为0.32 B .若样本容量为100,则[1014),的频数为40 C .若样本容量为100,则(10] ,的频数为40 D .由频率分布布直方图可得出结论:估计总体大约有10%分布在[1014),【例13】 (2006北京模拟)下面是某学校学生日睡眠时间的抽样频率分布表:【例14】 (2010崇文一模)为了调查某厂2000名工人生产某种产品的能力,随机抽查了m 位工人某天生产该产品的数量,产品数量的分组区间为[)10,15,[)15,20,[)20,25,[)25,30,[30,35],频率分布直方图如图所示.已知生产的产品数量在[)20,25之间的工人有6位. ⑴求m ; 10 15 20 25 30 35产品数量⑵工厂规定从各组中任选1人进行再培训,则选取5人不在同一组的概率是多少?【例15】 考查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm )如下:⑴ 作出频率分布表; ⑵ 画出频率分布直方图.【例16】(2010陕西卷高考)为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行出样检查,测得身高情况的统计图如下:/cm/cm⑴估计该小男生的人数;⑵估计该校学生身高在170~185cm之间的概率;⑶从样本中身高在165~180cm之间的女生..中任选2人,求至少有1人身高在170~180cm 之间的概率.【例17】从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表,画出频率分布直方图及折线图,并根据作出的频率分布直方图估计身高不小于170的同学的人数.【例18】为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如下图),已知图中从左到右的前三个小组的频率分别是0.10.30.4,,.第一小组的频数是5.⑴求第四小组的频率和参加这次测试的学生人数;⑵在这次测试中,学生跳绳次数的中位数落在第几小组内?⑶参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩优秀率是多少?O频率组距次数149.5124.599.574.549.5【例19】 为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛. 为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计. 请你根据尚未完成并有局部污损的频率分布表和频数分布直方图,解答下列问题:⑴ 填充频率分布表的空格(将答案直接填在表格内); ⑵ 补全频数条形图;⑶ 若成绩在75.5~85.5分的学生为二等奖,问获得二等奖的学生约为多少人?【例20】 (2010丰台一模)某校高三(1)班的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题.85987654322198653328698765叶茎1009080706050分数频率组距0.040.0280.0160.008⑴求全班人数及分数在[)80,90之间的频数;⑵估计该班的平均分数,并计算频率分布直方图中[)80,90间的矩形的高;⑶若要从分数在[]80,100之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在[]90,100之间的概率.【例21】某地区为了了解70~80岁老人的日平均睡眠时间(单位:h).随机选择了50位老人的进行调查.下表是这50位老人日睡眠时间的频率分布表.在上述统计数据中,一部分计算见算法流程图(其中←可用=代替),则输出的S的值是.。

历年高考数学真题精选40 频率分布直方图

历年高考数学真题精选40 频率分布直方图

高考数学真题精选(按考点分类)专题40 频率分布直方图(学生版)一.选择题(共2小题)1.(2016•山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140A.6B.8C.12D.18二.填空题(共2小题)3.(2015•湖北)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a .(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.4.(2014•江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:)cm,所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm.三.解答题(共8小题)5.(2019•新课标Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).m和使6.(2018•新课标Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:3)用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于30.35m的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)7.(2017•北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20, ,90],并整理得到如下频率分布直方图:30),[30,40),[80(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.8.(2017•新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:)kg,其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50kg箱产量50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较.附:2P K K0.0500.0100.001()K 3.841 6.63510.82822()()()()()n ad bc K a b c d a c b d -=++++. 9.(2016•四川)我国是世界上严重缺水的国家.某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),⋯,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(Ⅰ)求直方图中a 的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (Ⅲ)估计居民月均水量的中位数.10.(2016•北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如图频率分布直方图:(1)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当3w =时,估计该市居民该月的人均水费.11.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?12.(2015•新课标Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100)频数2814106(1)做出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个不等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.历年高考数学真题精选(按考点分类)专题40 频率分布直方图(教师版)一.选择题(共2小题)1.(2016•山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140【答案】D【解析】自习时间不少于22.5小时的频率为:(0.160.080.04) 2.50.7++⨯=,故自习时间不少于22.5小时的频数为:0.7200140⨯=A.6B.8C.12D.18【答案】C【解析】由直方图可得分布在区间第一组与第二组共有20人,分布在区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人,第三组的频率为0.36,所以第三组的人数:18人,第三组中没有疗效的有6人,第三组中有疗效的有12人.二.填空题(共2小题)3.(2015•湖北)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=.(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.【答案】(1)3 (2)6000【解析】(1)由题意,根据直方图的性质得(1.5 2.5 2.00.80.2)0.11+++++⨯=,解得3aa=(2)由直方图得(3 2.00.80.2)0.1100006000+++⨯⨯=4.(2014•江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:)cm,所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm.【答案】24【解析】由频率分布直方图知:底部周长小于100cm的频率为(0.0150.025)100.4+⨯=,⨯=(株).∴底部周长小于100cm的频数为600.424三.解答题(共8小题)5.(2019•新课标Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解:(1)C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.则由频率分布直方图得:0.200.150.70.050.1510.7ab++=⎧⎨++=-⎩,解得乙离子残留百分比直方图中0.35a=,0.10b=.(2)估计甲离子残留百分比的平均值为:20.1530.2040.3050.2060.1070.05 4.05x=⨯+⨯+⨯+⨯+⨯+⨯=甲.乙离子残留百分比的平均值为:30.0540.150.1560.3570.280.15 6.00x=⨯+⨯+⨯+⨯+⨯+⨯=乙.6.(2018•新课标Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:3)m和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于30.35m的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)【解答】解:(1)根据使用了节水龙头50天的日用水量频数分布表,作出使用了节水龙头50天的日用水量数据的频率分布直方图,如下图:(2)根据频率分布直方图得:该家庭使用节水龙头后,日用水量小于30.35m 的概率为: (0.2 1.0 2.61)0.10.48p =+++⨯=.(3)由题意得未使用水龙头50天的日均水量为:1(10.0530.1520.2540.3590.45260.5550.65)0.4850⨯+⨯+⨯+⨯+⨯+⨯+⨯=, 使用节水龙头50天的日均用水量为:1(10.0550.15130.25100.35160.4550.55)0.3550⨯+⨯+⨯+⨯+⨯+⨯=, ∴估计该家庭使用节水龙头后,一年能节省:3365(0.480.35)47.45m ⨯-=.7.(2017•北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),[80⋯,90],并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解:(Ⅰ)由频率分布直方图知:分数小于70的频率为:1(0.040.02)100.4-+⨯=故从总体的400名学生中随机抽取一人,估计其分数小于70的概率为0.4;(Ⅱ)已知样本中分数小于40的学生有5人,故样本中分数小于40的频率为:0.05,则分数在区间[40,50)内的频率为:1(0.040.020.020.01)100.050.05-+++⨯-=,估计总体中分数在区间[40,50)内的人数为4000.0520⨯=人,(Ⅲ)样本中分数不小于70的频率为:0.6,由于样本中分数不小于70的男女生人数相等.故分数不小于70的男生的频率为:0.3,由样本中有一半男生的分数不小于70,故男生的频率为:0.6,即女生的频率为:0.4,即总体中男生和女生人数的比例约为:3:2.8.(2017•新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:)kg,其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50kg <箱产量50kg旧养殖法 新养殖法(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较. 附:2()P K K0.050 0.010 0.001 K3.8416.63510.8282()()()()()n ad bc K a b c d a c b d -=++++. 解:(1)根据题意,由旧养殖法的频率分布直方图可得:P (A )(0.0120.0140.0240.0340.040)50.62=++++⨯=;(2)根据题意,补全列联表可得:箱产量50kg <箱产量50kg总计 旧养殖法 62 38 100 新养殖法 34 66 100 总计96104200则有2200(62663834)15.705 6.63510010096104K ⨯-⨯=≈>⨯⨯⨯, 故有99%的把握认为箱产量与养殖方法有关; (3)由频率分布直方图可得: 旧养殖法100个网箱产量的平均数1(27.50.01232.50.01437.50.02442.50.03447.50.04052.50.03257.50.0262.50.01267.50.012)559.4247.1x =⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯⨯=⨯=; 新养殖法100个网箱产量的平均数2(37.50.00442.50.02047.50.04452.50.05457.50.04662.50.01067.50.008)5510.4752.35x =⨯+⨯+⨯+⨯+⨯+⨯+⨯⨯=⨯=;比较可得:12x x <,故新养殖法更加优于旧养殖法.9.(2016•四川)我国是世界上严重缺水的国家.某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),⋯,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(Ⅰ)求直方图中a 的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (Ⅲ)估计居民月均水量的中位数.解:()1(0.080.160.400.520.120.080.04)0.5I a a =++++++++⨯, 整理可得:2 1.42a =+,∴解得:0.3a =.()II 估计全市居民中月均用水量不低于3吨的人数为3.6万,理由如下:由已知中的频率分布直方图可得月均用水量不低于3吨的频率为(0.120.080.04)0.50.12++⨯=,又样本容量为30万,则样本中月均用水量不低于3吨的户数为300.12 3.6⨯=万. (Ⅲ)根据频率分布直方图,得;0.080.50.160.50.300.50.420.50.480.5⨯+⨯+⨯+⨯=<,+⨯=>,0.480.50.50.740.5∴中位数应在[2,2.5)组内,设出未知数x,令0.080.50.160.50.300.50.420.50.50.5⨯+⨯+⨯+⨯+⨯=,x解得0.04x=;+=.∴中位数是20.04 2.0410.(2016•北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如图频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当3w=时,估计该市居民该月的人均水费.解:(1)由频率分布直方图得:用水量在[0.5,1)的频率为0.1,用水量在[1,1.5)的频率为0.15,用水量在[1.5,2)的频率为0.2,用水量在[2,2.5)的频率为0.25,用水量在[2.5,3)的频率为0.15,用水量在[3,3.5)的频率为0.05,用水量在[3.5,4)的频率为0.05,用水量在[4,4.5)的频率为0.05,用水量小于等于3立方米的频率为85%,∴为使80%以上居民在该用的用水价为4元/立方米,w∴至少定为3立方米.(2)当3w=时,该市居民的人均水费为:(0.110.15 1.50.220.25 2.50.153)40.05340.050.5100.05340.051100.05340.05 1.51010.5⨯+⨯+⨯+⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=,∴当3w=时,估计该市居民该月的人均水费为10.5元.11.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?解:(1)由直方图的性质可得(0.0020.00950.0110.01250.0050.0025)201x++++++⨯=,解方程可得0.0075x=,∴直方图中x的值为0.0075;(2)月平均用电量的众数是2202402302+=,(0.0020.00950.011)200.450.5++⨯=<,∴月平均用电量的中位数在[220,240)内,设中位数为a,由(0.0020.00950.011)200.0125(220)0.5a++⨯+⨯-=可得224a=,∴月平均用电量的中位数为224;(3)月平均用电量为[220,240)的用户有0.01252010025⨯⨯=,月平均用电量为[240,260)的用户有0.00752010015⨯⨯=,月平均用电量为[260,280)的用户有0.0052010010⨯⨯=,月平均用电量为[280,300)的用户有0.0025201005⨯⨯=,∴抽取比例为111 25151055=+++,∴月平均用电量在[220,240)的用户中应抽取12555⨯=户.12.(2015•新课标Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100)频数2814106(1)做出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个不等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.解:(Ⅰ)通过两个地区用户满意度评分的频率分布直方图可以看出,B 地区用户满意度评分的平均值高于A 地区用户满意度评分的平均值,B 地区的用户满意度评分的比较集中,而A 地区的用户满意度评分的比较分散.(Ⅱ)A 地区用户的满意度等级为不满意的概率大.记A C 表示事件:“A 地区用户的满意度等级为不满意”, B C 表示事件:“B 地区用户的满意度等级为不满意”,由直方图得()(0.010.020.03)100.6A P C =++⨯= 得()(0.0050.02)100.25B P C =+⨯=A ∴地区用户的满意度等级为不满意的概率大.。

高中数学频率分布直方图

高中数学频率分布直方图

频率分布直方图作频率分布直方图的方法为:(1)把横轴分成若干段,每一线段对应一个组的组距;(2)以此线段为底作矩形,它的高等于该组的组距频率,这样得出一系列的矩形;(3)每个矩形的面积恰好是该组上的频率.频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图.作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.知识点1:利用频率分布直方图分析总体分布例题1: 2000辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,时速在[50,60)的汽车大约有 A .30辆 B .60辆 C .300辆 D .600辆变式:某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是 [96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是A.90B.75C. 60D.45变式:某初一年级有500名同学,将他们的身高(单位:cm )数据绘制成频率分布直方图(如图),若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[)130,140内的学生中选取的人数为 .知识点2:用样本分估计总体例题2某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,96 98 100 102 104 106 0.1500.125 0.1000.0750.050 克 频率/组距100 110 120130 140 150 身高频率|组距0.0050.0100.020a0.035(Ⅰ) 完成频率分布表;(Ⅱ)作出频率分布直方图;(Ⅲ)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染。

专题3.5频率分布直方图与数字特征-2021年高考数学(理)备考之百强校大题狂练系列(解析版)

专题3.5频率分布直方图与数字特征-2021年高考数学(理)备考之百强校大题狂练系列(解析版)

一、解答题1.全世界越来越关注环境保护问题,某监测站点于2018年1月某日起连续天监测空气质量指数(),数据统计如下:空气质量指数()空气质量等级空气优空气良轻度污染中度污染重度污染天数2040105(1)根据所给统计表和频率分布直方图中的信息求出,的值,并完成频率分布直方图;(2)由频率分布直方图,求该组数据的众数和中位数;(3)在空气质量指数分别属于和的监测数据中,用分层抽样的方法抽取天,再从中任意选取天,求事件“两天空气都为良”发生的概率.【答案】(1)答案见解析;(2)答案见解析;(3).解析:(1)∵,∴,∵,∴,;;;.(2)众数为120.中位数为.点睛:本题考查频率分布直方图的应用,考查概率的求法,考查推理论证能力、运算求解能力、数据处理能力,考查化归与转化思想、数形结合思想.2.从某校高三的学生中随机抽取了100名学生,统计了某次数学模考考试成绩如表:(1)请在频率分布表中的①、②位置上填上相应的数据,并在给定的坐标系中作出这些数据的频率分布直方图,再根据频率分布直方图估计这100名学生的平均成绩;(2)从这100名学生中,采用分层抽样的方法已抽取了 20名同学参加“希望杯数学竞赛”,现需要选取其中3名同学代表高三年级到外校交流,记这3名学生中“期中考试成绩低于120分”的人数为,求的分布列和数学期望.【答案】(1)见解析;(2)见解析【解析】分析:(1)利用总频数为和频率和为得到①②的值,再根据频率分布表中的数据绘制频率分布直方图.详解:(1),.频率分布表为:分组频数频率频率分布直方图为:平均成绩为分.(2)成绩低于分的人数为人,不低于分的人数为人,∴的所有可能取值为且,,.∴的分布列为:∴.点睛:根据频率分布表绘制频率分布直方图时,注意小矩形的高是频率除以组距,各小矩形的面积和为.计算随机变量的分布列时,注意利用常见模型计算概率,如二项分布、超几何分布等.学科&网3.中国海军,正在以不可阻挡的气魄向深蓝进军。

2023年高考数学复习----《统计图表》规律方法与典型例题讲解

2023年高考数学复习----《统计图表》规律方法与典型例题讲解

2023年高考数学复习----《统计图表》规律方法与典型例题讲解【规律方法】1、制作频率分布直方图的步骤.第一步:求极差,决定组数和组距,组距=极差组数第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表;第四步:画频率分布直方图.2、解决频率分布直方图问题时要抓住3个要点.(1)直方图中各小矩形的面积之和为1;(2)直方图中纵轴表示频率组距,故每组样本的频率为组距⨯频率组距(3)直方图中每组样本的频数为频率⨯总体个数.3、用频率分布直方图估计众数、中位数、平均数的方法.(1)众数为频率分布直方图中最高矩形底边中点的横坐标;(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;(3)平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和.【典型例题】例1.(2022·云南昆明·昆明一中模拟预测)为了响应教育部门疫情期间“停课不停学”的号召,某校实施网络授课,为了检验学生上网课的效果,在高三年级进行了一次网络模拟考试,从中抽取了100人的数学成绩,绘制成频率分布直方图(如下图所示),其中数学成绩落在区间[110,120),[120,130),[130,140]的频率之比为4:2:1.(1)根据频率分布直方图求学生成绩在区间[110,120)的频率,并求抽取的这100名同学数学成绩的中位数(2)若将频率视为概率,从全校高三年级学生中随机抽取3个人,记抽取的3人成绩在[100,130)内的学生人数为X ,求X 的分布列与数学期望.【解析】(1)由直方图可知,数学成绩落在区间[70,110)内的频率为(0.0040.0120.0190.030)10+++⨯=0.65,所以数学成绩落在区间[110,140]内的频率为10.650.35−=,因为数学成绩落在区间[110,120),[120,130),[130,140]的频率之比为4:2:1,所以数学成绩落在区间[110,120)的频率为40.35421⨯++0.2=, 数学成绩落在区间[70,100)的频率为(0.0040.0120.019)100.35++⨯=, 所以中位数落在区间[100,110)内,设中位数为x ,则(100)0.0300.50.35x −⨯=−,解得105x =, 所以抽取的这100名同学数学成绩的中位数为105.(2)由(1)知,数学成绩落在区间[100,130)内的频率为0.0310⨯+0.2+20.35421⨯++0.6=,由题意可知,3~(3,)5X B ,X 的所有可能取值为0,1,2,3,033338(0)C ()(1)55125P X ==⋅−=,12333(1)C (1)55P X ==⋅⋅−36125=, 22333(2)C ()(1)55P X ==⋅⋅−54125=,330333(3)C ()(1)55P X ==⋅−27125=,所以X 的分布列为:所以数学期望8365427()0123125125125125E X =⨯+⨯+⨯+⨯95=.例2.(2022·贵州贵阳·贵阳六中校考一模)某校组织1000名学生进行科学探索知识竞赛,成绩分成5组:[)50,60,[)60,70,[)70,80,[)80,90,[]90,100,得到如图所示的频率分布直方图.若图中未知的数据a ,b ,c 成等差数列,成绩落在区间[)60,70内的人数为400.(1)求出直方图中a ,b ,c 的值;(2)估计中位数(精确到0.1)和平均数(同一组中的数据用该组区间的中点值代替); (3)若用频率估计概率,设从这1000人中抽取的6人,得分在区间[]90,100内的学生人数为X ,求X 的数学期望.【解析】(1)依题意可得:4001000100.04a =÷÷=,又a ,b ,c 成等差数列,所以2b a c =+且(0.0050.005)101a b c ++++⨯=,解得:0.02,0.03c b == 所以0.04,0.03,0.02a b c ===.(2)因为(0.0050.04)100.450.5+⨯=<,设中位数为x , 则[70,80)x ∈,所以()()0.0050.0410700.030.5x +⨯+−⨯=,解得:71.7x ≈,即中位数约为71.7,平均数为(550.005650.04750.03850.02950.005)1073⨯+⨯+⨯+⨯+⨯⨯=. (3)由题意可知:得分在区间[]90,100内概率为10.0051020⨯=, 根据条件可知:X 的所有可能值为0,1,2,3,4,5,6,且1(6,)20X ,所以1()60.320E X np ==⨯=.例3.(2022·全国·高三专题练习)为丰富学生课外生活,某市组织了高中生钢笔书法比赛,比赛分两个阶段进行:第一阶段由评委为所有参赛作品评分,并确定优胜者;第二阶段为附加赛,参赛人员由组委会按规则另行确定.数据统计员对第一阶段的分数进行了统计分析,这些分数X 都在[75,100)内,再以5为组距画分数的频率分布直方图(设“Y=频率组距”)时,发现Y 满足:7,15,15019,16,30011,16,1520n Y n k n n ⎧=⎪⎪⎪==⎨⎪⎪−⋅>⎪−⎩,55(1)n N n X n *∈≤<+. (1)试确定n 的所有取值,并求k ;(2)组委会确定:在第一阶段比赛中低于85分的同学无缘获奖也不能参加附加赛;分数在[95,100)内的同学评为一等奖;分数在[90,95)内的同学评为二等奖,但通过附加赛有111的概率提升为一等奖;分数在[85,90)内的同学评为三等奖,但通过附加赛有17的概率提升为二等奖(所有参加附加赛的获奖人员均不降低获奖等级,且附加赛获奖等级在第一阶段获奖等级基础上,最多升高一级).已知学生A 和B 均参加了本次比赛,且学生A 在第一阶段获得二等奖.①求学生B 最终获奖等级不低于学生A 最终获奖等级的概率;②已知学生A 和B 都获奖,记A ,B 两位同学最终获得一等奖的人数为ξ,求ξ的分布列和数学期望.【解析】(1)根据题意,X 在[75,100)内,按5为组距可分成5个小区间, 分别是[75,80),[80,85),[85,90),[90,95),[95,100),因为75100X ≤<,由55(1)n X n ≤<+,n N *∈,所以15,16,17,18,19n =.每个小区间的频率值分别是7,15,30195,1660115,17,18,19320n P Y n k n n ⎧=⎪⎪⎪===⎨⎪⎪−⋅=⎪−⎩由719111511306032k ⎛⎫++−++= ⎪⎝⎭,解得350k =. (2)①由于参赛学生很多,可以把频率视为概率.由(1)知,学生B 的分数属于区间[75,80),[80,85),[85,90),[90,95),[95,100)的概率分别是:730,1960,1460,1160,260.我们用符号ijA (或ijB )表示学生A (或B )在第一轮获奖等级为i ,通过附加赛最终获奖等级为j ,其中(,1,2,3)j i i j ≤=记“学生B 最终获奖等级不低于学生A 的最终获奖等级”为事件W , 则()12122223222()P W P B B B A B A =+++()()()()()()12122223222P B P B P B P A P B P A =+++2111111010141105160601160111160711220=+⋅+⋅⋅+⋅⋅=.②学生A 最终获得一等奖的概率是111A P =,学生B 最终获得一等奖的概率是21112116060272711272796060B P =+⋅=+=,1180(0)1111999P ξ⎛⎫⎛⎫==−−= ⎪⎪⎝⎭⎝⎭,111118(1)1111911999P ξ⎛⎫⎛⎫==⋅−+−⋅=⎪ ⎪⎝⎭⎝⎭, 111(2)11999P ξ==⋅=.所以ξ的分布列为:801812001299999999E ξ=⋅+⋅+⋅=.。

(整理)高考数学总复习专题系列——统计.板块二.频率直方图.学生版

(整理)高考数学总复习专题系列——统计.板块二.频率直方图.学生版

一.随机抽样1.随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法:⑴简单随机抽样:从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. 抽出办法:①抽签法:用纸片或小球分别标号后抽签的方法.②随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表.表中每一位置出现各个数字的可能性相同. 随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法.简单随机抽样是最简单、最基本的抽样方法.⑵系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.抽出办法:从元素个数为N 的总体中抽取容量为n 的样本,如果总体容量能被样本容量整除,设Nk n=,先对总体进行编号,号码从1到N ,再从数字1到k 中随机抽取一个数s 作为起始数,然后顺次抽取第2(1)s k s k s n k +++-,,,个数,这样就得到容量为n 的样本.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样.系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样.⑶分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样.分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛.2.简单随机抽样必须具备下列特点:⑴简单随机抽样要求被抽取的样本的总体个数N 是有限的. ⑵简单随机样本数n 小于等于样本总体的个数N . ⑶简单随机样本是从总体中逐个抽取的. ⑷简单随机抽样是一种不放回的抽样.⑸简单随机抽样的每个个体入样的可能性均为nN.3.系统抽样时,当总体个数N 恰好是样本容量n 的整数倍时,取Nk n=;若Nn不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量n 整除.因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍知识内容板块二.频率直方图然相等,为N n.二.频率直方图列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:取组距,用极差组距决定组数;③决定分点:决定起点,进行分组;④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图,知小长方形的面积=组距×频率组距=频率.频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x =来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.三.茎叶图制作茎叶图的步骤:①将数据分为“茎”、“叶”两部分;②将最大茎与最小茎之间的数字按大小顺序排成一列,并画上竖线作为分隔线; ③将各个数据的“叶”在分界线的一侧对应茎处同行列出.四.统计数据的数字特征用样本平均数估计总体平均数;用样本标准差估计总体标准差. 数据的离散程序可以用极差、方差或标准差来描述.极差又叫全距,是一组数据的最大值和最小值之差,反映一组数据的变动幅度; 样本方差描述了一组数据平均数波动的大小,样本的标准差是方差的算术平方根. 一般地,设样本的元素为12n x x x ,,,样本的平均数为x , 定义样本方差为222212()()()n x x x x x x s n-+-++-=,样本标准差s =简化公式:22222121[()]n s x x x nx n=+++-.五.独立性检验1.两个变量之间的关系;常见的有两类:一类是确定性的函数关系;另一类是变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的.当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.2.散点图:将样本中的n 个数据点()(12)i i x y i n =,,,,描在平面直角坐标系中,就得到了散点图.散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系.3.如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域.反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.此时,散点图中的点在从左上角到右下角的区域.散点图可以判断两个变量之间有没有相关关系.4.统计假设:如果事件A 与B 独立,这时应该有()()()P AB P A P B =,用字母0H 表示此式,即0:()()()H P AB P A P B =,称之为统计假设. 5.2χ(读作“卡方”)统计量:统计学中有一个非常有用的统计量,它的表达式为22112212211212()n n n n n n n n n χ++++-=,用它的大小可以用来决定是否拒绝原来的统计假设0H .如果2χ的值较大,就拒绝0H ,即认为A 与B 是有关的.2χ统计量的两个临界值:3.841、6.635;当2 3.841χ>时,有95%的把握说事件A 与B 有关;当2 6.635χ>时,有99%的把握说事件A 与B 有关;当23.841χ≤时,认为事件A 与B 是无关的.独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立的. 1.独立性检验的步骤:统计假设:0H ;列出22⨯联表;计算2χ统计量;查对临界值表,作出判断.2.几个临界值:222()0.10( 3.841)0.05( 6.635)0.01P P P χχχ≈≈≈≥2.706,≥,≥.22⨯联表的独立性检验:如果对于某个群体有两种状态,对于每种状态又有两个情况,这样排成一张22⨯的表,如下:状态B 状态B 合计 状态A 11n 12n 1n + 状态A21n 22n 2n +1n +2n +n如果有调查得来的四个数据11122122n n n n ,,,,并希望根据这样的4个数据来检验上述的两种状态A 与B 是否有关,就称之为22⨯联表的独立性检验.六.回归分析1.回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性. 回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.最小二乘法:记回归直线方程为:ˆy a bx =+,称为变量Y 对变量x 的回归直线方程,其中a b ,叫做回归系数.ˆy是为了区分Y 的实际值y ,当x 取值i x 时,变量Y 的相应观察值为i y ,而直线上对应于i x 的纵坐标是ˆi i ya bx =+. 设x Y ,的一组观察值为()i i x y ,,12i n =,,,,且回归直线方程为ˆya bx =+, 当x 取值i x 时,Y 的相应观察值为i y ,差ˆ(12)i i y yi n -=,,,刻画了实际观察值i y 与回归直线上相应点的纵坐标之间的偏离程度,称这些值为离差.我们希望这n 个离差构成的总离差越小越好,这样才能使所找的直线很贴近已知点. 记21()ni i i Q y a bx ==--∑,回归直线就是所有直线中Q 取最小值的那条.这种使“离差平方和为最小”的方法,叫做最小二乘法.用最小二乘法求回归系数a b ,有如下的公式: 1221ˆni ii nii x ynxy bxnx ==-=-∑∑,ˆˆa y bx =-,其中a b ,上方加“^”,表示是由观察值按最小二乘法求得的回归系数.3.线性回归模型:将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型. 产生随机误差的主要原因有:①所用的确定性函数不恰当即模型近似引起的误差; ②忽略了某些因素的影响,通常这些影响都比较小; ③由于测量工具等原因,存在观测误差. 4.线性回归系数的最佳估计值:利用最小二乘法可以得到ˆˆab ,的计算公式为 1122211()()()()nnii iii i nniii i xx y y x ynxyb xx xn x ====---==--∑∑∑∑,ˆˆa y bx =-,其中11n i i x x n ==∑,11nii y y n ==∑ 由此得到的直线ˆˆya bx =+就称为回归直线,此直线方程即为线性回归方程.其中ˆa ,b 分别为a ,b 的估计值,ˆa称为回归截距,b 称为回归系数,ˆy 称为回归值. 5.相关系数:()()nnii i ixx y y x ynx yr ---==∑∑6.相关系数r 的性质: ⑴||1r ≤;⑵||r 越接近于1,x y ,的线性相关程度越强; ⑶||r 越接近于0,x y ,的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. 7.转化思想:根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数. 8.一些备案 ①回归(regression )一词的来历:“回归”这个词英国统计学家Francils Galton 提出来的.1889年,他在研究祖先与后代的身高之间的关系时发现,身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们父母的平均身高高.Galton 把这种后代的身高向中间值靠近的趋势称为“回归现象”.后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析.②回归系数的推导过程:22222[()]222i i i i i i i i Q y a bx y a y na b x y ab x b x =--=-+-++∑∑∑∑∑∑ 22222()2i i i i i i na a b x y b x b x y y =+-+-+∑∑∑∑∑,把上式看成a 的二次函数,2a 的系数0n >,因此当2()2i i i ib x y y b x a n n --=-=∑∑∑∑时取最小值. 同理,把Q 的展开式按b 的降幂排列,看成b 的二次函数,当2i iiix y a xb x-=∑∑∑时取最小值.解得:12221()()()ni iii i niii x ynxyx x y y b x x xnx==---==--∑∑∑∑,a y bx =-, 其中1i y y n =∑,1i x x n=∑是样本平均数. 9. 对相关系数r 进行相关性检验的步骤: ①提出统计假设0H :变量x y ,不具有线性相关关系;②如果以95%的把握作出推断,那么可以根据10.950.05-=与2n -(n 是样本容量)在相关性检验的临界值表中查出一个r 的临界值0.05r (其中10.950.05-=称为检验水平); ③计算样本相关系数r ;④作出统计推断:若0.05||r r >,则否定0H ,表明有95%的把握认为变量y 与x 之间具有线性相关关系;若0.05||r r ≤,则没有理由拒绝0H ,即就目前数据而言,没有充分理由认为变量y 与x 之间具有线性相关关系. 说明:⑴对相关系数r 进行显著性检验,一般取检验水平0.05α=,即可靠程度为95%.⑵这里的r 指的是线性相关系数,r 的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系.⑶这里的r 是对抽样数据而言的.有时即使||1r =,两者也不一定是线性相关的.故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释.题型一 频率分布直方图【例1】 (2010西城二模)某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.则这200名同学中成绩大于等于80分且小于90分的学生有______名.典例分析【例2】 (2010东城二模)已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内的样本频数为 ,样本数据落在[2,10)内的频率为 .【例3】 (2010北京)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a = .若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[]140,150内的学生中选取的人数应为 .【例4】 (2010江苏高考)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[]540,中,其频率分布直方图如图所示,则其抽样的100根中,有____根在棉花纤维的长度小于20mm .(mm)频率组距【例5】 (2009湖北15)下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[)610,内的频数为 ,数据落在[)210,内的概率约为 .【例6】 (2009福建3)一个容量为100的样本,其数据的分组与各组的频数如下: 组别 (]010,(]1020, (]2030, (]3040, (]4050, (]5060, (]6070,频数12 13 2415 16 137则样本数据落在(]1040,上的频率为( )A .0.13B .0.39C .0.52D .0.64【例7】 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( )时间(h)A .0.6hB .0.9hC .1.0hD .1.5h【例8】 为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[)4555,,[)5565,,[)6575,,[)7585,,[)8595,由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)5575,的人数是 .产品数量0.0200.0150.0100.005【例9】 (2009山东8)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96106],,样本数据分组为[)9698,,[)98100,,[)100102,,[)102104,,[104106],.已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A .90B .75C .60D .45【例10】 某路段检查站监控录象显示,在某时段内,有1000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为右图的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90km/h 的车辆数为( )A .200B .600C .500D .300【例11】 (2006年全国II )一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本频率分布直方图,为了分析居民的收入与年龄、学历、职业等方面的联系,要从这10000人中用分层抽样的方法抽出100人做进一步调查,则在[25003000],(元)月收入段应抽出_____人.0.00050.00040.00030.00020.0001频率组距月收入(元)【例12】 如图为某样本数据的频率分布直方图,则下列说法不正确的是( )0.1频率组距A .[610),的频率为0.32B .若样本容量为100,则[1014),的频数为40C .若样本容量为100,则(10]-∞,的频数为40D .由频率分布布直方图可得出结论:估计总体大约有10%分布在[1014),【例13】 (2006北京模拟)下面是某学校学生日睡眠时间的抽样频率分布表:睡眠时间 人数 频率 [6 6.5), 5 0.05 [6.57), 17 0.17 [77.5), 33 0.33 [7.58), 37 0.37 [88.5), 6 0.06 [8.59), 2 0.02合计 100 1画出频率分布直方图,估计该校学生的日平均睡眠时间.【例14】 (2010崇文一模)为了调查某厂2000名工人生产某种产品的能力,随机抽查了m 位工人某天生产该产品的数量,产品数量的分组区间为[)10,15,[)15,20,[)20,25,[)25,30,[30,35],频率分布直方图如图所示.已知生产的产品数量在[)20,25之间的工人有6位.⑴求m ;10 15 20 25 30 35 产品数量⑵工厂规定从各组中任选1人进行再培训,则选取5人不在同一组的概率是多少?【例15】考查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)⑴作出频率分布表;⑵画出频率分布直方图.【例16】(2010陕西卷高考)为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行出样检查,测得身高情况的统计图如下:/cm/cm⑴估计该小男生的人数;⑵估计该校学生身高在170~185cm之间的概率;⑶从样本中身高在165~180cm之间的女生..中任选2人,求至少有1人身高在170~180cm之间的概率.【例17】从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表,画出频率分布直方图及折线图,并根据作出的频率分布直方图估计身高不小于170的同学的人数.【例18】为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如下图),已知图中从左到右的前三个小组的频率分别是0.10.30.4,,.第一小组的频数是5.⑴求第四小组的频率和参加这次测试的学生人数;⑵在这次测试中,学生跳绳次数的中位数落在第几小组内?⑶参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩优秀率是多少?【例19】 为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛. 为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计. 请你根据尚未完成并有局部污损的频率分布表和频数分布直方图,解答下列问题: ⑴ 填充频率分布表的空格(将答案直接填在表格内); ⑵ 补全频数条形图;⑶ 若成绩在75.5~85.5分的学生为二等奖,问获得二等奖的学生约为多少人?【例20】 (2010丰台一模)某校高三(1)班的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题.频率⑴求全班人数及分数在[)80,90之间的频数;⑵估计该班的平均分数,并计算频率分布直方图中[)80,90间的矩形的高;⑶若要从分数在[]80,100之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在[]90,100之间的概率.【例21】某地区为了了解70~80岁老人的日平均睡眠时间(单位:h).随机选择了50位老人的进行调查.下表是这50位老人日睡眠时间的频率分布表.在上述统计数据中,一部分计算见算法流程图(其中←可用=代替),则输出的S的值是.。

频率分布直方图典例解析

频率分布直方图典例解析
一 、 识 图 与 基本 运算 题 例1 在某一样本的频率分布表 中,第三组 的频
数和频率分别为24和÷ ,则该样本的样本容量为

( )。
一~一一舳 一 解得a=15。b=15。
设 “该 学 校 学 生 的 Et平 均 睡 眠 时 间 在 7/h时 以
上 ”为事件 ,则P(A)= =0.38。
50
该学校学生 的 日平 均睡眠时 间在 7小 时以上 的 概率 约 为 0.38。
三 、与 其 他知 识 结 合 的 创 新题 例 3 某 中学 团委 组织 了 “我 对 祖 国 知 多 少 ”的 知识竞赛 ,从参加考试 的学生 中抽 出60名学生 ,将其 成 绩 (均 为整 数 )分 成 六 组 [40,50),[50,6O),… ,
O.20 0 O8
(2)由题 意 ,知
1f ×6×4.5+10×5.5+(Ⅸ6.5+6×7.5+4×8.5=6.52, 50 I6+10+叶 6+4=50。
(分 )
图 2
(2)依 题 意 ,60分 及 以上 的分 数 在 [60,70), [70,80),[80,90),[90,100]这 四个组 ,其频 率和 为 (0.015+0.03+0.025+0.005)xlO=0.75。所 以估计这 次 考 试 的 及 格率 是 75%。
利用组 中值估算 学生成绩 的平均 分 ,则有45x
0.1+55x0.15+65x0.15+75x0.3+85x0.25+95x0.05=71 o
所 以估计这次考试 的平均分是71分 。 (3)成绩在 [40,50)的人数是 60xO.1=6,成绩 在
[90,100] 的 人 数 是 60×0.05=3,所 以 从 成 绩 在 [40,50)与[90,100]的学生 中选 两人 ,他们在同一分

高考数学专题统计《用频率直方图估计总体分布《百分位数》突破解析

高考数学专题统计《用频率直方图估计总体分布《百分位数》突破解析

14.4.3用频率直方图估计总体分布14.4.4百分位数必备知识基础练1.以下数据为参加数学竞赛决赛的15人的成绩(单位:分):78,70,72,86,88,79,80,81,94,84,56,98,83,90,91.这15人成绩的80百分位数是()A.90B.90.5C.91D.91.5=12,56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为80×15100=90.5.所以这15人成绩的80百分位数是90+9122.如图是某工厂对一批新产品长度(单位:mm)检测结果的频率直方图.估计这批产品的平均数与中位数分别为()A.22.5,20B.22.5,22.75C.22.75,22.5D.22.75,25,这批产品的平均数为x=5×(0.02×12.5+0.04×17.5+0.08×22.5+0.03×27.5+0.03×32.5)=22.75,其中位数为=22.5.故选C.x0=20+0.5-(0.02+0.04)×50.083.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,50百分位数为b,则有()A.a=13.7,b=15.5B.a=14,b=15C.a=12,b=15.5D.a=14.7,b=1510,12,14,14,15,15,16,17,17,17,其平均数a=110×(10+12+14+14+15+15+16+17+17+17)=14.7,因为50×10100=5,所以这10名工人一小时内生产零件的50百分位数为b=15+152=15. 4.已知甲、乙两组数据(已按从小到大的顺序排列): 甲组:27,28,39,40,m ,50; 乙组:24,n ,34,43,48,52.若这两组数据的30百分位数,80百分位数分别相等,则mn等于( ) A.127 B.107C.43D.74因为30100×6=1.8,80100×6=4.8,所以30百分位数为n=28,80百分位数为m=48,所以mn =4828=127. 5.1,2,3,4,5,6,7,8,9,10这组数据的25百分位数为 ,75百分位数为 ,90百分位数为 .8 9.510,而且10×25%=2.5,10×75%=7.5,10×90%=9,所以该组数据的25百分位数为3,75百分位数为8,90百分位数为9+102=9.5. 6.某学校组织学生参加数学测试,成绩的频率直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的 百分位数.[20,40),[40,60)的频率之和为(0.005+0.01)×20=0.3,所以60分为成绩的30百分位数.7.某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45]岁之间,根据调查结果得出司机的年龄情况残缺的频率直方图如图所示,利用这个残缺的频率直方图估计该市出租车司机年龄的中位数大约是 (保留一位小数)..6,所有矩形面积之和为1,所以,数据位于[25,30)的频率为1-(0.01+0.07+0.06+0.02)×5=0.2, 前两个矩形的面积之和为0.01×5+0.2=0.25, 前三个矩形的面积之和为0.25+0.07×5=0.6, 所以,中位数位于区间[30,35),设中位数为a , 则有0.25+(a-30)×0.07=0.5,解得a ≈33.6(岁). 8.求下列数据的四分位数. 13,15,12,27,22,24,28,30,31,18,19,20.12个数据按从小到大的顺序排列为12,13,15,18,19,20,22,24,27,28,30,31,计算25×12100=3,50×12100=6,75×12100=9, 所以数据的25百分位数为15+182=16.5, 50百分位数为20+222=21,75百分位数为27+282=27.5. 9.某网络营销部门随机抽查了某市200名网友在2019年11月11日的网购金额,所得数据如下表:已知网购金额低于3千元与不低于3千元的人数比恰为3∶2. (1)试确定x ,y ,p ,q 的值,并补全频率直方图;(2)估计网购金额的25百分位数(结果保留三位有效数字).根据题意有{16+24+x +y +16+14=200,16+24+x y+16+14=32,解得{x =80,y =50.所以p=0.4,q=0.25.补全频率直方图如图所示.(2)由(1)可知,网购金额低于2千元的频率为0.08+0.12=0.2,网购金额低于3千元的频率为0.2+0.4=0.6,所以网购金额的25百分位数在[2,3)内,则网购金额的25百分位数估计为2+0.25-0.20.6-0.2×1=2.125≈2.13. 关键能力提升练10.数据3.2,3.4,3.8,4.2,4.3,4.5,x ,6.6的65百分位数是4.5,则实数x 的取值范围是( ) A.[4.5,+∞) B.[4.5,6.6) C.(4.5,+∞)D.(4.5,6.6]65×8100=5.2,所以这组数据的65百分位数是第6个数据4.5,则x ≥4.5,故选A.11.港珠澳大桥于2018年10月24日正式通车,它是中国境内一座连接香港、珠海和澳门的桥隧工程.桥隧全长55千米,桥面为双向六车道高速公路,大桥通行限速100 km/h .现对大桥某路段上汽车行驶速度进行抽样调查,画出频率直方图(如图).根据直方图估计在此路段上汽车行驶速度的众数和行驶速度超过90 km/h 的频率分别为( )A.85,0.25B.90,0.35C.87.5,0.25D.87.5,0.35=87.5,由频率直方图估计在此路段由频率直方图估计在此路段上汽车行驶速度的众数为85+902上汽车行驶速度超过90 km/h的频率为(0.05+0.02)×5=0.35,所以由频率直方图估计在此路段上汽车行驶速度超过90 km/h的频率为0.35.12.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率直方图如图所示.估计棉花纤维的长度的样本数据的80百分位数是()A.29 mmB.29.5 mmC.30 mmD.30.5 mm30 mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,在25 mm以=29,可以估计棉花下的比例为85%-25%=60%,因此,80百分位数一定位于[25,30)内,由25+5×0.80-0.600.85-0.60纤维的长度的样本数据的80百分位数是29 mm.13.(多选)已知100个数据的75百分位数是9.3,则下列说法不正确的是()A.这100个数据中一定有75个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第75个数据C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数=75为整数,所以第75个数据和76个数据的平均数为75百分位数,是9.3,则C正75×100100确,其他选项均不对,故选ABD.14.(多选)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的平均数等于乙的成绩的平均数C.甲的成绩的80百分位数等于乙的成绩的80百分位数D.甲的成绩的极差等于乙的成绩的极差,x 甲=4+5+6+7+85=6,x 乙=3×5+6+95=6,A 项错误,B 项正确;甲的成绩的80百分位数为7+82=7.5,乙的成绩的80百分位数为6+92=7.5,所以二者相等,所以C 项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D 项正确.15.已知30个数据的60百分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是 ..660×30100=18,设第19个数据为x ,则7.8+x2=8.2,解得x=8.6,即第19个数据是8.6.16.如图是某市2020年4月1日至4月7日每天最高、最低气温的折线统计图,这7天的日最高气温的10百分位数为 ,日最低气温的80百分位数为 .℃ 16 ℃,把日最高气温按照从小到大排序,得24,24.5,24.5,25,26,26,27,因为共有7个数据,所以7×10100=0.7,不是整数,所以这7天日最高气温的10百分位数是第1个数据,为24 ℃.把日最低气温按照从小到大排序,得12,12,13,14,15,16,17,因为共有7个数据,所以7×80100=5.6,不是整数,所以这7天日最低气温的80百分位数是第6个数据,为16 ℃.17.某年级120名学生在一次百米跑测试中,成绩全部介于13秒与18秒之间,将测试结果分成5组,即[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率直方图,如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70百分位数约为 秒..570百分位数为x ,因为1+3+71+3+7+6+3=0.55,1+3+7+61+3+7+6+3=0.85,所以x ∈[16,17),所以0.55+(x-16)×61+3+7+6+3=0.70,解得x=16.5. 18.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为 ;(2)由频率直方图估计志愿者年龄的85百分位数为 岁(结果保留整数)..04 (2)39设[25,30)年龄组对应小矩形的高度为h ,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.(2)由图可知,年龄小于35岁的频率为(0.01+0.04+0.07)×5=0.6,年龄小于40岁的频率为(0.01+0.04+0.07+0.06)×5=0.9,所以志愿者年龄的85百分位数在[35,40)内,因此志愿者年龄的85百分位数为35+0.85-0.60.9-0.6×5≈39(岁). 19.(2021浙江宁波期末)首次实施新高考的八省(市)于2021年1月23日统一举行了新高考适应性考试,在联考结束后,根据联考成绩,考生可了解自己的学习情况,作出升学规划,决定是否参加强基计划.在本次适应性考试中,某学校为了解高三学生的联考情况,随机抽取了100名学生的联考数学成绩作为样本,并按照分数段[50,70),[70,90),[90,110),[110,130),[130,150]分组,绘制了如图所示的频率直方图.(1)求出图中a的值并估计本次考试及格率(“及格率”指得分为90分及以上的学生所占比例);(2)估计该校学生联考数学成绩的80百分位数;(3)估计该校学生联考数学成绩的众数、平均数.由(0.004+a+0.013+0.014+0.016)×20=1,解得a=0.003,则及格率为(0.016+0.014+0.003)×20=0.66=66%.(2)得分在110以下的学生所占比例为(0.004+0.013+0.016)×20=0.66,得分在130以下的学生所=120(分),估计占比例为0.66+0.014×20=0.94,所以80百分位数位于[110,130)内,由110+20×0.8-0.660.94-0.6680百分位数为120.(3)由图可得,众数估计值为100.平均数估计值为0.08×60+0.26×80+0.32×100+0.28×120+0.06×140=99.6(分).学科素养创新练20.2020年某地苹果出现滞销现象,为了帮助当地果农打开销路,当地政府与全国一些企业采用团购的方式带动销售链,使得当地果农积压的许多苹果有了销路.为了解果农们苹果的销售量情况,当地农业局随机对100名果农的苹果销售量进行统计,将数据按照[90,110),[110,130),[130,150),[150,170]分成4组,得到如图所示的频率直方图.(1)试估计这100名果农苹果销售量的平均数;(2)根据题中的频率直方图,估计销售量样本数据的80百分位数(结果精确到0.1);(3)假设这100名果农在未打开销路之前都积压了2万千克的苹果,通过团购的方式果农每千克苹果的纯利润为1.3元,而积压仍未售出的苹果每千克将损失2元的成本费,试估计这100名果农积压的苹果通过此次团购活动获得的总利润.设这100名果农苹果销售量的平均数为x百千克,则x=(100×0.002 5+120×0.01+140×0.0225+160×0.015)×20=140(百千克),故这100名果农苹果销售量的平均数为1.4万千克.(2)因为(0.002 5+0.010 0)×20=0.25<0.8,0.25+0.225×20=0.7<0.8,×20≈156.7.所以80百分位数在第4组内,且80百分位数为150+0.8-0.71-0.7(3)销售量在[90,110)的每位果农的利润为100×100×1.3-(2×104-100×100)×2=-0.7(万元);销售量在[110,130)的每位果农的利润为120×100×1.3-(2×104-120×100)×2=-0.04(万元);销售量在[130,150)的每位果农的利润为100×140×1.3-(2×104-140×100)×2=0.62(万元);销售量在[150,170]的每位果农的利润为100×160×1.3-(2×104-160×100)×2=1.28(万元).因为[90,110),[110,130),[130,150),[150,170)这4组的人数分别为5,20,45,30,所以这100名果农积压的苹果通过此次团购活动获得的总利润约为-0.7×5-0.04×20+0.62×45+1.28×30=62(万元).。

频率分布直方图经典题型剖析

频率分布直方图经典题型剖析

频率分布直方图经典题型剖析ʏ胡 磊频率分布直方图属于一种重要的统计图表,在统计中具有广泛的应用㊂频率分布直方图是高考考查的重要知识点,下面对这类题型进行剖析㊂一㊁明确频率分布直方图中的相关结论1.求解频率分布直方图问题的关键是掌握频率分布直方图中的相等关系,其主要关系包括:(1)各小组的频数之和等于样本容量;(2)频率=频数样本容量;(3)各小组的频率之和等于1;(4)各小组的组距相等,即每个小长方形的宽都相等;(5)各小长方形的高=频率组距=频数样本容量ˑ组距,即小长方形的高与频率成正比,与频数也成正比;(6)各小长方形的面积等于各组的频率,小长方形面积之和等于频率之和,即为1㊂2.利用频率分布直方图估计几种数据:在频率分布直方图中,众数是最高小长方形底边中点的横坐标所对应的数据,它表示样本数据的中心值;在频率分布直方图中,中位数是左右两边的小长方形的面积相等的底边的值;平均数等于各个小长方形的面积乘以对应的小长方形的底边中点的横坐标之和㊂二㊁频率分布直方图经典题型剖析1.频率分布直方图的相关计算㊂例1 统计某校学生的某次数学同步练习成绩(满分150分),根据成绩分成六组:[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],绘制的频率分布直方图如图1所示,若已知不低于140分的人数为110,则该校被统计的学生人数是( )㊂图1A.800 B .900C .1200D .1000分析:由频率分布直方图可求出n =0.011,从而可得不低于140分的频率为0.011ˑ10=0.11,由此求出该校被统计的学生人数㊂解:由频率分布直方图可得10ˑ(0.031+0.02+0.016ˑ2+n +0.006)=1,解得n =0.011㊂因为不低于140分的频率为0.011ˑ10=0.11,所以该校被统计的学生人数为1100.11=1000㊂应选D㊂本题主要考查频率分布直方图的有关计算,考查同学们的计算求解能力㊂例2 港珠澳大桥于2018年10月正式通车,它是中国境内一座连接香港㊁珠海和澳门的桥隧工程,桥隧全长55k m ,桥面为双向六车道高速公路,大桥通行限速100k m /h㊂现对大桥某路段上1000辆汽车的行驶速度进行抽样调查,画出了频率分布直方图(如图2)㊂根据频率分别直方图,估计在此路段上汽车行驶速度在区间[85,90)上的车辆数和行驶速度超过90k m /h 的频率分别为( )㊂图2A.300,0.25B .300,0.35C .60,0.25D .60,0.35分析:由频率分布直方图可求出在此路段上汽车行驶速度在区间[85,90)上的频率,从而求出在此路段上汽车行驶速度在区间[85,90)上的车辆数,再求出行驶速度超过93解题篇㊃经典题突破方法 高一使用 2019年12月90k m /h 的频率㊂解:由频率分布直方图可得,在此路段上汽车行驶速度在区间[85,90)上的频率为0.06ˑ5=0.3,所以在此路段上汽车行驶速度在区间[85,90)上的车辆数为0.3ˑ1000=300,行驶速度超过90k m /h 的频率为(0.05+0.02)ˑ5=0.35㊂应选B㊂样本的频率分布直方图的画法步骤:计算数据极差x m a x -x m i n ;决定组距和组数;决定分点;列频率分布表;画频率分布直方图㊂2.利用频率分布直方图求平均数㊁中位数㊁众数㊂例3 某企业对其生产的一批产品进行检测,得出每件产品中某种物质含量(单位:g)的频率分布直方图,如图3所示,则该物质含量的众数和平均数分别为( )㊂图3A.83和84 B .83和85C .85和84D .85和85分析:由频率分布直方图中最高小长方形可知众数落在第三小组,从而求出众数的值,再由每个小组的频率以及中间值求出平均数㊂解:根据频率分布直方图可知众数落在第三小组,所以众数为80+902=85㊂由含量在[60,70)内的频率为0.1,含量在[70,80)内的频率为0.2,含量在[80,90)内的频率为0.4,可得含量在[90,100)内的频率为0.3,所以该物质含量的的平均数为65ˑ0.1+75ˑ0.2+85ˑ0.4+95ˑ0.3=84㊂应选C㊂本题主要考查频率分布直方图中众数和平均数的求法,考查运算求解能力㊂例4 在某次高中学科竞赛中,4000名考生的参赛成绩统计如图4所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中错误的是( )㊂图4A .成绩在[70,80]内的考生人数最多B .不及格的考生人数为1000C .考生竞赛成绩的平均分约为70.5D .考生竞赛成绩的中位数为75分析:利用频率分布直方图即可判断四个选项的正确与否㊂解:根据频率分布直方图可得,成绩在[70,80]内的频率最大,即考生人数最多,A 正确㊂不及格的考生人数为10ˑ(0.01+0.015)ˑ4000=1000,B 正确㊂根据频率分布直方图估计考试成绩的平均分为45ˑ0.1+55ˑ0.15+65ˑ0.2+75ˑ0.3+85ˑ0.15+95ˑ0.1=70.5,C 正确㊂由前四组的频率大于0.5,前三组的频率等于0.45,可知中位数在第四组,可得考生竞赛成绩的中位数为70+0.5-0.450.3ˑ10ʈ71.67,D 错误㊂应选D㊂在频率分布直方图中,众数是最高小长方形底边的中点所对应的数据,它表示样本数据的中心值;中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但有偏差;平均数等于每个小长方形的面积乘以小长方形底边中点的横坐标之和,平均数是频率分布直方图的 重心 ,它是频率分布直方图的 平衡点㊂作者单位:山东省平邑县第一中学西校(责任编辑 郭正华)4 解题篇㊃经典题突破方法 高一使用 2019年12月。

高考一轮复习第10章统计统计案例第2讲用样本估计总体

高考一轮复习第10章统计统计案例第2讲用样本估计总体

第二讲 用样本估计总体知识梳理·双基自测 知识梳理知识点一 用样本的频率分布估计总体分布 (1)频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,从中可以看到整个样本数据的频率分布情况.绘制频率分布直方图的步骤为:①_求极差__;②_决定组距与组数__;③_将数据分组__;④_列频率分布表__;⑤_画频率分布直方图__.(2)频率分布折线图顺次连接频率分布直方图中_各小长方形上端的中点__,就得到频率分布折线图. (3)总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,它能提供更加精细的信息. 知识点二 茎叶图(1)茎叶图中茎是指_中间__的一列数,叶是从茎的_旁边__生长出来的数.(2)茎叶图的优点是可以_保留__原始数据,而且可以_随时__记录,这对数据的记录和表示都能带来方便.知识点三 样本的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x =_x 1+x 2+…+x nn__,反映了一组数据的平均水平.(4)标准差: s =_1n[x 1-x2+x 2-x2+…+x n -x2]__,反映了样本数据的离散程度.(5)方差:s 2=_1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]__,反映了样本数据的离散程度.重要结论(1)若一组数据x i (i =1,2,…,n)的平均数为x -,方差为s 2,则数据组ax i +b(i =1,2,…,n ,a ,b 为常数)的平均数为a x -+b ,方差为a 2·s 2.(2)频率分布直方图与众数、中位数与平均数的关系 ①最高的小长方形底边中点的横坐标即是众数.②中位数左边和右边的小长方形的面积和是相等的,均为12.③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.双基自测题组一 走出误区1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × ) 题组二 走进教材2.(P 81A 组T1改编)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( B )A .95,94B .92,86C .99,86D .95,91[解析]由茎叶图可知,此组数据由小到大排列依次76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B .3.(P 7T1)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有_25__人.[解析]100×(0.5×0.5)=25(人).题组三走向高考4.(2020·新课标Ⅲ)设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为( C )A.0.01 B.0.1C.1 D.10[解析]∵样本数据x1,x2,…,x n的方差为0.01,∴根据任何一组数据同时扩大几倍方差将变为平方倍增长,∴数据10x1,10x2,…,10x n的方差为:100×0.01=1,故选C.5.(2020·天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( B )A.10 B.18C.20 D.36[解析]直径落在区间[5.43,5.47)的频率为(6.25+5)×0.02= 0.225,则被抽取的零件中,直径落在区间[5.43,5.47)内的个数为0.225×80 =18个,故选B.考点突破·互动探究考点一频率分布直方图——自主练透例1 (1)(2021·江西赣州十四县联考)中央电视台播出《中国诗词大会》火遍全国,下面是组委会在选拔赛时随机抽取的100名选手的成绩,按成绩分组,得到的频率分布表如下所示:组号分组频数频率第1组[160,165) 0.100笫2组[165,170) ①第3组[170,175) 20 ②第4组[175,180) 20 0.200第5组[180,185) 10 0.100合计100 1.00(ⅰ)请先求出频率分布表中①、②位置的相应数据,再完成频率分布直方图(用阴影表示).(ⅱ)为了能选拔出最优秀的选手,组委会决定在笔试成绩高的第3,4,5组中用分层抽样抽取5名选手进入第二轮面试,则第3,4,5组每组各抽取多少名选手进入第二轮面试?(ⅲ)在(ⅱ)的前提下,组委会决定在5名选手中随机抽取2名选手接受考官A面试,求第4组至少有一名选手被考官A面试的概率.(2)(2021·福建漳州质检)2018年9月的台风“山竹”对我国多个省市的财产造成重大损害,据统计直接经济损失达52亿元.某青年志愿者组织调查了某地区的50个农户在该次台风中造成的直接经济损失,将收集的损失数据分成五组:[0,2 000],(2 000,4 000],(4 000,6 000],(6 000,8 000],(8 000,10 000](单位:元),得到如图所示的频率分布直方图.(ⅰ)试根据频率分布直方图估计该地区每个农户的损失(同一组中的数据用该区间的中点值代表);(ⅱ)台风后该青年志愿者与当地政府向社会发出倡议,为该地区的农户捐款帮扶,现从这50户损失超过4 000元的农户中随机抽取2户进行重点帮扶,设抽出损失超过8 000元的农户数为X,求X的分布列和数学期望.[解析](1)(ⅰ)第1组的频数为100×0.100=10,所以①处应填的数为100-(10+20+20+10)=40, 从而第2组的频率为40100=0.400.②处应填的数为1-(0.1+0.4+0.2+0.1)=0.200. 频率分布直方图如图所示.(ⅱ)因为第3,4,5组共有50名选手,所以利用分层抽样在50名选手中抽取5名选手进入第二轮面试时,每组抽取的人数分别为:第3组:2050×5=2,第4组:2050×5=2,第5组:1050×5=1,所以第3,4,5组分别抽取2人,2人,1人进入第二轮面试. (ⅲ)记“第4组至少有一名选手被考官A 面试”为事件A , 则P(A)=C 12C 13+C 22C 25=710. ⎝ ⎛⎭⎪⎫或P A =1-P A -=1-C 23C 25=710 (2)(ⅰ)记每个农户的平均损失为x -元,则x -=1 000×0.3+3 000×0.4+5 000×0.18+7 000×0.06+9 000×0.06=33 601;(ⅱ)由频率分布直方图,可得损失超过 4 000元的农户共有(0.000 09+0.000 03+0.000 03)×2 000×50=15(户),损失超过8 000元的农户共有0.000 03×2 000×50=3(户),随机抽取2户,则X 的可能取值为0,1,2; 计算P(X =0)=C 212C 215=2235,P(X =1)=C 112C 13C 215=1235,P(X =2)=C 23C 215=135.所以X 的分布列为:X0 1 2P2235 1235 135数学期望为E(X)=0×2235+1×1235+2×135=25.名师点拨应用频率分布直方图时的注意事项用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距;(2)频率分布直方图中各长方形高的比也就是其频率之比;(3)频率分布直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.〔变式训练1〕(1)(2021·安徽“皖南八校”摸底)某校高三年级有400名学生,在一次数学测试中,成绩都在[80,130](单位:分)内,其频率分布直方图如图,则这次测试数学成绩不低于100分的人数为_220__.(2)(2021·山西适应性考试)某病毒引起的肺炎的潜伏期平均为7天左右,短的约2~3天,长的约10~14天,甚至有20余天.某医疗机构对400名确诊患者的潜伏期进行统计,整理得到以下频率分布直方图.根据该直方图估计:要使90%的患者显现出明显病状,需隔离观察的天数至少是( C )A .12B .13C .14D .15[解析] (1)根据频率分布直方图知: (2a +0.04+0.03+0.02)×10=1⇒a =0.005; 计算出数学成绩不低于100分的频率为: (0.03+0.02+0.005)×10=0.55;所以这次测试数学成绩不低于100分的人数为0.55×400=220人.(2)由题可知,第一,二,三,四,五组的频率分别为0.16,0.4,0.32,0.08,0.04. 因为前三组的频率和为0.88, 故要使90%的患者显现出明显病状,则需隔离观察的天数至少是:13+0.9-0.880.02=14,故选C .考点二 茎叶图——师生共研例2 (多选题)(2021·四川省乐山市调研改编)胡萝卜中含有大量的β-胡萝卜素,摄入人体消化器官后,可以转化为维生素A ,现从a ,b 两个品种的胡萝卜所含的β-胡萝卜素(单位mg)得到茎叶图如图所示,则下列说法正确的是( ABD )A .x a <x bB .a 的方差大于b 的方差C .b 品种的众数为3.31D .a 品种的中位数为3.27 [解析] 由茎叶图得:b 品种所含β-胡萝卜素普遍高于a 品种, ∴x a <x b ,故A 正确;a 品种的数据波动比b 品种的数据波动大, ∴a 的方差大于b 的方差,故B 正确; b 品种的众数为3.31与3.41,故C 错误; a 品种的数据的中位数为:3.23+3.312=3.27,故D 正确.名师点拨茎叶图的绘制及应用(1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.〔变式训练2〕(2019·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 与y 的值分别为( A )A .3,5B .5,5C .3,7D .5,7[解析] 甲组数据的中位数为65,由甲、乙两组数据的中位数相等,得y =5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78),∴x =3.故选A . 考点三 样本数字特征——多维探究 角度1 样本数字特征与频率分布直方图例3 (1)如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是( B )A .12.5,12.5B .12.5,13C .13,12.5D .13,13[解析] 由频率分布直方图可知,众数为10+152=12.5,因为0.04×5=0.2,0.1×5=0.5,在频率分布直方图中,中位数左边和右边的面积相等,所以中位数在区间[10,15)内.设中位数为x ,则(x -10)×0.1=0.5-0.2,解得x =13.角度2 样本数字特征与茎叶图(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:⎪⎪⎪897 74 0 1 0 x 9 1则7个剩余分数的方差为_367__.[解析] 由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4,∴s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.角度3 样本数字特征的计算(3)(2021·湖北武汉、襄阳、荆门、宜昌四地六校考试联盟联考)已知某7个数据的平均数为5,方差为4,现又加入一个新数据5,此时这8个数的方差s 2为( C )A .52B .3C .72D .4[解析] 设某7个数据分别为a 1,a 2,…,a 7, 则由题意得a 1+a 2+…+a 7=5×7=35, (a 1-5)2+(a 2-5)2+…+(a 7-5)2=4×7=28, 加入新数据5后的平均数x -=35+58=5,方差s 2=a 1-52+a 2-52+…+a 7-52+5-528=288=72.故选C .名师点拨平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数,中位数,众数描述其集中趋势,方差和标准差描述其波动大小.〔变式训练3〕(1)(角度1)某小区共有1 000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为_155__,平均数为_156.8__.(2)(角度2)(2021·陕西西安八校联考)在一次技能比赛中,共有12人参加,他们的得分(百分制)茎叶图如图,则他们得分的中位数和方差分别为( B )A .89 54.5B .89 53.5C .87 53.5D .89 54(3)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x 1,x 2,x 3,…,x 100,它们的平均数为x -,方差为s 2:其中扫码支付使用的人数分别为3x 1+2,3x 2+2,3x 3+2,…,3x 100+2,它们的平均数为x -′,方差为s′2,则x -′,s′2分别为( C )A .3x -+2,3s 2+2 B .3x -,3s 2C .3x -+2,9s 2D .3x -+2,9s 2+2[解析] (1)中位数为:150+(170-150)×0.10.02×20=155.该组数据的平均数为x =0.005×20×120+0.015×20×140+0.020×20×160+0.005×20×180+0.003×20×200+0.002×20×220=156.8.(2)由题可知,中位数为:87+912=89,先求平均数:x -=78+79+84+86+87+87+91+94+98+98+99+9912=90,S 2=112[(-12)2+(-11)2+(-6)2+(-4)2+(-3)2+(-3)2+12+42+82+82+92+92]=53.5,故中位数为:89,方差为53.5,故选:B .(3)显然x -′=3x -+2,而每个数据上都加上或减去相同数不影响方差,但每个数据都乘以a ,则方差变为原方差的a 2倍,故选C .考点四 折线图——师生共研例4 (多选题)(2021·河南顶级名校模拟改编)如图是某地某月1日至15日的日平均温度变化的折线图,根据该折线图,下列结论不正确的是( BCD )A .连续三天日平均温度的方差最大的是7日,8日,9日三天B .这15天日平均温度的极差为15 ℃C .由折线图能预测16日温度要低于19 ℃D .由折线图能预测本月温度小于25 ℃的天数少于温度大于25 ℃的天数[解析] A 选项,日平均温度的方差的大小取决于日平均温度的波动的大小,7,8,9三日的日平均温度的波动最大,故日平均温度的方差最大,正确;B 选项,这15天日平均温度的极差为18 ℃,B 错;C 选项,由折线图无法预测16日温度是否低于19 ℃,故C 错误;D 选项,由折线图无法预测本月温度小于25 ℃的天数是否少于温度大于25 ℃的天数,故D 错误.故选B 、C 、D .名师点拨折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.〔变式训练4〕(多选题)甲乙两名同学在本学期的六次考试成绩统计如图,甲乙两组数据的平均值分别为x -甲、x -乙,则( BC )A .每次考试甲的成绩都比乙的成绩高B .甲的成绩比乙稳定C .x -甲一定大于x -乙D .甲的成绩的极差大于乙的成绩的极差[解析] 第二次考试甲的成绩比乙低,A 错;由图可知甲的成绩比乙的成绩波动小,B 正确,D 错;甲的平均成绩显然比乙的平均成绩高,C 正确;故选B 、C .名师讲坛·素养提升 高考与频率分布直方图例5 (2021·安徽省池州市期末)高三年级某班50名学生期中考试数学成绩的频率分布直方图如图所示,成绩分组区间为:[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150].其中a ,b ,c 成等差数列且c =2a ,物理成绩统计如表.(说明:数学满分150分,物理满分100分)分组 [50,60) [60,70) [70,80) [80,90) [90,100]频数6920105(1)根据频率分布直方图,请估计数学成绩的平均分; (2)根据物理成绩统计表,请估计物理成绩的中位数;(3)若数学成绩不低于140分的为“优”,物理成绩不低于90分的为“优”,已知本班中至少有一个“优”同学总数为6人,从此6人中随机抽取3人.记X 为抽到两个“优”的学生人数,求X 的分布列和期望值.[解析] (1)根据频率分布直方图得, (a +b +2c +0.024+0.020+0.004)×10 =1, 又因a +c =2b ,c =2a ,解得a =0.008,b =0.012,c =0.016, 故数学成绩的平均分x -=85×0.04+95×0.12+105×0.16+115×0.2+125×0.24 +135×0.16+145×0.08=117.8(分),(2)总人数50分,由物理成绩统计表知,中位数在成绩区间[70,80), 所以物理成绩的中位数为75分.(3)数学成绩为“优”的同学有4人,物理成绩为“优”有5人,因为至少有一个“优”的同学总数为6名同学,故两科均为“优”的人数为3人,故X 的取值为0、1、2、3.P(X =0)=C 33C 36=120,P(X =1)=C 13C 23C 36=920,P(X =2)=C 23C 13C 36=920,P(X =3)=C 33C 36=120,所以分布列为:X 0 1 2 3 P120920920120∴期望值为E(X)=0×120+1×920+2×920+3×120=32.名师点拨(1)通过统计图可以很清楚地表示出各部分数量同总数之间的关系. (2)准确理解频率分布直方图的数据特点是解题关键. 〔变式训练5〕(2019·高考全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).[解析](1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05,乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.。

高三 复习 频率分布直方图

高三 复习 频率分布直方图

总体密度曲线
总体密度曲线反映了总体在各个范围内取值的 百分比,精确地反映了总体的分布规律。 用样本分布直方图去估计相应的总体分布时 ,一般样本容量越大,频率分布折线图就会无限 接近总体密度曲线,就越精确地反映了总体的分 布规律,即越精确地反映了总体在各个范围内取 值百分比。
茎叶图
某赛季甲、乙两名篮球运动员每场比赛得分的原 始记录如下:
引入
我国是世界上严重缺水的国家之一, 城市缺水问题较为突出。
2000年全国主要城市中缺水情况排在前10位的城市
政府为了节约生活用水,计划在本市试行居民生 活用水定额管理,即确定一个居民月用水量标准a , 用水量不超过a的部分按平价收费,超过a的部 分按议价收费。
①如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?
组距:指每个小组的两个端点的距离,
极差 4.1 组数= = 8.2 = 组距 0.5 3.将数据分组(左闭右开) [0,0.5 ),[0.5,1 ),…,[4,4.5]
4.列频率分布表
频率分布表一般分“分 组”,“频数累计”( 可省),“频数”,“ 频率”, “ 频率/组距 ””五列,最后一行是 频数 合计
助学微博
一个对比
频率分布表:优点:能看出分布规律.缺点:不直观. 频率分布直方图:优点:很直观且能看出分布规律.缺点: 数据的轻微变化都要重新作图. 茎叶图:优点:很直观,能看出分布规律,还可以添加新 数据.缺点:数据少时方便,数据较多时不方便.
两个特性
(1)在频率分布表中,频数的和等于样本容量,每一小组的频 率等于这一组的频数除以样本容量,各小组频率的和等于 1; (2)在频率分布直方图中,小矩形的高等于每一组的频率/组 距,每个小矩形的面积等于该组的频率,所有小矩形的面积 之和为 1.

第9章统计专题3 频率分布直方图常考题型专题练习——【含答案】

第9章统计专题3 频率分布直方图常考题型专题练习——【含答案】

1频率分布直方图【知识总结】 1.频率分布直方图(1)纵轴表示频率组距,即小长方形的高=频率组距;(2)小长方形的面积=组距×频率组距=频率;(3)各个小方形的面积总和等于1 . 2.频率分布表的画法第一步:求极差,决定组数和组距,组距=极差组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. 3. 频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.2【巩固练习】1、随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36. 根据上述数据得到样本的频率分布表如表所示.分组 频数 频率[25,30] 3 0.12(30,35] 5 0.20(35,40] 8 0.32(40,45] n 1 f 1(45,50] n 2 f 2(1)确定样本频率分布表中n 1,n 2,f 1和f 2的值;(2)根据上述频率分布表,画出样本频率分布直方图和频率分布折线图. 【答案】(1) n 1=7,n 2=2,f 1=0.28,f 2=0.08 (2)见解析【解析】(1)由所给数据知,落在区间(40,45]内的有7个,落在(45,50]内的有2个,故1n =7,2n =2,所以f 1=125n =725=0.28,f 2=225n =225=0.08. (2)样本频率分布直方图和频率分布折线图如图所示.32. 为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是( )A .35B .48C .60D .75【答案】C【解析】设被抽查的美术生的人数为n ,因为后2个小组的频率之和为(0.0375+0.0125)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n =515250.75++=60.故选:C.3、某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为若低于60分的人数是15人,则该班的学生人数是( )A .B .C .D.【答案】B【解析】根据频率分布直方可知成绩低于60分的有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20,则成绩低于60分的频率P=(0.005+0.010)×20=0.3.又因为低于60分的人数是15人,所以该班的学生人数是15÷0.3=50.本题选择B选项.4、某校初三年级有400名学生,随机抽查了40名学生测试1分钟仰卧起坐的成绩(单位:次),将数据整理后绘制成如图所示的频率分布直方图.用样本估计总体,下列结论正确的是( )4A.该校初三学生1分钟仰卧起坐的次数的中位数为25B.该校初三学生1分钟仰卧起坐的次数的众数为24C.该校初三学生1分钟仰卧起坐的次数超过30的人数约有80D.该校初三学生1分钟仰卧起坐的次数少于20的人数约为8[解析] 第一组数据的频率为0.02×5=0.1,第二组数据的频率为0.06×5=0.3,第三组数据的频率为0.08×5=0.4,∴中位数在第三组内,设中位数为25+x,则x×0.08=0.5-0.1-0.3=0.1,∴x=1.25,∴中位数为26.25,故A错误;第三组数据所在的矩形最高,第三组数据的中间值为27.5,∴众数为27.5,故B错误;1分钟仰卧起坐的次数超过30的频率为0.2,∴超过30次的人数为400×0.2=80,故C正确;1分钟仰卧起坐的次数少于20的频率为0.1,∴1分钟仰卧起坐的次数少于20的人数为400×0.1=40,故D错误.故选C.[答案] C5、某家庭记录了未使用节水龙头50天的日用水量数据(单位:3m)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用[)0,0.1[)0.1,0.2[)0.2,0.3[)0.3,0.4[)0.4,0.5[)0.5,0.6[)0.6,0.756水量频数132 49 26 5使用了节水龙头50天的日用水量频数分布表日用水量[)0,0.1[)0.1,0.2 [)0.2,0.3 [)0.3,0.4 [)0.4,0.5 [)0.5,0.6频数151310165(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:7(2)估计该家庭使用节水龙头后,日用水量小于30.35m 的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【答案】(1)直方图见解析;(2)0.48;(3)347.45m . 【解析】(1)频率分布直方图如下图所示:(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于30.35m 的频率为0.20.110.1 2.60.120.050.48⨯+⨯+⨯+⨯=;因此该家庭使用节水龙头后日用水量小于30.35m 的概率的估计值为0.48; (3)该家庭未使用节水龙头50天日用水量的平均数为()110.0510.1530.2520.3540.4590.55260.6550.4850x =⨯+⨯+⨯+⨯+⨯+⨯+⨯=. 该家庭使用了节水龙头后50天日用水量的平均数为8()210.0510.1550.25130.35100.45160.5550.3550x =⨯+⨯+⨯+⨯+⨯+⨯=. 估计使用节水龙头后,一年可节省水()()30.480.3536547.45m -⨯=.6、某电视台为宣传本省,随机对本省内1565~岁的人群抽取了n 人,回答问题“本省内著名旅游景点有哪些”统计结果如图表所示(1)分别求出a b x y 、、、的值;(2)从第234、、组回答正确的人中用分层抽样的方法抽取6人,求第234、、组每组各抽取多少人?(3)指出直方图中,这组数据的中位数是多少(取整数值)?【答案】(1)5a =,27b =,0.9x =,0.2y =;(2)2人,3人,1人;(3)42【解析】(1)由已知第4组人数为9250.36=,∴251000.02510n ==⨯,9由频率分布直方图得第一组人数为:1000.011010⨯⨯=,100.55a =⨯=,第二组人数为:1000.021020⨯⨯=,180.920x ==, 第三组人数为:1000.031030⨯⨯=,300.927b =⨯=,第五组人数为:1000.0151015⨯⨯=,30.215x ==. (2)第2、3、4组回答正确人数分别18、27、9,共54人,设第234、、组分别抽取,,x y z 人,则65418279x y z===,解得2,3,1x y z ===. (3)第1、2组频率和为0.10.20.3+=,第4、5组频率和为0.250.150.4+=,第3组频率为0.3,设中位数为m ,则350.50.3100.3m --=,241423m =≈. ∴中位数为42.7、某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图.10(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数.【答案】(1)0.0075x =;(2)众数是230,中位数为224. 【解析】(1)由直方图的性质可得(0.0020.00950.0110.01250.0050.0025)201x ++++++⨯=,∴0.0075x =.(2)月平均用电量的众数是2202402302+=, ∵(0.0020.00950.011)200.450.5++⨯=<, 月平均用电量的中位数在[220,240)内,设中位数为a ,由(0.0020.00950.011)200.0125(220)0.5a ++⨯+⨯-=,可得224a =, ∴月平均用电量的中位数为2248、为参加学校的“我爱古诗词”知识竞赛,小王所在班级组织了一次古诗词知识测试,并将全班同学的分数(得分取正整数,满分为100分)进行统计,以下是根据这次测试成绩制作的不完整的频率分布表和频率分布直方图.频率分布表组别分组频数频率1 [50,60) 9 0.182 [60,70) a3 [70,80) 20 0.404 [80,90) 0.085 [90,100] 2 b合计 1请根据以上频率分布表和频率分布直方图,回答下列问题:(1)求出a,b,c,d的值;(2)老师说:“小王的测试成绩是全班同学成绩的中位数”,那么小王的测试成绩在什么范围内.1112【答案】(1) a =15,b =0.04,c =0.03,d =0.004 (2) 70≤x <80 【解析】(1)样本容量为9÷0.18=50,50×0.08=4, 所以a =50-9-20-4-2=15,b =2÷50=0.04,c =15÷50÷10=0.03,d =0.04÷10=0.004.(2)因为样本容量为50,则样本的中位数是第25,26个数据的平均数, 而第25,26个数据均位于70≤x <80范围内, 所以小王的测试成绩在70≤x <80范围内.9、某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[)50,60,[)60,70,[)70,80,[)80,90,[]90,100.分数段[)50,60[)60,70[)70,80[)80,90:x y1∶12∶13∶44∶513(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[)50,90之外的人数. 【答案】(1)0.005a =;(2)73(分);(3)10.【解析】(1)由频率分布直方图知(20.020.030.04)101a +++⨯=,解得0.005a =. (2)由频率分布直方图知这100名学生语文成绩的平均分为550.00510650.0410750.0310850.0210950.0051073⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=(分).(3)由频率分布直方图知语文成绩在[)50,60,[)60,70,[)70,80,[)80,90各分数段的人数依次为:0.005101005,0.041010040,0.031010030,0.021010020⨯⨯=⨯⨯=⨯⨯=⨯⨯=由题中给出的比例关系知数学成绩在上述各分数段的人数依次为1455,4020,3040,2025234⨯=⨯=⨯=.故数学成绩在[50,90)之外的人数为100(5204025)10-+++=.10.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值分[75,85) [85,95) [95,105) [105,115) [115,125) 组频数 6 26 38 22 8(I)在答题卡上作出这些数据的频率分布直方图:(II)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(III)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?14【答案】(1)见解析;(2)平均数100,方差为104;(3)不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.【解析】(1)直方图如图,(2)质量指标值的样本平均数为x=⨯+⨯+⨯+⨯+⨯=.800.06900.261000.381100.221200.08100质量指标值的样本方差为22222s=-⨯+-⨯+⨯+⨯+⨯=.(20)0.06(10)0.2600.38100.22200.08104(3)质量指标值不低于95的产品所占比例的估计值为++=,0.380.220.080.68由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.11、从某企业生产的某种产品中随机抽取100件,测量这些产品的某项质量指标,由测量1516结果得到如下频数分布表:质量指标值分组[)75,85[)85,95[)95,105[)105,115[)115,125频数62638228()1在图中作出这些数据的频率分布直方图;()2估计这种产品质量指标值的平均数、中位数(保留2位小数);()3根据以上抽样调査数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?【答案】(1)直方图见解析;(2)平均数100,中位数99.74;(3)不能. 【解析】()1由已知作出频率分布表为:质量指标值分组[)75,85 [)85,95 [)95,105 [)105,115 [)115,12517频数 6 26 38 22 8频率0.06 0.26 0.38 0.22 0.08由频率分布表作出这些数据的频率分布直方图为:()2质量指标值的样本平均数为:800.06900.261000.381100.221200.08100x =⨯+⨯+⨯+⨯+⨯=,[)75,95内频率为:0.060.260.32+=,∴中位数位于[)95,105内,设中位数为x ,则0.50.260.06951099.740.38x --=+⨯≈,∴中位数为99.74.()3质量指标值不低于95 的产品所占比例的估计值为0.380.220.080.68++=.由于该估计值小于0.8,故不能认为该企业生产的这种产品“质量指标值不低于95 的产品至少要占全部产品80%的规定.18。

(完整版)频率分布直方图题型归纳-邓永海,推荐文档

(完整版)频率分布直方图题型归纳-邓永海,推荐文档

频率分布直方图题型归纳1.频率、频数、样本容量三个量产生的知二求一2.补全频率分布表3.做频率分布直方图4.性质“面积和为1”的应用,补全直方图5.与分层抽样、数列等知识综合6.估计总体的频率分布,区间内的频数问题【例 1】14.I2[2012·ft东卷] 如图1-4 是根据部分城市某年6 月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为.图1-414.9 [解析] 本题考查频率分布直方图及样本估计总体的知识,考查数据处理能力,容易题.11样本容量=1 × (0.10+0.12)=50,样本中平均气温不低于25.5℃的城市个数为50×1×0.18=9.【例2】18.I2[2012·安徽卷] 若某产品的直径长与标准值的差的绝对值不超过1 mm 时,则视为合格品,否则视为不合格品,在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取 5 000 件进行检测,结果发现有50 件不合格品.计算这50 件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:(1)将上面表格中缺少的数据填在答题卡的相应位置.(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(3)现对该厂这种产品的某个批次进行检查,结果发现有20 件不合格品,据此估算这批产品中的合格品的件数.18.解:(1)频率分布表分组频数频率[-3,-2) 5 0.10[-2,-1) 8 0.16(1,2] 25 0.50(2,3] 10 0.20(3,4] 2 0.04合计50 1.00(2)由频率分布表知,长与标准值的差落在区间(1,3]内的概率约为0.50+0.20=0.70;(3)设这批产品中的合格品数为x 件,50 20依题意有5000=x+20,5000 × 20解得x=50 -20=1 980.所以该批产品的合格品件数估计是1 980 件.【例3】18.I2[2014·全国新课标卷Ⅰ] 从某企业生产的某种产品中抽取100 件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标[75,85) [85,95) [95,105) [105,115) [115,125) 值分组频数 6 26 38 22 8(1)在答题卡上作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均值及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95 的产品至少要占全部产品80%”的规定?18.解:(1)频率分布直方图如下:(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95 的产品所占比例的估计值为0.38+0.22+0.8=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95 的产品至少要占全部产品80%”的规定.【例4】11.I2[2013·湖北卷] 从某小区抽取100 户居民进行月用电量调查,发现其用电量都在50 至350 度之间,频率分布直方图如图1-3 所示.(1)直方图中x 的值为;(2)在这些用户中,用电量落在区间[100,250)内的户数为.图1-311.(1)0.004 4 (2)70 [解析] (1)(0.001 2+0.002 4×2+0.003 6+x+0.006 0) ×50=1 x=0.004 4.(2)[1-(0.001 2+0.002 4×2)×50]×100=70.【变式】17.I2、K2[2014·重庆卷] 20 名学生某次数学考试成绩(单位:分)的频率分布直方图如图1-3 所示.y 力 力力 力0.3 0.1o 4.3 4.4 4.5 4.6 4.7 4.8 4.9 5.0 5.15.2力 力 x为( )图 1-3(1) 求频率分布直方图中 a 的值;(2) 分别求出成绩落在[50,60)与[60,70)中的学生人数;(3) 从成绩在[50,70)的学生中任选 2 人,求此 2 人的成绩都在[60,70)中的概率. 17.解:(1)据直方图知组距为 10,由 (2a +3a +7a +6a +2a )×10=1,1解得 a =200=0.005.(2)成绩落在[50,60)中的学生人数为 2×0.005×10×20=2. 成绩落在[60,70)中的学生人数为 3×0.005×10×20=3.(3)记成绩落在[50,60)中的 2 人为 A 1,A 2,成绩落在[60,70)中的 3 人为B 1,B 2,B 3,则从成绩在[50,70)的学生中任选 2 人的基本事件共有 10 个,即(A 1,A 2), (A 1,B 1),(A 1,B 2),(A 1,B 3),(A 2,B 1),(A 2,B 2),(A 2,B 3),(B 1,B 2),(B 1,B 3), (B 2,B 3).其中 2 人的成绩都在[60,70)中的基本事件有 3 个,即(B 1,B 2),(B 1,B 3),(B 2,B 3).3故所求概率为 P =10.【例 5】(12)从某小学随机抽取 100 名同学,将他们身高(单位:厘米)数据绘制成频率分布直方图(如图)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

频率分布直方图典型例题析
频率分布直方图是表达和分析数据的重要工具,还可以直观、准确地理解相应的有用的信息,所以成为新高考的重点,我们必须总结其重要题型及有关计算。

一、基本概念类
例1、关于频率 分布直方图的下列说法中,正确的是( )
(A )、直方图的高表示某数的频率;
(B )、直方图的高表示该组上的个体在样本中出现的频率;
(C )、直方图的高表示该组上的个体与组距的比值;
(D )、直方图的高表示该组上的个体在样本中
出现的频率与组距的比值;
解析:在频率分布直方图中,每一个小矩形
都是等宽的,即等于组距,其面积表示数据的取
值落在相应区间上的频率,因此每一个小矩形的
高表示该组上的个体在样本中出现的频率与组
距的比值,所以选(D )。

二、识图计算类
例2、为了了解某地区高三学生的身体发育
情况,抽查了该地区100名年龄为17.5岁-1
8岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这100名学生中体重在
[56.5,64.5)的学生人数是 ( )
(A)20 (B)30
(C)40 (D )50
解:本题主要考查频率分布直方图和总体分布的估计等知识,同时考查图形的识别能力。

由频率直方图可知组距为2,故学生中体重在[56.5,64.5)的频率为:
(0.03+0.05+0.05+0.07)×2=0.4,所以100名学生中体重在[56.5,64.5)的学生人数有: 0. 4×100=40人。

故选择C 点评:在频率分布直方图中,每一个小矩形都是等宽的,即等于组距,高是
,所以有:×组距=频率;即可把所求范围内的频率求出,进而求该范围的人数。

例3:某校高一某班共有64名学生,下图是该班某次数学考
试成绩的频率分布直方图,根据该图可知,成绩在110120间的
同学大约有( )
A 、 10
B 、11
C 、13
D 、16
解析:通过直方图可知:成绩在110120的频率是:
2.02
3.015.01.005.01=----,所以成绩在110120之间的同学大约有:64×0.2=12.813≈人。

故选择C
点评:解决本题需要注意两点:所有小矩形的面积之和等于1;在分布图中若有高度相同的两个矩形,不能出现计算失误。

三、识图综合计算类
例4、一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图)。

为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人
作进一步调查,则在[2500,3000)(元)月收入段应
抽出____________人。

解:由已知可得每个个体被抽入样的概率均为100110000100 ,由直方图知识可得在)3000,2500[内的频率为该矩形的面积,即得0.0005×(3000-2500)=0.25,即得该范围内的人数为10 000×0.25=2 500人,则分层抽样时,该范围内应当抽取的人数为2 500×100
1=25人. 点评:本题考查了频率分布直方图以及抽样方法,这两点知识作为高考考查重点,需要掌握分层抽样的有关的计算及频率分布直方图的有关计算,本题设计小、活、新颖但是需要思考才能正确求解。

0.0005300035000.0003
0.0004
200015000.0002
0.0001
400025001000月收入(元)
频率/组距。

相关文档
最新文档