高考题型之-频率分布直方图

合集下载

高中数学总结归纳 帮你理解频率分布直方图

高中数学总结归纳 帮你理解频率分布直方图

帮你理解频率分布直方图通过频率分布表,我们可以确切地知道数据分布在各个不同区间的频率,而通过频率分布直方图我们可以直观地看出数据分布的总体态势,两者相互补充,可以使我们对数据的频率分布情况了解的更加清楚,但在画频率分布直方图时,一定要注意其纵轴的意义.例给出如下样本数据:10,8,6,10,8,13,11,10,12,7,8,9,11,9,11,12,9,10,11,12,并分组如下:(1)完成上面的频率分布表;(2)根据上表,在坐标系中作出频率分布直方图.错解:(1)频率分布表如下:12(2)频率分布直方图如下:剖析:以上第(2)问的频率分布直方图画错了.原因在于纵轴单位是,而不是频率.例如当数据在[9.5,11.5)时,频率为0.4,而频率组距0.40.22==.故图中最高的这个矩形的高度应为0.2个单位,而不是0.4个单位,其他小矩形的高度可依此求出来. 正解:(1)同上.(2)频率分布直方图如下:[)11.513.5, 4 0.2 合计201.0点悟:频率分布直方图中,各个小长方形的面积等于相应各组的频率,因为各组频率之和为1,故所有长方形面积之和等于1.根据这一点,也可以判断你画出的频率分布直方图是否正确.练习:为了了解某校高三年级男生的身高情况,随机抽取40名高三男生的身高,所得数据如下(单位:cm):171,163,163,166,166,168,168,160,168,165,171,169,167,169,151,168,170,160,168,174,165,168,174,159,167,156,157,164,169,180,176,157,162,161,158,164,163,163,167,161.(1)列出频率分布表;(2)画出频率分布直方图.提示:确定组距和组数是解决该类问题的出发点.只有科学合理的确定组距和组数,才能准确的制表及绘图.3。

高中数学复习概率统计题型归纳与讲解03 频率分布直方图

高中数学复习概率统计题型归纳与讲解03 频率分布直方图

高中数学复习概率统计题型归纳与讲解专题3频率分布直方图例1.要调查某地区高中学生身体素质,从高中生中抽取100人进行跳高测试,根据测试成绩制作频率分布直方图如图,现从成绩在[120,140)之间的学生中用分层抽样的方法抽取5人,应从[120,130)间抽取人数为b,则()A.a=0.2,b=2B.a=0.025,b=3C.a=0.3,b=4D.a=0.030,b=3【解析】解:由题得10×(0.005+0.035+a+0.020+0.010)=1,所以a=0.030.在[120,130)之间的学生人数为:100×10×0.030=30人,在[130,140)之间的学生人数为:100×10×0.020=20人,在[120,140)之间的学生人数为:100×(10×0.030+0.020)=50人,又用分层抽样的方法在[120,140)之间的学生50人中抽取5人,即抽取比例为:110,所以成绩在[120,130)之间的学生中抽取的人数应,30×110=3,即b=3,故选:D.例2.从某企业生产的某种产品中随机抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值分组[70,80) [80,90) [90,100) [100,110) 110,120)频数 14 20 36 18 12估计这种产品质量指标值的平均数为(同一组中的数据用该组区间的中点值作代表)( )A .100B .98.8C .96.6D .94.4【解析】解:平均数x →=0.14×75+0.20×85+0.36×95+0.18×105+0.12×115=94.4.故选:D .例3.“新冠肺炎”席卷全球,我国医务工作者为了打好这次疫情阻击战,充分发挥优势,很快抑制了病毒,据统计老年患者治愈率为71%,中年患者治愈率为85%,青年患者治愈率为91%.如果某医院有30名老年患者,40名中年患者,50名青年患者,则估计该医院的平均治愈率是( )A .86%B .83%C .90%D .84%【解析】解:利用求加权平均数的公式解得:30×71%+40×85%+50×91%30+40+50=0.84=84%,故选:D .例4.已知样本数据x 1,x 2,…,x n (n ∈N *)的平均数与方差分别是a 和b ,若y i =﹣2x i +3(i =1,2,…n ),且样本数据y 1,y 2,…,y n 的平均数与方差分别是b 和a ,则a ﹣b =( )A .1B .2C .3D .4【解析】解:由题意得:{−2a +3=b a =4b ,解得:{a =43b =13,故a ﹣b =1, 故选:A .例5.下面定义一个同学数学成绩优秀的标志为:“连续5次考试成绩均不低于120分”.现有甲、乙、丙三位同学连续5次数学考试成绩的记录数据(记录数据都是正整数):①甲同学:5个数据的中位数为127,众数为120;②乙同学:5个数据的中位数为125,总体均值为127;③丙同学:5个数据的中位数为135,总体均值为128,总体方差为19.8.则可以判定数学成绩优秀同学为( )A .甲、乙B .乙、丙C .甲、丙D .甲、乙、丙【解析】解:在①中,甲同学:5个数据的中位数为127,众数为120,所以前三个数为120,120,127,则后两个数肯定大于127,故甲同学数学成绩优秀,故①成立;在②中,5个数据的中位数为125,总体均值为127,可以找到很多反例,如:118,119,125,128,145,故乙同学数学成绩不优秀,故②不成立;在③中,5个数据的中位数为135,总体均值为128,总体方差为19.8设x 1<x 2<x 3<x 4,则丙的方差为15[(x 1﹣128)2+(x 2﹣128)2+(x 3﹣128)2+(x 4﹣128)2+(135﹣128)2]=19.8, ∴(x 1﹣128)2+(x 2﹣128)2+(x 3﹣128)2+(x 4﹣128)2=50,∴(x 1﹣128)2≤50,得|x 1﹣128|≤5,∴x 1≥128﹣5>120,∴丙同学数学成绩优秀,故③成立.∴数学成绩优秀有甲和丙2个同学.故选:C .例6.若数据x 1,x 2,…,x n 的平均数x =3,方差s 2=1,则数据2x 1+3,2x 2+3,…,2x n +3的平均数和方差分别为( )A.6,6B.9,2C.9,6D.9,4【解析】解:由题意若数据x1,x2,…,x n的平均数x=3,方差s2=1,可得x1+x2+…+x n=3n,则:2x1+3+x2+3+…+x n+3=2(x1+x2+…+x n)+3n=9n,所以数据2x1+3,2x2+3,…,2x n+3的平均数为9.又S2=1n[(x1﹣3)2+(x2﹣3)2+…+(x n﹣3)2]=1,所以[(x1﹣3)2+(x2﹣3)2+…+(x n﹣3)2]=n,所以1n [(2x1+3﹣9)2+(2x2+3﹣9)2+…+(2x n+3﹣9)2]=4n[(x1﹣3)2+(x2﹣3)2+…+(x n﹣3)2]=4,则数据2x1+3,2x2+3,…,2x n+3的平均数和方差分别为9,4.故选:D.例7.随着城镇化的不断发展,老旧小区的改造及管理已经引起了某市政府的高度重视,为了了解本市甲,乙两个物业公司管理的小区住户对其服务的满意程度,现从他们所服务的小区中随机选择了40个住户,根据住户对其服务的满意度评分,得到A区住户满意度评分的频率分布直方图和B 区住户满意度评分的频率分布表.B区住户满意度评分的频率分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数4610128(Ⅰ)在图2中作出B区住户满意度评分的频率分布直方图,并通过频率分布直方图计算两区住户满意度评分的平均值及分散程度(其中分散程度不要求计算出具体值,给出结论即可);(Ⅱ)根据住户满意度评分,将住户和满意度分为三个等级:满意度评分低于70分,评定为不满意;满意度评分在70分到89分之间,评定为满意;满意度评分不低于90分,评定为非常满意.试估计哪个地区住户的满意度等级为不满意的概率大?若是要选择一个物业公司来管理老旧小区的物业,从满意度角度考虑,应该选择哪一个物业公司?说明理由.【解析】解:(Ⅰ)作出如图所示的频率分布直方图,B区住户满意度评分的频率分布直方图如图所示A区住户满意度评分的平均值为45×0.1+55×0.2+65×0.3+75×0.2+85×0.15+95×0.05=67.5;B区住户满意度评分的平均值为55×0.1+65×0.15+75×0.25+85×0.3+95×0.2=78.5.通过比较两区住户满意度评分的频率分布直方图可以看出,B区住户满意度评分比较集中,而A 区住户满意度评分比较分散.(Ⅱ)记D表示事件:“A区住户的满意度等级为不满意”,记E表示事件:“B区住户的满意度等级为不满意”,则P(D)=(0.010+0.020+0.030)×10=0.6,P(E)=(0.010十0.015)×10=0.25,所以A区住户的满意度等级为不满意的概率较大.若是要选择一个物业公司来管理老旧小区的物业,从满意度等级为满意来考虑,应该选择乙物业公司来为小区服务,这样的话小区住户满意度会高一些.例8.某校在一次期末数学测试中,为统计学生的考试情况,从学校的2000名学生中随机抽取50名学生的考试成绩,被测学生成绩全部介于65分到145分之间(满分150分),将统计结果按如下方式分成八组:第一组[65,75),第二组[75,85),……第八组[135,145],如图是按上述分组方法得到的频率分布直方图的一部分.(1)求第七组的频率,并完成频率分布直方图;(2)用样本数据估计该校的2000名学生这次考试成绩的平均分(同一组中的数据用该组区间的中点值代表该组数据平均值);(3)若从样本成绩属于第六组和第八组的所有学生中随机抽取2名,求他们的分差的绝对值小于10分的概率.【解析】解:(1)由频率分布直方图得第七组的频率为:1﹣(0.004+0.012+0.016+0.030+0.020+0.006+0.004)×10=0.08.完成频率分布直方图如下:(2)用样本数据估计该校的2000名学生这次考试成绩的平均分为:70×0.004×10+80×0.012×10+90×0.016×10+100×0.030×10+110×0.020×10+120×0.006×10+130×0.008×10+140×0.004×10=102.(3)样本成绩属于第六组的有0.006×10×50=3人,样本成绩属于第八组的有0.004×10×50=2人,从样本成绩属于第六组和第八组的所有学生中随机抽取2名,基本事件总数n=C52=10,他们的分差的绝对值小于10分包含的基本事件个数m=C32+C22=4,∴他们的分差的绝对值小于10分的概率p=mn=410=25.例9.我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准x,用水量不超过x的部分按平价收费,超出x的部分按议价收费.下面是居民月均用水量的抽样频率分布直方图.①求直方图中a的值;②试估计该市居民月均用水量的众数、平均数;③设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;④如果希望85%的居民月均用水量不超过标准x ,那么标准x 定为多少比较合理?【解析】解:①由概率统计相关知识,各组频率之和的值为1,∵频率=(频率/组距)*组距,∴0.5×(0.08+0.16+0.4+0.52+0.12+0.08+0.04+2a )=1,解得:a =0.3,∴a 的值为0.3;②由频率分布直方图估计该市居民月均用水量的众数为2+2.52=2.25(吨),估计该市居民月均用水量的平均数为:0.5(0.25×0.08+0.75×0.16+1.25×0.3+1.75×0.4+2.25×0.52+2.75×0.3+3.25×0.12+3.75×0.08+4.25×0.04)=2.035(吨).③由图,不低于3吨人数所占百分比为0.5×(0.12+0.08+0.04)=12%,∴全市月均用水量不低于3吨的人数为:30×12%=3.6(万);④由频率分布直方图得月均用水量低于2.5吨的频率为:0.5×(0.08+0.16+0.3+0.4+0.52)=0.73<85%,月均用水量低于3吨的频率为:0.5×(0.08+0.16+0.3+0.4+0.52+0.3)=0.88>85%,∴x=2.5+0.5×0.85−0.730.3×0.5=2.9(吨).例10.如图是某校高三(1)班的一次数学知识竞赛成绩的基叶图(图中仅列出[50,60),[90,100)的数据)和频率分布直方图.(1)求全班人数以及频率分布直方图中的x,y;(2)估计学生竞赛成绩的平均数和中位数(保留两位小数).【解析】解:(1)分数在[50,60)的频率为0.020×10=0.2,由茎叶图知,分数在[50,60)之间的频数为5,所以全班人数为50.2=25(人);分数在[90,100)之间的频数为2,由225=10y,解得y=0.008;又10x=1﹣10×(0.036+0.024+0.020+0.008),解得x=0.012.(2)由频率分布直方图,计算平均数为x=55×0.2+65×0.24+75×0.36+85×0.12+95×0.08=71.4,由0.2+0.24+0.36=0.80,所以中位数在[70,80)内,设中位数为m,则0.20+0.24+(m﹣70)×0.036=0.5,解得m≈71.67,所以中位数约为71.67.例11.某高中数学建模兴趣小组的同学为了研究所在地区男高中生的身高与体重的关系,从若干个高中男学生中抽取了1000个样本,得到如下数据.数据一:身高在[170,180)(单位:cm)的体重频数统计体重(kg)[50,55)[55,60)[60,65)[65,70)[70,75)[75,80)[80,85)[85,90)人数206010010080201010数据二:身高所在的区间含样本的个数及部分数据身高x(cm)[140,150)[150,160)[160﹣170)[170﹣180)[180﹣190)平均体重y(kg)4553.66075(Ⅰ)依据数据一将下面男高中生身高在[170﹣180)(单位:cm)体重的频率分布直方图补充完整,并利用频率分布直方图估计身高在[170﹣180)(单位:cm)的中学生的平均体重;(保留小数点后一位)(Ⅱ)依据数据一、二,计算身高(取值为区间中点)和体重的相关系数约为0.99,能否用线性回归直线来刻画中学生身高与体重的相关关系,请说明理由;若能,求出该回归直线方程;(Ⅲ)说明残差平方和或相关指数R2与线性回归模型拟合效果之间关系.(只需写出结论,不需要计算)参考公式:b=∑ni=1(x i−x)(y i−y)∑n i=1(x i−x)2=∑ni=1x i y i−nx⋅y∑n i=1x i2−nx2,a=y−b x.参考数据:(1)145×45+155×53.6+165×60+185×75=38608;(2)1452+1552+1652+1752+1852﹣5×1652=1000.(3)663×175=116025,664×175=116200,665×175=116375.(4)728×165=120120.【解析】解:(1)身高在[170,180)的总人数为:20+60+100+100+80+20+10+10=400,体重在[55﹣60)的频率为:60400=0.15,体重在[70﹣75)的频率为:80400=0.2,平均体重为:52.5×0.05+57.5×0.15+62.5×0.25+67.5×0.25+72.5×0.2+77.5×0.05+82.5×0.025+87.5×0.025≈66.4,(2)因为r=0.99→1,线性相关很强,故可以用线性回归直线来刻画中学生身高与体重的相关,x=145+155+165+175+1855=165,y=45+75+60+53.6+66.45=60,b=∑8i=1x i y i−8x⋅y∑8i=1x i2−8x2=38608+175×66.4−5×165×601000=0.728,a=y−b x=60−0.728×165=−60.12,所以回归直线方程为:y=0.728x−60.12,(3)残差平方和越小或相关指数R2越接近于1,线性回归模型拟合效果越好.例12.市政府为了节约用水,调查了100位居民某年的月均用水量(单位:t),频数分布如下:分组[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]频数4815222514642(1)根据所给数据将频率分布直方图补充完整(不必说明理由);(2)根据频率分布直方图估计本市居民月均用水量的中位数;(3)根据频率分布直方图估计本市居民月均用水量的平均数(同一组数据由该组区间的中点值作为代表).【解析】解:(1)频率分布直方图如图所示:(2)∵0.04+0.08+0.15+0.22=0.49<0.5,∴中位数为2+0.5−0.490.25×0.5=2.02,(3)由频率分布直方图得平均数为:0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.02=2.02.例13.某地区100居民的人均用水量(单位:t)的分组的频数如下:[0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22;[2,2.5),25;[2.5,3),14;[3,3.5),6;[3.5,4),4;[4,4.5),2.(1)列出样本的频率分布表;(2)画出频率分布直方图,并根据直方图估计这组数据的众数;(坐标轴单位自定)(3)当地政府制订了人均月用水量为3t的标准,若超出标准加倍收费,当地政府解释说,85%以上的居民不超出这个标准,这个解释对吗?为什么?【解析】解:(1 )分组频数频率[0,0.5 )40.04[0.5,1 )80.08[1,1.5 )150.15[1.5,2 )220.22[2,2.5 )250.25[2.5,3 )140.14[3,3.5 )60.06[3.5,4 )40.04[4,4.5 )20.02(2):频率分布直方图如下图,由图知,这组数据的众数为2.25.(3)人均月用水量在3t以上的居民的比例为6%+4%+2%=12%,即大约是有12%的居民月均用水量在3t以上,88%的居民月均用水量在3t以下,因此,政府的解释是正确的.例14.某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60)…[90,100]后画出如下频率分布直方图.观察图形的信息,回答下列问题:(Ⅰ)估计这次考试的众数m与中位数n(结果保留一位小数);(Ⅱ)估计这次考试的及格率(60分及以上为及格)和平均分.【解析】解:(Ⅰ)众数是最高小矩形中点的横坐标,所以众数为m=75(分);(3分)前三个小矩形面积为0.01×10+0.015×10+0.015×10=0.4,∵中位数要平分直方图的面积,∴n=70+0.5−0.40.03=73.3(7分)(Ⅱ)依题意,60及以上的分数所在的第三、四、五、六组,频率和为(0.015+0.03+0.025+0.005)*10=0.75所以,抽样学生成绩的合格率是75% (11分)利用组中值估算抽样学生的平均分45•f1+55•f2+65•f3+75•f4+85•f5+95•f6=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71估计这次考试的平均分是71分.(14分)例15.为应对新冠疫情,重庆市于2020年1月24日启动重大突发公共卫生事件一级响应机制,要求市民少出门,少聚集,于是快递业务得到迅猛发展.为满足广大市民的日常生活所需,某快递公司以优厚的条件招聘派送员,现给出了两种日薪薪酬方案,甲方案:底薪100元,每派送一单奖励1元;乙方案:底薪150元,每日前55单没有奖励,超过55单的部分每单奖励10元.(Ⅰ)请分别求出这两种薪酬方案中日薪y(单位:元)与送货单数n的函数关系式;(Ⅱ)根据该公司所有派送员10天的派送记录,发现派送员的日平均派送单数与天数满足以下表格:日均派送单数5054565860频数(天)23221回答下列问题:①根据以上数据,设每名派送员的日薪为X(单位:元),试分别求出这10天中甲、乙两种方案的日薪X的平均数及方差;②结合①中的数据,根据统计学的思想,若你去应聘派送员,选择哪种薪酬方案比较合适,并说明你的理由.(参考数据:172=289,372=1369)【解析】解:(1)甲方案,y =100+n ;乙方案,y ={150,n ≤5510n −400,n >55.(2),①甲方案中,根据已知表格可计算出日平均派送单数为2×50+3×54+2×56+2×58+6010=55,方差为0.2×(50﹣55)2+0.3×(54﹣55)2+0.2×(56﹣55)2+0.2×(58﹣55)2+0.1×(60﹣55)2=9.8,所以,由(1)中变量之间的关系,可以指,甲方案的日薪X 的平均数为155,方差为9.8. 乙方案中,日薪X 的平均数为[5×150+160×2+180×2+200]×0.1=163,日薪方差为0.5×(150﹣163)2+0.2×(160﹣163)2+0.2×(180﹣163)2+0.1×(200﹣163)2=213.4.(3)若去应聘派送员,我会选择乙方案,从平均数的角度来看,乙方案的平均薪酬更高,同时更有激励作用.例16.2019年起,全国地级及以上城市全面启动生活垃圾分类工作,垃圾分类投放逐步成为居民的新时尚.为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收垃圾、有害垃圾和其他垃圾四类,并分别设置了相应的垃圾箱.为调查居民生活垃圾分类投放情况,现随机抽取了某市三类垃圾箱中总计1000吨生活垃圾,数据统计如下(单位:吨):“厨余垃圾”箱 “可回收垃圾”箱 “有害垃圾”箱“其他垃圾”箱厨余垃圾 300 70 30 80 可回收垃圾 30 210 30 30 有害垃圾 20 20 60 20 其他垃圾10201060(1)分别估计厨余垃圾和有害垃圾投放正确的概率;(2)假设厨余垃圾在“厨余垃圾”箱、“可回收垃圾”箱、“有害垃圾”箱、“其他垃圾”箱的投放量分别为a,b,c,d,其中a>0,a+b+c+d=800.当数据a,b,c,d的方差s2最大时,写出a,b,c,d的值(结论不要求证明),并求此时s2的值.【解析】解:(1)根据题意,厨余垃圾共300+70+30+80=480吨,其中投放正确的有300吨,则厨余垃圾投放正确的概率P1=300480=58,有害垃圾共20+20+60+20=120吨,其中投放正确的有60吨,则害垃圾投放正确的概率P2=60120=12;(2)根据题意,厨余垃圾在四种垃圾箱的投放量分别为a,b,c,d,其中a>0,a+b+c+d=800,则其平均数x=8004=200,则其方差S2=14[(a﹣200)2+(b﹣200)2+(c﹣200)2+(d﹣200)2],当a=600,b=c=d=0时,s2最大,而x=a+b+c+d4=200,此时s2=14[(600﹣200)2+(0﹣200)2+(0﹣200)2+(0﹣200)2]=120000例17.某市教育局为了解全市高中学生在素质教育过程中的幸福指数变化情况,对8名学生在高一,高二不同学习阶段的幸福指数进行了一次跟踪调研.结果如表:学生编号12345678高一阶段幸福指数9593969497989695学生编号12345678高二阶段幸福指数9497959695949396(1)根据统计表中的数据情况,分别计算出两组数据的平均值及方差;(2)请根据上述结果,就平均值和方差的角度分析,说明在高一,高二不同阶段的学生幸福指数状况,并发表自己观点.【解析】解:(1)8名学生在高一阶段的幸福指数的平均数为:x=18(95+93+96+94+97+98+96+95)=95.5,方差为:S12=18∑8i=1(x i−x1)2=2.25,8名学生在高二阶段的幸福指数的平均数为:y=18(94+97+95+96+95+94+93+96)=95,方差为:S22=18∑8i=1(y i−y)2=1.5;(2)①∵x>y,∴可以认为这8名学生在高一的平均幸福指数大于在高二的平均幸福指数,②∵S12>S22,∴可以认为这8名学生在高二的幸福指数的稳定性大于在高一的幸福指数的稳定性.例18.2020年1月,教育部《关于在部分高校开展基础学科招生改革试点工作的意见》印发,自2020年起,在部分高校开展基础学科招生改革试点(也称“强基计划”).强基计划聚焦高端芯片与软件、智能科技、新材料、先进制造和国家安全等关键领域以及国家人才紧缺的人文社会科学领域,选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生.新材料产业是重要的战略性新兴产业,如图是我国2011﹣2019年中国新材料产业市场规模及增长趋势图.其中柱状图表示新材料产业市场规模(单位:万亿元),折线图表示新材料产业市场规模年增长率(%).(1)求从2012年至2019年,每年新材料产业市场规模年增长量的平均数(精确到0.1);(2)从2015年至2019年中随机挑选两年,求两年中至少有一﹣年新材料产业市场规模年增长率超过20%的概率;(3)由图判断,从哪年开始连续三年的新材料产业市场规模的方差最大.(结论不要求证明)【解析】解:(1)从2012年起,每年新材料产业市场规模的年增加值依次为:0.3,0.2,0.3,0.5,0.6,0.4,0.8,0.6,(单位:万亿元),∴年增加的平均数为:0.3+0.2+0.3+0.5+0.6+0.4+0.8+0.68=0.5万亿元.(2)设A表示事件“从2015年至2019年中随机挑选两个,两年中至少有一年新材料产业市场规模增长率超过20%”,依题意P(A)=1−C22C52=910.(3)从2017年开始连续三年的新材料产业市场规模的方差最大.。

高考题型之 频率分布直方图

高考题型之 频率分布直方图

高考题型之频率分布直方图典型例题:......................................................................答案............................................................................知识点:典型例题:1.某工厂对一批产品进行了抽样检测.有图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是(A)90(B)75(C)60(D)452.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……第六组,成绩大于等于18秒且小于19秒。

右图是按上述分组方法得到的频率分布直方图。

设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为(A)0.9,35(B)0.9,45(C)0.1,35(D)0.1,453.某个小区住户共200户,为调查小区居民的7月份用水量,用分层抽样的方法抽取了50户进行调查,得到本月的用水量(单位:m3)的频率分布直方图如图所示,则小区内用水量超过15m3的住户的户数为A.10B.50C.60D.1404.某时段内共有100辆汽车经过某一雷达地区,时速频率分布直方图如右图所示,则时速超过60 km/h的汽车数量为_____________;5.某个容量为100的样本的频率分布直方图如下,则在区间[4,5)上的数据的频数..为.6.某地区教育主管部门为了对该地区模拟考试成绩进行分析,抽取了总成绩介于350分到650分之间的10000名学生成绩,并根据这10000名学生的总成绩画了样本的频率分布直方图.为了进一步分析学生的总成绩与各科成绩等方面的关系,要从这10000名学生中,再用分层抽样方法抽出200人作进一步调查,则总成绩在[400,500)内共抽出()A.100人B.90人C.65人D.50人7.济南交警部门随机测量了顺河高架桥南下口某一时间段经过的2000辆汽车的时速,时速频率分布直方图如图所示,则时速超过70km/h的汽车数量为_______8.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg),得到频率分布直方图如下:根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是()(A)20(B)30(C)40(D)509.一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在[2500,3000)(元)月收入段应抽出人.10.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图)。

高中数学复习典型题专题训练118---频率直方图

高中数学复习典型题专题训练118---频率直方图

高中数学复习典型题专题训练118频率直方图列出样本数据的频率分布表和频率分布直方图的步骤: ①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:取组距,用极差组距决定组数;③决定分点:决定起点,进行分组;④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图,知小长方形的面积=组距×频率组距=频率.频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x 来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.题型一 频率分布直方图【例1】 (2010西城二模)某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.知识内容典例分析板块二.频率直方图则这200名同学中成绩大于等于80分且小于90分的学生有______名.【例2】 (2010东城二模)已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内的样本频数为 ,样本数据落在[2,10)内的频率为 .【例3】 (2010北京)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a = .若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[]140,150内的学生中选取的人数应为 .【例4】 (2010江苏高考)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[]540,中,其频率分布直方图如图所示,则其抽样的100根中,有____根在棉花纤维的长度小于20mm .(mm)频率组距【例5】 (2009湖北15)下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[)610,内的频数为 ,数据落在[)210,内的概率约为 .【例6】 (2009福建3)A .0.13B .0.39C .0.52D .0.64【例7】 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( )时间(h)A .0.6hB .0.9hC .1.0hD .1.5h【例8】 为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[)4555,,[)5565,,[)6575,,[)7585,,[)8595,由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)5575,的人数是 .产品数量0.0200.0150.0100.005【例9】 (2009山东8)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96106],,样本数据分组为[)9698,,[)98100,,[)100102,,[)102104,,[104106],.已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A .90B .75C .60D .45【例10】 某路段检查站监控录象显示,在某时段内,有1000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为右图的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90km/h 的车辆数为( )A .200B .600C .500D .300【例11】 (2006年全国II )一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本频率分布直方图,为了分析居民的收入与年龄、学历、职业等方面的联系,要从这10000人中用分层抽样的方法抽出100人做进一步调查,则在[25003000],(元)月收入段应抽出_____人.0.00050.00040.00030.00020.0001频率组距月收入(元)【例12】 如图为某样本数据的频率分布直方图,则下列说法不正确的是( )频率A .[610),的频率为0.32 B .若样本容量为100,则[1014),的频数为40 C .若样本容量为100,则(10] ,的频数为40 D .由频率分布布直方图可得出结论:估计总体大约有10%分布在[1014),【例13】 (2006北京模拟)下面是某学校学生日睡眠时间的抽样频率分布表:【例14】 (2010崇文一模)为了调查某厂2000名工人生产某种产品的能力,随机抽查了m 位工人某天生产该产品的数量,产品数量的分组区间为[)10,15,[)15,20,[)20,25,[)25,30,[30,35],频率分布直方图如图所示.已知生产的产品数量在[)20,25之间的工人有6位. ⑴求m ; 10 15 20 25 30 35产品数量⑵工厂规定从各组中任选1人进行再培训,则选取5人不在同一组的概率是多少?【例15】 考查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm )如下:⑴ 作出频率分布表; ⑵ 画出频率分布直方图.【例16】(2010陕西卷高考)为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行出样检查,测得身高情况的统计图如下:/cm/cm⑴估计该小男生的人数;⑵估计该校学生身高在170~185cm之间的概率;⑶从样本中身高在165~180cm之间的女生..中任选2人,求至少有1人身高在170~180cm 之间的概率.【例17】从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表,画出频率分布直方图及折线图,并根据作出的频率分布直方图估计身高不小于170的同学的人数.【例18】为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如下图),已知图中从左到右的前三个小组的频率分别是0.10.30.4,,.第一小组的频数是5.⑴求第四小组的频率和参加这次测试的学生人数;⑵在这次测试中,学生跳绳次数的中位数落在第几小组内?⑶参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩优秀率是多少?O频率组距次数149.5124.599.574.549.5【例19】 为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛. 为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计. 请你根据尚未完成并有局部污损的频率分布表和频数分布直方图,解答下列问题:⑴ 填充频率分布表的空格(将答案直接填在表格内); ⑵ 补全频数条形图;⑶ 若成绩在75.5~85.5分的学生为二等奖,问获得二等奖的学生约为多少人?【例20】 (2010丰台一模)某校高三(1)班的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题.85987654322198653328698765叶茎1009080706050分数频率组距0.040.0280.0160.008⑴求全班人数及分数在[)80,90之间的频数;⑵估计该班的平均分数,并计算频率分布直方图中[)80,90间的矩形的高;⑶若要从分数在[]80,100之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在[]90,100之间的概率.【例21】某地区为了了解70~80岁老人的日平均睡眠时间(单位:h).随机选择了50位老人的进行调查.下表是这50位老人日睡眠时间的频率分布表.在上述统计数据中,一部分计算见算法流程图(其中←可用=代替),则输出的S的值是.。

历年高考数学真题精选40 频率分布直方图

历年高考数学真题精选40 频率分布直方图

高考数学真题精选(按考点分类)专题40 频率分布直方图(学生版)一.选择题(共2小题)1.(2016•山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140A.6B.8C.12D.18二.填空题(共2小题)3.(2015•湖北)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a .(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.4.(2014•江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:)cm,所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm.三.解答题(共8小题)5.(2019•新课标Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).m和使6.(2018•新课标Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:3)用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于30.35m的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)7.(2017•北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20, ,90],并整理得到如下频率分布直方图:30),[30,40),[80(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.8.(2017•新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:)kg,其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50kg箱产量50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较.附:2P K K0.0500.0100.001()K 3.841 6.63510.82822()()()()()n ad bc K a b c d a c b d -=++++. 9.(2016•四川)我国是世界上严重缺水的国家.某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),⋯,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(Ⅰ)求直方图中a 的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (Ⅲ)估计居民月均水量的中位数.10.(2016•北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如图频率分布直方图:(1)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当3w =时,估计该市居民该月的人均水费.11.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?12.(2015•新课标Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100)频数2814106(1)做出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个不等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.历年高考数学真题精选(按考点分类)专题40 频率分布直方图(教师版)一.选择题(共2小题)1.(2016•山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140【答案】D【解析】自习时间不少于22.5小时的频率为:(0.160.080.04) 2.50.7++⨯=,故自习时间不少于22.5小时的频数为:0.7200140⨯=A.6B.8C.12D.18【答案】C【解析】由直方图可得分布在区间第一组与第二组共有20人,分布在区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人,第三组的频率为0.36,所以第三组的人数:18人,第三组中没有疗效的有6人,第三组中有疗效的有12人.二.填空题(共2小题)3.(2015•湖北)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=.(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.【答案】(1)3 (2)6000【解析】(1)由题意,根据直方图的性质得(1.5 2.5 2.00.80.2)0.11+++++⨯=,解得3aa=(2)由直方图得(3 2.00.80.2)0.1100006000+++⨯⨯=4.(2014•江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:)cm,所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm.【答案】24【解析】由频率分布直方图知:底部周长小于100cm的频率为(0.0150.025)100.4+⨯=,⨯=(株).∴底部周长小于100cm的频数为600.424三.解答题(共8小题)5.(2019•新课标Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解:(1)C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.则由频率分布直方图得:0.200.150.70.050.1510.7ab++=⎧⎨++=-⎩,解得乙离子残留百分比直方图中0.35a=,0.10b=.(2)估计甲离子残留百分比的平均值为:20.1530.2040.3050.2060.1070.05 4.05x=⨯+⨯+⨯+⨯+⨯+⨯=甲.乙离子残留百分比的平均值为:30.0540.150.1560.3570.280.15 6.00x=⨯+⨯+⨯+⨯+⨯+⨯=乙.6.(2018•新课标Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:3)m和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于30.35m的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)【解答】解:(1)根据使用了节水龙头50天的日用水量频数分布表,作出使用了节水龙头50天的日用水量数据的频率分布直方图,如下图:(2)根据频率分布直方图得:该家庭使用节水龙头后,日用水量小于30.35m 的概率为: (0.2 1.0 2.61)0.10.48p =+++⨯=.(3)由题意得未使用水龙头50天的日均水量为:1(10.0530.1520.2540.3590.45260.5550.65)0.4850⨯+⨯+⨯+⨯+⨯+⨯+⨯=, 使用节水龙头50天的日均用水量为:1(10.0550.15130.25100.35160.4550.55)0.3550⨯+⨯+⨯+⨯+⨯+⨯=, ∴估计该家庭使用节水龙头后,一年能节省:3365(0.480.35)47.45m ⨯-=.7.(2017•北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),[80⋯,90],并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解:(Ⅰ)由频率分布直方图知:分数小于70的频率为:1(0.040.02)100.4-+⨯=故从总体的400名学生中随机抽取一人,估计其分数小于70的概率为0.4;(Ⅱ)已知样本中分数小于40的学生有5人,故样本中分数小于40的频率为:0.05,则分数在区间[40,50)内的频率为:1(0.040.020.020.01)100.050.05-+++⨯-=,估计总体中分数在区间[40,50)内的人数为4000.0520⨯=人,(Ⅲ)样本中分数不小于70的频率为:0.6,由于样本中分数不小于70的男女生人数相等.故分数不小于70的男生的频率为:0.3,由样本中有一半男生的分数不小于70,故男生的频率为:0.6,即女生的频率为:0.4,即总体中男生和女生人数的比例约为:3:2.8.(2017•新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:)kg,其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50kg <箱产量50kg旧养殖法 新养殖法(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较. 附:2()P K K0.050 0.010 0.001 K3.8416.63510.8282()()()()()n ad bc K a b c d a c b d -=++++. 解:(1)根据题意,由旧养殖法的频率分布直方图可得:P (A )(0.0120.0140.0240.0340.040)50.62=++++⨯=;(2)根据题意,补全列联表可得:箱产量50kg <箱产量50kg总计 旧养殖法 62 38 100 新养殖法 34 66 100 总计96104200则有2200(62663834)15.705 6.63510010096104K ⨯-⨯=≈>⨯⨯⨯, 故有99%的把握认为箱产量与养殖方法有关; (3)由频率分布直方图可得: 旧养殖法100个网箱产量的平均数1(27.50.01232.50.01437.50.02442.50.03447.50.04052.50.03257.50.0262.50.01267.50.012)559.4247.1x =⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯⨯=⨯=; 新养殖法100个网箱产量的平均数2(37.50.00442.50.02047.50.04452.50.05457.50.04662.50.01067.50.008)5510.4752.35x =⨯+⨯+⨯+⨯+⨯+⨯+⨯⨯=⨯=;比较可得:12x x <,故新养殖法更加优于旧养殖法.9.(2016•四川)我国是世界上严重缺水的国家.某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),⋯,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(Ⅰ)求直方图中a 的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (Ⅲ)估计居民月均水量的中位数.解:()1(0.080.160.400.520.120.080.04)0.5I a a =++++++++⨯, 整理可得:2 1.42a =+,∴解得:0.3a =.()II 估计全市居民中月均用水量不低于3吨的人数为3.6万,理由如下:由已知中的频率分布直方图可得月均用水量不低于3吨的频率为(0.120.080.04)0.50.12++⨯=,又样本容量为30万,则样本中月均用水量不低于3吨的户数为300.12 3.6⨯=万. (Ⅲ)根据频率分布直方图,得;0.080.50.160.50.300.50.420.50.480.5⨯+⨯+⨯+⨯=<,+⨯=>,0.480.50.50.740.5∴中位数应在[2,2.5)组内,设出未知数x,令0.080.50.160.50.300.50.420.50.50.5⨯+⨯+⨯+⨯+⨯=,x解得0.04x=;+=.∴中位数是20.04 2.0410.(2016•北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如图频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当3w=时,估计该市居民该月的人均水费.解:(1)由频率分布直方图得:用水量在[0.5,1)的频率为0.1,用水量在[1,1.5)的频率为0.15,用水量在[1.5,2)的频率为0.2,用水量在[2,2.5)的频率为0.25,用水量在[2.5,3)的频率为0.15,用水量在[3,3.5)的频率为0.05,用水量在[3.5,4)的频率为0.05,用水量在[4,4.5)的频率为0.05,用水量小于等于3立方米的频率为85%,∴为使80%以上居民在该用的用水价为4元/立方米,w∴至少定为3立方米.(2)当3w=时,该市居民的人均水费为:(0.110.15 1.50.220.25 2.50.153)40.05340.050.5100.05340.051100.05340.05 1.51010.5⨯+⨯+⨯+⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=,∴当3w=时,估计该市居民该月的人均水费为10.5元.11.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?解:(1)由直方图的性质可得(0.0020.00950.0110.01250.0050.0025)201x++++++⨯=,解方程可得0.0075x=,∴直方图中x的值为0.0075;(2)月平均用电量的众数是2202402302+=,(0.0020.00950.011)200.450.5++⨯=<,∴月平均用电量的中位数在[220,240)内,设中位数为a,由(0.0020.00950.011)200.0125(220)0.5a++⨯+⨯-=可得224a=,∴月平均用电量的中位数为224;(3)月平均用电量为[220,240)的用户有0.01252010025⨯⨯=,月平均用电量为[240,260)的用户有0.00752010015⨯⨯=,月平均用电量为[260,280)的用户有0.0052010010⨯⨯=,月平均用电量为[280,300)的用户有0.0025201005⨯⨯=,∴抽取比例为111 25151055=+++,∴月平均用电量在[220,240)的用户中应抽取12555⨯=户.12.(2015•新课标Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100)频数2814106(1)做出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个不等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.解:(Ⅰ)通过两个地区用户满意度评分的频率分布直方图可以看出,B 地区用户满意度评分的平均值高于A 地区用户满意度评分的平均值,B 地区的用户满意度评分的比较集中,而A 地区的用户满意度评分的比较分散.(Ⅱ)A 地区用户的满意度等级为不满意的概率大.记A C 表示事件:“A 地区用户的满意度等级为不满意”, B C 表示事件:“B 地区用户的满意度等级为不满意”,由直方图得()(0.010.020.03)100.6A P C =++⨯= 得()(0.0050.02)100.25B P C =+⨯=A ∴地区用户的满意度等级为不满意的概率大.。

高中数学专题讲义-频率直方图

高中数学专题讲义-频率直方图

一.随机抽样1.随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法:⑴简单随机抽样:从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. 抽出办法:①抽签法:用纸片或小球分别标号后抽签的方法.②随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表.表中每一位置出现各个数字的可能性相同. 随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法.简单随机抽样是最简单、最基本的抽样方法.⑵系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.抽出办法:从元素个数为N 的总体中抽取容量为n 的样本,如果总体容量能被样本容量整除,设Nk n=,先对总体进行编号,号码从1到N ,再从数字1到k 中随机抽取一个数s 作为起始数,然后顺次抽取第2(1)s k s k s n k +++-L ,,,个数,这样就得到容量为n 的样本.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样.系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样.⑶分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样.分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛.2.简单随机抽样必须具备下列特点:⑴简单随机抽样要求被抽取的样本的总体个数N 是有限的. ⑵简单随机样本数n 小于等于样本总体的个数N . ⑶简单随机样本是从总体中逐个抽取的. ⑷简单随机抽样是一种不放回的抽样.⑸简单随机抽样的每个个体入样的可能性均为nN.3.系统抽样时,当总体个数N 恰好是样本容量n 的整数倍时,取Nk n=;若Nn不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量n 整除.因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍知识内容板块二.频率直方图然相等,为N n.二.频率直方图列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:取组距,用极差组距决定组数;③决定分点:决定起点,进行分组;④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图,知小长方形的面积=组距×频率组距=频率.频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x =来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.三.茎叶图制作茎叶图的步骤:①将数据分为“茎”、“叶”两部分;②将最大茎与最小茎之间的数字按大小顺序排成一列,并画上竖线作为分隔线; ③将各个数据的“叶”在分界线的一侧对应茎处同行列出.四.统计数据的数字特征用样本平均数估计总体平均数;用样本标准差估计总体标准差. 数据的离散程序可以用极差、方差或标准差来描述.极差又叫全距,是一组数据的最大值和最小值之差,反映一组数据的变动幅度; 样本方差描述了一组数据平均数波动的大小,样本的标准差是方差的算术平方根. 一般地,设样本的元素为12n x x x L ,,,样本的平均数为x , 定义样本方差为222212()()()n x x x x x x s n-+-++-=L ,样本标准差s =简化公式:22222121[()]n s x x x nx n=+++-L .五.独立性检验1.两个变量之间的关系;常见的有两类:一类是确定性的函数关系;另一类是变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的.当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系. 2.散点图:将样本中的n 个数据点()(12)i i x y i n =L ,,,,描在平面直角坐标系中,就得到了散点图.散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系.3.如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域.反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.此时,散点图中的点在从左上角到右下角的区域.散点图可以判断两个变量之间有没有相关关系.4.统计假设:如果事件A 与B 独立,这时应该有()()()P AB P A P B =,用字母0H 表示此式,即0:()()()H P AB P A P B =,称之为统计假设. 5.2χ(读作“卡方”)统计量:统计学中有一个非常有用的统计量,它的表达式为22112212211212()n n n n n n n n n χ++++-=,用它的大小可以用来决定是否拒绝原来的统计假设0H .如果2χ的值较大,就拒绝0H ,即认为A 与B 是有关的.2χ统计量的两个临界值:3.841、6.635;当2 3.841χ>时,有95%的把握说事件A 与B 有关;当2 6.635χ>时,有99%的把握说事件A 与B 有关;当2 3.841χ≤时,认为事件A 与B 是无关的.独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立的. 1.独立性检验的步骤:统计假设:0H ;列出22⨯联表;计算2χ统计量;查对临界值表,作出判断.2.几个临界值:222()0.10( 3.841)0.05( 6.635)0.01P P P χχχ≈≈≈≥2.706,≥,≥.22⨯联表的独立性检验:如果对于某个群体有两种状态,对于每种状态又有两个情况,这样排成一张22⨯的表,如下:如果有调查得来的四个数据11122122n 4个数据来检验上述的两种状态A 与B 是否有关,就称之为22⨯联表的独立性检验.六.回归分析1.回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性. 回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.最小二乘法:记回归直线方程为:ˆy a bx =+,称为变量Y 对变量x 的回归直线方程,其中a b ,叫做回归系数.ˆy是为了区分Y 的实际值y ,当x 取值i x 时,变量Y 的相应观察值为i y ,而直线上对应于i x 的纵坐标是ˆi i ya bx =+. 设x Y ,的一组观察值为()i i x y ,,12i n =L ,,,,且回归直线方程为ˆya bx =+, 当x 取值i x 时,Y 的相应观察值为i y ,差ˆ(12)i i y y i n -=L ,,,刻画了实际观察值i y 与回归直线上相应点的纵坐标之间的偏离程度,称这些值为离差.我们希望这n 个离差构成的总离差越小越好,这样才能使所找的直线很贴近已知点. 记21()ni i i Q y a bx ==--∑,回归直线就是所有直线中Q 取最小值的那条.这种使“离差平方和为最小”的方法,叫做最小二乘法.用最小二乘法求回归系数a b ,有如下的公式:1221ˆni ii nii x ynxy bxnx ==-=-∑∑,ˆˆa y bx =-,其中a b ,上方加“^”,表示是由观察值按最小二乘法求得的回归系数.3.线性回归模型:将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型. 产生随机误差的主要原因有:①所用的确定性函数不恰当即模型近似引起的误差; ②忽略了某些因素的影响,通常这些影响都比较小; ③由于测量工具等原因,存在观测误差. 4.线性回归系数的最佳估计值:利用最小二乘法可以得到ˆˆab ,的计算公式为 1122211()()()()nnii iii i nniii i xx y y x ynxybxx xn x ====---==--∑∑∑∑$,ˆˆa y bx =-,其中11n i i x x n ==∑,11nii y y n ==∑ 由此得到的直线ˆˆya bx =+$就称为回归直线,此直线方程即为线性回归方程.其中ˆa ,b $分别为a ,b 的估计值,ˆa称为回归截距,b $称为回归系数,ˆy 称为回归值. 5.相关系数:()()nnii i ixx y y x ynx yr ---==∑∑6.相关系数r 的性质:⑴||1r ≤;⑵||r 越接近于1,x y ,的线性相关程度越强; ⑶||r 越接近于0,x y ,的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. 7.转化思想:根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数. 8.一些备案 ①回归(regression )一词的来历:“回归”这个词英国统计学家Francils Galton 提出来的.1889年,他在研究祖先与后代的身高之间的关系时发现,身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们父母的平均身高高.Galton 把这种后代的身高向中间值靠近的趋势称为“回归现象”.后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析.②回归系数的推导过程:22222[()]222i i i i i i i i Q y a bx y a y na b x y ab x b x =--=-+-++∑∑∑∑∑∑ 22222()2i i ii i i na a b x y b x b x y y =+-+-+∑∑∑∑∑,把上式看成a 的二次函数,2a 的系数0n >,因此当2()2i i i ib x y y b x a n n --=-=∑∑∑∑时取最小值. 同理,把Q 的展开式按b 的降幂排列,看成b 的二次函数,当2i iiix y a xb x-=∑∑∑时取最小值.解得:12221()()()ni iii i niii x ynxyx x y y b x x xnx==---==--∑∑∑∑,a y bx =-, 其中1i y y n =∑,1i x x n=∑是样本平均数. 9. 对相关系数r 进行相关性检验的步骤: ①提出统计假设0H :变量x y ,不具有线性相关关系;②如果以95%的把握作出推断,那么可以根据10.950.05-=与2n -(n 是样本容量)在相关性检验的临界值表中查出一个r 的临界值0.05r (其中10.950.05-=称为检验水平); ③计算样本相关系数r ;④作出统计推断:若0.05||r r >,则否定0H ,表明有95%的把握认为变量y 与x 之间具有线性相关关系;若0.05||r r ≤,则没有理由拒绝0H ,即就目前数据而言,没有充分理由认为变量y 与x 之间具有线性相关关系. 说明:⑴对相关系数r 进行显著性检验,一般取检验水平0.05α=,即可靠程度为95%.⑵这里的r 指的是线性相关系数,r 的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系.⑶这里的r 是对抽样数据而言的.有时即使||1r =,两者也不一定是线性相关的.故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释.题型一 频率分布直方图【例1】 (2010西城二模)某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.则这200名同学中成绩大于等于80分且小于90分的学生有______名.典例分析【例2】 (2010东城二模)已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内的样本频数为 ,样本数据落在[2,10)内的频率为 .【例3】 (2010北京)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a = .若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[]140,150内的学生中选取的人数应为 .【例4】 (2010江苏高考)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[]540,中,其频率分布直方图如图所示,则其抽样的100根中,有____根在棉花纤维的长度小于20mm .(mm)频率组距【例5】 (2009湖北15)下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[)610,内的频数为 ,数据落在[)210,内的概率约为 .【例6】 (2009福建3)A .0.13B .0.39C .0.52D .0.64【例7】 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( )时间(h)A .0.6hB .0.9hC .1.0hD .1.5h【例8】 为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[)4555,,[)5565,,[)6575,,[)7585,,[)8595,由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)5575,的人数是 .产品数量0.0200.0150.0100.005【例9】 (2009山东8)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96106],,样本数据分组为[)9698,,[)98100,,[)100102,,[)102104,,[104106],.已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A .90B .75C .60D .45【例10】 某路段检查站监控录象显示,在某时段内,有1000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为右图的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90km/h 的车辆数为( )A .200B .600C .500D .300【例11】 (2006年全国II )一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本频率分布直方图,为了分析居民的收入与年龄、学历、职业等方面的联系,要从这10000人中用分层抽样的方法抽出100人做进一步调查,则在[25003000],(元)月收入段应抽出_____人.0.00050.00040.00030.00020.0001频率组距月收入(元)【例12】 如图为某样本数据的频率分布直方图,则下列说法不正确的是( )0.1频率组距A .[610),的频率为0.32B .若样本容量为100,则[1014),的频数为40C .若样本容量为100,则(10]-∞,的频数为40D .由频率分布布直方图可得出结论:估计总体大约有10%分布在[1014),【例13】 (2006北京模拟)下面是某学校学生日睡眠时间的抽样频率分布表:【例14】 (2010崇文一模)为了调查某厂2000名工人生产某种产品的能力,随机抽查了m 位工人某天生产该产品的数量,产品数量的分组区间为[)10,15,[)15,20,[)20,25,[)25,30,[30,35],频率分布直方图如图所示.已知生产的产品数量在[)20,25之间的工人有6位.⑴求m ;10 15 20 25 30 35产品数量⑵工厂规定从各组中任选1人进行再培训,则选取5人不在同一组的概率是多少?【例15】 考查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm )⑴ 作出频率分布表; ⑵ 画出频率分布直方图.【例16】 (2010陕西卷高考)为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行出样检查,测得身高情况的统计图如下:/cm/cm⑴估计该小男生的人数;⑵估计该校学生身高在170~185cm 之间的概率; ⑶从样本中身高在165~180cm 之间的女生..中任选2人,求至少有1人身高在170~180cm 之间的概率.【例17】 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm ).作出该样本的频率分布表,画出频率分布直方图及折线图,并根据作出的频率分布直方图估计身高不小于170的同学的人数.【例18】 为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如下图),已知图中从左到右的前三个小组的频率分别是0.10.30.4,,.第一小组的频数是5.⑴求第四小组的频率和参加这次测试的学生人数;⑵在这次测试中,学生跳绳次数的中位数落在第几小组内? ⑶参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩优秀率是多少?【例19】 为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛. 为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计. 请你根据尚未完成并有局部污损的频率分布表和频数分布直方图,解答下列问题: ⑴ 填充频率分布表的空格(将答案直接填在表格内); ⑵ 补全频数条形图;⑶ 若成绩在75.5~85.5分的学生为二等奖,问获得二等奖的学生约为多少人?【例20】 (2010丰台一模)某校高三(1)班的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题.85987654322198653328698765叶茎6050分数频率组距0.040.0280.0160.008⑴求全班人数及分数在[)80,90之间的频数;⑵估计该班的平均分数,并计算频率分布直方图中[)80,90间的矩形的高;⑶若要从分数在[]80,100之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在[]90,100之间的概率.【例21】 某地区为了了解70~80岁老人的日平均睡眠时间(单位:h ).随机选择了50位老人的进行调查.下表是这50位老人日睡眠时间的频率分布表.序号 (i ) 分组 (睡眠时间) 组中值 (i G ) 频数 (人数) 频率(i F ) 1 [4,5) 4.5 6 0.12 2 [5,6) 5.510 0.20 3 [6,7) 6.5 20 0.40 4 [7,8) 7.5 10 0.205[8,9]8.5 40.08在上述统计数据中,一部分计算见算法流程图(其中←可用=代替),则输出的S的值是.。

2023年高考数学复习----《统计图表》规律方法与典型例题讲解

2023年高考数学复习----《统计图表》规律方法与典型例题讲解

2023年高考数学复习----《统计图表》规律方法与典型例题讲解【规律方法】1、制作频率分布直方图的步骤.第一步:求极差,决定组数和组距,组距=极差组数第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表;第四步:画频率分布直方图.2、解决频率分布直方图问题时要抓住3个要点.(1)直方图中各小矩形的面积之和为1;(2)直方图中纵轴表示频率组距,故每组样本的频率为组距⨯频率组距(3)直方图中每组样本的频数为频率⨯总体个数.3、用频率分布直方图估计众数、中位数、平均数的方法.(1)众数为频率分布直方图中最高矩形底边中点的横坐标;(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;(3)平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和.【典型例题】例1.(2022·云南昆明·昆明一中模拟预测)为了响应教育部门疫情期间“停课不停学”的号召,某校实施网络授课,为了检验学生上网课的效果,在高三年级进行了一次网络模拟考试,从中抽取了100人的数学成绩,绘制成频率分布直方图(如下图所示),其中数学成绩落在区间[110,120),[120,130),[130,140]的频率之比为4:2:1.(1)根据频率分布直方图求学生成绩在区间[110,120)的频率,并求抽取的这100名同学数学成绩的中位数(2)若将频率视为概率,从全校高三年级学生中随机抽取3个人,记抽取的3人成绩在[100,130)内的学生人数为X ,求X 的分布列与数学期望.【解析】(1)由直方图可知,数学成绩落在区间[70,110)内的频率为(0.0040.0120.0190.030)10+++⨯=0.65,所以数学成绩落在区间[110,140]内的频率为10.650.35−=,因为数学成绩落在区间[110,120),[120,130),[130,140]的频率之比为4:2:1,所以数学成绩落在区间[110,120)的频率为40.35421⨯++0.2=, 数学成绩落在区间[70,100)的频率为(0.0040.0120.019)100.35++⨯=, 所以中位数落在区间[100,110)内,设中位数为x ,则(100)0.0300.50.35x −⨯=−,解得105x =, 所以抽取的这100名同学数学成绩的中位数为105.(2)由(1)知,数学成绩落在区间[100,130)内的频率为0.0310⨯+0.2+20.35421⨯++0.6=,由题意可知,3~(3,)5X B ,X 的所有可能取值为0,1,2,3,033338(0)C ()(1)55125P X ==⋅−=,12333(1)C (1)55P X ==⋅⋅−36125=, 22333(2)C ()(1)55P X ==⋅⋅−54125=,330333(3)C ()(1)55P X ==⋅−27125=,所以X 的分布列为:所以数学期望8365427()0123125125125125E X =⨯+⨯+⨯+⨯95=.例2.(2022·贵州贵阳·贵阳六中校考一模)某校组织1000名学生进行科学探索知识竞赛,成绩分成5组:[)50,60,[)60,70,[)70,80,[)80,90,[]90,100,得到如图所示的频率分布直方图.若图中未知的数据a ,b ,c 成等差数列,成绩落在区间[)60,70内的人数为400.(1)求出直方图中a ,b ,c 的值;(2)估计中位数(精确到0.1)和平均数(同一组中的数据用该组区间的中点值代替); (3)若用频率估计概率,设从这1000人中抽取的6人,得分在区间[]90,100内的学生人数为X ,求X 的数学期望.【解析】(1)依题意可得:4001000100.04a =÷÷=,又a ,b ,c 成等差数列,所以2b a c =+且(0.0050.005)101a b c ++++⨯=,解得:0.02,0.03c b == 所以0.04,0.03,0.02a b c ===.(2)因为(0.0050.04)100.450.5+⨯=<,设中位数为x , 则[70,80)x ∈,所以()()0.0050.0410700.030.5x +⨯+−⨯=,解得:71.7x ≈,即中位数约为71.7,平均数为(550.005650.04750.03850.02950.005)1073⨯+⨯+⨯+⨯+⨯⨯=. (3)由题意可知:得分在区间[]90,100内概率为10.0051020⨯=, 根据条件可知:X 的所有可能值为0,1,2,3,4,5,6,且1(6,)20X ,所以1()60.320E X np ==⨯=.例3.(2022·全国·高三专题练习)为丰富学生课外生活,某市组织了高中生钢笔书法比赛,比赛分两个阶段进行:第一阶段由评委为所有参赛作品评分,并确定优胜者;第二阶段为附加赛,参赛人员由组委会按规则另行确定.数据统计员对第一阶段的分数进行了统计分析,这些分数X 都在[75,100)内,再以5为组距画分数的频率分布直方图(设“Y=频率组距”)时,发现Y 满足:7,15,15019,16,30011,16,1520n Y n k n n ⎧=⎪⎪⎪==⎨⎪⎪−⋅>⎪−⎩,55(1)n N n X n *∈≤<+. (1)试确定n 的所有取值,并求k ;(2)组委会确定:在第一阶段比赛中低于85分的同学无缘获奖也不能参加附加赛;分数在[95,100)内的同学评为一等奖;分数在[90,95)内的同学评为二等奖,但通过附加赛有111的概率提升为一等奖;分数在[85,90)内的同学评为三等奖,但通过附加赛有17的概率提升为二等奖(所有参加附加赛的获奖人员均不降低获奖等级,且附加赛获奖等级在第一阶段获奖等级基础上,最多升高一级).已知学生A 和B 均参加了本次比赛,且学生A 在第一阶段获得二等奖.①求学生B 最终获奖等级不低于学生A 最终获奖等级的概率;②已知学生A 和B 都获奖,记A ,B 两位同学最终获得一等奖的人数为ξ,求ξ的分布列和数学期望.【解析】(1)根据题意,X 在[75,100)内,按5为组距可分成5个小区间, 分别是[75,80),[80,85),[85,90),[90,95),[95,100),因为75100X ≤<,由55(1)n X n ≤<+,n N *∈,所以15,16,17,18,19n =.每个小区间的频率值分别是7,15,30195,1660115,17,18,19320n P Y n k n n ⎧=⎪⎪⎪===⎨⎪⎪−⋅=⎪−⎩由719111511306032k ⎛⎫++−++= ⎪⎝⎭,解得350k =. (2)①由于参赛学生很多,可以把频率视为概率.由(1)知,学生B 的分数属于区间[75,80),[80,85),[85,90),[90,95),[95,100)的概率分别是:730,1960,1460,1160,260.我们用符号ijA (或ijB )表示学生A (或B )在第一轮获奖等级为i ,通过附加赛最终获奖等级为j ,其中(,1,2,3)j i i j ≤=记“学生B 最终获奖等级不低于学生A 的最终获奖等级”为事件W , 则()12122223222()P W P B B B A B A =+++()()()()()()12122223222P B P B P B P A P B P A =+++2111111010141105160601160111160711220=+⋅+⋅⋅+⋅⋅=.②学生A 最终获得一等奖的概率是111A P =,学生B 最终获得一等奖的概率是21112116060272711272796060B P =+⋅=+=,1180(0)1111999P ξ⎛⎫⎛⎫==−−= ⎪⎪⎝⎭⎝⎭,111118(1)1111911999P ξ⎛⎫⎛⎫==⋅−+−⋅=⎪ ⎪⎝⎭⎝⎭, 111(2)11999P ξ==⋅=.所以ξ的分布列为:801812001299999999E ξ=⋅+⋅+⋅=.。

高中数学频率分布直方图

高中数学频率分布直方图

频率分布直方图作频率分布直方图的方法为:(1)把横轴分成若干段,每一线段对应一个组的组距;(2)以此线段为底作矩形,它的高等于该组的组距频率,这样得出一系列的矩形;(3)每个矩形的面积恰好是该组上的频率.频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图.作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.知识点1:利用频率分布直方图分析总体分布例题1: 2000辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,时速在[50,60)的汽车大约有 A .30辆 B .60辆 C .300辆 D .600辆变式:某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是 [96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是A.90B.75C. 60D.45变式:某初一年级有500名同学,将他们的身高(单位:cm )数据绘制成频率分布直方图(如图),若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[)130,140内的学生中选取的人数为 .知识点2:用样本分估计总体例题2某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,96 98 100 102 104 106 0.1500.125 0.1000.0750.050 克 频率/组距100 110 120130 140 150 身高频率|组距0.0050.0100.020a0.035(Ⅰ) 完成频率分布表;(Ⅱ)作出频率分布直方图;(Ⅲ)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染。

高中数学频率分布直方图

高中数学频率分布直方图

频率分布直方图作频率分布直方图的方法为:(1)把横轴分成若干段,每一线段对应一个组的组距;(2)以此线段为底作矩形,它的高等于该组的组距频率,这样得出一系列的矩形;(3)每个矩形的面积恰好是该组上的频率.频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图.作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.知识点1:利用频率分布直方图分析总体分布例题1:2000辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,时速在[50,60)的汽车大约有A.30辆B.60辆C.300辆D.600辆变式:某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是A.90B.75C. 60D.45变式:某初一年级有500名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图),若要从身高在[)120,130,[)130,140,[]140,150三100 110 120 130 140 150 身高.组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[)130,140内的学生中选取的人数为.知识点2:用样本分估计总体例题2某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,(Ⅰ) 完成频率分布表;(Ⅱ)作出频率分布直方图;(Ⅲ)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染。

高考数学专题统计《用频率直方图估计总体分布《百分位数》突破解析

高考数学专题统计《用频率直方图估计总体分布《百分位数》突破解析

14.4.3用频率直方图估计总体分布14.4.4百分位数必备知识基础练1.以下数据为参加数学竞赛决赛的15人的成绩(单位:分):78,70,72,86,88,79,80,81,94,84,56,98,83,90,91.这15人成绩的80百分位数是()A.90B.90.5C.91D.91.5=12,56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为80×15100=90.5.所以这15人成绩的80百分位数是90+9122.如图是某工厂对一批新产品长度(单位:mm)检测结果的频率直方图.估计这批产品的平均数与中位数分别为()A.22.5,20B.22.5,22.75C.22.75,22.5D.22.75,25,这批产品的平均数为x=5×(0.02×12.5+0.04×17.5+0.08×22.5+0.03×27.5+0.03×32.5)=22.75,其中位数为=22.5.故选C.x0=20+0.5-(0.02+0.04)×50.083.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,50百分位数为b,则有()A.a=13.7,b=15.5B.a=14,b=15C.a=12,b=15.5D.a=14.7,b=1510,12,14,14,15,15,16,17,17,17,其平均数a=110×(10+12+14+14+15+15+16+17+17+17)=14.7,因为50×10100=5,所以这10名工人一小时内生产零件的50百分位数为b=15+152=15. 4.已知甲、乙两组数据(已按从小到大的顺序排列): 甲组:27,28,39,40,m ,50; 乙组:24,n ,34,43,48,52.若这两组数据的30百分位数,80百分位数分别相等,则mn等于( ) A.127 B.107C.43D.74因为30100×6=1.8,80100×6=4.8,所以30百分位数为n=28,80百分位数为m=48,所以mn =4828=127. 5.1,2,3,4,5,6,7,8,9,10这组数据的25百分位数为 ,75百分位数为 ,90百分位数为 .8 9.510,而且10×25%=2.5,10×75%=7.5,10×90%=9,所以该组数据的25百分位数为3,75百分位数为8,90百分位数为9+102=9.5. 6.某学校组织学生参加数学测试,成绩的频率直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的 百分位数.[20,40),[40,60)的频率之和为(0.005+0.01)×20=0.3,所以60分为成绩的30百分位数.7.某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45]岁之间,根据调查结果得出司机的年龄情况残缺的频率直方图如图所示,利用这个残缺的频率直方图估计该市出租车司机年龄的中位数大约是 (保留一位小数)..6,所有矩形面积之和为1,所以,数据位于[25,30)的频率为1-(0.01+0.07+0.06+0.02)×5=0.2, 前两个矩形的面积之和为0.01×5+0.2=0.25, 前三个矩形的面积之和为0.25+0.07×5=0.6, 所以,中位数位于区间[30,35),设中位数为a , 则有0.25+(a-30)×0.07=0.5,解得a ≈33.6(岁). 8.求下列数据的四分位数. 13,15,12,27,22,24,28,30,31,18,19,20.12个数据按从小到大的顺序排列为12,13,15,18,19,20,22,24,27,28,30,31,计算25×12100=3,50×12100=6,75×12100=9, 所以数据的25百分位数为15+182=16.5, 50百分位数为20+222=21,75百分位数为27+282=27.5. 9.某网络营销部门随机抽查了某市200名网友在2019年11月11日的网购金额,所得数据如下表:已知网购金额低于3千元与不低于3千元的人数比恰为3∶2. (1)试确定x ,y ,p ,q 的值,并补全频率直方图;(2)估计网购金额的25百分位数(结果保留三位有效数字).根据题意有{16+24+x +y +16+14=200,16+24+x y+16+14=32,解得{x =80,y =50.所以p=0.4,q=0.25.补全频率直方图如图所示.(2)由(1)可知,网购金额低于2千元的频率为0.08+0.12=0.2,网购金额低于3千元的频率为0.2+0.4=0.6,所以网购金额的25百分位数在[2,3)内,则网购金额的25百分位数估计为2+0.25-0.20.6-0.2×1=2.125≈2.13. 关键能力提升练10.数据3.2,3.4,3.8,4.2,4.3,4.5,x ,6.6的65百分位数是4.5,则实数x 的取值范围是( ) A.[4.5,+∞) B.[4.5,6.6) C.(4.5,+∞)D.(4.5,6.6]65×8100=5.2,所以这组数据的65百分位数是第6个数据4.5,则x ≥4.5,故选A.11.港珠澳大桥于2018年10月24日正式通车,它是中国境内一座连接香港、珠海和澳门的桥隧工程.桥隧全长55千米,桥面为双向六车道高速公路,大桥通行限速100 km/h .现对大桥某路段上汽车行驶速度进行抽样调查,画出频率直方图(如图).根据直方图估计在此路段上汽车行驶速度的众数和行驶速度超过90 km/h 的频率分别为( )A.85,0.25B.90,0.35C.87.5,0.25D.87.5,0.35=87.5,由频率直方图估计在此路段由频率直方图估计在此路段上汽车行驶速度的众数为85+902上汽车行驶速度超过90 km/h的频率为(0.05+0.02)×5=0.35,所以由频率直方图估计在此路段上汽车行驶速度超过90 km/h的频率为0.35.12.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率直方图如图所示.估计棉花纤维的长度的样本数据的80百分位数是()A.29 mmB.29.5 mmC.30 mmD.30.5 mm30 mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,在25 mm以=29,可以估计棉花下的比例为85%-25%=60%,因此,80百分位数一定位于[25,30)内,由25+5×0.80-0.600.85-0.60纤维的长度的样本数据的80百分位数是29 mm.13.(多选)已知100个数据的75百分位数是9.3,则下列说法不正确的是()A.这100个数据中一定有75个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第75个数据C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数=75为整数,所以第75个数据和76个数据的平均数为75百分位数,是9.3,则C正75×100100确,其他选项均不对,故选ABD.14.(多选)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的平均数等于乙的成绩的平均数C.甲的成绩的80百分位数等于乙的成绩的80百分位数D.甲的成绩的极差等于乙的成绩的极差,x 甲=4+5+6+7+85=6,x 乙=3×5+6+95=6,A 项错误,B 项正确;甲的成绩的80百分位数为7+82=7.5,乙的成绩的80百分位数为6+92=7.5,所以二者相等,所以C 项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D 项正确.15.已知30个数据的60百分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是 ..660×30100=18,设第19个数据为x ,则7.8+x2=8.2,解得x=8.6,即第19个数据是8.6.16.如图是某市2020年4月1日至4月7日每天最高、最低气温的折线统计图,这7天的日最高气温的10百分位数为 ,日最低气温的80百分位数为 .℃ 16 ℃,把日最高气温按照从小到大排序,得24,24.5,24.5,25,26,26,27,因为共有7个数据,所以7×10100=0.7,不是整数,所以这7天日最高气温的10百分位数是第1个数据,为24 ℃.把日最低气温按照从小到大排序,得12,12,13,14,15,16,17,因为共有7个数据,所以7×80100=5.6,不是整数,所以这7天日最低气温的80百分位数是第6个数据,为16 ℃.17.某年级120名学生在一次百米跑测试中,成绩全部介于13秒与18秒之间,将测试结果分成5组,即[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率直方图,如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70百分位数约为 秒..570百分位数为x ,因为1+3+71+3+7+6+3=0.55,1+3+7+61+3+7+6+3=0.85,所以x ∈[16,17),所以0.55+(x-16)×61+3+7+6+3=0.70,解得x=16.5. 18.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为 ;(2)由频率直方图估计志愿者年龄的85百分位数为 岁(结果保留整数)..04 (2)39设[25,30)年龄组对应小矩形的高度为h ,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.(2)由图可知,年龄小于35岁的频率为(0.01+0.04+0.07)×5=0.6,年龄小于40岁的频率为(0.01+0.04+0.07+0.06)×5=0.9,所以志愿者年龄的85百分位数在[35,40)内,因此志愿者年龄的85百分位数为35+0.85-0.60.9-0.6×5≈39(岁). 19.(2021浙江宁波期末)首次实施新高考的八省(市)于2021年1月23日统一举行了新高考适应性考试,在联考结束后,根据联考成绩,考生可了解自己的学习情况,作出升学规划,决定是否参加强基计划.在本次适应性考试中,某学校为了解高三学生的联考情况,随机抽取了100名学生的联考数学成绩作为样本,并按照分数段[50,70),[70,90),[90,110),[110,130),[130,150]分组,绘制了如图所示的频率直方图.(1)求出图中a的值并估计本次考试及格率(“及格率”指得分为90分及以上的学生所占比例);(2)估计该校学生联考数学成绩的80百分位数;(3)估计该校学生联考数学成绩的众数、平均数.由(0.004+a+0.013+0.014+0.016)×20=1,解得a=0.003,则及格率为(0.016+0.014+0.003)×20=0.66=66%.(2)得分在110以下的学生所占比例为(0.004+0.013+0.016)×20=0.66,得分在130以下的学生所=120(分),估计占比例为0.66+0.014×20=0.94,所以80百分位数位于[110,130)内,由110+20×0.8-0.660.94-0.6680百分位数为120.(3)由图可得,众数估计值为100.平均数估计值为0.08×60+0.26×80+0.32×100+0.28×120+0.06×140=99.6(分).学科素养创新练20.2020年某地苹果出现滞销现象,为了帮助当地果农打开销路,当地政府与全国一些企业采用团购的方式带动销售链,使得当地果农积压的许多苹果有了销路.为了解果农们苹果的销售量情况,当地农业局随机对100名果农的苹果销售量进行统计,将数据按照[90,110),[110,130),[130,150),[150,170]分成4组,得到如图所示的频率直方图.(1)试估计这100名果农苹果销售量的平均数;(2)根据题中的频率直方图,估计销售量样本数据的80百分位数(结果精确到0.1);(3)假设这100名果农在未打开销路之前都积压了2万千克的苹果,通过团购的方式果农每千克苹果的纯利润为1.3元,而积压仍未售出的苹果每千克将损失2元的成本费,试估计这100名果农积压的苹果通过此次团购活动获得的总利润.设这100名果农苹果销售量的平均数为x百千克,则x=(100×0.002 5+120×0.01+140×0.0225+160×0.015)×20=140(百千克),故这100名果农苹果销售量的平均数为1.4万千克.(2)因为(0.002 5+0.010 0)×20=0.25<0.8,0.25+0.225×20=0.7<0.8,×20≈156.7.所以80百分位数在第4组内,且80百分位数为150+0.8-0.71-0.7(3)销售量在[90,110)的每位果农的利润为100×100×1.3-(2×104-100×100)×2=-0.7(万元);销售量在[110,130)的每位果农的利润为120×100×1.3-(2×104-120×100)×2=-0.04(万元);销售量在[130,150)的每位果农的利润为100×140×1.3-(2×104-140×100)×2=0.62(万元);销售量在[150,170]的每位果农的利润为100×160×1.3-(2×104-160×100)×2=1.28(万元).因为[90,110),[110,130),[130,150),[150,170)这4组的人数分别为5,20,45,30,所以这100名果农积压的苹果通过此次团购活动获得的总利润约为-0.7×5-0.04×20+0.62×45+1.28×30=62(万元).。

高考数学频率分布直方图大题训练题(含答案)

高考数学频率分布直方图大题训练题(含答案)

频率分布直方图大题训练题一、解答题(共18题;共205分)1.(2020·龙岩模拟)某电讯企业为了了解某地区居民对电讯服务质量评价情况,随机调查100 名用户,根据这100名用户对该电讯企业的评分,绘制频率分布直方图,如图所示,其中样本数据分组为,,…… .(1)估计该地区用户对该电讯企业评分不低于70分的概率,并估计对该电讯企业评分的中位数;(2)现从评分在的调查用户中随机抽取2人,求2人评分都在的概率.2.(2020·芜湖模拟)某学校为了了解该校高三年级学生寒假在家自主学习的情况,随机对该校300名高三学生寒假的每天学习时间(单位:h)进行统计,按照,,,,的分组作出频率分布直方图如图所示.参考公式:,其中.参考附表:0.050 0.010 0.001(Ⅰ)根据频率分布直方图计算该校高三年级学生的平均每天学习时间(同一组中的数据用该组区间中点值代表);(Ⅱ)该校规定学习时间超过4h为合格,否则不合格.已知这300名学生中男生有140人,其中合格的有70人,请补全下表,根据表中数据,能否有99.9%的把握认为该校高三年级学生的性别与学习时长合格有关?3.(2020·泰安模拟)某水果批发商经销某种水果(以下简称A水果),购入价为300元/袋,并以360元/袋的价格售出,若前8小时内所购进的A水果没有售完,则批发商将没售完的A水果以220元/袋的价格低价处理完毕(根据经验,2小时内完全能够把A水果低价处理完,且当天不再购进).该水果批发商根据往年的销量,统计了100天A水果在每天的前8小时内的销售量,制成如下频数分布条形图.现以记录的100天的A水果在每天的前8小时内的销售量的频率作为A水果在一天的前8小时内的销售量的概率,记X表示A水果一天前8小时内的销售量,n表示水果批发商一天批发A水果的袋数.(1)求X的分布列;(2)以日利润的期望值为决策依据,在与中选其一,应选用哪个?4.(2020·南昌模拟)某产品自生产并投入市场以来,生产企业为确保产品质量,决定邀请第三方检测机构对产品进行质量检测,并依据质量指标Z来衡量产品的质量.当时,产品为优等品;当时,产品为一等品;当时,产品为二等品.第三方检测机构在该产品中随机抽取500件,绘制了这500件产品的质量指标Z的条形图.用随机抽取的500件产品作为样本,估计该企业生产该产品的质量情况,并用频率估计概率.(1)从该企业生产的所有产品中随机抽取4件,求至少有1件优等品的概率;(2)现某人决定购买80件该产品.已知每件成本1000元,购买前,邀请第三方检测机构对要购买的80件产品进行抽样检测,买家、企业及第三方检测机构就检测方案达成以下协议:从80件产品中随机抽出4件产品进行检测,若检测出3件或4件为优等品,则按每件1600元购买,否则按每件1500元购买,每件产品的检测费用250元由企业承担.记企业的收益为X元,求X的分布列与数学期望.5.(2020·南昌模拟)在“挑战不可能”的电视节目上,甲、乙、丙三个人组成的解密团队参加一项解密挑战活动,规则是由密码专家给出题目,然后由3个人依次出场解密,每人限定时间是1分钟内,否则派下一个人.3个人中只要有一人解密正确,则认为该团队挑战成功,否则挑战失败.根据甲以往解密测试情况,抽取了甲100次的测试记录,绘制了如下的频率分布直方图.(1)若甲解密成功所需时间的中位数为47,求a、b的值,并求出甲在1分钟内解密成功的频率;(2)在“挑战不可能”节目上由于来自各方及自身的心理压力,甲,乙,丙解密成功的概率分别为,其中表示第个出场选手解密成功的概率,并且定义为甲抽样中解密成功的频率代替,各人是否解密成功相互独立.①求该团队挑战成功的概率;②该团队以从小到大的顺序按排甲、乙、丙三个人上场解密,求团队挑战成功所需派出的人员数目X 的分布列与数学期望.6.(2020·江西模拟)冠状病毒是一个大型病毒家族,可引起感冒以及中东呼吸综合征(MERS)和严重急性呼吸综合征(SARS)等较严重疾病.出现的新型冠状病毒(nCoV)是从未在人体中发现的冠状病毒新毒株.人感染了新型冠状病毒后常见体征有呼吸道症状、发热、咳嗽、气促和呼吸困难等.在较严重病例中,感染可导致肺炎、严重急性呼吸综合征、肾衰竭,甚至死亡.某医院为筛查冠状病毒,需要检测血液中的指标A.现从采集的血液样品中抽取500份检测指标A的值,由测量结果得下侧频率分布直方图:(1)求这500份血液样品指标A值的平均数和样本方差(同一组数据用该区间的中点值作代表,记作);(2)由频率分布直方图可以认为,这项指标的值X服从正态分布,其中近似为样本平均数,近似为样本方差.在统计学中,把发生概率小于3‰的事件称为小概率事件(正常条件下小概率事件的发生是不正常的).该医院非常关注本院医生健康状况,随机抽取20名医生,独立的检测血液中指标A的值,结果发现4名医生血液中指标A的值大于正常值20.03,试根据题中条件判断该院医生的健康率是否正常,并说明理由.附:参考数据与公式:,,;若,则① ;② ;③.,,,.7.(2020·江西模拟)年前某市质监部门根据质量管理考核指标对本地的500家食品生产企业进行考核,然后通过随机抽样抽取其中的50家,统计其考核成绩(单位:分),并制成如下频率分布直方图.(1)求这50家食品生产企业考核成绩的平均数(同一组中的数据用该组区间的中点值为代表)及中位数a(精确到0.01)(2)该市质监部门打算举办食品生产企业质量交流会,并从这50家食品生产企业中随机抽取4家考核成绩不低于88分的企业发言,记抽到的企业中考核成绩在的企业数为X,求X的分布列与数学期望(3)若该市食品生产企业的考核成绩X服从正态分布其中近似为50家食品生产企业考核成绩的平均数,近似为样本方差,经计算得,利用该正态分布,估计该市500家食品生产企业质量管理考核成绩高于90.06分的有多少家?(结果保留整数).附参考数据与公式:则,.8.(2020·漯河模拟)十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康.经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入、实现2020年脱贫的工作计划,该地扶贫办统计了2019年50位农民的年收入并制成如下频率分布直方图:附参考数据:,若随机变量X服从正态分布,则,,.(1)根据频率分布直方图,估计50位农民的平均年收入(单位:千元);(同一组数据用该组数据区间的中点值表示);(2)由频率分布直方图,可以认为该贫困地区农民年收入X服从正态分布,其中近似为年平均收入,近似为样本方差,经计算得=6.92,利用该正态分布,求:①在扶贫攻坚工作中,若使该地区约有占总农民人数的的农民的年收入高于扶贫办制定的最低年收入标准,则最低年收入标准大约为多少千元?②为了调研“精准扶贫,不落一人”的政策要求落实情况,扶贫办随机走访了1000位农民.若每位农民的年收入互相独立,问:这1000位农民中的年收入不少于12.14千元的人数最有可能是多少?9.(2017·黑龙江模拟)某学生社团在对本校学生学习方法开展问卷调查的过程中发现,在回收上来的1000份有效问卷中,同学们背英语单词的时间安排共有两种:白天背和晚上临睡前背.为研究背单词时间安排对记忆效果的影响,该社团以5%的比例对这1000名学生按时间安排粪型进行分层抽样,并完成一项实验,实验方法是,使两组学生记忆40个无意义音节(如xIQ、GEH),均要求在刚能全部记清时就停止识记,并在8小时后进行记忆测验.不同的是,甲组同学识记结束后一直不睡觉,8小时后测验;乙组同学识记停止后立刻睡觉,8小时后叫醒测验.两组同学识记停止8小时后的准确回忆(保持)情况如图(区间含左端点而不舍右端点)(1)估计1000名被调查的学生中识记停止后8小时40个音节的保持率大于等于60%的人数;(2)从乙组准确回忆结束在|12,24)范围内的学生中随机选3人,记能准确回忆20个以上(含20)的人数为随机变量x.求X分布列及数学期望;(3)从本次实验的结果来看,上述两种时间安排方法中哪种方法背英语单词记忆效果更好?计算并说明理由.10.(2018·南宁模拟)在某单位的食堂中,食堂每天以10元/斤的价格购进米粉,然后以4.4元/碗的价格出售,每碗内含米粉0.2斤,如果当天卖不完,剩下的米粉以2元/斤的价格卖给养猪场.根据以往统计资料,得到食堂某天米粉需求量的频率分布直方图如图所示,若食堂购进了80斤米粉,以(斤)(其中)表示米粉的需求量,(元)表示利润.(1)估计该天食堂利润不少于760元的概率;(2)在直方图的需求量分组中,以区间中间值作为该区间的需求量,以需求量落入该区间的频率作为需求量在该区间的概率,求的分布列和数学期望.11.(2020·辽宁模拟)某城市100户居民的月平均用电量(单位:度),以,,,,,,分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为,,,的四组用户中,用分层抽样的方法抽取户居民,则月平均用电量在的用户中应抽取多少户?12.(2020·大连模拟)某校从参加高三模拟考试的学生中随机抽取名学生,将其数学成绩(均为整数)分成六段后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:(1)求分数在内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分;(3)用分层抽样的方法在分数段为的学生中抽取一个容量为的样本,将该样本看成一个总体,从中任取个,求至多有人在分数段内的概率.13.(2020·莆田模拟)为了解某地网民浏览购物网站的情况,从该地随机抽取100名网民进行调查,其中男性、女性人数分别为45和55.下面是根据调查结果绘制的网民日均浏览购物网站时间的频率分布直方图,将日均浏览购物网站时间不低于40分钟的网民称为“网购达人”,已知“网购达人”中女性有10人.参考公式:,其中.参考数据:0.102.7063.841 5.024 6.635 7.879 10.828(1)根据已知条件完成下面的列联表,并判断是否有90%的把握认为是否为“网购达人”与性别有关;(2)将上述调査所得到的频率视为概率,现在从该地的网民中随机抽取3名,记被抽取的3名网民中的“网购达人”的人数为X,求X的分布列、数学期望和方差.14.(2020·长春模拟)笔、墨、纸、砚是中国独有的文书工具,即“文房四宝”.笔、墨、纸、砚之名,起源于南北朝时期,其中的“纸”指的是宣纸,宣纸“始于唐代,产于泾县”,而唐代泾县隶属于宣州府管辖,故因地而得名“宣纸”,宣纸按质量等级,可分为正牌和副牌(优等品和合格品),某公司年产宣纸10000刀(每刀100张),公司按照某种质量标准值给宣纸确定质量等级,如下表所示:公式在所生产的宣纸中随机抽取了一刀(100张)进行检验,得到频率分布直方图如图所示,已知每张正牌纸的利润是10元,副牌纸的利润是5元,废品亏损10元.(1)估计该公式生产宣纸的年利润(单位:万元);(2)该公司预备购买一种售价为100万元的机器改进生产工艺,这种机器的使用寿命是一年,只能提高宣纸的质量,不影响产量,这种机器生产的宣纸的质量标准值的频率,如下表所示:其中为改进工艺前质量标准值的平均值,改进工艺后,每张正牌和副牌宣纸的利润都下降2元,请判断该公司是否应该购买这种机器,并说明理由.15.(2020·蚌埠模拟)随着网购人数的日益增多,网上的支付方式也呈现一种多样化的状态,越来越多的便捷移动支付方式受到了人们的青睐,更被网友们评为“新四大发明”之一.随着人们消费观念的进步,许多人喜欢用信用卡购物,考虑到这一点,一种“网上的信用卡”横空出世——蚂蚁花呗.这是一款支付宝和蚂蚁金融合作开发的新支付方式,简单便捷,同时也满足了部分网上消费群体在支付宝余额不足时的“赊购”消费需求.为了调查使用蚂蚁花呗“赊购”消费与消费者年龄段的关系,某网站对其注册用户开展抽样调查,在每个年龄段的注册用户中各随机抽取100人,得到各年龄段使用蚂蚁花呗“赊购”的人数百分比如图所示.参考答案:,.(1)由大数据可知,在18到44岁之间使用花呗“赊购”的人数百分比y与年龄x成线性相关关系,利用统计图表中的数据,以各年龄段的区间中点代表该年龄段的年龄,求所调查群体各年龄段“赊购”人数百分比y与年龄x的线性回归方程(回归直线方程的斜率和截距保留两位有效数字);(2)该网站年龄为20岁的注册用户共有2000人,试估算该网站20岁的注册用户中使用花呗“赊购”的人数;(3)已知该网店中年龄段在18-26岁和27-35岁的注册用户人数相同,现从18到35岁之间使用花呗“赊购”的人群中按分层抽样的方法随机抽取8人,再从这8人中简单随机抽取2人调查他们每个月使用花呗消费的额度,求抽取的两人年龄都在18到26岁的概率.16.(2020·辽宁模拟)港珠澳大桥是一座具有划时代意义的大桥.它连通了珠海香港澳门三地,大大缩短了三地的时空距离,盘活了珠江三角洲的经济,被誉为新的世界七大奇迹.截至2019年10月23日8点,珠海公路口岸共验放出入境旅客超过1400万人次,日均客流量已经达到4万人次,验放出入境车辆超过70万辆次,2019年春节期间,客流再次大幅增长,日均客流达8万人次,单日客流量更是创下11.3万人次的最高纪录.2019年从五月一日开始的连续100天客流量频率分布直方图如下(1)①同一组数据用该区间的中点值代替,根据频率分布直方图.估计客流量的平均数.②求客流量的中位数.(2)设这100天中客流量超过5万人次的有天,从这天中任取两天,设为这两天中客流量超过7万人的天数.求的分布列和期望.17.(2020·江门模拟)2019年7月1日到3日,世界新能源汽车大会在海南博鳌召开,大会着眼于全球汽车产业的转型升级和生态环境的持续改善.某汽车公司顺应时代潮流,最新研发了一款新能源汽车,并在出厂前对100辆汽车进行了单次最大续航里程(理论上是指新能源汽车所装载的燃料或电池所能够提供给车行驶的最远里程)的测试.现对测试数据进行分析,得到如图的频率分布直方图.(1)估计这100辆汽车的单次最大续航里程的平均值(同一组中的数据用该组区间的中点值代表);(2)根据大量的汽车测试数据,可以认为这款汽车的单次最大续航量程X近似地服从正态分布,经计算第(1)问中样本标准差s的近似值为50.用样本平均数作为的近似值,用样本标准差s作为的估计值,现任取一辆汽车,求它的单次最大续航里程恰在250千米到400千米之间的概率;(3)某汽车销售公司为推广此款新能源汽车,现面向意向客户推出“玩游戏,送大奖”活动,客户可根据抛掷硬币的结果,操控微型遥控车在方格图上行进,若遥控车最终停在“胜利大本营”,则可获得购车优惠券.已知硬币出现正,反面的概率都是,方格图上标有第0格、第1格、第2格……第50格.遥控车开始在第0格,客户每掷一次硬币,遥控车向前移动一次,若掷出正面,遥控车向前移动一格(从k到),若掷出反面,遥控车向前移动两格(从k到),直到遥控车移到第49格(胜利大本营)或第50格(失败大本营)时,游戏结束.设遥控车移到第n格的概率为,试证明是等比数列,并解释此方案能否成功吸引顾客购买该款新能源汽车.参考数据:若随机变量服从正态分布,则,,.18.(2020·肇庆模拟)某公司新上一条生产线,为保证新的生产线正常工作,需对该生产线进行检测,现从该生产线上随机抽取100件产品,测量产品数据,用统计方法得到样本的平均数,标准差,绘制如图所示的频率分布直方图,以频率值作为概率估值.(1)从该生产线加工的产品中任意抽取一件,记其数据为,依据以下不等式评判(表示对应事件的概率)①②③评判规则为:若至少满足以上两个不等式,则生产状况为优,无需检修;否则需检修生产线,试判断该生产线是否需要检修;(2)将数据不在内的产品视为次品,从该生产线加工的产品中任意抽取2件,次品数记为,求的分布列与数学期望.答案解析部分一、解答题1.【答案】(1)解:由题意,该地区用户对该电讯企业评分的频率分布如下表:因此可估计评分不低于70分的概率为;对该电讯企业评分的中位数设为x,可得,则,解得,所以可估计对该电讯企业评分的中位数为;(2)解:受调查用户评分在的有人,若编号依次为1,2,3,4,从中选2人的事件有、、、、、,共有个基本事件;受调查用户评分在的有人,若编号依次为1,2,3,..9,10,从中选2人,可得共有个基本事件;因此2人评分都在的概率.【解析】【分析】(1)由题意列出频率分布表,求和即可估计该地区用户对该电讯企业评分不低于70分的概率;利用中位数两侧的概率和相等列方程即可估计对该电讯企业评分的中位数;(2)由题意计算出受调查用户评分在、的人数,求出总的基本事件个数及满足要求的基本事件的个数,由古典概型概率公式即可得解.2.【答案】解:(Ⅰ)高三年级学生平均每天的学习时间为:(h);(Ⅱ)300名学生中合格的人数为(人),故补全表格如下:所以所以有99.9%的把握认为该校高三年级学生的性别与学习时长合格有关.【解析】【分析】(Ⅰ)根据频率分布直方图直接计算平均值即可;(Ⅱ)先求出300名学生中合格的人数,再补全表格,然后根据表格数据和公式计算,最后将与进行比较,进而得出结论.3.【答案】(1)解:由题意知,根据条形图,可得A水果在每天的前8小时内的销售量分别为14,15,16,17的频率分别是0.2,0.3,0.4和0.1 ,所以X的分布列为140.2(2)解:当时,设Y为水果批发商的日利润,则Y的可能取值为760,900,可得,所以期望,当时,设Z为水果批发商的日利润,则Z的可能取值为680,820,960,可得,所以期望.因为,综上可知,当时的日利润期望值大于时的日利润期望值,故答案为:.【解析】【分析】(1)由题意知,根据条形图,得到销售量分别为14,15,16,17的频率,进而得到随机变量X的分布列;(2)分别求得当和时,利润的数学期望,比较即可得到结论.4.【答案】(1)解:由题意知,500件产品中共有优等品件,则从样本中随机取一件为优等品的概率为,所以从该企业生产的所有产品中随机抽取4件,没有一件是优等品的概率为,则随机抽取4件,至少有1件优等品的概率为.(2)解:检测出3件或4件为优等品时,检测出的优等品低于3件时,,由题意知,,故X的分布列为所以数学期望.【解析】【分析】(1)先求出从样本中随机取一件为优等品的概率,再求从该企业生产的所有产品中随机抽取4件,没有一件是优等品的概率,从而可求出至少有一件是优等品的概率.(2)由题意求出检测出3件或4件为优等品时及检测出的优等品低于3件时的X的值,结合第一问求出,,从而可得X的分布列,即可计算其数学期望5.【答案】(1)解:甲解密成功所需时间的中位数为47,,解得,,解得,由频率分布直方图知,甲在分钟内解密成功的频率是;(2)解:①由题意及(1)可知第一个出场选手解密成功的概率为,第二个出场选手解密成功的概率为,第三个出场选手解密成功的概率为,所以该团队挑战成功的概率为;②由①可知按从小到大的顺序的概率分别、、,根据题意知的取值为、、,则,,,所以所需派出的人员数目的分布列为:因此,.【解析】【分析】(1)根据中位数左右两边的矩形面积之和均为0.5可求得a、b的值,并根据频率分布直方图求得甲在1分钟内解密成功的频率;(2)①由(1)得出,求出、的值,由此得出该团队挑战成功的概率为;②由题意可得出随机变量X的可能取值有1、2、3,利用独立事件的概率乘法公式计算出随机变量X在不同取值下的概率,据此可得出随机变量X的分布列,结合期望公式可计算出X的数学期望值.6.【答案】(1)解:根据题意,由频率分布直方图可知,500份血液样品指标A值的平均数为:,500份血液样品指标A值的样本方差为:.(2)解:由题意知:指标的值服从正态分布,,,则,所以,.随机抽取20名医生独立检测血液中指标的值,就相当于进行了20次独立重复试验,记“20名医生中出现4名医生血液中指标的值大于正常值20,03”为事件,则,所以从血液中指标的值的角度来看:该院医生的健康率是正常的.【解析】【分析】(1)由频率分布直方图,直接利用平均数和方差公式,求出500份血液样品指标值的平均数和样本方差;(2)由(1)得出指标的值服从正态分布,从而可求出,在根据独立重复试验中的概率求法,求出20名医生中出现4名医生血液中指标的值大于正常值20.03的概率,即可判断该院医生的健康率是否正常7.【答案】(1)解:由题意,这50家食品生产企业考核成绩的平均数为:(分),由频率分布图可知内,所以,解得分.(2)解:根据题意,这50家食品生产企业中考核成绩不低于88分的企业有:(家),其中考核成绩在内的企业有(家),所以X可能取值有0,1,2,3,4则,,,,,所以X的分布列为所以.(3)解:由题意得,所以,所以,所以(家),所以500家食品生产企业质量管理考核成绩高于90.06分的有79家.【解析】【分析】(1)利用频率分布直方图的性质能求出这50家食品生产企业考核成绩的平均数和中位数;(2)由已知得到考核成绩在内的企业有5家,得出随机变量的可能取值,分别求出相应的概率和分布列,求得数学期望;(3)根据题意得,由此估计该市500家食品生产企业质量管理考核成绩高于90.06分的企业个数.8.【答案】(1)解:千元.故估计50位农民的年平均收入为17.40千元.(2)解:由题意知,① ,所以时,满足题意,即最低年收入大约为14.77千元.②由,每个农民的年收入不少于12.14千元的事件的概率为0.9773,记1000个农民的年收入不少于12.14千元的人数为则,其中于是恰好有k个农民的年收入不少于12.14千元的事件概率为,。

高三 复习 频率分布直方图

高三 复习 频率分布直方图

总体密度曲线
总体密度曲线反映了总体在各个范围内取值的 百分比,精确地反映了总体的分布规律。 用样本分布直方图去估计相应的总体分布时 ,一般样本容量越大,频率分布折线图就会无限 接近总体密度曲线,就越精确地反映了总体的分 布规律,即越精确地反映了总体在各个范围内取 值百分比。
茎叶图
某赛季甲、乙两名篮球运动员每场比赛得分的原 始记录如下:
引入
我国是世界上严重缺水的国家之一, 城市缺水问题较为突出。
2000年全国主要城市中缺水情况排在前10位的城市
政府为了节约生活用水,计划在本市试行居民生 活用水定额管理,即确定一个居民月用水量标准a , 用水量不超过a的部分按平价收费,超过a的部 分按议价收费。
①如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?
组距:指每个小组的两个端点的距离,
极差 4.1 组数= = 8.2 = 组距 0.5 3.将数据分组(左闭右开) [0,0.5 ),[0.5,1 ),…,[4,4.5]
4.列频率分布表
频率分布表一般分“分 组”,“频数累计”( 可省),“频数”,“ 频率”, “ 频率/组距 ””五列,最后一行是 频数 合计
助学微博
一个对比
频率分布表:优点:能看出分布规律.缺点:不直观. 频率分布直方图:优点:很直观且能看出分布规律.缺点: 数据的轻微变化都要重新作图. 茎叶图:优点:很直观,能看出分布规律,还可以添加新 数据.缺点:数据少时方便,数据较多时不方便.
两个特性
(1)在频率分布表中,频数的和等于样本容量,每一小组的频 率等于这一组的频数除以样本容量,各小组频率的和等于 1; (2)在频率分布直方图中,小矩形的高等于每一组的频率/组 距,每个小矩形的面积等于该组的频率,所有小矩形的面积 之和为 1.

频率分布直方图如下

频率分布直方图如下

(1)解:如图:茎为成绩的整环数,叶为小数点后的数字


85 2 74
7
1
8
57
4
9
112 78
8751
10
11
(2)乙成绩大致对称,甲成绩的中位数为9.05, 乙成绩的中位数为9.15,所以乙成绩较甲好, 乙成绩较集中于峰值,甲成绩分散
所以乙发挥的稳定性好,甲波动大

练习2:课本71页练习第三题
作业:课本71页练习1,上面的练习1和2。
优化设计
小结:1.什么是频率折线图
2.什么是总体密度曲线及其意义 3.1)认识茎叶图,如何做茎叶图 2)分析茎叶图,3)茎叶图的优缺点
频率分布直方图如下:
频率
连接频率分布直方图
组距
中各小长方形上端的
中点,得到频率分布折
线图
0.50
0.40
0.30
0.20
0.10
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
利用样本频率分布对总体分布进行相应估计
(1)上例的样本容量为100,如果增至1000, 其频率分布直方图的情况会有什么变化?假如增 至10000呢?
26
思考: 数据大于俩位数的整数时又如何选茎,叶?
数据为小数时又如何选茎,叶?
结论:1>当数据为整数时:通常个位数字在叶上, 其他位数在茎上(一位数时,茎为0)
2>当数据为小数时:通常小数部分在叶上, 整数部分在茎上
甲的茎叶图画法
也可以画一组数据的茎叶图,竖线左边为茎,
右边为叶。


08
1 364
甲的中位数为26,乙的中位数为36,所以乙较甲成绩要好, 另,乙的叶较甲的更集中于峰值附近,所以乙较甲发挥 更稳定

高考数学频率分布直方图大题训练题(含答案)

高考数学频率分布直方图大题训练题(含答案)

频率分布直方图大题训练题一、解答题(共18题;共205分)1.(2020·龙岩模拟)某电讯企业为了了解某地区居民对电讯服务质量评价情况,随机调查100 名用户,根据这100名用户对该电讯企业的评分,绘制频率分布直方图,如图所示,其中样本数据分组为,,…… .(1)估计该地区用户对该电讯企业评分不低于70分的概率,并估计对该电讯企业评分的中位数;(2)现从评分在的调查用户中随机抽取2人,求2人评分都在的概率.2.(2020·芜湖模拟)某学校为了了解该校高三年级学生寒假在家自主学习的情况,随机对该校300名高三学生寒假的每天学习时间(单位:h)进行统计,按照,,,,的分组作出频率分布直方图如图所示.参考公式:,其中.参考附表:0.050 0.010 0.001(Ⅰ)根据频率分布直方图计算该校高三年级学生的平均每天学习时间(同一组中的数据用该组区间中点值代表);(Ⅱ)该校规定学习时间超过4h为合格,否则不合格.已知这300名学生中男生有140人,其中合格的有70人,请补全下表,根据表中数据,能否有99.9%的把握认为该校高三年级学生的性别与学习时长合格有关?3.(2020·泰安模拟)某水果批发商经销某种水果(以下简称A水果),购入价为300元/袋,并以360元/袋的价格售出,若前8小时内所购进的A水果没有售完,则批发商将没售完的A水果以220元/袋的价格低价处理完毕(根据经验,2小时内完全能够把A水果低价处理完,且当天不再购进).该水果批发商根据往年的销量,统计了100天A水果在每天的前8小时内的销售量,制成如下频数分布条形图.现以记录的100天的A水果在每天的前8小时内的销售量的频率作为A水果在一天的前8小时内的销售量的概率,记X表示A水果一天前8小时内的销售量,n表示水果批发商一天批发A水果的袋数.(1)求X的分布列;(2)以日利润的期望值为决策依据,在与中选其一,应选用哪个?4.(2020·南昌模拟)某产品自生产并投入市场以来,生产企业为确保产品质量,决定邀请第三方检测机构对产品进行质量检测,并依据质量指标Z来衡量产品的质量.当时,产品为优等品;当时,产品为一等品;当时,产品为二等品.第三方检测机构在该产品中随机抽取500件,绘制了这500件产品的质量指标Z的条形图.用随机抽取的500件产品作为样本,估计该企业生产该产品的质量情况,并用频率估计概率.(1)从该企业生产的所有产品中随机抽取4件,求至少有1件优等品的概率;(2)现某人决定购买80件该产品.已知每件成本1000元,购买前,邀请第三方检测机构对要购买的80件产品进行抽样检测,买家、企业及第三方检测机构就检测方案达成以下协议:从80件产品中随机抽出4件产品进行检测,若检测出3件或4件为优等品,则按每件1600元购买,否则按每件1500元购买,每件产品的检测费用250元由企业承担.记企业的收益为X元,求X的分布列与数学期望.5.(2020·南昌模拟)在“挑战不可能”的电视节目上,甲、乙、丙三个人组成的解密团队参加一项解密挑战活动,规则是由密码专家给出题目,然后由3个人依次出场解密,每人限定时间是1分钟内,否则派下一个人.3个人中只要有一人解密正确,则认为该团队挑战成功,否则挑战失败.根据甲以往解密测试情况,抽取了甲100次的测试记录,绘制了如下的频率分布直方图.(1)若甲解密成功所需时间的中位数为47,求a、b的值,并求出甲在1分钟内解密成功的频率;(2)在“挑战不可能”节目上由于来自各方及自身的心理压力,甲,乙,丙解密成功的概率分别为,其中表示第个出场选手解密成功的概率,并且定义为甲抽样中解密成功的频率代替,各人是否解密成功相互独立.①求该团队挑战成功的概率;②该团队以从小到大的顺序按排甲、乙、丙三个人上场解密,求团队挑战成功所需派出的人员数目X 的分布列与数学期望.6.(2020·江西模拟)冠状病毒是一个大型病毒家族,可引起感冒以及中东呼吸综合征(MERS)和严重急性呼吸综合征(SARS)等较严重疾病.出现的新型冠状病毒(nCoV)是从未在人体中发现的冠状病毒新毒株.人感染了新型冠状病毒后常见体征有呼吸道症状、发热、咳嗽、气促和呼吸困难等.在较严重病例中,感染可导致肺炎、严重急性呼吸综合征、肾衰竭,甚至死亡.某医院为筛查冠状病毒,需要检测血液中的指标A.现从采集的血液样品中抽取500份检测指标A的值,由测量结果得下侧频率分布直方图:(1)求这500份血液样品指标A值的平均数和样本方差(同一组数据用该区间的中点值作代表,记作);(2)由频率分布直方图可以认为,这项指标的值X服从正态分布,其中近似为样本平均数,近似为样本方差.在统计学中,把发生概率小于3‰的事件称为小概率事件(正常条件下小概率事件的发生是不正常的).该医院非常关注本院医生健康状况,随机抽取20名医生,独立的检测血液中指标A的值,结果发现4名医生血液中指标A的值大于正常值20.03,试根据题中条件判断该院医生的健康率是否正常,并说明理由.附:参考数据与公式:,,;若,则① ;② ;③.,,,.7.(2020·江西模拟)年前某市质监部门根据质量管理考核指标对本地的500家食品生产企业进行考核,然后通过随机抽样抽取其中的50家,统计其考核成绩(单位:分),并制成如下频率分布直方图.(1)求这50家食品生产企业考核成绩的平均数(同一组中的数据用该组区间的中点值为代表)及中位数a(精确到0.01)(2)该市质监部门打算举办食品生产企业质量交流会,并从这50家食品生产企业中随机抽取4家考核成绩不低于88分的企业发言,记抽到的企业中考核成绩在的企业数为X,求X的分布列与数学期望(3)若该市食品生产企业的考核成绩X服从正态分布其中近似为50家食品生产企业考核成绩的平均数,近似为样本方差,经计算得,利用该正态分布,估计该市500家食品生产企业质量管理考核成绩高于90.06分的有多少家?(结果保留整数).附参考数据与公式:则,.8.(2020·漯河模拟)十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康.经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入、实现2020年脱贫的工作计划,该地扶贫办统计了2019年50位农民的年收入并制成如下频率分布直方图:附参考数据:,若随机变量X服从正态分布,则,,.(1)根据频率分布直方图,估计50位农民的平均年收入(单位:千元);(同一组数据用该组数据区间的中点值表示);(2)由频率分布直方图,可以认为该贫困地区农民年收入X服从正态分布,其中近似为年平均收入,近似为样本方差,经计算得=6.92,利用该正态分布,求:①在扶贫攻坚工作中,若使该地区约有占总农民人数的的农民的年收入高于扶贫办制定的最低年收入标准,则最低年收入标准大约为多少千元?②为了调研“精准扶贫,不落一人”的政策要求落实情况,扶贫办随机走访了1000位农民.若每位农民的年收入互相独立,问:这1000位农民中的年收入不少于12.14千元的人数最有可能是多少?9.(2017·黑龙江模拟)某学生社团在对本校学生学习方法开展问卷调查的过程中发现,在回收上来的1000份有效问卷中,同学们背英语单词的时间安排共有两种:白天背和晚上临睡前背.为研究背单词时间安排对记忆效果的影响,该社团以5%的比例对这1000名学生按时间安排粪型进行分层抽样,并完成一项实验,实验方法是,使两组学生记忆40个无意义音节(如xIQ、GEH),均要求在刚能全部记清时就停止识记,并在8小时后进行记忆测验.不同的是,甲组同学识记结束后一直不睡觉,8小时后测验;乙组同学识记停止后立刻睡觉,8小时后叫醒测验.两组同学识记停止8小时后的准确回忆(保持)情况如图(区间含左端点而不舍右端点)(1)估计1000名被调查的学生中识记停止后8小时40个音节的保持率大于等于60%的人数;(2)从乙组准确回忆结束在|12,24)范围内的学生中随机选3人,记能准确回忆20个以上(含20)的人数为随机变量x.求X分布列及数学期望;(3)从本次实验的结果来看,上述两种时间安排方法中哪种方法背英语单词记忆效果更好?计算并说明理由.10.(2018·南宁模拟)在某单位的食堂中,食堂每天以10元/斤的价格购进米粉,然后以4.4元/碗的价格出售,每碗内含米粉0.2斤,如果当天卖不完,剩下的米粉以2元/斤的价格卖给养猪场.根据以往统计资料,得到食堂某天米粉需求量的频率分布直方图如图所示,若食堂购进了80斤米粉,以(斤)(其中)表示米粉的需求量,(元)表示利润.(1)估计该天食堂利润不少于760元的概率;(2)在直方图的需求量分组中,以区间中间值作为该区间的需求量,以需求量落入该区间的频率作为需求量在该区间的概率,求的分布列和数学期望.11.(2020·辽宁模拟)某城市100户居民的月平均用电量(单位:度),以,,,,,,分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为,,,的四组用户中,用分层抽样的方法抽取户居民,则月平均用电量在的用户中应抽取多少户?12.(2020·大连模拟)某校从参加高三模拟考试的学生中随机抽取名学生,将其数学成绩(均为整数)分成六段后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:(1)求分数在内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分;(3)用分层抽样的方法在分数段为的学生中抽取一个容量为的样本,将该样本看成一个总体,从中任取个,求至多有人在分数段内的概率.13.(2020·莆田模拟)为了解某地网民浏览购物网站的情况,从该地随机抽取100名网民进行调查,其中男性、女性人数分别为45和55.下面是根据调查结果绘制的网民日均浏览购物网站时间的频率分布直方图,将日均浏览购物网站时间不低于40分钟的网民称为“网购达人”,已知“网购达人”中女性有10人.参考公式:,其中.参考数据:0.102.7063.841 5.024 6.635 7.879 10.828(1)根据已知条件完成下面的列联表,并判断是否有90%的把握认为是否为“网购达人”与性别有关;(2)将上述调査所得到的频率视为概率,现在从该地的网民中随机抽取3名,记被抽取的3名网民中的“网购达人”的人数为X,求X的分布列、数学期望和方差.14.(2020·长春模拟)笔、墨、纸、砚是中国独有的文书工具,即“文房四宝”.笔、墨、纸、砚之名,起源于南北朝时期,其中的“纸”指的是宣纸,宣纸“始于唐代,产于泾县”,而唐代泾县隶属于宣州府管辖,故因地而得名“宣纸”,宣纸按质量等级,可分为正牌和副牌(优等品和合格品),某公司年产宣纸10000刀(每刀100张),公司按照某种质量标准值给宣纸确定质量等级,如下表所示:公式在所生产的宣纸中随机抽取了一刀(100张)进行检验,得到频率分布直方图如图所示,已知每张正牌纸的利润是10元,副牌纸的利润是5元,废品亏损10元.(1)估计该公式生产宣纸的年利润(单位:万元);(2)该公司预备购买一种售价为100万元的机器改进生产工艺,这种机器的使用寿命是一年,只能提高宣纸的质量,不影响产量,这种机器生产的宣纸的质量标准值的频率,如下表所示:其中为改进工艺前质量标准值的平均值,改进工艺后,每张正牌和副牌宣纸的利润都下降2元,请判断该公司是否应该购买这种机器,并说明理由.15.(2020·蚌埠模拟)随着网购人数的日益增多,网上的支付方式也呈现一种多样化的状态,越来越多的便捷移动支付方式受到了人们的青睐,更被网友们评为“新四大发明”之一.随着人们消费观念的进步,许多人喜欢用信用卡购物,考虑到这一点,一种“网上的信用卡”横空出世——蚂蚁花呗.这是一款支付宝和蚂蚁金融合作开发的新支付方式,简单便捷,同时也满足了部分网上消费群体在支付宝余额不足时的“赊购”消费需求.为了调查使用蚂蚁花呗“赊购”消费与消费者年龄段的关系,某网站对其注册用户开展抽样调查,在每个年龄段的注册用户中各随机抽取100人,得到各年龄段使用蚂蚁花呗“赊购”的人数百分比如图所示.参考答案:,.(1)由大数据可知,在18到44岁之间使用花呗“赊购”的人数百分比y与年龄x成线性相关关系,利用统计图表中的数据,以各年龄段的区间中点代表该年龄段的年龄,求所调查群体各年龄段“赊购”人数百分比y与年龄x的线性回归方程(回归直线方程的斜率和截距保留两位有效数字);(2)该网站年龄为20岁的注册用户共有2000人,试估算该网站20岁的注册用户中使用花呗“赊购”的人数;(3)已知该网店中年龄段在18-26岁和27-35岁的注册用户人数相同,现从18到35岁之间使用花呗“赊购”的人群中按分层抽样的方法随机抽取8人,再从这8人中简单随机抽取2人调查他们每个月使用花呗消费的额度,求抽取的两人年龄都在18到26岁的概率.16.(2020·辽宁模拟)港珠澳大桥是一座具有划时代意义的大桥.它连通了珠海香港澳门三地,大大缩短了三地的时空距离,盘活了珠江三角洲的经济,被誉为新的世界七大奇迹.截至2019年10月23日8点,珠海公路口岸共验放出入境旅客超过1400万人次,日均客流量已经达到4万人次,验放出入境车辆超过70万辆次,2019年春节期间,客流再次大幅增长,日均客流达8万人次,单日客流量更是创下11.3万人次的最高纪录.2019年从五月一日开始的连续100天客流量频率分布直方图如下(1)①同一组数据用该区间的中点值代替,根据频率分布直方图.估计客流量的平均数.②求客流量的中位数.(2)设这100天中客流量超过5万人次的有天,从这天中任取两天,设为这两天中客流量超过7万人的天数.求的分布列和期望.17.(2020·江门模拟)2019年7月1日到3日,世界新能源汽车大会在海南博鳌召开,大会着眼于全球汽车产业的转型升级和生态环境的持续改善.某汽车公司顺应时代潮流,最新研发了一款新能源汽车,并在出厂前对100辆汽车进行了单次最大续航里程(理论上是指新能源汽车所装载的燃料或电池所能够提供给车行驶的最远里程)的测试.现对测试数据进行分析,得到如图的频率分布直方图.(1)估计这100辆汽车的单次最大续航里程的平均值(同一组中的数据用该组区间的中点值代表);(2)根据大量的汽车测试数据,可以认为这款汽车的单次最大续航量程X近似地服从正态分布,经计算第(1)问中样本标准差s的近似值为50.用样本平均数作为的近似值,用样本标准差s作为的估计值,现任取一辆汽车,求它的单次最大续航里程恰在250千米到400千米之间的概率;(3)某汽车销售公司为推广此款新能源汽车,现面向意向客户推出“玩游戏,送大奖”活动,客户可根据抛掷硬币的结果,操控微型遥控车在方格图上行进,若遥控车最终停在“胜利大本营”,则可获得购车优惠券.已知硬币出现正,反面的概率都是,方格图上标有第0格、第1格、第2格……第50格.遥控车开始在第0格,客户每掷一次硬币,遥控车向前移动一次,若掷出正面,遥控车向前移动一格(从k到),若掷出反面,遥控车向前移动两格(从k到),直到遥控车移到第49格(胜利大本营)或第50格(失败大本营)时,游戏结束.设遥控车移到第n格的概率为,试证明是等比数列,并解释此方案能否成功吸引顾客购买该款新能源汽车.参考数据:若随机变量服从正态分布,则,,.18.(2020·肇庆模拟)某公司新上一条生产线,为保证新的生产线正常工作,需对该生产线进行检测,现从该生产线上随机抽取100件产品,测量产品数据,用统计方法得到样本的平均数,标准差,绘制如图所示的频率分布直方图,以频率值作为概率估值.(1)从该生产线加工的产品中任意抽取一件,记其数据为,依据以下不等式评判(表示对应事件的概率)①②③评判规则为:若至少满足以上两个不等式,则生产状况为优,无需检修;否则需检修生产线,试判断该生产线是否需要检修;(2)将数据不在内的产品视为次品,从该生产线加工的产品中任意抽取2件,次品数记为,求的分布列与数学期望.答案解析部分一、解答题1.【答案】(1)解:由题意,该地区用户对该电讯企业评分的频率分布如下表:因此可估计评分不低于70分的概率为;对该电讯企业评分的中位数设为x,可得,则,解得,所以可估计对该电讯企业评分的中位数为;(2)解:受调查用户评分在的有人,若编号依次为1,2,3,4,从中选2人的事件有、、、、、,共有个基本事件;受调查用户评分在的有人,若编号依次为1,2,3,..9,10,从中选2人,可得共有个基本事件;因此2人评分都在的概率.【解析】【分析】(1)由题意列出频率分布表,求和即可估计该地区用户对该电讯企业评分不低于70分的概率;利用中位数两侧的概率和相等列方程即可估计对该电讯企业评分的中位数;(2)由题意计算出受调查用户评分在、的人数,求出总的基本事件个数及满足要求的基本事件的个数,由古典概型概率公式即可得解.2.【答案】解:(Ⅰ)高三年级学生平均每天的学习时间为:(h);(Ⅱ)300名学生中合格的人数为(人),故补全表格如下:所以所以有99.9%的把握认为该校高三年级学生的性别与学习时长合格有关.【解析】【分析】(Ⅰ)根据频率分布直方图直接计算平均值即可;(Ⅱ)先求出300名学生中合格的人数,再补全表格,然后根据表格数据和公式计算,最后将与进行比较,进而得出结论.3.【答案】(1)解:由题意知,根据条形图,可得A水果在每天的前8小时内的销售量分别为14,15,16,17的频率分别是0.2,0.3,0.4和0.1 ,所以X的分布列为140.2(2)解:当时,设Y为水果批发商的日利润,则Y的可能取值为760,900,可得,所以期望,当时,设Z为水果批发商的日利润,则Z的可能取值为680,820,960,可得,所以期望.因为,综上可知,当时的日利润期望值大于时的日利润期望值,故答案为:.【解析】【分析】(1)由题意知,根据条形图,得到销售量分别为14,15,16,17的频率,进而得到随机变量X的分布列;(2)分别求得当和时,利润的数学期望,比较即可得到结论.4.【答案】(1)解:由题意知,500件产品中共有优等品件,则从样本中随机取一件为优等品的概率为,所以从该企业生产的所有产品中随机抽取4件,没有一件是优等品的概率为,则随机抽取4件,至少有1件优等品的概率为.(2)解:检测出3件或4件为优等品时,检测出的优等品低于3件时,,由题意知,,故X的分布列为所以数学期望.【解析】【分析】(1)先求出从样本中随机取一件为优等品的概率,再求从该企业生产的所有产品中随机抽取4件,没有一件是优等品的概率,从而可求出至少有一件是优等品的概率.(2)由题意求出检测出3件或4件为优等品时及检测出的优等品低于3件时的X的值,结合第一问求出,,从而可得X的分布列,即可计算其数学期望5.【答案】(1)解:甲解密成功所需时间的中位数为47,,解得,,解得,由频率分布直方图知,甲在分钟内解密成功的频率是;(2)解:①由题意及(1)可知第一个出场选手解密成功的概率为,第二个出场选手解密成功的概率为,第三个出场选手解密成功的概率为,所以该团队挑战成功的概率为;②由①可知按从小到大的顺序的概率分别、、,根据题意知的取值为、、,则,,,所以所需派出的人员数目的分布列为:因此,.【解析】【分析】(1)根据中位数左右两边的矩形面积之和均为0.5可求得a、b的值,并根据频率分布直方图求得甲在1分钟内解密成功的频率;(2)①由(1)得出,求出、的值,由此得出该团队挑战成功的概率为;②由题意可得出随机变量X的可能取值有1、2、3,利用独立事件的概率乘法公式计算出随机变量X在不同取值下的概率,据此可得出随机变量X的分布列,结合期望公式可计算出X的数学期望值.6.【答案】(1)解:根据题意,由频率分布直方图可知,500份血液样品指标A值的平均数为:,500份血液样品指标A值的样本方差为:.(2)解:由题意知:指标的值服从正态分布,,,则,所以,.随机抽取20名医生独立检测血液中指标的值,就相当于进行了20次独立重复试验,记“20名医生中出现4名医生血液中指标的值大于正常值20,03”为事件,则,所以从血液中指标的值的角度来看:该院医生的健康率是正常的.【解析】【分析】(1)由频率分布直方图,直接利用平均数和方差公式,求出500份血液样品指标值的平均数和样本方差;(2)由(1)得出指标的值服从正态分布,从而可求出,在根据独立重复试验中的概率求法,求出20名医生中出现4名医生血液中指标的值大于正常值20.03的概率,即可判断该院医生的健康率是否正常7.【答案】(1)解:由题意,这50家食品生产企业考核成绩的平均数为:(分),由频率分布图可知内,所以,解得分.(2)解:根据题意,这50家食品生产企业中考核成绩不低于88分的企业有:(家),其中考核成绩在内的企业有(家),所以X可能取值有0,1,2,3,4则,,,,,所以X的分布列为所以.(3)解:由题意得,所以,所以,所以(家),所以500家食品生产企业质量管理考核成绩高于90.06分的有79家.【解析】【分析】(1)利用频率分布直方图的性质能求出这50家食品生产企业考核成绩的平均数和中位数;(2)由已知得到考核成绩在内的企业有5家,得出随机变量的可能取值,分别求出相应的概率和分布列,求得数学期望;(3)根据题意得,由此估计该市500家食品生产企业质量管理考核成绩高于90.06分的企业个数.8.【答案】(1)解:千元.故估计50位农民的年平均收入为17.40千元.(2)解:由题意知,① ,所以时,满足题意,即最低年收入大约为14.77千元.②由,每个农民的年收入不少于12.14千元的事件的概率为0.9773,记1000个农民的年收入不少于12.14千元的人数为则,其中于是恰好有k个农民的年收入不少于12.14千元的事件概率为,。

高考题型之-频率分布直方图

高考题型之-频率分布直方图

高考题型之频率分布直方图知识点:............................................................................................................................................................................... - 1 -典型例题:........................................................................................................................................................................... - 1 -答案....................................................................................................................................................................................... - 4 -知识点:典型例题:1.某工厂对一批产品进行了抽样检测.有图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100), [100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是(A)90 (B)75 (C)60 (D)452.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……第六组,成绩大于等于18秒且小于19秒。

(整理)高考数学总复习专题系列——统计.板块二.频率直方图.学生版

(整理)高考数学总复习专题系列——统计.板块二.频率直方图.学生版

一.随机抽样1.随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法:⑴简单随机抽样:从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. 抽出办法:①抽签法:用纸片或小球分别标号后抽签的方法.②随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表.表中每一位置出现各个数字的可能性相同. 随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法.简单随机抽样是最简单、最基本的抽样方法.⑵系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.抽出办法:从元素个数为N 的总体中抽取容量为n 的样本,如果总体容量能被样本容量整除,设Nk n=,先对总体进行编号,号码从1到N ,再从数字1到k 中随机抽取一个数s 作为起始数,然后顺次抽取第2(1)s k s k s n k +++-,,,个数,这样就得到容量为n 的样本.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样.系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样.⑶分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样.分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛.2.简单随机抽样必须具备下列特点:⑴简单随机抽样要求被抽取的样本的总体个数N 是有限的. ⑵简单随机样本数n 小于等于样本总体的个数N . ⑶简单随机样本是从总体中逐个抽取的. ⑷简单随机抽样是一种不放回的抽样.⑸简单随机抽样的每个个体入样的可能性均为nN.3.系统抽样时,当总体个数N 恰好是样本容量n 的整数倍时,取Nk n=;若Nn不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量n 整除.因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍知识内容板块二.频率直方图然相等,为N n.二.频率直方图列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:取组距,用极差组距决定组数;③决定分点:决定起点,进行分组;④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图,知小长方形的面积=组距×频率组距=频率.频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x =来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.三.茎叶图制作茎叶图的步骤:①将数据分为“茎”、“叶”两部分;②将最大茎与最小茎之间的数字按大小顺序排成一列,并画上竖线作为分隔线; ③将各个数据的“叶”在分界线的一侧对应茎处同行列出.四.统计数据的数字特征用样本平均数估计总体平均数;用样本标准差估计总体标准差. 数据的离散程序可以用极差、方差或标准差来描述.极差又叫全距,是一组数据的最大值和最小值之差,反映一组数据的变动幅度; 样本方差描述了一组数据平均数波动的大小,样本的标准差是方差的算术平方根. 一般地,设样本的元素为12n x x x ,,,样本的平均数为x , 定义样本方差为222212()()()n x x x x x x s n-+-++-=,样本标准差s =简化公式:22222121[()]n s x x x nx n=+++-.五.独立性检验1.两个变量之间的关系;常见的有两类:一类是确定性的函数关系;另一类是变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的.当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.2.散点图:将样本中的n 个数据点()(12)i i x y i n =,,,,描在平面直角坐标系中,就得到了散点图.散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系.3.如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域.反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.此时,散点图中的点在从左上角到右下角的区域.散点图可以判断两个变量之间有没有相关关系.4.统计假设:如果事件A 与B 独立,这时应该有()()()P AB P A P B =,用字母0H 表示此式,即0:()()()H P AB P A P B =,称之为统计假设. 5.2χ(读作“卡方”)统计量:统计学中有一个非常有用的统计量,它的表达式为22112212211212()n n n n n n n n n χ++++-=,用它的大小可以用来决定是否拒绝原来的统计假设0H .如果2χ的值较大,就拒绝0H ,即认为A 与B 是有关的.2χ统计量的两个临界值:3.841、6.635;当2 3.841χ>时,有95%的把握说事件A 与B 有关;当2 6.635χ>时,有99%的把握说事件A 与B 有关;当23.841χ≤时,认为事件A 与B 是无关的.独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立的. 1.独立性检验的步骤:统计假设:0H ;列出22⨯联表;计算2χ统计量;查对临界值表,作出判断.2.几个临界值:222()0.10( 3.841)0.05( 6.635)0.01P P P χχχ≈≈≈≥2.706,≥,≥.22⨯联表的独立性检验:如果对于某个群体有两种状态,对于每种状态又有两个情况,这样排成一张22⨯的表,如下:状态B 状态B 合计 状态A 11n 12n 1n + 状态A21n 22n 2n +1n +2n +n如果有调查得来的四个数据11122122n n n n ,,,,并希望根据这样的4个数据来检验上述的两种状态A 与B 是否有关,就称之为22⨯联表的独立性检验.六.回归分析1.回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性. 回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.最小二乘法:记回归直线方程为:ˆy a bx =+,称为变量Y 对变量x 的回归直线方程,其中a b ,叫做回归系数.ˆy是为了区分Y 的实际值y ,当x 取值i x 时,变量Y 的相应观察值为i y ,而直线上对应于i x 的纵坐标是ˆi i ya bx =+. 设x Y ,的一组观察值为()i i x y ,,12i n =,,,,且回归直线方程为ˆya bx =+, 当x 取值i x 时,Y 的相应观察值为i y ,差ˆ(12)i i y yi n -=,,,刻画了实际观察值i y 与回归直线上相应点的纵坐标之间的偏离程度,称这些值为离差.我们希望这n 个离差构成的总离差越小越好,这样才能使所找的直线很贴近已知点. 记21()ni i i Q y a bx ==--∑,回归直线就是所有直线中Q 取最小值的那条.这种使“离差平方和为最小”的方法,叫做最小二乘法.用最小二乘法求回归系数a b ,有如下的公式: 1221ˆni ii nii x ynxy bxnx ==-=-∑∑,ˆˆa y bx =-,其中a b ,上方加“^”,表示是由观察值按最小二乘法求得的回归系数.3.线性回归模型:将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型. 产生随机误差的主要原因有:①所用的确定性函数不恰当即模型近似引起的误差; ②忽略了某些因素的影响,通常这些影响都比较小; ③由于测量工具等原因,存在观测误差. 4.线性回归系数的最佳估计值:利用最小二乘法可以得到ˆˆab ,的计算公式为 1122211()()()()nnii iii i nniii i xx y y x ynxyb xx xn x ====---==--∑∑∑∑,ˆˆa y bx =-,其中11n i i x x n ==∑,11nii y y n ==∑ 由此得到的直线ˆˆya bx =+就称为回归直线,此直线方程即为线性回归方程.其中ˆa ,b 分别为a ,b 的估计值,ˆa称为回归截距,b 称为回归系数,ˆy 称为回归值. 5.相关系数:()()nnii i ixx y y x ynx yr ---==∑∑6.相关系数r 的性质: ⑴||1r ≤;⑵||r 越接近于1,x y ,的线性相关程度越强; ⑶||r 越接近于0,x y ,的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. 7.转化思想:根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数. 8.一些备案 ①回归(regression )一词的来历:“回归”这个词英国统计学家Francils Galton 提出来的.1889年,他在研究祖先与后代的身高之间的关系时发现,身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们父母的平均身高高.Galton 把这种后代的身高向中间值靠近的趋势称为“回归现象”.后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析.②回归系数的推导过程:22222[()]222i i i i i i i i Q y a bx y a y na b x y ab x b x =--=-+-++∑∑∑∑∑∑ 22222()2i i i i i i na a b x y b x b x y y =+-+-+∑∑∑∑∑,把上式看成a 的二次函数,2a 的系数0n >,因此当2()2i i i ib x y y b x a n n --=-=∑∑∑∑时取最小值. 同理,把Q 的展开式按b 的降幂排列,看成b 的二次函数,当2i iiix y a xb x-=∑∑∑时取最小值.解得:12221()()()ni iii i niii x ynxyx x y y b x x xnx==---==--∑∑∑∑,a y bx =-, 其中1i y y n =∑,1i x x n=∑是样本平均数. 9. 对相关系数r 进行相关性检验的步骤: ①提出统计假设0H :变量x y ,不具有线性相关关系;②如果以95%的把握作出推断,那么可以根据10.950.05-=与2n -(n 是样本容量)在相关性检验的临界值表中查出一个r 的临界值0.05r (其中10.950.05-=称为检验水平); ③计算样本相关系数r ;④作出统计推断:若0.05||r r >,则否定0H ,表明有95%的把握认为变量y 与x 之间具有线性相关关系;若0.05||r r ≤,则没有理由拒绝0H ,即就目前数据而言,没有充分理由认为变量y 与x 之间具有线性相关关系. 说明:⑴对相关系数r 进行显著性检验,一般取检验水平0.05α=,即可靠程度为95%.⑵这里的r 指的是线性相关系数,r 的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系.⑶这里的r 是对抽样数据而言的.有时即使||1r =,两者也不一定是线性相关的.故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释.题型一 频率分布直方图【例1】 (2010西城二模)某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.则这200名同学中成绩大于等于80分且小于90分的学生有______名.典例分析【例2】 (2010东城二模)已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内的样本频数为 ,样本数据落在[2,10)内的频率为 .【例3】 (2010北京)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a = .若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[]140,150内的学生中选取的人数应为 .【例4】 (2010江苏高考)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[]540,中,其频率分布直方图如图所示,则其抽样的100根中,有____根在棉花纤维的长度小于20mm .(mm)频率组距【例5】 (2009湖北15)下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[)610,内的频数为 ,数据落在[)210,内的概率约为 .【例6】 (2009福建3)一个容量为100的样本,其数据的分组与各组的频数如下: 组别 (]010,(]1020, (]2030, (]3040, (]4050, (]5060, (]6070,频数12 13 2415 16 137则样本数据落在(]1040,上的频率为( )A .0.13B .0.39C .0.52D .0.64【例7】 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( )时间(h)A .0.6hB .0.9hC .1.0hD .1.5h【例8】 为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[)4555,,[)5565,,[)6575,,[)7585,,[)8595,由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)5575,的人数是 .产品数量0.0200.0150.0100.005【例9】 (2009山东8)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96106],,样本数据分组为[)9698,,[)98100,,[)100102,,[)102104,,[104106],.已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A .90B .75C .60D .45【例10】 某路段检查站监控录象显示,在某时段内,有1000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为右图的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90km/h 的车辆数为( )A .200B .600C .500D .300【例11】 (2006年全国II )一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本频率分布直方图,为了分析居民的收入与年龄、学历、职业等方面的联系,要从这10000人中用分层抽样的方法抽出100人做进一步调查,则在[25003000],(元)月收入段应抽出_____人.0.00050.00040.00030.00020.0001频率组距月收入(元)【例12】 如图为某样本数据的频率分布直方图,则下列说法不正确的是( )0.1频率组距A .[610),的频率为0.32B .若样本容量为100,则[1014),的频数为40C .若样本容量为100,则(10]-∞,的频数为40D .由频率分布布直方图可得出结论:估计总体大约有10%分布在[1014),【例13】 (2006北京模拟)下面是某学校学生日睡眠时间的抽样频率分布表:睡眠时间 人数 频率 [6 6.5), 5 0.05 [6.57), 17 0.17 [77.5), 33 0.33 [7.58), 37 0.37 [88.5), 6 0.06 [8.59), 2 0.02合计 100 1画出频率分布直方图,估计该校学生的日平均睡眠时间.【例14】 (2010崇文一模)为了调查某厂2000名工人生产某种产品的能力,随机抽查了m 位工人某天生产该产品的数量,产品数量的分组区间为[)10,15,[)15,20,[)20,25,[)25,30,[30,35],频率分布直方图如图所示.已知生产的产品数量在[)20,25之间的工人有6位.⑴求m ;10 15 20 25 30 35 产品数量⑵工厂规定从各组中任选1人进行再培训,则选取5人不在同一组的概率是多少?【例15】考查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)⑴作出频率分布表;⑵画出频率分布直方图.【例16】(2010陕西卷高考)为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行出样检查,测得身高情况的统计图如下:/cm/cm⑴估计该小男生的人数;⑵估计该校学生身高在170~185cm之间的概率;⑶从样本中身高在165~180cm之间的女生..中任选2人,求至少有1人身高在170~180cm之间的概率.【例17】从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表,画出频率分布直方图及折线图,并根据作出的频率分布直方图估计身高不小于170的同学的人数.【例18】为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如下图),已知图中从左到右的前三个小组的频率分别是0.10.30.4,,.第一小组的频数是5.⑴求第四小组的频率和参加这次测试的学生人数;⑵在这次测试中,学生跳绳次数的中位数落在第几小组内?⑶参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩优秀率是多少?【例19】 为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛. 为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计. 请你根据尚未完成并有局部污损的频率分布表和频数分布直方图,解答下列问题: ⑴ 填充频率分布表的空格(将答案直接填在表格内); ⑵ 补全频数条形图;⑶ 若成绩在75.5~85.5分的学生为二等奖,问获得二等奖的学生约为多少人?【例20】 (2010丰台一模)某校高三(1)班的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题.频率⑴求全班人数及分数在[)80,90之间的频数;⑵估计该班的平均分数,并计算频率分布直方图中[)80,90间的矩形的高;⑶若要从分数在[]80,100之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在[]90,100之间的概率.【例21】某地区为了了解70~80岁老人的日平均睡眠时间(单位:h).随机选择了50位老人的进行调查.下表是这50位老人日睡眠时间的频率分布表.在上述统计数据中,一部分计算见算法流程图(其中←可用=代替),则输出的S的值是.。

频率分布直方图的平均数

频率分布直方图的平均数

频率分布直方图的平均数
频率分布直方图是用来描述一组数据的分布情况的图表。

它将数据的取值范围划分成一些区间,统计每个区间内数据出现的次数,然后将这些次数用纵向的条形图表示出来。

频率分布直方图的平均数是指所有数据的平均数。

如果数据有n个,则平均数计算公式为:
平均数= Σ(数据值× 频率) / Σ频率
其中,Σ(数据值× 频率)表示所有数据值乘以对应的频率的总和,Σ频率表示所有数据的频率的总和。

例如,对于如下的频率分布直方图:
数据值频率
0-10 3
10-20 5
20-30 2
30-40 4
40-50 1
则平均数计算如下:
平均数= (0 × 3 + 10 × 5 + 20 × 2 + 30 × 4 + 40 × 1) / (3 + 5 + 2 + 4 + 1)
= 270 / 15
= 18
频率分布直方图的平均数可以反映出数据的中位数,即大多数数据取值的中间值。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高考题型之频率分布直方图
知识点:............................................................................................................................................................................... - 1 -典型例题:........................................................................................................................................................................... - 1 -答案....................................................................................................................................................................................... - 4 -
知识点:
典型例题:
1.某工厂对一批产品进行了抽样检测.有图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100), [100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是
(A)90 (B)75 (C)60 (D)45
2.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……第六组,成绩大于等于18秒且小于19秒。

右图是按上述分组方法得到的频率分布直方图。

设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为
(A)0.9,35(B)0.9,45(C)0.1,35(D)0.1,45
3.某个小区住户共200户,为调查小区居民的7月份用水量,用分层抽样的方法抽取了50户进行调查,得到本月的用水量(单位:m3)的频率分布直方图如图所示,则小区内用水量超过15m3的住户的户数为
A.10
B.50
C.60
D.140
4.某时段内共有100辆汽车经过某一雷达地区,时速频率分布直方图如右图所示,则时速超过60km/h的汽车数量为_____________;
5.某个容量为100的样本的频率分布直方图如下,则在区间[4,5)上的数据的频数
..为.
6.某地区教育主管部门为了对该地区模拟考试成绩进行分析,抽取了总成绩介于350分到650分之间的10000名学生成绩,并根据这10000名学生的总成绩画了样本的频率分布直方图.为了进一步分析学生的总成绩与各科成绩等方面的关系,要从这10000名学生中,再用分层抽样方法抽出200人作进一步调查,则总成绩在[400,500)内共抽出( )
A.100人
B.90人
C.65人
D.50人
7.济南交警部门随机测量了顺河高架桥南下口某一时间段经过的2000辆汽车的时速,时速频率分布直方图如图所示,则时速超过70km/h的汽车数量为_______
8.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:
根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是 ( )
(A)20 (B)30 (C)40 (D)50
9.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2500,3000)(元)月收入段应抽出人.
10.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图)。

由图中数据
可知a=。

若要从身高在[ 120 , 130),[130 ,140) , [140 , 150]三组内的学生中,用分层抽样的方法选取
18人参加一项活动,则从身高在[140 ,150]内的学生中选取的人数应为。

11.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则其抽样的100根中,有____根在棉花纤维的长度小于20mm 。

本类题的特征是:__________________________________________________________________________________ __________________________________________________________________________________________________ 本类题的做法是:__________________________________________________________________________________ __________________________________________________________________________________________________
答案
1.【解析】:产品净重小于100克的概率为(0.050+0.100)×2=0.300, 已知样本中产品净重小于100克的个数是36,设样本容量为n ,则300.036=n
,所以120=n ,净重大于或等于98克并且小于104克的产品的概率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.故选A.
2. A .【分析】:从频率分布直方图上可以看出0.9x =,35y =.
3.C 【解析】以50为样本容量可计算出超过3
15m 用水量的户数为()50.050.015015,⨯+⨯=所以可估算200户居民超过3
15m 用水量的户数60.
4.38
5. 30
6.B
7.200
8.C
9.25 10.答案:0.030 3
11. [解析]考查频率分布直方图的知识。

100×(0.001+0.001+0.004)×5=30。

相关文档
最新文档