高考题型之-频率分布直方图
频率分布直方图题型归纳-邓永海
频率分布直方图题型归纳1.频率、频数、样本容量三个量产生的知二求一2.补全频率分布表3.做频率分布直方图4.性质“面积和为1”的应用,补全直方图5.与分层抽样、数列等知识综合6.估计总体的频率分布,区间内的频数问题【例1】14.I2[2012·山东卷] 如图1-4是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为________.图1-414.9[解析] 本题考查频率分布直方图及样本估计总体的知识,考查数据处理能力,容易题.样本容量=111×(0.10+0.12)=50,样本中平均气温不低于25.5℃的城市个数为50×1×0.18=9.【例2】18.I2[2012·安徽卷] 若某产品的直径长与标准值的差的绝对值不超过...1 mm时,则视为合格品,否则视为不合格品,在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:(1)...(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品,据此估算这批产品中的合格品的件数.18.解:(1)频率分布表(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率约为0.50+0.20=0.70;(3)设这批产品中的合格品数为x 件,依题意有505000=20x +20, 解得x =5000×2050-20=1 980. 所以该批产品的合格品件数估计是1 980件.【例3】18.I2[2014·全国新课标卷Ⅰ] 从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(1)在答题卡上作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均值及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?18.解:(1)频率分布直方图如下:(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.8=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.【例4】11.I2[2013·湖北卷] 从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图1-3所示.(1)直方图中x的值为________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.图1-311.(1)0.004 4(2)70[解析] (1)(0.001 2+0.002 4×2+0.003 6+x+0.006 0)×50=1x=0.004 4.(2)[1-(0.001 2+0.002 4×2)×50]×100=70.【变式】17.I2、K2[2014·重庆卷] 20名学生某次数学考试成绩(单位:分)的频率分布直方图如图1-3所示.图1-3(1)求频率分布直方图中a的值;(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率.17.解:(1)据直方图知组距为10,由(2a+3a+7a+6a+2a)×10=1,解得a=1200=0.005.(2)成绩落在[50,60)中的学生人数为2×0.005×10×20=2. 成绩落在[60,70)中的学生人数为3×0.005×10×20=3.(3)记成绩落在[50,60)中的2人为A 1,A 2,成绩落在[60,70)中的3人为B 1,B 2,B 3,则从成绩在[50,70)的学生中任选2人的基本事件共有10个,即(A 1,A 2),(A 1,B 1),(A 1,B 2),(A 1,B 3),(A 2,B 1),(A 2,B 2),(A 2,B 3),(B 1,B 2),(B 1,B 3),(B 2,B 3).其中2人的成绩都在[60,70)中的基本事件有3个,即(B 1,B 2),(B 1,B 3),(B 2,B 3).故所求概率为P =310.【例5】(12)从某小学随机抽取100名同学,将他们身高(单位:厘米)数据绘制成频率分布直方图(如图)。
高中数学频率分布直方图
频率分布直方图作频率分布直方图的方法为:(1)把横轴分成若干段,每一线段对应一个组的组距;(2)以此线段为底作矩形,它的高等于该组的组距频率,这样得出一系列的矩形;(3)每个矩形的面积恰好是该组上的频率.频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图.作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.知识点1:利用频率分布直方图分析总体分布例题1: 2000辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,时速在[50,60)的汽车大约有 A .30辆 B .60辆 C .300辆 D .600辆变式:某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是 [96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是A.90B.75C. 60D.45变式:某初一年级有500名同学,将他们的身高(单位:cm )数据绘制成频率分布直方图(如图),若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[)130,140内的学生中选取的人数为 .知识点2:用样本分估计总体例题2某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,96 98 100 102 104 106 0.1500.125 0.1000.0750.050 克 频率/组距100 110 120130 140 150 身高频率|组距0.0050.0100.020a0.035(Ⅰ) 完成频率分布表;(Ⅱ)作出频率分布直方图;(Ⅲ)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染。
高考题型之-频率分布直方图
高考题型之-频率分布直方图
频率分布直方图是用来表示数据分布情况的一种统计图,其中的每一条柱状图代表了某个特定变量的频率分布。
这种图形能够很好地显示出数据分布的大致特征,帮助研究者更快更有效地理解和提取数据中的信息。
高考中,频率分布直方图会用于帮助考生分析一组数据,从而确定其分布范围,比例和密度。
此外,它还可以用来比较不同数据集之间的差异,以及分析数据集的变化趋势,从而帮助考生更好地掌握数据分析的基本原理。
高中数学复习概率统计题型归纳与讲解03 频率分布直方图
高中数学复习概率统计题型归纳与讲解专题3频率分布直方图例1.要调查某地区高中学生身体素质,从高中生中抽取100人进行跳高测试,根据测试成绩制作频率分布直方图如图,现从成绩在[120,140)之间的学生中用分层抽样的方法抽取5人,应从[120,130)间抽取人数为b,则()A.a=0.2,b=2B.a=0.025,b=3C.a=0.3,b=4D.a=0.030,b=3【解析】解:由题得10×(0.005+0.035+a+0.020+0.010)=1,所以a=0.030.在[120,130)之间的学生人数为:100×10×0.030=30人,在[130,140)之间的学生人数为:100×10×0.020=20人,在[120,140)之间的学生人数为:100×(10×0.030+0.020)=50人,又用分层抽样的方法在[120,140)之间的学生50人中抽取5人,即抽取比例为:110,所以成绩在[120,130)之间的学生中抽取的人数应,30×110=3,即b=3,故选:D.例2.从某企业生产的某种产品中随机抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值分组[70,80) [80,90) [90,100) [100,110) 110,120)频数 14 20 36 18 12估计这种产品质量指标值的平均数为(同一组中的数据用该组区间的中点值作代表)( )A .100B .98.8C .96.6D .94.4【解析】解:平均数x →=0.14×75+0.20×85+0.36×95+0.18×105+0.12×115=94.4.故选:D .例3.“新冠肺炎”席卷全球,我国医务工作者为了打好这次疫情阻击战,充分发挥优势,很快抑制了病毒,据统计老年患者治愈率为71%,中年患者治愈率为85%,青年患者治愈率为91%.如果某医院有30名老年患者,40名中年患者,50名青年患者,则估计该医院的平均治愈率是( )A .86%B .83%C .90%D .84%【解析】解:利用求加权平均数的公式解得:30×71%+40×85%+50×91%30+40+50=0.84=84%,故选:D .例4.已知样本数据x 1,x 2,…,x n (n ∈N *)的平均数与方差分别是a 和b ,若y i =﹣2x i +3(i =1,2,…n ),且样本数据y 1,y 2,…,y n 的平均数与方差分别是b 和a ,则a ﹣b =( )A .1B .2C .3D .4【解析】解:由题意得:{−2a +3=b a =4b ,解得:{a =43b =13,故a ﹣b =1, 故选:A .例5.下面定义一个同学数学成绩优秀的标志为:“连续5次考试成绩均不低于120分”.现有甲、乙、丙三位同学连续5次数学考试成绩的记录数据(记录数据都是正整数):①甲同学:5个数据的中位数为127,众数为120;②乙同学:5个数据的中位数为125,总体均值为127;③丙同学:5个数据的中位数为135,总体均值为128,总体方差为19.8.则可以判定数学成绩优秀同学为( )A .甲、乙B .乙、丙C .甲、丙D .甲、乙、丙【解析】解:在①中,甲同学:5个数据的中位数为127,众数为120,所以前三个数为120,120,127,则后两个数肯定大于127,故甲同学数学成绩优秀,故①成立;在②中,5个数据的中位数为125,总体均值为127,可以找到很多反例,如:118,119,125,128,145,故乙同学数学成绩不优秀,故②不成立;在③中,5个数据的中位数为135,总体均值为128,总体方差为19.8设x 1<x 2<x 3<x 4,则丙的方差为15[(x 1﹣128)2+(x 2﹣128)2+(x 3﹣128)2+(x 4﹣128)2+(135﹣128)2]=19.8, ∴(x 1﹣128)2+(x 2﹣128)2+(x 3﹣128)2+(x 4﹣128)2=50,∴(x 1﹣128)2≤50,得|x 1﹣128|≤5,∴x 1≥128﹣5>120,∴丙同学数学成绩优秀,故③成立.∴数学成绩优秀有甲和丙2个同学.故选:C .例6.若数据x 1,x 2,…,x n 的平均数x =3,方差s 2=1,则数据2x 1+3,2x 2+3,…,2x n +3的平均数和方差分别为( )A.6,6B.9,2C.9,6D.9,4【解析】解:由题意若数据x1,x2,…,x n的平均数x=3,方差s2=1,可得x1+x2+…+x n=3n,则:2x1+3+x2+3+…+x n+3=2(x1+x2+…+x n)+3n=9n,所以数据2x1+3,2x2+3,…,2x n+3的平均数为9.又S2=1n[(x1﹣3)2+(x2﹣3)2+…+(x n﹣3)2]=1,所以[(x1﹣3)2+(x2﹣3)2+…+(x n﹣3)2]=n,所以1n [(2x1+3﹣9)2+(2x2+3﹣9)2+…+(2x n+3﹣9)2]=4n[(x1﹣3)2+(x2﹣3)2+…+(x n﹣3)2]=4,则数据2x1+3,2x2+3,…,2x n+3的平均数和方差分别为9,4.故选:D.例7.随着城镇化的不断发展,老旧小区的改造及管理已经引起了某市政府的高度重视,为了了解本市甲,乙两个物业公司管理的小区住户对其服务的满意程度,现从他们所服务的小区中随机选择了40个住户,根据住户对其服务的满意度评分,得到A区住户满意度评分的频率分布直方图和B 区住户满意度评分的频率分布表.B区住户满意度评分的频率分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数4610128(Ⅰ)在图2中作出B区住户满意度评分的频率分布直方图,并通过频率分布直方图计算两区住户满意度评分的平均值及分散程度(其中分散程度不要求计算出具体值,给出结论即可);(Ⅱ)根据住户满意度评分,将住户和满意度分为三个等级:满意度评分低于70分,评定为不满意;满意度评分在70分到89分之间,评定为满意;满意度评分不低于90分,评定为非常满意.试估计哪个地区住户的满意度等级为不满意的概率大?若是要选择一个物业公司来管理老旧小区的物业,从满意度角度考虑,应该选择哪一个物业公司?说明理由.【解析】解:(Ⅰ)作出如图所示的频率分布直方图,B区住户满意度评分的频率分布直方图如图所示A区住户满意度评分的平均值为45×0.1+55×0.2+65×0.3+75×0.2+85×0.15+95×0.05=67.5;B区住户满意度评分的平均值为55×0.1+65×0.15+75×0.25+85×0.3+95×0.2=78.5.通过比较两区住户满意度评分的频率分布直方图可以看出,B区住户满意度评分比较集中,而A 区住户满意度评分比较分散.(Ⅱ)记D表示事件:“A区住户的满意度等级为不满意”,记E表示事件:“B区住户的满意度等级为不满意”,则P(D)=(0.010+0.020+0.030)×10=0.6,P(E)=(0.010十0.015)×10=0.25,所以A区住户的满意度等级为不满意的概率较大.若是要选择一个物业公司来管理老旧小区的物业,从满意度等级为满意来考虑,应该选择乙物业公司来为小区服务,这样的话小区住户满意度会高一些.例8.某校在一次期末数学测试中,为统计学生的考试情况,从学校的2000名学生中随机抽取50名学生的考试成绩,被测学生成绩全部介于65分到145分之间(满分150分),将统计结果按如下方式分成八组:第一组[65,75),第二组[75,85),……第八组[135,145],如图是按上述分组方法得到的频率分布直方图的一部分.(1)求第七组的频率,并完成频率分布直方图;(2)用样本数据估计该校的2000名学生这次考试成绩的平均分(同一组中的数据用该组区间的中点值代表该组数据平均值);(3)若从样本成绩属于第六组和第八组的所有学生中随机抽取2名,求他们的分差的绝对值小于10分的概率.【解析】解:(1)由频率分布直方图得第七组的频率为:1﹣(0.004+0.012+0.016+0.030+0.020+0.006+0.004)×10=0.08.完成频率分布直方图如下:(2)用样本数据估计该校的2000名学生这次考试成绩的平均分为:70×0.004×10+80×0.012×10+90×0.016×10+100×0.030×10+110×0.020×10+120×0.006×10+130×0.008×10+140×0.004×10=102.(3)样本成绩属于第六组的有0.006×10×50=3人,样本成绩属于第八组的有0.004×10×50=2人,从样本成绩属于第六组和第八组的所有学生中随机抽取2名,基本事件总数n=C52=10,他们的分差的绝对值小于10分包含的基本事件个数m=C32+C22=4,∴他们的分差的绝对值小于10分的概率p=mn=410=25.例9.我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准x,用水量不超过x的部分按平价收费,超出x的部分按议价收费.下面是居民月均用水量的抽样频率分布直方图.①求直方图中a的值;②试估计该市居民月均用水量的众数、平均数;③设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;④如果希望85%的居民月均用水量不超过标准x ,那么标准x 定为多少比较合理?【解析】解:①由概率统计相关知识,各组频率之和的值为1,∵频率=(频率/组距)*组距,∴0.5×(0.08+0.16+0.4+0.52+0.12+0.08+0.04+2a )=1,解得:a =0.3,∴a 的值为0.3;②由频率分布直方图估计该市居民月均用水量的众数为2+2.52=2.25(吨),估计该市居民月均用水量的平均数为:0.5(0.25×0.08+0.75×0.16+1.25×0.3+1.75×0.4+2.25×0.52+2.75×0.3+3.25×0.12+3.75×0.08+4.25×0.04)=2.035(吨).③由图,不低于3吨人数所占百分比为0.5×(0.12+0.08+0.04)=12%,∴全市月均用水量不低于3吨的人数为:30×12%=3.6(万);④由频率分布直方图得月均用水量低于2.5吨的频率为:0.5×(0.08+0.16+0.3+0.4+0.52)=0.73<85%,月均用水量低于3吨的频率为:0.5×(0.08+0.16+0.3+0.4+0.52+0.3)=0.88>85%,∴x=2.5+0.5×0.85−0.730.3×0.5=2.9(吨).例10.如图是某校高三(1)班的一次数学知识竞赛成绩的基叶图(图中仅列出[50,60),[90,100)的数据)和频率分布直方图.(1)求全班人数以及频率分布直方图中的x,y;(2)估计学生竞赛成绩的平均数和中位数(保留两位小数).【解析】解:(1)分数在[50,60)的频率为0.020×10=0.2,由茎叶图知,分数在[50,60)之间的频数为5,所以全班人数为50.2=25(人);分数在[90,100)之间的频数为2,由225=10y,解得y=0.008;又10x=1﹣10×(0.036+0.024+0.020+0.008),解得x=0.012.(2)由频率分布直方图,计算平均数为x=55×0.2+65×0.24+75×0.36+85×0.12+95×0.08=71.4,由0.2+0.24+0.36=0.80,所以中位数在[70,80)内,设中位数为m,则0.20+0.24+(m﹣70)×0.036=0.5,解得m≈71.67,所以中位数约为71.67.例11.某高中数学建模兴趣小组的同学为了研究所在地区男高中生的身高与体重的关系,从若干个高中男学生中抽取了1000个样本,得到如下数据.数据一:身高在[170,180)(单位:cm)的体重频数统计体重(kg)[50,55)[55,60)[60,65)[65,70)[70,75)[75,80)[80,85)[85,90)人数206010010080201010数据二:身高所在的区间含样本的个数及部分数据身高x(cm)[140,150)[150,160)[160﹣170)[170﹣180)[180﹣190)平均体重y(kg)4553.66075(Ⅰ)依据数据一将下面男高中生身高在[170﹣180)(单位:cm)体重的频率分布直方图补充完整,并利用频率分布直方图估计身高在[170﹣180)(单位:cm)的中学生的平均体重;(保留小数点后一位)(Ⅱ)依据数据一、二,计算身高(取值为区间中点)和体重的相关系数约为0.99,能否用线性回归直线来刻画中学生身高与体重的相关关系,请说明理由;若能,求出该回归直线方程;(Ⅲ)说明残差平方和或相关指数R2与线性回归模型拟合效果之间关系.(只需写出结论,不需要计算)参考公式:b=∑ni=1(x i−x)(y i−y)∑n i=1(x i−x)2=∑ni=1x i y i−nx⋅y∑n i=1x i2−nx2,a=y−b x.参考数据:(1)145×45+155×53.6+165×60+185×75=38608;(2)1452+1552+1652+1752+1852﹣5×1652=1000.(3)663×175=116025,664×175=116200,665×175=116375.(4)728×165=120120.【解析】解:(1)身高在[170,180)的总人数为:20+60+100+100+80+20+10+10=400,体重在[55﹣60)的频率为:60400=0.15,体重在[70﹣75)的频率为:80400=0.2,平均体重为:52.5×0.05+57.5×0.15+62.5×0.25+67.5×0.25+72.5×0.2+77.5×0.05+82.5×0.025+87.5×0.025≈66.4,(2)因为r=0.99→1,线性相关很强,故可以用线性回归直线来刻画中学生身高与体重的相关,x=145+155+165+175+1855=165,y=45+75+60+53.6+66.45=60,b=∑8i=1x i y i−8x⋅y∑8i=1x i2−8x2=38608+175×66.4−5×165×601000=0.728,a=y−b x=60−0.728×165=−60.12,所以回归直线方程为:y=0.728x−60.12,(3)残差平方和越小或相关指数R2越接近于1,线性回归模型拟合效果越好.例12.市政府为了节约用水,调查了100位居民某年的月均用水量(单位:t),频数分布如下:分组[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]频数4815222514642(1)根据所给数据将频率分布直方图补充完整(不必说明理由);(2)根据频率分布直方图估计本市居民月均用水量的中位数;(3)根据频率分布直方图估计本市居民月均用水量的平均数(同一组数据由该组区间的中点值作为代表).【解析】解:(1)频率分布直方图如图所示:(2)∵0.04+0.08+0.15+0.22=0.49<0.5,∴中位数为2+0.5−0.490.25×0.5=2.02,(3)由频率分布直方图得平均数为:0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.02=2.02.例13.某地区100居民的人均用水量(单位:t)的分组的频数如下:[0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22;[2,2.5),25;[2.5,3),14;[3,3.5),6;[3.5,4),4;[4,4.5),2.(1)列出样本的频率分布表;(2)画出频率分布直方图,并根据直方图估计这组数据的众数;(坐标轴单位自定)(3)当地政府制订了人均月用水量为3t的标准,若超出标准加倍收费,当地政府解释说,85%以上的居民不超出这个标准,这个解释对吗?为什么?【解析】解:(1 )分组频数频率[0,0.5 )40.04[0.5,1 )80.08[1,1.5 )150.15[1.5,2 )220.22[2,2.5 )250.25[2.5,3 )140.14[3,3.5 )60.06[3.5,4 )40.04[4,4.5 )20.02(2):频率分布直方图如下图,由图知,这组数据的众数为2.25.(3)人均月用水量在3t以上的居民的比例为6%+4%+2%=12%,即大约是有12%的居民月均用水量在3t以上,88%的居民月均用水量在3t以下,因此,政府的解释是正确的.例14.某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60)…[90,100]后画出如下频率分布直方图.观察图形的信息,回答下列问题:(Ⅰ)估计这次考试的众数m与中位数n(结果保留一位小数);(Ⅱ)估计这次考试的及格率(60分及以上为及格)和平均分.【解析】解:(Ⅰ)众数是最高小矩形中点的横坐标,所以众数为m=75(分);(3分)前三个小矩形面积为0.01×10+0.015×10+0.015×10=0.4,∵中位数要平分直方图的面积,∴n=70+0.5−0.40.03=73.3(7分)(Ⅱ)依题意,60及以上的分数所在的第三、四、五、六组,频率和为(0.015+0.03+0.025+0.005)*10=0.75所以,抽样学生成绩的合格率是75% (11分)利用组中值估算抽样学生的平均分45•f1+55•f2+65•f3+75•f4+85•f5+95•f6=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71估计这次考试的平均分是71分.(14分)例15.为应对新冠疫情,重庆市于2020年1月24日启动重大突发公共卫生事件一级响应机制,要求市民少出门,少聚集,于是快递业务得到迅猛发展.为满足广大市民的日常生活所需,某快递公司以优厚的条件招聘派送员,现给出了两种日薪薪酬方案,甲方案:底薪100元,每派送一单奖励1元;乙方案:底薪150元,每日前55单没有奖励,超过55单的部分每单奖励10元.(Ⅰ)请分别求出这两种薪酬方案中日薪y(单位:元)与送货单数n的函数关系式;(Ⅱ)根据该公司所有派送员10天的派送记录,发现派送员的日平均派送单数与天数满足以下表格:日均派送单数5054565860频数(天)23221回答下列问题:①根据以上数据,设每名派送员的日薪为X(单位:元),试分别求出这10天中甲、乙两种方案的日薪X的平均数及方差;②结合①中的数据,根据统计学的思想,若你去应聘派送员,选择哪种薪酬方案比较合适,并说明你的理由.(参考数据:172=289,372=1369)【解析】解:(1)甲方案,y =100+n ;乙方案,y ={150,n ≤5510n −400,n >55.(2),①甲方案中,根据已知表格可计算出日平均派送单数为2×50+3×54+2×56+2×58+6010=55,方差为0.2×(50﹣55)2+0.3×(54﹣55)2+0.2×(56﹣55)2+0.2×(58﹣55)2+0.1×(60﹣55)2=9.8,所以,由(1)中变量之间的关系,可以指,甲方案的日薪X 的平均数为155,方差为9.8. 乙方案中,日薪X 的平均数为[5×150+160×2+180×2+200]×0.1=163,日薪方差为0.5×(150﹣163)2+0.2×(160﹣163)2+0.2×(180﹣163)2+0.1×(200﹣163)2=213.4.(3)若去应聘派送员,我会选择乙方案,从平均数的角度来看,乙方案的平均薪酬更高,同时更有激励作用.例16.2019年起,全国地级及以上城市全面启动生活垃圾分类工作,垃圾分类投放逐步成为居民的新时尚.为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收垃圾、有害垃圾和其他垃圾四类,并分别设置了相应的垃圾箱.为调查居民生活垃圾分类投放情况,现随机抽取了某市三类垃圾箱中总计1000吨生活垃圾,数据统计如下(单位:吨):“厨余垃圾”箱 “可回收垃圾”箱 “有害垃圾”箱“其他垃圾”箱厨余垃圾 300 70 30 80 可回收垃圾 30 210 30 30 有害垃圾 20 20 60 20 其他垃圾10201060(1)分别估计厨余垃圾和有害垃圾投放正确的概率;(2)假设厨余垃圾在“厨余垃圾”箱、“可回收垃圾”箱、“有害垃圾”箱、“其他垃圾”箱的投放量分别为a,b,c,d,其中a>0,a+b+c+d=800.当数据a,b,c,d的方差s2最大时,写出a,b,c,d的值(结论不要求证明),并求此时s2的值.【解析】解:(1)根据题意,厨余垃圾共300+70+30+80=480吨,其中投放正确的有300吨,则厨余垃圾投放正确的概率P1=300480=58,有害垃圾共20+20+60+20=120吨,其中投放正确的有60吨,则害垃圾投放正确的概率P2=60120=12;(2)根据题意,厨余垃圾在四种垃圾箱的投放量分别为a,b,c,d,其中a>0,a+b+c+d=800,则其平均数x=8004=200,则其方差S2=14[(a﹣200)2+(b﹣200)2+(c﹣200)2+(d﹣200)2],当a=600,b=c=d=0时,s2最大,而x=a+b+c+d4=200,此时s2=14[(600﹣200)2+(0﹣200)2+(0﹣200)2+(0﹣200)2]=120000例17.某市教育局为了解全市高中学生在素质教育过程中的幸福指数变化情况,对8名学生在高一,高二不同学习阶段的幸福指数进行了一次跟踪调研.结果如表:学生编号12345678高一阶段幸福指数9593969497989695学生编号12345678高二阶段幸福指数9497959695949396(1)根据统计表中的数据情况,分别计算出两组数据的平均值及方差;(2)请根据上述结果,就平均值和方差的角度分析,说明在高一,高二不同阶段的学生幸福指数状况,并发表自己观点.【解析】解:(1)8名学生在高一阶段的幸福指数的平均数为:x=18(95+93+96+94+97+98+96+95)=95.5,方差为:S12=18∑8i=1(x i−x1)2=2.25,8名学生在高二阶段的幸福指数的平均数为:y=18(94+97+95+96+95+94+93+96)=95,方差为:S22=18∑8i=1(y i−y)2=1.5;(2)①∵x>y,∴可以认为这8名学生在高一的平均幸福指数大于在高二的平均幸福指数,②∵S12>S22,∴可以认为这8名学生在高二的幸福指数的稳定性大于在高一的幸福指数的稳定性.例18.2020年1月,教育部《关于在部分高校开展基础学科招生改革试点工作的意见》印发,自2020年起,在部分高校开展基础学科招生改革试点(也称“强基计划”).强基计划聚焦高端芯片与软件、智能科技、新材料、先进制造和国家安全等关键领域以及国家人才紧缺的人文社会科学领域,选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生.新材料产业是重要的战略性新兴产业,如图是我国2011﹣2019年中国新材料产业市场规模及增长趋势图.其中柱状图表示新材料产业市场规模(单位:万亿元),折线图表示新材料产业市场规模年增长率(%).(1)求从2012年至2019年,每年新材料产业市场规模年增长量的平均数(精确到0.1);(2)从2015年至2019年中随机挑选两年,求两年中至少有一﹣年新材料产业市场规模年增长率超过20%的概率;(3)由图判断,从哪年开始连续三年的新材料产业市场规模的方差最大.(结论不要求证明)【解析】解:(1)从2012年起,每年新材料产业市场规模的年增加值依次为:0.3,0.2,0.3,0.5,0.6,0.4,0.8,0.6,(单位:万亿元),∴年增加的平均数为:0.3+0.2+0.3+0.5+0.6+0.4+0.8+0.68=0.5万亿元.(2)设A表示事件“从2015年至2019年中随机挑选两个,两年中至少有一年新材料产业市场规模增长率超过20%”,依题意P(A)=1−C22C52=910.(3)从2017年开始连续三年的新材料产业市场规模的方差最大.。
高考数学复习点拨 频率分布直方图典型例题析
频率分布直方图典型例题析频率分布直方图是表达和分析数据的重要工具,还可以直观、准确地理解相应的有用的信息,所以成为新高考的重点,我们必须总结其重要题型及有关计算。
一、基本概念类例1、关于频率 分布直方图的下列说法中,正确的是( )(A )、直方图的高表示某数的频率;(B )、直方图的高表示该组上的个体在样本中出现的频率;(C )、直方图的高表示该组上的个体与组距的比值;(D )、直方图的高表示该组上的个体在样本中出现的频率与组距的比值;解析:在频率分布直方图中,每一个小矩形都是等宽的,即等于组距,其面积表示数据的取值落在相应区间上的频率,因此每一个小矩形的高表示该组上的个体在样本中出现的频率与组距的比值,所以选(D )。
二、识图计算类例2、为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这100名学生中体重在[56.5,64.5)的学生人数是 ( )(A)20 (B)30(C)40 (D )50解:本题主要考查频率分布直方图和总体分布的估计等知识,同时考查图形的识别能力。
由频率直方图可知组距为2,故学生中体重在[56.5,64.5)的频率为:(0.03+0.05+0.05+0.07)×2=0.4,所以100名学生中体重在[56.5,64.5)的学生人数有: 0. 4×100=40人。
故选择C 点评:在频率分布直方图中,每一个小矩形都是等宽的,即等于组距,高是,所以有:×组距=频率;即可把所求范围内的频率求出,进而求该范围的人数。
例3:某校高一某班共有64名学生,下图是该班某次数学考试成绩的频率分布直方图,根据该图可知,成绩在110120间的同学大约有( )A 、 10B 、11C 、13D 、16解析:通过直方图可知:成绩在110120的频率是:2.023.015.01.005.01=----,所以成绩在110120之间的同学大约有:64×0.2=12.813≈人。
高考数学统计与概率大题解题模板
统计与概率大题解题模板 一、随机抽样和用样本估计总体模板一、频率分布直方图1、频率分布直方图的性质:(1)小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小; (2)在频率分布直方图中,各小矩形的面积之和等于1; (3)频数/相应的频率=样本容量.2、频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.3、频率分布直方图中的纵坐标为频率组距,而不是频率值.例1-1.某城市100户居民月平均用电量(单位:度),以[160180),、[180200),、[200220),、[220240),、[240260),、[260280),、]280[300,分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220240),、[240260),、[260280),、]280[300,的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220240),的用户中应抽取多少户? 【解析】(1)由(0.0020.00950.0110.01250.0050.0025)201x ++++++⨯=得:0.0075x =,∴直方图中x 的值是0.0075;(2)月平均用电量的众数是2202402302+=,∵(0.0020.00950.011)200.450.5++⨯=<,∴月平均用电量的中位数在[220240),内,设中位数为a , 由(0.0020.00950.011)200.0125(220)0.5a ++⨯+⨯-=得:224a =, ∴月平均用电量的中位数是224;(3)月平均用电量为[220240),的用户有0.01252010025⨯⨯=户, 月平均用电量为[240260),的用户有0.00752010015⨯⨯=户, 月平均用电量为[260280),的用户有0.0052010010⨯⨯=户, 月平均用电量为]280[300,的用户有0.0025201005⨯⨯=户, 抽取比例11125151055==+++,∴月平均用电量在[220,240)的用户中应抽取12555⨯=户.模板二、茎叶图1、绘制茎叶图的关键是分清茎和叶,如数据是两位数,十位数字为“茎”,个位数字为“叶”;如果是小数时,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶.2、利用茎叶图进行数据分析时,一般从数据分布的对称性、中位数、稳定性等几个方面来考虑. 例1-2.某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下: 甲:95、81、75、91、86、89、71、65、76、88、94、110、107; 乙:83、86、93、99、88、103、98、114、98、79、78、106、101. 画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较. 【解析】甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图上可以看出,乙同学的得分情况是大致对称的, 中位数是98;甲同学的得分情况,也大致对称,中位数是88, 乙同学的成绩比较稳定,总体情况比甲同学好.模板三、散点图1、两个变量的关系2、散点图:将样本中n 个数据点()i i x y ,(1i =,2,…,n )描在平面直角坐标系中得到的图形.3、正相关与负相关:(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关. 4、最小二乘法:设x 、y 的一组观察值为()i i x y ,(1i =,2,…,n ),且回归直线方程为ˆˆˆybx a =+.当x 取值i x (1i =,2,…,n )时,y 的观察值为i y ,差ˆi i y y -(1i =,2,…,n )刻画了实际观察值i y 与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即21()ni i i Q y a bx ==--∑作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q 取最小值的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法. 5、回归直线方程的系数计算公式例1-3.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:(1)y 与x 是否具有线性相关关系?(2)如果y 与x 具有线性相关关系,求y 关于x 的回归直线方程. 审题路线图:→→→【解析】(1)画散点图如下:由图可知y 与x 具有线性相关关系;(2)列表、计算:1102211055950105591.70.66838500105520ˆ1iii ii x y x ybxx ==⋅-⋅⋅-⨯⨯==≈-⨯-⋅∑∑,91.70.668ˆ55.6ˆ549ay bx =-=-⨯=,即所求的回归直线方程为:0.66859ˆ 4.6y x =+.构建答题模板:第一步:列表i x 、i y 、i i x y ;第二步:计算x ,y ,21ni i x =∑,1ni i i x y =∑;第三步:代入公式计算ˆb 、ˆa 的值; 第四步:写出回归直线方程;第五步:反复回顾,查看是否有重复或遗漏情况,明确规范书写答题.模板四、古典概型例1-4.袋中有五张卡片,其中红色卡片三张,标号为1、2、3;蓝色卡片两张,标号为1、2. (1)从以上五张卡片中任取两张,求这两张卡片颜色不同且标号之和小于4的概率;(2)向袋中再放入一张标号为0的绿色卡片,从这六张卡片中任取两张,求这两张卡片颜色不同且标点之和小于4的概率.审题路线图:确定概率模型→列出所有取卡片的结果(基本事件)→构成事件的基本事件→求概率. 规范解答:【解析】(1)标号为1、2、3的三张红色卡片分别记为A 、B 、C , 标号为1、2的两张蓝色卡片分别记为D 、E , 从五张卡片中任取两张的所有可能的结果为:AB 、AC 、AD 、AE 、BC 、BD 、BE 、CD 、CE 、DE 共10种,由于每一张卡片被取到的机会均等,因此这些基本事件的出现是等可能的, 从五张卡片中任取两张,这两张卡片颜色不同且它们的标号之和小于4的结果为:AD 、AE 、BD ,共3种,∴这两张卡片颜色不同且它们的标号之和小于4的概率为310;(2)记F 是标号为0的绿色卡片,从六张卡中任取两张的所有可能的结果为:AB 、AC 、AD 、AE 、AF 、BC 、BD 、BE 、BF 、CD 、CE 、CF 、DE 、DF 、EF 共15种,用于每一张卡片被取到的机会均等,因此这些基本事件的出现是等可能的, 从六张卡片中任取两张,这两张卡片颜色不同且它们的标号之和小于4的结果为:AD 、AE 、BD 、AF 、BF 、CF 、DF 、EF ,共8种, ∴这两张卡片颜色不同且它们的标号之和小于4的概率为815. 构建答题模板:第一步:列出所有基本事件,计算基本事件总数;第二步:将所求事件分解为若干个互斥的事件或转化为其对立事件(也许不用分解,但分解必要注意互斥);第三步:分别计算每个互斥事件的概率;第四步:利用概率的加法公式求出问题事件的概率;第五步:反复回顾,查看是否有重复或遗漏情况,明确规范书写答题.二、概率与统计之超几何分布与二项分布离散型随机变量的分布列、数学期望与方差1、关于离散型随机变量分布列的计算方法如下: (1)写出ξ的所有可能取值;(2)用随机事件概率的计算方法,求出ξ取各个值的概率; (3)利用(1)、(2)的结果写出ξ的分布列. 2、常见的特殊离散型随机变量的分布列:(1)两点分布,分布列为(0p -、1q -),其中01p <<,且1p q +=;(2)二项分布,分布列为(00p 、11p 、22p 、…、k kp 、…、n np ),其中k k n kk n p C p q -=,0k =、1、2、…、n ,且01p <<,1p q +=,k k n k k n p C p q -=可记为(,,)b k n p .3、对离散型随机变量的期望应注意:(1)期望是算术平均值概念的推广,是概念意义下的平均;(2)()E ξ是一个实数,由ξ的分布列唯一确定,即作为随机变量ξ是可变的,可取不同值,而()E ξ是不变的,它描述ξ取值的平均状态;(3)()1122n n E x p x p x p ξ=++⋅⋅⋅++⋅⋅⋅直接给出了E ξ的求法,即随机变量取值与相应概率值分别相乘后相加.4、对离散型随机变量的方差应注意:(1)()D ξ表示随机变量ξ对()E ξ的平均偏离程度,()D ξ越大表明平均偏离程度越大,说明ξ的取值越分散;反之()D ξ越小,ξ的取值越集中,在()E ξ来描述ξ的分散程度.(2)()D ξ与()E ξ一样也是一个实数,由ξ的分布列唯一确定.模板一、超几何分布——离散型随机变量的分布列、期望与方差(1)超几何分布的特征:①在小范围内不放回的随机抽取;②每次抽取相互影响;③每次抽取的可能性一直变化;(2)超几何分布的题型:在含有M 件次品的N 件产品中任取n 件(n M N ≤≤),其中恰有X 件次品;(3)超几何分布的分布列、期望与方差:①分布列:()k n k M N MnNC C P X k C --⋅==,012k n =⋅⋅⋅,,,,,k ∈N ;②期望:0()[()]nk nME X k P X k N ===⋅=∑; ③{}22()()()[()]()(1)nk nM N M N n D X k E x P X k N N =--==-⋅=-∑. 例2-1.已知一个袋中装有3个白球和3个红球,这些球除颜色外完全相同.(1)每次从袋中取一个球,取出后不放回,直到取到一个红球为止,求取球次数ξ的分布列和数学期望()E ξ;(2)每次从袋中取一个球,取出后放回接着再取一个球,这样取3次,求取出红球次数η的分布列、数学期望和方差()D η.审题路线图:取到红球为止→取球次数的所有可能1、2、3、4→求对应次数的概率→列分布列→求()E ξ.取出后放回,这是条件→每次取到红球的概率相同→三次独立重复试验→利用公式. 规范解答:【解析】(1)ξ的可能取值为1、2、3、4,31(1)62P ξ===,333(2)6510P ξ==⨯=, 3233(3)65420P ξ==⨯⨯=,32131(4)654320P ξ==⨯⨯⨯=,故ξ的分布列为:17()123421020204E ξ=⨯+⨯+⨯+⨯=;(2)取出后放回,取球3次,可看作3次独立重复试验,∴1~(2)2B η,,η的可能取值为0、1、2、3,0033111(0)()()228P C η==⋅⋅=,1123113(1)()()228P C η==⋅⋅=,2213113(2)()()228P C η==⋅⋅=,3303111(4)()()228P C η==⋅⋅=,故ξ的分布列为:∴()322E η=⨯=,113()3224D η=⨯⨯=. 构建答题模板:第一步:确定离散型随机变量的所有可能性; 第二步:求出每个可能性的概率; 第三步:画出随机变量的分布列; 第四步:求期望和方差;第五步:反复回顾,查看是否有重复或遗漏情况,明确规范书写答题.如本题可重点查看随机变量的所有可能值是否正确;根据分布列性质检查概率是否正确.模板二、二项分布及其应用(1)二项分布的特征:①在小范围内有放回的随机抽取或在大范围内任意随机抽取;②每次抽取相互独立;③每次抽取的可能性保持不变;(2)二项分布的题型:在n 次独立重复试验中,设事件A 发生的次数为X ,在每次试验中事件A 发生的概率为p ;(3)二项分布的分布列、期望与方差:①分布列:~(,)X B n p ,n 为试验次数,p 为试验成功率,()(1)k kn k n P X k C p p -==-,0,1,2,,k n =⋅⋅⋅,k ∈N ;②期望:()E X np =; ③()(1)D X np p =-.例2-2.某联欢晚会举行抽奖活动,举办方设置了甲、乙两种抽奖方案,方案甲的中奖率为23,中奖可以获得2分;方案乙的中奖率为25,中奖可以获得3分;未中奖则不得分.每人有且只有一次抽奖机会,每次抽奖中奖与否互不影响,晚会结束后凭分数兑换奖品.(1)若小明选择方案甲抽奖,小红选择方案乙抽奖,记他们的累计得分为X ,求3≤X 的概率; (2)若小明、小红两人都选择方案甲或都选择方案乙进行抽奖,问:他们选择何种方案抽奖,累计得分的数学期望较大?【解析】(1)由已知得,小明中奖的概率为23,小红中奖的概率为25,且两人中奖与否互不影响,记“这2人的累计得分3≤X ”的事件为A ,则事件A 的对立事件为“5X =”, ∵224(5)3515P X ==⨯=,∴11()1(5)15P A P X =-==, 即这两人的累计得分3≤X 的概率为1115; (2)设小明小红都选择方案甲抽奖中奖次数为1X ,都选择方案乙抽奖中奖次数为2X ,则这两人选择方案甲抽奖累计得分的数学期望为1()2E X ⨯, 选择方案乙抽奖累计得分的数学期望为2()3E X ⨯,由已知可得12~(2)3X B ,,22~(2)5X B ,,∴124()233E X =⨯=,224()255E X =⨯=,从而18()23E X ⨯=,212()35E X ⨯=,∴12()2()3E X E X ⨯>⨯,∴他们都选择方案甲进行抽奖时,累计得分的数学期望较大.模板三、统计概率的综合应用例2-3.某食品厂为了检查一条自动包装流水线的生产情况,随即抽取该流水线上40件产品作为样本算出他们的重量(单位:克)重量的分组区间为,(495500],,…,(510515],,由此得到样本的频率分布直方图,如图所示.(1)根据频率分布直方图,求重量超过505克的产品数量.(2)在上述抽取的40件产品中任取2件,设X 为重量超过505克的产品数量,求X 的分布列及期望.(3)在上述抽取的40件产品中任取5件产品,求恰有2件产品的重量超过505克的概率. 【解析】(1)重量超过505克的产品数量是40(0.0550.015)12⨯⨯+⨯=件; (2)X 的所有可能取值为0、1、2,021********(0)130C C P X C ⋅===,11122824056(1)130C C P X C ⋅===,20122824011(2)130C C P X C ⋅===, X 的分布列为:X 的期望561139()01213013013065E X =⨯+⨯+⨯=; (3)设在上述抽取的40件产品中任取5件产品,恰有2件产品的重量超过505克为事件A ,则322812540231()703C C P A C ⋅==. 变式1:第三问改为:从流水线上任取5件产品,设Y 为重量超过505克的产品数量,求Y 的分布列、期望、方差.【解析】从流水线上任取5件产品服从二项分布:Y 可取:0、1、2、3、4、5;超过505克的产品发生的概率为0.3p =,则~(50.3)Y B ,, 005055(0)(1)0.70.16807P Y C p p -==-==, 115111455(1)(1)0.30.70.36015P Y C p p C -==-=⨯=,225222355(2)(1)0.30.70.3087P Y C p p C -==-=⨯=,335333255(3)(1)0.30.70.1323P Y C p p C -==-=⨯=,44544455(4)(1)0.30.70.02835P Y C p p C -==-=⨯=,555555(5)(1)0.30.00243P Y C p p -==-==,则Y 的分布列为:Y 的期望()50.3 1.5E Y =⨯=,方差()50.30.7 1.05D Y =⨯⨯=.变式2:某食品厂为了检查甲乙两条自动包装流水线的生产情况,随即在这两条抽流水线上各抽取40件产品作为样本算出他们的重量(单位:克).重量落在(495510],的产品为合格品,否则为不合格.表一为甲流水线样本频率分布表,图一为乙流水线样本的频率分布直方图.(1)根据上表数据在答题卡上作出甲流水线样本的频率分布直方图;(2)若以频率作为概率,试估计从乙流水线上任取5件产品,恰有3件产品为合格品的概率;(3)由以上统计数据完成下面22⨯列联表,并回答有多大的把握认为“产品的包装质量与两条自动包装流水线的选择有关”.附:下面的临界值表供参考:(参考公式:22()()()()()n ad bcKa b a c c d b d-=++++,其中n a b c d=+++).在平面直角坐标系中做出频率分布直方图,甲流水线样本的频率分布直方图如下:(2)由图1知,乙样本中合格品为:(0.060.090.03)54036++⨯⨯=,故合格品的频率为360.940=, ∴可估计从乙流水线上任取一件产品该产品为合格品的概率0.9P =,设ξ为从乙流水线上任取5件产品中的合格品数,则~(50.9)B ξ,, ∴3325(3)0.90.10.0729P C ξ===,即从乙流水线上任取5件产品,恰有3件产品为合格品的概率为0.0729; (3)22⨯列联表如下:∵22()80(120360) 3.117 2.706()()()()66144040n ad bc K a b a c c d b d -⨯-==≈>++++⨯⨯⨯, ∴有90%的把握认为“产品的包装质量与两条自动包装流水线的选择有关”.课后作业1. 某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.)(1)根据茎叶图,帮助这位学生说明其亲属30人的饮食习惯;(2)根据以上数据完成下列22⨯列联表:(3)能否有99%的把握认为其亲属的饮食习惯与年龄有关,并写出简要分析.【答案】(1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主;(2)表格见解析;(3)有,分析见解析.【解析】【分析】(1)根据茎叶图,分析题中数据即可得出结果.(2)根据茎叶图,补充完善列联表,计算观测值即可求解.【详解】(1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主;(2)补全22⨯列联表:(3)230(42168)10 6.63512182010K ⨯⨯-⨯==>⨯⨯⨯,有99%的把握认为其亲属的饮食习惯与年龄有关.2. 某网站就“民众是否支持加大修建城市地下排水设施的资金投入”进行投票.按照北京暴雨前后两个时间收集有效投票,暴雨后的投票收集了50份,暴雨前的投票也收集了50份,所得统计结果如下表:已知工作人员从所有投票中任取一个,取到“不支持投入”的投票的概率为25. (1)求列联表中的数据x 、y 、A 、B 的值;(2)绘制条形统计图,通过图形判断本次暴雨是否影响到民众对加大修建城市地下排水设施的投入的态度?(3)能够有多大把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关? 【答案】(1)40x =,10y =,60A =,40B =;(2)条形统计图答案见解析,暴雨影响到民众对加大修建城市地下排水设施的投入的态度;(3)有99.9%把握.【解析】【分析】(1)先求出y的值,再求,,B x A的值;(2)先求出暴雨前后的支持率和不支持率,画出条形统计图,再通过图形判断本次暴雨是否影响到民众对加大修建城市地下排水设施的投入的态度.(3)利用独立性检验求解即可.【详解】(1)设“从所有投票中抽取一个,取到不支持投入的投票”为事件A,由已知得302()1005yP A+==,∴10y=,40B=,40x=,60A=;(2)由(1)知北京暴雨后支持为404505=,不支持率为41155-=,北京暴雨前支持率为202505=,不支持率为23155-=,条形统计图如图:由图可以看出暴雨影响到民众对加大修建城市地下排水设施的投入的态度;(3)22100(30402010)5016.7810.828505040603K⨯⨯-⨯==≈>⨯⨯⨯,故至少有99.9%把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关.【点睛】方法点睛:独立性检验的解题步骤:(1)2*2列联表;(2)提出假设:设p与q没有关系;(3)根据列联表中的数据2K计算的值;(4)根据计算得到的随机变量2K的观测值作出判断.3. 电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的22⨯列联表,并据此资料判断是否有95%的把握认为“体育迷”与性别有关?(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:22()()()()()n ad bcKa b a c c d b d-=++++【答案】(1)列联表答案见解析,没有95%的把握认为“体育迷”与性别有关;(2)7 10 .【解析】 【分析】(1)根据频率分布直方图,计算体育迷的人数,再结合条件依次填入22⨯列联表,并计算2K ,并和临界值3.841比较后进行判断;(2)首先由频率分布直方图计算“超级体育迷”的人数,在通过编号列举的方法,利用古典概型的计算公式计算概率.【详解】(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而完成22⨯列联表如下:将22⨯列联表中的数据代入公式计算,得22100(30104515)100 3.030 3.8417525455533K ⨯⨯-⨯==≈<⨯⨯⨯,∴没有95%的把握认为“体育迷”与性别有关;(2)由频率分布直方图可知“超级体育迷”为5人,设123,,a a a 是3名男超级体育迷,12,b b 是2名女超级体育迷,从而一切可能结果所组成基本事件为:12()a a ,、13()a a ,、23()a a ,、11()a b ,、12()a b ,、 21()a b ,、22()a b ,、31()a b ,、32()a b ,、12()b b ,,则由10个基本事件组成,而且这些基本事件的出现是等可能的, 用A 表示“任选2人中,至少有1人是女性”这一事件,则A 由11()a b ,、12()a b ,、21()a b ,、22()a b ,、31()a b ,、32()a b ,、12()b b , 这7个基本事件组成,因而7()10P A =.4. 2015年7月9日21时15分,台风“莲花”在我国广东省陆丰市甲东镇沿海登陆,给当地人民造成了巨大的财产损失,适逢暑假,大学生小张调查了当地某小区的100户居民由于台风造成的经济损失,将收集的数据分成[02000),、[2000,4000)、[4000,6000)、[6000,8000)、[800010000],五组作出频率分布直方图,如图:(1)台风后居委会号召小区居民为台风重灾区捐款,小张调查的100户居民捐款情况如表格,在表格空白处填写正确数字,并说明是否有95%以上的把握认为捐款数额多于或少于500元和自身经济损失是否到4000元有关?(2)将上述调查所得到的频率视为概率.现在从该地区大量受灾居民中,采用随机抽样方法每次抽取1户居民,抽取3次,记被抽取的3户居民中自身经济损失超过4000元的人数为ξ.若每次抽取的结果是相互独立的,求ξ的分布列,期望()E ξ和方差()D ξ.【答案】(1)答案见解析,有;(2)分布列见解析,()0.9E ξ=,()0.63D ξ=. 【解析】【分析】(1)由频率分布直方图可求出抽取的100户中,经济损失不超过4000元的户数,经济损失超过4000元的户数, 从而可补全列联表,进而可求出2K ,得出结论;(2)由题意知ξ的取值可能有0、1、2、3,符合二项分布,则3~(3)10B ξ,,从而利用二项分布的概率公式求出各自对应的概率,进而可得ξ的分布列,期望()E ξ和方差()D ξ. 【详解】(1)由频率分布直方图可知,在抽取的100户中,经济损失不超过4000元的有1002000(0.000150.00020)70⨯⨯+=户,则经济损失超过4000元的有30户, 则表格数据如下:22100(60102010) 4.76280207030K ⨯⨯-⨯=≈⨯⨯⨯,∵4.762 3.841>,2( 3.841)0.05P K ≥=,∴有95%以上把握认为捐款数额是否多于或少于500元和自身经济损失是否到4000元有关; (2)由频率分布直方图可知抽到自身经济损失超过4000元居民的频率为0.3,将频率视为概率,由题意知ξ的取值可能有0、1、2、3,符合二项分布,则3~(3)10B ξ,,003337343(0)()()10101000P C ξ==⋅⋅=,112337441(1)()()10101000P C ξ==⋅⋅=,221337189(2)()()10101000P C ξ==⋅⋅=,33033727(3)()()10101000P C ξ==⋅⋅=,从而ξ的分布列为:3()30.910E np ξ==⨯=,37()(1)30.631010D np p ξ=-=⨯⨯=. 5. 私家车的尾气排放是造成雾霾天气的重要因素之一,因此在生活中我们应该提倡低碳生活,少开私家车,尽量选择绿色出行方式,为预防雾霾出一份力.为此,很多城市实施了机动车车尾号限行,我市某报社为了解市区公众对“车辆限行”的态度,随机抽查了50人,将调查情况进行整理后制成下表:(1)完成被调查人员的频率分布直方图.(2)若从年龄在[15,25)([25,35)的被调查者中各随机选取2人进行追踪调查,求恰有2人不赞成的概率.(3)在(2)在条件下,再记选中的4人中不赞成...“车辆限行”的人数为ξ,求随机变量ξ的分布列和数学期望.【答案】(1)见解析(2(2275(3)见解析 【解析】【详解】试题分析:(1)根据频率等于频数除以总数,再求频率与组距之比得纵坐标,画出对应频率分布直方图.(2)先根据2人分布分类,再对应利用组合求概率,最后根据概率加法求概率,(3)先确定随机变量,再根据组合求对应概率,列表可得分布列,最后根据数学期望公式求期望. 试题解析:(1((2(由表知年龄在[)15,25内的有5人,不赞成的有1人,年龄在[)25,35 内的有10人,不赞成的有4人,恰有2人不赞成的概率为:()11122464442222510510C C C C C 4246666222C C C C 1025104522575P ξ==⋅+⋅=⋅+⋅==((3( ξ的所有可能取值为:0(1(2(3(()226422510C C 45150C C 22575P ξ==⋅==(()21112646442222510510C C C C C 415624102341C C C C 1045104522575P ξ⋅==⋅+⋅=⋅+⋅==( ()124422510C C 461243C C 104522575P ξ==⋅=⋅==( 所以ξ的分布列是:所以ξ的数学期望5E ξ=( 6. 某商场举行的“三色球”购物摸奖活动规定:在一次摸奖中,摸奖者先从装有3个红球与4个白球的袋中任意摸出3个球,再从装有1个蓝球与2个白球的袋中任意摸出1个球,根据摸出4个球中红球与蓝球的个数,设一、二、三等奖如下:其余情况无奖且每次摸奖最多只能获得一个奖级.(1)求一次摸奖恰好摸到1个红球的概率;(2)求摸奖者在一次摸奖中获奖金额x的分布列与期望E(x).【答案】(1)(2)X的分布列为EX==4元【解析】【详解】(1)设A i表示摸到i个红球,B i表示摸到i个蓝球,则与相互独立(i=0,1,2,3)∴P(A1)==(2)X的所有可能取值为0,10,50,200P(X=200)=P(A3B1)=P(A3)P(B1)=P(X=50)=P(A3)P(B0)==P(X=10)=P(A2)P(B1)==P(X=0)=1﹣=∴X的分布列为EX==4元7. 以下茎叶图记录了甲、乙两组个四名同学的植树棵树、乙组记录中有一个数据模糊,无法确认,在图中以X表示.(1)如果8X=,求乙组同学植树棵树的平均数和方差;(2)如果9X=,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵树Y的分布列和数学期望.【答案】(1)平均数为354,方差为1116;(2)分布列答案见解析,数学期望:19.【解析】【分析】(1)利用平均数和方差公式求出即可;(2)根据题意可得Y 的可能取值为17,18,19,20,21,分别求出Y 取不同值的概率,即可得出分布列,求出期望.【详解】(1)当8X =时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10, ∴平均数为889103544x +++==,方差为2222213535353511[(8)(8)(9)(10)]4444416s =-+-+-+-=;(2)当9X =时,由茎叶图可知,甲组同学的植树棵树是:9,9,11,11, 乙组同学的植树棵数是:9,8,9,10,分别从甲、乙两组中随机选取一名同学,共有4416⨯=种可能的结果, 这两名同学植树总棵数Y 的可能取值为17,18,19,20,21,事件“17Y =”等价于“甲组选出的同学植树9棵,乙组选出的同学植树8棵”, ∴该事件有2种可能的结果,21(17)168P Y ===, 事件“18Y =”等价于“甲组选出的同学植树9棵,乙组选出的同学植树9棵”, ∴该事件有4种可能的结果,41(18)164P Y ===, 事件“19Y =”等价于“甲组选出的同学植树9棵,乙组选出的同学植树10棵, 或甲组选出的同学植树11棵,乙组选出的同学植树8棵”, ∴该事件有224+=种可能的结果,41(19)164P Y ===, 事件“20Y =”等价于“甲组选出的同学植树11棵,乙组选出的同学植树9棵”, ∴该事件有4种可能的结果,41(20)164P Y ===, 事件“21Y =”等价于“甲组选出的同学植树11棵,乙组选出的同学植树10棵”, ∴该事件有2种可能的结果,21(21)168P Y ===,∴随机变量Y 的分布列为:∴11()17181920211984448E Y =⨯+⨯+⨯+⨯+⨯=.8. 语文成绩服从正态分布2(100,17.5)N ,数学成绩的频率分布直方图如图,如果成绩大于135的则认为特别优秀.(1)这500名学生中本次考试语文、数学特别优秀的大约各多少人?(2)如果语文和数学两科都特别优秀的共有6人,从(1)中的这些同学中随机抽取3人,设三人中两科都特别优秀的有X 人,求X 的分布列和数学期望.(附公式:若2~(,)X N μσ,则()0.68P X μσμσ-<≤+=,(22)0.96P X μσμσ-<≤+=).【答案】(1)语文有10人,数学有12人;(2)分布列见解析,98.【解析】【分析】(1)利用正态分布的对称性求出语文成绩特别优秀的概率,从而可估计出语文成绩特别优秀人数,由频率分布直方图可求出数学成绩特别优秀的频率,用频率来衡量概率,从而可求出数学成绩特别优秀的人数;(2)结合(1)可知数学语文单科优秀的有10人,则X 的所有可能取值为0、1、2、3,然后求出各自对应的概率即可列出分布列,求得数学期望【详解】(1)∵语文成绩服从正态分布2(10017.5)N ,,∴语文成绩特别优秀概率为11(135)(10.96)0.022P P X =≥=-⨯=, ∴数学成绩特别优秀的概率为230.0016200.0244P =⨯⨯=, ∴语文特别优秀的同学有5000.0210⨯=人,数学特别优秀的同学有5000.02412⨯=人; (2)语文数学两科都优秀的有6人,单科优秀的有10人,X 的所有可能取值为0、1、2、3,3103163(0)14C P X C ===,2110631627(1)56C C P X C ⋅===, 1210631615(2)56C C P X C ⋅===,363161(3)28C P X C ===, ∴X 的分布列为:19()0123145656288E X =⨯+⨯+⨯+⨯=. 9. 张明要参加某单位组织的招聘面试.面试要求应聘者有7次选题答题的机会(选一题答一题),若答对4题即终止答题,直接进入下一轮,否则被淘汰.已知张明答对每一道题的概率都为12. (1)求张明进入下一轮的概率;(2)设张明在本次面试中答题的个数为ξ,试写出ξ的分布列,并求ξ的数学期望. 【答案】(1)12;(2)分布列答案见解析,数学期望:9316. 【解析】 【分析】(1)分情况讨论张明进入下一轮的概率;(2)由条件可知4,5,6,7ξ=,理解随机变量对应的事件,写出概率分布列,计算数学期望.。
高中数学复习典型题专题训练118---频率直方图
高中数学复习典型题专题训练118频率直方图列出样本数据的频率分布表和频率分布直方图的步骤: ①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:取组距,用极差组距决定组数;③决定分点:决定起点,进行分组;④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图,知小长方形的面积=组距×频率组距=频率.频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x 来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.题型一 频率分布直方图【例1】 (2010西城二模)某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.知识内容典例分析板块二.频率直方图则这200名同学中成绩大于等于80分且小于90分的学生有______名.【例2】 (2010东城二模)已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内的样本频数为 ,样本数据落在[2,10)内的频率为 .【例3】 (2010北京)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a = .若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[]140,150内的学生中选取的人数应为 .【例4】 (2010江苏高考)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[]540,中,其频率分布直方图如图所示,则其抽样的100根中,有____根在棉花纤维的长度小于20mm .(mm)频率组距【例5】 (2009湖北15)下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[)610,内的频数为 ,数据落在[)210,内的概率约为 .【例6】 (2009福建3)A .0.13B .0.39C .0.52D .0.64【例7】 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( )时间(h)A .0.6hB .0.9hC .1.0hD .1.5h【例8】 为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[)4555,,[)5565,,[)6575,,[)7585,,[)8595,由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)5575,的人数是 .产品数量0.0200.0150.0100.005【例9】 (2009山东8)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96106],,样本数据分组为[)9698,,[)98100,,[)100102,,[)102104,,[104106],.已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A .90B .75C .60D .45【例10】 某路段检查站监控录象显示,在某时段内,有1000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为右图的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90km/h 的车辆数为( )A .200B .600C .500D .300【例11】 (2006年全国II )一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本频率分布直方图,为了分析居民的收入与年龄、学历、职业等方面的联系,要从这10000人中用分层抽样的方法抽出100人做进一步调查,则在[25003000],(元)月收入段应抽出_____人.0.00050.00040.00030.00020.0001频率组距月收入(元)【例12】 如图为某样本数据的频率分布直方图,则下列说法不正确的是( )频率A .[610),的频率为0.32 B .若样本容量为100,则[1014),的频数为40 C .若样本容量为100,则(10] ,的频数为40 D .由频率分布布直方图可得出结论:估计总体大约有10%分布在[1014),【例13】 (2006北京模拟)下面是某学校学生日睡眠时间的抽样频率分布表:【例14】 (2010崇文一模)为了调查某厂2000名工人生产某种产品的能力,随机抽查了m 位工人某天生产该产品的数量,产品数量的分组区间为[)10,15,[)15,20,[)20,25,[)25,30,[30,35],频率分布直方图如图所示.已知生产的产品数量在[)20,25之间的工人有6位. ⑴求m ; 10 15 20 25 30 35产品数量⑵工厂规定从各组中任选1人进行再培训,则选取5人不在同一组的概率是多少?【例15】 考查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm )如下:⑴ 作出频率分布表; ⑵ 画出频率分布直方图.【例16】(2010陕西卷高考)为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行出样检查,测得身高情况的统计图如下:/cm/cm⑴估计该小男生的人数;⑵估计该校学生身高在170~185cm之间的概率;⑶从样本中身高在165~180cm之间的女生..中任选2人,求至少有1人身高在170~180cm 之间的概率.【例17】从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表,画出频率分布直方图及折线图,并根据作出的频率分布直方图估计身高不小于170的同学的人数.【例18】为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如下图),已知图中从左到右的前三个小组的频率分别是0.10.30.4,,.第一小组的频数是5.⑴求第四小组的频率和参加这次测试的学生人数;⑵在这次测试中,学生跳绳次数的中位数落在第几小组内?⑶参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩优秀率是多少?O频率组距次数149.5124.599.574.549.5【例19】 为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛. 为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计. 请你根据尚未完成并有局部污损的频率分布表和频数分布直方图,解答下列问题:⑴ 填充频率分布表的空格(将答案直接填在表格内); ⑵ 补全频数条形图;⑶ 若成绩在75.5~85.5分的学生为二等奖,问获得二等奖的学生约为多少人?【例20】 (2010丰台一模)某校高三(1)班的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题.85987654322198653328698765叶茎1009080706050分数频率组距0.040.0280.0160.008⑴求全班人数及分数在[)80,90之间的频数;⑵估计该班的平均分数,并计算频率分布直方图中[)80,90间的矩形的高;⑶若要从分数在[]80,100之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在[]90,100之间的概率.【例21】某地区为了了解70~80岁老人的日平均睡眠时间(单位:h).随机选择了50位老人的进行调查.下表是这50位老人日睡眠时间的频率分布表.在上述统计数据中,一部分计算见算法流程图(其中←可用=代替),则输出的S的值是.。
频率分布直方图考试题(汇编)
频率分布直方图北鲲五班练习题1.用样本估计总体,下列说法正确的是()A.样本的结果就是总体的结果B.样本容量越大,估计就越精确C.样本的标准差可以近似地反映总体的平均状态D.数据的方差越大,说明数据越稳定2.一支田径队有男队员56人,女队员42人,用分层抽样的方法从全体运动员中抽出一个容量为28的样本,则应抽取男队员的人数为()A.12 B.14 C.16 D.183.某学校有教职工共160人,其中有教师104人,管理人员32人,后勤服务人员24人,要从中抽取一个容量为20的样本,用分层抽样的方法抽取样本,则在20人的样本中应抽取后勤人员的人数为( )A. 3B. 4C. 5D. 64.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人.为了了解该单位职工的健康情况,决定采用分层抽样的方法,从中抽取容量为15的样本.则从上述各层中依次抽取的人数分别是()A. 8,4,3B. 6,5,4C. 7,5,3D. 8,5,25. 某协会有200名会员,现要从中抽取40名会员作样本,采用系统抽样法等间距抽取样本,将全体会员随机按1~200编号,并按编号顺序平均分为40组(1-5号,6-10号,…,196-200号).若第5组抽出的号码为22,则第1组至第3组抽出的号码依次是()A. 3,8,13B. 2,7,12C. 3,9,15D. 2,6,126.一个容量为n的样本,分成若干组,已知某组的频数和频率分别是40,0.125,则n的值为A. 640B.320C.240D. 1607.个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为.A. 2B. 4C. 6D. 8 ( )8.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为( )A.45,75,15B. 45,45,45C.30,90,15D. 45,60,309.某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,则老年人、中年人、青年人分别各抽取的人数是( )A. 6,12,18B. 7,11,19C. 6,13,17D. 7,12,1710.某班的78名同学已编号1,2,3,…,78,为了解该班同学的作业情况,老师收取了学号能被5整除的15名同学的作业本,这里运用的抽样方法是( ).A.简单随机抽样法B.系统抽样法C.分层抽样法D.抽签法11.某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为2 :3 :5.现用分层抽n样方法抽出一个容量为n的样本,样本中A种型号产品有16件,那么此样本的容量12.某学校共有教师490人,其中不到40岁的有350人,40岁及以上的有140人,为了解普通话在该校教师中的推广普及情况,用分层抽样的方法,从全体教师中抽取一个容量为70人的样本进行普通话水平测试,其中不到40岁的教师中应抽取的人数是___________.13.在某次学生考试的成绩中随机抽取若干学生的成绩,分组与各组的频数如下:[40,50),4;[50,60),1;[60,70),10;[70,80),11;[80,90),18;[90,100),6,估计本次考试的及格率为__________ . 14.把容量是100的样本分成8组,从第1组到第4组的频数分别是15,17,11,13,第5组到第7组的频率之和是0.32,那么第8组的频率是.15.《中华人民共和国道路交通安全法》 规定:车辆驾驶员血液酒精浓度在20~80 mg/100mL (不含80)之间,属于酒后驾车;血液酒精浓度在80mg/100mL (含80)以上时,属醉酒驾车。
历年高考数学真题精选40 频率分布直方图
高考数学真题精选(按考点分类)专题40 频率分布直方图(学生版)一.选择题(共2小题)1.(2016•山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140A.6B.8C.12D.18二.填空题(共2小题)3.(2015•湖北)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a .(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.4.(2014•江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:)cm,所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm.三.解答题(共8小题)5.(2019•新课标Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).m和使6.(2018•新课标Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:3)用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于30.35m的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)7.(2017•北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20, ,90],并整理得到如下频率分布直方图:30),[30,40),[80(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.8.(2017•新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:)kg,其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50kg箱产量50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较.附:2P K K0.0500.0100.001()K 3.841 6.63510.82822()()()()()n ad bc K a b c d a c b d -=++++. 9.(2016•四川)我国是世界上严重缺水的国家.某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),⋯,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(Ⅰ)求直方图中a 的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (Ⅲ)估计居民月均水量的中位数.10.(2016•北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如图频率分布直方图:(1)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当3w =时,估计该市居民该月的人均水费.11.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?12.(2015•新课标Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100)频数2814106(1)做出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个不等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.历年高考数学真题精选(按考点分类)专题40 频率分布直方图(教师版)一.选择题(共2小题)1.(2016•山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140【答案】D【解析】自习时间不少于22.5小时的频率为:(0.160.080.04) 2.50.7++⨯=,故自习时间不少于22.5小时的频数为:0.7200140⨯=A.6B.8C.12D.18【答案】C【解析】由直方图可得分布在区间第一组与第二组共有20人,分布在区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人,第三组的频率为0.36,所以第三组的人数:18人,第三组中没有疗效的有6人,第三组中有疗效的有12人.二.填空题(共2小题)3.(2015•湖北)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=.(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.【答案】(1)3 (2)6000【解析】(1)由题意,根据直方图的性质得(1.5 2.5 2.00.80.2)0.11+++++⨯=,解得3aa=(2)由直方图得(3 2.00.80.2)0.1100006000+++⨯⨯=4.(2014•江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:)cm,所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm.【答案】24【解析】由频率分布直方图知:底部周长小于100cm的频率为(0.0150.025)100.4+⨯=,⨯=(株).∴底部周长小于100cm的频数为600.424三.解答题(共8小题)5.(2019•新课标Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解:(1)C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.则由频率分布直方图得:0.200.150.70.050.1510.7ab++=⎧⎨++=-⎩,解得乙离子残留百分比直方图中0.35a=,0.10b=.(2)估计甲离子残留百分比的平均值为:20.1530.2040.3050.2060.1070.05 4.05x=⨯+⨯+⨯+⨯+⨯+⨯=甲.乙离子残留百分比的平均值为:30.0540.150.1560.3570.280.15 6.00x=⨯+⨯+⨯+⨯+⨯+⨯=乙.6.(2018•新课标Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:3)m和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于30.35m的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)【解答】解:(1)根据使用了节水龙头50天的日用水量频数分布表,作出使用了节水龙头50天的日用水量数据的频率分布直方图,如下图:(2)根据频率分布直方图得:该家庭使用节水龙头后,日用水量小于30.35m 的概率为: (0.2 1.0 2.61)0.10.48p =+++⨯=.(3)由题意得未使用水龙头50天的日均水量为:1(10.0530.1520.2540.3590.45260.5550.65)0.4850⨯+⨯+⨯+⨯+⨯+⨯+⨯=, 使用节水龙头50天的日均用水量为:1(10.0550.15130.25100.35160.4550.55)0.3550⨯+⨯+⨯+⨯+⨯+⨯=, ∴估计该家庭使用节水龙头后,一年能节省:3365(0.480.35)47.45m ⨯-=.7.(2017•北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),[80⋯,90],并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解:(Ⅰ)由频率分布直方图知:分数小于70的频率为:1(0.040.02)100.4-+⨯=故从总体的400名学生中随机抽取一人,估计其分数小于70的概率为0.4;(Ⅱ)已知样本中分数小于40的学生有5人,故样本中分数小于40的频率为:0.05,则分数在区间[40,50)内的频率为:1(0.040.020.020.01)100.050.05-+++⨯-=,估计总体中分数在区间[40,50)内的人数为4000.0520⨯=人,(Ⅲ)样本中分数不小于70的频率为:0.6,由于样本中分数不小于70的男女生人数相等.故分数不小于70的男生的频率为:0.3,由样本中有一半男生的分数不小于70,故男生的频率为:0.6,即女生的频率为:0.4,即总体中男生和女生人数的比例约为:3:2.8.(2017•新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:)kg,其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50kg <箱产量50kg旧养殖法 新养殖法(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较. 附:2()P K K0.050 0.010 0.001 K3.8416.63510.8282()()()()()n ad bc K a b c d a c b d -=++++. 解:(1)根据题意,由旧养殖法的频率分布直方图可得:P (A )(0.0120.0140.0240.0340.040)50.62=++++⨯=;(2)根据题意,补全列联表可得:箱产量50kg <箱产量50kg总计 旧养殖法 62 38 100 新养殖法 34 66 100 总计96104200则有2200(62663834)15.705 6.63510010096104K ⨯-⨯=≈>⨯⨯⨯, 故有99%的把握认为箱产量与养殖方法有关; (3)由频率分布直方图可得: 旧养殖法100个网箱产量的平均数1(27.50.01232.50.01437.50.02442.50.03447.50.04052.50.03257.50.0262.50.01267.50.012)559.4247.1x =⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯⨯=⨯=; 新养殖法100个网箱产量的平均数2(37.50.00442.50.02047.50.04452.50.05457.50.04662.50.01067.50.008)5510.4752.35x =⨯+⨯+⨯+⨯+⨯+⨯+⨯⨯=⨯=;比较可得:12x x <,故新养殖法更加优于旧养殖法.9.(2016•四川)我国是世界上严重缺水的国家.某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),⋯,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(Ⅰ)求直方图中a 的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (Ⅲ)估计居民月均水量的中位数.解:()1(0.080.160.400.520.120.080.04)0.5I a a =++++++++⨯, 整理可得:2 1.42a =+,∴解得:0.3a =.()II 估计全市居民中月均用水量不低于3吨的人数为3.6万,理由如下:由已知中的频率分布直方图可得月均用水量不低于3吨的频率为(0.120.080.04)0.50.12++⨯=,又样本容量为30万,则样本中月均用水量不低于3吨的户数为300.12 3.6⨯=万. (Ⅲ)根据频率分布直方图,得;0.080.50.160.50.300.50.420.50.480.5⨯+⨯+⨯+⨯=<,+⨯=>,0.480.50.50.740.5∴中位数应在[2,2.5)组内,设出未知数x,令0.080.50.160.50.300.50.420.50.50.5⨯+⨯+⨯+⨯+⨯=,x解得0.04x=;+=.∴中位数是20.04 2.0410.(2016•北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如图频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当3w=时,估计该市居民该月的人均水费.解:(1)由频率分布直方图得:用水量在[0.5,1)的频率为0.1,用水量在[1,1.5)的频率为0.15,用水量在[1.5,2)的频率为0.2,用水量在[2,2.5)的频率为0.25,用水量在[2.5,3)的频率为0.15,用水量在[3,3.5)的频率为0.05,用水量在[3.5,4)的频率为0.05,用水量在[4,4.5)的频率为0.05,用水量小于等于3立方米的频率为85%,∴为使80%以上居民在该用的用水价为4元/立方米,w∴至少定为3立方米.(2)当3w=时,该市居民的人均水费为:(0.110.15 1.50.220.25 2.50.153)40.05340.050.5100.05340.051100.05340.05 1.51010.5⨯+⨯+⨯+⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=,∴当3w=时,估计该市居民该月的人均水费为10.5元.11.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?解:(1)由直方图的性质可得(0.0020.00950.0110.01250.0050.0025)201x++++++⨯=,解方程可得0.0075x=,∴直方图中x的值为0.0075;(2)月平均用电量的众数是2202402302+=,(0.0020.00950.011)200.450.5++⨯=<,∴月平均用电量的中位数在[220,240)内,设中位数为a,由(0.0020.00950.011)200.0125(220)0.5a++⨯+⨯-=可得224a=,∴月平均用电量的中位数为224;(3)月平均用电量为[220,240)的用户有0.01252010025⨯⨯=,月平均用电量为[240,260)的用户有0.00752010015⨯⨯=,月平均用电量为[260,280)的用户有0.0052010010⨯⨯=,月平均用电量为[280,300)的用户有0.0025201005⨯⨯=,∴抽取比例为111 25151055=+++,∴月平均用电量在[220,240)的用户中应抽取12555⨯=户.12.(2015•新课标Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100)频数2814106(1)做出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个不等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.解:(Ⅰ)通过两个地区用户满意度评分的频率分布直方图可以看出,B 地区用户满意度评分的平均值高于A 地区用户满意度评分的平均值,B 地区的用户满意度评分的比较集中,而A 地区的用户满意度评分的比较分散.(Ⅱ)A 地区用户的满意度等级为不满意的概率大.记A C 表示事件:“A 地区用户的满意度等级为不满意”, B C 表示事件:“B 地区用户的满意度等级为不满意”,由直方图得()(0.010.020.03)100.6A P C =++⨯= 得()(0.0050.02)100.25B P C =+⨯=A ∴地区用户的满意度等级为不满意的概率大.。
专题3.5频率分布直方图与数字特征-2021年高考数学(理)备考之百强校大题狂练系列(解析版)
一、解答题1.全世界越来越关注环境保护问题,某监测站点于2018年1月某日起连续天监测空气质量指数(),数据统计如下:空气质量指数()空气质量等级空气优空气良轻度污染中度污染重度污染天数2040105(1)根据所给统计表和频率分布直方图中的信息求出,的值,并完成频率分布直方图;(2)由频率分布直方图,求该组数据的众数和中位数;(3)在空气质量指数分别属于和的监测数据中,用分层抽样的方法抽取天,再从中任意选取天,求事件“两天空气都为良”发生的概率.【答案】(1)答案见解析;(2)答案见解析;(3).解析:(1)∵,∴,∵,∴,;;;.(2)众数为120.中位数为.点睛:本题考查频率分布直方图的应用,考查概率的求法,考查推理论证能力、运算求解能力、数据处理能力,考查化归与转化思想、数形结合思想.2.从某校高三的学生中随机抽取了100名学生,统计了某次数学模考考试成绩如表:(1)请在频率分布表中的①、②位置上填上相应的数据,并在给定的坐标系中作出这些数据的频率分布直方图,再根据频率分布直方图估计这100名学生的平均成绩;(2)从这100名学生中,采用分层抽样的方法已抽取了 20名同学参加“希望杯数学竞赛”,现需要选取其中3名同学代表高三年级到外校交流,记这3名学生中“期中考试成绩低于120分”的人数为,求的分布列和数学期望.【答案】(1)见解析;(2)见解析【解析】分析:(1)利用总频数为和频率和为得到①②的值,再根据频率分布表中的数据绘制频率分布直方图.详解:(1),.频率分布表为:分组频数频率频率分布直方图为:平均成绩为分.(2)成绩低于分的人数为人,不低于分的人数为人,∴的所有可能取值为且,,.∴的分布列为:∴.点睛:根据频率分布表绘制频率分布直方图时,注意小矩形的高是频率除以组距,各小矩形的面积和为.计算随机变量的分布列时,注意利用常见模型计算概率,如二项分布、超几何分布等.学科&网3.中国海军,正在以不可阻挡的气魄向深蓝进军。
高中数学专题讲义-频率直方图
一.随机抽样1.随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法:⑴简单随机抽样:从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. 抽出办法:①抽签法:用纸片或小球分别标号后抽签的方法.②随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表.表中每一位置出现各个数字的可能性相同. 随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法.简单随机抽样是最简单、最基本的抽样方法.⑵系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.抽出办法:从元素个数为N 的总体中抽取容量为n 的样本,如果总体容量能被样本容量整除,设Nk n=,先对总体进行编号,号码从1到N ,再从数字1到k 中随机抽取一个数s 作为起始数,然后顺次抽取第2(1)s k s k s n k +++-L ,,,个数,这样就得到容量为n 的样本.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样.系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样.⑶分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样.分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛.2.简单随机抽样必须具备下列特点:⑴简单随机抽样要求被抽取的样本的总体个数N 是有限的. ⑵简单随机样本数n 小于等于样本总体的个数N . ⑶简单随机样本是从总体中逐个抽取的. ⑷简单随机抽样是一种不放回的抽样.⑸简单随机抽样的每个个体入样的可能性均为nN.3.系统抽样时,当总体个数N 恰好是样本容量n 的整数倍时,取Nk n=;若Nn不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量n 整除.因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍知识内容板块二.频率直方图然相等,为N n.二.频率直方图列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:取组距,用极差组距决定组数;③决定分点:决定起点,进行分组;④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图,知小长方形的面积=组距×频率组距=频率.频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x =来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.三.茎叶图制作茎叶图的步骤:①将数据分为“茎”、“叶”两部分;②将最大茎与最小茎之间的数字按大小顺序排成一列,并画上竖线作为分隔线; ③将各个数据的“叶”在分界线的一侧对应茎处同行列出.四.统计数据的数字特征用样本平均数估计总体平均数;用样本标准差估计总体标准差. 数据的离散程序可以用极差、方差或标准差来描述.极差又叫全距,是一组数据的最大值和最小值之差,反映一组数据的变动幅度; 样本方差描述了一组数据平均数波动的大小,样本的标准差是方差的算术平方根. 一般地,设样本的元素为12n x x x L ,,,样本的平均数为x , 定义样本方差为222212()()()n x x x x x x s n-+-++-=L ,样本标准差s =简化公式:22222121[()]n s x x x nx n=+++-L .五.独立性检验1.两个变量之间的关系;常见的有两类:一类是确定性的函数关系;另一类是变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的.当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系. 2.散点图:将样本中的n 个数据点()(12)i i x y i n =L ,,,,描在平面直角坐标系中,就得到了散点图.散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系.3.如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域.反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.此时,散点图中的点在从左上角到右下角的区域.散点图可以判断两个变量之间有没有相关关系.4.统计假设:如果事件A 与B 独立,这时应该有()()()P AB P A P B =,用字母0H 表示此式,即0:()()()H P AB P A P B =,称之为统计假设. 5.2χ(读作“卡方”)统计量:统计学中有一个非常有用的统计量,它的表达式为22112212211212()n n n n n n n n n χ++++-=,用它的大小可以用来决定是否拒绝原来的统计假设0H .如果2χ的值较大,就拒绝0H ,即认为A 与B 是有关的.2χ统计量的两个临界值:3.841、6.635;当2 3.841χ>时,有95%的把握说事件A 与B 有关;当2 6.635χ>时,有99%的把握说事件A 与B 有关;当2 3.841χ≤时,认为事件A 与B 是无关的.独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立的. 1.独立性检验的步骤:统计假设:0H ;列出22⨯联表;计算2χ统计量;查对临界值表,作出判断.2.几个临界值:222()0.10( 3.841)0.05( 6.635)0.01P P P χχχ≈≈≈≥2.706,≥,≥.22⨯联表的独立性检验:如果对于某个群体有两种状态,对于每种状态又有两个情况,这样排成一张22⨯的表,如下:如果有调查得来的四个数据11122122n 4个数据来检验上述的两种状态A 与B 是否有关,就称之为22⨯联表的独立性检验.六.回归分析1.回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性. 回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.最小二乘法:记回归直线方程为:ˆy a bx =+,称为变量Y 对变量x 的回归直线方程,其中a b ,叫做回归系数.ˆy是为了区分Y 的实际值y ,当x 取值i x 时,变量Y 的相应观察值为i y ,而直线上对应于i x 的纵坐标是ˆi i ya bx =+. 设x Y ,的一组观察值为()i i x y ,,12i n =L ,,,,且回归直线方程为ˆya bx =+, 当x 取值i x 时,Y 的相应观察值为i y ,差ˆ(12)i i y y i n -=L ,,,刻画了实际观察值i y 与回归直线上相应点的纵坐标之间的偏离程度,称这些值为离差.我们希望这n 个离差构成的总离差越小越好,这样才能使所找的直线很贴近已知点. 记21()ni i i Q y a bx ==--∑,回归直线就是所有直线中Q 取最小值的那条.这种使“离差平方和为最小”的方法,叫做最小二乘法.用最小二乘法求回归系数a b ,有如下的公式:1221ˆni ii nii x ynxy bxnx ==-=-∑∑,ˆˆa y bx =-,其中a b ,上方加“^”,表示是由观察值按最小二乘法求得的回归系数.3.线性回归模型:将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型. 产生随机误差的主要原因有:①所用的确定性函数不恰当即模型近似引起的误差; ②忽略了某些因素的影响,通常这些影响都比较小; ③由于测量工具等原因,存在观测误差. 4.线性回归系数的最佳估计值:利用最小二乘法可以得到ˆˆab ,的计算公式为 1122211()()()()nnii iii i nniii i xx y y x ynxybxx xn x ====---==--∑∑∑∑$,ˆˆa y bx =-,其中11n i i x x n ==∑,11nii y y n ==∑ 由此得到的直线ˆˆya bx =+$就称为回归直线,此直线方程即为线性回归方程.其中ˆa ,b $分别为a ,b 的估计值,ˆa称为回归截距,b $称为回归系数,ˆy 称为回归值. 5.相关系数:()()nnii i ixx y y x ynx yr ---==∑∑6.相关系数r 的性质:⑴||1r ≤;⑵||r 越接近于1,x y ,的线性相关程度越强; ⑶||r 越接近于0,x y ,的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. 7.转化思想:根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数. 8.一些备案 ①回归(regression )一词的来历:“回归”这个词英国统计学家Francils Galton 提出来的.1889年,他在研究祖先与后代的身高之间的关系时发现,身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们父母的平均身高高.Galton 把这种后代的身高向中间值靠近的趋势称为“回归现象”.后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析.②回归系数的推导过程:22222[()]222i i i i i i i i Q y a bx y a y na b x y ab x b x =--=-+-++∑∑∑∑∑∑ 22222()2i i ii i i na a b x y b x b x y y =+-+-+∑∑∑∑∑,把上式看成a 的二次函数,2a 的系数0n >,因此当2()2i i i ib x y y b x a n n --=-=∑∑∑∑时取最小值. 同理,把Q 的展开式按b 的降幂排列,看成b 的二次函数,当2i iiix y a xb x-=∑∑∑时取最小值.解得:12221()()()ni iii i niii x ynxyx x y y b x x xnx==---==--∑∑∑∑,a y bx =-, 其中1i y y n =∑,1i x x n=∑是样本平均数. 9. 对相关系数r 进行相关性检验的步骤: ①提出统计假设0H :变量x y ,不具有线性相关关系;②如果以95%的把握作出推断,那么可以根据10.950.05-=与2n -(n 是样本容量)在相关性检验的临界值表中查出一个r 的临界值0.05r (其中10.950.05-=称为检验水平); ③计算样本相关系数r ;④作出统计推断:若0.05||r r >,则否定0H ,表明有95%的把握认为变量y 与x 之间具有线性相关关系;若0.05||r r ≤,则没有理由拒绝0H ,即就目前数据而言,没有充分理由认为变量y 与x 之间具有线性相关关系. 说明:⑴对相关系数r 进行显著性检验,一般取检验水平0.05α=,即可靠程度为95%.⑵这里的r 指的是线性相关系数,r 的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系.⑶这里的r 是对抽样数据而言的.有时即使||1r =,两者也不一定是线性相关的.故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释.题型一 频率分布直方图【例1】 (2010西城二模)某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.则这200名同学中成绩大于等于80分且小于90分的学生有______名.典例分析【例2】 (2010东城二模)已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内的样本频数为 ,样本数据落在[2,10)内的频率为 .【例3】 (2010北京)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a = .若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[]140,150内的学生中选取的人数应为 .【例4】 (2010江苏高考)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[]540,中,其频率分布直方图如图所示,则其抽样的100根中,有____根在棉花纤维的长度小于20mm .(mm)频率组距【例5】 (2009湖北15)下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[)610,内的频数为 ,数据落在[)210,内的概率约为 .【例6】 (2009福建3)A .0.13B .0.39C .0.52D .0.64【例7】 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( )时间(h)A .0.6hB .0.9hC .1.0hD .1.5h【例8】 为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[)4555,,[)5565,,[)6575,,[)7585,,[)8595,由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)5575,的人数是 .产品数量0.0200.0150.0100.005【例9】 (2009山东8)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96106],,样本数据分组为[)9698,,[)98100,,[)100102,,[)102104,,[104106],.已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A .90B .75C .60D .45【例10】 某路段检查站监控录象显示,在某时段内,有1000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为右图的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90km/h 的车辆数为( )A .200B .600C .500D .300【例11】 (2006年全国II )一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本频率分布直方图,为了分析居民的收入与年龄、学历、职业等方面的联系,要从这10000人中用分层抽样的方法抽出100人做进一步调查,则在[25003000],(元)月收入段应抽出_____人.0.00050.00040.00030.00020.0001频率组距月收入(元)【例12】 如图为某样本数据的频率分布直方图,则下列说法不正确的是( )0.1频率组距A .[610),的频率为0.32B .若样本容量为100,则[1014),的频数为40C .若样本容量为100,则(10]-∞,的频数为40D .由频率分布布直方图可得出结论:估计总体大约有10%分布在[1014),【例13】 (2006北京模拟)下面是某学校学生日睡眠时间的抽样频率分布表:【例14】 (2010崇文一模)为了调查某厂2000名工人生产某种产品的能力,随机抽查了m 位工人某天生产该产品的数量,产品数量的分组区间为[)10,15,[)15,20,[)20,25,[)25,30,[30,35],频率分布直方图如图所示.已知生产的产品数量在[)20,25之间的工人有6位.⑴求m ;10 15 20 25 30 35产品数量⑵工厂规定从各组中任选1人进行再培训,则选取5人不在同一组的概率是多少?【例15】 考查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm )⑴ 作出频率分布表; ⑵ 画出频率分布直方图.【例16】 (2010陕西卷高考)为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行出样检查,测得身高情况的统计图如下:/cm/cm⑴估计该小男生的人数;⑵估计该校学生身高在170~185cm 之间的概率; ⑶从样本中身高在165~180cm 之间的女生..中任选2人,求至少有1人身高在170~180cm 之间的概率.【例17】 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm ).作出该样本的频率分布表,画出频率分布直方图及折线图,并根据作出的频率分布直方图估计身高不小于170的同学的人数.【例18】 为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如下图),已知图中从左到右的前三个小组的频率分别是0.10.30.4,,.第一小组的频数是5.⑴求第四小组的频率和参加这次测试的学生人数;⑵在这次测试中,学生跳绳次数的中位数落在第几小组内? ⑶参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩优秀率是多少?【例19】 为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛. 为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计. 请你根据尚未完成并有局部污损的频率分布表和频数分布直方图,解答下列问题: ⑴ 填充频率分布表的空格(将答案直接填在表格内); ⑵ 补全频数条形图;⑶ 若成绩在75.5~85.5分的学生为二等奖,问获得二等奖的学生约为多少人?【例20】 (2010丰台一模)某校高三(1)班的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题.85987654322198653328698765叶茎6050分数频率组距0.040.0280.0160.008⑴求全班人数及分数在[)80,90之间的频数;⑵估计该班的平均分数,并计算频率分布直方图中[)80,90间的矩形的高;⑶若要从分数在[]80,100之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在[]90,100之间的概率.【例21】 某地区为了了解70~80岁老人的日平均睡眠时间(单位:h ).随机选择了50位老人的进行调查.下表是这50位老人日睡眠时间的频率分布表.序号 (i ) 分组 (睡眠时间) 组中值 (i G ) 频数 (人数) 频率(i F ) 1 [4,5) 4.5 6 0.12 2 [5,6) 5.510 0.20 3 [6,7) 6.5 20 0.40 4 [7,8) 7.5 10 0.205[8,9]8.5 40.08在上述统计数据中,一部分计算见算法流程图(其中←可用=代替),则输出的S的值是.。
2023年高考数学复习----《统计图表》规律方法与典型例题讲解
2023年高考数学复习----《统计图表》规律方法与典型例题讲解【规律方法】1、制作频率分布直方图的步骤.第一步:求极差,决定组数和组距,组距=极差组数第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表;第四步:画频率分布直方图.2、解决频率分布直方图问题时要抓住3个要点.(1)直方图中各小矩形的面积之和为1;(2)直方图中纵轴表示频率组距,故每组样本的频率为组距⨯频率组距(3)直方图中每组样本的频数为频率⨯总体个数.3、用频率分布直方图估计众数、中位数、平均数的方法.(1)众数为频率分布直方图中最高矩形底边中点的横坐标;(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;(3)平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和.【典型例题】例1.(2022·云南昆明·昆明一中模拟预测)为了响应教育部门疫情期间“停课不停学”的号召,某校实施网络授课,为了检验学生上网课的效果,在高三年级进行了一次网络模拟考试,从中抽取了100人的数学成绩,绘制成频率分布直方图(如下图所示),其中数学成绩落在区间[110,120),[120,130),[130,140]的频率之比为4:2:1.(1)根据频率分布直方图求学生成绩在区间[110,120)的频率,并求抽取的这100名同学数学成绩的中位数(2)若将频率视为概率,从全校高三年级学生中随机抽取3个人,记抽取的3人成绩在[100,130)内的学生人数为X ,求X 的分布列与数学期望.【解析】(1)由直方图可知,数学成绩落在区间[70,110)内的频率为(0.0040.0120.0190.030)10+++⨯=0.65,所以数学成绩落在区间[110,140]内的频率为10.650.35−=,因为数学成绩落在区间[110,120),[120,130),[130,140]的频率之比为4:2:1,所以数学成绩落在区间[110,120)的频率为40.35421⨯++0.2=, 数学成绩落在区间[70,100)的频率为(0.0040.0120.019)100.35++⨯=, 所以中位数落在区间[100,110)内,设中位数为x ,则(100)0.0300.50.35x −⨯=−,解得105x =, 所以抽取的这100名同学数学成绩的中位数为105.(2)由(1)知,数学成绩落在区间[100,130)内的频率为0.0310⨯+0.2+20.35421⨯++0.6=,由题意可知,3~(3,)5X B ,X 的所有可能取值为0,1,2,3,033338(0)C ()(1)55125P X ==⋅−=,12333(1)C (1)55P X ==⋅⋅−36125=, 22333(2)C ()(1)55P X ==⋅⋅−54125=,330333(3)C ()(1)55P X ==⋅−27125=,所以X 的分布列为:所以数学期望8365427()0123125125125125E X =⨯+⨯+⨯+⨯95=.例2.(2022·贵州贵阳·贵阳六中校考一模)某校组织1000名学生进行科学探索知识竞赛,成绩分成5组:[)50,60,[)60,70,[)70,80,[)80,90,[]90,100,得到如图所示的频率分布直方图.若图中未知的数据a ,b ,c 成等差数列,成绩落在区间[)60,70内的人数为400.(1)求出直方图中a ,b ,c 的值;(2)估计中位数(精确到0.1)和平均数(同一组中的数据用该组区间的中点值代替); (3)若用频率估计概率,设从这1000人中抽取的6人,得分在区间[]90,100内的学生人数为X ,求X 的数学期望.【解析】(1)依题意可得:4001000100.04a =÷÷=,又a ,b ,c 成等差数列,所以2b a c =+且(0.0050.005)101a b c ++++⨯=,解得:0.02,0.03c b == 所以0.04,0.03,0.02a b c ===.(2)因为(0.0050.04)100.450.5+⨯=<,设中位数为x , 则[70,80)x ∈,所以()()0.0050.0410700.030.5x +⨯+−⨯=,解得:71.7x ≈,即中位数约为71.7,平均数为(550.005650.04750.03850.02950.005)1073⨯+⨯+⨯+⨯+⨯⨯=. (3)由题意可知:得分在区间[]90,100内概率为10.0051020⨯=, 根据条件可知:X 的所有可能值为0,1,2,3,4,5,6,且1(6,)20X ,所以1()60.320E X np ==⨯=.例3.(2022·全国·高三专题练习)为丰富学生课外生活,某市组织了高中生钢笔书法比赛,比赛分两个阶段进行:第一阶段由评委为所有参赛作品评分,并确定优胜者;第二阶段为附加赛,参赛人员由组委会按规则另行确定.数据统计员对第一阶段的分数进行了统计分析,这些分数X 都在[75,100)内,再以5为组距画分数的频率分布直方图(设“Y=频率组距”)时,发现Y 满足:7,15,15019,16,30011,16,1520n Y n k n n ⎧=⎪⎪⎪==⎨⎪⎪−⋅>⎪−⎩,55(1)n N n X n *∈≤<+. (1)试确定n 的所有取值,并求k ;(2)组委会确定:在第一阶段比赛中低于85分的同学无缘获奖也不能参加附加赛;分数在[95,100)内的同学评为一等奖;分数在[90,95)内的同学评为二等奖,但通过附加赛有111的概率提升为一等奖;分数在[85,90)内的同学评为三等奖,但通过附加赛有17的概率提升为二等奖(所有参加附加赛的获奖人员均不降低获奖等级,且附加赛获奖等级在第一阶段获奖等级基础上,最多升高一级).已知学生A 和B 均参加了本次比赛,且学生A 在第一阶段获得二等奖.①求学生B 最终获奖等级不低于学生A 最终获奖等级的概率;②已知学生A 和B 都获奖,记A ,B 两位同学最终获得一等奖的人数为ξ,求ξ的分布列和数学期望.【解析】(1)根据题意,X 在[75,100)内,按5为组距可分成5个小区间, 分别是[75,80),[80,85),[85,90),[90,95),[95,100),因为75100X ≤<,由55(1)n X n ≤<+,n N *∈,所以15,16,17,18,19n =.每个小区间的频率值分别是7,15,30195,1660115,17,18,19320n P Y n k n n ⎧=⎪⎪⎪===⎨⎪⎪−⋅=⎪−⎩由719111511306032k ⎛⎫++−++= ⎪⎝⎭,解得350k =. (2)①由于参赛学生很多,可以把频率视为概率.由(1)知,学生B 的分数属于区间[75,80),[80,85),[85,90),[90,95),[95,100)的概率分别是:730,1960,1460,1160,260.我们用符号ijA (或ijB )表示学生A (或B )在第一轮获奖等级为i ,通过附加赛最终获奖等级为j ,其中(,1,2,3)j i i j ≤=记“学生B 最终获奖等级不低于学生A 的最终获奖等级”为事件W , 则()12122223222()P W P B B B A B A =+++()()()()()()12122223222P B P B P B P A P B P A =+++2111111010141105160601160111160711220=+⋅+⋅⋅+⋅⋅=.②学生A 最终获得一等奖的概率是111A P =,学生B 最终获得一等奖的概率是21112116060272711272796060B P =+⋅=+=,1180(0)1111999P ξ⎛⎫⎛⎫==−−= ⎪⎪⎝⎭⎝⎭,111118(1)1111911999P ξ⎛⎫⎛⎫==⋅−+−⋅=⎪ ⎪⎝⎭⎝⎭, 111(2)11999P ξ==⋅=.所以ξ的分布列为:801812001299999999E ξ=⋅+⋅+⋅=.。
频率分布直方图典例解析
数和频率分别为24和÷ ,则该样本的样本容量为
3
( )。
一~一一舳 一 解得a=15。b=15。
设 “该 学 校 学 生 的 Et平 均 睡 眠 时 间 在 7/h时 以
上 ”为事件 ,则P(A)= =0.38。
50
该学校学生 的 日平 均睡眠时 间在 7小 时以上 的 概率 约 为 0.38。
三 、与 其 他知 识 结 合 的 创 新题 例 3 某 中学 团委 组织 了 “我 对 祖 国 知 多 少 ”的 知识竞赛 ,从参加考试 的学生 中抽 出60名学生 ,将其 成 绩 (均 为整 数 )分 成 六 组 [40,50),[50,6O),… ,
O.20 0 O8
(2)由题 意 ,知
1f ×6×4.5+10×5.5+(Ⅸ6.5+6×7.5+4×8.5=6.52, 50 I6+10+叶 6+4=50。
(分 )
图 2
(2)依 题 意 ,60分 及 以上 的分 数 在 [60,70), [70,80),[80,90),[90,100]这 四个组 ,其频 率和 为 (0.015+0.03+0.025+0.005)xlO=0.75。所 以估计这 次 考 试 的 及 格率 是 75%。
利用组 中值估算 学生成绩 的平均 分 ,则有45x
0.1+55x0.15+65x0.15+75x0.3+85x0.25+95x0.05=71 o
所 以估计这次考试 的平均分是71分 。 (3)成绩在 [40,50)的人数是 60xO.1=6,成绩 在
[90,100] 的 人 数 是 60×0.05=3,所 以 从 成 绩 在 [40,50)与[90,100]的学生 中选 两人 ,他们在同一分
高考数学专题统计《用频率直方图估计总体分布《百分位数》突破解析
14.4.3用频率直方图估计总体分布14.4.4百分位数必备知识基础练1.以下数据为参加数学竞赛决赛的15人的成绩(单位:分):78,70,72,86,88,79,80,81,94,84,56,98,83,90,91.这15人成绩的80百分位数是()A.90B.90.5C.91D.91.5=12,56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为80×15100=90.5.所以这15人成绩的80百分位数是90+9122.如图是某工厂对一批新产品长度(单位:mm)检测结果的频率直方图.估计这批产品的平均数与中位数分别为()A.22.5,20B.22.5,22.75C.22.75,22.5D.22.75,25,这批产品的平均数为x=5×(0.02×12.5+0.04×17.5+0.08×22.5+0.03×27.5+0.03×32.5)=22.75,其中位数为=22.5.故选C.x0=20+0.5-(0.02+0.04)×50.083.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,50百分位数为b,则有()A.a=13.7,b=15.5B.a=14,b=15C.a=12,b=15.5D.a=14.7,b=1510,12,14,14,15,15,16,17,17,17,其平均数a=110×(10+12+14+14+15+15+16+17+17+17)=14.7,因为50×10100=5,所以这10名工人一小时内生产零件的50百分位数为b=15+152=15. 4.已知甲、乙两组数据(已按从小到大的顺序排列): 甲组:27,28,39,40,m ,50; 乙组:24,n ,34,43,48,52.若这两组数据的30百分位数,80百分位数分别相等,则mn等于( ) A.127 B.107C.43D.74因为30100×6=1.8,80100×6=4.8,所以30百分位数为n=28,80百分位数为m=48,所以mn =4828=127. 5.1,2,3,4,5,6,7,8,9,10这组数据的25百分位数为 ,75百分位数为 ,90百分位数为 .8 9.510,而且10×25%=2.5,10×75%=7.5,10×90%=9,所以该组数据的25百分位数为3,75百分位数为8,90百分位数为9+102=9.5. 6.某学校组织学生参加数学测试,成绩的频率直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的 百分位数.[20,40),[40,60)的频率之和为(0.005+0.01)×20=0.3,所以60分为成绩的30百分位数.7.某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45]岁之间,根据调查结果得出司机的年龄情况残缺的频率直方图如图所示,利用这个残缺的频率直方图估计该市出租车司机年龄的中位数大约是 (保留一位小数)..6,所有矩形面积之和为1,所以,数据位于[25,30)的频率为1-(0.01+0.07+0.06+0.02)×5=0.2, 前两个矩形的面积之和为0.01×5+0.2=0.25, 前三个矩形的面积之和为0.25+0.07×5=0.6, 所以,中位数位于区间[30,35),设中位数为a , 则有0.25+(a-30)×0.07=0.5,解得a ≈33.6(岁). 8.求下列数据的四分位数. 13,15,12,27,22,24,28,30,31,18,19,20.12个数据按从小到大的顺序排列为12,13,15,18,19,20,22,24,27,28,30,31,计算25×12100=3,50×12100=6,75×12100=9, 所以数据的25百分位数为15+182=16.5, 50百分位数为20+222=21,75百分位数为27+282=27.5. 9.某网络营销部门随机抽查了某市200名网友在2019年11月11日的网购金额,所得数据如下表:已知网购金额低于3千元与不低于3千元的人数比恰为3∶2. (1)试确定x ,y ,p ,q 的值,并补全频率直方图;(2)估计网购金额的25百分位数(结果保留三位有效数字).根据题意有{16+24+x +y +16+14=200,16+24+x y+16+14=32,解得{x =80,y =50.所以p=0.4,q=0.25.补全频率直方图如图所示.(2)由(1)可知,网购金额低于2千元的频率为0.08+0.12=0.2,网购金额低于3千元的频率为0.2+0.4=0.6,所以网购金额的25百分位数在[2,3)内,则网购金额的25百分位数估计为2+0.25-0.20.6-0.2×1=2.125≈2.13. 关键能力提升练10.数据3.2,3.4,3.8,4.2,4.3,4.5,x ,6.6的65百分位数是4.5,则实数x 的取值范围是( ) A.[4.5,+∞) B.[4.5,6.6) C.(4.5,+∞)D.(4.5,6.6]65×8100=5.2,所以这组数据的65百分位数是第6个数据4.5,则x ≥4.5,故选A.11.港珠澳大桥于2018年10月24日正式通车,它是中国境内一座连接香港、珠海和澳门的桥隧工程.桥隧全长55千米,桥面为双向六车道高速公路,大桥通行限速100 km/h .现对大桥某路段上汽车行驶速度进行抽样调查,画出频率直方图(如图).根据直方图估计在此路段上汽车行驶速度的众数和行驶速度超过90 km/h 的频率分别为( )A.85,0.25B.90,0.35C.87.5,0.25D.87.5,0.35=87.5,由频率直方图估计在此路段由频率直方图估计在此路段上汽车行驶速度的众数为85+902上汽车行驶速度超过90 km/h的频率为(0.05+0.02)×5=0.35,所以由频率直方图估计在此路段上汽车行驶速度超过90 km/h的频率为0.35.12.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率直方图如图所示.估计棉花纤维的长度的样本数据的80百分位数是()A.29 mmB.29.5 mmC.30 mmD.30.5 mm30 mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,在25 mm以=29,可以估计棉花下的比例为85%-25%=60%,因此,80百分位数一定位于[25,30)内,由25+5×0.80-0.600.85-0.60纤维的长度的样本数据的80百分位数是29 mm.13.(多选)已知100个数据的75百分位数是9.3,则下列说法不正确的是()A.这100个数据中一定有75个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第75个数据C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数=75为整数,所以第75个数据和76个数据的平均数为75百分位数,是9.3,则C正75×100100确,其他选项均不对,故选ABD.14.(多选)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的平均数等于乙的成绩的平均数C.甲的成绩的80百分位数等于乙的成绩的80百分位数D.甲的成绩的极差等于乙的成绩的极差,x 甲=4+5+6+7+85=6,x 乙=3×5+6+95=6,A 项错误,B 项正确;甲的成绩的80百分位数为7+82=7.5,乙的成绩的80百分位数为6+92=7.5,所以二者相等,所以C 项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D 项正确.15.已知30个数据的60百分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是 ..660×30100=18,设第19个数据为x ,则7.8+x2=8.2,解得x=8.6,即第19个数据是8.6.16.如图是某市2020年4月1日至4月7日每天最高、最低气温的折线统计图,这7天的日最高气温的10百分位数为 ,日最低气温的80百分位数为 .℃ 16 ℃,把日最高气温按照从小到大排序,得24,24.5,24.5,25,26,26,27,因为共有7个数据,所以7×10100=0.7,不是整数,所以这7天日最高气温的10百分位数是第1个数据,为24 ℃.把日最低气温按照从小到大排序,得12,12,13,14,15,16,17,因为共有7个数据,所以7×80100=5.6,不是整数,所以这7天日最低气温的80百分位数是第6个数据,为16 ℃.17.某年级120名学生在一次百米跑测试中,成绩全部介于13秒与18秒之间,将测试结果分成5组,即[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率直方图,如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70百分位数约为 秒..570百分位数为x ,因为1+3+71+3+7+6+3=0.55,1+3+7+61+3+7+6+3=0.85,所以x ∈[16,17),所以0.55+(x-16)×61+3+7+6+3=0.70,解得x=16.5. 18.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为 ;(2)由频率直方图估计志愿者年龄的85百分位数为 岁(结果保留整数)..04 (2)39设[25,30)年龄组对应小矩形的高度为h ,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.(2)由图可知,年龄小于35岁的频率为(0.01+0.04+0.07)×5=0.6,年龄小于40岁的频率为(0.01+0.04+0.07+0.06)×5=0.9,所以志愿者年龄的85百分位数在[35,40)内,因此志愿者年龄的85百分位数为35+0.85-0.60.9-0.6×5≈39(岁). 19.(2021浙江宁波期末)首次实施新高考的八省(市)于2021年1月23日统一举行了新高考适应性考试,在联考结束后,根据联考成绩,考生可了解自己的学习情况,作出升学规划,决定是否参加强基计划.在本次适应性考试中,某学校为了解高三学生的联考情况,随机抽取了100名学生的联考数学成绩作为样本,并按照分数段[50,70),[70,90),[90,110),[110,130),[130,150]分组,绘制了如图所示的频率直方图.(1)求出图中a的值并估计本次考试及格率(“及格率”指得分为90分及以上的学生所占比例);(2)估计该校学生联考数学成绩的80百分位数;(3)估计该校学生联考数学成绩的众数、平均数.由(0.004+a+0.013+0.014+0.016)×20=1,解得a=0.003,则及格率为(0.016+0.014+0.003)×20=0.66=66%.(2)得分在110以下的学生所占比例为(0.004+0.013+0.016)×20=0.66,得分在130以下的学生所=120(分),估计占比例为0.66+0.014×20=0.94,所以80百分位数位于[110,130)内,由110+20×0.8-0.660.94-0.6680百分位数为120.(3)由图可得,众数估计值为100.平均数估计值为0.08×60+0.26×80+0.32×100+0.28×120+0.06×140=99.6(分).学科素养创新练20.2020年某地苹果出现滞销现象,为了帮助当地果农打开销路,当地政府与全国一些企业采用团购的方式带动销售链,使得当地果农积压的许多苹果有了销路.为了解果农们苹果的销售量情况,当地农业局随机对100名果农的苹果销售量进行统计,将数据按照[90,110),[110,130),[130,150),[150,170]分成4组,得到如图所示的频率直方图.(1)试估计这100名果农苹果销售量的平均数;(2)根据题中的频率直方图,估计销售量样本数据的80百分位数(结果精确到0.1);(3)假设这100名果农在未打开销路之前都积压了2万千克的苹果,通过团购的方式果农每千克苹果的纯利润为1.3元,而积压仍未售出的苹果每千克将损失2元的成本费,试估计这100名果农积压的苹果通过此次团购活动获得的总利润.设这100名果农苹果销售量的平均数为x百千克,则x=(100×0.002 5+120×0.01+140×0.0225+160×0.015)×20=140(百千克),故这100名果农苹果销售量的平均数为1.4万千克.(2)因为(0.002 5+0.010 0)×20=0.25<0.8,0.25+0.225×20=0.7<0.8,×20≈156.7.所以80百分位数在第4组内,且80百分位数为150+0.8-0.71-0.7(3)销售量在[90,110)的每位果农的利润为100×100×1.3-(2×104-100×100)×2=-0.7(万元);销售量在[110,130)的每位果农的利润为120×100×1.3-(2×104-120×100)×2=-0.04(万元);销售量在[130,150)的每位果农的利润为100×140×1.3-(2×104-140×100)×2=0.62(万元);销售量在[150,170]的每位果农的利润为100×160×1.3-(2×104-160×100)×2=1.28(万元).因为[90,110),[110,130),[130,150),[150,170)这4组的人数分别为5,20,45,30,所以这100名果农积压的苹果通过此次团购活动获得的总利润约为-0.7×5-0.04×20+0.62×45+1.28×30=62(万元).。
高考数学频率分布直方图大题训练题(含答案)
频率分布直方图大题训练题一、解答题(共18题;共205分)1.(2020·龙岩模拟)某电讯企业为了了解某地区居民对电讯服务质量评价情况,随机调查100 名用户,根据这100名用户对该电讯企业的评分,绘制频率分布直方图,如图所示,其中样本数据分组为,,…… .(1)估计该地区用户对该电讯企业评分不低于70分的概率,并估计对该电讯企业评分的中位数;(2)现从评分在的调查用户中随机抽取2人,求2人评分都在的概率.2.(2020·芜湖模拟)某学校为了了解该校高三年级学生寒假在家自主学习的情况,随机对该校300名高三学生寒假的每天学习时间(单位:h)进行统计,按照,,,,的分组作出频率分布直方图如图所示.参考公式:,其中.参考附表:0.050 0.010 0.001(Ⅰ)根据频率分布直方图计算该校高三年级学生的平均每天学习时间(同一组中的数据用该组区间中点值代表);(Ⅱ)该校规定学习时间超过4h为合格,否则不合格.已知这300名学生中男生有140人,其中合格的有70人,请补全下表,根据表中数据,能否有99.9%的把握认为该校高三年级学生的性别与学习时长合格有关?3.(2020·泰安模拟)某水果批发商经销某种水果(以下简称A水果),购入价为300元/袋,并以360元/袋的价格售出,若前8小时内所购进的A水果没有售完,则批发商将没售完的A水果以220元/袋的价格低价处理完毕(根据经验,2小时内完全能够把A水果低价处理完,且当天不再购进).该水果批发商根据往年的销量,统计了100天A水果在每天的前8小时内的销售量,制成如下频数分布条形图.现以记录的100天的A水果在每天的前8小时内的销售量的频率作为A水果在一天的前8小时内的销售量的概率,记X表示A水果一天前8小时内的销售量,n表示水果批发商一天批发A水果的袋数.(1)求X的分布列;(2)以日利润的期望值为决策依据,在与中选其一,应选用哪个?4.(2020·南昌模拟)某产品自生产并投入市场以来,生产企业为确保产品质量,决定邀请第三方检测机构对产品进行质量检测,并依据质量指标Z来衡量产品的质量.当时,产品为优等品;当时,产品为一等品;当时,产品为二等品.第三方检测机构在该产品中随机抽取500件,绘制了这500件产品的质量指标Z的条形图.用随机抽取的500件产品作为样本,估计该企业生产该产品的质量情况,并用频率估计概率.(1)从该企业生产的所有产品中随机抽取4件,求至少有1件优等品的概率;(2)现某人决定购买80件该产品.已知每件成本1000元,购买前,邀请第三方检测机构对要购买的80件产品进行抽样检测,买家、企业及第三方检测机构就检测方案达成以下协议:从80件产品中随机抽出4件产品进行检测,若检测出3件或4件为优等品,则按每件1600元购买,否则按每件1500元购买,每件产品的检测费用250元由企业承担.记企业的收益为X元,求X的分布列与数学期望.5.(2020·南昌模拟)在“挑战不可能”的电视节目上,甲、乙、丙三个人组成的解密团队参加一项解密挑战活动,规则是由密码专家给出题目,然后由3个人依次出场解密,每人限定时间是1分钟内,否则派下一个人.3个人中只要有一人解密正确,则认为该团队挑战成功,否则挑战失败.根据甲以往解密测试情况,抽取了甲100次的测试记录,绘制了如下的频率分布直方图.(1)若甲解密成功所需时间的中位数为47,求a、b的值,并求出甲在1分钟内解密成功的频率;(2)在“挑战不可能”节目上由于来自各方及自身的心理压力,甲,乙,丙解密成功的概率分别为,其中表示第个出场选手解密成功的概率,并且定义为甲抽样中解密成功的频率代替,各人是否解密成功相互独立.①求该团队挑战成功的概率;②该团队以从小到大的顺序按排甲、乙、丙三个人上场解密,求团队挑战成功所需派出的人员数目X 的分布列与数学期望.6.(2020·江西模拟)冠状病毒是一个大型病毒家族,可引起感冒以及中东呼吸综合征(MERS)和严重急性呼吸综合征(SARS)等较严重疾病.出现的新型冠状病毒(nCoV)是从未在人体中发现的冠状病毒新毒株.人感染了新型冠状病毒后常见体征有呼吸道症状、发热、咳嗽、气促和呼吸困难等.在较严重病例中,感染可导致肺炎、严重急性呼吸综合征、肾衰竭,甚至死亡.某医院为筛查冠状病毒,需要检测血液中的指标A.现从采集的血液样品中抽取500份检测指标A的值,由测量结果得下侧频率分布直方图:(1)求这500份血液样品指标A值的平均数和样本方差(同一组数据用该区间的中点值作代表,记作);(2)由频率分布直方图可以认为,这项指标的值X服从正态分布,其中近似为样本平均数,近似为样本方差.在统计学中,把发生概率小于3‰的事件称为小概率事件(正常条件下小概率事件的发生是不正常的).该医院非常关注本院医生健康状况,随机抽取20名医生,独立的检测血液中指标A的值,结果发现4名医生血液中指标A的值大于正常值20.03,试根据题中条件判断该院医生的健康率是否正常,并说明理由.附:参考数据与公式:,,;若,则① ;② ;③.,,,.7.(2020·江西模拟)年前某市质监部门根据质量管理考核指标对本地的500家食品生产企业进行考核,然后通过随机抽样抽取其中的50家,统计其考核成绩(单位:分),并制成如下频率分布直方图.(1)求这50家食品生产企业考核成绩的平均数(同一组中的数据用该组区间的中点值为代表)及中位数a(精确到0.01)(2)该市质监部门打算举办食品生产企业质量交流会,并从这50家食品生产企业中随机抽取4家考核成绩不低于88分的企业发言,记抽到的企业中考核成绩在的企业数为X,求X的分布列与数学期望(3)若该市食品生产企业的考核成绩X服从正态分布其中近似为50家食品生产企业考核成绩的平均数,近似为样本方差,经计算得,利用该正态分布,估计该市500家食品生产企业质量管理考核成绩高于90.06分的有多少家?(结果保留整数).附参考数据与公式:则,.8.(2020·漯河模拟)十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康.经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入、实现2020年脱贫的工作计划,该地扶贫办统计了2019年50位农民的年收入并制成如下频率分布直方图:附参考数据:,若随机变量X服从正态分布,则,,.(1)根据频率分布直方图,估计50位农民的平均年收入(单位:千元);(同一组数据用该组数据区间的中点值表示);(2)由频率分布直方图,可以认为该贫困地区农民年收入X服从正态分布,其中近似为年平均收入,近似为样本方差,经计算得=6.92,利用该正态分布,求:①在扶贫攻坚工作中,若使该地区约有占总农民人数的的农民的年收入高于扶贫办制定的最低年收入标准,则最低年收入标准大约为多少千元?②为了调研“精准扶贫,不落一人”的政策要求落实情况,扶贫办随机走访了1000位农民.若每位农民的年收入互相独立,问:这1000位农民中的年收入不少于12.14千元的人数最有可能是多少?9.(2017·黑龙江模拟)某学生社团在对本校学生学习方法开展问卷调查的过程中发现,在回收上来的1000份有效问卷中,同学们背英语单词的时间安排共有两种:白天背和晚上临睡前背.为研究背单词时间安排对记忆效果的影响,该社团以5%的比例对这1000名学生按时间安排粪型进行分层抽样,并完成一项实验,实验方法是,使两组学生记忆40个无意义音节(如xIQ、GEH),均要求在刚能全部记清时就停止识记,并在8小时后进行记忆测验.不同的是,甲组同学识记结束后一直不睡觉,8小时后测验;乙组同学识记停止后立刻睡觉,8小时后叫醒测验.两组同学识记停止8小时后的准确回忆(保持)情况如图(区间含左端点而不舍右端点)(1)估计1000名被调查的学生中识记停止后8小时40个音节的保持率大于等于60%的人数;(2)从乙组准确回忆结束在|12,24)范围内的学生中随机选3人,记能准确回忆20个以上(含20)的人数为随机变量x.求X分布列及数学期望;(3)从本次实验的结果来看,上述两种时间安排方法中哪种方法背英语单词记忆效果更好?计算并说明理由.10.(2018·南宁模拟)在某单位的食堂中,食堂每天以10元/斤的价格购进米粉,然后以4.4元/碗的价格出售,每碗内含米粉0.2斤,如果当天卖不完,剩下的米粉以2元/斤的价格卖给养猪场.根据以往统计资料,得到食堂某天米粉需求量的频率分布直方图如图所示,若食堂购进了80斤米粉,以(斤)(其中)表示米粉的需求量,(元)表示利润.(1)估计该天食堂利润不少于760元的概率;(2)在直方图的需求量分组中,以区间中间值作为该区间的需求量,以需求量落入该区间的频率作为需求量在该区间的概率,求的分布列和数学期望.11.(2020·辽宁模拟)某城市100户居民的月平均用电量(单位:度),以,,,,,,分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为,,,的四组用户中,用分层抽样的方法抽取户居民,则月平均用电量在的用户中应抽取多少户?12.(2020·大连模拟)某校从参加高三模拟考试的学生中随机抽取名学生,将其数学成绩(均为整数)分成六段后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:(1)求分数在内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分;(3)用分层抽样的方法在分数段为的学生中抽取一个容量为的样本,将该样本看成一个总体,从中任取个,求至多有人在分数段内的概率.13.(2020·莆田模拟)为了解某地网民浏览购物网站的情况,从该地随机抽取100名网民进行调查,其中男性、女性人数分别为45和55.下面是根据调查结果绘制的网民日均浏览购物网站时间的频率分布直方图,将日均浏览购物网站时间不低于40分钟的网民称为“网购达人”,已知“网购达人”中女性有10人.参考公式:,其中.参考数据:0.102.7063.841 5.024 6.635 7.879 10.828(1)根据已知条件完成下面的列联表,并判断是否有90%的把握认为是否为“网购达人”与性别有关;(2)将上述调査所得到的频率视为概率,现在从该地的网民中随机抽取3名,记被抽取的3名网民中的“网购达人”的人数为X,求X的分布列、数学期望和方差.14.(2020·长春模拟)笔、墨、纸、砚是中国独有的文书工具,即“文房四宝”.笔、墨、纸、砚之名,起源于南北朝时期,其中的“纸”指的是宣纸,宣纸“始于唐代,产于泾县”,而唐代泾县隶属于宣州府管辖,故因地而得名“宣纸”,宣纸按质量等级,可分为正牌和副牌(优等品和合格品),某公司年产宣纸10000刀(每刀100张),公司按照某种质量标准值给宣纸确定质量等级,如下表所示:公式在所生产的宣纸中随机抽取了一刀(100张)进行检验,得到频率分布直方图如图所示,已知每张正牌纸的利润是10元,副牌纸的利润是5元,废品亏损10元.(1)估计该公式生产宣纸的年利润(单位:万元);(2)该公司预备购买一种售价为100万元的机器改进生产工艺,这种机器的使用寿命是一年,只能提高宣纸的质量,不影响产量,这种机器生产的宣纸的质量标准值的频率,如下表所示:其中为改进工艺前质量标准值的平均值,改进工艺后,每张正牌和副牌宣纸的利润都下降2元,请判断该公司是否应该购买这种机器,并说明理由.15.(2020·蚌埠模拟)随着网购人数的日益增多,网上的支付方式也呈现一种多样化的状态,越来越多的便捷移动支付方式受到了人们的青睐,更被网友们评为“新四大发明”之一.随着人们消费观念的进步,许多人喜欢用信用卡购物,考虑到这一点,一种“网上的信用卡”横空出世——蚂蚁花呗.这是一款支付宝和蚂蚁金融合作开发的新支付方式,简单便捷,同时也满足了部分网上消费群体在支付宝余额不足时的“赊购”消费需求.为了调查使用蚂蚁花呗“赊购”消费与消费者年龄段的关系,某网站对其注册用户开展抽样调查,在每个年龄段的注册用户中各随机抽取100人,得到各年龄段使用蚂蚁花呗“赊购”的人数百分比如图所示.参考答案:,.(1)由大数据可知,在18到44岁之间使用花呗“赊购”的人数百分比y与年龄x成线性相关关系,利用统计图表中的数据,以各年龄段的区间中点代表该年龄段的年龄,求所调查群体各年龄段“赊购”人数百分比y与年龄x的线性回归方程(回归直线方程的斜率和截距保留两位有效数字);(2)该网站年龄为20岁的注册用户共有2000人,试估算该网站20岁的注册用户中使用花呗“赊购”的人数;(3)已知该网店中年龄段在18-26岁和27-35岁的注册用户人数相同,现从18到35岁之间使用花呗“赊购”的人群中按分层抽样的方法随机抽取8人,再从这8人中简单随机抽取2人调查他们每个月使用花呗消费的额度,求抽取的两人年龄都在18到26岁的概率.16.(2020·辽宁模拟)港珠澳大桥是一座具有划时代意义的大桥.它连通了珠海香港澳门三地,大大缩短了三地的时空距离,盘活了珠江三角洲的经济,被誉为新的世界七大奇迹.截至2019年10月23日8点,珠海公路口岸共验放出入境旅客超过1400万人次,日均客流量已经达到4万人次,验放出入境车辆超过70万辆次,2019年春节期间,客流再次大幅增长,日均客流达8万人次,单日客流量更是创下11.3万人次的最高纪录.2019年从五月一日开始的连续100天客流量频率分布直方图如下(1)①同一组数据用该区间的中点值代替,根据频率分布直方图.估计客流量的平均数.②求客流量的中位数.(2)设这100天中客流量超过5万人次的有天,从这天中任取两天,设为这两天中客流量超过7万人的天数.求的分布列和期望.17.(2020·江门模拟)2019年7月1日到3日,世界新能源汽车大会在海南博鳌召开,大会着眼于全球汽车产业的转型升级和生态环境的持续改善.某汽车公司顺应时代潮流,最新研发了一款新能源汽车,并在出厂前对100辆汽车进行了单次最大续航里程(理论上是指新能源汽车所装载的燃料或电池所能够提供给车行驶的最远里程)的测试.现对测试数据进行分析,得到如图的频率分布直方图.(1)估计这100辆汽车的单次最大续航里程的平均值(同一组中的数据用该组区间的中点值代表);(2)根据大量的汽车测试数据,可以认为这款汽车的单次最大续航量程X近似地服从正态分布,经计算第(1)问中样本标准差s的近似值为50.用样本平均数作为的近似值,用样本标准差s作为的估计值,现任取一辆汽车,求它的单次最大续航里程恰在250千米到400千米之间的概率;(3)某汽车销售公司为推广此款新能源汽车,现面向意向客户推出“玩游戏,送大奖”活动,客户可根据抛掷硬币的结果,操控微型遥控车在方格图上行进,若遥控车最终停在“胜利大本营”,则可获得购车优惠券.已知硬币出现正,反面的概率都是,方格图上标有第0格、第1格、第2格……第50格.遥控车开始在第0格,客户每掷一次硬币,遥控车向前移动一次,若掷出正面,遥控车向前移动一格(从k到),若掷出反面,遥控车向前移动两格(从k到),直到遥控车移到第49格(胜利大本营)或第50格(失败大本营)时,游戏结束.设遥控车移到第n格的概率为,试证明是等比数列,并解释此方案能否成功吸引顾客购买该款新能源汽车.参考数据:若随机变量服从正态分布,则,,.18.(2020·肇庆模拟)某公司新上一条生产线,为保证新的生产线正常工作,需对该生产线进行检测,现从该生产线上随机抽取100件产品,测量产品数据,用统计方法得到样本的平均数,标准差,绘制如图所示的频率分布直方图,以频率值作为概率估值.(1)从该生产线加工的产品中任意抽取一件,记其数据为,依据以下不等式评判(表示对应事件的概率)①②③评判规则为:若至少满足以上两个不等式,则生产状况为优,无需检修;否则需检修生产线,试判断该生产线是否需要检修;(2)将数据不在内的产品视为次品,从该生产线加工的产品中任意抽取2件,次品数记为,求的分布列与数学期望.答案解析部分一、解答题1.【答案】(1)解:由题意,该地区用户对该电讯企业评分的频率分布如下表:因此可估计评分不低于70分的概率为;对该电讯企业评分的中位数设为x,可得,则,解得,所以可估计对该电讯企业评分的中位数为;(2)解:受调查用户评分在的有人,若编号依次为1,2,3,4,从中选2人的事件有、、、、、,共有个基本事件;受调查用户评分在的有人,若编号依次为1,2,3,..9,10,从中选2人,可得共有个基本事件;因此2人评分都在的概率.【解析】【分析】(1)由题意列出频率分布表,求和即可估计该地区用户对该电讯企业评分不低于70分的概率;利用中位数两侧的概率和相等列方程即可估计对该电讯企业评分的中位数;(2)由题意计算出受调查用户评分在、的人数,求出总的基本事件个数及满足要求的基本事件的个数,由古典概型概率公式即可得解.2.【答案】解:(Ⅰ)高三年级学生平均每天的学习时间为:(h);(Ⅱ)300名学生中合格的人数为(人),故补全表格如下:所以所以有99.9%的把握认为该校高三年级学生的性别与学习时长合格有关.【解析】【分析】(Ⅰ)根据频率分布直方图直接计算平均值即可;(Ⅱ)先求出300名学生中合格的人数,再补全表格,然后根据表格数据和公式计算,最后将与进行比较,进而得出结论.3.【答案】(1)解:由题意知,根据条形图,可得A水果在每天的前8小时内的销售量分别为14,15,16,17的频率分别是0.2,0.3,0.4和0.1 ,所以X的分布列为140.2(2)解:当时,设Y为水果批发商的日利润,则Y的可能取值为760,900,可得,所以期望,当时,设Z为水果批发商的日利润,则Z的可能取值为680,820,960,可得,所以期望.因为,综上可知,当时的日利润期望值大于时的日利润期望值,故答案为:.【解析】【分析】(1)由题意知,根据条形图,得到销售量分别为14,15,16,17的频率,进而得到随机变量X的分布列;(2)分别求得当和时,利润的数学期望,比较即可得到结论.4.【答案】(1)解:由题意知,500件产品中共有优等品件,则从样本中随机取一件为优等品的概率为,所以从该企业生产的所有产品中随机抽取4件,没有一件是优等品的概率为,则随机抽取4件,至少有1件优等品的概率为.(2)解:检测出3件或4件为优等品时,检测出的优等品低于3件时,,由题意知,,故X的分布列为所以数学期望.【解析】【分析】(1)先求出从样本中随机取一件为优等品的概率,再求从该企业生产的所有产品中随机抽取4件,没有一件是优等品的概率,从而可求出至少有一件是优等品的概率.(2)由题意求出检测出3件或4件为优等品时及检测出的优等品低于3件时的X的值,结合第一问求出,,从而可得X的分布列,即可计算其数学期望5.【答案】(1)解:甲解密成功所需时间的中位数为47,,解得,,解得,由频率分布直方图知,甲在分钟内解密成功的频率是;(2)解:①由题意及(1)可知第一个出场选手解密成功的概率为,第二个出场选手解密成功的概率为,第三个出场选手解密成功的概率为,所以该团队挑战成功的概率为;②由①可知按从小到大的顺序的概率分别、、,根据题意知的取值为、、,则,,,所以所需派出的人员数目的分布列为:因此,.【解析】【分析】(1)根据中位数左右两边的矩形面积之和均为0.5可求得a、b的值,并根据频率分布直方图求得甲在1分钟内解密成功的频率;(2)①由(1)得出,求出、的值,由此得出该团队挑战成功的概率为;②由题意可得出随机变量X的可能取值有1、2、3,利用独立事件的概率乘法公式计算出随机变量X在不同取值下的概率,据此可得出随机变量X的分布列,结合期望公式可计算出X的数学期望值.6.【答案】(1)解:根据题意,由频率分布直方图可知,500份血液样品指标A值的平均数为:,500份血液样品指标A值的样本方差为:.(2)解:由题意知:指标的值服从正态分布,,,则,所以,.随机抽取20名医生独立检测血液中指标的值,就相当于进行了20次独立重复试验,记“20名医生中出现4名医生血液中指标的值大于正常值20,03”为事件,则,所以从血液中指标的值的角度来看:该院医生的健康率是正常的.【解析】【分析】(1)由频率分布直方图,直接利用平均数和方差公式,求出500份血液样品指标值的平均数和样本方差;(2)由(1)得出指标的值服从正态分布,从而可求出,在根据独立重复试验中的概率求法,求出20名医生中出现4名医生血液中指标的值大于正常值20.03的概率,即可判断该院医生的健康率是否正常7.【答案】(1)解:由题意,这50家食品生产企业考核成绩的平均数为:(分),由频率分布图可知内,所以,解得分.(2)解:根据题意,这50家食品生产企业中考核成绩不低于88分的企业有:(家),其中考核成绩在内的企业有(家),所以X可能取值有0,1,2,3,4则,,,,,所以X的分布列为所以.(3)解:由题意得,所以,所以,所以(家),所以500家食品生产企业质量管理考核成绩高于90.06分的有79家.【解析】【分析】(1)利用频率分布直方图的性质能求出这50家食品生产企业考核成绩的平均数和中位数;(2)由已知得到考核成绩在内的企业有5家,得出随机变量的可能取值,分别求出相应的概率和分布列,求得数学期望;(3)根据题意得,由此估计该市500家食品生产企业质量管理考核成绩高于90.06分的企业个数.8.【答案】(1)解:千元.故估计50位农民的年平均收入为17.40千元.(2)解:由题意知,① ,所以时,满足题意,即最低年收入大约为14.77千元.②由,每个农民的年收入不少于12.14千元的事件的概率为0.9773,记1000个农民的年收入不少于12.14千元的人数为则,其中于是恰好有k个农民的年收入不少于12.14千元的事件概率为,。
高三 复习 频率分布直方图
总体密度曲线
总体密度曲线反映了总体在各个范围内取值的 百分比,精确地反映了总体的分布规律。 用样本分布直方图去估计相应的总体分布时 ,一般样本容量越大,频率分布折线图就会无限 接近总体密度曲线,就越精确地反映了总体的分 布规律,即越精确地反映了总体在各个范围内取 值百分比。
茎叶图
某赛季甲、乙两名篮球运动员每场比赛得分的原 始记录如下:
引入
我国是世界上严重缺水的国家之一, 城市缺水问题较为突出。
2000年全国主要城市中缺水情况排在前10位的城市
政府为了节约生活用水,计划在本市试行居民生 活用水定额管理,即确定一个居民月用水量标准a , 用水量不超过a的部分按平价收费,超过a的部 分按议价收费。
①如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?
组距:指每个小组的两个端点的距离,
极差 4.1 组数= = 8.2 = 组距 0.5 3.将数据分组(左闭右开) [0,0.5 ),[0.5,1 ),…,[4,4.5]
4.列频率分布表
频率分布表一般分“分 组”,“频数累计”( 可省),“频数”,“ 频率”, “ 频率/组距 ””五列,最后一行是 频数 合计
助学微博
一个对比
频率分布表:优点:能看出分布规律.缺点:不直观. 频率分布直方图:优点:很直观且能看出分布规律.缺点: 数据的轻微变化都要重新作图. 茎叶图:优点:很直观,能看出分布规律,还可以添加新 数据.缺点:数据少时方便,数据较多时不方便.
两个特性
(1)在频率分布表中,频数的和等于样本容量,每一小组的频 率等于这一组的频数除以样本容量,各小组频率的和等于 1; (2)在频率分布直方图中,小矩形的高等于每一组的频率/组 距,每个小矩形的面积等于该组的频率,所有小矩形的面积 之和为 1.
第9章统计专题3 频率分布直方图常考题型专题练习——【含答案】
1频率分布直方图【知识总结】 1.频率分布直方图(1)纵轴表示频率组距,即小长方形的高=频率组距;(2)小长方形的面积=组距×频率组距=频率;(3)各个小方形的面积总和等于1 . 2.频率分布表的画法第一步:求极差,决定组数和组距,组距=极差组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. 3. 频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.2【巩固练习】1、随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36. 根据上述数据得到样本的频率分布表如表所示.分组 频数 频率[25,30] 3 0.12(30,35] 5 0.20(35,40] 8 0.32(40,45] n 1 f 1(45,50] n 2 f 2(1)确定样本频率分布表中n 1,n 2,f 1和f 2的值;(2)根据上述频率分布表,画出样本频率分布直方图和频率分布折线图. 【答案】(1) n 1=7,n 2=2,f 1=0.28,f 2=0.08 (2)见解析【解析】(1)由所给数据知,落在区间(40,45]内的有7个,落在(45,50]内的有2个,故1n =7,2n =2,所以f 1=125n =725=0.28,f 2=225n =225=0.08. (2)样本频率分布直方图和频率分布折线图如图所示.32. 为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是( )A .35B .48C .60D .75【答案】C【解析】设被抽查的美术生的人数为n ,因为后2个小组的频率之和为(0.0375+0.0125)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n =515250.75++=60.故选:C.3、某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为若低于60分的人数是15人,则该班的学生人数是( )A .B .C .D.【答案】B【解析】根据频率分布直方可知成绩低于60分的有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20,则成绩低于60分的频率P=(0.005+0.010)×20=0.3.又因为低于60分的人数是15人,所以该班的学生人数是15÷0.3=50.本题选择B选项.4、某校初三年级有400名学生,随机抽查了40名学生测试1分钟仰卧起坐的成绩(单位:次),将数据整理后绘制成如图所示的频率分布直方图.用样本估计总体,下列结论正确的是( )4A.该校初三学生1分钟仰卧起坐的次数的中位数为25B.该校初三学生1分钟仰卧起坐的次数的众数为24C.该校初三学生1分钟仰卧起坐的次数超过30的人数约有80D.该校初三学生1分钟仰卧起坐的次数少于20的人数约为8[解析] 第一组数据的频率为0.02×5=0.1,第二组数据的频率为0.06×5=0.3,第三组数据的频率为0.08×5=0.4,∴中位数在第三组内,设中位数为25+x,则x×0.08=0.5-0.1-0.3=0.1,∴x=1.25,∴中位数为26.25,故A错误;第三组数据所在的矩形最高,第三组数据的中间值为27.5,∴众数为27.5,故B错误;1分钟仰卧起坐的次数超过30的频率为0.2,∴超过30次的人数为400×0.2=80,故C正确;1分钟仰卧起坐的次数少于20的频率为0.1,∴1分钟仰卧起坐的次数少于20的人数为400×0.1=40,故D错误.故选C.[答案] C5、某家庭记录了未使用节水龙头50天的日用水量数据(单位:3m)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用[)0,0.1[)0.1,0.2[)0.2,0.3[)0.3,0.4[)0.4,0.5[)0.5,0.6[)0.6,0.756水量频数132 49 26 5使用了节水龙头50天的日用水量频数分布表日用水量[)0,0.1[)0.1,0.2 [)0.2,0.3 [)0.3,0.4 [)0.4,0.5 [)0.5,0.6频数151310165(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:7(2)估计该家庭使用节水龙头后,日用水量小于30.35m 的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【答案】(1)直方图见解析;(2)0.48;(3)347.45m . 【解析】(1)频率分布直方图如下图所示:(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于30.35m 的频率为0.20.110.1 2.60.120.050.48⨯+⨯+⨯+⨯=;因此该家庭使用节水龙头后日用水量小于30.35m 的概率的估计值为0.48; (3)该家庭未使用节水龙头50天日用水量的平均数为()110.0510.1530.2520.3540.4590.55260.6550.4850x =⨯+⨯+⨯+⨯+⨯+⨯+⨯=. 该家庭使用了节水龙头后50天日用水量的平均数为8()210.0510.1550.25130.35100.45160.5550.3550x =⨯+⨯+⨯+⨯+⨯+⨯=. 估计使用节水龙头后,一年可节省水()()30.480.3536547.45m -⨯=.6、某电视台为宣传本省,随机对本省内1565~岁的人群抽取了n 人,回答问题“本省内著名旅游景点有哪些”统计结果如图表所示(1)分别求出a b x y 、、、的值;(2)从第234、、组回答正确的人中用分层抽样的方法抽取6人,求第234、、组每组各抽取多少人?(3)指出直方图中,这组数据的中位数是多少(取整数值)?【答案】(1)5a =,27b =,0.9x =,0.2y =;(2)2人,3人,1人;(3)42【解析】(1)由已知第4组人数为9250.36=,∴251000.02510n ==⨯,9由频率分布直方图得第一组人数为:1000.011010⨯⨯=,100.55a =⨯=,第二组人数为:1000.021020⨯⨯=,180.920x ==, 第三组人数为:1000.031030⨯⨯=,300.927b =⨯=,第五组人数为:1000.0151015⨯⨯=,30.215x ==. (2)第2、3、4组回答正确人数分别18、27、9,共54人,设第234、、组分别抽取,,x y z 人,则65418279x y z===,解得2,3,1x y z ===. (3)第1、2组频率和为0.10.20.3+=,第4、5组频率和为0.250.150.4+=,第3组频率为0.3,设中位数为m ,则350.50.3100.3m --=,241423m =≈. ∴中位数为42.7、某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图.10(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数.【答案】(1)0.0075x =;(2)众数是230,中位数为224. 【解析】(1)由直方图的性质可得(0.0020.00950.0110.01250.0050.0025)201x ++++++⨯=,∴0.0075x =.(2)月平均用电量的众数是2202402302+=, ∵(0.0020.00950.011)200.450.5++⨯=<, 月平均用电量的中位数在[220,240)内,设中位数为a ,由(0.0020.00950.011)200.0125(220)0.5a ++⨯+⨯-=,可得224a =, ∴月平均用电量的中位数为2248、为参加学校的“我爱古诗词”知识竞赛,小王所在班级组织了一次古诗词知识测试,并将全班同学的分数(得分取正整数,满分为100分)进行统计,以下是根据这次测试成绩制作的不完整的频率分布表和频率分布直方图.频率分布表组别分组频数频率1 [50,60) 9 0.182 [60,70) a3 [70,80) 20 0.404 [80,90) 0.085 [90,100] 2 b合计 1请根据以上频率分布表和频率分布直方图,回答下列问题:(1)求出a,b,c,d的值;(2)老师说:“小王的测试成绩是全班同学成绩的中位数”,那么小王的测试成绩在什么范围内.1112【答案】(1) a =15,b =0.04,c =0.03,d =0.004 (2) 70≤x <80 【解析】(1)样本容量为9÷0.18=50,50×0.08=4, 所以a =50-9-20-4-2=15,b =2÷50=0.04,c =15÷50÷10=0.03,d =0.04÷10=0.004.(2)因为样本容量为50,则样本的中位数是第25,26个数据的平均数, 而第25,26个数据均位于70≤x <80范围内, 所以小王的测试成绩在70≤x <80范围内.9、某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[)50,60,[)60,70,[)70,80,[)80,90,[]90,100.分数段[)50,60[)60,70[)70,80[)80,90:x y1∶12∶13∶44∶513(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[)50,90之外的人数. 【答案】(1)0.005a =;(2)73(分);(3)10.【解析】(1)由频率分布直方图知(20.020.030.04)101a +++⨯=,解得0.005a =. (2)由频率分布直方图知这100名学生语文成绩的平均分为550.00510650.0410750.0310850.0210950.0051073⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=(分).(3)由频率分布直方图知语文成绩在[)50,60,[)60,70,[)70,80,[)80,90各分数段的人数依次为:0.005101005,0.041010040,0.031010030,0.021010020⨯⨯=⨯⨯=⨯⨯=⨯⨯=由题中给出的比例关系知数学成绩在上述各分数段的人数依次为1455,4020,3040,2025234⨯=⨯=⨯=.故数学成绩在[50,90)之外的人数为100(5204025)10-+++=.10.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值分[75,85) [85,95) [95,105) [105,115) [115,125) 组频数 6 26 38 22 8(I)在答题卡上作出这些数据的频率分布直方图:(II)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(III)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?14【答案】(1)见解析;(2)平均数100,方差为104;(3)不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.【解析】(1)直方图如图,(2)质量指标值的样本平均数为x=⨯+⨯+⨯+⨯+⨯=.800.06900.261000.381100.221200.08100质量指标值的样本方差为22222s=-⨯+-⨯+⨯+⨯+⨯=.(20)0.06(10)0.2600.38100.22200.08104(3)质量指标值不低于95的产品所占比例的估计值为++=,0.380.220.080.68由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.11、从某企业生产的某种产品中随机抽取100件,测量这些产品的某项质量指标,由测量1516结果得到如下频数分布表:质量指标值分组[)75,85[)85,95[)95,105[)105,115[)115,125频数62638228()1在图中作出这些数据的频率分布直方图;()2估计这种产品质量指标值的平均数、中位数(保留2位小数);()3根据以上抽样调査数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?【答案】(1)直方图见解析;(2)平均数100,中位数99.74;(3)不能. 【解析】()1由已知作出频率分布表为:质量指标值分组[)75,85 [)85,95 [)95,105 [)105,115 [)115,12517频数 6 26 38 22 8频率0.06 0.26 0.38 0.22 0.08由频率分布表作出这些数据的频率分布直方图为:()2质量指标值的样本平均数为:800.06900.261000.381100.221200.08100x =⨯+⨯+⨯+⨯+⨯=,[)75,95内频率为:0.060.260.32+=,∴中位数位于[)95,105内,设中位数为x ,则0.50.260.06951099.740.38x --=+⨯≈,∴中位数为99.74.()3质量指标值不低于95 的产品所占比例的估计值为0.380.220.080.68++=.由于该估计值小于0.8,故不能认为该企业生产的这种产品“质量指标值不低于95 的产品至少要占全部产品80%的规定.18。
高考数学频率分布直方图大题训练题(含答案)
频率分布直方图大题训练题一、解答题(共18题;共205分)1.(2020·龙岩模拟)某电讯企业为了了解某地区居民对电讯服务质量评价情况,随机调查100 名用户,根据这100名用户对该电讯企业的评分,绘制频率分布直方图,如图所示,其中样本数据分组为,,…… .(1)估计该地区用户对该电讯企业评分不低于70分的概率,并估计对该电讯企业评分的中位数;(2)现从评分在的调查用户中随机抽取2人,求2人评分都在的概率.2.(2020·芜湖模拟)某学校为了了解该校高三年级学生寒假在家自主学习的情况,随机对该校300名高三学生寒假的每天学习时间(单位:h)进行统计,按照,,,,的分组作出频率分布直方图如图所示.参考公式:,其中.参考附表:0.050 0.010 0.001(Ⅰ)根据频率分布直方图计算该校高三年级学生的平均每天学习时间(同一组中的数据用该组区间中点值代表);(Ⅱ)该校规定学习时间超过4h为合格,否则不合格.已知这300名学生中男生有140人,其中合格的有70人,请补全下表,根据表中数据,能否有99.9%的把握认为该校高三年级学生的性别与学习时长合格有关?3.(2020·泰安模拟)某水果批发商经销某种水果(以下简称A水果),购入价为300元/袋,并以360元/袋的价格售出,若前8小时内所购进的A水果没有售完,则批发商将没售完的A水果以220元/袋的价格低价处理完毕(根据经验,2小时内完全能够把A水果低价处理完,且当天不再购进).该水果批发商根据往年的销量,统计了100天A水果在每天的前8小时内的销售量,制成如下频数分布条形图.现以记录的100天的A水果在每天的前8小时内的销售量的频率作为A水果在一天的前8小时内的销售量的概率,记X表示A水果一天前8小时内的销售量,n表示水果批发商一天批发A水果的袋数.(1)求X的分布列;(2)以日利润的期望值为决策依据,在与中选其一,应选用哪个?4.(2020·南昌模拟)某产品自生产并投入市场以来,生产企业为确保产品质量,决定邀请第三方检测机构对产品进行质量检测,并依据质量指标Z来衡量产品的质量.当时,产品为优等品;当时,产品为一等品;当时,产品为二等品.第三方检测机构在该产品中随机抽取500件,绘制了这500件产品的质量指标Z的条形图.用随机抽取的500件产品作为样本,估计该企业生产该产品的质量情况,并用频率估计概率.(1)从该企业生产的所有产品中随机抽取4件,求至少有1件优等品的概率;(2)现某人决定购买80件该产品.已知每件成本1000元,购买前,邀请第三方检测机构对要购买的80件产品进行抽样检测,买家、企业及第三方检测机构就检测方案达成以下协议:从80件产品中随机抽出4件产品进行检测,若检测出3件或4件为优等品,则按每件1600元购买,否则按每件1500元购买,每件产品的检测费用250元由企业承担.记企业的收益为X元,求X的分布列与数学期望.5.(2020·南昌模拟)在“挑战不可能”的电视节目上,甲、乙、丙三个人组成的解密团队参加一项解密挑战活动,规则是由密码专家给出题目,然后由3个人依次出场解密,每人限定时间是1分钟内,否则派下一个人.3个人中只要有一人解密正确,则认为该团队挑战成功,否则挑战失败.根据甲以往解密测试情况,抽取了甲100次的测试记录,绘制了如下的频率分布直方图.(1)若甲解密成功所需时间的中位数为47,求a、b的值,并求出甲在1分钟内解密成功的频率;(2)在“挑战不可能”节目上由于来自各方及自身的心理压力,甲,乙,丙解密成功的概率分别为,其中表示第个出场选手解密成功的概率,并且定义为甲抽样中解密成功的频率代替,各人是否解密成功相互独立.①求该团队挑战成功的概率;②该团队以从小到大的顺序按排甲、乙、丙三个人上场解密,求团队挑战成功所需派出的人员数目X 的分布列与数学期望.6.(2020·江西模拟)冠状病毒是一个大型病毒家族,可引起感冒以及中东呼吸综合征(MERS)和严重急性呼吸综合征(SARS)等较严重疾病.出现的新型冠状病毒(nCoV)是从未在人体中发现的冠状病毒新毒株.人感染了新型冠状病毒后常见体征有呼吸道症状、发热、咳嗽、气促和呼吸困难等.在较严重病例中,感染可导致肺炎、严重急性呼吸综合征、肾衰竭,甚至死亡.某医院为筛查冠状病毒,需要检测血液中的指标A.现从采集的血液样品中抽取500份检测指标A的值,由测量结果得下侧频率分布直方图:(1)求这500份血液样品指标A值的平均数和样本方差(同一组数据用该区间的中点值作代表,记作);(2)由频率分布直方图可以认为,这项指标的值X服从正态分布,其中近似为样本平均数,近似为样本方差.在统计学中,把发生概率小于3‰的事件称为小概率事件(正常条件下小概率事件的发生是不正常的).该医院非常关注本院医生健康状况,随机抽取20名医生,独立的检测血液中指标A的值,结果发现4名医生血液中指标A的值大于正常值20.03,试根据题中条件判断该院医生的健康率是否正常,并说明理由.附:参考数据与公式:,,;若,则① ;② ;③.,,,.7.(2020·江西模拟)年前某市质监部门根据质量管理考核指标对本地的500家食品生产企业进行考核,然后通过随机抽样抽取其中的50家,统计其考核成绩(单位:分),并制成如下频率分布直方图.(1)求这50家食品生产企业考核成绩的平均数(同一组中的数据用该组区间的中点值为代表)及中位数a(精确到0.01)(2)该市质监部门打算举办食品生产企业质量交流会,并从这50家食品生产企业中随机抽取4家考核成绩不低于88分的企业发言,记抽到的企业中考核成绩在的企业数为X,求X的分布列与数学期望(3)若该市食品生产企业的考核成绩X服从正态分布其中近似为50家食品生产企业考核成绩的平均数,近似为样本方差,经计算得,利用该正态分布,估计该市500家食品生产企业质量管理考核成绩高于90.06分的有多少家?(结果保留整数).附参考数据与公式:则,.8.(2020·漯河模拟)十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康.经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入、实现2020年脱贫的工作计划,该地扶贫办统计了2019年50位农民的年收入并制成如下频率分布直方图:附参考数据:,若随机变量X服从正态分布,则,,.(1)根据频率分布直方图,估计50位农民的平均年收入(单位:千元);(同一组数据用该组数据区间的中点值表示);(2)由频率分布直方图,可以认为该贫困地区农民年收入X服从正态分布,其中近似为年平均收入,近似为样本方差,经计算得=6.92,利用该正态分布,求:①在扶贫攻坚工作中,若使该地区约有占总农民人数的的农民的年收入高于扶贫办制定的最低年收入标准,则最低年收入标准大约为多少千元?②为了调研“精准扶贫,不落一人”的政策要求落实情况,扶贫办随机走访了1000位农民.若每位农民的年收入互相独立,问:这1000位农民中的年收入不少于12.14千元的人数最有可能是多少?9.(2017·黑龙江模拟)某学生社团在对本校学生学习方法开展问卷调查的过程中发现,在回收上来的1000份有效问卷中,同学们背英语单词的时间安排共有两种:白天背和晚上临睡前背.为研究背单词时间安排对记忆效果的影响,该社团以5%的比例对这1000名学生按时间安排粪型进行分层抽样,并完成一项实验,实验方法是,使两组学生记忆40个无意义音节(如xIQ、GEH),均要求在刚能全部记清时就停止识记,并在8小时后进行记忆测验.不同的是,甲组同学识记结束后一直不睡觉,8小时后测验;乙组同学识记停止后立刻睡觉,8小时后叫醒测验.两组同学识记停止8小时后的准确回忆(保持)情况如图(区间含左端点而不舍右端点)(1)估计1000名被调查的学生中识记停止后8小时40个音节的保持率大于等于60%的人数;(2)从乙组准确回忆结束在|12,24)范围内的学生中随机选3人,记能准确回忆20个以上(含20)的人数为随机变量x.求X分布列及数学期望;(3)从本次实验的结果来看,上述两种时间安排方法中哪种方法背英语单词记忆效果更好?计算并说明理由.10.(2018·南宁模拟)在某单位的食堂中,食堂每天以10元/斤的价格购进米粉,然后以4.4元/碗的价格出售,每碗内含米粉0.2斤,如果当天卖不完,剩下的米粉以2元/斤的价格卖给养猪场.根据以往统计资料,得到食堂某天米粉需求量的频率分布直方图如图所示,若食堂购进了80斤米粉,以(斤)(其中)表示米粉的需求量,(元)表示利润.(1)估计该天食堂利润不少于760元的概率;(2)在直方图的需求量分组中,以区间中间值作为该区间的需求量,以需求量落入该区间的频率作为需求量在该区间的概率,求的分布列和数学期望.11.(2020·辽宁模拟)某城市100户居民的月平均用电量(单位:度),以,,,,,,分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为,,,的四组用户中,用分层抽样的方法抽取户居民,则月平均用电量在的用户中应抽取多少户?12.(2020·大连模拟)某校从参加高三模拟考试的学生中随机抽取名学生,将其数学成绩(均为整数)分成六段后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:(1)求分数在内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分;(3)用分层抽样的方法在分数段为的学生中抽取一个容量为的样本,将该样本看成一个总体,从中任取个,求至多有人在分数段内的概率.13.(2020·莆田模拟)为了解某地网民浏览购物网站的情况,从该地随机抽取100名网民进行调查,其中男性、女性人数分别为45和55.下面是根据调查结果绘制的网民日均浏览购物网站时间的频率分布直方图,将日均浏览购物网站时间不低于40分钟的网民称为“网购达人”,已知“网购达人”中女性有10人.参考公式:,其中.参考数据:0.102.7063.841 5.024 6.635 7.879 10.828(1)根据已知条件完成下面的列联表,并判断是否有90%的把握认为是否为“网购达人”与性别有关;(2)将上述调査所得到的频率视为概率,现在从该地的网民中随机抽取3名,记被抽取的3名网民中的“网购达人”的人数为X,求X的分布列、数学期望和方差.14.(2020·长春模拟)笔、墨、纸、砚是中国独有的文书工具,即“文房四宝”.笔、墨、纸、砚之名,起源于南北朝时期,其中的“纸”指的是宣纸,宣纸“始于唐代,产于泾县”,而唐代泾县隶属于宣州府管辖,故因地而得名“宣纸”,宣纸按质量等级,可分为正牌和副牌(优等品和合格品),某公司年产宣纸10000刀(每刀100张),公司按照某种质量标准值给宣纸确定质量等级,如下表所示:公式在所生产的宣纸中随机抽取了一刀(100张)进行检验,得到频率分布直方图如图所示,已知每张正牌纸的利润是10元,副牌纸的利润是5元,废品亏损10元.(1)估计该公式生产宣纸的年利润(单位:万元);(2)该公司预备购买一种售价为100万元的机器改进生产工艺,这种机器的使用寿命是一年,只能提高宣纸的质量,不影响产量,这种机器生产的宣纸的质量标准值的频率,如下表所示:其中为改进工艺前质量标准值的平均值,改进工艺后,每张正牌和副牌宣纸的利润都下降2元,请判断该公司是否应该购买这种机器,并说明理由.15.(2020·蚌埠模拟)随着网购人数的日益增多,网上的支付方式也呈现一种多样化的状态,越来越多的便捷移动支付方式受到了人们的青睐,更被网友们评为“新四大发明”之一.随着人们消费观念的进步,许多人喜欢用信用卡购物,考虑到这一点,一种“网上的信用卡”横空出世——蚂蚁花呗.这是一款支付宝和蚂蚁金融合作开发的新支付方式,简单便捷,同时也满足了部分网上消费群体在支付宝余额不足时的“赊购”消费需求.为了调查使用蚂蚁花呗“赊购”消费与消费者年龄段的关系,某网站对其注册用户开展抽样调查,在每个年龄段的注册用户中各随机抽取100人,得到各年龄段使用蚂蚁花呗“赊购”的人数百分比如图所示.参考答案:,.(1)由大数据可知,在18到44岁之间使用花呗“赊购”的人数百分比y与年龄x成线性相关关系,利用统计图表中的数据,以各年龄段的区间中点代表该年龄段的年龄,求所调查群体各年龄段“赊购”人数百分比y与年龄x的线性回归方程(回归直线方程的斜率和截距保留两位有效数字);(2)该网站年龄为20岁的注册用户共有2000人,试估算该网站20岁的注册用户中使用花呗“赊购”的人数;(3)已知该网店中年龄段在18-26岁和27-35岁的注册用户人数相同,现从18到35岁之间使用花呗“赊购”的人群中按分层抽样的方法随机抽取8人,再从这8人中简单随机抽取2人调查他们每个月使用花呗消费的额度,求抽取的两人年龄都在18到26岁的概率.16.(2020·辽宁模拟)港珠澳大桥是一座具有划时代意义的大桥.它连通了珠海香港澳门三地,大大缩短了三地的时空距离,盘活了珠江三角洲的经济,被誉为新的世界七大奇迹.截至2019年10月23日8点,珠海公路口岸共验放出入境旅客超过1400万人次,日均客流量已经达到4万人次,验放出入境车辆超过70万辆次,2019年春节期间,客流再次大幅增长,日均客流达8万人次,单日客流量更是创下11.3万人次的最高纪录.2019年从五月一日开始的连续100天客流量频率分布直方图如下(1)①同一组数据用该区间的中点值代替,根据频率分布直方图.估计客流量的平均数.②求客流量的中位数.(2)设这100天中客流量超过5万人次的有天,从这天中任取两天,设为这两天中客流量超过7万人的天数.求的分布列和期望.17.(2020·江门模拟)2019年7月1日到3日,世界新能源汽车大会在海南博鳌召开,大会着眼于全球汽车产业的转型升级和生态环境的持续改善.某汽车公司顺应时代潮流,最新研发了一款新能源汽车,并在出厂前对100辆汽车进行了单次最大续航里程(理论上是指新能源汽车所装载的燃料或电池所能够提供给车行驶的最远里程)的测试.现对测试数据进行分析,得到如图的频率分布直方图.(1)估计这100辆汽车的单次最大续航里程的平均值(同一组中的数据用该组区间的中点值代表);(2)根据大量的汽车测试数据,可以认为这款汽车的单次最大续航量程X近似地服从正态分布,经计算第(1)问中样本标准差s的近似值为50.用样本平均数作为的近似值,用样本标准差s作为的估计值,现任取一辆汽车,求它的单次最大续航里程恰在250千米到400千米之间的概率;(3)某汽车销售公司为推广此款新能源汽车,现面向意向客户推出“玩游戏,送大奖”活动,客户可根据抛掷硬币的结果,操控微型遥控车在方格图上行进,若遥控车最终停在“胜利大本营”,则可获得购车优惠券.已知硬币出现正,反面的概率都是,方格图上标有第0格、第1格、第2格……第50格.遥控车开始在第0格,客户每掷一次硬币,遥控车向前移动一次,若掷出正面,遥控车向前移动一格(从k到),若掷出反面,遥控车向前移动两格(从k到),直到遥控车移到第49格(胜利大本营)或第50格(失败大本营)时,游戏结束.设遥控车移到第n格的概率为,试证明是等比数列,并解释此方案能否成功吸引顾客购买该款新能源汽车.参考数据:若随机变量服从正态分布,则,,.18.(2020·肇庆模拟)某公司新上一条生产线,为保证新的生产线正常工作,需对该生产线进行检测,现从该生产线上随机抽取100件产品,测量产品数据,用统计方法得到样本的平均数,标准差,绘制如图所示的频率分布直方图,以频率值作为概率估值.(1)从该生产线加工的产品中任意抽取一件,记其数据为,依据以下不等式评判(表示对应事件的概率)①②③评判规则为:若至少满足以上两个不等式,则生产状况为优,无需检修;否则需检修生产线,试判断该生产线是否需要检修;(2)将数据不在内的产品视为次品,从该生产线加工的产品中任意抽取2件,次品数记为,求的分布列与数学期望.答案解析部分一、解答题1.【答案】(1)解:由题意,该地区用户对该电讯企业评分的频率分布如下表:因此可估计评分不低于70分的概率为;对该电讯企业评分的中位数设为x,可得,则,解得,所以可估计对该电讯企业评分的中位数为;(2)解:受调查用户评分在的有人,若编号依次为1,2,3,4,从中选2人的事件有、、、、、,共有个基本事件;受调查用户评分在的有人,若编号依次为1,2,3,..9,10,从中选2人,可得共有个基本事件;因此2人评分都在的概率.【解析】【分析】(1)由题意列出频率分布表,求和即可估计该地区用户对该电讯企业评分不低于70分的概率;利用中位数两侧的概率和相等列方程即可估计对该电讯企业评分的中位数;(2)由题意计算出受调查用户评分在、的人数,求出总的基本事件个数及满足要求的基本事件的个数,由古典概型概率公式即可得解.2.【答案】解:(Ⅰ)高三年级学生平均每天的学习时间为:(h);(Ⅱ)300名学生中合格的人数为(人),故补全表格如下:所以所以有99.9%的把握认为该校高三年级学生的性别与学习时长合格有关.【解析】【分析】(Ⅰ)根据频率分布直方图直接计算平均值即可;(Ⅱ)先求出300名学生中合格的人数,再补全表格,然后根据表格数据和公式计算,最后将与进行比较,进而得出结论.3.【答案】(1)解:由题意知,根据条形图,可得A水果在每天的前8小时内的销售量分别为14,15,16,17的频率分别是0.2,0.3,0.4和0.1 ,所以X的分布列为140.2(2)解:当时,设Y为水果批发商的日利润,则Y的可能取值为760,900,可得,所以期望,当时,设Z为水果批发商的日利润,则Z的可能取值为680,820,960,可得,所以期望.因为,综上可知,当时的日利润期望值大于时的日利润期望值,故答案为:.【解析】【分析】(1)由题意知,根据条形图,得到销售量分别为14,15,16,17的频率,进而得到随机变量X的分布列;(2)分别求得当和时,利润的数学期望,比较即可得到结论.4.【答案】(1)解:由题意知,500件产品中共有优等品件,则从样本中随机取一件为优等品的概率为,所以从该企业生产的所有产品中随机抽取4件,没有一件是优等品的概率为,则随机抽取4件,至少有1件优等品的概率为.(2)解:检测出3件或4件为优等品时,检测出的优等品低于3件时,,由题意知,,故X的分布列为所以数学期望.【解析】【分析】(1)先求出从样本中随机取一件为优等品的概率,再求从该企业生产的所有产品中随机抽取4件,没有一件是优等品的概率,从而可求出至少有一件是优等品的概率.(2)由题意求出检测出3件或4件为优等品时及检测出的优等品低于3件时的X的值,结合第一问求出,,从而可得X的分布列,即可计算其数学期望5.【答案】(1)解:甲解密成功所需时间的中位数为47,,解得,,解得,由频率分布直方图知,甲在分钟内解密成功的频率是;(2)解:①由题意及(1)可知第一个出场选手解密成功的概率为,第二个出场选手解密成功的概率为,第三个出场选手解密成功的概率为,所以该团队挑战成功的概率为;②由①可知按从小到大的顺序的概率分别、、,根据题意知的取值为、、,则,,,所以所需派出的人员数目的分布列为:因此,.【解析】【分析】(1)根据中位数左右两边的矩形面积之和均为0.5可求得a、b的值,并根据频率分布直方图求得甲在1分钟内解密成功的频率;(2)①由(1)得出,求出、的值,由此得出该团队挑战成功的概率为;②由题意可得出随机变量X的可能取值有1、2、3,利用独立事件的概率乘法公式计算出随机变量X在不同取值下的概率,据此可得出随机变量X的分布列,结合期望公式可计算出X的数学期望值.6.【答案】(1)解:根据题意,由频率分布直方图可知,500份血液样品指标A值的平均数为:,500份血液样品指标A值的样本方差为:.(2)解:由题意知:指标的值服从正态分布,,,则,所以,.随机抽取20名医生独立检测血液中指标的值,就相当于进行了20次独立重复试验,记“20名医生中出现4名医生血液中指标的值大于正常值20,03”为事件,则,所以从血液中指标的值的角度来看:该院医生的健康率是正常的.【解析】【分析】(1)由频率分布直方图,直接利用平均数和方差公式,求出500份血液样品指标值的平均数和样本方差;(2)由(1)得出指标的值服从正态分布,从而可求出,在根据独立重复试验中的概率求法,求出20名医生中出现4名医生血液中指标的值大于正常值20.03的概率,即可判断该院医生的健康率是否正常7.【答案】(1)解:由题意,这50家食品生产企业考核成绩的平均数为:(分),由频率分布图可知内,所以,解得分.(2)解:根据题意,这50家食品生产企业中考核成绩不低于88分的企业有:(家),其中考核成绩在内的企业有(家),所以X可能取值有0,1,2,3,4则,,,,,所以X的分布列为所以.(3)解:由题意得,所以,所以,所以(家),所以500家食品生产企业质量管理考核成绩高于90.06分的有79家.【解析】【分析】(1)利用频率分布直方图的性质能求出这50家食品生产企业考核成绩的平均数和中位数;(2)由已知得到考核成绩在内的企业有5家,得出随机变量的可能取值,分别求出相应的概率和分布列,求得数学期望;(3)根据题意得,由此估计该市500家食品生产企业质量管理考核成绩高于90.06分的企业个数.8.【答案】(1)解:千元.故估计50位农民的年平均收入为17.40千元.(2)解:由题意知,① ,所以时,满足题意,即最低年收入大约为14.77千元.②由,每个农民的年收入不少于12.14千元的事件的概率为0.9773,记1000个农民的年收入不少于12.14千元的人数为则,其中于是恰好有k个农民的年收入不少于12.14千元的事件概率为,。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高考题型之频率分布直方图
知识点:ﻩ错误!未定义书签。
典型例题:1 -ﻩ-
答案1 -ﻩ-
知识点:
典型例题:
1.某工厂对一批产品进行了抽样检测.有图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100), [100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是
(A)90 (B)75 (C)60(D)45
2.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……第六组,成绩大于等于18秒且小于19秒。
右图是按上述分组方法得到的频率分布直方图。
设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为
(A)0.9,35(B) 0.9,45(C)0.1,35(D) 0.1,45
3.某个小区住户共200户,为调查小区居民的7月份用水量,用分层抽样的方法抽取了50户进行调查,得到本月的用水量(单位:m3)的频率分布直方图如图所示,则小区内用水量超过15m3的住户的户数为
A.10 B.50 C.60 D.140
4.某时段内共有100辆汽车经过某一雷达地区,时速频率分布直方图如右图所示,则时速超过60km/h的汽车数量为_____________;
5.某个容量为100的样本的频率分布直方图如下,则在区间[4,5)上的数据的频数
..为.
6.某地区教育主管部门为了对该地区模拟考试成绩进行分析,抽取了总成绩介于350分到650分之间的10000名学生成绩,并根据这10000名学生的总成绩画了样本的频率分布直方图.为了进一步分析学生的总成绩与各科成绩等方面的关系,要从这10000名学生中,再用分层抽样方法抽出200人作进一步调查,则总成绩在[400,500)内共抽出( )
A.100人B.90人C.65人 D.50人
7.济南交警部门随机测量了顺河高架桥南下口某一时间段经过的2000辆汽车的时速,时速频率分布直方图如图所示,则时速超过70km/h的汽车数量为_______
8.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg),得到频率分布直方图如下:
根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是 ( )
(A)20 (B)30 (C)40 (D)50
9.一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2500,3000)(元)月收入段应抽出人.
10.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图)。
由图中数据可知
a=。
若要从身高在[120 , 130),[130,140),[140,150]三组内的学生中,用分层抽样的
方法选取18人参加一项活动,则从身高在[140 ,150]内的学生中选取的人数应为。
11.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则其抽样的100根中,有____根在棉花纤维的长度小于20m m。
本类题的特征是:__________________________________________________________________________________
__________________________________________________________________________________________________
本类题的做法是:__________________________________________________________________________________
__________________________________________________________________________________________________
答案
1.【解析】:产品净重小于100克的概率为(0.050+0.100)×2=0.300, 已知样本中产品净重小于100克的个数是36,设样本容量为n ,则300.036=n
,所以120=n ,净重大于或等于98克并且小于104克的产品的概率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.故选A.
2. A .【分析】:从频率分布直方图上可以看出0.9x =,35y =.
3.C【解析】以50为样本容量可计算出超过3
15m 用水量的户数为()50.050.015015,⨯+⨯=所以可估算200户居民超过315m 用水量的户数60.
4. 38 5. 30 6.B 7.200 8.C 9.25 10.答案:0.030 3
11. [解析]考查频率分布直方图的知识。
100×(0.001+0.001+0.004)×5=30。