高考题型之频率分布直方图.docx
频数(率)分布直方图(详细解析+考点分析+名师点评)-1.doc
频数(率)分布直方图(详细解析+考点分析+名师点评)-1.doc答案与评分标准一、选择题(共20小题)1、夷昌中学开展“阳光体育活动”,九年级一班全体同学在2011年4月18日16时分别参加了巴山舞、乒乓球、篮球三个项目的活动,陈老师在此时统计了该班正在参加这三项活动的人数,并绘制了如图所示的频数分布直方图和扇形统计图.根据这两个统计图,可以知道此时该班正在参加乒乓球活动的人数是()A、50B、25C、15D、102、为了支援地震灾区同学,某校开展捐书活动,九(1)班40名同学积极参与.现将捐书数量绘制成频数分布直方图如图所示,则捐书数量在5.5~6.5组别的频率是()A、0.1B、0.2C、0.3D、0.4考点:频数(率)分布直方图。
分析:频率=,从直方图可知在5.5~6.5组别的频数是8,总数是40可求出解.解答:解:∵在5.5~6.5组别的频数是8,总数是40,∴=0.2.故选B.点评:本题考查频数分布直方图,从直方图上找出该组的频数,根据频率=,可求出解.3、某学校为了了解九年级体能情况,随机选取20名学生测试一分钟仰卧起坐次数,并绘制了如图的直方图,学生仰卧起坐次数在25~30之间的频率为()A、0.1B、0.17C、0.33D、0.4考点:频数(率)分布直方图。
专题:应用题;图表型。
分析:首先根据频数分布直方图可以知道仰卧起坐次数在25~30之间的频数,然后除以总次数(30)即可得到仰卧起坐次数在25~30之间的频率.解答:解:∵从频数率分布直方图可以知道仰卧起坐次数在25~30之间的频数为12,而仰卧起坐总次数为:3+10+12+5=30,∴学生仰卧起坐次数在25~30之间的频率为12÷30=0.4.故选D.点评:本题考查读频数分布直方图的能力和利用统计图获取信息的能力;利用统计图获取信息时,必须认真观察、分析、研究统计图,才能作出正确的判断和解决问题.4、学校为了解七年级学生参加课外兴趣小组活动情况,随机调查了40名学生,将结果绘制成了如图所示的频数分布直方图,则参加绘画兴趣小组的频率是()A、0.1B、0.15C、0.25D、0.3考点:频数(率)分布直方图。
(学习指导) 频率分布直方图Word版含解析
3.2频率分布直方图学习目标核心素养1.学会用频率分布表,画频率分布直方图表示样本数据.(重点)2.能通过频率分布表或频率分布直方图对数据做出总体统计.(难点、易混点)1.通过对频率分布直方图画法的学习,培养数据分析素养.2.通过与频率分布直方图有关的计算,培养数学运算素养.频率分布直方图中每个矩形的底边长是该组的组距,矩形的高是该组的频率与组距的比,从而矩形的面积等于这个组的频率,即矩形的面积=组距×频率组距=频率.我们把这样的图叫作频率分布直方图.频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小.2.频率分布直方图的应用当考虑数据落在若干个组内的频率之和时,可以用相应矩形面积之和来表示.3.画频率分布直方图的步骤(1)计算极差:即一组数据中最大值和最小值的差;(2)确定组距与组数:当数据在120个以内时,通常按照数据的多少分成5~12组,在实际操作中,一般要求各组的组距相等.(3)分组:按组距将数据分组,分组时,各组均为左闭右开区间,最后一组是闭区间.(4)列表:一般分四列:宽度分组、频数、频率、频率组距.其中频数合计应是样本容量,频率合计是1.(5)画频率分布直方图:画图时,应以横轴表示分组,纵轴表示频率组距组距上的频率等于该组上的小长方形的面积.即每个小长方形的面积=组距×频率组距=频率.4.频率折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.有时也用它来估计总体的分布情况.随着样本容量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.思考:1.为什么需要用频率分布直方图对原始数据进行整理?[提示]因为通过抽样获得的原始数据多而且杂乱,无法直接从中理解它们的含义,并提取信息,也不便于我们用它来传递信息.正因为如此我们才用频率分布直方图来整理数据.2.为什么要对样本数据进行分组?[提示]不分组很难看出样本中的数字所包含的信息,分组后,计算出频率,从而估计总体的分布特征.1.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为()A.20B.30C.40D.50B[样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.]2.已知样本10,8,10,8,6,13,11,10,12,7,9,8,12,9,11,12,9,10,11,10,那么频率为0.2的范围是()A.5.5~7.5 B.7.5~9.5C.9.5~11.5 D.11.5~13.5D[由题意知,共20个数据,频率为0.2,在此范围内的数据有20×0.2=4个,只有在11.5~13.5范围内有4个数据:13,12,12,12,故选D.]3.某地为了了解该地区10 000户家庭的用电情况,采用分层随机抽样的方法抽取了500户家庭的月平均用电量,并根据这500户家庭的月平均用电量画出频率分布直方图如图所示,则该地区10 000户家庭中月平均用电度数在[70,80)的家庭有________户.1 200[根据频率分布直方图得该地区10 000户家庭中月平均用电度数在[70,80)的家庭有10 000×0.012×10=1 200(户).]频率分布直方图的绘制【例1】考察某校初二年级男生的身高,随机抽取40名初二男生,实测身高数据(单位:cm)如下:171 163 163 166 166 168 168 160 168 165171 169 167 169 151 168 170 160 168 174165 168 174 159 167 156 157 164 169 180176 157 162 161 158 164 163 163 167 161(1)作出频率分布表;(2)画出频率分布直方图和频率折线图.[解](1)最低身高151,最高身高180,它们的极差为180-151=29.确定组距为3,组数为10,列表如下:(2)频率分布直方图和频率折线图如图所示.绘制频率分布直方图应注意的问题(1)在绘制出频率分布表后,画频率分布直方图的关键就是确定小矩形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“频率组距”所占的比例来定高.如我们预先设定以“”为1个单位长度,代表“0.1”,则若一个组的频率组距为0.2,则该小矩形的高就是“”(占两个单位长度),如此类推.(2)数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.[跟进训练]1.如表所示给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).区间界限[122,126)[126,130)[130,134)[134,138)[138,142) 人数58102233区间界限[142,146)[146,150)[150,154)[154,158]人数201165(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.[解](1)样本频率分布表如下:分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28(2)其频率分布直方图如下:(3)由样本频率分布表可知,身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.频率分布直方图的应用【例2】为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?[解](1)第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校高一年级学生的达标率为17+15+9+32+4+17+15+9+3×100%=88%.频率分布直方图的性质(1)因为小矩形的面积=组距×频率组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.(2)在频率分布直方图中,各小矩形的面积之和等于1.(3)样本容量=频数相应的频率.[跟进训练]2.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140D[由频率分布直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,故每周自习时间不少于22.5小时的人数为0.7×200=140.故选D.]频率分布与数字特征的综合应用[探究问题]1.什么是一组数据的众数,中位数,平均数?提示:设一组数据为x1,x2,…,x n,则其中出现次数最多的数是众数,把这n个数据按照从小到大的顺序排列,最“中间”的数就是中位数,即当n为奇数时,中间的一个数就是本组数据的中位数;当n为偶数时,中间的两个数的平均数就是本组数据的中位数.本组数据的平均数x=x1+x2+…+x nn.2.如何利用频率分布直方图估计数据的众数、中位数和平均数?提示:(1)众数是最高的矩形的底边的中点;(2)中位数左右两侧小矩形的面积相等;(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.【例3】某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:(1)高一参赛学生成绩的众数、中位数;(2)高一参赛学生的平均成绩.[思路点拨](1)根据频率分布直方图的数据,最高小矩形的底边中点就是数据的众数,数据的中位数左右两边的面积和相等,都等于0.5;(2)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.[解](1)由题图可知众数为65,又∵第一个小矩形的面积为0.3,∴设中位数为60+x,则0.3+x×0.04=0.5,得x=5,∴中位数为60+5=65.(2)依题意,x=55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,∴平均成绩约为67分.1.利用频率分布直方图估计数字特征(1)众数是最高的矩形的底边的中点;(2)中位数左右两侧小矩形的面积相等;(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.2.利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.1.总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2.当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.3.绘制频率分布直方图的步骤:(1)计算极差,(2)决定组距与组数,(3)分组,(4)列频率分布表,(5)绘制频率分布直方图.1.思考辨析(正确的画“√”,错误的画“×”)(1)频率分布直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值.()(2)频率分布直方图中小矩形的面积表示该组的个体数.()(3)频率分布直方图中所有小长方形面积之和为1.()[提示](1)正确.(2)错误.频率分布直方图中小矩形的面积表示该组的频率.(3)正确.[答案](1)√(2)×(3)√2.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.18C[志愿者的总人数为20(0.24+0.16)×1=50,所以第三组人数为50×0.36×1=18,所以有疗效的人数为18-6=12.]3.某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如图所示.已知图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________.1000.15[设参赛的人数为n,第二小组的频率为0.4,依题意40n=0.4,∴n=100,优秀的频率=0.10+0.05=0.15.]4.随机抽取100名学生,测得他们的身高(单位:cm),按照区间[160,165),[165,170),[170,175),[175,180),[180,185]分组,得到样本身高的频率分布直方图如图所示.(1)求频率分布直方图中x的值及身高在170 cm以上的学生人数;(2)将身高在[170,175),[175,180),[180,185]区间内的学生依次记为A,B,C三个组,用分层随机抽样的方法从这三个组中抽取6人,求这三个组分别抽取的学生人数.[解](1)由频率分布直方图可知5×(0.01+0.02+0.04+x+0.07)=1,解得x=0.06.身高在170 cm以上的学生人数为100×(0.06×5+0.04×5+0.02×5)=60(人).(2)A组人数为100×0.06×5=30(人),B组人数为100×0.04×5=20(人),C组人数为100×0.02×5=10(人),由题意可知抽样比k=660=1 10,故应从A,B,C三组中分别抽取30×110=3(人),20×110=2(人),10×110=1(人).。
2.2.1频率分布直方图
41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.3 32.5 34.6 33.0 30.8 31.0 28.6 31.5 28.8
28.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.1
32.8 29.4 25.6 24.7 30.0 30.1 29.5 30.3
必修3 第二章
统 计
栏目导引
(1)将数据进行适当的分组,并画出相应的频率 分布直方图和频率分析折线图. (2)用自己的语言描述一下历届美国总统就任时 年龄的分布情况. 解析: (1)以4为组距,列表如下:
必修3 第二章
统 计
栏目导引
分组
频数累计
频数
频率
[41.5,45.5) [45.5,49.5) [49.5,53.5) [53.5,57.5) [57.5,61.5) [61.5,65.5) [65.5,69.5]
必修3 第二章
统 计
栏目导引
[策略点睛]
必修3 第二章
统 计
栏目导引
[解题过程] 甲、乙两人数学成绩的茎叶图如 图所示.从这个茎叶图上可以看出,乙同学的 得分情况是大致对称的,中位数是98分;甲同 学的得分情况除一个特殊得分外,也大致对称, 中位数是88分,但分数分布相对于乙来说,趋 向于低分阶段.因此乙同学发挥比较稳定,总 体得分情况比甲同学好.
必修3 第二章
统 计
栏目导引
2.某良种培育基地正在培育一种 小麦新品种 A,将其与原有的一个优良品种 B 进行对照试验,两种小麦各种植了 25 亩,所得 亩产数据(单位:千克)如下:
必修3 第二章
统 计
栏目导引
品种A: 357,359,367,368,375,388,392,399,400,405,412,41 4,415,421,423,423,427,430,430,434,443,445,445, 451,454 品种B: 363,371,374,383,385,386,391,392,394,394,395,39 7,397,400,401,401,403,406,407,410,412,415,416, 422,430 (1)完成数据的茎叶图; (2)用茎叶图处理现有的数据,有什么优点?
高考数学复习点拨 频率分布直方图典型例题析
频率分布直方图典型例题析频率分布直方图是表达和分析数据的重要工具,还可以直观、准确地理解相应的有用的信息,所以成为新高考的重点,我们必须总结其重要题型及有关计算。
一、基本概念类例1、关于频率 分布直方图的下列说法中,正确的是( )(A )、直方图的高表示某数的频率;(B )、直方图的高表示该组上的个体在样本中出现的频率;(C )、直方图的高表示该组上的个体与组距的比值;(D )、直方图的高表示该组上的个体在样本中出现的频率与组距的比值;解析:在频率分布直方图中,每一个小矩形都是等宽的,即等于组距,其面积表示数据的取值落在相应区间上的频率,因此每一个小矩形的高表示该组上的个体在样本中出现的频率与组距的比值,所以选(D )。
二、识图计算类例2、为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这100名学生中体重在[56.5,64.5)的学生人数是 ( )(A)20 (B)30(C)40 (D )50解:本题主要考查频率分布直方图和总体分布的估计等知识,同时考查图形的识别能力。
由频率直方图可知组距为2,故学生中体重在[56.5,64.5)的频率为:(0.03+0.05+0.05+0.07)×2=0.4,所以100名学生中体重在[56.5,64.5)的学生人数有: 0. 4×100=40人。
故选择C 点评:在频率分布直方图中,每一个小矩形都是等宽的,即等于组距,高是,所以有:×组距=频率;即可把所求范围内的频率求出,进而求该范围的人数。
例3:某校高一某班共有64名学生,下图是该班某次数学考试成绩的频率分布直方图,根据该图可知,成绩在110120间的同学大约有( )A 、 10B 、11C 、13D 、16解析:通过直方图可知:成绩在110120的频率是:2.023.015.01.005.01=----,所以成绩在110120之间的同学大约有:64×0.2=12.813≈人。
概率专题:频率分布直方图
例 8.某校在一次期末数学测试中,为统计学生的考试情况,从学校的 2000 名学生中随机抽取 50 名学生的
考试成绩,被测学生成绩全部介于 65 分到 145 分之间(满分 150 分)
,将统计结果按如下方式分成八组:
第一组[65,75)
,第二组[75,85),……第八组[135,145],如图是按上述分组方法得到的频率分布直方
区住户的满意度等级为不满意的概率大?若是要选择一个物业公司来管理老旧小区的物业,从满意度角
度考虑,应该选择哪一个物业公司?说明理由.
【解析】解:(Ⅰ)作出如图所示的频率分布直方图,
B 区住户满意度评分的频率分布直方图如图所示
A 区住户满意度评分的平均值为 45×0.1+55×0.2+65×0.3+75×0.2+85×0.15+95×0.05=67.5;
)内,
设中位数为 m,则 0.20+0.24+(m﹣70)×0.036=0.5,
解得 m≈71.67,
所以中位数约为 71.67.
例 11.某高中数学建模兴趣小组的同学为了研究所在地区男高中生的身高与体重的关系,从若干个高中男
在[120,140)之间的学生人数为:100×(10×0.030+0.020)=50 人,
1
又用分层抽样的方法在[120,140)之间的学生 50 人中抽取 5 人,即抽取比例为: ,
10
1
所以成绩在[120,130)之间的学生中抽取的人数应,30× 10 =3,即 b=3,
故选:D.
例 2.从某企业生产的某种产品中随机抽取 100 件,测量这些产品的一项质量指标值,由测量表得如下频数
高中数学复习典型题专题训练118---频率直方图
高中数学复习典型题专题训练118频率直方图列出样本数据的频率分布表和频率分布直方图的步骤: ①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:取组距,用极差组距决定组数;③决定分点:决定起点,进行分组;④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图,知小长方形的面积=组距×频率组距=频率.频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x 来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.题型一 频率分布直方图【例1】 (2010西城二模)某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.知识内容典例分析板块二.频率直方图则这200名同学中成绩大于等于80分且小于90分的学生有______名.【例2】 (2010东城二模)已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内的样本频数为 ,样本数据落在[2,10)内的频率为 .【例3】 (2010北京)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a = .若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[]140,150内的学生中选取的人数应为 .【例4】 (2010江苏高考)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[]540,中,其频率分布直方图如图所示,则其抽样的100根中,有____根在棉花纤维的长度小于20mm .(mm)频率组距【例5】 (2009湖北15)下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[)610,内的频数为 ,数据落在[)210,内的概率约为 .【例6】 (2009福建3)A .0.13B .0.39C .0.52D .0.64【例7】 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( )时间(h)A .0.6hB .0.9hC .1.0hD .1.5h【例8】 为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[)4555,,[)5565,,[)6575,,[)7585,,[)8595,由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)5575,的人数是 .产品数量0.0200.0150.0100.005【例9】 (2009山东8)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96106],,样本数据分组为[)9698,,[)98100,,[)100102,,[)102104,,[104106],.已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A .90B .75C .60D .45【例10】 某路段检查站监控录象显示,在某时段内,有1000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为右图的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90km/h 的车辆数为( )A .200B .600C .500D .300【例11】 (2006年全国II )一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本频率分布直方图,为了分析居民的收入与年龄、学历、职业等方面的联系,要从这10000人中用分层抽样的方法抽出100人做进一步调查,则在[25003000],(元)月收入段应抽出_____人.0.00050.00040.00030.00020.0001频率组距月收入(元)【例12】 如图为某样本数据的频率分布直方图,则下列说法不正确的是( )频率A .[610),的频率为0.32 B .若样本容量为100,则[1014),的频数为40 C .若样本容量为100,则(10] ,的频数为40 D .由频率分布布直方图可得出结论:估计总体大约有10%分布在[1014),【例13】 (2006北京模拟)下面是某学校学生日睡眠时间的抽样频率分布表:【例14】 (2010崇文一模)为了调查某厂2000名工人生产某种产品的能力,随机抽查了m 位工人某天生产该产品的数量,产品数量的分组区间为[)10,15,[)15,20,[)20,25,[)25,30,[30,35],频率分布直方图如图所示.已知生产的产品数量在[)20,25之间的工人有6位. ⑴求m ; 10 15 20 25 30 35产品数量⑵工厂规定从各组中任选1人进行再培训,则选取5人不在同一组的概率是多少?【例15】 考查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm )如下:⑴ 作出频率分布表; ⑵ 画出频率分布直方图.【例16】(2010陕西卷高考)为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行出样检查,测得身高情况的统计图如下:/cm/cm⑴估计该小男生的人数;⑵估计该校学生身高在170~185cm之间的概率;⑶从样本中身高在165~180cm之间的女生..中任选2人,求至少有1人身高在170~180cm 之间的概率.【例17】从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表,画出频率分布直方图及折线图,并根据作出的频率分布直方图估计身高不小于170的同学的人数.【例18】为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如下图),已知图中从左到右的前三个小组的频率分别是0.10.30.4,,.第一小组的频数是5.⑴求第四小组的频率和参加这次测试的学生人数;⑵在这次测试中,学生跳绳次数的中位数落在第几小组内?⑶参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩优秀率是多少?O频率组距次数149.5124.599.574.549.5【例19】 为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛. 为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计. 请你根据尚未完成并有局部污损的频率分布表和频数分布直方图,解答下列问题:⑴ 填充频率分布表的空格(将答案直接填在表格内); ⑵ 补全频数条形图;⑶ 若成绩在75.5~85.5分的学生为二等奖,问获得二等奖的学生约为多少人?【例20】 (2010丰台一模)某校高三(1)班的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题.85987654322198653328698765叶茎1009080706050分数频率组距0.040.0280.0160.008⑴求全班人数及分数在[)80,90之间的频数;⑵估计该班的平均分数,并计算频率分布直方图中[)80,90间的矩形的高;⑶若要从分数在[]80,100之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在[]90,100之间的概率.【例21】某地区为了了解70~80岁老人的日平均睡眠时间(单位:h).随机选择了50位老人的进行调查.下表是这50位老人日睡眠时间的频率分布表.在上述统计数据中,一部分计算见算法流程图(其中←可用=代替),则输出的S的值是.。
频率分布直方图考试题(汇编)
频率分布直方图北鲲五班练习题1.用样本估计总体,下列说法正确的是()A.样本的结果就是总体的结果B.样本容量越大,估计就越精确C.样本的标准差可以近似地反映总体的平均状态D.数据的方差越大,说明数据越稳定2.一支田径队有男队员56人,女队员42人,用分层抽样的方法从全体运动员中抽出一个容量为28的样本,则应抽取男队员的人数为()A.12 B.14 C.16 D.183.某学校有教职工共160人,其中有教师104人,管理人员32人,后勤服务人员24人,要从中抽取一个容量为20的样本,用分层抽样的方法抽取样本,则在20人的样本中应抽取后勤人员的人数为( )A. 3B. 4C. 5D. 64.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人.为了了解该单位职工的健康情况,决定采用分层抽样的方法,从中抽取容量为15的样本.则从上述各层中依次抽取的人数分别是()A. 8,4,3B. 6,5,4C. 7,5,3D. 8,5,25. 某协会有200名会员,现要从中抽取40名会员作样本,采用系统抽样法等间距抽取样本,将全体会员随机按1~200编号,并按编号顺序平均分为40组(1-5号,6-10号,…,196-200号).若第5组抽出的号码为22,则第1组至第3组抽出的号码依次是()A. 3,8,13B. 2,7,12C. 3,9,15D. 2,6,126.一个容量为n的样本,分成若干组,已知某组的频数和频率分别是40,0.125,则n的值为A. 640B.320C.240D. 1607.个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为.A. 2B. 4C. 6D. 8 ( )8.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为( )A.45,75,15B. 45,45,45C.30,90,15D. 45,60,309.某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,则老年人、中年人、青年人分别各抽取的人数是( )A. 6,12,18B. 7,11,19C. 6,13,17D. 7,12,1710.某班的78名同学已编号1,2,3,…,78,为了解该班同学的作业情况,老师收取了学号能被5整除的15名同学的作业本,这里运用的抽样方法是( ).A.简单随机抽样法B.系统抽样法C.分层抽样法D.抽签法11.某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为2 :3 :5.现用分层抽n样方法抽出一个容量为n的样本,样本中A种型号产品有16件,那么此样本的容量12.某学校共有教师490人,其中不到40岁的有350人,40岁及以上的有140人,为了解普通话在该校教师中的推广普及情况,用分层抽样的方法,从全体教师中抽取一个容量为70人的样本进行普通话水平测试,其中不到40岁的教师中应抽取的人数是___________.13.在某次学生考试的成绩中随机抽取若干学生的成绩,分组与各组的频数如下:[40,50),4;[50,60),1;[60,70),10;[70,80),11;[80,90),18;[90,100),6,估计本次考试的及格率为__________ . 14.把容量是100的样本分成8组,从第1组到第4组的频数分别是15,17,11,13,第5组到第7组的频率之和是0.32,那么第8组的频率是.15.《中华人民共和国道路交通安全法》 规定:车辆驾驶员血液酒精浓度在20~80 mg/100mL (不含80)之间,属于酒后驾车;血液酒精浓度在80mg/100mL (含80)以上时,属醉酒驾车。
历年高考数学真题精选40 频率分布直方图
高考数学真题精选(按考点分类)专题40 频率分布直方图(学生版)一.选择题(共2小题)1.(2016•山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140A.6B.8C.12D.18二.填空题(共2小题)3.(2015•湖北)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a .(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.4.(2014•江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:)cm,所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm.三.解答题(共8小题)5.(2019•新课标Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).m和使6.(2018•新课标Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:3)用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于30.35m的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)7.(2017•北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20, ,90],并整理得到如下频率分布直方图:30),[30,40),[80(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.8.(2017•新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:)kg,其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50kg箱产量50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较.附:2P K K0.0500.0100.001()K 3.841 6.63510.82822()()()()()n ad bc K a b c d a c b d -=++++. 9.(2016•四川)我国是世界上严重缺水的国家.某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),⋯,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(Ⅰ)求直方图中a 的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (Ⅲ)估计居民月均水量的中位数.10.(2016•北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如图频率分布直方图:(1)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当3w =时,估计该市居民该月的人均水费.11.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?12.(2015•新课标Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100)频数2814106(1)做出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个不等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.历年高考数学真题精选(按考点分类)专题40 频率分布直方图(教师版)一.选择题(共2小题)1.(2016•山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140【答案】D【解析】自习时间不少于22.5小时的频率为:(0.160.080.04) 2.50.7++⨯=,故自习时间不少于22.5小时的频数为:0.7200140⨯=A.6B.8C.12D.18【答案】C【解析】由直方图可得分布在区间第一组与第二组共有20人,分布在区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人,第三组的频率为0.36,所以第三组的人数:18人,第三组中没有疗效的有6人,第三组中有疗效的有12人.二.填空题(共2小题)3.(2015•湖北)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=.(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.【答案】(1)3 (2)6000【解析】(1)由题意,根据直方图的性质得(1.5 2.5 2.00.80.2)0.11+++++⨯=,解得3aa=(2)由直方图得(3 2.00.80.2)0.1100006000+++⨯⨯=4.(2014•江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:)cm,所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm.【答案】24【解析】由频率分布直方图知:底部周长小于100cm的频率为(0.0150.025)100.4+⨯=,⨯=(株).∴底部周长小于100cm的频数为600.424三.解答题(共8小题)5.(2019•新课标Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解:(1)C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.则由频率分布直方图得:0.200.150.70.050.1510.7ab++=⎧⎨++=-⎩,解得乙离子残留百分比直方图中0.35a=,0.10b=.(2)估计甲离子残留百分比的平均值为:20.1530.2040.3050.2060.1070.05 4.05x=⨯+⨯+⨯+⨯+⨯+⨯=甲.乙离子残留百分比的平均值为:30.0540.150.1560.3570.280.15 6.00x=⨯+⨯+⨯+⨯+⨯+⨯=乙.6.(2018•新课标Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:3)m和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于30.35m的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)【解答】解:(1)根据使用了节水龙头50天的日用水量频数分布表,作出使用了节水龙头50天的日用水量数据的频率分布直方图,如下图:(2)根据频率分布直方图得:该家庭使用节水龙头后,日用水量小于30.35m 的概率为: (0.2 1.0 2.61)0.10.48p =+++⨯=.(3)由题意得未使用水龙头50天的日均水量为:1(10.0530.1520.2540.3590.45260.5550.65)0.4850⨯+⨯+⨯+⨯+⨯+⨯+⨯=, 使用节水龙头50天的日均用水量为:1(10.0550.15130.25100.35160.4550.55)0.3550⨯+⨯+⨯+⨯+⨯+⨯=, ∴估计该家庭使用节水龙头后,一年能节省:3365(0.480.35)47.45m ⨯-=.7.(2017•北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),[80⋯,90],并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解:(Ⅰ)由频率分布直方图知:分数小于70的频率为:1(0.040.02)100.4-+⨯=故从总体的400名学生中随机抽取一人,估计其分数小于70的概率为0.4;(Ⅱ)已知样本中分数小于40的学生有5人,故样本中分数小于40的频率为:0.05,则分数在区间[40,50)内的频率为:1(0.040.020.020.01)100.050.05-+++⨯-=,估计总体中分数在区间[40,50)内的人数为4000.0520⨯=人,(Ⅲ)样本中分数不小于70的频率为:0.6,由于样本中分数不小于70的男女生人数相等.故分数不小于70的男生的频率为:0.3,由样本中有一半男生的分数不小于70,故男生的频率为:0.6,即女生的频率为:0.4,即总体中男生和女生人数的比例约为:3:2.8.(2017•新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:)kg,其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50kg <箱产量50kg旧养殖法 新养殖法(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较. 附:2()P K K0.050 0.010 0.001 K3.8416.63510.8282()()()()()n ad bc K a b c d a c b d -=++++. 解:(1)根据题意,由旧养殖法的频率分布直方图可得:P (A )(0.0120.0140.0240.0340.040)50.62=++++⨯=;(2)根据题意,补全列联表可得:箱产量50kg <箱产量50kg总计 旧养殖法 62 38 100 新养殖法 34 66 100 总计96104200则有2200(62663834)15.705 6.63510010096104K ⨯-⨯=≈>⨯⨯⨯, 故有99%的把握认为箱产量与养殖方法有关; (3)由频率分布直方图可得: 旧养殖法100个网箱产量的平均数1(27.50.01232.50.01437.50.02442.50.03447.50.04052.50.03257.50.0262.50.01267.50.012)559.4247.1x =⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯⨯=⨯=; 新养殖法100个网箱产量的平均数2(37.50.00442.50.02047.50.04452.50.05457.50.04662.50.01067.50.008)5510.4752.35x =⨯+⨯+⨯+⨯+⨯+⨯+⨯⨯=⨯=;比较可得:12x x <,故新养殖法更加优于旧养殖法.9.(2016•四川)我国是世界上严重缺水的国家.某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),⋯,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(Ⅰ)求直方图中a 的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (Ⅲ)估计居民月均水量的中位数.解:()1(0.080.160.400.520.120.080.04)0.5I a a =++++++++⨯, 整理可得:2 1.42a =+,∴解得:0.3a =.()II 估计全市居民中月均用水量不低于3吨的人数为3.6万,理由如下:由已知中的频率分布直方图可得月均用水量不低于3吨的频率为(0.120.080.04)0.50.12++⨯=,又样本容量为30万,则样本中月均用水量不低于3吨的户数为300.12 3.6⨯=万. (Ⅲ)根据频率分布直方图,得;0.080.50.160.50.300.50.420.50.480.5⨯+⨯+⨯+⨯=<,+⨯=>,0.480.50.50.740.5∴中位数应在[2,2.5)组内,设出未知数x,令0.080.50.160.50.300.50.420.50.50.5⨯+⨯+⨯+⨯+⨯=,x解得0.04x=;+=.∴中位数是20.04 2.0410.(2016•北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如图频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当3w=时,估计该市居民该月的人均水费.解:(1)由频率分布直方图得:用水量在[0.5,1)的频率为0.1,用水量在[1,1.5)的频率为0.15,用水量在[1.5,2)的频率为0.2,用水量在[2,2.5)的频率为0.25,用水量在[2.5,3)的频率为0.15,用水量在[3,3.5)的频率为0.05,用水量在[3.5,4)的频率为0.05,用水量在[4,4.5)的频率为0.05,用水量小于等于3立方米的频率为85%,∴为使80%以上居民在该用的用水价为4元/立方米,w∴至少定为3立方米.(2)当3w=时,该市居民的人均水费为:(0.110.15 1.50.220.25 2.50.153)40.05340.050.5100.05340.051100.05340.05 1.51010.5⨯+⨯+⨯+⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=,∴当3w=时,估计该市居民该月的人均水费为10.5元.11.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?解:(1)由直方图的性质可得(0.0020.00950.0110.01250.0050.0025)201x++++++⨯=,解方程可得0.0075x=,∴直方图中x的值为0.0075;(2)月平均用电量的众数是2202402302+=,(0.0020.00950.011)200.450.5++⨯=<,∴月平均用电量的中位数在[220,240)内,设中位数为a,由(0.0020.00950.011)200.0125(220)0.5a++⨯+⨯-=可得224a=,∴月平均用电量的中位数为224;(3)月平均用电量为[220,240)的用户有0.01252010025⨯⨯=,月平均用电量为[240,260)的用户有0.00752010015⨯⨯=,月平均用电量为[260,280)的用户有0.0052010010⨯⨯=,月平均用电量为[280,300)的用户有0.0025201005⨯⨯=,∴抽取比例为111 25151055=+++,∴月平均用电量在[220,240)的用户中应抽取12555⨯=户.12.(2015•新课标Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100)频数2814106(1)做出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个不等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.解:(Ⅰ)通过两个地区用户满意度评分的频率分布直方图可以看出,B 地区用户满意度评分的平均值高于A 地区用户满意度评分的平均值,B 地区的用户满意度评分的比较集中,而A 地区的用户满意度评分的比较分散.(Ⅱ)A 地区用户的满意度等级为不满意的概率大.记A C 表示事件:“A 地区用户的满意度等级为不满意”, B C 表示事件:“B 地区用户的满意度等级为不满意”,由直方图得()(0.010.020.03)100.6A P C =++⨯= 得()(0.0050.02)100.25B P C =+⨯=A ∴地区用户的满意度等级为不满意的概率大.。
高中数学频率分布直方图
频率分布直方图作频率分布直方图的方法为:(1)把横轴分成若干段,每一线段对应一个组的组距;(2)以此线段为底作矩形,它的高等于该组的组距频率,这样得出一系列的矩形;(3)每个矩形的面积恰好是该组上的频率.频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图.作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.知识点1:利用频率分布直方图分析总体分布例题1: 2000辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,时速在[50,60)的汽车大约有 A .30辆 B .60辆 C .300辆 D .600辆变式:某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是 [96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是A.90B.75C. 60D.45变式:某初一年级有500名同学,将他们的身高(单位:cm )数据绘制成频率分布直方图(如图),若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[)130,140内的学生中选取的人数为 .知识点2:用样本分估计总体例题2某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,96 98 100 102 104 106 0.1500.125 0.1000.0750.050 克 频率/组距100 110 120130 140 150 身高频率|组距0.0050.0100.020a0.035(Ⅰ) 完成频率分布表;(Ⅱ)作出频率分布直方图;(Ⅲ)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染。
(整理)高考数学总复习专题系列——统计.板块二.频率直方图.学生版
一.随机抽样1.随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法:⑴简单随机抽样:从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. 抽出办法:①抽签法:用纸片或小球分别标号后抽签的方法.②随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表.表中每一位置出现各个数字的可能性相同. 随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法.简单随机抽样是最简单、最基本的抽样方法.⑵系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.抽出办法:从元素个数为N 的总体中抽取容量为n 的样本,如果总体容量能被样本容量整除,设Nk n=,先对总体进行编号,号码从1到N ,再从数字1到k 中随机抽取一个数s 作为起始数,然后顺次抽取第2(1)s k s k s n k +++-,,,个数,这样就得到容量为n 的样本.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样.系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样.⑶分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样.分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛.2.简单随机抽样必须具备下列特点:⑴简单随机抽样要求被抽取的样本的总体个数N 是有限的. ⑵简单随机样本数n 小于等于样本总体的个数N . ⑶简单随机样本是从总体中逐个抽取的. ⑷简单随机抽样是一种不放回的抽样.⑸简单随机抽样的每个个体入样的可能性均为nN.3.系统抽样时,当总体个数N 恰好是样本容量n 的整数倍时,取Nk n=;若Nn不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量n 整除.因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍知识内容板块二.频率直方图然相等,为N n.二.频率直方图列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:取组距,用极差组距决定组数;③决定分点:决定起点,进行分组;④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图,知小长方形的面积=组距×频率组距=频率.频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x =来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.三.茎叶图制作茎叶图的步骤:①将数据分为“茎”、“叶”两部分;②将最大茎与最小茎之间的数字按大小顺序排成一列,并画上竖线作为分隔线; ③将各个数据的“叶”在分界线的一侧对应茎处同行列出.四.统计数据的数字特征用样本平均数估计总体平均数;用样本标准差估计总体标准差. 数据的离散程序可以用极差、方差或标准差来描述.极差又叫全距,是一组数据的最大值和最小值之差,反映一组数据的变动幅度; 样本方差描述了一组数据平均数波动的大小,样本的标准差是方差的算术平方根. 一般地,设样本的元素为12n x x x ,,,样本的平均数为x , 定义样本方差为222212()()()n x x x x x x s n-+-++-=,样本标准差s =简化公式:22222121[()]n s x x x nx n=+++-.五.独立性检验1.两个变量之间的关系;常见的有两类:一类是确定性的函数关系;另一类是变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的.当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.2.散点图:将样本中的n 个数据点()(12)i i x y i n =,,,,描在平面直角坐标系中,就得到了散点图.散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系.3.如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域.反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.此时,散点图中的点在从左上角到右下角的区域.散点图可以判断两个变量之间有没有相关关系.4.统计假设:如果事件A 与B 独立,这时应该有()()()P AB P A P B =,用字母0H 表示此式,即0:()()()H P AB P A P B =,称之为统计假设. 5.2χ(读作“卡方”)统计量:统计学中有一个非常有用的统计量,它的表达式为22112212211212()n n n n n n n n n χ++++-=,用它的大小可以用来决定是否拒绝原来的统计假设0H .如果2χ的值较大,就拒绝0H ,即认为A 与B 是有关的.2χ统计量的两个临界值:3.841、6.635;当2 3.841χ>时,有95%的把握说事件A 与B 有关;当2 6.635χ>时,有99%的把握说事件A 与B 有关;当23.841χ≤时,认为事件A 与B 是无关的.独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立的. 1.独立性检验的步骤:统计假设:0H ;列出22⨯联表;计算2χ统计量;查对临界值表,作出判断.2.几个临界值:222()0.10( 3.841)0.05( 6.635)0.01P P P χχχ≈≈≈≥2.706,≥,≥.22⨯联表的独立性检验:如果对于某个群体有两种状态,对于每种状态又有两个情况,这样排成一张22⨯的表,如下:状态B 状态B 合计 状态A 11n 12n 1n + 状态A21n 22n 2n +1n +2n +n如果有调查得来的四个数据11122122n n n n ,,,,并希望根据这样的4个数据来检验上述的两种状态A 与B 是否有关,就称之为22⨯联表的独立性检验.六.回归分析1.回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性. 回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.最小二乘法:记回归直线方程为:ˆy a bx =+,称为变量Y 对变量x 的回归直线方程,其中a b ,叫做回归系数.ˆy是为了区分Y 的实际值y ,当x 取值i x 时,变量Y 的相应观察值为i y ,而直线上对应于i x 的纵坐标是ˆi i ya bx =+. 设x Y ,的一组观察值为()i i x y ,,12i n =,,,,且回归直线方程为ˆya bx =+, 当x 取值i x 时,Y 的相应观察值为i y ,差ˆ(12)i i y yi n -=,,,刻画了实际观察值i y 与回归直线上相应点的纵坐标之间的偏离程度,称这些值为离差.我们希望这n 个离差构成的总离差越小越好,这样才能使所找的直线很贴近已知点. 记21()ni i i Q y a bx ==--∑,回归直线就是所有直线中Q 取最小值的那条.这种使“离差平方和为最小”的方法,叫做最小二乘法.用最小二乘法求回归系数a b ,有如下的公式: 1221ˆni ii nii x ynxy bxnx ==-=-∑∑,ˆˆa y bx =-,其中a b ,上方加“^”,表示是由观察值按最小二乘法求得的回归系数.3.线性回归模型:将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型. 产生随机误差的主要原因有:①所用的确定性函数不恰当即模型近似引起的误差; ②忽略了某些因素的影响,通常这些影响都比较小; ③由于测量工具等原因,存在观测误差. 4.线性回归系数的最佳估计值:利用最小二乘法可以得到ˆˆab ,的计算公式为 1122211()()()()nnii iii i nniii i xx y y x ynxyb xx xn x ====---==--∑∑∑∑,ˆˆa y bx =-,其中11n i i x x n ==∑,11nii y y n ==∑ 由此得到的直线ˆˆya bx =+就称为回归直线,此直线方程即为线性回归方程.其中ˆa ,b 分别为a ,b 的估计值,ˆa称为回归截距,b 称为回归系数,ˆy 称为回归值. 5.相关系数:()()nnii i ixx y y x ynx yr ---==∑∑6.相关系数r 的性质: ⑴||1r ≤;⑵||r 越接近于1,x y ,的线性相关程度越强; ⑶||r 越接近于0,x y ,的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. 7.转化思想:根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数. 8.一些备案 ①回归(regression )一词的来历:“回归”这个词英国统计学家Francils Galton 提出来的.1889年,他在研究祖先与后代的身高之间的关系时发现,身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们父母的平均身高高.Galton 把这种后代的身高向中间值靠近的趋势称为“回归现象”.后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析.②回归系数的推导过程:22222[()]222i i i i i i i i Q y a bx y a y na b x y ab x b x =--=-+-++∑∑∑∑∑∑ 22222()2i i i i i i na a b x y b x b x y y =+-+-+∑∑∑∑∑,把上式看成a 的二次函数,2a 的系数0n >,因此当2()2i i i ib x y y b x a n n --=-=∑∑∑∑时取最小值. 同理,把Q 的展开式按b 的降幂排列,看成b 的二次函数,当2i iiix y a xb x-=∑∑∑时取最小值.解得:12221()()()ni iii i niii x ynxyx x y y b x x xnx==---==--∑∑∑∑,a y bx =-, 其中1i y y n =∑,1i x x n=∑是样本平均数. 9. 对相关系数r 进行相关性检验的步骤: ①提出统计假设0H :变量x y ,不具有线性相关关系;②如果以95%的把握作出推断,那么可以根据10.950.05-=与2n -(n 是样本容量)在相关性检验的临界值表中查出一个r 的临界值0.05r (其中10.950.05-=称为检验水平); ③计算样本相关系数r ;④作出统计推断:若0.05||r r >,则否定0H ,表明有95%的把握认为变量y 与x 之间具有线性相关关系;若0.05||r r ≤,则没有理由拒绝0H ,即就目前数据而言,没有充分理由认为变量y 与x 之间具有线性相关关系. 说明:⑴对相关系数r 进行显著性检验,一般取检验水平0.05α=,即可靠程度为95%.⑵这里的r 指的是线性相关系数,r 的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系.⑶这里的r 是对抽样数据而言的.有时即使||1r =,两者也不一定是线性相关的.故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释.题型一 频率分布直方图【例1】 (2010西城二模)某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.则这200名同学中成绩大于等于80分且小于90分的学生有______名.典例分析【例2】 (2010东城二模)已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内的样本频数为 ,样本数据落在[2,10)内的频率为 .【例3】 (2010北京)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a = .若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[]140,150内的学生中选取的人数应为 .【例4】 (2010江苏高考)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[]540,中,其频率分布直方图如图所示,则其抽样的100根中,有____根在棉花纤维的长度小于20mm .(mm)频率组距【例5】 (2009湖北15)下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[)610,内的频数为 ,数据落在[)210,内的概率约为 .【例6】 (2009福建3)一个容量为100的样本,其数据的分组与各组的频数如下: 组别 (]010,(]1020, (]2030, (]3040, (]4050, (]5060, (]6070,频数12 13 2415 16 137则样本数据落在(]1040,上的频率为( )A .0.13B .0.39C .0.52D .0.64【例7】 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( )时间(h)A .0.6hB .0.9hC .1.0hD .1.5h【例8】 为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[)4555,,[)5565,,[)6575,,[)7585,,[)8595,由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)5575,的人数是 .产品数量0.0200.0150.0100.005【例9】 (2009山东8)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96106],,样本数据分组为[)9698,,[)98100,,[)100102,,[)102104,,[104106],.已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A .90B .75C .60D .45【例10】 某路段检查站监控录象显示,在某时段内,有1000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为右图的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90km/h 的车辆数为( )A .200B .600C .500D .300【例11】 (2006年全国II )一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本频率分布直方图,为了分析居民的收入与年龄、学历、职业等方面的联系,要从这10000人中用分层抽样的方法抽出100人做进一步调查,则在[25003000],(元)月收入段应抽出_____人.0.00050.00040.00030.00020.0001频率组距月收入(元)【例12】 如图为某样本数据的频率分布直方图,则下列说法不正确的是( )0.1频率组距A .[610),的频率为0.32B .若样本容量为100,则[1014),的频数为40C .若样本容量为100,则(10]-∞,的频数为40D .由频率分布布直方图可得出结论:估计总体大约有10%分布在[1014),【例13】 (2006北京模拟)下面是某学校学生日睡眠时间的抽样频率分布表:睡眠时间 人数 频率 [6 6.5), 5 0.05 [6.57), 17 0.17 [77.5), 33 0.33 [7.58), 37 0.37 [88.5), 6 0.06 [8.59), 2 0.02合计 100 1画出频率分布直方图,估计该校学生的日平均睡眠时间.【例14】 (2010崇文一模)为了调查某厂2000名工人生产某种产品的能力,随机抽查了m 位工人某天生产该产品的数量,产品数量的分组区间为[)10,15,[)15,20,[)20,25,[)25,30,[30,35],频率分布直方图如图所示.已知生产的产品数量在[)20,25之间的工人有6位.⑴求m ;10 15 20 25 30 35 产品数量⑵工厂规定从各组中任选1人进行再培训,则选取5人不在同一组的概率是多少?【例15】考查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)⑴作出频率分布表;⑵画出频率分布直方图.【例16】(2010陕西卷高考)为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行出样检查,测得身高情况的统计图如下:/cm/cm⑴估计该小男生的人数;⑵估计该校学生身高在170~185cm之间的概率;⑶从样本中身高在165~180cm之间的女生..中任选2人,求至少有1人身高在170~180cm之间的概率.【例17】从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表,画出频率分布直方图及折线图,并根据作出的频率分布直方图估计身高不小于170的同学的人数.【例18】为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如下图),已知图中从左到右的前三个小组的频率分别是0.10.30.4,,.第一小组的频数是5.⑴求第四小组的频率和参加这次测试的学生人数;⑵在这次测试中,学生跳绳次数的中位数落在第几小组内?⑶参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩优秀率是多少?【例19】 为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛. 为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计. 请你根据尚未完成并有局部污损的频率分布表和频数分布直方图,解答下列问题: ⑴ 填充频率分布表的空格(将答案直接填在表格内); ⑵ 补全频数条形图;⑶ 若成绩在75.5~85.5分的学生为二等奖,问获得二等奖的学生约为多少人?【例20】 (2010丰台一模)某校高三(1)班的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题.频率⑴求全班人数及分数在[)80,90之间的频数;⑵估计该班的平均分数,并计算频率分布直方图中[)80,90间的矩形的高;⑶若要从分数在[]80,100之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在[]90,100之间的概率.【例21】某地区为了了解70~80岁老人的日平均睡眠时间(单位:h).随机选择了50位老人的进行调查.下表是这50位老人日睡眠时间的频率分布表.在上述统计数据中,一部分计算见算法流程图(其中←可用=代替),则输出的S的值是.。
7.4 频数分布表和频数分布直方图 分层练习 原卷版
7.4 频数分布表和频数分布直方图分层练习考查题型一从频数分布表、频数分布直方图中获取信息解决实际问题1.某面粉厂准备确定面粉包装袋的规格,市场调查员小李随机选择三家超市进行调查,收集三家超市一周的面粉销售情况,并整理数据、做出如图所示的统计图,则该面粉厂应选择面粉包装袋的规格为()A.2kg/包B.3kg/包C.4kg/包D.5kg/包2.“共享单车”为人们提供了一种经济便捷、绿色低碳的共享服务,成为城市交通出行的新方式,小文对他所在小区居民当月使用“共享单车”的次数进行了抽样调查,并绘制成了如图所示的频数分布直方图(每一组含前一个边界值,不含后一个边界值),则下列说法正确的是()A.小文一共抽样调查了20人B.样本中当月使用“共享单车”40~50次的人数最多C.样本中当月使用“共享单车”不足30次的人数有14人D.样本中当月使用次数不足30次的人数多于50~60次的人数3.体育委员统计了全班女生立定跳远的成绩,列出频数分布表如下:已知跳远距离1.8米以上为优秀,则该班女生获得优秀的频率为_ .4.为了参加全校各年级之间的广播体操比赛,七年级准备从63名同学中挑选身高相差不多的40名学生参加比赛.根据这63名学生身高x(cm)的频数分布直方图(每组数据含最小值,不含最大值),分析可得参加比赛的学生身高x的合理范围是_ .5.如图是八年级某班50名学生身高(精确到1cm)的频数分布直方图(每组包含最小值,不包含最大值),从左起第一、二、三、四个小长方形的高的比是1:3:5:1,则身高在170cm 及170cm以上的学生的人数为.考查题型二列频数分布表、绘制频数分布直方图1.对频数分布直方图的下列认识,不正确的是()A.每小组条形图的横宽等于这组的组距B.每小组条形图的纵高等于这组的频数C.每小组条形图的面积等于这组的频率D.所有小组条形图的个数等于数据分组整理的组数2.南京某校八年级体育课上,体育老师统计了全班同学60秒跳绳的次数,发现跳绳次数最多的同学是185个,跳绳次数最少的同学是140个,为了分析数据需要列频数分布表,规定组距为6,那么组数是()A.6B.7C.8D.93.为了解某校学生每周课外阅读时间的情况,随机抽取该校a名学生进行调查,获得的数据整理后绘制成统计表如下:表中4≤x<6组的频数b满足25≤b≤35.下面有四个推断:①表中a的值为100;②表中c的值可以为0.31;③这a名学生每周课外阅读时间的中位数一定不在6~8之间;④这a名学生每周课外阅读时间的平均数不会超过6.所有合理推断的序号是______________.4.2022年12月4日是我国第22个“法制宣传日”,我校举行了主题“学法,知法,懂法,守法”的普法知识竞赛.为了了解本次知识竞赛成绩的分布情况,从参赛学生中随机抽取了150名学生的初赛成绩进行统计,得到如下两幅不完整的统计图表.(1)表中a=___________,b=___________;(2)请补全频数分布直方图:(3)若80分以上为优秀,该校现有1200名学生,请你估计我校成绩优秀的学生有多少名?(4)结合以上信息,请你给该校关于普法方面提出一条合理化的建议.考查题型三综合频数分布直方图(频数分布表)与扇形统计图获取需要的信息1.“俭以养德”是中华民族的优秀传统,时代中学为了对全校学生零花钱的使用进行正确引导,随机抽取50名学生,对他们一周的零花钱数额进行了统计,并根据调查结果绘制了不完整的频数分布表和扇形统计图,如图所示:组别零花钱数额x/元频数一x≤10二10<x≤1512三15<x≤2015四20<x≤25a五x>255关于这次调查,下列说法正确的是()A.总体为50名学生一周的零花钱数额B.五组对应扇形的圆心角度数为36°C.在这次调查中,四组的频数为6D.若该校共有学生1500人,则估计该校零花钱数额不超过20元的人数约为1200人2.小周是一位运动达人,他通过佩戴智能手环来记录自己一个月(30天)的每日行走步数(单位:千步),并绘制成右面的统计图.根据统计图提供的信息,下列推断不合理...的是()A.每日行走步数为4~8千步的天数占这个月总天数的10%B.每日行走步数为8~12千步的扇形圆心角是108°C.小周这个月超过一半的天数每日行走步数不低于12000步D.小周这个月行走的总步数不超过324千步3.为了更好地开展全民健身,建设健康中国,某社区随机抽取了若干居民,对其健身情况进行抽样调查.将被调查的居民每天的健身时间t(min)分为5组,绘制如下的不完整的健身时间频数分布表和扇形统计图.根据上述信息,解答下列问题:(1)在扇形统计图中,C组对应的圆心角为直角,频数分布表中a的值是______;(2)在频数分布表中,m的值为______,在扇形统计图中,A组的圆心角为______;(3)在本次统计中,中位数落在______组;(4)若该社区共有3万人,利用本次抽样调查的结果,可估计该社区锻炼时间不少于45分钟的人数为______万人.4.菲尔兹奖是国际上有崇高声誉的一个数学奖项.晓刚统计了连续几年共20位菲尔兹奖得主的年龄,整理并绘制成如下统计图.根据以上图表,解答下列问题:(1)m=_____________,n=_____________,并补全频数分布直方图;(2)在扇形统计图中,获奖年龄在B组的人数约占获奖总人数的_____________%,C组的圆心角度数为_____________°;(3)根据统计图描述这些数学家获得菲尔兹奖时年龄的分布特征.1.唐同学去年暑假随爸爸去成都大熊猫繁殖基地看熊猫,发现整个基地的熊猫都未出熊猫内室,当天的温度有33度,他了解到熊猫的外出活动与室外温度有关,因此通过一年(以365天计算)的观察,对熊猫“花花”外出活动时的温度(以0℃至40℃为监测温度区间)进行了调查,并制作了如下图所示的频数分布表与直方图:请根据图表提供的信息,解答下列问题:(1)在频数分布表中,求出a=______,b=______;并补全频数直方图.(2)熊猫最喜欢外出活动时的温度区间为______;(3)成都的全年每个月的平均温度如下表:你认为哪个月看熊猫最合适,为什么?2.区政府想了解某镇的经济状况,用简单随机抽样的方法,在130户家庭中抽取20户调查过去一年的收入(单位:万元),结果如下:1.3,1.7,2.4,1.1,1.4,1.6,1.6,2.7,2.1,1.5,0.9,3.2,1.3,2.1,2.6,2.1,1.0,1.8,2.2,1.8(1)将上述数据进行分组整理,列出频数分布表,请补充;(2)根据频数分布表绘制频数分布直方图和扇形统计图,请补全;(3)求扇形统计图中百分比最大部分所对应的扇形的圆心角的度数;(4)如果把年收入低于1.3万元的视为“低收入家庭”,试估计该镇“低收入家庭”的户数.。
高考数学专题统计《用频率直方图估计总体分布《百分位数》突破解析
14.4.3用频率直方图估计总体分布14.4.4百分位数必备知识基础练1.以下数据为参加数学竞赛决赛的15人的成绩(单位:分):78,70,72,86,88,79,80,81,94,84,56,98,83,90,91.这15人成绩的80百分位数是()A.90B.90.5C.91D.91.5=12,56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为80×15100=90.5.所以这15人成绩的80百分位数是90+9122.如图是某工厂对一批新产品长度(单位:mm)检测结果的频率直方图.估计这批产品的平均数与中位数分别为()A.22.5,20B.22.5,22.75C.22.75,22.5D.22.75,25,这批产品的平均数为x=5×(0.02×12.5+0.04×17.5+0.08×22.5+0.03×27.5+0.03×32.5)=22.75,其中位数为=22.5.故选C.x0=20+0.5-(0.02+0.04)×50.083.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,50百分位数为b,则有()A.a=13.7,b=15.5B.a=14,b=15C.a=12,b=15.5D.a=14.7,b=1510,12,14,14,15,15,16,17,17,17,其平均数a=110×(10+12+14+14+15+15+16+17+17+17)=14.7,因为50×10100=5,所以这10名工人一小时内生产零件的50百分位数为b=15+152=15. 4.已知甲、乙两组数据(已按从小到大的顺序排列): 甲组:27,28,39,40,m ,50; 乙组:24,n ,34,43,48,52.若这两组数据的30百分位数,80百分位数分别相等,则mn等于( ) A.127 B.107C.43D.74因为30100×6=1.8,80100×6=4.8,所以30百分位数为n=28,80百分位数为m=48,所以mn =4828=127. 5.1,2,3,4,5,6,7,8,9,10这组数据的25百分位数为 ,75百分位数为 ,90百分位数为 .8 9.510,而且10×25%=2.5,10×75%=7.5,10×90%=9,所以该组数据的25百分位数为3,75百分位数为8,90百分位数为9+102=9.5. 6.某学校组织学生参加数学测试,成绩的频率直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的 百分位数.[20,40),[40,60)的频率之和为(0.005+0.01)×20=0.3,所以60分为成绩的30百分位数.7.某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45]岁之间,根据调查结果得出司机的年龄情况残缺的频率直方图如图所示,利用这个残缺的频率直方图估计该市出租车司机年龄的中位数大约是 (保留一位小数)..6,所有矩形面积之和为1,所以,数据位于[25,30)的频率为1-(0.01+0.07+0.06+0.02)×5=0.2, 前两个矩形的面积之和为0.01×5+0.2=0.25, 前三个矩形的面积之和为0.25+0.07×5=0.6, 所以,中位数位于区间[30,35),设中位数为a , 则有0.25+(a-30)×0.07=0.5,解得a ≈33.6(岁). 8.求下列数据的四分位数. 13,15,12,27,22,24,28,30,31,18,19,20.12个数据按从小到大的顺序排列为12,13,15,18,19,20,22,24,27,28,30,31,计算25×12100=3,50×12100=6,75×12100=9, 所以数据的25百分位数为15+182=16.5, 50百分位数为20+222=21,75百分位数为27+282=27.5. 9.某网络营销部门随机抽查了某市200名网友在2019年11月11日的网购金额,所得数据如下表:已知网购金额低于3千元与不低于3千元的人数比恰为3∶2. (1)试确定x ,y ,p ,q 的值,并补全频率直方图;(2)估计网购金额的25百分位数(结果保留三位有效数字).根据题意有{16+24+x +y +16+14=200,16+24+x y+16+14=32,解得{x =80,y =50.所以p=0.4,q=0.25.补全频率直方图如图所示.(2)由(1)可知,网购金额低于2千元的频率为0.08+0.12=0.2,网购金额低于3千元的频率为0.2+0.4=0.6,所以网购金额的25百分位数在[2,3)内,则网购金额的25百分位数估计为2+0.25-0.20.6-0.2×1=2.125≈2.13. 关键能力提升练10.数据3.2,3.4,3.8,4.2,4.3,4.5,x ,6.6的65百分位数是4.5,则实数x 的取值范围是( ) A.[4.5,+∞) B.[4.5,6.6) C.(4.5,+∞)D.(4.5,6.6]65×8100=5.2,所以这组数据的65百分位数是第6个数据4.5,则x ≥4.5,故选A.11.港珠澳大桥于2018年10月24日正式通车,它是中国境内一座连接香港、珠海和澳门的桥隧工程.桥隧全长55千米,桥面为双向六车道高速公路,大桥通行限速100 km/h .现对大桥某路段上汽车行驶速度进行抽样调查,画出频率直方图(如图).根据直方图估计在此路段上汽车行驶速度的众数和行驶速度超过90 km/h 的频率分别为( )A.85,0.25B.90,0.35C.87.5,0.25D.87.5,0.35=87.5,由频率直方图估计在此路段由频率直方图估计在此路段上汽车行驶速度的众数为85+902上汽车行驶速度超过90 km/h的频率为(0.05+0.02)×5=0.35,所以由频率直方图估计在此路段上汽车行驶速度超过90 km/h的频率为0.35.12.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率直方图如图所示.估计棉花纤维的长度的样本数据的80百分位数是()A.29 mmB.29.5 mmC.30 mmD.30.5 mm30 mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,在25 mm以=29,可以估计棉花下的比例为85%-25%=60%,因此,80百分位数一定位于[25,30)内,由25+5×0.80-0.600.85-0.60纤维的长度的样本数据的80百分位数是29 mm.13.(多选)已知100个数据的75百分位数是9.3,则下列说法不正确的是()A.这100个数据中一定有75个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第75个数据C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数=75为整数,所以第75个数据和76个数据的平均数为75百分位数,是9.3,则C正75×100100确,其他选项均不对,故选ABD.14.(多选)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的平均数等于乙的成绩的平均数C.甲的成绩的80百分位数等于乙的成绩的80百分位数D.甲的成绩的极差等于乙的成绩的极差,x 甲=4+5+6+7+85=6,x 乙=3×5+6+95=6,A 项错误,B 项正确;甲的成绩的80百分位数为7+82=7.5,乙的成绩的80百分位数为6+92=7.5,所以二者相等,所以C 项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D 项正确.15.已知30个数据的60百分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是 ..660×30100=18,设第19个数据为x ,则7.8+x2=8.2,解得x=8.6,即第19个数据是8.6.16.如图是某市2020年4月1日至4月7日每天最高、最低气温的折线统计图,这7天的日最高气温的10百分位数为 ,日最低气温的80百分位数为 .℃ 16 ℃,把日最高气温按照从小到大排序,得24,24.5,24.5,25,26,26,27,因为共有7个数据,所以7×10100=0.7,不是整数,所以这7天日最高气温的10百分位数是第1个数据,为24 ℃.把日最低气温按照从小到大排序,得12,12,13,14,15,16,17,因为共有7个数据,所以7×80100=5.6,不是整数,所以这7天日最低气温的80百分位数是第6个数据,为16 ℃.17.某年级120名学生在一次百米跑测试中,成绩全部介于13秒与18秒之间,将测试结果分成5组,即[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率直方图,如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70百分位数约为 秒..570百分位数为x ,因为1+3+71+3+7+6+3=0.55,1+3+7+61+3+7+6+3=0.85,所以x ∈[16,17),所以0.55+(x-16)×61+3+7+6+3=0.70,解得x=16.5. 18.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为 ;(2)由频率直方图估计志愿者年龄的85百分位数为 岁(结果保留整数)..04 (2)39设[25,30)年龄组对应小矩形的高度为h ,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.(2)由图可知,年龄小于35岁的频率为(0.01+0.04+0.07)×5=0.6,年龄小于40岁的频率为(0.01+0.04+0.07+0.06)×5=0.9,所以志愿者年龄的85百分位数在[35,40)内,因此志愿者年龄的85百分位数为35+0.85-0.60.9-0.6×5≈39(岁). 19.(2021浙江宁波期末)首次实施新高考的八省(市)于2021年1月23日统一举行了新高考适应性考试,在联考结束后,根据联考成绩,考生可了解自己的学习情况,作出升学规划,决定是否参加强基计划.在本次适应性考试中,某学校为了解高三学生的联考情况,随机抽取了100名学生的联考数学成绩作为样本,并按照分数段[50,70),[70,90),[90,110),[110,130),[130,150]分组,绘制了如图所示的频率直方图.(1)求出图中a的值并估计本次考试及格率(“及格率”指得分为90分及以上的学生所占比例);(2)估计该校学生联考数学成绩的80百分位数;(3)估计该校学生联考数学成绩的众数、平均数.由(0.004+a+0.013+0.014+0.016)×20=1,解得a=0.003,则及格率为(0.016+0.014+0.003)×20=0.66=66%.(2)得分在110以下的学生所占比例为(0.004+0.013+0.016)×20=0.66,得分在130以下的学生所=120(分),估计占比例为0.66+0.014×20=0.94,所以80百分位数位于[110,130)内,由110+20×0.8-0.660.94-0.6680百分位数为120.(3)由图可得,众数估计值为100.平均数估计值为0.08×60+0.26×80+0.32×100+0.28×120+0.06×140=99.6(分).学科素养创新练20.2020年某地苹果出现滞销现象,为了帮助当地果农打开销路,当地政府与全国一些企业采用团购的方式带动销售链,使得当地果农积压的许多苹果有了销路.为了解果农们苹果的销售量情况,当地农业局随机对100名果农的苹果销售量进行统计,将数据按照[90,110),[110,130),[130,150),[150,170]分成4组,得到如图所示的频率直方图.(1)试估计这100名果农苹果销售量的平均数;(2)根据题中的频率直方图,估计销售量样本数据的80百分位数(结果精确到0.1);(3)假设这100名果农在未打开销路之前都积压了2万千克的苹果,通过团购的方式果农每千克苹果的纯利润为1.3元,而积压仍未售出的苹果每千克将损失2元的成本费,试估计这100名果农积压的苹果通过此次团购活动获得的总利润.设这100名果农苹果销售量的平均数为x百千克,则x=(100×0.002 5+120×0.01+140×0.0225+160×0.015)×20=140(百千克),故这100名果农苹果销售量的平均数为1.4万千克.(2)因为(0.002 5+0.010 0)×20=0.25<0.8,0.25+0.225×20=0.7<0.8,×20≈156.7.所以80百分位数在第4组内,且80百分位数为150+0.8-0.71-0.7(3)销售量在[90,110)的每位果农的利润为100×100×1.3-(2×104-100×100)×2=-0.7(万元);销售量在[110,130)的每位果农的利润为120×100×1.3-(2×104-120×100)×2=-0.04(万元);销售量在[130,150)的每位果农的利润为100×140×1.3-(2×104-140×100)×2=0.62(万元);销售量在[150,170]的每位果农的利润为100×160×1.3-(2×104-160×100)×2=1.28(万元).因为[90,110),[110,130),[130,150),[150,170)这4组的人数分别为5,20,45,30,所以这100名果农积压的苹果通过此次团购活动获得的总利润约为-0.7×5-0.04×20+0.62×45+1.28×30=62(万元).。
高考数学频率分布直方图大题训练题(含答案)
频率分布直方图大题训练题一、解答题(共18题;共205分)1.(2020·龙岩模拟)某电讯企业为了了解某地区居民对电讯服务质量评价情况,随机调查100 名用户,根据这100名用户对该电讯企业的评分,绘制频率分布直方图,如图所示,其中样本数据分组为,,…… .(1)估计该地区用户对该电讯企业评分不低于70分的概率,并估计对该电讯企业评分的中位数;(2)现从评分在的调查用户中随机抽取2人,求2人评分都在的概率.2.(2020·芜湖模拟)某学校为了了解该校高三年级学生寒假在家自主学习的情况,随机对该校300名高三学生寒假的每天学习时间(单位:h)进行统计,按照,,,,的分组作出频率分布直方图如图所示.参考公式:,其中.参考附表:0.050 0.010 0.001(Ⅰ)根据频率分布直方图计算该校高三年级学生的平均每天学习时间(同一组中的数据用该组区间中点值代表);(Ⅱ)该校规定学习时间超过4h为合格,否则不合格.已知这300名学生中男生有140人,其中合格的有70人,请补全下表,根据表中数据,能否有99.9%的把握认为该校高三年级学生的性别与学习时长合格有关?3.(2020·泰安模拟)某水果批发商经销某种水果(以下简称A水果),购入价为300元/袋,并以360元/袋的价格售出,若前8小时内所购进的A水果没有售完,则批发商将没售完的A水果以220元/袋的价格低价处理完毕(根据经验,2小时内完全能够把A水果低价处理完,且当天不再购进).该水果批发商根据往年的销量,统计了100天A水果在每天的前8小时内的销售量,制成如下频数分布条形图.现以记录的100天的A水果在每天的前8小时内的销售量的频率作为A水果在一天的前8小时内的销售量的概率,记X表示A水果一天前8小时内的销售量,n表示水果批发商一天批发A水果的袋数.(1)求X的分布列;(2)以日利润的期望值为决策依据,在与中选其一,应选用哪个?4.(2020·南昌模拟)某产品自生产并投入市场以来,生产企业为确保产品质量,决定邀请第三方检测机构对产品进行质量检测,并依据质量指标Z来衡量产品的质量.当时,产品为优等品;当时,产品为一等品;当时,产品为二等品.第三方检测机构在该产品中随机抽取500件,绘制了这500件产品的质量指标Z的条形图.用随机抽取的500件产品作为样本,估计该企业生产该产品的质量情况,并用频率估计概率.(1)从该企业生产的所有产品中随机抽取4件,求至少有1件优等品的概率;(2)现某人决定购买80件该产品.已知每件成本1000元,购买前,邀请第三方检测机构对要购买的80件产品进行抽样检测,买家、企业及第三方检测机构就检测方案达成以下协议:从80件产品中随机抽出4件产品进行检测,若检测出3件或4件为优等品,则按每件1600元购买,否则按每件1500元购买,每件产品的检测费用250元由企业承担.记企业的收益为X元,求X的分布列与数学期望.5.(2020·南昌模拟)在“挑战不可能”的电视节目上,甲、乙、丙三个人组成的解密团队参加一项解密挑战活动,规则是由密码专家给出题目,然后由3个人依次出场解密,每人限定时间是1分钟内,否则派下一个人.3个人中只要有一人解密正确,则认为该团队挑战成功,否则挑战失败.根据甲以往解密测试情况,抽取了甲100次的测试记录,绘制了如下的频率分布直方图.(1)若甲解密成功所需时间的中位数为47,求a、b的值,并求出甲在1分钟内解密成功的频率;(2)在“挑战不可能”节目上由于来自各方及自身的心理压力,甲,乙,丙解密成功的概率分别为,其中表示第个出场选手解密成功的概率,并且定义为甲抽样中解密成功的频率代替,各人是否解密成功相互独立.①求该团队挑战成功的概率;②该团队以从小到大的顺序按排甲、乙、丙三个人上场解密,求团队挑战成功所需派出的人员数目X 的分布列与数学期望.6.(2020·江西模拟)冠状病毒是一个大型病毒家族,可引起感冒以及中东呼吸综合征(MERS)和严重急性呼吸综合征(SARS)等较严重疾病.出现的新型冠状病毒(nCoV)是从未在人体中发现的冠状病毒新毒株.人感染了新型冠状病毒后常见体征有呼吸道症状、发热、咳嗽、气促和呼吸困难等.在较严重病例中,感染可导致肺炎、严重急性呼吸综合征、肾衰竭,甚至死亡.某医院为筛查冠状病毒,需要检测血液中的指标A.现从采集的血液样品中抽取500份检测指标A的值,由测量结果得下侧频率分布直方图:(1)求这500份血液样品指标A值的平均数和样本方差(同一组数据用该区间的中点值作代表,记作);(2)由频率分布直方图可以认为,这项指标的值X服从正态分布,其中近似为样本平均数,近似为样本方差.在统计学中,把发生概率小于3‰的事件称为小概率事件(正常条件下小概率事件的发生是不正常的).该医院非常关注本院医生健康状况,随机抽取20名医生,独立的检测血液中指标A的值,结果发现4名医生血液中指标A的值大于正常值20.03,试根据题中条件判断该院医生的健康率是否正常,并说明理由.附:参考数据与公式:,,;若,则① ;② ;③.,,,.7.(2020·江西模拟)年前某市质监部门根据质量管理考核指标对本地的500家食品生产企业进行考核,然后通过随机抽样抽取其中的50家,统计其考核成绩(单位:分),并制成如下频率分布直方图.(1)求这50家食品生产企业考核成绩的平均数(同一组中的数据用该组区间的中点值为代表)及中位数a(精确到0.01)(2)该市质监部门打算举办食品生产企业质量交流会,并从这50家食品生产企业中随机抽取4家考核成绩不低于88分的企业发言,记抽到的企业中考核成绩在的企业数为X,求X的分布列与数学期望(3)若该市食品生产企业的考核成绩X服从正态分布其中近似为50家食品生产企业考核成绩的平均数,近似为样本方差,经计算得,利用该正态分布,估计该市500家食品生产企业质量管理考核成绩高于90.06分的有多少家?(结果保留整数).附参考数据与公式:则,.8.(2020·漯河模拟)十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康.经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入、实现2020年脱贫的工作计划,该地扶贫办统计了2019年50位农民的年收入并制成如下频率分布直方图:附参考数据:,若随机变量X服从正态分布,则,,.(1)根据频率分布直方图,估计50位农民的平均年收入(单位:千元);(同一组数据用该组数据区间的中点值表示);(2)由频率分布直方图,可以认为该贫困地区农民年收入X服从正态分布,其中近似为年平均收入,近似为样本方差,经计算得=6.92,利用该正态分布,求:①在扶贫攻坚工作中,若使该地区约有占总农民人数的的农民的年收入高于扶贫办制定的最低年收入标准,则最低年收入标准大约为多少千元?②为了调研“精准扶贫,不落一人”的政策要求落实情况,扶贫办随机走访了1000位农民.若每位农民的年收入互相独立,问:这1000位农民中的年收入不少于12.14千元的人数最有可能是多少?9.(2017·黑龙江模拟)某学生社团在对本校学生学习方法开展问卷调查的过程中发现,在回收上来的1000份有效问卷中,同学们背英语单词的时间安排共有两种:白天背和晚上临睡前背.为研究背单词时间安排对记忆效果的影响,该社团以5%的比例对这1000名学生按时间安排粪型进行分层抽样,并完成一项实验,实验方法是,使两组学生记忆40个无意义音节(如xIQ、GEH),均要求在刚能全部记清时就停止识记,并在8小时后进行记忆测验.不同的是,甲组同学识记结束后一直不睡觉,8小时后测验;乙组同学识记停止后立刻睡觉,8小时后叫醒测验.两组同学识记停止8小时后的准确回忆(保持)情况如图(区间含左端点而不舍右端点)(1)估计1000名被调查的学生中识记停止后8小时40个音节的保持率大于等于60%的人数;(2)从乙组准确回忆结束在|12,24)范围内的学生中随机选3人,记能准确回忆20个以上(含20)的人数为随机变量x.求X分布列及数学期望;(3)从本次实验的结果来看,上述两种时间安排方法中哪种方法背英语单词记忆效果更好?计算并说明理由.10.(2018·南宁模拟)在某单位的食堂中,食堂每天以10元/斤的价格购进米粉,然后以4.4元/碗的价格出售,每碗内含米粉0.2斤,如果当天卖不完,剩下的米粉以2元/斤的价格卖给养猪场.根据以往统计资料,得到食堂某天米粉需求量的频率分布直方图如图所示,若食堂购进了80斤米粉,以(斤)(其中)表示米粉的需求量,(元)表示利润.(1)估计该天食堂利润不少于760元的概率;(2)在直方图的需求量分组中,以区间中间值作为该区间的需求量,以需求量落入该区间的频率作为需求量在该区间的概率,求的分布列和数学期望.11.(2020·辽宁模拟)某城市100户居民的月平均用电量(单位:度),以,,,,,,分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为,,,的四组用户中,用分层抽样的方法抽取户居民,则月平均用电量在的用户中应抽取多少户?12.(2020·大连模拟)某校从参加高三模拟考试的学生中随机抽取名学生,将其数学成绩(均为整数)分成六段后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:(1)求分数在内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分;(3)用分层抽样的方法在分数段为的学生中抽取一个容量为的样本,将该样本看成一个总体,从中任取个,求至多有人在分数段内的概率.13.(2020·莆田模拟)为了解某地网民浏览购物网站的情况,从该地随机抽取100名网民进行调查,其中男性、女性人数分别为45和55.下面是根据调查结果绘制的网民日均浏览购物网站时间的频率分布直方图,将日均浏览购物网站时间不低于40分钟的网民称为“网购达人”,已知“网购达人”中女性有10人.参考公式:,其中.参考数据:0.102.7063.841 5.024 6.635 7.879 10.828(1)根据已知条件完成下面的列联表,并判断是否有90%的把握认为是否为“网购达人”与性别有关;(2)将上述调査所得到的频率视为概率,现在从该地的网民中随机抽取3名,记被抽取的3名网民中的“网购达人”的人数为X,求X的分布列、数学期望和方差.14.(2020·长春模拟)笔、墨、纸、砚是中国独有的文书工具,即“文房四宝”.笔、墨、纸、砚之名,起源于南北朝时期,其中的“纸”指的是宣纸,宣纸“始于唐代,产于泾县”,而唐代泾县隶属于宣州府管辖,故因地而得名“宣纸”,宣纸按质量等级,可分为正牌和副牌(优等品和合格品),某公司年产宣纸10000刀(每刀100张),公司按照某种质量标准值给宣纸确定质量等级,如下表所示:公式在所生产的宣纸中随机抽取了一刀(100张)进行检验,得到频率分布直方图如图所示,已知每张正牌纸的利润是10元,副牌纸的利润是5元,废品亏损10元.(1)估计该公式生产宣纸的年利润(单位:万元);(2)该公司预备购买一种售价为100万元的机器改进生产工艺,这种机器的使用寿命是一年,只能提高宣纸的质量,不影响产量,这种机器生产的宣纸的质量标准值的频率,如下表所示:其中为改进工艺前质量标准值的平均值,改进工艺后,每张正牌和副牌宣纸的利润都下降2元,请判断该公司是否应该购买这种机器,并说明理由.15.(2020·蚌埠模拟)随着网购人数的日益增多,网上的支付方式也呈现一种多样化的状态,越来越多的便捷移动支付方式受到了人们的青睐,更被网友们评为“新四大发明”之一.随着人们消费观念的进步,许多人喜欢用信用卡购物,考虑到这一点,一种“网上的信用卡”横空出世——蚂蚁花呗.这是一款支付宝和蚂蚁金融合作开发的新支付方式,简单便捷,同时也满足了部分网上消费群体在支付宝余额不足时的“赊购”消费需求.为了调查使用蚂蚁花呗“赊购”消费与消费者年龄段的关系,某网站对其注册用户开展抽样调查,在每个年龄段的注册用户中各随机抽取100人,得到各年龄段使用蚂蚁花呗“赊购”的人数百分比如图所示.参考答案:,.(1)由大数据可知,在18到44岁之间使用花呗“赊购”的人数百分比y与年龄x成线性相关关系,利用统计图表中的数据,以各年龄段的区间中点代表该年龄段的年龄,求所调查群体各年龄段“赊购”人数百分比y与年龄x的线性回归方程(回归直线方程的斜率和截距保留两位有效数字);(2)该网站年龄为20岁的注册用户共有2000人,试估算该网站20岁的注册用户中使用花呗“赊购”的人数;(3)已知该网店中年龄段在18-26岁和27-35岁的注册用户人数相同,现从18到35岁之间使用花呗“赊购”的人群中按分层抽样的方法随机抽取8人,再从这8人中简单随机抽取2人调查他们每个月使用花呗消费的额度,求抽取的两人年龄都在18到26岁的概率.16.(2020·辽宁模拟)港珠澳大桥是一座具有划时代意义的大桥.它连通了珠海香港澳门三地,大大缩短了三地的时空距离,盘活了珠江三角洲的经济,被誉为新的世界七大奇迹.截至2019年10月23日8点,珠海公路口岸共验放出入境旅客超过1400万人次,日均客流量已经达到4万人次,验放出入境车辆超过70万辆次,2019年春节期间,客流再次大幅增长,日均客流达8万人次,单日客流量更是创下11.3万人次的最高纪录.2019年从五月一日开始的连续100天客流量频率分布直方图如下(1)①同一组数据用该区间的中点值代替,根据频率分布直方图.估计客流量的平均数.②求客流量的中位数.(2)设这100天中客流量超过5万人次的有天,从这天中任取两天,设为这两天中客流量超过7万人的天数.求的分布列和期望.17.(2020·江门模拟)2019年7月1日到3日,世界新能源汽车大会在海南博鳌召开,大会着眼于全球汽车产业的转型升级和生态环境的持续改善.某汽车公司顺应时代潮流,最新研发了一款新能源汽车,并在出厂前对100辆汽车进行了单次最大续航里程(理论上是指新能源汽车所装载的燃料或电池所能够提供给车行驶的最远里程)的测试.现对测试数据进行分析,得到如图的频率分布直方图.(1)估计这100辆汽车的单次最大续航里程的平均值(同一组中的数据用该组区间的中点值代表);(2)根据大量的汽车测试数据,可以认为这款汽车的单次最大续航量程X近似地服从正态分布,经计算第(1)问中样本标准差s的近似值为50.用样本平均数作为的近似值,用样本标准差s作为的估计值,现任取一辆汽车,求它的单次最大续航里程恰在250千米到400千米之间的概率;(3)某汽车销售公司为推广此款新能源汽车,现面向意向客户推出“玩游戏,送大奖”活动,客户可根据抛掷硬币的结果,操控微型遥控车在方格图上行进,若遥控车最终停在“胜利大本营”,则可获得购车优惠券.已知硬币出现正,反面的概率都是,方格图上标有第0格、第1格、第2格……第50格.遥控车开始在第0格,客户每掷一次硬币,遥控车向前移动一次,若掷出正面,遥控车向前移动一格(从k到),若掷出反面,遥控车向前移动两格(从k到),直到遥控车移到第49格(胜利大本营)或第50格(失败大本营)时,游戏结束.设遥控车移到第n格的概率为,试证明是等比数列,并解释此方案能否成功吸引顾客购买该款新能源汽车.参考数据:若随机变量服从正态分布,则,,.18.(2020·肇庆模拟)某公司新上一条生产线,为保证新的生产线正常工作,需对该生产线进行检测,现从该生产线上随机抽取100件产品,测量产品数据,用统计方法得到样本的平均数,标准差,绘制如图所示的频率分布直方图,以频率值作为概率估值.(1)从该生产线加工的产品中任意抽取一件,记其数据为,依据以下不等式评判(表示对应事件的概率)①②③评判规则为:若至少满足以上两个不等式,则生产状况为优,无需检修;否则需检修生产线,试判断该生产线是否需要检修;(2)将数据不在内的产品视为次品,从该生产线加工的产品中任意抽取2件,次品数记为,求的分布列与数学期望.答案解析部分一、解答题1.【答案】(1)解:由题意,该地区用户对该电讯企业评分的频率分布如下表:因此可估计评分不低于70分的概率为;对该电讯企业评分的中位数设为x,可得,则,解得,所以可估计对该电讯企业评分的中位数为;(2)解:受调查用户评分在的有人,若编号依次为1,2,3,4,从中选2人的事件有、、、、、,共有个基本事件;受调查用户评分在的有人,若编号依次为1,2,3,..9,10,从中选2人,可得共有个基本事件;因此2人评分都在的概率.【解析】【分析】(1)由题意列出频率分布表,求和即可估计该地区用户对该电讯企业评分不低于70分的概率;利用中位数两侧的概率和相等列方程即可估计对该电讯企业评分的中位数;(2)由题意计算出受调查用户评分在、的人数,求出总的基本事件个数及满足要求的基本事件的个数,由古典概型概率公式即可得解.2.【答案】解:(Ⅰ)高三年级学生平均每天的学习时间为:(h);(Ⅱ)300名学生中合格的人数为(人),故补全表格如下:所以所以有99.9%的把握认为该校高三年级学生的性别与学习时长合格有关.【解析】【分析】(Ⅰ)根据频率分布直方图直接计算平均值即可;(Ⅱ)先求出300名学生中合格的人数,再补全表格,然后根据表格数据和公式计算,最后将与进行比较,进而得出结论.3.【答案】(1)解:由题意知,根据条形图,可得A水果在每天的前8小时内的销售量分别为14,15,16,17的频率分别是0.2,0.3,0.4和0.1 ,所以X的分布列为140.2(2)解:当时,设Y为水果批发商的日利润,则Y的可能取值为760,900,可得,所以期望,当时,设Z为水果批发商的日利润,则Z的可能取值为680,820,960,可得,所以期望.因为,综上可知,当时的日利润期望值大于时的日利润期望值,故答案为:.【解析】【分析】(1)由题意知,根据条形图,得到销售量分别为14,15,16,17的频率,进而得到随机变量X的分布列;(2)分别求得当和时,利润的数学期望,比较即可得到结论.4.【答案】(1)解:由题意知,500件产品中共有优等品件,则从样本中随机取一件为优等品的概率为,所以从该企业生产的所有产品中随机抽取4件,没有一件是优等品的概率为,则随机抽取4件,至少有1件优等品的概率为.(2)解:检测出3件或4件为优等品时,检测出的优等品低于3件时,,由题意知,,故X的分布列为所以数学期望.【解析】【分析】(1)先求出从样本中随机取一件为优等品的概率,再求从该企业生产的所有产品中随机抽取4件,没有一件是优等品的概率,从而可求出至少有一件是优等品的概率.(2)由题意求出检测出3件或4件为优等品时及检测出的优等品低于3件时的X的值,结合第一问求出,,从而可得X的分布列,即可计算其数学期望5.【答案】(1)解:甲解密成功所需时间的中位数为47,,解得,,解得,由频率分布直方图知,甲在分钟内解密成功的频率是;(2)解:①由题意及(1)可知第一个出场选手解密成功的概率为,第二个出场选手解密成功的概率为,第三个出场选手解密成功的概率为,所以该团队挑战成功的概率为;②由①可知按从小到大的顺序的概率分别、、,根据题意知的取值为、、,则,,,所以所需派出的人员数目的分布列为:因此,.【解析】【分析】(1)根据中位数左右两边的矩形面积之和均为0.5可求得a、b的值,并根据频率分布直方图求得甲在1分钟内解密成功的频率;(2)①由(1)得出,求出、的值,由此得出该团队挑战成功的概率为;②由题意可得出随机变量X的可能取值有1、2、3,利用独立事件的概率乘法公式计算出随机变量X在不同取值下的概率,据此可得出随机变量X的分布列,结合期望公式可计算出X的数学期望值.6.【答案】(1)解:根据题意,由频率分布直方图可知,500份血液样品指标A值的平均数为:,500份血液样品指标A值的样本方差为:.(2)解:由题意知:指标的值服从正态分布,,,则,所以,.随机抽取20名医生独立检测血液中指标的值,就相当于进行了20次独立重复试验,记“20名医生中出现4名医生血液中指标的值大于正常值20,03”为事件,则,所以从血液中指标的值的角度来看:该院医生的健康率是正常的.【解析】【分析】(1)由频率分布直方图,直接利用平均数和方差公式,求出500份血液样品指标值的平均数和样本方差;(2)由(1)得出指标的值服从正态分布,从而可求出,在根据独立重复试验中的概率求法,求出20名医生中出现4名医生血液中指标的值大于正常值20.03的概率,即可判断该院医生的健康率是否正常7.【答案】(1)解:由题意,这50家食品生产企业考核成绩的平均数为:(分),由频率分布图可知内,所以,解得分.(2)解:根据题意,这50家食品生产企业中考核成绩不低于88分的企业有:(家),其中考核成绩在内的企业有(家),所以X可能取值有0,1,2,3,4则,,,,,所以X的分布列为所以.(3)解:由题意得,所以,所以,所以(家),所以500家食品生产企业质量管理考核成绩高于90.06分的有79家.【解析】【分析】(1)利用频率分布直方图的性质能求出这50家食品生产企业考核成绩的平均数和中位数;(2)由已知得到考核成绩在内的企业有5家,得出随机变量的可能取值,分别求出相应的概率和分布列,求得数学期望;(3)根据题意得,由此估计该市500家食品生产企业质量管理考核成绩高于90.06分的企业个数.8.【答案】(1)解:千元.故估计50位农民的年平均收入为17.40千元.(2)解:由题意知,① ,所以时,满足题意,即最低年收入大约为14.77千元.②由,每个农民的年收入不少于12.14千元的事件的概率为0.9773,记1000个农民的年收入不少于12.14千元的人数为则,其中于是恰好有k个农民的年收入不少于12.14千元的事件概率为,。
高三 复习 频率分布直方图
总体密度曲线
总体密度曲线反映了总体在各个范围内取值的 百分比,精确地反映了总体的分布规律。 用样本分布直方图去估计相应的总体分布时 ,一般样本容量越大,频率分布折线图就会无限 接近总体密度曲线,就越精确地反映了总体的分 布规律,即越精确地反映了总体在各个范围内取 值百分比。
茎叶图
某赛季甲、乙两名篮球运动员每场比赛得分的原 始记录如下:
引入
我国是世界上严重缺水的国家之一, 城市缺水问题较为突出。
2000年全国主要城市中缺水情况排在前10位的城市
政府为了节约生活用水,计划在本市试行居民生 活用水定额管理,即确定一个居民月用水量标准a , 用水量不超过a的部分按平价收费,超过a的部 分按议价收费。
①如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?
组距:指每个小组的两个端点的距离,
极差 4.1 组数= = 8.2 = 组距 0.5 3.将数据分组(左闭右开) [0,0.5 ),[0.5,1 ),…,[4,4.5]
4.列频率分布表
频率分布表一般分“分 组”,“频数累计”( 可省),“频数”,“ 频率”, “ 频率/组距 ””五列,最后一行是 频数 合计
助学微博
一个对比
频率分布表:优点:能看出分布规律.缺点:不直观. 频率分布直方图:优点:很直观且能看出分布规律.缺点: 数据的轻微变化都要重新作图. 茎叶图:优点:很直观,能看出分布规律,还可以添加新 数据.缺点:数据少时方便,数据较多时不方便.
两个特性
(1)在频率分布表中,频数的和等于样本容量,每一小组的频 率等于这一组的频数除以样本容量,各小组频率的和等于 1; (2)在频率分布直方图中,小矩形的高等于每一组的频率/组 距,每个小矩形的面积等于该组的频率,所有小矩形的面积 之和为 1.
第9章统计专题3 频率分布直方图常考题型专题练习——【含答案】
1频率分布直方图【知识总结】 1.频率分布直方图(1)纵轴表示频率组距,即小长方形的高=频率组距;(2)小长方形的面积=组距×频率组距=频率;(3)各个小方形的面积总和等于1 . 2.频率分布表的画法第一步:求极差,决定组数和组距,组距=极差组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. 3. 频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.2【巩固练习】1、随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36. 根据上述数据得到样本的频率分布表如表所示.分组 频数 频率[25,30] 3 0.12(30,35] 5 0.20(35,40] 8 0.32(40,45] n 1 f 1(45,50] n 2 f 2(1)确定样本频率分布表中n 1,n 2,f 1和f 2的值;(2)根据上述频率分布表,画出样本频率分布直方图和频率分布折线图. 【答案】(1) n 1=7,n 2=2,f 1=0.28,f 2=0.08 (2)见解析【解析】(1)由所给数据知,落在区间(40,45]内的有7个,落在(45,50]内的有2个,故1n =7,2n =2,所以f 1=125n =725=0.28,f 2=225n =225=0.08. (2)样本频率分布直方图和频率分布折线图如图所示.32. 为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是( )A .35B .48C .60D .75【答案】C【解析】设被抽查的美术生的人数为n ,因为后2个小组的频率之和为(0.0375+0.0125)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n =515250.75++=60.故选:C.3、某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为若低于60分的人数是15人,则该班的学生人数是( )A .B .C .D.【答案】B【解析】根据频率分布直方可知成绩低于60分的有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20,则成绩低于60分的频率P=(0.005+0.010)×20=0.3.又因为低于60分的人数是15人,所以该班的学生人数是15÷0.3=50.本题选择B选项.4、某校初三年级有400名学生,随机抽查了40名学生测试1分钟仰卧起坐的成绩(单位:次),将数据整理后绘制成如图所示的频率分布直方图.用样本估计总体,下列结论正确的是( )4A.该校初三学生1分钟仰卧起坐的次数的中位数为25B.该校初三学生1分钟仰卧起坐的次数的众数为24C.该校初三学生1分钟仰卧起坐的次数超过30的人数约有80D.该校初三学生1分钟仰卧起坐的次数少于20的人数约为8[解析] 第一组数据的频率为0.02×5=0.1,第二组数据的频率为0.06×5=0.3,第三组数据的频率为0.08×5=0.4,∴中位数在第三组内,设中位数为25+x,则x×0.08=0.5-0.1-0.3=0.1,∴x=1.25,∴中位数为26.25,故A错误;第三组数据所在的矩形最高,第三组数据的中间值为27.5,∴众数为27.5,故B错误;1分钟仰卧起坐的次数超过30的频率为0.2,∴超过30次的人数为400×0.2=80,故C正确;1分钟仰卧起坐的次数少于20的频率为0.1,∴1分钟仰卧起坐的次数少于20的人数为400×0.1=40,故D错误.故选C.[答案] C5、某家庭记录了未使用节水龙头50天的日用水量数据(单位:3m)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用[)0,0.1[)0.1,0.2[)0.2,0.3[)0.3,0.4[)0.4,0.5[)0.5,0.6[)0.6,0.756水量频数132 49 26 5使用了节水龙头50天的日用水量频数分布表日用水量[)0,0.1[)0.1,0.2 [)0.2,0.3 [)0.3,0.4 [)0.4,0.5 [)0.5,0.6频数151310165(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:7(2)估计该家庭使用节水龙头后,日用水量小于30.35m 的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【答案】(1)直方图见解析;(2)0.48;(3)347.45m . 【解析】(1)频率分布直方图如下图所示:(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于30.35m 的频率为0.20.110.1 2.60.120.050.48⨯+⨯+⨯+⨯=;因此该家庭使用节水龙头后日用水量小于30.35m 的概率的估计值为0.48; (3)该家庭未使用节水龙头50天日用水量的平均数为()110.0510.1530.2520.3540.4590.55260.6550.4850x =⨯+⨯+⨯+⨯+⨯+⨯+⨯=. 该家庭使用了节水龙头后50天日用水量的平均数为8()210.0510.1550.25130.35100.45160.5550.3550x =⨯+⨯+⨯+⨯+⨯+⨯=. 估计使用节水龙头后,一年可节省水()()30.480.3536547.45m -⨯=.6、某电视台为宣传本省,随机对本省内1565~岁的人群抽取了n 人,回答问题“本省内著名旅游景点有哪些”统计结果如图表所示(1)分别求出a b x y 、、、的值;(2)从第234、、组回答正确的人中用分层抽样的方法抽取6人,求第234、、组每组各抽取多少人?(3)指出直方图中,这组数据的中位数是多少(取整数值)?【答案】(1)5a =,27b =,0.9x =,0.2y =;(2)2人,3人,1人;(3)42【解析】(1)由已知第4组人数为9250.36=,∴251000.02510n ==⨯,9由频率分布直方图得第一组人数为:1000.011010⨯⨯=,100.55a =⨯=,第二组人数为:1000.021020⨯⨯=,180.920x ==, 第三组人数为:1000.031030⨯⨯=,300.927b =⨯=,第五组人数为:1000.0151015⨯⨯=,30.215x ==. (2)第2、3、4组回答正确人数分别18、27、9,共54人,设第234、、组分别抽取,,x y z 人,则65418279x y z===,解得2,3,1x y z ===. (3)第1、2组频率和为0.10.20.3+=,第4、5组频率和为0.250.150.4+=,第3组频率为0.3,设中位数为m ,则350.50.3100.3m --=,241423m =≈. ∴中位数为42.7、某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图.10(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数.【答案】(1)0.0075x =;(2)众数是230,中位数为224. 【解析】(1)由直方图的性质可得(0.0020.00950.0110.01250.0050.0025)201x ++++++⨯=,∴0.0075x =.(2)月平均用电量的众数是2202402302+=, ∵(0.0020.00950.011)200.450.5++⨯=<, 月平均用电量的中位数在[220,240)内,设中位数为a ,由(0.0020.00950.011)200.0125(220)0.5a ++⨯+⨯-=,可得224a =, ∴月平均用电量的中位数为2248、为参加学校的“我爱古诗词”知识竞赛,小王所在班级组织了一次古诗词知识测试,并将全班同学的分数(得分取正整数,满分为100分)进行统计,以下是根据这次测试成绩制作的不完整的频率分布表和频率分布直方图.频率分布表组别分组频数频率1 [50,60) 9 0.182 [60,70) a3 [70,80) 20 0.404 [80,90) 0.085 [90,100] 2 b合计 1请根据以上频率分布表和频率分布直方图,回答下列问题:(1)求出a,b,c,d的值;(2)老师说:“小王的测试成绩是全班同学成绩的中位数”,那么小王的测试成绩在什么范围内.1112【答案】(1) a =15,b =0.04,c =0.03,d =0.004 (2) 70≤x <80 【解析】(1)样本容量为9÷0.18=50,50×0.08=4, 所以a =50-9-20-4-2=15,b =2÷50=0.04,c =15÷50÷10=0.03,d =0.04÷10=0.004.(2)因为样本容量为50,则样本的中位数是第25,26个数据的平均数, 而第25,26个数据均位于70≤x <80范围内, 所以小王的测试成绩在70≤x <80范围内.9、某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[)50,60,[)60,70,[)70,80,[)80,90,[]90,100.分数段[)50,60[)60,70[)70,80[)80,90:x y1∶12∶13∶44∶513(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[)50,90之外的人数. 【答案】(1)0.005a =;(2)73(分);(3)10.【解析】(1)由频率分布直方图知(20.020.030.04)101a +++⨯=,解得0.005a =. (2)由频率分布直方图知这100名学生语文成绩的平均分为550.00510650.0410750.0310850.0210950.0051073⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=(分).(3)由频率分布直方图知语文成绩在[)50,60,[)60,70,[)70,80,[)80,90各分数段的人数依次为:0.005101005,0.041010040,0.031010030,0.021010020⨯⨯=⨯⨯=⨯⨯=⨯⨯=由题中给出的比例关系知数学成绩在上述各分数段的人数依次为1455,4020,3040,2025234⨯=⨯=⨯=.故数学成绩在[50,90)之外的人数为100(5204025)10-+++=.10.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值分[75,85) [85,95) [95,105) [105,115) [115,125) 组频数 6 26 38 22 8(I)在答题卡上作出这些数据的频率分布直方图:(II)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(III)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?14【答案】(1)见解析;(2)平均数100,方差为104;(3)不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.【解析】(1)直方图如图,(2)质量指标值的样本平均数为x=⨯+⨯+⨯+⨯+⨯=.800.06900.261000.381100.221200.08100质量指标值的样本方差为22222s=-⨯+-⨯+⨯+⨯+⨯=.(20)0.06(10)0.2600.38100.22200.08104(3)质量指标值不低于95的产品所占比例的估计值为++=,0.380.220.080.68由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.11、从某企业生产的某种产品中随机抽取100件,测量这些产品的某项质量指标,由测量1516结果得到如下频数分布表:质量指标值分组[)75,85[)85,95[)95,105[)105,115[)115,125频数62638228()1在图中作出这些数据的频率分布直方图;()2估计这种产品质量指标值的平均数、中位数(保留2位小数);()3根据以上抽样调査数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?【答案】(1)直方图见解析;(2)平均数100,中位数99.74;(3)不能. 【解析】()1由已知作出频率分布表为:质量指标值分组[)75,85 [)85,95 [)95,105 [)105,115 [)115,12517频数 6 26 38 22 8频率0.06 0.26 0.38 0.22 0.08由频率分布表作出这些数据的频率分布直方图为:()2质量指标值的样本平均数为:800.06900.261000.381100.221200.08100x =⨯+⨯+⨯+⨯+⨯=,[)75,95内频率为:0.060.260.32+=,∴中位数位于[)95,105内,设中位数为x ,则0.50.260.06951099.740.38x --=+⨯≈,∴中位数为99.74.()3质量指标值不低于95 的产品所占比例的估计值为0.380.220.080.68++=.由于该估计值小于0.8,故不能认为该企业生产的这种产品“质量指标值不低于95 的产品至少要占全部产品80%的规定.18。
1431432 频率直方图Word版含解析
14.3.2频率直方图学习目标核心素养1.通过对实例的分析,体会总体分布的意义和作用.2.在表示样本数据的过程中,学会列频率分布表,画频率直方图、频率折线图,体会它们各自的特点,学会应用频率直方图分析个体在总体中的分布位置.(重点)3.会利用样本数据的四种图表估计总体分布.1.通过对问题中数据样本进行分析,培养学生数据分析的数学核心素养.2.通过对样本数据的计算来培养学生数学运算的数学核心素养.频数直方图可以直观地看出各组数据地频数,但是当所取的组距不全相等时,任意给人以错觉,认为矩形面积越大,频数就越多,因此需要进一步学习频率直方图,能否运用频率直方图分析个体在总体中的分布位置?把横轴均分成若干段,每一段对应的长度称为组距,然后以此线段为底作矩形,它的高等于该组的频率组距,这样得出一系列的矩形,每个矩形的面积恰好是该组的频率,这些矩形就构成了频率直方图.思考1:(1)对数据分组时,组距、组数的确定有没有固定的标准?(2)当样本容量不超过100时,分多少组合适?提示:(1)组距与组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.在确定分组区间的端点,即分点时,应对分点进行适当调整,使分点比数据多一位小数,并确保每个数据均能落在一个区间内,而不是处于区间的端点.(2)组数与样本容量有关,一般地,样本容量越大,分的组数也越多.当样本容量不超过100时,按照数据的多少,常分成5至12组.2.频率折线图如果将频率直方图中各个矩形的上底边的中点顺次连接起来,并将两端点向外延伸半个组距,就得到频率折线图,简称折线图.1.下列关于频率直方图的说法,正确的是()A.直方图的高表示取某数的频率B.直方图的高表示该组上的个体在样本中出现的频数与组距的比值C.直方图的高表示该组上的个体在样本中出现的频率D.直方图的高表示该组上的个体在样本中出现的频率与组距的比值D[频率直方图的高表示该组上的个体在样本中出现的频率与组距的比值.] 2.将一批数据分成四组,列出频率表,其中第一组的频率是0.27,第二组与第四组的频率之和为0.54,那么第三组的频率是________.0.19[根据题意知,四个组的频率之和为1,所以第三组的频率为1-0.27-0.54=0.19.]3.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率直方图如图所示,其中支出在[50,60]的同学有30人,若想在这n个人中抽取50个人,则在[50,60]之间应抽取的人数为________.15[根据频率直方图得总人数n=301-(0.01+0.024+0.036)×10=100,依题意知,应采取分层抽样,再根据分层抽样的特点,则在[50,60]之间应抽取的人数为50×30100=15.]频率表的制作及应用分组[10,20)[20,30)[30,40)[40,50)[50,60)[60,70]频数234542(2)已知一个样本数据:27232527293127303231 28262729282426272830以2为组距,列出频率表.(1)0.45[数据落在区间[10,40)内的频数为9,样本容量为20,所求频率为9 20=0.45.故填0.45.(2)[解]①计算最大值与最小值的差:最大值为32,最小值为23,它们的差为32-23=9.②已知组距为2,决定组数:因为92=4.5,所以组数为5.③决定分点:[22.5,24.5),[24.5,26.5),[26.5,28.5),[28.5,30.5),[30.5,32.5].④列频率表如下:1.频率、频数和样本容量的关系为频率=样本容量,利用此式可知二求一.2.制作频率表的步骤(1)求全距,决定组数与组距,组距=全距组数;(2)分组,通常对组内数值所在区间取左闭右开区间(或左开右闭区间),最后一组取闭区间;(3)登记频数,计算频率,列出频率表.提醒:(1)在制作频率表时,分组过多或过少都不好.分组过多会给制作频率表带来困难,分组过少虽减少了操作,但不能很好地反映总体情况.一般样本容量越大,所分组数应越多.(2)所分的组数应力求“取整”.组数k=全距组距,若k∈Z,则组数为k;否则,组数为大于k的最小整数,这时需适当增大全距,在两端同时增加适当的范围.(3)在决定分点时,应避免将样本中的数据作为分点,常将分点的数值取比样本中的数据多一位小数.[跟进训练]1.一个容量为n的样本分成若干组,已知某组的频数和频率分别为30和0.25,则n等于________.120[某一组的频率等于该组的频数与样本容量的比.由于30n=0.25,所以n=120.]2.对某电子元件进行寿命追踪调查,情况如下:(2)估计寿命在100 h~400 h以内的电子元件所占的百分比.[解](1)(2)由频率表可以看出,寿命在100 h~400 h的电子元件出现的频率为0.65,因此我们估计寿命在100 h~400 h的电子元件所占的百分比为65%.频率直方图、折线图的制作与应用情况,现从中随机抽出10辆在同一条件下进行耗油1 L所行路程试验,得到如下样本数据(单位:km):13.7,12.7,14.4, 13.8,13.3,12.5,13.5,13.6,13.1,13.4,其分组如下:分组频数频率[12.45,12.95)[12.95,13.45)[13.45,13.95)[13.95,14.45]合计10 1.0(1)(2)根据上表,在给定坐标系中画出频率直方图及频率折线图;(3)根据上述图表,估计总体数据落在[12.95,13.95)中的可能性.[思路点拨](1)依据频率表的制作步骤完成上面的频率表.(2)依据制作频率直方图及频率折线图的方法步骤绘制频率直方图及频率折线图.(3)计算出样本数据落在[12.95,13.95)中的频率.[解](1)频率表:分组频数频率[12.45,12.95) 2 0.2[12.95,13.45) 3 0.3[13.45,13.95) 4 0.4[13.95,14.45] 1 0.1合计10 1.0(2)频率直方图及频率折线图如图.(3)根据上述图表,可知数据落在[12.95,13.95)中的频率为0.3+0.4=0.7,故总体数据落在[12.95,13.95)中的可能性为0.7.1.制作频率直方图的方法步骤 (1)制作频率表.(2)建立直角坐标系:把横轴分成若干段,每一段对应一个组的组距,纵轴表示频率组距. (3)画矩形:在横轴上标明各组端点值,以相邻两点间的线段为底,作高等于该组的频率组距的矩形,这样得到一系列矩形,就构成了频率直方图.2.频率折线图的制作步骤 (1)取每个矩形上底边中点. (2)顺次连接各个中点.(3)取值区间两端点需分别向外延伸半个组距,并取此组距上在x 轴上的点与折线的首、尾分别相连.3.解决频率直方图的相关计算,需掌握下列关系式:(1)频率组距×组距=频率,即小长方形的高乘以宽即为落在相应区间数据的频率. (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量. 提醒:频率直方图中,每个矩形的高为频率组距,面积为对应组的频率.[跟进训练]3.如图是容量为100的样本的频率直方图,试根据图中的数据填空: 样本数据落在[6,10)内的频率为________,样本数据落在[10,14)内的频率为________.0.320.36[样本数据落在[6,10)内的频率为0.08×4=0.32,样本数据落在[10,14)内的频率为0.09×4=0.36.]4.通过全国人口普查工作,得到我国人口的年龄频率直方图如图,那么在一个总人口数为200万的城市中,年龄在[20,60)之间的人大约有________万.116[在频率直方图中,小矩形的面积表示频率,年龄在[20,60)之间的频率约为(0.018+0.011)×20=0.58,200×0.58=116(万),故年龄在[20,60)之间的人大约有116万.]1.本节课的重点是会列频率表,会画频率直方图、频率折线图,难点是理解用样本的频率估计总体分布的方法.2.本节课要重点掌握的规律方法(1)绘制频率直方图的步骤.(2)会用频率直方图的意义解决问题.1.在某次赛车中,50名参赛选手的成绩(单位:min)全部介于13到18之间(包括13和18),将比赛成绩分为五组:第一组[13,14),第二组[14,15),…,第五组[17,18].其频率分布直方图如图所示,若成绩在[13,15)内的选手可获奖,则这50名选手中获奖的人数为()A.39B.35C.15D.11D[由频率分布直方图知成绩在[15,18]内的频率为(0.38+0.32+0.08)×1=0.78.所以成绩在[13,15)内的频率为1-0.78=0.22.则成绩在[13,15)内的选手有50×0.22=11(人),即这50名选手中获奖的人数为11,故选D.]2.容量为100的某个样本,数据拆分为10组,并填写频率表,若前七组频率之和为0.79,而剩下三组的频率依次相差0.05,则剩下的三组中频率最高的一组的频率为________.0.12[设剩下的三组中频率最高的一组的频率为x,则另两组的频率分别为x -0.05,x-0.1,而由频率总和为1,得0.79+(x-0.05)+(x-0.1)+x=1,解得x =0.12.]3.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5),2;[15.5,19.5),4;[19.5,23.5),9;[23.5,27.5),18;[27.5,31.5),11;[31.5,35.5),12;[35.5,39.5),7;[39.5,43.5],3.根据样本的频率,估计大于或等于31.5的数据约占________. 13[根据各组数据可知,符合条件的数据占12+7+366=13.]4.在一个容量为80的样本中,数据的最大值是140,最小值是56,组距是10,则应将样本数据分为多少组?[解]当全距组距不是整数时,组数=⎣⎢⎢⎡⎦⎥⎥⎤全距组距+1.本题全距=140-56=84,组距为10,故应分9组.。
专题03 频率分布直方图(原卷版)
专题3 频率分布直方图例1.要调查某地区高中学生身体素质,从高中生中抽取100人进行跳高测试,根据测试成绩制作频率分布直方图如图,现从成绩在[120,140)之间的学生中用分层抽样的方法抽取5人,应从[120,130)间抽取人数为b,则()A.a=0.2,b=2B.a=0.025,b=3C.a=0.3,b=4D.a=0.030,b=3例2.从某企业生产的某种产品中随机抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:[70,80)[80,90)[90,100)[100,110)110,120)质量指标值分组频数1420361812估计这种产品质量指标值的平均数为(同一组中的数据用该组区间的中点值作代表)()A.100B.98.8C.96.6D.94.4例3.“新冠肺炎”席卷全球,我国医务工作者为了打好这次疫情阻击战,充分发挥优势,很快抑制了病毒,据统计老年患者治愈率为71%,中年患者治愈率为85%,青年患者治愈率为91%.如果某医院有30名老年患者,40名中年患者,50名青年患者,则估计该医院的平均治愈率是()A.86%B.83%C.90%D.84%例4.已知样本数据x1,x2,…,x n(n∈N*)的平均数与方差分别是a和b,若y i=﹣2x i+3(i=1,2,…n),且样本数据y1,y2,…,y n的平均数与方差分别是b和a,则a﹣b=()A.1B.2C.3D.4例5.下面定义一个同学数学成绩优秀的标志为:“连续5次考试成绩均不低于120分”.现有甲、乙、丙三位同学连续5次数学考试成绩的记录数据(记录数据都是正整数):①甲同学:5个数据的中位数为127,众数为120;②乙同学:5个数据的中位数为125,总体均值为127;③丙同学:5个数据的中位数为135,总体均值为128,总体方差为19.8.则可以判定数学成绩优秀同学为()A.甲、乙B.乙、丙C.甲、丙D.甲、乙、丙例6.若数据x1,x2,…,x n的平均数x=3,方差s2=1,则数据2x1+3,2x2+3,…,2x n+3的平均数和方差分别为()A.6,6B.9,2C.9,6D.9,4例7.随着城镇化的不断发展,老旧小区的改造及管理已经引起了某市政府的高度重视,为了了解本市甲,乙两个物业公司管理的小区住户对其服务的满意程度,现从他们所服务的小区中随机选择了40个住户,根据住户对其服务的满意度评分,得到A区住户满意度评分的频率分布直方图和B区住户满意度评分的频率分布表.B区住户满意度评分的频率分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数4610128(Ⅰ)在图2中作出B区住户满意度评分的频率分布直方图,并通过频率分布直方图计算两区住户满意度评分的平均值及分散程度(其中分散程度不要求计算出具体值,给出结论即可);(Ⅱ)根据住户满意度评分,将住户和满意度分为三个等级:满意度评分低于70分,评定为不满意;满意度评分在70分到89分之间,评定为满意;满意度评分不低于90分,评定为非常满意.试估计哪个地区住户的满意度等级为不满意的概率大?若是要选择一个物业公司来管理老旧小区的物业,从满意度角度考虑,应该选择哪一个物业公司?说明理由.例8.某校在一次期末数学测试中,为统计学生的考试情况,从学校的2000名学生中随机抽取50名学生的考试成绩,被测学生成绩全部介于65分到145分之间(满分150分),将统计结果按如下方式分成八组:第一组[65,75),第二组[75,85),……第八组[135,145],如图是按上述分组方法得到的频率分布直方图的一部分.(1)求第七组的频率,并完成频率分布直方图;(2)用样本数据估计该校的2000名学生这次考试成绩的平均分(同一组中的数据用该组区间的中点值代表该组数据平均值);(3)若从样本成绩属于第六组和第八组的所有学生中随机抽取2名,求他们的分差的绝对值小于10分的概率.例9.我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准x,用水量不超过x的部分按平价收费,超出x的部分按议价收费.下面是居民月均用水量的抽样频率分布直方图.①求直方图中a的值;②试估计该市居民月均用水量的众数、平均数;③设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;④如果希望85%的居民月均用水量不超过标准x,那么标准x定为多少比较合理?例10.如图是某校高三(1)班的一次数学知识竞赛成绩的基叶图(图中仅列出[50,60),[90,100)的数据)和频率分布直方图.(1)求全班人数以及频率分布直方图中的x,y;(2)估计学生竞赛成绩的平均数和中位数(保留两位小数).例11.某高中数学建模兴趣小组的同学为了研究所在地区男高中生的身高与体重的关系,从若干个高中男学生中抽取了1000个样本,得到如下数据.数据一:身高在[170,180)(单位:cm)的体重频数统计体重(kg)[50,55)[55,60)[60,65)[65,70)[70,75)[75,80)[80,85)[85,90)人数206010010080201010数据二:身高所在的区间含样本的个数及部分数据身高x(cm)[140,150)[150,160)[160﹣170)[170﹣180)[180﹣190)平均体重y(kg)4553.66075(Ⅰ)依据数据一将下面男高中生身高在[170﹣180)(单位:cm)体重的频率分布直方图补充完整,并利用频率分布直方图估计身高在[170﹣180)(单位:cm)的中学生的平均体重;(保留小数点后一位)(Ⅱ)依据数据一、二,计算身高(取值为区间中点)和体重的相关系数约为0.99,能否用线性回归直线来刻画中学生身高与体重的相关关系,请说明理由;若能,求出该回归直线方程;(Ⅲ)说明残差平方和或相关指数R2与线性回归模型拟合效果之间关系.(只需写出结论,不需要计算)参考公式:b=∑ni=1(x i−x)(y i−y)∑n i=1(x i−x)2=∑ni=1x i y i−nx⋅y∑n i=1x i2−nx2,a=y−b x.参考数据:(1)145×45+155×53.6+165×60+185×75=38608;(2)1452+1552+1652+1752+1852﹣5×1652=1000.(3)663×175=116025,664×175=116200,665×175=116375.(4)728×165=120120.例12.市政府为了节约用水,调查了100位居民某年的月均用水量(单位:t),频数分布如下:分组[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]频数4815222514642(1)根据所给数据将频率分布直方图补充完整(不必说明理由);(2)根据频率分布直方图估计本市居民月均用水量的中位数;(3)根据频率分布直方图估计本市居民月均用水量的平均数(同一组数据由该组区间的中点值作为代表).例13.某地区100居民的人均用水量(单位:t)的分组的频数如下:[0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22;[2,2.5),25;[2.5,3),14;[3,3.5),6;[3.5,4),4;[4,4.5),2.(1)列出样本的频率分布表;(2)画出频率分布直方图,并根据直方图估计这组数据的众数;(坐标轴单位自定)(3)当地政府制订了人均月用水量为3t的标准,若超出标准加倍收费,当地政府解释说,85%以上的居民不超出这个标准,这个解释对吗?为什么?例14.某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60)…[90,100]后画出如下频率分布直方图.观察图形的信息,回答下列问题:(Ⅰ)估计这次考试的众数m与中位数n(结果保留一位小数);(Ⅱ)估计这次考试的及格率(60分及以上为及格)和平均分.例15.为应对新冠疫情,重庆市于2020年1月24日启动重大突发公共卫生事件一级响应机制,要求市民少出门,少聚集,于是快递业务得到迅猛发展.为满足广大市民的日常生活所需,某快递公司以优厚的条件招聘派送员,现给出了两种日薪薪酬方案,甲方案:底薪100元,每派送一单奖励1元;乙方案:底薪150元,每日前55单没有奖励,超过55单的部分每单奖励10元.(Ⅰ)请分别求出这两种薪酬方案中日薪y(单位:元)与送货单数n的函数关系式;(Ⅱ)根据该公司所有派送员10天的派送记录,发现派送员的日平均派送单数与天数满足以下表格:日均派送单数5054565860频数(天)23221回答下列问题:①根据以上数据,设每名派送员的日薪为X(单位:元),试分别求出这10天中甲、乙两种方案的日薪X的平均数及方差;②结合①中的数据,根据统计学的思想,若你去应聘派送员,选择哪种薪酬方案比较合适,并说明你的理由.(参考数据:172=289,372=1369)例16.2019年起,全国地级及以上城市全面启动生活垃圾分类工作,垃圾分类投放逐步成为居民的新时尚.为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收垃圾、有害垃圾和其他垃圾四类,并分别设置了相应的垃圾箱.为调查居民生活垃圾分类投放情况,现随机抽取了某市三类垃圾箱中总计1000吨生活垃圾,数据统计如下(单位:吨):“厨余垃圾”箱“可回收垃圾”箱“有害垃圾”箱“其他垃圾”箱厨余垃圾300703080可回收垃圾302103030有害垃圾20206020其他垃圾10201060(1)分别估计厨余垃圾和有害垃圾投放正确的概率;(2)假设厨余垃圾在“厨余垃圾”箱、“可回收垃圾”箱、“有害垃圾”箱、“其他垃圾”箱的投放量分别为a,b,c,d,其中a>0,a+b+c+d=800.当数据a,b,c,d的方差s2最大时,写出a,b,c,d 的值(结论不要求证明),并求此时s2的值.例17.某市教育局为了解全市高中学生在素质教育过程中的幸福指数变化情况,对8名学生在高一,高二不同学习阶段的幸福指数进行了一次跟踪调研.结果如表:学生编号123456789593969497989695高一阶段幸福指数学生编号123456789497959695949396高二阶段幸福指数(1)根据统计表中的数据情况,分别计算出两组数据的平均值及方差;(2)请根据上述结果,就平均值和方差的角度分析,说明在高一,高二不同阶段的学生幸福指数状况,并发表自己观点.例18.2020年1月,教育部《关于在部分高校开展基础学科招生改革试点工作的意见》印发,自2020年起,在部分高校开展基础学科招生改革试点(也称“强基计划”).强基计划聚焦高端芯片与软件、智能科技、新材料、先进制造和国家安全等关键领域以及国家人才紧缺的人文社会科学领域,选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生.新材料产业是重要的战略性新兴产业,如图是我国2011﹣2019年中国新材料产业市场规模及增长趋势图.其中柱状图表示新材料产业市场规模(单位:万亿元),折线图表示新材料产业市场规模年增长率(%).(1)求从2012年至2019年,每年新材料产业市场规模年增长量的平均数(精确到0.1);(2)从2015年至2019年中随机挑选两年,求两年中至少有一﹣年新材料产业市场规模年增长率超过20%的概率;(3)由图判断,从哪年开始连续三年的新材料产业市场规模的方差最大.(结论不要求证明)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高考题型之频率分布直方图
知识点:............................................................................................................................................................................... - 1 -典型例题:........................................................................................................................................................................... - 1 -答案....................................................................................................................................................................................... - 4 -
知识点:
典型例题:
1.某工厂对一批产品进行了抽样检测.有图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100), [100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是
(A)90 (B)75 (C)60 (D)45
2.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……第六组,成绩大于等于18秒且小于19秒。
右图是按上述分组方法得到的频率分布直方图。
设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为
(A)0.9,35(B)0.9,45(C)0.1,35(D)0.1,45
3.某个小区住户共200户,为调查小区居民的7月份用水量,用分层抽样的方法抽取了50户进行调查,得到本月的用水量(单位:m3)的频率分布直方图如图所示,则小区内用水量超过15m3的住户的户数为
A.10
B.50
C.60
D.140
4.某时段内共有100辆汽车经过某一雷达地区,时速频率分布直方图如右图所示,则时速超过60km/h的汽车数量为_____________;
5.某个容量为100的样本的频率分布直方图如下,则在区间[4,5)上的数据的频数
..为.
6.某地区教育主管部门为了对该地区模拟考试成绩进行分析,抽取了总成绩介于350分到650分之间的10000名学生成绩,并根据这10000名学生的总成绩画了样本的频率分布直方图.为了进一步分析学生的总成绩与各科成绩等方面的关系,要从这10000名学生中,再用分层抽样方法抽出200人作进一步调查,则总成绩在[400,500)内共抽出( )
A.100人
B.90人
C.65人
D.50人
7.济南交警部门随机测量了顺河高架桥南下口某一时间段经过的2000辆汽车的时速,时速频率分布直方图如图所示,则时速超过70km/h的汽车数量为_______
8.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:
根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是 ( )
(A)20 (B)30 (C)40 (D)50
9.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2500,3000)(元)月收入段应抽出人.
10.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图)。
由图中数据
可知a=。
若要从身高在[ 120 , 130),[130 ,140) , [140 , 150]三组内的学生中,用分层抽样的方法选取
18人参加一项活动,则从身高在[140 ,150]内的学生中选取的人数应为。
11.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则其抽样的100根中,有____根在棉花纤维的长度小于20mm 。
本类题的特征是:__________________________________________________________________________________ __________________________________________________________________________________________________ 本类题的做法是:__________________________________________________________________________________ __________________________________________________________________________________________________
答案
1.【解析】:产品净重小于100克的概率为(0.050+0.100)×2=0.300, 已知样本中产品净重小于100克的个数是36,设样本容量为n ,则300.036=n
,所以120=n ,净重大于或等于98克并且小于104克的产品的概率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.故选A.
2. A .【分析】:从频率分布直方图上可以看出0.9x =,35y =.
3.C 【解析】以50为样本容量可计算出超过3
15m 用水量的户数为()50.050.015015,⨯+⨯=所以可估算200户居民超过3
15m 用水量的户数60.
4.38
5. 30
6.B
7.200
8.C
9.25 10.答案:0.030 3
11. [解析]考查频率分布直方图的知识。
100×(0.001+0.001+0.004)×5=30。