频率分布直方图中的基本计算问题
用频率分布直方图估计总体分布

答案 不能,因为把样本数据做成频率分布直方图后就失去了原始数据.
问题 2: 给出样本数据的频率分布直方图,可以求出数据的众数、中位数和平均数吗?
答案
可以近似地求出
课前预学
课堂导学
1.利用频率分布直方图求数字特征
(1)众数是最高的矩形的底边的中点;
(2)中位数左右两侧直方图的面积相等;
(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
生产的产品是否有 75%以上为一等品?
参考数据: 150≈12.2
课前预学
方法指导
课堂导学
(1)区间中点值和频率相乘,再分别相加可得平均数,再利用方差
公式可求方差;(2)由质量指标值在(185,215)内的频率可得一等品的百分比.
解析
(1)由频率分布直方图可得
=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=20
则 0.0050×20+0.0075×20+0.0150×(a-40)=0.5,解得 a=
中位数的估计值为
170
3
.
170
3
,即所有参赛选手得分的
课前预学
课堂导学
任务 1: 频率分布直方图中简单的数字计算
问题 1:频率分布直方图的横轴表示什么?
答案
频率分布直方图的横轴表示样本数据..
问题 2: 如何计算频率分布直方图中每一小组的频率.
们的得分按照[0,20],(20,40],(40,60],(60,80],(80,100]分组,绘成频率分布直方图(如图).
问题 1:如何求图中 x 的值?
用直方图算平均数,中位数、众数、标准差

思考
如何从频率分布直方图中估计众数、 中位数、平均数呢? 众数:最高矩形的中点的横坐标 2.25
中位数:左右两边直方 2.02 图的面积相等. 平均数:频率分布直方 图中每个小矩形的面 积乘以小矩形底边中 点的横坐标之和. 2.02
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
17
例1:画出下列四组样本数据的直方图,说 明它们的异同点.
(1)
(2)
(3)
(4)
例2:甲乙两人同时生产内径为25.40mm的一种零件. 为了对两人的生产质量进行评比,从他们生产的零件 中各抽出20件,量得其内径尺寸如下(单位:mm ) 甲
X甲≈25.401 s甲≈0.037
乙
X乙≈25.406 S乙≈0.068
平均数向我们提供了样本数据的重要信 息,但是,有时它也会影响我们,使我们对 总体作出片面判断。平均数反映数据的集中 趋势,但是,只有平均数还难以概况样本数 据的实际状态。当样本的平均数相等或相差 无几时,就要用样本数据的离散程度来估计 总体的数字特征。这时,我们引进了一个概 念:标准差!
12
标准差
众数在一组数据中出现次数最多的数据叫做这一组数据的众数中位数将一组数据按大小依次排列把处在最中间位置的一个数据或两个数据的平均数叫做这组数据的中位数如何从频率分布直方图中估计众数中位数平均数呢
1
问题
在一次射击比赛中,甲、乙两名运动员各射击
10次,命中环数如下﹕ 甲运动员﹕7,8,6,8,6,5,8,10,7,4; 乙运动员﹕9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发挥
a.用样本平均数估计总体平均数。
b.用样本标准差估计总体标准差。样本容量越大, 估计就越精确。 2.平均数对数据有“取齐”的作用,代表一组数据 的平均水平。
利用频率直方图求中位数、众数、平均数-高考数学微专题突破含详解

高考数学微专题突破利用频率分布直方图求中位数、平均数、总数一、单选题1.某校为了解高二年级学生某次数学考试成绩的分布情况,从该年级的1120名学生中随机抽取了100名学生的数学成绩,发现都在[]80,150内现将这100名学生的成绩按照[)8090,,[)90100,,[)100110,,[)110120,,[)120130,,[)130140,,[]140150,分组后,得到的频率分布直方图如图所示,则下列说法正确的是()A .频率分布直方图中a 的值为0.040B .样本数据低于130分的频率为0.3C .总体的中位数(保留1位小数)估计为123.3分D .总体分布在[)90100,的频数一定与总体分布在[)100110,的频数相等2.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n 个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已知学习时长在[)9,11的学生人数为25,则n 的值为()A .40B .50C .80D .1003.某地工商局对辖区内100家饭店进行卫生检查并评分,分为甲、乙、丙、丁四个等级,其中分数在[)60,70,[)70,80,[)80,90,[]90,100内的等级分别为:丁、丙、乙、甲,对饭店评分后,得到频率分布折线图,如图所示,估计这些饭店得分的平均数是()A .80.5B .80.6C .80.7D .80.84.下面是甲、乙两位同学高三上学期的5次联考数学成绩,现在只知其从第1次到第5次分数所在区间段分布的条形图(从左至右依次为第1至第5次),则从图中可以读出一定正确的信息是()A .甲同学的成绩的平均数大于乙同学的成绩的平均数B .甲同学的成绩的方差大于乙同学的成绩的方差C .甲同学的成绩的极差小于乙同学的成绩的极差D.甲同学的成绩的中位数小于乙同学的成绩的中位数5.下面是追踪调查200个某种电子元件寿命(单位:h)频率分布直方图,如图:其中300-400、400-500两组数据丢失,下面四个说法中有且只有一个与原数据相符,这个说法是①寿命在300-400的频数是90;②寿命在400-500的矩形的面积是0.2;③用频率分布直方图估计电子元件的平均寿命为:⨯+⨯+⨯+⨯+⨯1500.12500.153500.454500.155500.15④寿命超过400h的频率为0.3A.①B.②C.③D.④6.为了解某电子产品的使用寿命,从中随机抽取了100件产品进行测试,得到图示统计图.依据统计图,估计这100件产品使用寿命的中位数为()A.218.25B.232.5C.231.25D.241.25 7.为了让学生了解社会,拓宽视野,丰富知识,提高社会实践能力和综合素质,哈三中团委组织学生参加了抽测一批棉花的纤维长度(单位:cm)的社会实践活动.利用所学习的数学知识,同学们作出了样本的频率分布直方图.现在,由于原始数据不全,只能通过直方图来估计这一批棉花的纤维长度的平均值(同一组数据用这组数据所在区间的中点的值代替).则估计的平均值为()A.21.75B.22.25C.23.75D.20.75 8.为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是()A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有32人9.某地气象局把当地某月(共30天)每一天的最低气温作了统计,并绘制了如下图所示的统计图.记这组数据的众数为M,中位数为N,平均数为P,则()A .M N P <<B .N M P <<C .P M N <=D .P N M<<10.在某次高中学科竞赛中,4000名考生的参赛成绩按[)40,50,[)50,60,[)60,70,[)70,80,[)80,90,[)90,100分成六组,其频率分布直方图如图所示,则下列说法中错误的是().A .成绩在[)70,80内的考生人数最多B .不及格(60分以下)的考生人数约为1000人C .考生竞赛成绩平均分的估计值为70.5分D .考生竞赛成绩中位数的估计值为75分11.在2019年某省普通高中学业水平考试(合格考)中,对全省所有考生的物成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[)40,50,[)50,60,[)60,70,[)80,90,[]90,100,90分以上为优秀,则下列说法中不正确的是()A .从全体考生中随机抽取1000人,则其中得优秀考试约有100人B .若要全省的合格考通过率达到96%,则合格分数线约为44分C .若同一组中数据用该组区间中间值作代表值,可得考试物理成绩的平均分约为70D .该省考生物理成绩的中位数为75分第II 卷(非选择题)请点击修改第II 卷的文字说明二、填空题12.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.则估计高一参赛学生的成绩的众数、中位数分别为____________.13.某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:g )绘制的频率分布直方图,样本数据分为8组,分别为[)80,82,[)82,84,[)84,86,[)86,88,[)88,90,[)90,92,[)92,94,[]94,96,则样本的中位数在第______组14.某中学举行了一场音乐知识竞赛,将参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图.根据频率分布直方图,同一组数据用该区间的中点值代替,估计这次竞赛的平均成绩为______分.三、双空题15.根据高二某班50名同学的数学成绩,绘制频率分布直方图如图所示,虽不小心将其中一个数据污染了,但依然可以推断这个被污染的数据为_________,该班同学的成绩众数为_________.16.中小学生的视力状况受到社会的广泛关注,某市有关部门从全市6万名高一学生中随机抽取了400名,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示.从左至右五个小组的频率之比依次是5∶7∶12∶10∶6,则这400名学生视力的众数为________,中位数为________.四、解答题17.有一种鱼的身体吸收汞,一定量身体中汞的含量超过其体重的61.0010-⨯的鱼被人食用后,就会对人体产生危害.某海鲜市场进口了一批这种鱼,质监部门对这种鱼进行抽样检测,在30条鱼的样本中发现的汞含量(乘以百万分之一)如下:0.070.340.950.98 1.020.98 1.37 1.400.39 1.021.44 1.580.54 1.080.710.70 1.20 1.24 1.62 1.681.85 1.300.810.820.84 1.39 1.262.200.91 1.31(1)完成下面频率分布表,并画出频率分布直方图;频率分布表:分组频数频率[)0,0.50[) 0.50,1.001 3[) 1.00,1.50[) 1.50,2.002 15[)2.00,2.5011 30合计301频率分布直方图:(2)根据频率分布直方图估算样本数据的平均值(保留小数点后两位,同一组中的数据用该组区间中点值代表),并根据频率分布直方图描述这批鱼身体中汞含量的分布规律.18.经历过疫情,人们愈发懂得了健康的重要性,越来越多的人们加入了体育锻炼中,全民健身,利国利民,功在当代,利在千秋.一调研员在社区进行住户每周锻炼时间的调查,随机抽取了300人,并对这300人每周锻炼的时间(单位:小时)进行分组,绘制成了如图所示的频率分布直方图:(1)补全频率分布直方图,并估算该社区住户每周锻炼时间的中位数(精确到0.1);(2)若每周锻炼时间超过6小时就称为运动卫士,超过8小时就称为运动达人.现利用分层抽样的方法从运动卫士中抽取5人,再从这5人中抽取2人做进一步调查,求抽到的2人中恰有1人为运动达人的概率.19.经历过疫情,人们愈发懂得了健康的重要性,越来越多的人们加入了体育锻炼中,全民健身,利国利民,功在当代,利在千秋.一调研员在社区进行住户每周锻炼时间的调查,随机抽取了300人,并对这300人每周锻炼的时间(单位:小时)进行分组,绘制成了如图所示的频率分布直方图:(1)补全频率分布直方图,并估算该社区住户每周锻炼时间的中位数(精确到0.1);(2)若每周锻炼时间超过6小时就称为运动卫士,超过8小时就称为运动达人.现利用分层抽样的方法从运动卫士中抽取10人,再从这10人中抽取3人做进一步调查,设抽到的人中运动达人的人数为X ,求随机变量X 的分布列及期望.20.某贫困地区经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入、实现2020年脱贫的工作计划,该地扶贫办统计了2019年50位农民的年收入并制成如图频率分布直方图:(1)根据频率分布直方图,估计这50位农民的平均年收入x (单位:千元,同一组数据用该组数据区间的中点值表示);(2)为推进精准扶贫,某企业开设电商平台,让越来越多的农村偏远地区的农户通过经营网络商城脱贫致富.甲计划在A 店,乙计划在B 店同时参加一个订单“秒杀”抢购活动,其中每个订单由()*2,n n n N ≥∈个商品W 构成,假定甲、乙两人在A 、B 两店订单“秒杀”成功的概率分别为p 、q ,记甲、乙两人抢购成功的订单总数量、商品W 总数量分别为X 、Y .①求X 的分布列及数学期望()E X ;②若27sin4n p n n ππ=-,sin4n q nπ=,求当Y 的数学期望()E Y 取最大值时正整数n 的值.21.某地处偏远山区的古镇约有人口5000人,为了响应国家号召,镇政府多项并举,鼓励青壮劳力外出务工的同时发展以旅游业为龙头的乡村特色经济,到2020年底一举脱贫.据不完全统计该镇约有20%的人外出务工,下图是根据2020年扶贫工作期间随机调查本地100名在外务工人员的年收入(单位:千元)数据绘制的频率分布直方图.(1)根据样本数据估计该镇外出务工人员的创收总额(同一组中的数据用该组区间的中点值为代表);(2)完成脱贫任务后,古镇党政班子并不懈怠,决心带领全镇人民在奔小康道路上再上一个新台阶,出台了多项优惠政策,鼓励本地在外人员返乡创业,调查显示年收入在35千元(含35千元)以上的人中有60%的人愿意返乡投资创业,年收入在35千元以下的人中有40%的人愿意返乡投资创业,请从样本数据中完成下面的22⨯列联表,并判断能否在犯错误的概率不超过0.1的前提下认为“是否愿意返乡投资创业和年收入有关”.35千元(含35千元)以上35千元以下愿意返乡投资创业不愿意返乡投资创业附:()()()()()22n ad bc X a b c d a c b d -=++++,()20P X k ≥0.100.050.0250.0100k 2.7063.8415.0246.63522.某市为大力推进生态文明建设,把生态文明建设融入市政建设,打造了大型植物园旅游景区.为了了解游客对景区的满意度,市旅游部门随机对景区的100名游客进行问卷调查(满分100分),这100名游客的评分分别落在区间[)50,60,[)60,70,[)70,80,[)80,90,[]90,100内,且游客之间的评分情况相互独立,得到统计结果如频率分布直方图所示.(1)求这100名游客评分的平均值(同一区间的数据用该区间数据的中点值为代表);(2)视频率为概率,规定评分不低于80分为满意,低于80分为不满意,记游客不满意的概率为p .(ⅰ)若从游客中随机抽取m 人,记这m 人对景区都不满意的概率为m a ,求数列{}m a 的前4项和;(ⅱ)为了提高游客的满意度,市旅游部门对景区设施进行了改进,游客人数明显增多,对游客进行了继续旅游的意愿调查,若不再去旅游记1分,继续去旅游记2分,每位游客有继续旅游意愿的概率均为p ,且这次调查得分恰为n 分的概率为n B ,求4B .23.2016年春节期间全国流行在微信群里发、抢红包,现假设某人将688元发成手气红包50个,产生的手气红包频数分布表如下:金额分组[)1,5[)5,9[)9,13[)13,17[)17,21[)21,25频数39171182(1)求产生的手气红包的金额不小于9元的频率;(2)估计手气红包金额的平均数(同一组中的数据用该组区间的中点值作代表);(3)在这50个红包组成的样本中,将频率视为概率.①若红包金额在区间[]21,25内为最佳运气手,求抢得红包的某人恰好是最佳运气手的概率;②随机抽取手气红包金额在[)[]1,521,25⋃内的两名幸运者,设其手气金额分别为m ,n ,求事件“16m n ->”的概率.24.绿色已成为当今世界主题,绿色动力已成为时代的驱动力,绿色能源是未来新能源行业的主导.某汽车公司顺应时代潮流,最新研发了一款新能源汽车,并在出厂前对100辆汽车进行了单次最大续航里程(理论上是指新能源汽车所装载的燃料或电池所能够提供给车行驶的最远里程)的测试.现对测试数据进行分析,得到如图所示的频率分布直方图.(1)估计这100辆汽车的单次最大续航里程的平均值x (同一组中的数据用该组区间的中点值代表);(2)根据大量的汽车测试数据,可以认为这款汽车的单次最大续航里程X 近似地服从正态分布()2,N μσ,经计算第(1)问中样本标准差s 的近似值为50.用样本平均数x作为μ的近似值,用样本标准差s 作为σ的估计值;(ⅰ)现从该汽车公司最新研发的新能源汽车中任取一辆汽车,求它的单次最大续航里程恰好在200千米到350千米之间的概率;(ⅱ)从该汽车公司最新研发的新能源汽车中随机抽取10辆,设这10辆汽车中单次最大续航里程恰好在200千米到350千米之间的数量为Y ,求()E Y ;(3)某汽车销售公司为推广此款新能源汽车,现面向意向客户推出“玩游戏,送大奖”活动,客户可根据抛掷硬币的结果,操控微型遥控车在方格图上行进,若遥控车最终停在“胜利大本营”,则可获得购车优惠券.已知硬币出现正、反面的概率都是12,方格图上标有第0格、第1格、第2格、…、第50格.遥控车开始在第0格,客户每掷一次硬币,遥控车向前移动一次,若掷出正面,遥控车向前移动一格(从k 到1k +),若掷出反面,遥控车向前移动两格(从k 到2k +),直到遥控车移到第49格(胜利大本营)或第50格(失败大本营)时,游戏结束.设遥控车移到第n 格的概率为(1,2,,50)n P n = ,其中01P =,试说明{}1n n P P --是等比数列,并解释此方案能否成功吸引顾客购买该款新能源汽车.参考数据:若随机变量ξ服从正态分布()2,N μσ,则()0.6827P μσξμσ-<+≈ ,(22)0.9545P μσξμσ-<+≈ ,(33)0.9973P μσξμσ-<+≈ .25.某地处偏远山区的古镇约有人口5000人,为了响应国家号召,镇政府多项并举,鼓励青壮劳力外出务工的同时发展以旅游业为龙头的乡村特色经济,到2020年底一举脱贫.据不完全统计该镇约有20%的人外出务工.下图是根据2020年扶贫工作期间随机调查本地100名在外务工人员的年收入(单位:千元)数据绘制的频率分布直方图.(1)根据样本数据怙计该镇外出务工人员的创收总额(同一组中的数据用该组区间的中点值为代表);(2)假设该镇外出务工人员年收入服从正态分布()2,N μσ,其分布密度函数为22()2()x f x μσ--=,其中μ为样本平均值.若()f x 的最大值为10π,求σ的值;(3)完成脱贫任务后,古镇党政班子并不懈怠,决心带领全镇人民在奔小康道路上再上一个新台阶,出台了多项优惠政策,鼓励本地在外人员返乡创业.调查显示务工收入在[],2μσμσ++和[]2,3μσμσ++的人群愿意返乡创业的人数比例分别为15%和20%.从样本人群收入在[],3μσμσ++的人中随机抽取3人进行调查,设X 为愿意返乡创业的人数,求随机变量X 的分布列和数学期望.参考答案1.C 【分析】对于A :由频率分布直方图中所有小矩形面积之和为1,列出等式可求得a 的值,进而作出判断;对于B :先计算高于130分的频率,然后再用1减去于高于130分的频率即可得到低于130分的频率,进而作出判断;对于C :先计算[)80,120的频率和[)120130,的频率,再求出总体的中位数,进而作出判断;对于D :根据样本分布在[)90,100的频数一定与样本分布在[)100,110的频数相等,总体分布在[)90,100的频数不一定与总体分布在[)100,110的频数相等作出判断即可.【详解】由频率分布直方图得:()0.0050.0100.0100.0150.0250.005101a ++++++⨯=,解得0.030a =,故A 错误;样本数据低于130分的频率为:()10.0250.005100.7-⨯+=,故B 错误;[)80,120的频率为:()0.0050.0100.0100.015100.4+++⨯=,[)120130,的频率为:0.030100.3⨯=,∴总体的中位数(保留1位小数)估计为:0.50.412010123.30.3-+⨯≈分,故C 正确;样本分布在[)90,100的频数一定与样本分布在[)100,110的频数相等,总体分布在[)90,100的频数不一定与总体分布在[)100,110的频数相等,故D 错误.故选:C .【点睛】本题考查频率分布直方图的应用,考查逻辑思维能力和计算能力,属于基础题.2.B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解.由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =,所以学习时长在[)9,11的频率2520.5x n==,解得50n =.故选:B .【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.3.A 【分析】根据频率分布折线图计算该组数据的平均数为650.15750.4850.2950.25⨯+⨯+⨯+⨯.【详解】由折线图可知,该组数据的平均数为650.15750.4850.2950.2580.5⨯+⨯+⨯+⨯=.故选:A.【点睛】此题考查根据频率分布折线图求平均数,关键在于熟练掌握平均数的求解公式.4.D 【分析】根据频数分布表中的数据,对选项中的命题进行分析,判断正误,即可得到本题答案.【详解】甲同学的成绩的平均数1051201201301401235x ++++<=,乙同学的成绩的平均数1051151251351451255y ++++>=,所以A 错误;甲同学的成绩从第1次到第5次变化波动比乙同学的成绩的变化波动更小一些,所以甲同学的成绩的方差小于乙同学的成绩的方差,所以B 错误;甲同学的成绩的极差介于()30,40之间,乙同学的成绩的极差介于()35,45之间,所以甲同学的成绩的极差不一定小于乙同学的成绩的极差,所以C 错误;甲同学的成绩的中位数介于()115,120之间,乙同学的成绩的中位数介于()125,130之间,所以D 正确.故选:D本题主要考查频数直方图的相关问题,其中涉及中位数、平均数、方差、极差的求解. 5.B【详解】若①正确,则300400-对应的频率为0.45,则400500-对应的频率为0.15,则②错误;电子元件的平均寿命为1500.12500.153500.454500.155500.15⨯+⨯+⨯+⨯+⨯,则③正确;寿命超过400h的频率为0.150.150.3+=,则④正确,故不符合题意;若②正确,则300400-对应的频率为0.4,则①错误;电子元件的平均寿命为1500.12500.153500.44500.25500.15⨯+⨯+⨯+⨯+⨯,则③错误;寿命超过400h的频率为0.20.150.35+=,则④错误,故符合题意.故选:B.6.C【分析】设中位数为x,根据中位数左边的频数为50列等式可求得x的值.【详解】设中位数为x,前2组的频数之和为25,前3组的频数之和为65,由题意可得20025405050x-+⨯=,解得231.25x=.故选:C.7.A【分析】利用频率分布直方图计算平均数的方法求解即可.【详解】所给数据频率之和为(0.010.070.080.020.02)51++++⨯=则估计的平均值为5(12.50.0117.50.0722.50.0827.50.0232.50.02) 4.35521.75⨯+⨯+⨯+⨯+⨯=⨯=故选:A8.D 【分析】根据样本估计总体的知识依次判断各个选项即可得到结果.【详解】对于A ,设中位数为x ,则()()0.020.065250.080.5x +⨯+-⨯=,解得:26.25x =,即该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次,A 正确;对于B ,根据频率分布直方图知众数为:253027.52+=次,B 正确;对于C ,该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有16000.045320⨯⨯=人,C 正确;对于D ,该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有16000.025160⨯⨯=人,D 错误.故选:D.9.A 【分析】由统计图分别求出该月温度的中位数,众数,平均数,由此能求出结果.【详解】解:由统计图得:该月温度的中位数为565.52N +==,众数为5M =,平均数为1(233410566372829210) 5.9730P =⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯≈.∴M N P <<.故选:A .10.D 【分析】A .根据频率分布直方图中哪一组数据的频率除以组距的值最大进行分析;B .先分析60分以下对应的频率,再利用总体数量乘以所求频率即可得到结果;C .利用每组数据的组中值乘以对应频率并将每组计算结果相加即可得到结果;D .分析频率为0.5时对应的横坐标的值即为中位数.【详解】A .根据统计图可知:[)70,80对应的频率除以组距的值最大,即频率最大,所以人数最多,故正确;B .不及格的频率为:()0.0100.015100.25+⨯=,所以不及格的人数约为40000.25=1000⨯人,故正确;C .根据频率分布直方图可知平均数为:()450.01550.015650.02750.03850.015950.011070.5⨯+⨯+⨯+⨯+⨯+⨯⨯=,故正确;D .前三组的频率之和为:()0.01+0.0150.02100.450.5+⨯=<,前四组的频率之和为:()0.01+0.0150.020.03100.750.5++⨯=>,所以中位数在第四组数据中,且中位数为:0.50.45701071.70.0310-+⨯≈⨯,故错误;故选:D.11.D 【分析】利用频率分布直方图的性质直接求解.【详解】解:对于A ,90分以上为优秀,由频率分布直方图得优秀的频率为0.010100.1⨯=,∴从全体考生中随机抽取1000人,则其中得优秀考试生约有:10000.1100⨯=人,故A 正确;对于B ,由频率分布直方图得[40,50)的频率为0.01100.1⨯=,[50,100)的频率为:10.10.9-=,∴若要全省的合格考通过率达到96%,则合格分数线约为44分,故B 正确;对于C ,若同一组中数据用该组区间中间值作代表值,可得考试物理成绩的平均分约为:450.01010550.01510650.02010750.03010850.01510950.0101070.5⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=分,故C 正确;对于D ,[40,70)的频率为:(0.0100.0150.020)100.45++⨯=,[70,80)的频率为0.030100.3⨯=,∴该省考生物理成绩的中位数为:0.50.45701071.670.3-+⨯≈分,故D 错误.故选:D .【点睛】本题考查频数、合格分数线、平均数、中位数的求法,考查频率分布直方图的性质等基础知识,考查运算求解能力,属于基础题.12.65,65【分析】频率分布直方图中最高矩形的中点横坐标即为众数,利用平分矩形面积可得中位数.【详解】由题图可知众数为65,又∵第一个小矩形的面积为0.3,∴设中位数为60+x ,则0.3+x ×0.04=0.5,得x =5,∴中位数为60+5=65.故答案为:65,6513.四【分析】计算前几组的频率之和,判断频率为0.5在哪个区间即可判断中位数.【详解】根据频率分布直方图可知,前三组的频率之和为()0.03750.06250.07520.350.5++⨯=<,前四组的频率之和为()0.03750.06250.0750.120.550.5+++⨯=>,则可以判断中位数在第四组.故答案为:四.【点睛】本题考查根据频率分布直方图判断中位数所在区间,属于基础题.14.67.【分析】本题根据频率分布直方图直接求平均数即可.【详解】解:这次竞赛的平均成绩为:0.03055100.04065100.01575100.01085100.005951067⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=故答案为:67.【点睛】本题考查根据频率分布直方图求平均数,是基础题.15.0.016130【分析】利用频率分布直方图中所有矩形的面积之和为1可求得污染的数据;利用最高矩形底边的中点值可求得众数.【详解】设被污染的数据为a ,利用频率分布直方图中所有矩形的面积之和为1可得0.004100.02100.028100.03210101a ⨯+⨯+⨯+⨯+⨯=,解得0.016a =.由图可知,该班同学的成绩众数为130.故答案为:0.016,13016.4.7 4.75【分析】根据频率分布直方图,取最高矩形底边中点的横坐标即可求出众数,求出第三小组矩形的高,设中位数为x ,由()0.1250.175 4.5510.5x ++-⨯=,解方程即可求解.【详解】由图可知,众数为4.7,第五小组的频率为0.50.30.15⨯=从左至右五个小组的频率之比依次是5∶7∶12∶10∶6,可得第一小组的频率为50.150.1256⨯=,第二小组的频率为70.150.1250.1756⨯==,第三小组的频率为120.150.36⨯=,所以中位在第三小组,第三小组矩形面积为0.3,则第三小组的高为0.310.3=设中位数为x ,则()0.1250.175 4.5510.5x ++-⨯=,解得 4.75x =故答案为:4.7;4.75【点睛】本题考查了根据频率分布直方图求众数、中位数,考查了运算求解能力,属于基础题. 17.(1)填表见解析;作图见解析;(2)平均值为:1.08,答案见解析.【分析】(1)由样本数据,即可完善频率分布表中的数据,并画出频率直方图.(2)由(1)的频率直方图计算样本均值,进而描述汞含量分布规律.【详解】(1)由题设样本数据,则可得频率分布表如下,分组频数频率[)0,0.5031 10[)0.50,1.00101 3[)1.00,1.50122 5[)1.50,2.0042 15[)2.00,2.5011 30合计301(2)根据频率分布直方图估算平均值为:112210.250.75 1.25 1.75 2.25 1.0810351530⨯+⨯+⨯+⨯+⨯≈,分布规律:①该频率分布直方图呈中间高,两边低,大多数鱼身体中汞含量主要集中在区间[]0.5,1.5;②汞含量在区间[]1,1.5的鱼最多,汞含量在区间[]0.5,1的次之,在区间[]2,2.5的最少;③汞含量超过61.0010-⨯的数据所占比例较大,这说明这批鱼被人食用,对人体产生危害的可能性比较大.18.(1)作图见解析;中位数为4.3;(2)35.【分析】(1)设中位数为x ,则有()40.150.05x -⨯=,故可求中位数.(2)利用古典概型的概率公式可求概率.【详解】解:(1)第二组的频率为()120.150.0750.050.10.25-⨯+++=,故第二组小矩形的高为0.125频率分布直方图如图所示,由频率分布直方图可得,第一组和第二组的频率之和为0.20.250.450.5+=<,前三组的频率之和为0.20.250.30.750.5++=>,可知中位数在第三组,设中位数为x ,则有()40.150.50.450.05x -⨯=-=,解得134.33x =≈,所以该社区住户每周锻炼时间的中位数为4.3;。
第63讲 根据频率分布直方图求中位数众数和平均数-高中数学常见题型解法归纳反馈训练

【知识要点】一、用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计总体的数字特征),需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本容量越大,估计的结果也就越精确,分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.二、频率分布是指一个样本数据在各个小范围内所占比例的大小.一般是用频率分布直方图反映样本频率分布.三、样本的数字特征众数:就是数据中出现次数最多的那个,比其他的都多,如果几个数据出现的次数都是最多,则它们都是众数;每个数据都只有一次,那么数据没有众数.所以众数可以不止一个或者没有.中位数:就是这些数据排列好了以后中间的那个数字,那么如果有偶数个数据,那么就是中间两个数字的平均数,如果有奇数个数据,则中间那个就是数据的中位数.所以数据的中位数不一定在数据中.平均数:这个就是把所有数据相加,除以个数,就是数据的平均数. nx n++(n x x ++-(n x x ++-四、茎叶图茎叶图又称“枝叶图”,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少.当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出的叶子,因此通常把这样的图叫做茎叶图.【方法讲评】【例1】对某小区100户居民的月均用水量进行统计,得到样本的频率分布直方图如图,则估计此样本的众数、中位数分别为()A. 2.25,2.5 B.2.25,2.02 C.2,2.5 D.2.5,2.25【点评】(1)求频率分布图中的众数,一般先计算出频率分布直方图中的每个小矩形的面积,找到面积最大的那个矩形,取该矩形的横边中点对应的数为众数.(2)求众数也可以直接找最高矩形的横边的中点.【反馈检测1】某学校900名学生在一次百米测试中,成绩全部介于13秒与18秒之间,抽取其中50个样本,将测试结果按如下方式分成五组:第一组[13,14],第二组[14,15),…,第五组[17,18],如图是按上述分组方法得到的频率分布直方图.(1)若成绩小于14秒认为优秀,求该样本在这次百米测试中成绩优秀的人数;(2)请估计学校900名学生中,成绩属于第四组的人数;(3)请根据频率分布直方图,求样本数据的众数和中位数.【例2】高二某班50名学生在一次百米测试中,成绩全部都介于13秒到18秒之间,将测试结果按如下方式分成五组,第一组[13,14),第二组[14,15)…第五组[17,18],如图是按上述分组方法得到的频率分布直方图.(1)若成绩大于等于14秒且小于16秒规定为良好,求该班在这次百米测试中成绩为良好的人数. (2)请根据频率分布直方图,估计样本数据的众数和中位数(精确到0.01).(3)设n m ,表示该班两个学生的百米测试成绩,已知[)[]18,1714,13, ∈n m ,.6个基本事件组成.【点评】求频率分布直方图中的中位数,一般先计算出每个小矩形的面积,通过解方程找到左边面积为0.5的点P ,点P 对应的数就是中位数.【反馈检测2】某公路段在某一时刻内监测到的车速频率分布直方图如图所示. (Ⅰ)求纵坐标中参数h 的值及第三个小长方形的面积; (Ⅱ)求车速的众数1v ,中位数2v 的估计值;1122n n xx p x p x p 计算.的中点对应的数,n p 代表第n 个矩形的面积【例3】某校从参加考试的学生中抽出60名学生,将其成绩(均为整数)分成六组[40,50),[50,60)...[90,100]后画出如下部分频率分布直方图.观察图形的信息,回答下列问题: (Ⅰ)求成绩落在[70,80)上的频率,并补全这个频率分布直方图; (Ⅱ) 估计这次考试的及格率(60分及以上为及格)和平均分;(Ⅲ) 从成绩是70分以上(包括70分)的学生中选两人,求他们在同一分数段的概率.【解析】(Ⅰ)成绩落在[70,80)上的频率是0.3,频率分布直方图如下图.(Ⅲ) 成绩是70分以上(包括70分)的学生人数为(0.03+0.025+0.005)×10×60=36 所以所求的概率为【点评】求频率分布直方图中的平均数,1122n n x x p x p x p 计算.其中nx 代表第n 个矩形的横边的中点对应的数,n p 代表第n 个矩形的面积.【反馈检测3】某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100]. (1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[50,90)之外的人数.高中数学常见题型解法归纳及反馈检测第63讲: 根据频率分布直方图求中位数众数和平均数参考答案【反馈检测1答案】(1)3;(2)288;(3)15.5,15.74.【反馈检测2答案】(1)0.01h =,第三个小长方形的面积为65;(2)1265,62.5v v ==;(3【反馈检测2详细解析】(Ⅰ)∵所有小长形面积之和为1,∴10h +10×3h +10×4h +10×2h =1, 解得h =0.01, ∴第三个小长方形的面积为:10×4h =10×0.04=0.4. (Ⅱ)车速的众数1v =,车速的中位数是两边直方图的面积相等, 于是得:10×0.01+10×0.03+(2v ﹣60)×0.04=0.5,解得2v =62.5.×10×45+0.03×10×55+0.04×10×65+0.02×10×75=62. 【反馈检测3答案】(1)005.0=a ;(2)73;(3)10.【反馈检测3详细解析】(1)依题意得,()104.003.002.0210=+++a ,解得005.0=a(2)这100名学生语文成绩的平均分为:()分7305.0952.0853.0754.06505.055=⨯+⨯+⨯+⨯+⨯ (3)数学成绩在[50,60)的人数为:100×0.05=5数学成绩在[60,70[70,80数学成绩在[80,90所以数学成绩在[50,90)之外的人数为:102540205100=----。
高中数学复习概率统计题型归纳与讲解03 频率分布直方图

高中数学复习概率统计题型归纳与讲解专题3频率分布直方图例1.要调查某地区高中学生身体素质,从高中生中抽取100人进行跳高测试,根据测试成绩制作频率分布直方图如图,现从成绩在[120,140)之间的学生中用分层抽样的方法抽取5人,应从[120,130)间抽取人数为b,则()A.a=0.2,b=2B.a=0.025,b=3C.a=0.3,b=4D.a=0.030,b=3【解析】解:由题得10×(0.005+0.035+a+0.020+0.010)=1,所以a=0.030.在[120,130)之间的学生人数为:100×10×0.030=30人,在[130,140)之间的学生人数为:100×10×0.020=20人,在[120,140)之间的学生人数为:100×(10×0.030+0.020)=50人,又用分层抽样的方法在[120,140)之间的学生50人中抽取5人,即抽取比例为:110,所以成绩在[120,130)之间的学生中抽取的人数应,30×110=3,即b=3,故选:D.例2.从某企业生产的某种产品中随机抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值分组[70,80) [80,90) [90,100) [100,110) 110,120)频数 14 20 36 18 12估计这种产品质量指标值的平均数为(同一组中的数据用该组区间的中点值作代表)( )A .100B .98.8C .96.6D .94.4【解析】解:平均数x →=0.14×75+0.20×85+0.36×95+0.18×105+0.12×115=94.4.故选:D .例3.“新冠肺炎”席卷全球,我国医务工作者为了打好这次疫情阻击战,充分发挥优势,很快抑制了病毒,据统计老年患者治愈率为71%,中年患者治愈率为85%,青年患者治愈率为91%.如果某医院有30名老年患者,40名中年患者,50名青年患者,则估计该医院的平均治愈率是( )A .86%B .83%C .90%D .84%【解析】解:利用求加权平均数的公式解得:30×71%+40×85%+50×91%30+40+50=0.84=84%,故选:D .例4.已知样本数据x 1,x 2,…,x n (n ∈N *)的平均数与方差分别是a 和b ,若y i =﹣2x i +3(i =1,2,…n ),且样本数据y 1,y 2,…,y n 的平均数与方差分别是b 和a ,则a ﹣b =( )A .1B .2C .3D .4【解析】解:由题意得:{−2a +3=b a =4b ,解得:{a =43b =13,故a ﹣b =1, 故选:A .例5.下面定义一个同学数学成绩优秀的标志为:“连续5次考试成绩均不低于120分”.现有甲、乙、丙三位同学连续5次数学考试成绩的记录数据(记录数据都是正整数):①甲同学:5个数据的中位数为127,众数为120;②乙同学:5个数据的中位数为125,总体均值为127;③丙同学:5个数据的中位数为135,总体均值为128,总体方差为19.8.则可以判定数学成绩优秀同学为( )A .甲、乙B .乙、丙C .甲、丙D .甲、乙、丙【解析】解:在①中,甲同学:5个数据的中位数为127,众数为120,所以前三个数为120,120,127,则后两个数肯定大于127,故甲同学数学成绩优秀,故①成立;在②中,5个数据的中位数为125,总体均值为127,可以找到很多反例,如:118,119,125,128,145,故乙同学数学成绩不优秀,故②不成立;在③中,5个数据的中位数为135,总体均值为128,总体方差为19.8设x 1<x 2<x 3<x 4,则丙的方差为15[(x 1﹣128)2+(x 2﹣128)2+(x 3﹣128)2+(x 4﹣128)2+(135﹣128)2]=19.8, ∴(x 1﹣128)2+(x 2﹣128)2+(x 3﹣128)2+(x 4﹣128)2=50,∴(x 1﹣128)2≤50,得|x 1﹣128|≤5,∴x 1≥128﹣5>120,∴丙同学数学成绩优秀,故③成立.∴数学成绩优秀有甲和丙2个同学.故选:C .例6.若数据x 1,x 2,…,x n 的平均数x =3,方差s 2=1,则数据2x 1+3,2x 2+3,…,2x n +3的平均数和方差分别为( )A.6,6B.9,2C.9,6D.9,4【解析】解:由题意若数据x1,x2,…,x n的平均数x=3,方差s2=1,可得x1+x2+…+x n=3n,则:2x1+3+x2+3+…+x n+3=2(x1+x2+…+x n)+3n=9n,所以数据2x1+3,2x2+3,…,2x n+3的平均数为9.又S2=1n[(x1﹣3)2+(x2﹣3)2+…+(x n﹣3)2]=1,所以[(x1﹣3)2+(x2﹣3)2+…+(x n﹣3)2]=n,所以1n [(2x1+3﹣9)2+(2x2+3﹣9)2+…+(2x n+3﹣9)2]=4n[(x1﹣3)2+(x2﹣3)2+…+(x n﹣3)2]=4,则数据2x1+3,2x2+3,…,2x n+3的平均数和方差分别为9,4.故选:D.例7.随着城镇化的不断发展,老旧小区的改造及管理已经引起了某市政府的高度重视,为了了解本市甲,乙两个物业公司管理的小区住户对其服务的满意程度,现从他们所服务的小区中随机选择了40个住户,根据住户对其服务的满意度评分,得到A区住户满意度评分的频率分布直方图和B 区住户满意度评分的频率分布表.B区住户满意度评分的频率分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数4610128(Ⅰ)在图2中作出B区住户满意度评分的频率分布直方图,并通过频率分布直方图计算两区住户满意度评分的平均值及分散程度(其中分散程度不要求计算出具体值,给出结论即可);(Ⅱ)根据住户满意度评分,将住户和满意度分为三个等级:满意度评分低于70分,评定为不满意;满意度评分在70分到89分之间,评定为满意;满意度评分不低于90分,评定为非常满意.试估计哪个地区住户的满意度等级为不满意的概率大?若是要选择一个物业公司来管理老旧小区的物业,从满意度角度考虑,应该选择哪一个物业公司?说明理由.【解析】解:(Ⅰ)作出如图所示的频率分布直方图,B区住户满意度评分的频率分布直方图如图所示A区住户满意度评分的平均值为45×0.1+55×0.2+65×0.3+75×0.2+85×0.15+95×0.05=67.5;B区住户满意度评分的平均值为55×0.1+65×0.15+75×0.25+85×0.3+95×0.2=78.5.通过比较两区住户满意度评分的频率分布直方图可以看出,B区住户满意度评分比较集中,而A 区住户满意度评分比较分散.(Ⅱ)记D表示事件:“A区住户的满意度等级为不满意”,记E表示事件:“B区住户的满意度等级为不满意”,则P(D)=(0.010+0.020+0.030)×10=0.6,P(E)=(0.010十0.015)×10=0.25,所以A区住户的满意度等级为不满意的概率较大.若是要选择一个物业公司来管理老旧小区的物业,从满意度等级为满意来考虑,应该选择乙物业公司来为小区服务,这样的话小区住户满意度会高一些.例8.某校在一次期末数学测试中,为统计学生的考试情况,从学校的2000名学生中随机抽取50名学生的考试成绩,被测学生成绩全部介于65分到145分之间(满分150分),将统计结果按如下方式分成八组:第一组[65,75),第二组[75,85),……第八组[135,145],如图是按上述分组方法得到的频率分布直方图的一部分.(1)求第七组的频率,并完成频率分布直方图;(2)用样本数据估计该校的2000名学生这次考试成绩的平均分(同一组中的数据用该组区间的中点值代表该组数据平均值);(3)若从样本成绩属于第六组和第八组的所有学生中随机抽取2名,求他们的分差的绝对值小于10分的概率.【解析】解:(1)由频率分布直方图得第七组的频率为:1﹣(0.004+0.012+0.016+0.030+0.020+0.006+0.004)×10=0.08.完成频率分布直方图如下:(2)用样本数据估计该校的2000名学生这次考试成绩的平均分为:70×0.004×10+80×0.012×10+90×0.016×10+100×0.030×10+110×0.020×10+120×0.006×10+130×0.008×10+140×0.004×10=102.(3)样本成绩属于第六组的有0.006×10×50=3人,样本成绩属于第八组的有0.004×10×50=2人,从样本成绩属于第六组和第八组的所有学生中随机抽取2名,基本事件总数n=C52=10,他们的分差的绝对值小于10分包含的基本事件个数m=C32+C22=4,∴他们的分差的绝对值小于10分的概率p=mn=410=25.例9.我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准x,用水量不超过x的部分按平价收费,超出x的部分按议价收费.下面是居民月均用水量的抽样频率分布直方图.①求直方图中a的值;②试估计该市居民月均用水量的众数、平均数;③设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;④如果希望85%的居民月均用水量不超过标准x ,那么标准x 定为多少比较合理?【解析】解:①由概率统计相关知识,各组频率之和的值为1,∵频率=(频率/组距)*组距,∴0.5×(0.08+0.16+0.4+0.52+0.12+0.08+0.04+2a )=1,解得:a =0.3,∴a 的值为0.3;②由频率分布直方图估计该市居民月均用水量的众数为2+2.52=2.25(吨),估计该市居民月均用水量的平均数为:0.5(0.25×0.08+0.75×0.16+1.25×0.3+1.75×0.4+2.25×0.52+2.75×0.3+3.25×0.12+3.75×0.08+4.25×0.04)=2.035(吨).③由图,不低于3吨人数所占百分比为0.5×(0.12+0.08+0.04)=12%,∴全市月均用水量不低于3吨的人数为:30×12%=3.6(万);④由频率分布直方图得月均用水量低于2.5吨的频率为:0.5×(0.08+0.16+0.3+0.4+0.52)=0.73<85%,月均用水量低于3吨的频率为:0.5×(0.08+0.16+0.3+0.4+0.52+0.3)=0.88>85%,∴x=2.5+0.5×0.85−0.730.3×0.5=2.9(吨).例10.如图是某校高三(1)班的一次数学知识竞赛成绩的基叶图(图中仅列出[50,60),[90,100)的数据)和频率分布直方图.(1)求全班人数以及频率分布直方图中的x,y;(2)估计学生竞赛成绩的平均数和中位数(保留两位小数).【解析】解:(1)分数在[50,60)的频率为0.020×10=0.2,由茎叶图知,分数在[50,60)之间的频数为5,所以全班人数为50.2=25(人);分数在[90,100)之间的频数为2,由225=10y,解得y=0.008;又10x=1﹣10×(0.036+0.024+0.020+0.008),解得x=0.012.(2)由频率分布直方图,计算平均数为x=55×0.2+65×0.24+75×0.36+85×0.12+95×0.08=71.4,由0.2+0.24+0.36=0.80,所以中位数在[70,80)内,设中位数为m,则0.20+0.24+(m﹣70)×0.036=0.5,解得m≈71.67,所以中位数约为71.67.例11.某高中数学建模兴趣小组的同学为了研究所在地区男高中生的身高与体重的关系,从若干个高中男学生中抽取了1000个样本,得到如下数据.数据一:身高在[170,180)(单位:cm)的体重频数统计体重(kg)[50,55)[55,60)[60,65)[65,70)[70,75)[75,80)[80,85)[85,90)人数206010010080201010数据二:身高所在的区间含样本的个数及部分数据身高x(cm)[140,150)[150,160)[160﹣170)[170﹣180)[180﹣190)平均体重y(kg)4553.66075(Ⅰ)依据数据一将下面男高中生身高在[170﹣180)(单位:cm)体重的频率分布直方图补充完整,并利用频率分布直方图估计身高在[170﹣180)(单位:cm)的中学生的平均体重;(保留小数点后一位)(Ⅱ)依据数据一、二,计算身高(取值为区间中点)和体重的相关系数约为0.99,能否用线性回归直线来刻画中学生身高与体重的相关关系,请说明理由;若能,求出该回归直线方程;(Ⅲ)说明残差平方和或相关指数R2与线性回归模型拟合效果之间关系.(只需写出结论,不需要计算)参考公式:b=∑ni=1(x i−x)(y i−y)∑n i=1(x i−x)2=∑ni=1x i y i−nx⋅y∑n i=1x i2−nx2,a=y−b x.参考数据:(1)145×45+155×53.6+165×60+185×75=38608;(2)1452+1552+1652+1752+1852﹣5×1652=1000.(3)663×175=116025,664×175=116200,665×175=116375.(4)728×165=120120.【解析】解:(1)身高在[170,180)的总人数为:20+60+100+100+80+20+10+10=400,体重在[55﹣60)的频率为:60400=0.15,体重在[70﹣75)的频率为:80400=0.2,平均体重为:52.5×0.05+57.5×0.15+62.5×0.25+67.5×0.25+72.5×0.2+77.5×0.05+82.5×0.025+87.5×0.025≈66.4,(2)因为r=0.99→1,线性相关很强,故可以用线性回归直线来刻画中学生身高与体重的相关,x=145+155+165+175+1855=165,y=45+75+60+53.6+66.45=60,b=∑8i=1x i y i−8x⋅y∑8i=1x i2−8x2=38608+175×66.4−5×165×601000=0.728,a=y−b x=60−0.728×165=−60.12,所以回归直线方程为:y=0.728x−60.12,(3)残差平方和越小或相关指数R2越接近于1,线性回归模型拟合效果越好.例12.市政府为了节约用水,调查了100位居民某年的月均用水量(单位:t),频数分布如下:分组[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]频数4815222514642(1)根据所给数据将频率分布直方图补充完整(不必说明理由);(2)根据频率分布直方图估计本市居民月均用水量的中位数;(3)根据频率分布直方图估计本市居民月均用水量的平均数(同一组数据由该组区间的中点值作为代表).【解析】解:(1)频率分布直方图如图所示:(2)∵0.04+0.08+0.15+0.22=0.49<0.5,∴中位数为2+0.5−0.490.25×0.5=2.02,(3)由频率分布直方图得平均数为:0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.02=2.02.例13.某地区100居民的人均用水量(单位:t)的分组的频数如下:[0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22;[2,2.5),25;[2.5,3),14;[3,3.5),6;[3.5,4),4;[4,4.5),2.(1)列出样本的频率分布表;(2)画出频率分布直方图,并根据直方图估计这组数据的众数;(坐标轴单位自定)(3)当地政府制订了人均月用水量为3t的标准,若超出标准加倍收费,当地政府解释说,85%以上的居民不超出这个标准,这个解释对吗?为什么?【解析】解:(1 )分组频数频率[0,0.5 )40.04[0.5,1 )80.08[1,1.5 )150.15[1.5,2 )220.22[2,2.5 )250.25[2.5,3 )140.14[3,3.5 )60.06[3.5,4 )40.04[4,4.5 )20.02(2):频率分布直方图如下图,由图知,这组数据的众数为2.25.(3)人均月用水量在3t以上的居民的比例为6%+4%+2%=12%,即大约是有12%的居民月均用水量在3t以上,88%的居民月均用水量在3t以下,因此,政府的解释是正确的.例14.某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60)…[90,100]后画出如下频率分布直方图.观察图形的信息,回答下列问题:(Ⅰ)估计这次考试的众数m与中位数n(结果保留一位小数);(Ⅱ)估计这次考试的及格率(60分及以上为及格)和平均分.【解析】解:(Ⅰ)众数是最高小矩形中点的横坐标,所以众数为m=75(分);(3分)前三个小矩形面积为0.01×10+0.015×10+0.015×10=0.4,∵中位数要平分直方图的面积,∴n=70+0.5−0.40.03=73.3(7分)(Ⅱ)依题意,60及以上的分数所在的第三、四、五、六组,频率和为(0.015+0.03+0.025+0.005)*10=0.75所以,抽样学生成绩的合格率是75% (11分)利用组中值估算抽样学生的平均分45•f1+55•f2+65•f3+75•f4+85•f5+95•f6=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71估计这次考试的平均分是71分.(14分)例15.为应对新冠疫情,重庆市于2020年1月24日启动重大突发公共卫生事件一级响应机制,要求市民少出门,少聚集,于是快递业务得到迅猛发展.为满足广大市民的日常生活所需,某快递公司以优厚的条件招聘派送员,现给出了两种日薪薪酬方案,甲方案:底薪100元,每派送一单奖励1元;乙方案:底薪150元,每日前55单没有奖励,超过55单的部分每单奖励10元.(Ⅰ)请分别求出这两种薪酬方案中日薪y(单位:元)与送货单数n的函数关系式;(Ⅱ)根据该公司所有派送员10天的派送记录,发现派送员的日平均派送单数与天数满足以下表格:日均派送单数5054565860频数(天)23221回答下列问题:①根据以上数据,设每名派送员的日薪为X(单位:元),试分别求出这10天中甲、乙两种方案的日薪X的平均数及方差;②结合①中的数据,根据统计学的思想,若你去应聘派送员,选择哪种薪酬方案比较合适,并说明你的理由.(参考数据:172=289,372=1369)【解析】解:(1)甲方案,y =100+n ;乙方案,y ={150,n ≤5510n −400,n >55.(2),①甲方案中,根据已知表格可计算出日平均派送单数为2×50+3×54+2×56+2×58+6010=55,方差为0.2×(50﹣55)2+0.3×(54﹣55)2+0.2×(56﹣55)2+0.2×(58﹣55)2+0.1×(60﹣55)2=9.8,所以,由(1)中变量之间的关系,可以指,甲方案的日薪X 的平均数为155,方差为9.8. 乙方案中,日薪X 的平均数为[5×150+160×2+180×2+200]×0.1=163,日薪方差为0.5×(150﹣163)2+0.2×(160﹣163)2+0.2×(180﹣163)2+0.1×(200﹣163)2=213.4.(3)若去应聘派送员,我会选择乙方案,从平均数的角度来看,乙方案的平均薪酬更高,同时更有激励作用.例16.2019年起,全国地级及以上城市全面启动生活垃圾分类工作,垃圾分类投放逐步成为居民的新时尚.为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收垃圾、有害垃圾和其他垃圾四类,并分别设置了相应的垃圾箱.为调查居民生活垃圾分类投放情况,现随机抽取了某市三类垃圾箱中总计1000吨生活垃圾,数据统计如下(单位:吨):“厨余垃圾”箱 “可回收垃圾”箱 “有害垃圾”箱“其他垃圾”箱厨余垃圾 300 70 30 80 可回收垃圾 30 210 30 30 有害垃圾 20 20 60 20 其他垃圾10201060(1)分别估计厨余垃圾和有害垃圾投放正确的概率;(2)假设厨余垃圾在“厨余垃圾”箱、“可回收垃圾”箱、“有害垃圾”箱、“其他垃圾”箱的投放量分别为a,b,c,d,其中a>0,a+b+c+d=800.当数据a,b,c,d的方差s2最大时,写出a,b,c,d的值(结论不要求证明),并求此时s2的值.【解析】解:(1)根据题意,厨余垃圾共300+70+30+80=480吨,其中投放正确的有300吨,则厨余垃圾投放正确的概率P1=300480=58,有害垃圾共20+20+60+20=120吨,其中投放正确的有60吨,则害垃圾投放正确的概率P2=60120=12;(2)根据题意,厨余垃圾在四种垃圾箱的投放量分别为a,b,c,d,其中a>0,a+b+c+d=800,则其平均数x=8004=200,则其方差S2=14[(a﹣200)2+(b﹣200)2+(c﹣200)2+(d﹣200)2],当a=600,b=c=d=0时,s2最大,而x=a+b+c+d4=200,此时s2=14[(600﹣200)2+(0﹣200)2+(0﹣200)2+(0﹣200)2]=120000例17.某市教育局为了解全市高中学生在素质教育过程中的幸福指数变化情况,对8名学生在高一,高二不同学习阶段的幸福指数进行了一次跟踪调研.结果如表:学生编号12345678高一阶段幸福指数9593969497989695学生编号12345678高二阶段幸福指数9497959695949396(1)根据统计表中的数据情况,分别计算出两组数据的平均值及方差;(2)请根据上述结果,就平均值和方差的角度分析,说明在高一,高二不同阶段的学生幸福指数状况,并发表自己观点.【解析】解:(1)8名学生在高一阶段的幸福指数的平均数为:x=18(95+93+96+94+97+98+96+95)=95.5,方差为:S12=18∑8i=1(x i−x1)2=2.25,8名学生在高二阶段的幸福指数的平均数为:y=18(94+97+95+96+95+94+93+96)=95,方差为:S22=18∑8i=1(y i−y)2=1.5;(2)①∵x>y,∴可以认为这8名学生在高一的平均幸福指数大于在高二的平均幸福指数,②∵S12>S22,∴可以认为这8名学生在高二的幸福指数的稳定性大于在高一的幸福指数的稳定性.例18.2020年1月,教育部《关于在部分高校开展基础学科招生改革试点工作的意见》印发,自2020年起,在部分高校开展基础学科招生改革试点(也称“强基计划”).强基计划聚焦高端芯片与软件、智能科技、新材料、先进制造和国家安全等关键领域以及国家人才紧缺的人文社会科学领域,选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生.新材料产业是重要的战略性新兴产业,如图是我国2011﹣2019年中国新材料产业市场规模及增长趋势图.其中柱状图表示新材料产业市场规模(单位:万亿元),折线图表示新材料产业市场规模年增长率(%).(1)求从2012年至2019年,每年新材料产业市场规模年增长量的平均数(精确到0.1);(2)从2015年至2019年中随机挑选两年,求两年中至少有一﹣年新材料产业市场规模年增长率超过20%的概率;(3)由图判断,从哪年开始连续三年的新材料产业市场规模的方差最大.(结论不要求证明)【解析】解:(1)从2012年起,每年新材料产业市场规模的年增加值依次为:0.3,0.2,0.3,0.5,0.6,0.4,0.8,0.6,(单位:万亿元),∴年增加的平均数为:0.3+0.2+0.3+0.5+0.6+0.4+0.8+0.68=0.5万亿元.(2)设A表示事件“从2015年至2019年中随机挑选两个,两年中至少有一年新材料产业市场规模增长率超过20%”,依题意P(A)=1−C22C52=910.(3)从2017年开始连续三年的新材料产业市场规模的方差最大.。
频数直方图 知识讲解

频数直方图——知识讲解责编:康红梅【学习目标】1. 理解组距、频数、频率、频数统计表的概念;2. 会制作频数统计表,理解频数统计表的意义和作用;3. 体会样本和总体的关系,会用样本的频数分布估计总体的频数分布;4. 掌握画频数直方图的一般步骤,会画频数直方图,理解频数分布直方图的意义和作用. 【要点梳理】要点一、组距、频数、频率与频数统计表1.组距:将数据按从小到大适当地分组,并绘制成统计表,其中每一组的后一个边界值与前一个边界值的差叫做组距.2. 频数:数据分组后落在各小组内的数据个数称为频数.3. 频率:每一组数据频数与数据总数的比叫做这一组数据的频率.4.频数统计表:把各个组别中相应的频数分布用表格的形式表示出来,这种反映数据分布情况的统计表叫做频数统计表,也称频数表.列频数统计表的一般步骤如下:1.选取组距,确定组数.组数通常取大于最大值-最小值组距的最小整数. 当数据在100个以内时,通常可按照数据的多少分成5~12组.2.确定各组的边界值.第一组的起始边界值通常取得比最小数据要小一些.为了使数据不落在边界上,边界值可以比实际数据多取一位小数.取定起始边界值后,就可以根据组距写出各组的边界值.3.列表,填写组别和统计各组频数.要点诠释:(1)各组频数总和等于样本容量,各组数据的频率之和等于1;(2)频数统计表能清楚地反映一组数据的大小分布情况.将一批数据分组,一般数据越多,分的组也越多.要点二、频数直方图1.频数直方图由若干个宽等于组距,面积表示每一组频数的长方形组成的统计图,叫做频数直方图.简称直方图.它直观地呈现了频数的分布特征和变化规律.2.频数直方图的画法(1)列出频数表;(2)画具有相同原点,横、纵两条互相垂直的数轴,分别表示各组别和相应的频数.然后分别以横轴上每一组的两边界点为端点的线段为底边,作高为相应频数的长方形,就得到所求的频数直方图.3. 频数直方图与条形图的联系与区别(1)联系:它们都是用矩形来表示数据分布情况的;当矩形的宽度相等时,都是用矩形的高来表示数据分布情况的;频数直方图是特殊的条形统计图.(2)区别:①由于分组数据具有连续性,频数直方图中各“条形”之间通常是连续排列,中间没有间隙,而条形图中各“条形”是分开排列的,中间有一定的间隙;②条形统计图用横向指标表示考察对象的类别,用纵向指标表示不同对象的数量. 频数直方图横向指标表示考察对象数据的变化范围,用纵向指标表示相应范围内数据的频数.要点诠释:(1)频数直方图是条形统计图的一种;(2)注意直方图与条形图、扇形图、折线图在表示数据方面的优缺点.【典型例题】类型一、组距、组数、频数、频率1. (1)对某班50名学生的数学成绩进行统计,90~99分的人数有10名,这一分数段的频数为_________.(2)有60个数据,其中最小值为140,最大值为186,若取组距为5,则应该分的组数是________.【答案】(1)10; (2)10.【解析】解:(1)利用频数的定义进行解答;(2)利用组数的计算方法求解.【总结升华】组数的确定方法:设数据总数目为n,一般地,当n≤50时,则分为5~8组;的整数部分+1.当50≤n<100.则分为8~12组较为合适,组数等于最大值-最小值组距举一反三:【变式】一个样本中有80个数据,最大值是141,最小值是50,取组距为10,则样本可分成()A.10组 B.9组 C.8组 D.7组【答案】A.2. 我校八年级学生在生物实验中抽出50粒种籽进行研究,数据落在37~40之间的频率是0.2,则这50个数据在37~40之间的个数是()A.1 B.2 C.10 D.5【思路点拨】根据频率、频数的关系:频率=频数÷数据总和,可得频数=频率×数据总和.【答案】C.【解析】解:∵在生物实验中抽出50粒种籽进行研究,数据落在37~40之间的频率是0.2,∴这50个数据在37~40之间的个数=50×0.2=10.故选C.【总结升华】本题考查频率、频数、总数的关系:频率=频数÷数据总和.举一反三:【变式】(2016•黄浦区三模)将样本容量为100的样本编制成组号①~⑧的八个组,简况如表所示:组号①②③④⑤⑥⑦⑧频数14 11 12 13 13 12 10那么第⑤组的频率为()A.14 B.15 C.0.14 D.0.15【答案】D.解:根据表格中的数据,得第⑤组的频数为100﹣(14+11+12+13+13+12+10)=15, 其频率为15:100=0.15. 类型二、频数统计表3.某中学为了解学生的课外阅读情况,就“我最喜爱的课外读物”从文学、艺术、科普和其他四个类别进行了抽样调查(每位同学仅选一类),并根据调查结果制作了尚不完整的频数统计表:(1)表中m=______,n=______;(2)在这次抽样调查中,最喜爱阅读哪类读物的学生最多?最喜爱阅读哪类读物的学生最少?(3)根据以上调查,试估计该校1200名学生中最喜爱阅读科普类读物的学生有多少人? 【思路点拨】(1)由频率统计表可看出艺术类的频数22,频率是0.11,由频率=频数÷数据总数计算,可得到总数;根据频数的总和为200,可求出m 的值; (2)频数统计表中可以直接看出答案;(3)用样本估计整体:用整体×样本的百分比即可. 【答案与解析】 解:(1)学生总数:22÷0.11=200,m=200-22-66-28=84, n=66÷200=0.33,(2)从频数统计表中可以看出:最喜爱阅读文学类读物的学生最多84人,最喜爱阅读艺术类读物的学生最少22人. (3)1200×0.33=396(人). 【总结升华】此题主要考查了读频数统计表的能力,利用图表得出正确的信息是解决问题的关键.类型三、频数直方图4.某地区对八年级的英语教学情况进行期末质量调查,从中抽出的20个班级的英语期末平均成绩如下(单位:分):80 81 83 79 64 76 80 66 70 72 71 68 69 78 67 80 68 72 70 65试列出频数统计表并绘出频数直方图.【思路点拨】按照画频数直方图的步骤进行解答.解答时,应注意每个步骤中需要注意的事项.【答案与解析】解:(1)计算最大值与最小值的差.类别 频数(人数) 频率 文学 m 0.42 艺术 22 0.11 科普 66 n 其它 28 合计 183-64=19.(2)决定组距与组数.若取组距为4,则有194≈5,所以组数为5.(3)列频数统计表.(4)画频数直方图.【总结升华】按步骤进行操作.因选取的组距不同,所列的频数统计表及所画的频数直方图也不一样.在统计时,数据不能出现重复或遗漏的现象.【高清课堂:数据的描述369923 例1】举一反三:【变式】如图是某校九年级部分男生做俯卧撑的成绩(次数)进行整理后,分成五组,画出的频率分布直方图.已知从左到右前4个小组的频率分别是0.05,0.15,0.25,0.30,第五小组的频数为25,若合格成绩为20,那么此次统计的样本容量和本次测试的合格率分别是().A.100,55% B.100,80% C.75,55% D.75,80%【答案】B.5. (2016•安徽模拟)我校为了迎接体育中考,了解学生的体育成绩,从全校500名九年级学生中随机抽取了部分学生进行体育测试,其中“跳绳”成绩制作图如下:成绩段频数频率160≤x<170 5 0.1170≤x<180 10 a180≤x<190 b 0.14190≤x<200 16 c200≤x<210 12 0.24表(1)根据图表解决下列问题:(1)本次共抽取了名学生进行体育测试,表(1)中,a=,b=c=;(2)补全图(2),所抽取学生成绩中中位数在哪个分数段;(3)“跳绳”数在180以上,则此项成绩可得满分.那么,你估计全校九年级有多少学生在此项成绩中获满分?【思路点拨】(1)根据第一组的频数是5,对应的频率是0.1据此即可求得总人数;(2)根据中位数的定义即可求解;(3)利用总人数500乘以对应的比例即可求解.【答案与解析】解:(1)抽测的人数是:5÷0.1=50(人),a==0.2,b=50×0.14=7,c==0.32.故答案是:50,0.2,7,0.32.(2)所抽取学生成绩中中位数在190~200分数段;(3)全校九年级有多少学生在此项成绩中获满分的人数是×500=350(人).答:全校九年级有多少学生在此项成绩中获满分的人数是350人.【总结升华】本题考查读频数分布直方图的能力和利用统计图获取信息的能力;利用统计图获取信息时,必须认真观察、分析、研究统计图,才能作出正确的判断和解决问题.举一反三:【变式】随着车辆的增加,交通违规的现象越来越严重,交警对某雷达测速区检测到的一组汽车的时速数据进行整理,得到其频数及频率如表(未完成):(1)请你把表中的数据填写完整;(2)补全频数直方图;(3)如果汽车时速不低于60千米即为违章,则违章车辆共有多少辆?【答案】解:(1)36÷200=0.18,200×0.39=78,200-10-36-78-20=56,56÷200=0.28;(2)如图所示:(3)违章车辆数:56+20=76(辆).答:违章车辆有76辆.。
频率分布直方图中位数怎么求

频率分布直方图中位数怎么求频率分布直方图是一种常用的统计工具,用于图示化数据的分布情况。
而中位数是一种描述数据集中趋势的统计量。
本文将介绍如何在频率分布直方图中求取中位数。
首先,我们需要了解什么是频率分布直方图。
频率分布直方图是一种将数据分组并计数的图表,其中横轴表示数据的范围,纵轴表示数据的频率或计数。
每个数据范围被称为一个“组”,每个组的高度表示该组内数据的频率或计数。
通过绘制这样的直方图,我们可以更清晰地了解数据的分布情况。
为了计算频率分布直方图的中位数,我们需要确定数据集的总体中位数范围。
中位数是将数据集分成两半的值,也就是说有一半的数据小于等于中位数,有一半的数据大于等于中位数。
下面,我将提供一个简单的步骤来计算频率分布直方图的中位数:步骤 1:确定组距首先,我们需要确定直方图的组距。
组距是指每个组的数据范围。
组距的选择应该合理地将整个数据集划分为多个组。
通常,一个合适的组距可以使用Sturges'公式或者Scott's公式来计算。
Sturges'公式:组数 = 1 + 3.3*log(n)Scott's公式:组数 = (max(data) - min(data)) / (3.5 * std(data) * n^(-1/3))其中,n是数据集的样本量,max(data)和min(data)分别是数据集的最大值和最小值,std(data)是数据集的标准差。
步骤 2:确定频率和频率累计计算每个组的频率,即每个组内的数据数目。
根据数据集中的数据对应于不同组的情况,我们可以计算出每个组的频率。
步骤 3:计算频率累计在频率分布直方图中,频率累计是每个组的频率与其前面所有组的频率之和。
通过计算频率累计,我们可以找到频率分布曲线上的中位数位置。
步骤 4:确定中位数根据前面的步骤,我们可以得到频率累计的数据。
现在,我们需要找到频率累计最接近50%的组,并确定其中位数所在的位置。
频率分布直方图 小练 (含答案)

频率分布直方图小练1.为增强市民的环保意识,某市面向全市增招环保知识义务宣传志愿者.从符合条件的志愿者中随机选取名志愿者,其年龄频率分布直方图如图所示,其中年龄(岁)分成五组:第组,第组,第组,第组,第组.得到的频率分布直方图(局部)如图所示.(1)求第组的频率,并在图中补画直方图;(2)从名志愿者中再选出年龄低于岁的志愿者名担任主要宣讲人,求这名主要宣讲人的年龄在同一组的概率.解析(1)0.3,图见:(1)第4组的频率为.....1分, ............................2分,则补画第4组的直方图如图所示:.............................................4分(2)设“从20名志愿者中再选出年龄低于30岁的志愿者3名担任主要宣讲人, 其年龄均在同一组”为事件A...............................................5分第一组的人数为人第二组的人数为人......................6分设第一组的志愿者为m,第二组的4名志愿者分别为a,b,c,d.......................7分从m, a,b,c,d中选出3名志愿者共有10种选取方法。
.........10分其中都在第二组的共有4种选取方法..........11分所以,所求事件的概率为........................12分2.某校为了解高一期末数学考试的情况,从高一的所有学生数学试卷中随机抽取份,试卷进行成绩分析,得到数学成绩频率分布直方图(如图所示),其中成绩在的学生人数为6.(Ⅰ)估计所抽取的数学成绩的众数;(Ⅱ)用分层抽样的方法在成绩为和这两组中共抽取5个学生,并从这5个学生中任取2人进行点评,求分数在恰有1人的概率.考点6.统计图表解析解:(Ⅰ)由频率分布直方图可知:样本的众数为75.…………3分(Ⅱ)由频率分布直方图可得:第三组的频率:,所以,…………………………………………4分第四组的频数:;第五组的频数:;用分层抽样的方法抽取5份得:第四组抽取:;第五组抽取:.……7分记抽到第四组的三位同学为,抽到第五组的两位同学为则从5个同学中任取2人的基本事件有:,,共10种.其中分数在恰有1人有:,共6种.所求概率:.……………………………12分3.某校研究性学习小组从汽车市场上随机抽取20辆纯电动汽车调查其续驶里程(单次充电后能行驶的最大里程),被调查汽车的续驶里程全部介于公里和公里之间,将统计结果分成组:,,,,,绘制成如图所示的频率分布直方图.(Ⅰ)求直方图中的值;(Ⅱ)求续驶里程在的车辆数;(Ⅲ)若从续驶里程在的车辆中随机抽取2辆车,求其中恰有一辆车的续驶里程为的概率.考点6.统计图表解析解:(Ⅰ)由直方图可得:∴.------------------3分(Ⅱ)由题意可知,续驶里程在的车辆数为:------------------5分(Ⅲ)由(Ⅱ)及题意可知,续驶里程在的车辆数为,分别记为,续驶里程在的车辆数为,分别记为,设事件“其中恰有一辆汽车的续驶里程为”----------------------7分从该辆汽车中随机抽取辆,所有的可能如下:共种情况,----------------10分事件包含的可能有共种情况,则.------------------12分4.某中学高三(1)班共有50名学生,他们每天自主学习的时间在180到330分钟之间,将全班学生的自主学习时间作分组统计,得其频率分布如下表所示:组序分组频数频率第一组[180,210)50.1第二组[210,240)100.2第三组[240,270)120.24第四组[270,300)a b第五组[300,330)6c(1)求表中a、b、c的值;(2)某课题小组为了研究自主学习时间与成绩的相关性,需用分层抽样的方法从这50名学生中随机抽取20名作统计分析,则在第二组学生中应抽取多少人?(3)已知第一组学生中有3名男生和2名女生,从这5名学生中随机抽取2人,求恰好抽到1名男生和1名女生的概率.某单位N名员工参加“社区低碳你我他”活动,他们的年龄在25岁至50岁之间。
频率分布直方图练习题

频率分布直方图练习题1、根据《中华人民共和国道路交通安全法》,酒后驾车的血液酒精浓度在20~80mg/100mL(不含80)组距之间,而醉酒驾车的血液酒精浓度在80mg/100mL(含0.080)以上。
在某地区一周内,共查处500名酒后驾车和醉酒驾车的司机。
通过对这些司机血液中酒精含量的检测,得到了频率分布直方图。
根据直方图,可估算醉酒驾车的司机人数约为70人。
2、对100名学生进行随机抽样,测得他们的身高(单位cm)。
将身高分为区间[155,160),[160,165),[165,170),[170,175),[175,180),[180,185),并得到样本身高的频率分布直方图。
根据直方图,可以得到身高在170cm以上的学生人数为30人。
将身高在[170,175),[175,180),[180,185)三个区间内的学生分别记为A、B、C三组,从这三组中分层抽样选取6人,则从A、B、C三组中分别抽取的人数为2、2、2人。
3、某部门为了确定对某路段进行限速60km/h是否合理,对通过该路段的500辆汽车的车速进行检测,并将所得数据按照组距[40,50),[50,60),[60,70),[70,80]分组,得到频率分布直方图。
根据直方图,可以得出这500辆汽车中车速低于限速的汽车有90辆。
4、某校从参加高三年级期末考试的学生中抽出60名学生,并统计了他们的历史成绩(成绩均为整数且满分为100分)。
将不低于50分的成绩分为五段,得到部分频率分布直方图。
根据直方图,历史成绩在[70,80)的学生人数为16人。
5、给定XXX青年歌手大奖赛上某位选手得分的茎叶图,去掉一个最高分和一个最低分后,所剩数据的方差为25.4.6、从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图。
根据直方图,可得到a=141.若要从身高在[120,130),[130,140),[140,150)三组内的学生中,用分层抽样的方法选取18人参加活动,则应从每组中分别选取6人。
频率分布直方图方差的计算

频率分布直方图方差的计算
课题:频率分布直方图方差的计算频率分布直方图方差(Frequency Distribution Histogram Variance)是统计学中一种
重要的概念,它用于衡量一组数据的变异程度,方差值越大,数据点越分散,越不相关。
在计算频率分布直方图方差时,要先求出各个数据点的平均值,然后求出每个数据点与平均值之差的平方值,最后将每个数据点的平方值求和,再除以总的数据点数,就得到了频率分布直方图的方差。
首先,我们需要把统计学中的概念转换成具体的数学表达式,频率分布直方图方差可以用下面的公式表示:V = Σ( xi -
x )2/N其中,V表示方差,xi表示每个数据点,x表示数据点
的平均值,N表示数据点的数量。
具体的计算步骤是:首先,根据频率分布直方图统计出数据点的数量N;接着,计算数据点的平均值x,用下面的公式:x = Σ( xi )/N;接下来,将每个数据点xi与平均值x之差的平
方值求和,用下面的公式:Σ( xi - x )2;最后,将求和后的结
果除以数据点的数量N,就得到了频率分布直方图的方差V。
以上就是计算频率分布直方图方差的过程。
它是一种重要的统计量,可以用来衡量数据点的变异程度,方差越大,数据点越分散,越不相关。
此外,计算方差也可以帮助分析直方图中数据点的趋势变化,从而更好地了解数据的分布特征。
第八章第一讲频率分布直方图

第一讲 频率分布直方图一:考纲解读、有的放矢统计部分要求不太高,主要是考抽样方法与频率分布直方图和茎叶图有关的问题,最多一个小题(选择或填空)属容易题,但应充分注意以统计为载体、问题实质涉及期望与方差计算的综合解答题.二:核心梳理、茅塞顿开3. 作频率分布直方图的方法为:(1)把横轴分成若干段,每一线段对应一个组的组距;(2)以此线段为底作矩形,它的高等于该组的组距频率,这样得出一系列的矩形;(3)每个矩形的面积恰好是该组上的频率.4. 频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图.5. 作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.三:例题诠释,举一反三知识点1:利用频率分布直方图分析总体分布例题1:(2011中山期末A )2000辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,时速在[50,60)的汽车大约有 ( ) A .30辆 B .60辆 C .300辆D .600辆变式:(2009山东卷理B)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的 产品净重(单位:克)数据绘制的频率分布直方图,其中产品 净重的范围是[96,106],样本数据分组为[96,98),[98,100), [100,102),[102,104),[104,106],已知样本中产品净重小于 100克的个数是36,则样本中净重大于或等于98克并且 小于104克的产品的个数是 ( ). A.90 B.75 C. 60 D.45变式:(2011杭州质检B )某初一年级有500名同学,将他们的身高(单位:cm )数据绘制成频率分布直方图(如图),若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[)130,140内的学生中选取的人数为 .知识点2:用样本分估计总体例题2(2010安徽卷B )某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91, 77,86,81,83,82,82,64,79,86,85,75,71,49,45, (Ⅰ) 完成频率分布表;(Ⅱ)作出频率分布直方图;(Ⅲ)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染。
《频率分布直方图》教学设计、导学案、同步练习

《9.2.1 总体取值规律的估计》教学设计第1课时频率分布直方图【教材分析】本节是主要介绍表示样本分布的方法,包括频率分布表、频率分布直方图、条形图、扇形图、折线图等.由于作统计图、表的操作性很强,所以教学中要使学生在明确图、表含义的前提下,让学生自己动手作图.同时让学生理解:对于一个总体的分布,我们往往从总体抽取一个样本,用样本的频率分布估计总体分布. 学生在初中已经学过把样本数据表示成频数分布表和频数分布图的形式,能从图表上直观的看出数据的分布情况,为学习本节内容在基础知识上有了铺垫。
【教学目标与核心素养】课程目标1.结合实例,能用样本估计总体的取值规律.2.会列频率分布表,画频率分布直方图.3.能根据频率分布表和频率分布直方图观测数据的分布规律.数学学科素养1.直观想象:频率分布直方图的绘制与应用;2.数学运算:频率分布直方图中的相关计算问题.【教学重点】:①列频率分布表,画频率分布直方图;②根据频率分布表和频率分布直方图观测数据的分布规律.【教学难点】:①列频率分布表,画频率分布直方图;②根据频率分布表和频率分布直方图观测数据的分布规律.【教学过程】一、情景导入我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为为了较为合理地确定出这个标准需要做哪些工作?要求:让学生自由发言,教师不做判断。
而是引导学生进一步观察.研探. 二、预习课本,引入新课阅读课本192-197页,思考并完成以下问题 1、画频率分布直方图的步骤有哪些?2、频率分布直方图的纵轴表示什么?各矩形面积之和等于什么?要求:学生独立完成,以小组为单位,组内可商量,最终选出代表回答问题。
三、新知探究1.频率分布直方图绘制步骤①求极差,即一组数据中的最大值与最小值的差.②决定组距与组数.组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数越多.当样本容量不超过100时,常分成5~12组.为方便起见,一般取等长组距,并且组距应力求“取整”.③将数据分组.④列频率分布表.计算各小组的频率,第i 组的频率是第i 组频数样本容量.⑤画频率分布直方图.其中横轴表示分组,纵轴表示频率组距.频率组距实际上就是频率分布直方图中各小长方形的高度,它反映了各组样本观测数据的疏密程度.2. 频率分布直方图意义:各个小长方形的面积表示相应各组的频率,频率分布直方图以面积的形式反映数据落在各个小组的频率的大小,各小长方形的面积的总和等于1.3.总体取值规律的估计:我们可以用样本观测数据的频率分布估计总体的取值规律.4.频率分布直方图的特征:当频率分布直方图的组数少、组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原式数据信息;当频率分布直方图的组数多、组距小时,保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常不规则 ,不容易从中看出总体数据的分布特点.四、典例分析、举一反三题型一 频率分布直方图的绘制与应用例1 一个农技站为了考察某种麦穗长的分布情况,在一块试验地里抽取了100个麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6 5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8 6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.07.0 6.4 6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4 6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0 5.8 5.3 7.0 6.0 6.0 5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.9 5.4 6.0 5.2 6.0 6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3根据上面的数据列出频率分布表、绘出频率分布直方图,并用自己的语言描述一下这批麦穗长的情况.【答案】见解析 【解析】步骤是:(1)计算极差,7.4-4.0=3.4(cm). (2)决定组距与组数. 若取组距为0.3 cm,由于3.40.3=1113,需分成12组,组数合适.于是取定组距为0.3 cm,组数为12.(3)将数据分组.使分点比数据多一位小数,并且把第1小组的起点稍微减小一点.则所分的12个小组可以是[3.95,4.25),[4.25,4.55),[4.55,4.85),…,[7.25,7.55].(4)列频率分布表.对各个小组作频数累计,然后数频数,算频率,列频率分布表,如下表所示: 1 1 2 1128 13 112 1 (5)画频率分布直方图,如图.从表中看到,从频率分布表中可以看出,绝大部分麦穗长集中在5.15-5.95,并且5.75-6.05占比最大.解题技巧(绘制频率分布直方图的注意事项)1.在列频率分布表时,极差、组距、组数有如下关系: (1)若极差组距为整数,则极差组距=组数;(2)若极差组距不为整数,则极差组距的整数部分+1=组数.2.组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.跟踪训练一1. 某制造商3月份生产了一批乒乓球,随机抽样100个进行检查,测得每个球的直径(单位:mm),将数据分组如下表:补充完成频率分布表(结果保留两位小数),并在下图中画出频率分布直方图.【答案】见解析.【解析】频率分布表如下:频率分布直方图如下:题型二频率分布直方图中的相关计算问题例2 在某次数学测验后,将参加考试的500名学生的数学成绩制成频率分布直方图(如图),则在该次测验中成绩不低于100分的学生人数是()A.210B.205C.200D.195【答案】C【解析】由频率分布直方图,得在该次测验中成绩不低于100分的学生的频率为1-(0.012+0.018+0.030)×10=0.4,∴在该次测验中成绩不低于100分的学生人数为500×0.4=200.故选C. 解题技巧 (计算规律) 1.因为小长方形的面积=组距×频率组距=频率,所以各小长方形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.2.在频率分布直方图中,各小长方形的面积之和等于1.3.频数相应的频率=样本量.4.在频率分布直方图中,各长方形的面积之比等于频率之比,各长方形的高度之比也等于频率之比.跟踪训练二1.如图所示是由总体的一个样本绘制的频率分布直方图,且在[15,18)内频数为8.(1)求样本在[15,18)内的频率; (2)求样本量;(3)若在[12,15)内的小矩形面积为0.06,求在[18,33)内的频数. 【答案】(1) 425. (2) 50. (3) 39.【解析】 由样本频率分布直方图可知组距为3.(1)由样本频率分布直方图得样本在[15,18)内的频率等于475×3=425. (2)样本在[15,18)内的频数为8,由(1)可知,样本量为8425=8×254=50.(3)在[12,15)内的小矩形面积为0.06,故样本在[12,15)内的频率为0.06,故样本在[15,33)内的频数为50×(1-0.06)=47.又因为在[15,18)内的频数为8,故在[18,33)内的频数为47-8=39.五、课堂小结让学生总结本节课所学主要知识及解题技巧六、板书设计七、作业课本197页练习.【教学反思】本节课之前学生已有一定的统计学基础知识及分析问题和解决问题的能力,对常见的数学思想已有初步的认识和应用。
第9章统计专题3 频率分布直方图常考题型专题练习——【含答案】

1频率分布直方图【知识总结】 1.频率分布直方图(1)纵轴表示频率组距,即小长方形的高=频率组距;(2)小长方形的面积=组距×频率组距=频率;(3)各个小方形的面积总和等于1 . 2.频率分布表的画法第一步:求极差,决定组数和组距,组距=极差组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. 3. 频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.2【巩固练习】1、随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36. 根据上述数据得到样本的频率分布表如表所示.分组 频数 频率[25,30] 3 0.12(30,35] 5 0.20(35,40] 8 0.32(40,45] n 1 f 1(45,50] n 2 f 2(1)确定样本频率分布表中n 1,n 2,f 1和f 2的值;(2)根据上述频率分布表,画出样本频率分布直方图和频率分布折线图. 【答案】(1) n 1=7,n 2=2,f 1=0.28,f 2=0.08 (2)见解析【解析】(1)由所给数据知,落在区间(40,45]内的有7个,落在(45,50]内的有2个,故1n =7,2n =2,所以f 1=125n =725=0.28,f 2=225n =225=0.08. (2)样本频率分布直方图和频率分布折线图如图所示.32. 为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是( )A .35B .48C .60D .75【答案】C【解析】设被抽查的美术生的人数为n ,因为后2个小组的频率之和为(0.0375+0.0125)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n =515250.75++=60.故选:C.3、某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为若低于60分的人数是15人,则该班的学生人数是( )A .B .C .D.【答案】B【解析】根据频率分布直方可知成绩低于60分的有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20,则成绩低于60分的频率P=(0.005+0.010)×20=0.3.又因为低于60分的人数是15人,所以该班的学生人数是15÷0.3=50.本题选择B选项.4、某校初三年级有400名学生,随机抽查了40名学生测试1分钟仰卧起坐的成绩(单位:次),将数据整理后绘制成如图所示的频率分布直方图.用样本估计总体,下列结论正确的是( )4A.该校初三学生1分钟仰卧起坐的次数的中位数为25B.该校初三学生1分钟仰卧起坐的次数的众数为24C.该校初三学生1分钟仰卧起坐的次数超过30的人数约有80D.该校初三学生1分钟仰卧起坐的次数少于20的人数约为8[解析] 第一组数据的频率为0.02×5=0.1,第二组数据的频率为0.06×5=0.3,第三组数据的频率为0.08×5=0.4,∴中位数在第三组内,设中位数为25+x,则x×0.08=0.5-0.1-0.3=0.1,∴x=1.25,∴中位数为26.25,故A错误;第三组数据所在的矩形最高,第三组数据的中间值为27.5,∴众数为27.5,故B错误;1分钟仰卧起坐的次数超过30的频率为0.2,∴超过30次的人数为400×0.2=80,故C正确;1分钟仰卧起坐的次数少于20的频率为0.1,∴1分钟仰卧起坐的次数少于20的人数为400×0.1=40,故D错误.故选C.[答案] C5、某家庭记录了未使用节水龙头50天的日用水量数据(单位:3m)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用[)0,0.1[)0.1,0.2[)0.2,0.3[)0.3,0.4[)0.4,0.5[)0.5,0.6[)0.6,0.756水量频数132 49 26 5使用了节水龙头50天的日用水量频数分布表日用水量[)0,0.1[)0.1,0.2 [)0.2,0.3 [)0.3,0.4 [)0.4,0.5 [)0.5,0.6频数151310165(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:7(2)估计该家庭使用节水龙头后,日用水量小于30.35m 的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【答案】(1)直方图见解析;(2)0.48;(3)347.45m . 【解析】(1)频率分布直方图如下图所示:(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于30.35m 的频率为0.20.110.1 2.60.120.050.48⨯+⨯+⨯+⨯=;因此该家庭使用节水龙头后日用水量小于30.35m 的概率的估计值为0.48; (3)该家庭未使用节水龙头50天日用水量的平均数为()110.0510.1530.2520.3540.4590.55260.6550.4850x =⨯+⨯+⨯+⨯+⨯+⨯+⨯=. 该家庭使用了节水龙头后50天日用水量的平均数为8()210.0510.1550.25130.35100.45160.5550.3550x =⨯+⨯+⨯+⨯+⨯+⨯=. 估计使用节水龙头后,一年可节省水()()30.480.3536547.45m -⨯=.6、某电视台为宣传本省,随机对本省内1565~岁的人群抽取了n 人,回答问题“本省内著名旅游景点有哪些”统计结果如图表所示(1)分别求出a b x y 、、、的值;(2)从第234、、组回答正确的人中用分层抽样的方法抽取6人,求第234、、组每组各抽取多少人?(3)指出直方图中,这组数据的中位数是多少(取整数值)?【答案】(1)5a =,27b =,0.9x =,0.2y =;(2)2人,3人,1人;(3)42【解析】(1)由已知第4组人数为9250.36=,∴251000.02510n ==⨯,9由频率分布直方图得第一组人数为:1000.011010⨯⨯=,100.55a =⨯=,第二组人数为:1000.021020⨯⨯=,180.920x ==, 第三组人数为:1000.031030⨯⨯=,300.927b =⨯=,第五组人数为:1000.0151015⨯⨯=,30.215x ==. (2)第2、3、4组回答正确人数分别18、27、9,共54人,设第234、、组分别抽取,,x y z 人,则65418279x y z===,解得2,3,1x y z ===. (3)第1、2组频率和为0.10.20.3+=,第4、5组频率和为0.250.150.4+=,第3组频率为0.3,设中位数为m ,则350.50.3100.3m --=,241423m =≈. ∴中位数为42.7、某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图.10(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数.【答案】(1)0.0075x =;(2)众数是230,中位数为224. 【解析】(1)由直方图的性质可得(0.0020.00950.0110.01250.0050.0025)201x ++++++⨯=,∴0.0075x =.(2)月平均用电量的众数是2202402302+=, ∵(0.0020.00950.011)200.450.5++⨯=<, 月平均用电量的中位数在[220,240)内,设中位数为a ,由(0.0020.00950.011)200.0125(220)0.5a ++⨯+⨯-=,可得224a =, ∴月平均用电量的中位数为2248、为参加学校的“我爱古诗词”知识竞赛,小王所在班级组织了一次古诗词知识测试,并将全班同学的分数(得分取正整数,满分为100分)进行统计,以下是根据这次测试成绩制作的不完整的频率分布表和频率分布直方图.频率分布表组别分组频数频率1 [50,60) 9 0.182 [60,70) a3 [70,80) 20 0.404 [80,90) 0.085 [90,100] 2 b合计 1请根据以上频率分布表和频率分布直方图,回答下列问题:(1)求出a,b,c,d的值;(2)老师说:“小王的测试成绩是全班同学成绩的中位数”,那么小王的测试成绩在什么范围内.1112【答案】(1) a =15,b =0.04,c =0.03,d =0.004 (2) 70≤x <80 【解析】(1)样本容量为9÷0.18=50,50×0.08=4, 所以a =50-9-20-4-2=15,b =2÷50=0.04,c =15÷50÷10=0.03,d =0.04÷10=0.004.(2)因为样本容量为50,则样本的中位数是第25,26个数据的平均数, 而第25,26个数据均位于70≤x <80范围内, 所以小王的测试成绩在70≤x <80范围内.9、某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[)50,60,[)60,70,[)70,80,[)80,90,[]90,100.分数段[)50,60[)60,70[)70,80[)80,90:x y1∶12∶13∶44∶513(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[)50,90之外的人数. 【答案】(1)0.005a =;(2)73(分);(3)10.【解析】(1)由频率分布直方图知(20.020.030.04)101a +++⨯=,解得0.005a =. (2)由频率分布直方图知这100名学生语文成绩的平均分为550.00510650.0410750.0310850.0210950.0051073⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=(分).(3)由频率分布直方图知语文成绩在[)50,60,[)60,70,[)70,80,[)80,90各分数段的人数依次为:0.005101005,0.041010040,0.031010030,0.021010020⨯⨯=⨯⨯=⨯⨯=⨯⨯=由题中给出的比例关系知数学成绩在上述各分数段的人数依次为1455,4020,3040,2025234⨯=⨯=⨯=.故数学成绩在[50,90)之外的人数为100(5204025)10-+++=.10.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值分[75,85) [85,95) [95,105) [105,115) [115,125) 组频数 6 26 38 22 8(I)在答题卡上作出这些数据的频率分布直方图:(II)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(III)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?14【答案】(1)见解析;(2)平均数100,方差为104;(3)不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.【解析】(1)直方图如图,(2)质量指标值的样本平均数为x=⨯+⨯+⨯+⨯+⨯=.800.06900.261000.381100.221200.08100质量指标值的样本方差为22222s=-⨯+-⨯+⨯+⨯+⨯=.(20)0.06(10)0.2600.38100.22200.08104(3)质量指标值不低于95的产品所占比例的估计值为++=,0.380.220.080.68由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.11、从某企业生产的某种产品中随机抽取100件,测量这些产品的某项质量指标,由测量1516结果得到如下频数分布表:质量指标值分组[)75,85[)85,95[)95,105[)105,115[)115,125频数62638228()1在图中作出这些数据的频率分布直方图;()2估计这种产品质量指标值的平均数、中位数(保留2位小数);()3根据以上抽样调査数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?【答案】(1)直方图见解析;(2)平均数100,中位数99.74;(3)不能. 【解析】()1由已知作出频率分布表为:质量指标值分组[)75,85 [)85,95 [)95,105 [)105,115 [)115,12517频数 6 26 38 22 8频率0.06 0.26 0.38 0.22 0.08由频率分布表作出这些数据的频率分布直方图为:()2质量指标值的样本平均数为:800.06900.261000.381100.221200.08100x =⨯+⨯+⨯+⨯+⨯=,[)75,95内频率为:0.060.260.32+=,∴中位数位于[)95,105内,设中位数为x ,则0.50.260.06951099.740.38x --=+⨯≈,∴中位数为99.74.()3质量指标值不低于95 的产品所占比例的估计值为0.380.220.080.68++=.由于该估计值小于0.8,故不能认为该企业生产的这种产品“质量指标值不低于95 的产品至少要占全部产品80%的规定.18。
2020届高中数学分册同步讲义(必修3) 第2章 专题突破一 例析频率分布直方图中的统计问题

专题突破一例析频率分布直方图中的统计问题一、求样本中限制条件下的个体所占频率例1观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2 700,3 000)的频率为()A.0.001 B.0.1C.0.2 D.0.3思维切入求对应区间上的小矩形的面积.答案 D解析由直方图的意义可知,在区间[2 700,3 000)内取值的频率为(3 000-2 700)×0.001=0.3. 点评频率为直方图中相应小长方形的面积,即频率=纵坐标×横坐标差的绝对值.跟踪训练1某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分),现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如下图所示.已知图中从左到右的第一、三、四、五小组的频率分别为0.30,0.15,0.10,0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________. 答案 100 0.15解析 设参赛的人数为n ,第二小组的频率为1-(0.30+0.15+0.10+0.05)=0.4, 依题意40n=0.4,∴n =100,优秀的频率是0.10+0.05=0.15. 二、求样本中限制条件下的个体的频数例2 某市高三数学抽样考试中,对90分以上的成绩进行统计,其频率分布如图所示.若130~140分数段的人数为90,则90~100分数段的人数为________.思维切入 对应区间上的频数即为对应区间的频率×样本总体. 答案 810解析 由于90分以上的考试人数是样本总体,则图中5个分数段的频率之和等于1,设130~140分数段的频率为p ,则0.45+0.25+0.15+0.10+p =1,即0.95+p =1,则p =0.05,设该样本总体共有n 个学生的分数,且设90~100分数段的人数为x ,则由频率概念得⎩⎪⎨⎪⎧ 0.05×n =90,0.45×n =x ,解得⎩⎪⎨⎪⎧n =1 800,x =810,故90~100分数段的人数为810. 点评 本题是频率分布条形图.由于各分数段的人数与频率成正比,则可由x 90=0.450.05,求出x ;题设条形图的纵坐标是“频率”这是有别于常规的,在审题时不能混淆.跟踪训练2 为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.答案 12解析 志愿者的总人数为20(0.24+0.16)×1=50,所以第三组人数为50×0.36×1=18, 所以有疗效的人数为18-6=12. 三、求频率分布直方图中的参数问题例3 为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力,得到频率分布直方图,如图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a ,视力在4.6到5.0之间的学生数为b ,则a ,b 的值分别为( )A .0.27,78B .0.27,83C .2.7,78D .2.7,83思维切入 根据频率分布直方图的性质列方程求解. 答案 A解析 注意到纵轴表示频率组距,由图象可知,前4组的公比为3,最大频率a =0.1×33×0.1=0.27, 设后6组公差为d ,则0.01+0.03+0.09+0.27×6+5×62·d =1,解得d =-0.05,即后6组频率的公差为-0.05, 所以,视力在4.6到5.0之间的学生数为 (0.27+0.22+0.17+0.12)×100=78, 故选A.点评 解答本题关键是要利用频率分布直方图中残缺不全的数据,分析它们之间存在的内在关系.跟踪训练3 某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图所示),其中上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100]. (1)求频率分布直方图中x 的值;(2)如果上学所需时间不少于1小时的学生可申请在学校住宿,请估计学校600名新生中有多少名学生可以申请住宿.解(1)由频率分布直方图可得20×x+0.025×20+0.006 5×20+0.003×2×20=1,所以x=0.012 5.(2)由频率分布直方图可知,新生上学所需时间不少于1小时的频率为0.003×2×20=0.12.因为600×0.12=72,所以估计600名新生中有72名学生可以申请住宿.四、频率分布直方图中的数字特征例4从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).(1)由图中数据求a的值;(2)若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为多少?(3)估计这所小学的小学生身高的众数、中位数(保留两位小数)及平均数.思维切入众数即为出现次数最多的数,所以它的频率最大,在最高的小矩形中.中位数即为从小到大中间的数(或中间两数的平均数).解(1)因为直方图中的各个矩形的面积之和为1,所以10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.(2)由直方图知,身高在[120,130),[130,140),[140,150]三组的学生总数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]的学生人数为10,所以从身高在[140,150]内选取的学生人数为1860×10=3.(3)根据频率分布直方图知,身高在[110,120)的小矩形最高,所以这所小学的小学生身高的众数为110+1202=115(cm).又0.005×10+0.035×10=0.4<0.5,0.4+0.030×10=0.7>0.5,所以中位数在[120,130)内,可设为x,则(x-120)×0.030+0.4=0.5,解得x≈123.33,所以中位数为123.33 cm.根据频率分布直方图,计算平均数为105×0.05+115×0.35+125×0.3+135×0.2+145×0.1=124.5(cm).点评用频率分布直方图求得的众数、中位数不一定是样本中的具体数.跟踪训练4某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数为()A.20 B.25 C.22.5 D.22.75答案 C解析产品的中位数出现在频率是0.5的地方.自左至右各小矩形的面积依次为0.1,0.2,0.4,0.15,0.15,设中位数是x,则由0.1+0.2+0.08×(x-20)=0.5,得x=22.5,故选C.1.统计某校1 000名学生的数学水平测试成绩,得到样本的频率分布直方图如图所示.若满分为100分,规定不低于60分为及格,则及格率是()A.20% B.25% C.60% D.80%答案 D2.在中秋的促销活动中,某商场对9月14日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知12时到14时的销售额为7万元,则10时到11时的销售额为()A.1万元B.2万元C.3万元D.4万元答案 C3.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.答案94.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出________人.答案25解析由频率分布直方图可得[2 500,3 000)(元)月收入段共有10 000×0.000 5×500=2500(人),按分层抽样应抽出2 500×10010 000=25(人).5.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.估计居民月均用水量的中位数.解由(0.08+0.16+a+0.42+0.50+a+0.12+0.08+0.04)×0.5=1,解得a=0.30.设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.6.某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如图所示的频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/方立米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.解(1)由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1),[1,1.5),[1.5,2),[2,2.5),[2.5,3)内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:根据题意,该市居民该月的人均水费估计为4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).一、选择题1.从向阳小区抽取100户居民进行月用电量调查,为制定阶梯电价提供数据,发现其月用电量都在50到350度之间,制作频率分布直方图(如图所示)的工作人员粗心大意,位置t处未标明数据,则t等于()A.0.004 1 B.0.004 2C.0.004 3 D.0.004 4答案 D解析由题意得50×(0.006+t+0.003 6+0.002 4×2+0.001 2)=1,故t=0.004 4.故选D. 2.有一容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12]内的频数为()A.18 B.36 C.54 D.72答案 B解析易得样本数据落在区间[10,12]内的频率为0.18,则样本数据落在区间[10,12]内的频数为36.3.测量某地新生婴儿的体重,得到其频率分布直方图如图所示,则新生婴儿的体重(单位:g)在[2 700,3 000)的频率为()A.0.001 B.0.1 C.0.2 D.0.3答案 D解析由频率分布直方图可知,所求频率为0.001×300=0.3.4.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图可知,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56 B.60 C.120 D.140答案 D解析设所求人数为N,则N=2.5×(0.16+0.08+0.04)×200=140,故选D.5.如图是某班50名学生身高的频率分布直方图,那么身高(单位:cm)在区间[150,170)内的学生人数为()A.16 B.20 C.22 D.26答案 B解析根据频率分布直方图可知身高在区间[150,170)内的频率为(0.01+0.03)×10=0.4,所以身高在区间[150,170)内的学生人数为50×0.4=20,故选B.6.某学校对高二年级一次考试进行抽样分析,如图是根据抽样分析后的考试成绩绘制的频率分布直方图,其中抽样成绩的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中成绩小于100分的人数是36.则样本中成绩大于或等于98分且小于104分的人数是()A.90 B.75 C.60 D.45答案 A解析因为样本中成绩小于100分的人数是36,其对应频率之和为0.050×2+0.100×2=0.3,所以样本总数为36÷0.3=120,所以样本中成绩大于或等于98分且小于104分的人数为120×2×(0.100+0.150+0.125)=90,故选A.7.如图是某校高一一次数学考试成绩的样本频率分布直方图(样本容量n=200),若成绩不低于60分为及格,则样本中的及格人数是()A.6 B.36 C.60 D.120答案 D解析由题中频率分布直方图得,成绩不低于60分的人数为(0.012+0.018)×20×200=120.8.为了解学生在课外活动方面的支出情况,抽取了n 个同学进行调查,结果显示这些学生的支出金额(单位:元)都在[10,50]内,其中支出金额在[30,50]内的学生有117人,频率分布直方图如图所示,则n 等于( )A .180B .160C .150D .200 答案 A解析 [30,50]对应的概率为1-()0.01+0.025×10=0.65,所以n =1170.65=180. 二、填空题9.为了解某一段公路汽车通过时的车速情况,现随机抽测了通过这段公路的200辆汽车的时速,所得数据均在区间[40,80]中,其频率分布直方图如图所示,则在抽测的200辆汽车中,时速在区间[40,60)内的汽车有________辆.答案 80解析 由频率分布直方图得:时速在区间[40,60)内的汽车的频率为(0.01+0.03)×10=0.4.∴时速在区间[40,60)内的汽车有0.4×200=80(辆).10.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用的时间的条形图(如图所示)根据条形图可得这50名学生这一天平均每人的课外阅读时间为________.答案0.9解析这50名学生这一天平均每人的课外阅读时间为(0×5+0.5×20+1.0×10+1.5×10+2.0×5)÷50=0.9(小时).故选B.三、解答题11.为了了解小学生的体能情况,抽取某校一个年级的部分学生进行一分钟跳绳次数的测试,将数据整理后,画出频率分布直方图如图所示.已知图中从左到右前三个小组的频率分别为0.1,0.3,0.4,且第一小组的频数为5.(1)求第四小组的频率;(2)求参加这次测试的学生的人数;(3)若一分钟跳绳次数在75次以上(含75次)为达标,试估计该年级学生跳绳测试的达标率.解(1)第四小组的频率为1-0.1-0.3-0.4=0.2.(2)设参加这次测试的学生有x人,则0.1x=5,解得x=50,故参加这次测试的学生有50人.(3)由题意及频率分布直方图知,样本数据的达标率约为0.3+0.4+0.2=0.9,∴可估计该年级学生跳绳测试的达标率为90%.12.为组织好“市九运会”,组委会征集了800名志愿者,现对他们的年龄调查统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得:(1)年龄分组[25,30)对应小长方形的高度为________.(2)这800名志愿者中年龄在[25,35)内的人数为________.答案(1)0.04(2)440解析(1)因为各个小长方形的面积之和为1,所以年龄分组[25,30)对应小长方形的高度为1-(5×0.01+5×0.07+5×0.06+5×0.02)5=0.04.(2)年龄在[25,35)内的频率为0.04×5+0.07×5=0.55,人数为0.55×800=440.13.某校100名学生的期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)若这100名学生的语文成绩在某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.解 (1)由频率分布直方图知(2a +0.02+0.03+0.04)×10=1,解得a =0.005.(2)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20. 由题中给出的比例关系知数学成绩在上述分数段的人数依次为 5,40×12=20,30×43=40,20×54=25.故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.。
频率分布直方图问题分类解析

频率分布直方图问题分类解析作者:徐惠陈开懋来源:《高中生学习·高二版》2015年第10期频率分布直方图是高中概率统计部分的重要内容,在各省市高考中,几乎每年都考,频率分布直方图问题考查方式多样,一般有“求样本中限制条件下的个体数目或所占频率”、“填充频率分布直方图”、“求频率分布直方图中的参数”、“由频率分布直方图,求平均数、中位数、众数、方差、标准差”等几类考法.本文根据高中数学课程标准、高考考纲和最近几年的高考试题,对有关频率分布直方图的常见问题及解题规律方法进行一个小结,希望对读者有所帮助.例1 某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[[0.3, 0.9]]内,其频率分布直方图如图所示.(1)直方图中的[a=]_________;(2)在这些购物者中,消费金额在区间[[0.5, 0.9]]内的购物者的人数为_________.解析(1)由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解之得[a=3].(2)消费金额在区间[[0.5, 0.9]]内频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[[0.5, 0.9]]内的购物者的人数为:0.6×10000=6000.点拨本题以实际问题为背景,考查频率分布直方图,重点考查了以下三类问题:求频率分布直方图中的参数(例如某长方形的高);求某一范围内的频率;求某一范围内的样本容量.对于第一类问题,根据频率之和等于1,即频率分布直方图中各小矩形的面积之和等于1,即可解决.对于第二类问题,只需要弄清频率分布直方图中,纵轴是频率/组距,各小矩形的面积表示每一组距范围内的频率.对于第三类问题,某一范围内的样本容量=样本容量×某一范围内的频率.例2 某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为[40,50),[50,60),…,[80,90),[90,100].(1)求频率分布图中[a]的值;(2)估计该企业的职工对该部门评分不低于80的概率;(3)从评分在[[40,60)]的受访职工中,随机抽取2人,求此2人评分都在[[40,50]]的概率.[0.028][0.022][0.018][0.004][a][40][50][60][70][80][90][100][O][分数]解析(1)因为(0.004+a+0.0018+0.022×2+0.028)×10=1,所以[a=0.006].(2)由所给频率分布直方图知,50名受访职工评分不低于80的频率为(0.022+0.018)×10=0.4,所以该企业职工对该部门评分不低于80的概率的估计值为[0.4].(3)受访职工评分在[50,60)的有:50×0.006×10=3(人),即为[A1,A2,A3];受访职工评分在[40,50)的有: 50×0.004×40=2(人),即为[B1,B2]. 从这5名受访职工中随机抽取2人,所有可能的结果共有10种,它们是[A1,A2,A1,A3,][A1,B1,A1,B2,][A2,A31,][A2,B1,][A2,B2,][A3,B1,A3,B2,B1,B2,]又因为所抽取2人的评分都在[40,50)的结果有1种,即[B1,B2],故所求的概率为[P=110].点拨本题仍以实际问题为背景,考查频率分布直方图,重点考查了以下三类问题:求频率分布直方图中的参数(例如某长方形的高);求某一范围内的概率;与古典概型相结合求概率.对于第一类问题,仿例1即可解决;对于第二类问题,应弄清频率和概率的关系:频率是概率的估计值,求概率是用频率代替的,再利用求频率的方法即可;对于第三类问题,应先仿例1求某一范围内的频率,进而求出该范围内的样本容量;最后根据古典概型概率计算公式可求概率.点拨本题还是以实际问题为背景,考查频率分布直方图,重点考查了以下三类问题:求频率分布直方图中的参数(例如某长方形的高);利用频率分布直方图估算样本的数字特征(众数、中位数、平均数、标准差、方差);与随机抽样相结合求某一范围内的样本容量.对于第一类问题,仿例1即可解决.对于第二类问题,在频率分布直方图中,样本数字特征的估算方法分别是:众数是最高矩形的横坐标中点,中位数左边和右边的直方图的面积相等,平均数是频率分布直方图的重心,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点横坐标之和,方差估算公式是[s2=]第1个小矩形面积×[(x1中-x均值)2]+第2个小矩形面积×[(x2中-x均值)2]+…,其中,[x1中,x2中,…],表示第一个小矩形底边中点横坐标,第二个小矩形底边中点横坐标,…,标准差估算公式是[s=s2].对于第三类问题,应先仿例1求某一范围内的频率,进而求出该范围内的样本容量,再根据分层抽样知识计算出抽样比,最后可得某一范围内应抽取的样本容量.例4 从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(2)估计这种产品质量指标值的平均值及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解析(1)频率分布直方图如下:所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.8=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.点拨本题依旧以实际问题为背景,考查频率分布直方图,重点考查了以下三类问题:画频率分布直方图;利用频率分布直方图估算样本的数字特征(众数、中位数、平均数、标准差、方差);求某一范围内的频率.对于第一类问题,画频率分布直方图应注意横、纵坐标的意义,横坐标表示组距,纵坐标表示频率/组距.对于第二类问题,在频率分布直方图中,样本数字特征的估算方法见例3.对于第三类问题,仿例1.[练习]1. 20名学生某次数学考试成绩(单位:分)的频率分布直方图如图所示.(1)求频率分布直方图中a的值;(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率.2. 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图(如图所示).(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)。
频率分布表和频率分布直方图分析

根据频数分布表绘制直方图
不及格的 学生数最 少!!!
绘制频数折线图
将直方图中每个小 长方形上面一条边 的中点顺次连结起 来,即可得到频数 折线图
2.2.1 用样本的频率分 布估计总体分布
1、用样本去估计总体,是研究统计问题的一个基本思想
2、前面我们学过的抽样方法有:简单随机抽样、系统抽样、 分层抽样。要注意这几种抽样方法的联系与区别。
2.是用样本的数字特征(如平均 数、标准差等)估Байду номын сангаас总体特征。
通过抽样,我们获得了100位居民某年的月 平均用水量(单位:t) ,如下表:
思考:由上表,大家可以得到什么信息?
3.1 3.4 3.2 3.3 3.2 3.0 2.5 2.6 2.5 2.8
2.5 2.6 2.7 2.8 2.9 2.9 2.8 2.7 2.6 2.5
分 组 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5] 合计
频数 4 正 8 正 正 正 15 正 正 正 正 22 正 正 正 正 正 25 正 正 14 正 一 6 4 2 100
频数累计
频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1.00
频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06
频率/组距 0.50 0.40 0.30 0.20 0.10 0
0.04 0.02 1
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t
问题 如果当地政府希望使80% 以上的居 民每月的用水量不超出标准,根据频率分 布表和频率分布直方图,你能对制定月用 水量标准提出建议吗?
如何学好频数分布直方图

如何学好频数分布直方图学好统计,就得学好频数分布直方图,学好频数分布直方图就应注意以下几个问题:一、知道频数分布直方图和频数分布折线图的意义1,将一组数据分成若干个组,属于每组的数据个数叫做这组的频数.即频数是统计出的某一对象出现的次数.2,频数与总次数的比值称为频率.即频率是某一对象的频数与总次数的比值.由此可见,频率更能直接反映出某一对象出现的频繁程度.3,在相互垂直的两条轴上,把横轴分成若干段,每段对应一个组点后,以它为边作一矩形,它的高等于该组的频数,这一系列的矩形构成了频数分布直方图.4,将频数分布直方图中每个小长方形上面一条边的中点顺次连续起来,•就可以得到频数折线图.由此可见,频数分布折线图更能让我们清晰地感受到一组数据的分布状况.二、能从已知频数分布直方图或频数分布折线图上获取信息由于落在不同小组中的数据个数为该组的频数,频数与数据总数的比为频率,频率能反映各组频数的大小在总数中所占的份量.所以频数分布直方图能直观清楚地反映数据在各个范围内的分布情况,从而更全面、准确、细致地反映事物的属性.例1 如图1,根据频数分布直方图回答问题:(1)总共统计了多少名学生的心跳情况?(2)哪些次数段的学生数最多?占多大比例?(3)如果半分钟心跳次数为x ,且30≤x <39次属于正常范围,心跳次数属于正常的学生占多大比例?(4)说说你从频数折线图中获得的信息.简析 掌握频数分布直方图的特点是解决问题的关键.从统计图中可以获知各组心跳情况的人数及分布情况.(1)总共统计了2+4+7+5+3+1+2+2+1=27(人)的心跳情况.(2)30≤x <33这个次数段的学生数最多,约占26%.(3)30≤x <39次数段的总人数有7+5+3=15人,15÷27≈56%,故心跳次数属于正常范围的学生约占56%.(4)从折线统计图中可知:折线呈中间高两边低的趋势,就是说心跳正常的人数较多.三、根据已知数据,画频数分布直方图频数分布直方图在实际问题中应用广泛,学习频数统计图不仅能从统计图中获取信息,还要能根据已知的具体数据画出频数分布直方图.绘制频数分布直方图的一般步骤是:(1)计算最大值与最小值的差,目的是知道数据波动的大小,把它作为分组的依据;(2)决定组距与组数;(3)决定分点;(4)列频数分布表;(5)绘制频数分布直方图.例2 某校七年级(2)班30名男生的身高(x )情况测量如下(单位:cm ):164 169 170 182 180 169 176 166 162 174 183 170 171 170 173 174 162 174 173 165 167 160 158 175 162 177 173 156 174175图1根据这些数据,列出频率分布表、绘制频数直方图.简析 先根据数据适当分组,然后绘制频数分布表,最后绘制统计图.把这些数据分成6组,依次为155≤x <160,160≤x <165,165≤x <170,170≤x <175,175≤x <180,180≤x <185.列出频数分布表: 正正画频数分布直方图及折线图如图2.下面两道题目供同学们自己练习:1,某市教育局在中学开展的“创新素质实践行”中,进行了小论文的评比.各校交论文的时间为5月1日至30日,评委会把各校交的论文的件数按5天一组分组统计,绘制了频率分布直方图,如图3,已知从左至右各长方形的高的比为2∶3∶4∶6∶4∶1,第二组的频数为18.请回答下列问题:(1)本次活动共有多少篇论文参加评比?(2)哪组上交的论文数量最多?有多少篇?(3)经过评比,第四组和第六组分别有20篇、4篇论文获奖,问这两组哪组获奖率较高?2,王大爷开了一个报亭,为了使每天进的某种报纸适量,王大爷对这种报纸40天的销售情况作了调查,这40天卖出这种报纸的份数如下:136, 175, 153,135,161,140,155,180,179,166,188,142,144,154,155,图2 图3157,160,162,135,156,148,173,154,145,158,150,154,168,168,155,169,157,157,149,134,167,151,144,155,131将上面数据适当分组,作出适当的统计图,说明王大爷每天进多少这种报纸比较合适?参考答案:1,(1)本次活动共有120篇论文参评;(2)第四组上交的论文数量最多,有36篇;(3)第六组获奖率最高.2,由于这组数据的最大值为188,最小数据为131,即它们相差57,所以取组距为10,分六组,依次为:130≤x<140,140≤x<150,150≤x<160,160≤x<170,170≤x<180,正正图4画频数分布直方图,如图4所示.由此可知,王大爷每天进150~160份比较合适.。
画频率分布直方图第一步求极差数据组中最大值与最小值的差距

探究:
我国是世界上严重缺水 的国家之一,城市缺水 问题较为突出,某市政 府为了节约生活用水, 计划在本市试行居民生 活用水定额管理,即确 定一个居民月用水量标 准a,用水量不超过a的 部分按平价收费,超出 a的部分按议价收费。 如果希望大部分居民的 日常生活不受影响,那 么标准a定为多少比较 合理呢 ?
0.22
0.25
0.15 0.05
0.5
0.3 0.1 0.08 0.04 2.00
0.04
0.02 1
第 五 步: 画 出 频 率 分 布 直 方 图.
频率/组距 (组距=0.5)
0.6
0.5 0.5请大家阅读第 0.44 68页,直方图有 0.4 哪些优点和缺 0.3 0.3 0.3 点?
小长方形的面 月均用水量最 多的在哪个区 积总和 积=?=? 间?
0.070 0.060 0.050 0.040 0.030 0.020
0.010 12.5 15.5
练习:2 .投掷一枚均匀骰子44次的记录是:
3 4 6 6 2 2 3 1 4 5 3 6 1 3 1 2 5 1 2 2 1 3 4 5 3 4 2 2 4 1 6 6 5 4 3 5 6 5 4 4 5 1 6 3
如果希望大部分居民的日常生活不受影响那么标准a定为多少比较合理呢采用抽样调查的方式获得样本数据分析样本数据来估计全市居民用水量的分布情况下表给出100位居民的月均用水量表分析数据的一种基本方法是用图将它们画出来或者用紧凑的表格改变数据的排列方式作图可以达到两个目的一是从数据中提取信息二是利用图形传递信息
(同样一组数据,如果组距不同,横轴、纵 轴的单位不同,得到的图和形状也会不同。 不同的形状给人以不同的印象,这种印象有 时会影响我们对总体的判断 )
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
所以该样本的中位数为2.02
3.由频率分布直方图估计样本平均数公式:
每个小矩形底边中点的横坐标与对应矩形面积的 乘积之和
平均数
a1
2
b1
•
S1
a2
2
b2
•
S2
a3
2
b3
•
S3...
an
2
bn
•
Sn
(S为区间a, b对应矩形的面积)
0.4
0.04
0.03 0.3
0.2
0.02
0.1
0.01
各小组内频率的大小。
(2)小矩形面积之和为1
(3)频率
频数 样本容量
频数 频率 样本容量
样本容量
频数 频率
1.求某一小矩形的高:利用所有小矩形面积之和为1
2.求众数:最高矩形底边中点的横坐标
3.求平均数:每个小矩形底边中点的横坐标与对应矩形面 积的乘积之和
4.求中位数:线段之比=面积之比(或面积之和为0.5)
O
取一人,估计其上学路上所需
时间超过60分钟的概率。
时间
10 20 30 40 50 60 70 80 90 100 110
O 0.5
1
1.5 2
2.5 3 3.5 4 4.5
月平均用水量(t)
例题分析:月均用水量的众数是2.25t.如图所示:(2+2.5)/2=2.25
2、从频率分布直方图中估计中位数(中位数左边立方图的小矩形 面积为0.5)
频率/组距
0.404.50
0.40 0.30
0.16 0.20 0.08 0.10
5.求样本数据在某一区间内的频数:样本容量X该区间小 矩形的面积总和
1、众数: 在样本数据的频率分布直方图中,众数就 是最高矩形的中点的横坐标。
频率 组距
当最高矩形的数据组为(a, b) 时, 那么(a+b)/2就是众数。
0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 例题分析:月 均 用 水 量 的 众 数是2.25t.如 图 所示 :(2+2.5)/2=5 3 3.5 4 4.5 月均用水量 /t
前四组的小矩形面积之和为:
0.5-0.49=0.01
0.5×(0.08+ 0.16+ 0.30+ 0.44) = 0.49
设中位数为2+x
x 0.01所以x = 0.02 0.5 0.25
所以t=2.02
如图在直线t=2.02之前所有小矩形的面积为0.5
【典例】2.
频率/组距
某学校随机抽取部分新生调查
其上学路上所需时间(单位: x 分钟),并将所得数据绘制成
频率分布直方图(如图),
(1)求直方图中X的值;
(2)求众数、中位数、 0.0125 平均数
(3)若样本容量为1000,0.0065
求上学路上所需时
0.003
间不超过40分钟的人数。 (4)若从该校学生中随机抽
17 题
18题
频数分布表
18题
折线图
18题
问题:给定一组数据,如何求这组数据的众数、中位数、 平均数?
一.数学思想:用样本估计总体
二.频率分布直方图的性质: (1)小矩形的面积=对应区间上数据的频率(组距 所以各小矩形的面积表示相应各组的频率,
频率 组距
频率)
这样,频率分布直方图就以面积的形式反映了数据落在
年份
2020年 2019年 2018年 2017年 2016年
考情
(1)频率=概率 (2)求平均值 (3)独立性检验
(1)求小矩形高 (2)求平均值
(1)茎叶图的特征 (2)独立性检验
(1)频率=概率 (2)样本估计总体
(1)相关系数 (2)求回归方程并求预报值
考查形式
频数分布表
茎叶图
题号
18 题
平均数 0 10 • 0.1 10 20 • 0.3 20 30 • 0.4 30 40 • 0.2
2
2
2
2
0 10 20 30 40
【典例】1.2015年全国一卷改编
某公司为了解用户对其产品 的满意度,从A地区随机调 查了40个用户,根据用户对 产品的满意度评分,得到A a 地区用户满意评分的频率分 布直方图. (1)求图中a的值。 (2)若从该公司的用户中随 机抽取一名用户,求其满意 度评分低于60分的概率。 (3)求A地区用户满意度评 分的众数、中位数、平均数 (结果精确到0.01)。 (4)若该公司有15200名用 户,求用户满意评分度超过 80的用户数。