用直方图算平均数,中位数、众数、标准差共26页

合集下载

中考数学一轮复习专题解析—统计与概率

中考数学一轮复习专题解析—统计与概率

中考数学一轮复习专题解析—统计与概率复习目标1.能根据具体的实际问题或者提供的资料,运用统计的思想收集、整理和处理一些数据,并从中发现有价值的信息,在中考中多以图表阅读题的形式出现;2.了解总体、个体、样本、平均数、加权平均数、中位数、众数、极差、方差、频数、频率等概念,并能进行有效的解答或计算;3.能够对扇形统计图、列频数分布表、画频数分布直方图和频数折线图等几种统计图表进行具体运用,并会根据实际情况对统计图表进行取舍;4.在具体情境中了解概率的意义;能够运用列举法(包括列表、画树状图)求简单事件发生的概率.能够准确区分确定事件与不确定事件;考点梳理一、数据的收集及整理1.一般步骤:调查收集数据的过程一般有下列六步:明确调查问题、确定调查对象、选择调查方法、展开调查、记录结果、得出结论.2.调查收集数据的方法:普查与抽样调查.要点诠释:(1)通过调查总体的方式来收集数据的,抽样调查是通过调查样本方式来收集数据的.(2)一般地,当总体中个体数目较多,普查的工作量较大;受客观条件的限制,无法对所有个体进行普查;或调查具有破坏性时,不允许普查,这时我们往往会用抽样调查来体现估计总体的思想.(3)用抽签的办法决定哪些个体进入样本.统计学家们称这种理想的抽样方法为简单的随机抽样.3.数据的统计:条形统计图、折线统计图、扇形统计图是三种最常用的统计图.【特别提醒】这三种统计图各具特点:条形统计图可以直观地反映出数据的数量特征;折线统计图可以直观地反映出数据的数量变化规律;扇形统计图可以直观地反映出各部分数量在总量中所占的份额.例1. 连云港市实行中考改革,需要根据该市中学生体能的实际情况重新制定中考体育标准.为此,抽取了50名初中毕业的女学生进行“一分钟仰卧起坐”次数测试.测试的情况绘制成表格如下:次数 6 12 15 18 20 25 27 30 32 35 36 人数 1 1 7 18 10 5 2 2 1 1 2⑴求这次抽样测试数据的平均数、众数和中位数;⑵根据这一样本数据的特点,你认为该市中考女生“一分钟仰卧起坐”项目测试的合格标准应定为多少次较为合适?请简要说明理由;⑶根据⑵中你认为合格的标准,试估计该市中考女生“一分钟仰卧起坐”项目测试的合格率是多少?【答案】⑴该组数据的平均数众数为18,中位数为18;⑵该市中考女生一分钟仰卧起坐项目测试的合格标准应定为18次较为合适,因为众数及中位数均为18,且50人中达到18次的人数有41人,确定18次能保证大多数人达标;⑶根据⑵的标准,估计该市中考女生一分钟仰卧起坐项目测试的合格率为82%.二、数据的分析1.基本概念:总体:把所要考查的对象的全体叫做总体;个体:把组成总体的每一个考查对象叫做个体;样本:从总体中取出的一部分个体叫做总体的一个样本;样本容量:样本中包含的个体的个数叫做样本容量;频数:在记录实验数据时,每个对象出现的次数称为频数;频率:每个对象出现的次数与总次数的比值(或者百分比)称为频率;平均数:在一组数据中,用数据的总和除以数据的总个数就得到这组数据的平均数;中位数:将一组数据从小到大依次排列,位于正中间位置的数(或正中间两个数据的平均数)叫做这组数据的中位数;众数:在一组数据中,出现频数最多的数叫做这组数据的众数;极差:一组数据中的最大值减去最小值所得的差称为极差;方差:我们可以用“先平均,再求差,然后平方,最后再平均”得到的结果表示一组数据偏离平均值的情况,这个结果通常称为方差.计算方差的公式:设一组数据是,是这组数据的平均数。

利用频率直方图求中位数、众数、平均数-高考数学微专题突破含详解

利用频率直方图求中位数、众数、平均数-高考数学微专题突破含详解

高考数学微专题突破利用频率分布直方图求中位数、平均数、总数一、单选题1.某校为了解高二年级学生某次数学考试成绩的分布情况,从该年级的1120名学生中随机抽取了100名学生的数学成绩,发现都在[]80,150内现将这100名学生的成绩按照[)8090,,[)90100,,[)100110,,[)110120,,[)120130,,[)130140,,[]140150,分组后,得到的频率分布直方图如图所示,则下列说法正确的是()A .频率分布直方图中a 的值为0.040B .样本数据低于130分的频率为0.3C .总体的中位数(保留1位小数)估计为123.3分D .总体分布在[)90100,的频数一定与总体分布在[)100110,的频数相等2.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n 个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已知学习时长在[)9,11的学生人数为25,则n 的值为()A .40B .50C .80D .1003.某地工商局对辖区内100家饭店进行卫生检查并评分,分为甲、乙、丙、丁四个等级,其中分数在[)60,70,[)70,80,[)80,90,[]90,100内的等级分别为:丁、丙、乙、甲,对饭店评分后,得到频率分布折线图,如图所示,估计这些饭店得分的平均数是()A .80.5B .80.6C .80.7D .80.84.下面是甲、乙两位同学高三上学期的5次联考数学成绩,现在只知其从第1次到第5次分数所在区间段分布的条形图(从左至右依次为第1至第5次),则从图中可以读出一定正确的信息是()A .甲同学的成绩的平均数大于乙同学的成绩的平均数B .甲同学的成绩的方差大于乙同学的成绩的方差C .甲同学的成绩的极差小于乙同学的成绩的极差D.甲同学的成绩的中位数小于乙同学的成绩的中位数5.下面是追踪调查200个某种电子元件寿命(单位:h)频率分布直方图,如图:其中300-400、400-500两组数据丢失,下面四个说法中有且只有一个与原数据相符,这个说法是①寿命在300-400的频数是90;②寿命在400-500的矩形的面积是0.2;③用频率分布直方图估计电子元件的平均寿命为:⨯+⨯+⨯+⨯+⨯1500.12500.153500.454500.155500.15④寿命超过400h的频率为0.3A.①B.②C.③D.④6.为了解某电子产品的使用寿命,从中随机抽取了100件产品进行测试,得到图示统计图.依据统计图,估计这100件产品使用寿命的中位数为()A.218.25B.232.5C.231.25D.241.25 7.为了让学生了解社会,拓宽视野,丰富知识,提高社会实践能力和综合素质,哈三中团委组织学生参加了抽测一批棉花的纤维长度(单位:cm)的社会实践活动.利用所学习的数学知识,同学们作出了样本的频率分布直方图.现在,由于原始数据不全,只能通过直方图来估计这一批棉花的纤维长度的平均值(同一组数据用这组数据所在区间的中点的值代替).则估计的平均值为()A.21.75B.22.25C.23.75D.20.75 8.为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是()A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有32人9.某地气象局把当地某月(共30天)每一天的最低气温作了统计,并绘制了如下图所示的统计图.记这组数据的众数为M,中位数为N,平均数为P,则()A .M N P <<B .N M P <<C .P M N <=D .P N M<<10.在某次高中学科竞赛中,4000名考生的参赛成绩按[)40,50,[)50,60,[)60,70,[)70,80,[)80,90,[)90,100分成六组,其频率分布直方图如图所示,则下列说法中错误的是().A .成绩在[)70,80内的考生人数最多B .不及格(60分以下)的考生人数约为1000人C .考生竞赛成绩平均分的估计值为70.5分D .考生竞赛成绩中位数的估计值为75分11.在2019年某省普通高中学业水平考试(合格考)中,对全省所有考生的物成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[)40,50,[)50,60,[)60,70,[)80,90,[]90,100,90分以上为优秀,则下列说法中不正确的是()A .从全体考生中随机抽取1000人,则其中得优秀考试约有100人B .若要全省的合格考通过率达到96%,则合格分数线约为44分C .若同一组中数据用该组区间中间值作代表值,可得考试物理成绩的平均分约为70D .该省考生物理成绩的中位数为75分第II 卷(非选择题)请点击修改第II 卷的文字说明二、填空题12.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.则估计高一参赛学生的成绩的众数、中位数分别为____________.13.某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:g )绘制的频率分布直方图,样本数据分为8组,分别为[)80,82,[)82,84,[)84,86,[)86,88,[)88,90,[)90,92,[)92,94,[]94,96,则样本的中位数在第______组14.某中学举行了一场音乐知识竞赛,将参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图.根据频率分布直方图,同一组数据用该区间的中点值代替,估计这次竞赛的平均成绩为______分.三、双空题15.根据高二某班50名同学的数学成绩,绘制频率分布直方图如图所示,虽不小心将其中一个数据污染了,但依然可以推断这个被污染的数据为_________,该班同学的成绩众数为_________.16.中小学生的视力状况受到社会的广泛关注,某市有关部门从全市6万名高一学生中随机抽取了400名,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示.从左至右五个小组的频率之比依次是5∶7∶12∶10∶6,则这400名学生视力的众数为________,中位数为________.四、解答题17.有一种鱼的身体吸收汞,一定量身体中汞的含量超过其体重的61.0010-⨯的鱼被人食用后,就会对人体产生危害.某海鲜市场进口了一批这种鱼,质监部门对这种鱼进行抽样检测,在30条鱼的样本中发现的汞含量(乘以百万分之一)如下:0.070.340.950.98 1.020.98 1.37 1.400.39 1.021.44 1.580.54 1.080.710.70 1.20 1.24 1.62 1.681.85 1.300.810.820.84 1.39 1.262.200.91 1.31(1)完成下面频率分布表,并画出频率分布直方图;频率分布表:分组频数频率[)0,0.50[) 0.50,1.001 3[) 1.00,1.50[) 1.50,2.002 15[)2.00,2.5011 30合计301频率分布直方图:(2)根据频率分布直方图估算样本数据的平均值(保留小数点后两位,同一组中的数据用该组区间中点值代表),并根据频率分布直方图描述这批鱼身体中汞含量的分布规律.18.经历过疫情,人们愈发懂得了健康的重要性,越来越多的人们加入了体育锻炼中,全民健身,利国利民,功在当代,利在千秋.一调研员在社区进行住户每周锻炼时间的调查,随机抽取了300人,并对这300人每周锻炼的时间(单位:小时)进行分组,绘制成了如图所示的频率分布直方图:(1)补全频率分布直方图,并估算该社区住户每周锻炼时间的中位数(精确到0.1);(2)若每周锻炼时间超过6小时就称为运动卫士,超过8小时就称为运动达人.现利用分层抽样的方法从运动卫士中抽取5人,再从这5人中抽取2人做进一步调查,求抽到的2人中恰有1人为运动达人的概率.19.经历过疫情,人们愈发懂得了健康的重要性,越来越多的人们加入了体育锻炼中,全民健身,利国利民,功在当代,利在千秋.一调研员在社区进行住户每周锻炼时间的调查,随机抽取了300人,并对这300人每周锻炼的时间(单位:小时)进行分组,绘制成了如图所示的频率分布直方图:(1)补全频率分布直方图,并估算该社区住户每周锻炼时间的中位数(精确到0.1);(2)若每周锻炼时间超过6小时就称为运动卫士,超过8小时就称为运动达人.现利用分层抽样的方法从运动卫士中抽取10人,再从这10人中抽取3人做进一步调查,设抽到的人中运动达人的人数为X ,求随机变量X 的分布列及期望.20.某贫困地区经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入、实现2020年脱贫的工作计划,该地扶贫办统计了2019年50位农民的年收入并制成如图频率分布直方图:(1)根据频率分布直方图,估计这50位农民的平均年收入x (单位:千元,同一组数据用该组数据区间的中点值表示);(2)为推进精准扶贫,某企业开设电商平台,让越来越多的农村偏远地区的农户通过经营网络商城脱贫致富.甲计划在A 店,乙计划在B 店同时参加一个订单“秒杀”抢购活动,其中每个订单由()*2,n n n N ≥∈个商品W 构成,假定甲、乙两人在A 、B 两店订单“秒杀”成功的概率分别为p 、q ,记甲、乙两人抢购成功的订单总数量、商品W 总数量分别为X 、Y .①求X 的分布列及数学期望()E X ;②若27sin4n p n n ππ=-,sin4n q nπ=,求当Y 的数学期望()E Y 取最大值时正整数n 的值.21.某地处偏远山区的古镇约有人口5000人,为了响应国家号召,镇政府多项并举,鼓励青壮劳力外出务工的同时发展以旅游业为龙头的乡村特色经济,到2020年底一举脱贫.据不完全统计该镇约有20%的人外出务工,下图是根据2020年扶贫工作期间随机调查本地100名在外务工人员的年收入(单位:千元)数据绘制的频率分布直方图.(1)根据样本数据估计该镇外出务工人员的创收总额(同一组中的数据用该组区间的中点值为代表);(2)完成脱贫任务后,古镇党政班子并不懈怠,决心带领全镇人民在奔小康道路上再上一个新台阶,出台了多项优惠政策,鼓励本地在外人员返乡创业,调查显示年收入在35千元(含35千元)以上的人中有60%的人愿意返乡投资创业,年收入在35千元以下的人中有40%的人愿意返乡投资创业,请从样本数据中完成下面的22⨯列联表,并判断能否在犯错误的概率不超过0.1的前提下认为“是否愿意返乡投资创业和年收入有关”.35千元(含35千元)以上35千元以下愿意返乡投资创业不愿意返乡投资创业附:()()()()()22n ad bc X a b c d a c b d -=++++,()20P X k ≥0.100.050.0250.0100k 2.7063.8415.0246.63522.某市为大力推进生态文明建设,把生态文明建设融入市政建设,打造了大型植物园旅游景区.为了了解游客对景区的满意度,市旅游部门随机对景区的100名游客进行问卷调查(满分100分),这100名游客的评分分别落在区间[)50,60,[)60,70,[)70,80,[)80,90,[]90,100内,且游客之间的评分情况相互独立,得到统计结果如频率分布直方图所示.(1)求这100名游客评分的平均值(同一区间的数据用该区间数据的中点值为代表);(2)视频率为概率,规定评分不低于80分为满意,低于80分为不满意,记游客不满意的概率为p .(ⅰ)若从游客中随机抽取m 人,记这m 人对景区都不满意的概率为m a ,求数列{}m a 的前4项和;(ⅱ)为了提高游客的满意度,市旅游部门对景区设施进行了改进,游客人数明显增多,对游客进行了继续旅游的意愿调查,若不再去旅游记1分,继续去旅游记2分,每位游客有继续旅游意愿的概率均为p ,且这次调查得分恰为n 分的概率为n B ,求4B .23.2016年春节期间全国流行在微信群里发、抢红包,现假设某人将688元发成手气红包50个,产生的手气红包频数分布表如下:金额分组[)1,5[)5,9[)9,13[)13,17[)17,21[)21,25频数39171182(1)求产生的手气红包的金额不小于9元的频率;(2)估计手气红包金额的平均数(同一组中的数据用该组区间的中点值作代表);(3)在这50个红包组成的样本中,将频率视为概率.①若红包金额在区间[]21,25内为最佳运气手,求抢得红包的某人恰好是最佳运气手的概率;②随机抽取手气红包金额在[)[]1,521,25⋃内的两名幸运者,设其手气金额分别为m ,n ,求事件“16m n ->”的概率.24.绿色已成为当今世界主题,绿色动力已成为时代的驱动力,绿色能源是未来新能源行业的主导.某汽车公司顺应时代潮流,最新研发了一款新能源汽车,并在出厂前对100辆汽车进行了单次最大续航里程(理论上是指新能源汽车所装载的燃料或电池所能够提供给车行驶的最远里程)的测试.现对测试数据进行分析,得到如图所示的频率分布直方图.(1)估计这100辆汽车的单次最大续航里程的平均值x (同一组中的数据用该组区间的中点值代表);(2)根据大量的汽车测试数据,可以认为这款汽车的单次最大续航里程X 近似地服从正态分布()2,N μσ,经计算第(1)问中样本标准差s 的近似值为50.用样本平均数x作为μ的近似值,用样本标准差s 作为σ的估计值;(ⅰ)现从该汽车公司最新研发的新能源汽车中任取一辆汽车,求它的单次最大续航里程恰好在200千米到350千米之间的概率;(ⅱ)从该汽车公司最新研发的新能源汽车中随机抽取10辆,设这10辆汽车中单次最大续航里程恰好在200千米到350千米之间的数量为Y ,求()E Y ;(3)某汽车销售公司为推广此款新能源汽车,现面向意向客户推出“玩游戏,送大奖”活动,客户可根据抛掷硬币的结果,操控微型遥控车在方格图上行进,若遥控车最终停在“胜利大本营”,则可获得购车优惠券.已知硬币出现正、反面的概率都是12,方格图上标有第0格、第1格、第2格、…、第50格.遥控车开始在第0格,客户每掷一次硬币,遥控车向前移动一次,若掷出正面,遥控车向前移动一格(从k 到1k +),若掷出反面,遥控车向前移动两格(从k 到2k +),直到遥控车移到第49格(胜利大本营)或第50格(失败大本营)时,游戏结束.设遥控车移到第n 格的概率为(1,2,,50)n P n = ,其中01P =,试说明{}1n n P P --是等比数列,并解释此方案能否成功吸引顾客购买该款新能源汽车.参考数据:若随机变量ξ服从正态分布()2,N μσ,则()0.6827P μσξμσ-<+≈ ,(22)0.9545P μσξμσ-<+≈ ,(33)0.9973P μσξμσ-<+≈ .25.某地处偏远山区的古镇约有人口5000人,为了响应国家号召,镇政府多项并举,鼓励青壮劳力外出务工的同时发展以旅游业为龙头的乡村特色经济,到2020年底一举脱贫.据不完全统计该镇约有20%的人外出务工.下图是根据2020年扶贫工作期间随机调查本地100名在外务工人员的年收入(单位:千元)数据绘制的频率分布直方图.(1)根据样本数据怙计该镇外出务工人员的创收总额(同一组中的数据用该组区间的中点值为代表);(2)假设该镇外出务工人员年收入服从正态分布()2,N μσ,其分布密度函数为22()2()x f x μσ--=,其中μ为样本平均值.若()f x 的最大值为10π,求σ的值;(3)完成脱贫任务后,古镇党政班子并不懈怠,决心带领全镇人民在奔小康道路上再上一个新台阶,出台了多项优惠政策,鼓励本地在外人员返乡创业.调查显示务工收入在[],2μσμσ++和[]2,3μσμσ++的人群愿意返乡创业的人数比例分别为15%和20%.从样本人群收入在[],3μσμσ++的人中随机抽取3人进行调查,设X 为愿意返乡创业的人数,求随机变量X 的分布列和数学期望.参考答案1.C 【分析】对于A :由频率分布直方图中所有小矩形面积之和为1,列出等式可求得a 的值,进而作出判断;对于B :先计算高于130分的频率,然后再用1减去于高于130分的频率即可得到低于130分的频率,进而作出判断;对于C :先计算[)80,120的频率和[)120130,的频率,再求出总体的中位数,进而作出判断;对于D :根据样本分布在[)90,100的频数一定与样本分布在[)100,110的频数相等,总体分布在[)90,100的频数不一定与总体分布在[)100,110的频数相等作出判断即可.【详解】由频率分布直方图得:()0.0050.0100.0100.0150.0250.005101a ++++++⨯=,解得0.030a =,故A 错误;样本数据低于130分的频率为:()10.0250.005100.7-⨯+=,故B 错误;[)80,120的频率为:()0.0050.0100.0100.015100.4+++⨯=,[)120130,的频率为:0.030100.3⨯=,∴总体的中位数(保留1位小数)估计为:0.50.412010123.30.3-+⨯≈分,故C 正确;样本分布在[)90,100的频数一定与样本分布在[)100,110的频数相等,总体分布在[)90,100的频数不一定与总体分布在[)100,110的频数相等,故D 错误.故选:C .【点睛】本题考查频率分布直方图的应用,考查逻辑思维能力和计算能力,属于基础题.2.B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解.由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =,所以学习时长在[)9,11的频率2520.5x n==,解得50n =.故选:B .【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.3.A 【分析】根据频率分布折线图计算该组数据的平均数为650.15750.4850.2950.25⨯+⨯+⨯+⨯.【详解】由折线图可知,该组数据的平均数为650.15750.4850.2950.2580.5⨯+⨯+⨯+⨯=.故选:A.【点睛】此题考查根据频率分布折线图求平均数,关键在于熟练掌握平均数的求解公式.4.D 【分析】根据频数分布表中的数据,对选项中的命题进行分析,判断正误,即可得到本题答案.【详解】甲同学的成绩的平均数1051201201301401235x ++++<=,乙同学的成绩的平均数1051151251351451255y ++++>=,所以A 错误;甲同学的成绩从第1次到第5次变化波动比乙同学的成绩的变化波动更小一些,所以甲同学的成绩的方差小于乙同学的成绩的方差,所以B 错误;甲同学的成绩的极差介于()30,40之间,乙同学的成绩的极差介于()35,45之间,所以甲同学的成绩的极差不一定小于乙同学的成绩的极差,所以C 错误;甲同学的成绩的中位数介于()115,120之间,乙同学的成绩的中位数介于()125,130之间,所以D 正确.故选:D本题主要考查频数直方图的相关问题,其中涉及中位数、平均数、方差、极差的求解. 5.B【详解】若①正确,则300400-对应的频率为0.45,则400500-对应的频率为0.15,则②错误;电子元件的平均寿命为1500.12500.153500.454500.155500.15⨯+⨯+⨯+⨯+⨯,则③正确;寿命超过400h的频率为0.150.150.3+=,则④正确,故不符合题意;若②正确,则300400-对应的频率为0.4,则①错误;电子元件的平均寿命为1500.12500.153500.44500.25500.15⨯+⨯+⨯+⨯+⨯,则③错误;寿命超过400h的频率为0.20.150.35+=,则④错误,故符合题意.故选:B.6.C【分析】设中位数为x,根据中位数左边的频数为50列等式可求得x的值.【详解】设中位数为x,前2组的频数之和为25,前3组的频数之和为65,由题意可得20025405050x-+⨯=,解得231.25x=.故选:C.7.A【分析】利用频率分布直方图计算平均数的方法求解即可.【详解】所给数据频率之和为(0.010.070.080.020.02)51++++⨯=则估计的平均值为5(12.50.0117.50.0722.50.0827.50.0232.50.02) 4.35521.75⨯+⨯+⨯+⨯+⨯=⨯=故选:A8.D 【分析】根据样本估计总体的知识依次判断各个选项即可得到结果.【详解】对于A ,设中位数为x ,则()()0.020.065250.080.5x +⨯+-⨯=,解得:26.25x =,即该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次,A 正确;对于B ,根据频率分布直方图知众数为:253027.52+=次,B 正确;对于C ,该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有16000.045320⨯⨯=人,C 正确;对于D ,该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有16000.025160⨯⨯=人,D 错误.故选:D.9.A 【分析】由统计图分别求出该月温度的中位数,众数,平均数,由此能求出结果.【详解】解:由统计图得:该月温度的中位数为565.52N +==,众数为5M =,平均数为1(233410566372829210) 5.9730P =⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯≈.∴M N P <<.故选:A .10.D 【分析】A .根据频率分布直方图中哪一组数据的频率除以组距的值最大进行分析;B .先分析60分以下对应的频率,再利用总体数量乘以所求频率即可得到结果;C .利用每组数据的组中值乘以对应频率并将每组计算结果相加即可得到结果;D .分析频率为0.5时对应的横坐标的值即为中位数.【详解】A .根据统计图可知:[)70,80对应的频率除以组距的值最大,即频率最大,所以人数最多,故正确;B .不及格的频率为:()0.0100.015100.25+⨯=,所以不及格的人数约为40000.25=1000⨯人,故正确;C .根据频率分布直方图可知平均数为:()450.01550.015650.02750.03850.015950.011070.5⨯+⨯+⨯+⨯+⨯+⨯⨯=,故正确;D .前三组的频率之和为:()0.01+0.0150.02100.450.5+⨯=<,前四组的频率之和为:()0.01+0.0150.020.03100.750.5++⨯=>,所以中位数在第四组数据中,且中位数为:0.50.45701071.70.0310-+⨯≈⨯,故错误;故选:D.11.D 【分析】利用频率分布直方图的性质直接求解.【详解】解:对于A ,90分以上为优秀,由频率分布直方图得优秀的频率为0.010100.1⨯=,∴从全体考生中随机抽取1000人,则其中得优秀考试生约有:10000.1100⨯=人,故A 正确;对于B ,由频率分布直方图得[40,50)的频率为0.01100.1⨯=,[50,100)的频率为:10.10.9-=,∴若要全省的合格考通过率达到96%,则合格分数线约为44分,故B 正确;对于C ,若同一组中数据用该组区间中间值作代表值,可得考试物理成绩的平均分约为:450.01010550.01510650.02010750.03010850.01510950.0101070.5⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=分,故C 正确;对于D ,[40,70)的频率为:(0.0100.0150.020)100.45++⨯=,[70,80)的频率为0.030100.3⨯=,∴该省考生物理成绩的中位数为:0.50.45701071.670.3-+⨯≈分,故D 错误.故选:D .【点睛】本题考查频数、合格分数线、平均数、中位数的求法,考查频率分布直方图的性质等基础知识,考查运算求解能力,属于基础题.12.65,65【分析】频率分布直方图中最高矩形的中点横坐标即为众数,利用平分矩形面积可得中位数.【详解】由题图可知众数为65,又∵第一个小矩形的面积为0.3,∴设中位数为60+x ,则0.3+x ×0.04=0.5,得x =5,∴中位数为60+5=65.故答案为:65,6513.四【分析】计算前几组的频率之和,判断频率为0.5在哪个区间即可判断中位数.【详解】根据频率分布直方图可知,前三组的频率之和为()0.03750.06250.07520.350.5++⨯=<,前四组的频率之和为()0.03750.06250.0750.120.550.5+++⨯=>,则可以判断中位数在第四组.故答案为:四.【点睛】本题考查根据频率分布直方图判断中位数所在区间,属于基础题.14.67.【分析】本题根据频率分布直方图直接求平均数即可.【详解】解:这次竞赛的平均成绩为:0.03055100.04065100.01575100.01085100.005951067⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=故答案为:67.【点睛】本题考查根据频率分布直方图求平均数,是基础题.15.0.016130【分析】利用频率分布直方图中所有矩形的面积之和为1可求得污染的数据;利用最高矩形底边的中点值可求得众数.【详解】设被污染的数据为a ,利用频率分布直方图中所有矩形的面积之和为1可得0.004100.02100.028100.03210101a ⨯+⨯+⨯+⨯+⨯=,解得0.016a =.由图可知,该班同学的成绩众数为130.故答案为:0.016,13016.4.7 4.75【分析】根据频率分布直方图,取最高矩形底边中点的横坐标即可求出众数,求出第三小组矩形的高,设中位数为x ,由()0.1250.175 4.5510.5x ++-⨯=,解方程即可求解.【详解】由图可知,众数为4.7,第五小组的频率为0.50.30.15⨯=从左至右五个小组的频率之比依次是5∶7∶12∶10∶6,可得第一小组的频率为50.150.1256⨯=,第二小组的频率为70.150.1250.1756⨯==,第三小组的频率为120.150.36⨯=,所以中位在第三小组,第三小组矩形面积为0.3,则第三小组的高为0.310.3=设中位数为x ,则()0.1250.175 4.5510.5x ++-⨯=,解得 4.75x =故答案为:4.7;4.75【点睛】本题考查了根据频率分布直方图求众数、中位数,考查了运算求解能力,属于基础题. 17.(1)填表见解析;作图见解析;(2)平均值为:1.08,答案见解析.【分析】(1)由样本数据,即可完善频率分布表中的数据,并画出频率直方图.(2)由(1)的频率直方图计算样本均值,进而描述汞含量分布规律.【详解】(1)由题设样本数据,则可得频率分布表如下,分组频数频率[)0,0.5031 10[)0.50,1.00101 3[)1.00,1.50122 5[)1.50,2.0042 15[)2.00,2.5011 30合计301(2)根据频率分布直方图估算平均值为:112210.250.75 1.25 1.75 2.25 1.0810351530⨯+⨯+⨯+⨯+⨯≈,分布规律:①该频率分布直方图呈中间高,两边低,大多数鱼身体中汞含量主要集中在区间[]0.5,1.5;②汞含量在区间[]1,1.5的鱼最多,汞含量在区间[]0.5,1的次之,在区间[]2,2.5的最少;③汞含量超过61.0010-⨯的数据所占比例较大,这说明这批鱼被人食用,对人体产生危害的可能性比较大.18.(1)作图见解析;中位数为4.3;(2)35.【分析】(1)设中位数为x ,则有()40.150.05x -⨯=,故可求中位数.(2)利用古典概型的概率公式可求概率.【详解】解:(1)第二组的频率为()120.150.0750.050.10.25-⨯+++=,故第二组小矩形的高为0.125频率分布直方图如图所示,由频率分布直方图可得,第一组和第二组的频率之和为0.20.250.450.5+=<,前三组的频率之和为0.20.250.30.750.5++=>,可知中位数在第三组,设中位数为x ,则有()40.150.50.450.05x -⨯=-=,解得134.33x =≈,所以该社区住户每周锻炼时间的中位数为4.3;。

第63讲 根据频率分布直方图求中位数众数和平均数-高中数学常见题型解法归纳反馈训练

第63讲 根据频率分布直方图求中位数众数和平均数-高中数学常见题型解法归纳反馈训练

【知识要点】一、用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计总体的数字特征),需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本容量越大,估计的结果也就越精确,分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.二、频率分布是指一个样本数据在各个小范围内所占比例的大小.一般是用频率分布直方图反映样本频率分布.三、样本的数字特征众数:就是数据中出现次数最多的那个,比其他的都多,如果几个数据出现的次数都是最多,则它们都是众数;每个数据都只有一次,那么数据没有众数.所以众数可以不止一个或者没有.中位数:就是这些数据排列好了以后中间的那个数字,那么如果有偶数个数据,那么就是中间两个数字的平均数,如果有奇数个数据,则中间那个就是数据的中位数.所以数据的中位数不一定在数据中.平均数:这个就是把所有数据相加,除以个数,就是数据的平均数. nx n++(n x x ++-(n x x ++-四、茎叶图茎叶图又称“枝叶图”,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少.当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出的叶子,因此通常把这样的图叫做茎叶图.【方法讲评】【例1】对某小区100户居民的月均用水量进行统计,得到样本的频率分布直方图如图,则估计此样本的众数、中位数分别为()A. 2.25,2.5 B.2.25,2.02 C.2,2.5 D.2.5,2.25【点评】(1)求频率分布图中的众数,一般先计算出频率分布直方图中的每个小矩形的面积,找到面积最大的那个矩形,取该矩形的横边中点对应的数为众数.(2)求众数也可以直接找最高矩形的横边的中点.【反馈检测1】某学校900名学生在一次百米测试中,成绩全部介于13秒与18秒之间,抽取其中50个样本,将测试结果按如下方式分成五组:第一组[13,14],第二组[14,15),…,第五组[17,18],如图是按上述分组方法得到的频率分布直方图.(1)若成绩小于14秒认为优秀,求该样本在这次百米测试中成绩优秀的人数;(2)请估计学校900名学生中,成绩属于第四组的人数;(3)请根据频率分布直方图,求样本数据的众数和中位数.【例2】高二某班50名学生在一次百米测试中,成绩全部都介于13秒到18秒之间,将测试结果按如下方式分成五组,第一组[13,14),第二组[14,15)…第五组[17,18],如图是按上述分组方法得到的频率分布直方图.(1)若成绩大于等于14秒且小于16秒规定为良好,求该班在这次百米测试中成绩为良好的人数. (2)请根据频率分布直方图,估计样本数据的众数和中位数(精确到0.01).(3)设n m ,表示该班两个学生的百米测试成绩,已知[)[]18,1714,13, ∈n m ,.6个基本事件组成.【点评】求频率分布直方图中的中位数,一般先计算出每个小矩形的面积,通过解方程找到左边面积为0.5的点P ,点P 对应的数就是中位数.【反馈检测2】某公路段在某一时刻内监测到的车速频率分布直方图如图所示. (Ⅰ)求纵坐标中参数h 的值及第三个小长方形的面积; (Ⅱ)求车速的众数1v ,中位数2v 的估计值;1122n n xx p x p x p 计算.的中点对应的数,n p 代表第n 个矩形的面积【例3】某校从参加考试的学生中抽出60名学生,将其成绩(均为整数)分成六组[40,50),[50,60)...[90,100]后画出如下部分频率分布直方图.观察图形的信息,回答下列问题: (Ⅰ)求成绩落在[70,80)上的频率,并补全这个频率分布直方图; (Ⅱ) 估计这次考试的及格率(60分及以上为及格)和平均分;(Ⅲ) 从成绩是70分以上(包括70分)的学生中选两人,求他们在同一分数段的概率.【解析】(Ⅰ)成绩落在[70,80)上的频率是0.3,频率分布直方图如下图.(Ⅲ) 成绩是70分以上(包括70分)的学生人数为(0.03+0.025+0.005)×10×60=36 所以所求的概率为【点评】求频率分布直方图中的平均数,1122n n x x p x p x p 计算.其中nx 代表第n 个矩形的横边的中点对应的数,n p 代表第n 个矩形的面积.【反馈检测3】某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100]. (1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[50,90)之外的人数.高中数学常见题型解法归纳及反馈检测第63讲: 根据频率分布直方图求中位数众数和平均数参考答案【反馈检测1答案】(1)3;(2)288;(3)15.5,15.74.【反馈检测2答案】(1)0.01h =,第三个小长方形的面积为65;(2)1265,62.5v v ==;(3【反馈检测2详细解析】(Ⅰ)∵所有小长形面积之和为1,∴10h +10×3h +10×4h +10×2h =1, 解得h =0.01, ∴第三个小长方形的面积为:10×4h =10×0.04=0.4. (Ⅱ)车速的众数1v =,车速的中位数是两边直方图的面积相等, 于是得:10×0.01+10×0.03+(2v ﹣60)×0.04=0.5,解得2v =62.5.×10×45+0.03×10×55+0.04×10×65+0.02×10×75=62. 【反馈检测3答案】(1)005.0=a ;(2)73;(3)10.【反馈检测3详细解析】(1)依题意得,()104.003.002.0210=+++a ,解得005.0=a(2)这100名学生语文成绩的平均分为:()分7305.0952.0853.0754.06505.055=⨯+⨯+⨯+⨯+⨯ (3)数学成绩在[50,60)的人数为:100×0.05=5数学成绩在[60,70[70,80数学成绩在[80,90所以数学成绩在[50,90)之外的人数为:102540205100=----。

北师大必修三数学 平均数、中位数、众数、极差、方差 标准差

 北师大必修三数学 平均数、中位数、众数、极差、方差 标准差

首页
上一页
下一页
末页
结束
数字特征与统计图表的综合问题 [典例] (1)为了普及环保知识,增强环保意识,某大学随机 抽取 30 名学生参加环保知识测试,得分(十分制)如图所示,假 设得分值的中位数为 me,众数为 mo,平均值为 x ,则( )
A.me=mo= x B.me=mo< x C.me<mo< x D.mo<me< x
x

2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10 30
≈5.97.
于是得 mo<me< x .
首页
上一页
下一页
末页
结束
(2)观察图形可得:样本 A 的数据均小于或等于 10,样本 B 的数据均大于或等于 10,故 x A< x B,又样本 B 的波动范围 较小,故 sA>sB.
()
A.平均数
B.极差
C.中位数
D.方差
解析:选 C 判断是不是能进入决赛,只要判断是不是前 8 名,
所以只要知道其他 15 位同学的成绩中是不是有 8 个高于他,
也就是把其他 15 位同学的成绩排列后看第 8 个的成绩即可,
小刘的成绩高于这个成绩就能进入决赛,低于这个成绩就不能
进入决赛,这个第 8 名的成绩就是这 15 位同学成绩的中位数.
1.平均数、中位数、众数
(1)平均数
如果有 n 个数 x1,x2,…,xn,那么 x =
x1+x2+…+xn n

叫作这 n 个数的平均数.
(2)中位数
把一组数据按从小到大的顺序排列,把处于 最中间位置的那个
数(或中间两数的平均数)称为这组数据的中位数.
(3)众数
一组数据中重复出现次数 最多的数称为这组数的众数,一组数

数据的统计 (标准差,众数、中位数、平均数)

数据的统计  (标准差,众数、中位数、平均数)

频率/组距
0.08 . . . . .
0.16
0.3 0.44 0.5 0.28 0.12 0.08 0.04 2.00
[2.5 , 3)
[3 , 3.5) [3.5 , 4) [4 , 4.5) 合计
.
. . . .
频率/组距
频率分布直方图
0.50 0.40
频率分布折线图
0.30
0.20 0.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
表2-1
3.1 2.5
100位居民的月均用水量 (单位 :t )
2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6
3.4
3.2 3.3 3.2 3.0
2.6
2.7 2.8 2.9 2.9
2.2
2.3 2.3 2.4 2.4
2.2 1.5 1.2 0.2 0.4 0.3 0.4
2.1 2.2 2.3 2.4 1.6 1.7 1.8 1.9 1.2 1.3 1.4 1.3 3.7 3.6 3.5 1.4 1.5 1.7 1.9 1.8 0.5 0.6 0.8 0.7 3.8 4.1 4.3 2.0
(二)、频率分布直方图中中位数的获得
中位数是样本数据所占频率的等分线,即在 样本中,有50%的个体小于或等于中位数,也有 50%的个体大于或等于中位数, 因此,在频率分布直方图中,中位数左边和 右边的直方图的面积应该相等,由此可以估 计中位数的值。
2、中位数是样本数据所占频率的等分线,即在样本中, 有50%的个体小于或等于中位数,也有50%的个体大于 或等于中位数,因此,在频率分布直方图中,中位数左 边和右边的直方图的面积应该相等,由此可以估计中位 数的值。

高中数学必修三 18-19 第1章 §4 4.1 平均数、中位数、众数、极差、方差 4.2 标准差

高中数学必修三 18-19 第1章 §4 4.1 平均数、中位数、众数、极差、方差  4.2 标准差


(6)样本的标准差和方差都是正数.( )
返 首 页
[解析] (1)×,根据平均数的定义可知错误.


主 预
(2)×,根据众数定义知众数可以一个,也可以多个.
堂 达



(3)×,由中位数的定义可知错误.



新 知
(4)√,极差与标准差都反映了样本数据的波动性和离散程度.
双 基
(5)×,平均数与数据的波动性无关.
究 •
(4)算出(3)中 n 个平方数的平均数,即为样本方差.

重 难
(5)算出(4)中方差的算术平方根,即为样本标准差.
课 时 分 层 作 业
返 首 页






习 •
2.标准差(方差)的两个作用:
标 •



(1)标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的 双


离散程度越小.
达 标



A.茎叶图
B.频率分布直方图




C.频率折线图
D.频率分布表



探 究
B [当收集到的数据量很大时,一般用频率分布直方图.]

重 难
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
课 时 分 层 作 业
返 首 页
[解] (1) x 甲=16(99+100+98+100+100+103)=100,
自 主
x 乙=16(99+100+102+99+100+100)=100.

新教材高中数学第六章统计4用样本估计总体数字特征4-1样本的数字特征4-2分层随机抽样的均值与方差4

新教材高中数学第六章统计4用样本估计总体数字特征4-1样本的数字特征4-2分层随机抽样的均值与方差4

2.计算一组n个数据的p分位数的一般步骤如下:
第一步,按照从小到大排列原始数据;
第二步,计算i=np;
第三步,若i不是整数,大于i的最小整数为j,则p分位数为第j项数据;若i是整
数,则p分位数为第i项与第(i+1)项数据的平均数.
过关自诊
1.判断正误.(正确的画√,错误的画×)
(1)50%分位数就是中位数.( √ )
i=1
2.分层随机抽样的方差
设样本中不同层的平均数分别为x1 , x2 ,…,xn ,方差分别为s12 , s22 ,…,sn2 ,相应的
n
权重分别为 w1,w2,…,wn,则这个样本的方差为 s2= ∑ wi[si2 +(xi − x)2],其中x为
i=1
这个样本的平均数.
过关自诊
1.判断正误.(正确的画√,错误的画×)
第六章
4.1 样本的数字特征
4.2 分层随机抽样的均值与方差
4.3 百分位数
课标要求
1.会求样本的平均数、中位数、众数、百分位数.
2.会求样本的极差、标准差与方差.
3.通过应用相关知识解决实际统计问题,培养数据分析的核心素养.




01
基础落实•必备知识全过关
02
重难探究•能力素养全提升
03
Байду номын сангаас
学以致用•随堂检测全达标
5
5
5
=
42
.
5
2
2
2
2
2
2
2 1
又甲 =[(10-8) +(9-8) +(8-8) +(7-8) +(8-8) +(6-8) ]×6

众数、中位数、平均数与频率分布直方图关系

众数、中位数、平均数与频率分布直方图关系

20
30
80
40
30
(1)列出频率分布表;
(2)画出频率分布直方图; (3)估计电子元件寿命在100h~400h以内的概率; (4)估计电子元件寿命在400h以上的概率; (5)估计总体的数学期望.
寿命 100~200 200~300 300~400 400~500 500~600
合计
频率/组距
总体分布的估计
练习.(广东11变式题1)为了调查某厂工人生产 某种产品的能力,随机抽查 了20位工人某天生
产该产品的数量.产品数量的分组区间为 45,55,
5 5 ,6 5 ,6 5 ,7 5 ,7 5 ,8 5 ,85,95 由此得到频率
分布直方图如图3,则这20名工人中一天生产
该产品 数量在
的中位 数.
3、平均数是频率分布直方图的“重心”.
用样本数字特征估计总体数字特征
众数、中位数、平均数与频率分布直方 图的关系
一 众数、中位数、平均数的概念
众数、中位数、平均数都是描述一组 数据的集中趋势的特征数,只是描述的角 度不同,其中以平均数的应用最为广泛.
众数:在一组数据中,出现次数最多 的数据叫做这组数据的众数.
中位数:将一组数据按大小依次排列, 把处在最中间位置的一个数据(或最中 间两个数据的平均数)叫做这组数据的 中位数.
解:平均数是6,方差是8,标准差是 2 2 .
如果求 2a1 、 2a2、 2a3的平均数、方差、 标准差?已知ai的平均数X、方差Y、标准差Z, 则b+kai的平均数
是b+kx, 方差是k的平方与Y的乘积,标准差是k与Z的乘积。
(当然Y=Z的平方!)
总结
众数、中位数、平均数与频率分布直方图的关系:

众数,中位数,平均数,标准差

众数,中位数,平均数,标准差
平均数与中位数相等,是必然还是巧合?
巧合 频率 组距
分组 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5]
频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02
0.50 0.40 0.30 0.20 0.10

众数、中位数、平均数的简单应用
例1 某工厂人员及工资构成如下:
人员 周工资 人数 合计 经理 2200 1 2200 管理人员 250 6 1500 高级技工 220 5 1100 工人 200 10 2000 学徒 合计 100 1 23 100 6900
(1)指出这个问题中周工资的众数、中 位数、平均数 (2)这个问题中,工资的平均数能客观 地反映该厂的工资水平吗?为什么?
? 16
找到啦!有区别了!
上述各偏差的平方和的大小还与什么有关?
——与射击次数有关!
所以要进一步用各偏差平方的平均数来衡量数据的稳定性
设一组数据x1、x2、…、xn中,各数据与它们的平均 数的差的平方分别是(x1-x)2、(x2-x)2 、… (xn-x)2 , 那么我们用它们的平均数,即用
S2=
分析:众数为200,中位数为220,
平均数为300。 因平均数为300,由表格中所列出的数据 可见,只有经理在平均数以上,其余的人 都在平均数以下,故用平均数不能客观真 实地反映该工厂的工资水平。
教练的烦恼
甲,乙两名射击手的测试成绩统计如下:
第一次 第二次 第三次 第四次 第五次
甲命中环数 乙命中环数
O
0.5
1
1.5

2

2.2.2标准差

2.2.2标准差

解:(1)计算得x甲=7,x乙=7;
s甲=1.73,s乙=1.10. (2)由(1)知,甲、乙两人平均成绩相 等,但s乙<s甲,这表明乙的成绩比甲的成 绩稳定一些,从成绩的稳定性考虑,可以 选乙参赛。
(3)标准差和频率直方图的关系
从标准差的定义可知,如果样本各数 据都相等,则标准差得0,这表明数据没 有波动幅度,数据没有离散性;若个体 的值与平均数的差的绝对值较大,则标 准差也较大,表明数据的波动幅度也很 大,数据的离散程度很高,因此标准差 描述了数据对平均数的离散程度。
4 5 6 7 8 9 10 环数
甲的成绩比较分散,极差较大,乙的 成绩相对集中,比较稳定.
标准差
样本的众数、中位数和平均数常用来表示 样本数据的“中心值”,其中众数和中位数容 易计算,不受少数几个极端值的影响,但只能 表达样本数据中的少量信息. 平均数代表了数据 更多的信息,但受样本中每个数据的影响,越 极端的数据对平均数的影响也越大.当样本数据 质量比较差时,使用众数、中位数或平均数描 述数据的中心位置,可能与实际情况产生较大 的误差,难以反映样本数据的实际状况,因此, 我们需要一个统计数字刻画样本数据的离散程 度.
285×25%+315×16%+345×7%+375×2%=2
67.9≈268(天)
这些组中值的方差为
[1×(165-268)2+11×(195-268)2+18×(225- 268)2+20×(255-268)2+25×(285-268)2+16× (315-268)2+7×(345-268)2+2×(375-268)2] ÷100=2128.60(天2).
复习
如何根据样本频率分布直方图,分别估 计总体的众数、中位数和平均数?

频率分布直方图问题分类解析

频率分布直方图问题分类解析

频率分布直方图问题分类解析作者:徐惠陈开懋来源:《高中生学习·高二版》2015年第10期频率分布直方图是高中概率统计部分的重要内容,在各省市高考中,几乎每年都考,频率分布直方图问题考查方式多样,一般有“求样本中限制条件下的个体数目或所占频率”、“填充频率分布直方图”、“求频率分布直方图中的参数”、“由频率分布直方图,求平均数、中位数、众数、方差、标准差”等几类考法.本文根据高中数学课程标准、高考考纲和最近几年的高考试题,对有关频率分布直方图的常见问题及解题规律方法进行一个小结,希望对读者有所帮助.例1 某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[[0.3, 0.9]]内,其频率分布直方图如图所示.(1)直方图中的[a=]_________;(2)在这些购物者中,消费金额在区间[[0.5, 0.9]]内的购物者的人数为_________.解析(1)由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解之得[a=3].(2)消费金额在区间[[0.5, 0.9]]内频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[[0.5, 0.9]]内的购物者的人数为:0.6×10000=6000.点拨本题以实际问题为背景,考查频率分布直方图,重点考查了以下三类问题:求频率分布直方图中的参数(例如某长方形的高);求某一范围内的频率;求某一范围内的样本容量.对于第一类问题,根据频率之和等于1,即频率分布直方图中各小矩形的面积之和等于1,即可解决.对于第二类问题,只需要弄清频率分布直方图中,纵轴是频率/组距,各小矩形的面积表示每一组距范围内的频率.对于第三类问题,某一范围内的样本容量=样本容量×某一范围内的频率.例2 某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为[40,50),[50,60),…,[80,90),[90,100].(1)求频率分布图中[a]的值;(2)估计该企业的职工对该部门评分不低于80的概率;(3)从评分在[[40,60)]的受访职工中,随机抽取2人,求此2人评分都在[[40,50]]的概率.[0.028][0.022][0.018][0.004][a][40][50][60][70][80][90][100][O][分数]解析(1)因为(0.004+a+0.0018+0.022×2+0.028)×10=1,所以[a=0.006].(2)由所给频率分布直方图知,50名受访职工评分不低于80的频率为(0.022+0.018)×10=0.4,所以该企业职工对该部门评分不低于80的概率的估计值为[0.4].(3)受访职工评分在[50,60)的有:50×0.006×10=3(人),即为[A1,A2,A3];受访职工评分在[40,50)的有: 50×0.004×40=2(人),即为[B1,B2]. 从这5名受访职工中随机抽取2人,所有可能的结果共有10种,它们是[A1,A2,A1,A3,][A1,B1,A1,B2,][A2,A31,][A2,B1,][A2,B2,][A3,B1,A3,B2,B1,B2,]又因为所抽取2人的评分都在[40,50)的结果有1种,即[B1,B2],故所求的概率为[P=110].点拨本题仍以实际问题为背景,考查频率分布直方图,重点考查了以下三类问题:求频率分布直方图中的参数(例如某长方形的高);求某一范围内的概率;与古典概型相结合求概率.对于第一类问题,仿例1即可解决;对于第二类问题,应弄清频率和概率的关系:频率是概率的估计值,求概率是用频率代替的,再利用求频率的方法即可;对于第三类问题,应先仿例1求某一范围内的频率,进而求出该范围内的样本容量;最后根据古典概型概率计算公式可求概率.点拨本题还是以实际问题为背景,考查频率分布直方图,重点考查了以下三类问题:求频率分布直方图中的参数(例如某长方形的高);利用频率分布直方图估算样本的数字特征(众数、中位数、平均数、标准差、方差);与随机抽样相结合求某一范围内的样本容量.对于第一类问题,仿例1即可解决.对于第二类问题,在频率分布直方图中,样本数字特征的估算方法分别是:众数是最高矩形的横坐标中点,中位数左边和右边的直方图的面积相等,平均数是频率分布直方图的重心,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点横坐标之和,方差估算公式是[s2=]第1个小矩形面积×[(x1中-x均值)2]+第2个小矩形面积×[(x2中-x均值)2]+…,其中,[x1中,x2中,…],表示第一个小矩形底边中点横坐标,第二个小矩形底边中点横坐标,…,标准差估算公式是[s=s2].对于第三类问题,应先仿例1求某一范围内的频率,进而求出该范围内的样本容量,再根据分层抽样知识计算出抽样比,最后可得某一范围内应抽取的样本容量.例4 从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(2)估计这种产品质量指标值的平均值及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解析(1)频率分布直方图如下:所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.8=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.点拨本题依旧以实际问题为背景,考查频率分布直方图,重点考查了以下三类问题:画频率分布直方图;利用频率分布直方图估算样本的数字特征(众数、中位数、平均数、标准差、方差);求某一范围内的频率.对于第一类问题,画频率分布直方图应注意横、纵坐标的意义,横坐标表示组距,纵坐标表示频率/组距.对于第二类问题,在频率分布直方图中,样本数字特征的估算方法见例3.对于第三类问题,仿例1.[练习]1. 20名学生某次数学考试成绩(单位:分)的频率分布直方图如图所示.(1)求频率分布直方图中a的值;(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率.2. 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图(如图所示).(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)。

【优创课件】9.2.1总体取值规律的估计(人教A版2019 必修第二册)

【优创课件】9.2.1总体取值规律的估计(人教A版2019 必修第二册)
【思考】除了频率分布直方图,初中我们还学习了哪些图表呢? 【提示】 还学习了条形图、扇形图、折线图、频数分布直方图等.
(二)总体取值规律的估计
知识点二 其它统计图表 统计图表
扇形图
主要应用
直观描述各类数据占总数的比 例
条形图和直方图
直观描述不同类别或分组数据 的频数和频率
折线图
描述数据随时间的变化趋势
【问题】你能很容易地看出这些数据有什么规律吗?若不能,对这 些数据如何处理才可以?
【提示】不能.应对这些数据进行整理,用统计图表表示出来才容易看出其规律.
(二)总体取值规律的估计
知识点一 画频率分布直方图的步骤
(1)求极差:极差是一组数据中 最大值 与 最小值 的差;
(2)决定组距与组数:当样本容量不超过100时,常分成 5~12
【解析】(1)频率分布直方图是以面积的形式反映了数据落在各小组
内的频率大小的,因此第二小组的频率为
4
=0.08.
2+4+17+15++3
又因为第二小组的频率=样频本数容量,
所以样本容量=01.028=150. (2)由频率分布直方图可估计该校高一年级学生的达标率为
2+147++1175++195++39+3×100%=88%.
解 次数在130以上(含130次)的学生人数为:2+4+197++315+9+3×150=36.
【类题通法】由频率分布直方图进行相关计算时,需掌握下列关系式: (1)频组率距×组距=频率. (2)样频本数容量=频率,此关系式的变形为:样本容量×频率=频数.

众数、中位数、平均数标准差、方差

众数、中位数、平均数标准差、方差

连接频率分布直方图中各小长方形上端的中点, 得到频率分布折线图
总体密度曲线反映了总体在各个范围内取值的 百分比,精确地反映了总体的分布规律。是研究总 体分布的工具.
画茎叶图的步骤:
(1)将每个数据分为茎(高位)和叶(低位)两部分;
(2)将最小茎和最大茎之间的数按大小次序排成一列, 写在一侧; (3)将各个数据的叶按大小次序写在其茎的另一侧.
8 8 9 9 9 9 2 9 3 9 2 9 1 6 4 4 9 ,0 1 解析 当x8 ≥4 时9 8, 9 9 2 9 3 9 7 2 9 1 x 90 7
∴x<4,则
7
=91,∴x=1.
11.下图是某市有关部门根据该市干部的月收入情 况,作抽样调查后画出的样本频率分布直方图, 已知图中第一组的频数为4 000,请根据该图提供 的信息解答下列问题:(图中每组包括左端点, 不包 括右端点,如第一组表示收入在[1 000,1 500))
0.000 4
三种数字特征的优缺点
1、众数体现了样本数据的最大集中点,但它对其它 数据信息的忽视使得无法客观地反映总体特征.
2、中位数它不受少数几个极端值的影响,这在某些 情况下是优点,但它对极端值的不敏感有时也会成为 缺点。
3、由于平均数与每一个样本的数据有关,所以任何 一个样本数据的改变都会引起平均数的改变,这是众 数、中位数都不具有的性质。也正因如此 ,与众数、 中位数比较起来,平均数可以反映出更多的关于样本 数据全体的信息,但平均数受数据中的极端值的影响 较大,使平均数在估计时可靠性降低。
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你应当如何对这次射击作出评价?
如果看两人本次射击的平均成绩,由于x甲7,x乙7

平均数、中位数、众数与方差

平均数、中位数、众数与方差

平均数、中位数、众数与方差2卢老师家教内部资料平均数、中位数、众数与方差 姓名【基本概念】1.总体:在统计学里,所要考察对象的______,叫做总体。

2.个体:总体中的每一个考察对象叫做_______.3.样本:从_____中所抽取的________个体,叫做总体的一个样本。

4.样本容量:样本中个体的______叫做样本容量(样本容量没有______).5.平均数:样本中所有个体的平均数叫做样本_______.设一组数据123,,,,nx x x x 的平均数为x ,(1)一般平均数:x =_________________________;(2)加权平均数:在n 个数据中,1x 出现1f 次,2x 出现2f 次,…,k x 出现k f 次(1f +2f +…kf =n ),则x =___________________; (3)简化计算公式:x x a '=+,其中x '是12,,nx x x '''的平均数,(1,2,,),i ix x a i n a '=-=为接近样本平均数的较“整”的常数,在数据较大且在平均数左右波动时,用平均数简化计算公式较为简便。

6.众数:在一组数据中,出现次数______的数据叫做这组数据的众数,众数可能不止一个。

7.中位数:将一组数据按_________排列,把处在最中间位置的一个数据(或最中间的两个数据的________)叫做这组数据的中位数(中位数可能不是这组数据中的任何一个)。

例 1.为了了解某校初三年级学生的身高状况,从中抽查了50名学生的身高。

在这个问题中,下列说法正确的是()A.300名学生是总体B.300是众数C.50名是学生抽取的一个样本D.样本容量是50例2.将一组数据中的所有数都加2,则所得到的一组新数据的平均数与原来那组数据相比( ) A.扩大2倍B.增加2 C.数值不变D.增加2倍例3.要了解某市初中毕业会考的数学成绩情况,从中抽查了1000名学生的数学成绩,样本是指()(A)此城市所有参加毕业会考的学生(B)此城市所有参加毕业会考的学生的数学成绩(C)被抽查的1 000名学生(D)被抽查345叫做这组数据(或样本)的标准差,记作_____。

新人教版高中数学必修2课件:9.2.3 总体集中趋势的估计 9.2.4 总体离散程度的估计

新人教版高中数学必修2课件:9.2.3 总体集中趋势的估计 9.2.4 总体离散程度的估计
据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数.
变式训练1从某中学高三年级甲、乙两个班各选出7名学生参加数学竞赛,
他们取得的成绩(满分100分)如下,成绩已按大小排序:
甲:79 78 80
x 85
92
96
乙:72 81 81
y 91
91
96
其中甲班学生成绩的平均分和乙班学生成绩的中位数都是85,则x+y的值
的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边
的直方图的面积应该相等.
微练习
AQI是表示空气质量的指数,AQI指数值越小,表明空气质量越好,当AQI指
数值不大于100时称空气质量为“优良”.如图是某地4月1日到12日AQI指数
值的统计数据,图中点A表示4月1日的AQI指数值为201,则下列叙述不正确
95 + 104
AQI指数值的中位数是
=99.5,故C不正确;从4日到9日,AQI指数值
2
越来越小,表示空气质量越来越好,故D正确.故选C.
知识点三、方差、标准差
1.假设一组数据是 x1,x2,…,xn,用x表示这组数据的平均数.我们用每个数据与
平均数的差的绝对值作为“距离”,即|xi-x|(i=1,2,…,n)作为 xi 到x的“距离”.可
差去估计总体标准差.在随机抽样中,样本标准差依赖于样本的选取,具有
随机性.
微练习
在教学调查中,甲、乙、丙三个班的数学测试成
绩分布如图①,②,③,假设三个班的平均分都是
75分,s1,s2,s3分别表示甲、乙、丙三个班数学测
试成绩的标准差,则有(
)
A.s3>s1>s2
B.s2>s1>s3

中位数平均数众数方差

中位数平均数众数方差

A.304.6 B.303.6 C.302.6 D.
解析:
=303.6.
答案:B
3.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差 为( )
分数
5
4
3
2
1
人数
20
10
30
30
10
A.
B.
C.3
D.
解析:由标准差公式计算可得.
答案:B
4.( ·湖北卷)如图是样本容量为200的频率 分布直方图. 根据样本的频率分布直方图估计, 样本数据落在[6,10)内的频数为________, 数据落在[2,10)内的概率约为________. 解析:200××4=64;(0.02+0.08)×4=0.4. 答案:64
C.丙地:中位体数为方2,差众是数为反3映总体的波动情况的一个量,二者反映的角度不同,不可相
A.甲地:总体均值为3,中位数为4
(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;
A.甲地:总体互均值比为较3,,中位但数有为4些问题在总体期望值差距不大时,可考虑用总体方差进一
根据样本的频率分布直方图估计,
4.众数、中位数、平均数
(1)在一组数据中,出现次数 较多 的数据叫做这组数据的众数.
(2)将一组数据按大小依次排列,把处在中间 位置的一个数据(或中间两个数据的平
均数)叫做这组数据的中位数.
(3)如果有n个数x1,x2,…,xn,那么 5.标准差和方差
叫做这n个数的平均数.
(1)标准差是样本数据到平均数的一种 平均距离 .
思维点拨:已知一组数据x1,x2,…,xn,其平均数为 ,方差为
平均数、中位数、众数描述其集中趋势,方差和标准
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档