_众数,中位数,平均数与频率分布直方图

合集下载

_众数,中位数,平均数与频率分布直方图 ppt课件

_众数,中位数,平均数与频率分布直方图 ppt课件
2.02t.
2020/12/27
8
频率分布直方图如下:
频率 组距
中位数
0.50 0.40 0.30 0.20 0.10
2020/12/27
0.5
1 1.5 2 2.5 3
3.5 4
月均用水量 /t
4.5
9
说明:
2.02这个中位数的估计值,与样本 的中位数值2.0不一样,这是因为样本数 据的频率分布直方图,只是直观地表明 分布的形状,但是从直方图本身得不出 原始的数据内容,所以由频率分布直方 图得到的中位数估计值往往与样本的 实际中位数值不一致.
2020/12/27
10
3、平均数是频率分布直方图的“重 心”.
是直方图的平衡点. n 个样本数据的平均 数的估计值等于频率分布直方图中每个 小矩形的面积乘以小矩形底边中点的横 坐标之和。 给出.下图显示了居民月均用水量的平 均数: x=2.02
2020/12/27
11
频率分布直方图如下:
频率 组距
例 某工厂人员及工资构成如下:
人员
经理 管理人员 高级技工 工人 学徒 合计
周工资 2200 250
220
200 100
人数
16
5
10 1 23
合计
2200 1500
1100
2000 100 6900
(1)指出这个问题中周工资的众数、中
位数、平均数 (2)这个问题中,工资的平均数能客观
2地020/1反2/27 映该厂的工资水平吗?为什么?
14
3、由于平均数与每一个样本的
数据有关,所以任何一个样本数据的
改变都会引起平均数的改变,这是众
数、中位数都不具有的性质。也正因

利用频率直方图求中位数、众数、平均数-高考数学微专题突破含详解

利用频率直方图求中位数、众数、平均数-高考数学微专题突破含详解

高考数学微专题突破利用频率分布直方图求中位数、平均数、总数一、单选题1.某校为了解高二年级学生某次数学考试成绩的分布情况,从该年级的1120名学生中随机抽取了100名学生的数学成绩,发现都在[]80,150内现将这100名学生的成绩按照[)8090,,[)90100,,[)100110,,[)110120,,[)120130,,[)130140,,[]140150,分组后,得到的频率分布直方图如图所示,则下列说法正确的是()A .频率分布直方图中a 的值为0.040B .样本数据低于130分的频率为0.3C .总体的中位数(保留1位小数)估计为123.3分D .总体分布在[)90100,的频数一定与总体分布在[)100110,的频数相等2.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n 个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已知学习时长在[)9,11的学生人数为25,则n 的值为()A .40B .50C .80D .1003.某地工商局对辖区内100家饭店进行卫生检查并评分,分为甲、乙、丙、丁四个等级,其中分数在[)60,70,[)70,80,[)80,90,[]90,100内的等级分别为:丁、丙、乙、甲,对饭店评分后,得到频率分布折线图,如图所示,估计这些饭店得分的平均数是()A .80.5B .80.6C .80.7D .80.84.下面是甲、乙两位同学高三上学期的5次联考数学成绩,现在只知其从第1次到第5次分数所在区间段分布的条形图(从左至右依次为第1至第5次),则从图中可以读出一定正确的信息是()A .甲同学的成绩的平均数大于乙同学的成绩的平均数B .甲同学的成绩的方差大于乙同学的成绩的方差C .甲同学的成绩的极差小于乙同学的成绩的极差D.甲同学的成绩的中位数小于乙同学的成绩的中位数5.下面是追踪调查200个某种电子元件寿命(单位:h)频率分布直方图,如图:其中300-400、400-500两组数据丢失,下面四个说法中有且只有一个与原数据相符,这个说法是①寿命在300-400的频数是90;②寿命在400-500的矩形的面积是0.2;③用频率分布直方图估计电子元件的平均寿命为:⨯+⨯+⨯+⨯+⨯1500.12500.153500.454500.155500.15④寿命超过400h的频率为0.3A.①B.②C.③D.④6.为了解某电子产品的使用寿命,从中随机抽取了100件产品进行测试,得到图示统计图.依据统计图,估计这100件产品使用寿命的中位数为()A.218.25B.232.5C.231.25D.241.25 7.为了让学生了解社会,拓宽视野,丰富知识,提高社会实践能力和综合素质,哈三中团委组织学生参加了抽测一批棉花的纤维长度(单位:cm)的社会实践活动.利用所学习的数学知识,同学们作出了样本的频率分布直方图.现在,由于原始数据不全,只能通过直方图来估计这一批棉花的纤维长度的平均值(同一组数据用这组数据所在区间的中点的值代替).则估计的平均值为()A.21.75B.22.25C.23.75D.20.75 8.为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是()A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有32人9.某地气象局把当地某月(共30天)每一天的最低气温作了统计,并绘制了如下图所示的统计图.记这组数据的众数为M,中位数为N,平均数为P,则()A .M N P <<B .N M P <<C .P M N <=D .P N M<<10.在某次高中学科竞赛中,4000名考生的参赛成绩按[)40,50,[)50,60,[)60,70,[)70,80,[)80,90,[)90,100分成六组,其频率分布直方图如图所示,则下列说法中错误的是().A .成绩在[)70,80内的考生人数最多B .不及格(60分以下)的考生人数约为1000人C .考生竞赛成绩平均分的估计值为70.5分D .考生竞赛成绩中位数的估计值为75分11.在2019年某省普通高中学业水平考试(合格考)中,对全省所有考生的物成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[)40,50,[)50,60,[)60,70,[)80,90,[]90,100,90分以上为优秀,则下列说法中不正确的是()A .从全体考生中随机抽取1000人,则其中得优秀考试约有100人B .若要全省的合格考通过率达到96%,则合格分数线约为44分C .若同一组中数据用该组区间中间值作代表值,可得考试物理成绩的平均分约为70D .该省考生物理成绩的中位数为75分第II 卷(非选择题)请点击修改第II 卷的文字说明二、填空题12.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.则估计高一参赛学生的成绩的众数、中位数分别为____________.13.某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:g )绘制的频率分布直方图,样本数据分为8组,分别为[)80,82,[)82,84,[)84,86,[)86,88,[)88,90,[)90,92,[)92,94,[]94,96,则样本的中位数在第______组14.某中学举行了一场音乐知识竞赛,将参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图.根据频率分布直方图,同一组数据用该区间的中点值代替,估计这次竞赛的平均成绩为______分.三、双空题15.根据高二某班50名同学的数学成绩,绘制频率分布直方图如图所示,虽不小心将其中一个数据污染了,但依然可以推断这个被污染的数据为_________,该班同学的成绩众数为_________.16.中小学生的视力状况受到社会的广泛关注,某市有关部门从全市6万名高一学生中随机抽取了400名,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示.从左至右五个小组的频率之比依次是5∶7∶12∶10∶6,则这400名学生视力的众数为________,中位数为________.四、解答题17.有一种鱼的身体吸收汞,一定量身体中汞的含量超过其体重的61.0010-⨯的鱼被人食用后,就会对人体产生危害.某海鲜市场进口了一批这种鱼,质监部门对这种鱼进行抽样检测,在30条鱼的样本中发现的汞含量(乘以百万分之一)如下:0.070.340.950.98 1.020.98 1.37 1.400.39 1.021.44 1.580.54 1.080.710.70 1.20 1.24 1.62 1.681.85 1.300.810.820.84 1.39 1.262.200.91 1.31(1)完成下面频率分布表,并画出频率分布直方图;频率分布表:分组频数频率[)0,0.50[) 0.50,1.001 3[) 1.00,1.50[) 1.50,2.002 15[)2.00,2.5011 30合计301频率分布直方图:(2)根据频率分布直方图估算样本数据的平均值(保留小数点后两位,同一组中的数据用该组区间中点值代表),并根据频率分布直方图描述这批鱼身体中汞含量的分布规律.18.经历过疫情,人们愈发懂得了健康的重要性,越来越多的人们加入了体育锻炼中,全民健身,利国利民,功在当代,利在千秋.一调研员在社区进行住户每周锻炼时间的调查,随机抽取了300人,并对这300人每周锻炼的时间(单位:小时)进行分组,绘制成了如图所示的频率分布直方图:(1)补全频率分布直方图,并估算该社区住户每周锻炼时间的中位数(精确到0.1);(2)若每周锻炼时间超过6小时就称为运动卫士,超过8小时就称为运动达人.现利用分层抽样的方法从运动卫士中抽取5人,再从这5人中抽取2人做进一步调查,求抽到的2人中恰有1人为运动达人的概率.19.经历过疫情,人们愈发懂得了健康的重要性,越来越多的人们加入了体育锻炼中,全民健身,利国利民,功在当代,利在千秋.一调研员在社区进行住户每周锻炼时间的调查,随机抽取了300人,并对这300人每周锻炼的时间(单位:小时)进行分组,绘制成了如图所示的频率分布直方图:(1)补全频率分布直方图,并估算该社区住户每周锻炼时间的中位数(精确到0.1);(2)若每周锻炼时间超过6小时就称为运动卫士,超过8小时就称为运动达人.现利用分层抽样的方法从运动卫士中抽取10人,再从这10人中抽取3人做进一步调查,设抽到的人中运动达人的人数为X ,求随机变量X 的分布列及期望.20.某贫困地区经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入、实现2020年脱贫的工作计划,该地扶贫办统计了2019年50位农民的年收入并制成如图频率分布直方图:(1)根据频率分布直方图,估计这50位农民的平均年收入x (单位:千元,同一组数据用该组数据区间的中点值表示);(2)为推进精准扶贫,某企业开设电商平台,让越来越多的农村偏远地区的农户通过经营网络商城脱贫致富.甲计划在A 店,乙计划在B 店同时参加一个订单“秒杀”抢购活动,其中每个订单由()*2,n n n N ≥∈个商品W 构成,假定甲、乙两人在A 、B 两店订单“秒杀”成功的概率分别为p 、q ,记甲、乙两人抢购成功的订单总数量、商品W 总数量分别为X 、Y .①求X 的分布列及数学期望()E X ;②若27sin4n p n n ππ=-,sin4n q nπ=,求当Y 的数学期望()E Y 取最大值时正整数n 的值.21.某地处偏远山区的古镇约有人口5000人,为了响应国家号召,镇政府多项并举,鼓励青壮劳力外出务工的同时发展以旅游业为龙头的乡村特色经济,到2020年底一举脱贫.据不完全统计该镇约有20%的人外出务工,下图是根据2020年扶贫工作期间随机调查本地100名在外务工人员的年收入(单位:千元)数据绘制的频率分布直方图.(1)根据样本数据估计该镇外出务工人员的创收总额(同一组中的数据用该组区间的中点值为代表);(2)完成脱贫任务后,古镇党政班子并不懈怠,决心带领全镇人民在奔小康道路上再上一个新台阶,出台了多项优惠政策,鼓励本地在外人员返乡创业,调查显示年收入在35千元(含35千元)以上的人中有60%的人愿意返乡投资创业,年收入在35千元以下的人中有40%的人愿意返乡投资创业,请从样本数据中完成下面的22⨯列联表,并判断能否在犯错误的概率不超过0.1的前提下认为“是否愿意返乡投资创业和年收入有关”.35千元(含35千元)以上35千元以下愿意返乡投资创业不愿意返乡投资创业附:()()()()()22n ad bc X a b c d a c b d -=++++,()20P X k ≥0.100.050.0250.0100k 2.7063.8415.0246.63522.某市为大力推进生态文明建设,把生态文明建设融入市政建设,打造了大型植物园旅游景区.为了了解游客对景区的满意度,市旅游部门随机对景区的100名游客进行问卷调查(满分100分),这100名游客的评分分别落在区间[)50,60,[)60,70,[)70,80,[)80,90,[]90,100内,且游客之间的评分情况相互独立,得到统计结果如频率分布直方图所示.(1)求这100名游客评分的平均值(同一区间的数据用该区间数据的中点值为代表);(2)视频率为概率,规定评分不低于80分为满意,低于80分为不满意,记游客不满意的概率为p .(ⅰ)若从游客中随机抽取m 人,记这m 人对景区都不满意的概率为m a ,求数列{}m a 的前4项和;(ⅱ)为了提高游客的满意度,市旅游部门对景区设施进行了改进,游客人数明显增多,对游客进行了继续旅游的意愿调查,若不再去旅游记1分,继续去旅游记2分,每位游客有继续旅游意愿的概率均为p ,且这次调查得分恰为n 分的概率为n B ,求4B .23.2016年春节期间全国流行在微信群里发、抢红包,现假设某人将688元发成手气红包50个,产生的手气红包频数分布表如下:金额分组[)1,5[)5,9[)9,13[)13,17[)17,21[)21,25频数39171182(1)求产生的手气红包的金额不小于9元的频率;(2)估计手气红包金额的平均数(同一组中的数据用该组区间的中点值作代表);(3)在这50个红包组成的样本中,将频率视为概率.①若红包金额在区间[]21,25内为最佳运气手,求抢得红包的某人恰好是最佳运气手的概率;②随机抽取手气红包金额在[)[]1,521,25⋃内的两名幸运者,设其手气金额分别为m ,n ,求事件“16m n ->”的概率.24.绿色已成为当今世界主题,绿色动力已成为时代的驱动力,绿色能源是未来新能源行业的主导.某汽车公司顺应时代潮流,最新研发了一款新能源汽车,并在出厂前对100辆汽车进行了单次最大续航里程(理论上是指新能源汽车所装载的燃料或电池所能够提供给车行驶的最远里程)的测试.现对测试数据进行分析,得到如图所示的频率分布直方图.(1)估计这100辆汽车的单次最大续航里程的平均值x (同一组中的数据用该组区间的中点值代表);(2)根据大量的汽车测试数据,可以认为这款汽车的单次最大续航里程X 近似地服从正态分布()2,N μσ,经计算第(1)问中样本标准差s 的近似值为50.用样本平均数x作为μ的近似值,用样本标准差s 作为σ的估计值;(ⅰ)现从该汽车公司最新研发的新能源汽车中任取一辆汽车,求它的单次最大续航里程恰好在200千米到350千米之间的概率;(ⅱ)从该汽车公司最新研发的新能源汽车中随机抽取10辆,设这10辆汽车中单次最大续航里程恰好在200千米到350千米之间的数量为Y ,求()E Y ;(3)某汽车销售公司为推广此款新能源汽车,现面向意向客户推出“玩游戏,送大奖”活动,客户可根据抛掷硬币的结果,操控微型遥控车在方格图上行进,若遥控车最终停在“胜利大本营”,则可获得购车优惠券.已知硬币出现正、反面的概率都是12,方格图上标有第0格、第1格、第2格、…、第50格.遥控车开始在第0格,客户每掷一次硬币,遥控车向前移动一次,若掷出正面,遥控车向前移动一格(从k 到1k +),若掷出反面,遥控车向前移动两格(从k 到2k +),直到遥控车移到第49格(胜利大本营)或第50格(失败大本营)时,游戏结束.设遥控车移到第n 格的概率为(1,2,,50)n P n = ,其中01P =,试说明{}1n n P P --是等比数列,并解释此方案能否成功吸引顾客购买该款新能源汽车.参考数据:若随机变量ξ服从正态分布()2,N μσ,则()0.6827P μσξμσ-<+≈ ,(22)0.9545P μσξμσ-<+≈ ,(33)0.9973P μσξμσ-<+≈ .25.某地处偏远山区的古镇约有人口5000人,为了响应国家号召,镇政府多项并举,鼓励青壮劳力外出务工的同时发展以旅游业为龙头的乡村特色经济,到2020年底一举脱贫.据不完全统计该镇约有20%的人外出务工.下图是根据2020年扶贫工作期间随机调查本地100名在外务工人员的年收入(单位:千元)数据绘制的频率分布直方图.(1)根据样本数据怙计该镇外出务工人员的创收总额(同一组中的数据用该组区间的中点值为代表);(2)假设该镇外出务工人员年收入服从正态分布()2,N μσ,其分布密度函数为22()2()x f x μσ--=,其中μ为样本平均值.若()f x 的最大值为10π,求σ的值;(3)完成脱贫任务后,古镇党政班子并不懈怠,决心带领全镇人民在奔小康道路上再上一个新台阶,出台了多项优惠政策,鼓励本地在外人员返乡创业.调查显示务工收入在[],2μσμσ++和[]2,3μσμσ++的人群愿意返乡创业的人数比例分别为15%和20%.从样本人群收入在[],3μσμσ++的人中随机抽取3人进行调查,设X 为愿意返乡创业的人数,求随机变量X 的分布列和数学期望.参考答案1.C 【分析】对于A :由频率分布直方图中所有小矩形面积之和为1,列出等式可求得a 的值,进而作出判断;对于B :先计算高于130分的频率,然后再用1减去于高于130分的频率即可得到低于130分的频率,进而作出判断;对于C :先计算[)80,120的频率和[)120130,的频率,再求出总体的中位数,进而作出判断;对于D :根据样本分布在[)90,100的频数一定与样本分布在[)100,110的频数相等,总体分布在[)90,100的频数不一定与总体分布在[)100,110的频数相等作出判断即可.【详解】由频率分布直方图得:()0.0050.0100.0100.0150.0250.005101a ++++++⨯=,解得0.030a =,故A 错误;样本数据低于130分的频率为:()10.0250.005100.7-⨯+=,故B 错误;[)80,120的频率为:()0.0050.0100.0100.015100.4+++⨯=,[)120130,的频率为:0.030100.3⨯=,∴总体的中位数(保留1位小数)估计为:0.50.412010123.30.3-+⨯≈分,故C 正确;样本分布在[)90,100的频数一定与样本分布在[)100,110的频数相等,总体分布在[)90,100的频数不一定与总体分布在[)100,110的频数相等,故D 错误.故选:C .【点睛】本题考查频率分布直方图的应用,考查逻辑思维能力和计算能力,属于基础题.2.B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解.由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =,所以学习时长在[)9,11的频率2520.5x n==,解得50n =.故选:B .【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.3.A 【分析】根据频率分布折线图计算该组数据的平均数为650.15750.4850.2950.25⨯+⨯+⨯+⨯.【详解】由折线图可知,该组数据的平均数为650.15750.4850.2950.2580.5⨯+⨯+⨯+⨯=.故选:A.【点睛】此题考查根据频率分布折线图求平均数,关键在于熟练掌握平均数的求解公式.4.D 【分析】根据频数分布表中的数据,对选项中的命题进行分析,判断正误,即可得到本题答案.【详解】甲同学的成绩的平均数1051201201301401235x ++++<=,乙同学的成绩的平均数1051151251351451255y ++++>=,所以A 错误;甲同学的成绩从第1次到第5次变化波动比乙同学的成绩的变化波动更小一些,所以甲同学的成绩的方差小于乙同学的成绩的方差,所以B 错误;甲同学的成绩的极差介于()30,40之间,乙同学的成绩的极差介于()35,45之间,所以甲同学的成绩的极差不一定小于乙同学的成绩的极差,所以C 错误;甲同学的成绩的中位数介于()115,120之间,乙同学的成绩的中位数介于()125,130之间,所以D 正确.故选:D本题主要考查频数直方图的相关问题,其中涉及中位数、平均数、方差、极差的求解. 5.B【详解】若①正确,则300400-对应的频率为0.45,则400500-对应的频率为0.15,则②错误;电子元件的平均寿命为1500.12500.153500.454500.155500.15⨯+⨯+⨯+⨯+⨯,则③正确;寿命超过400h的频率为0.150.150.3+=,则④正确,故不符合题意;若②正确,则300400-对应的频率为0.4,则①错误;电子元件的平均寿命为1500.12500.153500.44500.25500.15⨯+⨯+⨯+⨯+⨯,则③错误;寿命超过400h的频率为0.20.150.35+=,则④错误,故符合题意.故选:B.6.C【分析】设中位数为x,根据中位数左边的频数为50列等式可求得x的值.【详解】设中位数为x,前2组的频数之和为25,前3组的频数之和为65,由题意可得20025405050x-+⨯=,解得231.25x=.故选:C.7.A【分析】利用频率分布直方图计算平均数的方法求解即可.【详解】所给数据频率之和为(0.010.070.080.020.02)51++++⨯=则估计的平均值为5(12.50.0117.50.0722.50.0827.50.0232.50.02) 4.35521.75⨯+⨯+⨯+⨯+⨯=⨯=故选:A8.D 【分析】根据样本估计总体的知识依次判断各个选项即可得到结果.【详解】对于A ,设中位数为x ,则()()0.020.065250.080.5x +⨯+-⨯=,解得:26.25x =,即该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次,A 正确;对于B ,根据频率分布直方图知众数为:253027.52+=次,B 正确;对于C ,该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有16000.045320⨯⨯=人,C 正确;对于D ,该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有16000.025160⨯⨯=人,D 错误.故选:D.9.A 【分析】由统计图分别求出该月温度的中位数,众数,平均数,由此能求出结果.【详解】解:由统计图得:该月温度的中位数为565.52N +==,众数为5M =,平均数为1(233410566372829210) 5.9730P =⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯≈.∴M N P <<.故选:A .10.D 【分析】A .根据频率分布直方图中哪一组数据的频率除以组距的值最大进行分析;B .先分析60分以下对应的频率,再利用总体数量乘以所求频率即可得到结果;C .利用每组数据的组中值乘以对应频率并将每组计算结果相加即可得到结果;D .分析频率为0.5时对应的横坐标的值即为中位数.【详解】A .根据统计图可知:[)70,80对应的频率除以组距的值最大,即频率最大,所以人数最多,故正确;B .不及格的频率为:()0.0100.015100.25+⨯=,所以不及格的人数约为40000.25=1000⨯人,故正确;C .根据频率分布直方图可知平均数为:()450.01550.015650.02750.03850.015950.011070.5⨯+⨯+⨯+⨯+⨯+⨯⨯=,故正确;D .前三组的频率之和为:()0.01+0.0150.02100.450.5+⨯=<,前四组的频率之和为:()0.01+0.0150.020.03100.750.5++⨯=>,所以中位数在第四组数据中,且中位数为:0.50.45701071.70.0310-+⨯≈⨯,故错误;故选:D.11.D 【分析】利用频率分布直方图的性质直接求解.【详解】解:对于A ,90分以上为优秀,由频率分布直方图得优秀的频率为0.010100.1⨯=,∴从全体考生中随机抽取1000人,则其中得优秀考试生约有:10000.1100⨯=人,故A 正确;对于B ,由频率分布直方图得[40,50)的频率为0.01100.1⨯=,[50,100)的频率为:10.10.9-=,∴若要全省的合格考通过率达到96%,则合格分数线约为44分,故B 正确;对于C ,若同一组中数据用该组区间中间值作代表值,可得考试物理成绩的平均分约为:450.01010550.01510650.02010750.03010850.01510950.0101070.5⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=分,故C 正确;对于D ,[40,70)的频率为:(0.0100.0150.020)100.45++⨯=,[70,80)的频率为0.030100.3⨯=,∴该省考生物理成绩的中位数为:0.50.45701071.670.3-+⨯≈分,故D 错误.故选:D .【点睛】本题考查频数、合格分数线、平均数、中位数的求法,考查频率分布直方图的性质等基础知识,考查运算求解能力,属于基础题.12.65,65【分析】频率分布直方图中最高矩形的中点横坐标即为众数,利用平分矩形面积可得中位数.【详解】由题图可知众数为65,又∵第一个小矩形的面积为0.3,∴设中位数为60+x ,则0.3+x ×0.04=0.5,得x =5,∴中位数为60+5=65.故答案为:65,6513.四【分析】计算前几组的频率之和,判断频率为0.5在哪个区间即可判断中位数.【详解】根据频率分布直方图可知,前三组的频率之和为()0.03750.06250.07520.350.5++⨯=<,前四组的频率之和为()0.03750.06250.0750.120.550.5+++⨯=>,则可以判断中位数在第四组.故答案为:四.【点睛】本题考查根据频率分布直方图判断中位数所在区间,属于基础题.14.67.【分析】本题根据频率分布直方图直接求平均数即可.【详解】解:这次竞赛的平均成绩为:0.03055100.04065100.01575100.01085100.005951067⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=故答案为:67.【点睛】本题考查根据频率分布直方图求平均数,是基础题.15.0.016130【分析】利用频率分布直方图中所有矩形的面积之和为1可求得污染的数据;利用最高矩形底边的中点值可求得众数.【详解】设被污染的数据为a ,利用频率分布直方图中所有矩形的面积之和为1可得0.004100.02100.028100.03210101a ⨯+⨯+⨯+⨯+⨯=,解得0.016a =.由图可知,该班同学的成绩众数为130.故答案为:0.016,13016.4.7 4.75【分析】根据频率分布直方图,取最高矩形底边中点的横坐标即可求出众数,求出第三小组矩形的高,设中位数为x ,由()0.1250.175 4.5510.5x ++-⨯=,解方程即可求解.【详解】由图可知,众数为4.7,第五小组的频率为0.50.30.15⨯=从左至右五个小组的频率之比依次是5∶7∶12∶10∶6,可得第一小组的频率为50.150.1256⨯=,第二小组的频率为70.150.1250.1756⨯==,第三小组的频率为120.150.36⨯=,所以中位在第三小组,第三小组矩形面积为0.3,则第三小组的高为0.310.3=设中位数为x ,则()0.1250.175 4.5510.5x ++-⨯=,解得 4.75x =故答案为:4.7;4.75【点睛】本题考查了根据频率分布直方图求众数、中位数,考查了运算求解能力,属于基础题. 17.(1)填表见解析;作图见解析;(2)平均值为:1.08,答案见解析.【分析】(1)由样本数据,即可完善频率分布表中的数据,并画出频率直方图.(2)由(1)的频率直方图计算样本均值,进而描述汞含量分布规律.【详解】(1)由题设样本数据,则可得频率分布表如下,分组频数频率[)0,0.5031 10[)0.50,1.00101 3[)1.00,1.50122 5[)1.50,2.0042 15[)2.00,2.5011 30合计301(2)根据频率分布直方图估算平均值为:112210.250.75 1.25 1.75 2.25 1.0810351530⨯+⨯+⨯+⨯+⨯≈,分布规律:①该频率分布直方图呈中间高,两边低,大多数鱼身体中汞含量主要集中在区间[]0.5,1.5;②汞含量在区间[]1,1.5的鱼最多,汞含量在区间[]0.5,1的次之,在区间[]2,2.5的最少;③汞含量超过61.0010-⨯的数据所占比例较大,这说明这批鱼被人食用,对人体产生危害的可能性比较大.18.(1)作图见解析;中位数为4.3;(2)35.【分析】(1)设中位数为x ,则有()40.150.05x -⨯=,故可求中位数.(2)利用古典概型的概率公式可求概率.【详解】解:(1)第二组的频率为()120.150.0750.050.10.25-⨯+++=,故第二组小矩形的高为0.125频率分布直方图如图所示,由频率分布直方图可得,第一组和第二组的频率之和为0.20.250.450.5+=<,前三组的频率之和为0.20.250.30.750.5++=>,可知中位数在第三组,设中位数为x ,则有()40.150.50.450.05x -⨯=-=,解得134.33x =≈,所以该社区住户每周锻炼时间的中位数为4.3;。

第63讲 根据频率分布直方图求中位数众数和平均数-高中数学常见题型解法归纳反馈训练

第63讲 根据频率分布直方图求中位数众数和平均数-高中数学常见题型解法归纳反馈训练

【知识要点】一、用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计总体的数字特征),需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本容量越大,估计的结果也就越精确,分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.二、频率分布是指一个样本数据在各个小范围内所占比例的大小.一般是用频率分布直方图反映样本频率分布.三、样本的数字特征众数:就是数据中出现次数最多的那个,比其他的都多,如果几个数据出现的次数都是最多,则它们都是众数;每个数据都只有一次,那么数据没有众数.所以众数可以不止一个或者没有.中位数:就是这些数据排列好了以后中间的那个数字,那么如果有偶数个数据,那么就是中间两个数字的平均数,如果有奇数个数据,则中间那个就是数据的中位数.所以数据的中位数不一定在数据中.平均数:这个就是把所有数据相加,除以个数,就是数据的平均数. nx n++(n x x ++-(n x x ++-四、茎叶图茎叶图又称“枝叶图”,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少.当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出的叶子,因此通常把这样的图叫做茎叶图.【方法讲评】【例1】对某小区100户居民的月均用水量进行统计,得到样本的频率分布直方图如图,则估计此样本的众数、中位数分别为()A. 2.25,2.5 B.2.25,2.02 C.2,2.5 D.2.5,2.25【点评】(1)求频率分布图中的众数,一般先计算出频率分布直方图中的每个小矩形的面积,找到面积最大的那个矩形,取该矩形的横边中点对应的数为众数.(2)求众数也可以直接找最高矩形的横边的中点.【反馈检测1】某学校900名学生在一次百米测试中,成绩全部介于13秒与18秒之间,抽取其中50个样本,将测试结果按如下方式分成五组:第一组[13,14],第二组[14,15),…,第五组[17,18],如图是按上述分组方法得到的频率分布直方图.(1)若成绩小于14秒认为优秀,求该样本在这次百米测试中成绩优秀的人数;(2)请估计学校900名学生中,成绩属于第四组的人数;(3)请根据频率分布直方图,求样本数据的众数和中位数.【例2】高二某班50名学生在一次百米测试中,成绩全部都介于13秒到18秒之间,将测试结果按如下方式分成五组,第一组[13,14),第二组[14,15)…第五组[17,18],如图是按上述分组方法得到的频率分布直方图.(1)若成绩大于等于14秒且小于16秒规定为良好,求该班在这次百米测试中成绩为良好的人数. (2)请根据频率分布直方图,估计样本数据的众数和中位数(精确到0.01).(3)设n m ,表示该班两个学生的百米测试成绩,已知[)[]18,1714,13, ∈n m ,.6个基本事件组成.【点评】求频率分布直方图中的中位数,一般先计算出每个小矩形的面积,通过解方程找到左边面积为0.5的点P ,点P 对应的数就是中位数.【反馈检测2】某公路段在某一时刻内监测到的车速频率分布直方图如图所示. (Ⅰ)求纵坐标中参数h 的值及第三个小长方形的面积; (Ⅱ)求车速的众数1v ,中位数2v 的估计值;1122n n xx p x p x p 计算.的中点对应的数,n p 代表第n 个矩形的面积【例3】某校从参加考试的学生中抽出60名学生,将其成绩(均为整数)分成六组[40,50),[50,60)...[90,100]后画出如下部分频率分布直方图.观察图形的信息,回答下列问题: (Ⅰ)求成绩落在[70,80)上的频率,并补全这个频率分布直方图; (Ⅱ) 估计这次考试的及格率(60分及以上为及格)和平均分;(Ⅲ) 从成绩是70分以上(包括70分)的学生中选两人,求他们在同一分数段的概率.【解析】(Ⅰ)成绩落在[70,80)上的频率是0.3,频率分布直方图如下图.(Ⅲ) 成绩是70分以上(包括70分)的学生人数为(0.03+0.025+0.005)×10×60=36 所以所求的概率为【点评】求频率分布直方图中的平均数,1122n n x x p x p x p 计算.其中nx 代表第n 个矩形的横边的中点对应的数,n p 代表第n 个矩形的面积.【反馈检测3】某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100]. (1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[50,90)之外的人数.高中数学常见题型解法归纳及反馈检测第63讲: 根据频率分布直方图求中位数众数和平均数参考答案【反馈检测1答案】(1)3;(2)288;(3)15.5,15.74.【反馈检测2答案】(1)0.01h =,第三个小长方形的面积为65;(2)1265,62.5v v ==;(3【反馈检测2详细解析】(Ⅰ)∵所有小长形面积之和为1,∴10h +10×3h +10×4h +10×2h =1, 解得h =0.01, ∴第三个小长方形的面积为:10×4h =10×0.04=0.4. (Ⅱ)车速的众数1v =,车速的中位数是两边直方图的面积相等, 于是得:10×0.01+10×0.03+(2v ﹣60)×0.04=0.5,解得2v =62.5.×10×45+0.03×10×55+0.04×10×65+0.02×10×75=62. 【反馈检测3答案】(1)005.0=a ;(2)73;(3)10.【反馈检测3详细解析】(1)依题意得,()104.003.002.0210=+++a ,解得005.0=a(2)这100名学生语文成绩的平均分为:()分7305.0952.0853.0754.06505.055=⨯+⨯+⨯+⨯+⨯ (3)数学成绩在[50,60)的人数为:100×0.05=5数学成绩在[60,70[70,80数学成绩在[80,90所以数学成绩在[50,90)之外的人数为:102540205100=----。

(最全)高中数学概率统计知识点总结

(最全)高中数学概率统计知识点总结

概率与统计一、普通的众数、平均数、中位数及方差1、 众数 :一组数据中,出现次数最多的数。

2、平均数 : ①、常规平均数:xx 1x 2x n②、加权平均数: xx 1 1 x 2 2x nnn12n3、中位数: 从大到小或者从小到大排列,最中间或最中间两个数的平均数 。

4、方差: s 21[( x 1 x) 2 ( x 2 x )2( x nx )2 ]n二、频率直方分布图下的频率1、频率 =小长方形面积: f S y 距 d ;频率 =频数 / 总数2、频率之和 : f 1f 2f n 1 ;同时 S 1 S 2S n1 ;三、频率直方分布图下的众数、平均数、中位数及方差1、众数: 最高小矩形底边的中点。

2、平均数: x x 1 f 1 x 2 f 2 x 3 f 3 x n f nx x 1 S 1 x 2 S 2x 3 S 3x n S n3、中位数: 从左到右或者从右到左累加,面积等于0.5 时 x 的值。

4、方差: s 2( x 1x )2 f 1 ( x 2 x) 2 f 2( x n x) 2 f n四、线性回归直线方程 : ? ? ?bxy an(x ix )( y iy )nx i y i nxy??其中: b i 1i 1,a?ybxnn( x i x )2x i 2nx 2i 1i11、线性回归直线方程必过样本中心( x , y ) ;??0 : 负相关。

2、 b 0 : 正相关; b?3、线性回归直线方程: y? ?bx a?的斜率 b 中,两个公式中分子、分母对应也相等;中间可以推导得到。

五、回归分析?i1、残差 : ?iy i?i 越小越好;ey (残差 =真实值—预报值)。

分析:e2、残差平方和 :n? )2(y i,i 1y in( y iy )2( y 1 y )2 ( yy )2( yy )2分析:①意义:越小越好;②计算:?i?12?2n?ni 1n ?i )23、拟合度(相关指数) : R 21( yy ,分析:① . R 20,1②. 越大拟合度越高;i 1的常数;ny)2i ( y i1nn4、相关系数 : ri ( x i x )( y i y)x i y i nx y1i 1nx)2 ny) 2 nx) 2 ny )2i 1( x i i ( y i( x i ( y i1i 1i 1分析:① . r[ 1,1]的常数;② . r 0: 正相关; r0: 负相关③. r[0,0.25] ;相关性很弱;r(0.25,0.75) ;相关性一般;r [0.75,1] ;相关性很强;六、独立性检验 x 1 x 21、2×2 列联表 :合计2、独立性检验公式 bc)2y 1 a b a b ①. k 2(an( add )y 2cdc db)(c d )(a c)(b合计a cb dn②.犯错误上界 P 对照表3、独立性检验步骤①.计算观察值n(ad bc) 2k : k;(a b)(c d )(a c)(b d )②.查找临界值 k0:由犯错误概率P,根据上表查找临界值k0;③.下结论: k k0:即犯错误概率不超过P 的前提下认为:, 有 1-P 以上的把握认为:;k k0:即犯错误概率超过P 的前提认为:,没有 1-P 以上的把握认为:;【经典例题】题型 1 与茎叶图的应用例 1( 2014 全国)某市为考核甲、乙两部门的工作情况,学科网随机访问了50 位市民。

中位数平均数众数方差

中位数平均数众数方差

A.304.6 B.303.6 C.302.6 D.
解析:
=303.6.
答案:B
3.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差 为( )
分数
5
4
3
2
1
人数
20
10
30
30
10
A.
B.
C.3
D.
解析:由标准差公式计算可得.
答案:B
4.( ·湖北卷)如图是样本容量为200的频率 分布直方图. 根据样本的频率分布直方图估计, 样本数据落在[6,10)内的频数为________, 数据落在[2,10)内的概率约为________. 解析:200××4=64;(0.02+0.08)×4=0.4. 答案:64
C.丙地:中位体数为方2,差众是数为反3映总体的波动情况的一个量,二者反映的角度不同,不可相
A.甲地:总体均值为3,中位数为4
(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;
A.甲地:总体互均值比为较3,,中位但数有为4些问题在总体期望值差距不大时,可考虑用总体方差进一
根据样本的频率分布直方图估计,
4.众数、中位数、平均数
(1)在一组数据中,出现次数 较多 的数据叫做这组数据的众数.
(2)将一组数据按大小依次排列,把处在中间 位置的一个数据(或中间两个数据的平
均数)叫做这组数据的中位数.
(3)如果有n个数x1,x2,…,xn,那么 5.标准差和方差
叫做这n个数的平均数.
(1)标准差是样本数据到平均数的一种 平均距离 .
思维点拨:已知一组数据x1,x2,…,xn,其平均数为 ,方差为
平均数、中位数、众数描述其集中趋势,方差和标准

经典:众数、中位数、平均数与频率分布直方图的关系

经典:众数、中位数、平均数与频率分布直方图的关系
5 5 ,6 5 ,6 5 ,7 5 ,7 5 ,8 5 ,85, 95 由此得到频率
分布直方图如图3,则这20名工人中一天生产
该产品 数量在
的中位 数.
3、平均数是频率分布直方图的“重心”.
是直方图的平衡点. n 个样本数据的平均数由 公式:
X= n 1(x1x2xn)
假设每组数据分别为〔a1, b1)、 〔a2, b2)、 … … 〔ak, bk)时, 且每组数据相应的 频率分别为f1、 f2 、 …… fk;那么样本的平 均数(或总体的数学期望)由下列公式计算即 可。
1002000.102003000.153004000.40
2
2
2
4005000.205006000.15151409082.5365.
2
2
我 们 估 计 总 体 生子产元的件电的 寿 命 的
期 望 值 ( 总 体 均36值5. ) 为
思考:从样本数据可知,所求得该样本的众 数、中位数和平均数,这与我们从样本频率 分布直方图得出的结论有偏差,你能解释一 下原因吗?
频数
20 30 80 40 30 200
频率
0.10 0.15 0.40 0.20
0.15 1
累积频率 0.10 0.25 0.65 0.85 1
0 100 200300400 500 600 寿命(h)
总体分布的估计
(3)由频率分布表 出可 ,以 寿看 命 10在 h0~400
的电子元件出现 为的 :0.6频 5,率 所以我们估计电子
元件寿命 10在 h0~40h0的概率:0为 .65.
( 4) .由 频 率 分 布 表 命可 在 40知 h0以, 上寿 的 电 子
元 件 出 现 的 :0.2频 00率 .15为 0.3, 5 故 我 们

2023年高考数学复习----《统计图表》规律方法与典型例题讲解

2023年高考数学复习----《统计图表》规律方法与典型例题讲解

2023年高考数学复习----《统计图表》规律方法与典型例题讲解【规律方法】1、制作频率分布直方图的步骤.第一步:求极差,决定组数和组距,组距=极差组数第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表;第四步:画频率分布直方图.2、解决频率分布直方图问题时要抓住3个要点.(1)直方图中各小矩形的面积之和为1;(2)直方图中纵轴表示频率组距,故每组样本的频率为组距⨯频率组距(3)直方图中每组样本的频数为频率⨯总体个数.3、用频率分布直方图估计众数、中位数、平均数的方法.(1)众数为频率分布直方图中最高矩形底边中点的横坐标;(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;(3)平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和.【典型例题】例1.(2022·云南昆明·昆明一中模拟预测)为了响应教育部门疫情期间“停课不停学”的号召,某校实施网络授课,为了检验学生上网课的效果,在高三年级进行了一次网络模拟考试,从中抽取了100人的数学成绩,绘制成频率分布直方图(如下图所示),其中数学成绩落在区间[110,120),[120,130),[130,140]的频率之比为4:2:1.(1)根据频率分布直方图求学生成绩在区间[110,120)的频率,并求抽取的这100名同学数学成绩的中位数(2)若将频率视为概率,从全校高三年级学生中随机抽取3个人,记抽取的3人成绩在[100,130)内的学生人数为X ,求X 的分布列与数学期望.【解析】(1)由直方图可知,数学成绩落在区间[70,110)内的频率为(0.0040.0120.0190.030)10+++⨯=0.65,所以数学成绩落在区间[110,140]内的频率为10.650.35−=,因为数学成绩落在区间[110,120),[120,130),[130,140]的频率之比为4:2:1,所以数学成绩落在区间[110,120)的频率为40.35421⨯++0.2=, 数学成绩落在区间[70,100)的频率为(0.0040.0120.019)100.35++⨯=, 所以中位数落在区间[100,110)内,设中位数为x ,则(100)0.0300.50.35x −⨯=−,解得105x =, 所以抽取的这100名同学数学成绩的中位数为105.(2)由(1)知,数学成绩落在区间[100,130)内的频率为0.0310⨯+0.2+20.35421⨯++0.6=,由题意可知,3~(3,)5X B ,X 的所有可能取值为0,1,2,3,033338(0)C ()(1)55125P X ==⋅−=,12333(1)C (1)55P X ==⋅⋅−36125=, 22333(2)C ()(1)55P X ==⋅⋅−54125=,330333(3)C ()(1)55P X ==⋅−27125=,所以X 的分布列为:所以数学期望8365427()0123125125125125E X =⨯+⨯+⨯+⨯95=.例2.(2022·贵州贵阳·贵阳六中校考一模)某校组织1000名学生进行科学探索知识竞赛,成绩分成5组:[)50,60,[)60,70,[)70,80,[)80,90,[]90,100,得到如图所示的频率分布直方图.若图中未知的数据a ,b ,c 成等差数列,成绩落在区间[)60,70内的人数为400.(1)求出直方图中a ,b ,c 的值;(2)估计中位数(精确到0.1)和平均数(同一组中的数据用该组区间的中点值代替); (3)若用频率估计概率,设从这1000人中抽取的6人,得分在区间[]90,100内的学生人数为X ,求X 的数学期望.【解析】(1)依题意可得:4001000100.04a =÷÷=,又a ,b ,c 成等差数列,所以2b a c =+且(0.0050.005)101a b c ++++⨯=,解得:0.02,0.03c b == 所以0.04,0.03,0.02a b c ===.(2)因为(0.0050.04)100.450.5+⨯=<,设中位数为x , 则[70,80)x ∈,所以()()0.0050.0410700.030.5x +⨯+−⨯=,解得:71.7x ≈,即中位数约为71.7,平均数为(550.005650.04750.03850.02950.005)1073⨯+⨯+⨯+⨯+⨯⨯=. (3)由题意可知:得分在区间[]90,100内概率为10.0051020⨯=, 根据条件可知:X 的所有可能值为0,1,2,3,4,5,6,且1(6,)20X ,所以1()60.320E X np ==⨯=.例3.(2022·全国·高三专题练习)为丰富学生课外生活,某市组织了高中生钢笔书法比赛,比赛分两个阶段进行:第一阶段由评委为所有参赛作品评分,并确定优胜者;第二阶段为附加赛,参赛人员由组委会按规则另行确定.数据统计员对第一阶段的分数进行了统计分析,这些分数X 都在[75,100)内,再以5为组距画分数的频率分布直方图(设“Y=频率组距”)时,发现Y 满足:7,15,15019,16,30011,16,1520n Y n k n n ⎧=⎪⎪⎪==⎨⎪⎪−⋅>⎪−⎩,55(1)n N n X n *∈≤<+. (1)试确定n 的所有取值,并求k ;(2)组委会确定:在第一阶段比赛中低于85分的同学无缘获奖也不能参加附加赛;分数在[95,100)内的同学评为一等奖;分数在[90,95)内的同学评为二等奖,但通过附加赛有111的概率提升为一等奖;分数在[85,90)内的同学评为三等奖,但通过附加赛有17的概率提升为二等奖(所有参加附加赛的获奖人员均不降低获奖等级,且附加赛获奖等级在第一阶段获奖等级基础上,最多升高一级).已知学生A 和B 均参加了本次比赛,且学生A 在第一阶段获得二等奖.①求学生B 最终获奖等级不低于学生A 最终获奖等级的概率;②已知学生A 和B 都获奖,记A ,B 两位同学最终获得一等奖的人数为ξ,求ξ的分布列和数学期望.【解析】(1)根据题意,X 在[75,100)内,按5为组距可分成5个小区间, 分别是[75,80),[80,85),[85,90),[90,95),[95,100),因为75100X ≤<,由55(1)n X n ≤<+,n N *∈,所以15,16,17,18,19n =.每个小区间的频率值分别是7,15,30195,1660115,17,18,19320n P Y n k n n ⎧=⎪⎪⎪===⎨⎪⎪−⋅=⎪−⎩由719111511306032k ⎛⎫++−++= ⎪⎝⎭,解得350k =. (2)①由于参赛学生很多,可以把频率视为概率.由(1)知,学生B 的分数属于区间[75,80),[80,85),[85,90),[90,95),[95,100)的概率分别是:730,1960,1460,1160,260.我们用符号ijA (或ijB )表示学生A (或B )在第一轮获奖等级为i ,通过附加赛最终获奖等级为j ,其中(,1,2,3)j i i j ≤=记“学生B 最终获奖等级不低于学生A 的最终获奖等级”为事件W , 则()12122223222()P W P B B B A B A =+++()()()()()()12122223222P B P B P B P A P B P A =+++2111111010141105160601160111160711220=+⋅+⋅⋅+⋅⋅=.②学生A 最终获得一等奖的概率是111A P =,学生B 最终获得一等奖的概率是21112116060272711272796060B P =+⋅=+=,1180(0)1111999P ξ⎛⎫⎛⎫==−−= ⎪⎪⎝⎭⎝⎭,111118(1)1111911999P ξ⎛⎫⎛⎫==⋅−+−⋅=⎪ ⎪⎝⎭⎝⎭, 111(2)11999P ξ==⋅=.所以ξ的分布列为:801812001299999999E ξ=⋅+⋅+⋅=.。

众数 中位数 平均数与频率分布直方图的关系

众数 中位数 平均数与频率分布直方图的关系

O
0.5
1
1.5
2
2.5
3
3.5
4
4.5
月平均用水量(t)
例题分析:月均用水量的众数是2.25t.如图所示:(2+2.5)/2=2.25
2、从频率分布直方图中估计中位数
(中位数是样本数据所占频率的等分线。)
• 当最高矩形的数据组为〔a, b) 时, 设中位 数为(a+X),根据中位数的定义得知, 中位 数左边立方图的小矩形面积为0.5, 列方程 得: • 当最高矩形的数据组之前所有小矩形的面 积之和为fm,
用样本数字特征估计总体数字特征
众数、中位数、平均数与频率分布直方 图的关系
二 、 众数、中位数、平均数 与频率分布直方图的关系
1、众数在样本数据的频率分布直方图中, 就是最高矩形的中点的横坐标。 当最高矩形的数据组为〔a, b) 时, 那 么(a+b)/2就是众数。
频率 组距
0.5 0.4 0.3 0.2 0.1
• xh+fm=0.5求解X, 那么a+X即为中位数。 • h=最高矩形的高
思考题:如何从频率分布直方图中估计中位数? 频率/组距
0.50 0.44 0.40 0.30 0.16 0.20 0.08 0.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
x
中位数左边立方图的小矩形面积为0.5 月均用水量 /t 0~2的小矩形面积之和为: 0.5×(0.08+0.16+0.30+0.44)=0.49 0.5-0.49=0.01 0.01/0.5=0.02 如图在直线t=2.02之前所有小矩形的面积为0.5 所以该样本的中位数为2.02
思考:从样本数据可知,所求得该样本的众 数、中位数和平均数,这与我们从样本频率 分布直方图得出的结论有偏差,你能解释一 下原因吗? 频率分布直方图损失了一些样本数据,得 到的是一个估计值,且所得估值与数据分组 有关. 注:在只有样本频率分布直方图的情况下,我 们可以按上述方法估计众数、中位数和平均 数,并由此估计总体特征.

222用样本的数字特征估计总体的数字特征(2)方差标准差讲解

222用样本的数字特征估计总体的数字特征(2)方差标准差讲解
规律:标准差越大, 则a越大,数据的 离散程度越大;反 之,数据的离散程 度越小。
性质归纳:kan b的平均数和方差:
已知a1,a2,,an的平均数是3,方差是2. 则a1 b,a2 b,,an b的平均数是3 b, 方差是2. ka1,ka2,,kan的平均数是3k,方差是2k 2.
标准差是样本平均数的一种平均距离,一般用s表示.
所谓“平均距离”,其含义可作如下理解:


假设样本数据是x1,x2,...xn ,x 表示这组数据的平均数,xi到 x
的距离是
-
xi - x (i = 1,2,… ,n).
, :
-
于是
样本数据x1,
x2,
x

n
x
的“平均距离”是



x1 x x2 x xn x
2.2.2用样本的数字特征估计总体 的数字特征(2) 方差、标准差
学习目标 1.明确标准差、方差等数字特征的意义,深刻 体会它们所反映的样本特征。 2.会用样本的数字特征估计总体的的数字特征, 初步体会样本的数字特征的随机性
复习回顾
一.什么是一组数据的众数、中位数及平均数?
众数:一组数据中出现次数最多的数据。
[解析] (1)甲组成绩的众数为 90 分,乙组成绩的众数为
70 分,从成绩的众数比较看,甲组成绩好些.
(2)s
2


1 2+5+10+13+14+6
×[2×(50

80)2

5×(60
- 80)2 + 10×(70 - 80)2 + 13×(80 - 80)2 + 14×(90 - 80)2 +
A.众数 B.平均数

直方图求中位数

直方图求中位数

2252225数为ax根据中位数的定义得知中位数左边立方图的小矩形面积为05列方程当最高矩形的数据组之前所有小矩形的面积之和为fm
二 、 众数、中位数、平均数 与频率分布直方图的关系
(在只有频率分布直方图的情况下,也可以估计总体特征,而且直方图比较直观 便于形象地进行分析。)
1、众数在样本数据的频率分布直方图中, 就是最高矩形的中点的横坐标。 当最高矩形的数据组为〔a, b) 时, 那 么(a+b)/2就是众数。
• 求解X, 那么a+X即为中位数。
思考题:如何从频率分布直方图中估计中位数? 频率/组距
0.50 0.44 0.40 0.30 0.16 0.20 0.08 0.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
中位数左边立方图的小矩形面积为0.5 月均用水量 /t 0~2的小矩形面积之和为: 0.5×(0.08+0.16+0.30+0.44)=0.49 0.5-0.49=0.01 0.01/0.5=0.02 如图在直线t=2.02之前所有小矩形的面积为0.5 所以该样本的中位数为2.02
练习.(广东11变式题1)为了调查某厂工人生产 某种产品的能力,随机抽查 了20位工人某天生 产该产品的数量.产品数量的分组区间为 45,55 , 55, 65 , 65, 75 , 75,85 85,95 由此得到频率 , 分布直方图如图3,则这20名工人中一天生产 该产品 数量在 的中位 数 .
频率 组距
0.5 0.4 0.3 0.2 0.1
O
ቤተ መጻሕፍቲ ባይዱ
0.5
1
1.5
2
2.5
3
3.5
4
4.5
月平均用水量(t)

众数、中位数、平均数(1)标准差、方差

众数、中位数、平均数(1)标准差、方差

好;
(4)乙队很少不失球.
例题分析
例1 画出下列四组样本数据的条形图, 说明他们的异同点.
(1) 5,5,5,5,5,5,5,5,5; (2) 4,4,4,5,5,5,6,6,6;
频率
x5
1.0 0.8
s0
0.6
0.4
0.2
O 12345678
(1)
频率 x 5
1.0 0.8
s 0.82
0.6
0.4
4,x,7,14,中位数为5,则这组数据的平均数和
方差分别为
( A)
A.5,24 2 3
B.5,24 1 3
C.4,25 1
D.4,25 2
3
3
解析 ∵中位数为5,∴5= 4 x ,∴x=6.
2
x104671 45,
6
s2= 1 [(5+1)2+(5-0)2+(5-4)2+(5-6)2+
6

(5-7)2+(5-14)2]=24 2 . 3
0.000 4
三种数字特征的优缺点
1、众数体现了样本数据的最大集中点,但它对其它 数据信息的忽视使得无法客观地反映总体特征.
2、中位数它不受少数几个极端值的影响,这在某些 情况下是优点,但它对极端值的不敏感有时也会成为 缺点。
3、由于平均数与每一个样本的数据有关,所以任何 一个样本数据的改变都会引起平均数的改变,这是众 数、中位数都不具有的性质。也正因如此 ,与众数、 中位数比较起来,平均数可以反映出更多的关于样本 数据全体的信息,但平均数受数据中的极端值的影响 较大,使平均数在估计时可靠性降低。
频率 组距
0.5 0.4 0.3 0.2

众数,中位数,平均数,标准差

众数,中位数,平均数,标准差
平均数与中位数相等,是必然还是巧合?
巧合 频率 组距
分组 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5]
频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02
0.50 0.40 0.30 0.20 0.10

众数、中位数、平均数的简单应用
例1 某工厂人员及工资构成如下:
人员 周工资 人数 合计 经理 2200 1 2200 管理人员 250 6 1500 高级技工 220 5 1100 工人 200 10 2000 学徒 合计 100 1 23 100 6900
(1)指出这个问题中周工资的众数、中 位数、平均数 (2)这个问题中,工资的平均数能客观 地反映该厂的工资水平吗?为什么?
? 16
找到啦!有区别了!
上述各偏差的平方和的大小还与什么有关?
——与射击次数有关!
所以要进一步用各偏差平方的平均数来衡量数据的稳定性
设一组数据x1、x2、…、xn中,各数据与它们的平均 数的差的平方分别是(x1-x)2、(x2-x)2 、… (xn-x)2 , 那么我们用它们的平均数,即用
S2=
分析:众数为200,中位数为220,
平均数为300。 因平均数为300,由表格中所列出的数据 可见,只有经理在平均数以上,其余的人 都在平均数以下,故用平均数不能客观真 实地反映该工厂的工资水平。
教练的烦恼
甲,乙两名射击手的测试成绩统计如下:
第一次 第二次 第三次 第四次 第五次
甲命中环数 乙命中环数
O
0.5
1
1.5

2

统计成对数据的统计分析知识点易错点总结-高考三轮复习冲刺

统计成对数据的统计分析知识点易错点总结-高考三轮复习冲刺

统计、成对数据的统计分析一、随机抽样1.简单随机抽样(1)简单随机抽样分为放回简单随机抽样和不放回简单随机抽样。

(2)简单随机样本:通过简单随机抽样获得的样本称为简单随机样本。

(3)简单随机抽样的常用方法。

实现简单随机抽样的方法有很多,抽签法和随机数法是比较常用的两种方法。

注意:除非特殊声明,本章简单随机抽样指不放回简单随机抽样。

2.总体平均数与样本平均数注意在简单随机抽样中我们常用样本平均数去估计总体平均数;②总体平均数是一个确定的数,样本平均数具有随机性(因为样本具有随机性);③一般情况下,样本量越大,估计越准确。

3.分层随机抽样(1)定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层。

在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配。

(2)分层随机抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层随机抽样。

(3)分层随机抽样的平均数计算在比例分配的分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,样本平均数分别为x̅,y̅,总体的样本平均数为w̅,则w̅=MM+N x̅+NM+Ny̅=mm+nx̅+nm+ny̅。

注意:①随机抽样时,总体中的每个个体入样的概率相同。

②比例分配的分层随机抽样,每一层入样的个体数为该层的个体数乘以抽样比。

【重点难点易错点】1.简单随机抽样的要点:.简单随机抽样需满足:①被抽取的样本和总体的个体数有限;②逐个抽取;③等可能抽取。

2.在使用随机数法时,如遇到三位数(或四位数),可从选择的随机数表中的某行某列的数字计起,每三个(或四个)作为一个单位,按某种顺序依次选取,有超过总体号码或出现重复号码的数字舍去。

人教A版高一数学必修第二册第九章《统计》单元练习题卷含答案解析 (36)

人教A版高一数学必修第二册第九章《统计》单元练习题卷含答案解析 (36)

高一数学必修第二册第九章《统计》单元练习题卷11(共22题)一、选择题(共10题)1.天津市某中学组织高二年级学生参加普法知识考试(满分100分),考试成绩的频率分布直方图如图,数据(成绩)的分组依次为[20,40),[40,60),[60,80),[80,100],若成绩低于60分的人数是180,则考试成绩在区间[60,80)内的人数是( )A.180B.240C.280D.3202.关于频率分布直方图中小长方形的高的说法,正确的是( )A.表示该组上的个体在样本中出现的频率B.表示取某数的频率C.表示该组上的个体数与组距的比值D.表示该组上的个体在样本中出现的频率与组距的比值3.下列问题中,最适合用简单随机抽样方法抽样的是( )A.某学术厅有32排座位,每排有40个座位,座位号是1∼40,有一次报告会学术厅里坐满了观众,报告会结束以后听取观众的意见,要留下32名观众进行座谈B.从10台冰箱中抽取3台进行质量检验C.某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人.教育部门为了解大家对学校机构改革的意见,要从中抽取容量为20的样本D.某乡农田有山地8000亩,丘陵12000亩,平地24000亩,洼地4000亩,现抽取农田480亩估计全乡农田平均产量4.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分,1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数B.平均数C.方差D.极差5.从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),⋯,[5.45,5.47],[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A.10B.18C.20D.366.10名工人生产某一零件,生产的件数分别是10,12,14,14,15,15,16,17,17,17.设其平均数为a,中位数为b,众数为c,则( )A.a>b>c B.b>c>a C.c>a>b D.c>b>a7.某班由编号为01,02,03,⋯,50的50名学生组成,现在要选取8名学生参加合唱团,选取方法是从如下随机数表的第1行第11列开始由左到右依次选取两个数字,则该样本中选出的第8名学生的编号为( )495443548217379323783035209623842634916450258392120676572355068877044767217633502583921206764954A.20B.23C.26D.348.在一次体育测试中,某班的6名同学的成绩(单位:分)分别为66,83,87,83,77,96.关于这组数据,下列说法错误的是( )A.众数是83B.中位数是83C.极差是30D.平均数是839.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是A.12,24,15,9B.9,12,12,7C.8,15,12,5D.8,16,10,610.某学校随机抽取了部分学生,对他们每周使用手机的时间进行统计,得到如下的频率分布直方图.若从每周使用时间在[15,20),[20,25),[25,30)三组内的学生中用分层抽样的方法选取8人进行访谈,则应从使用时间在[20,25)内的学生中选取的人数为( )A.1B.2C.3D.4二、填空题(共6题)11.某次体检,8位同学的身高(单位:米)分别为 1.68,1.71,1.73,1.63,1.81,1.74,1.66,1.78,则这组数据的中位数是(米).12.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如图所示),已知从左到右各长方形高的比为2:3:5:6:3:1,则该班学生数学成绩在(80,100)之间的学生人数是.13.校本课程的学分,统计如表.甲811141522乙67102324用s12,s22分别表示甲、乙两班抽取的5名学生学分的方差,计算两个班学分的方差,得s22=,并由此可判断成绩更稳定的班级是班.14.众数、中位数、平均数(1)众数、中位数、平均数的概念.①众数:在一组数据中,出现最多的数据(即频率分布最大值所对应的样本数据)叫这组数据的众数.若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数.②中位数:将一组数据按大小依次排列,把处在位置的一个数据(或中间两个数据的平均数)叫这组数据的中位数.③平均数:指样本数据的算术平均数.即:x=.(2)众数、中位数、平均数与频率分布直方图的关系.众数众数是最高矩形的 所对应的数据,表示样本数据的中心值中位数①在频率分布直方图中,中位数左边和右边的直方图 相等,由此可以估计中位数的值,但是有偏差②表示样本数据所占频率的等分线平均数①平均数等于每个小长方形的面积乘以小长方形底边中点的横坐标之和②平均数是频率分布直方图的重心,是频率分布直方图的平衡点15.某学校高一、高二、高三年级的学生人数之比为3:3:4,现用分层随机抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取名学生.16.一汽车厂生产甲,乙,丙三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):轿车甲轿车乙轿车丙舒适型100120z标准型300480600按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有甲类轿车10辆,则z的值为,抽取的50辆车中,乙类舒适型的数量为.三、解答题(共6题)17.一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.18.作为北京副中心,通州区的建设不仅成为京津冀协同发展战略的关键节点,也肩负着医治北京市“大城市病”的历史重任,因此,通州区的发展备受啊目,2017年12月25日发布的《北京市通州区统计年鉴(2017)》显示:2016年通州区全区完成全社会固定资产投资939.9亿元,比上年增长17.4%,下面给出的是通州区2011∼2016年全社会固定资产投资及增长率,如图一.根据通州区统计局2018年1月25日发布:2017年通州区全区完成全社会固定资产投资1054.5亿元,比上年增长12.2%.(1) 在图二中画出2017年通州区全区完成全社会固定资产投资(柱状图),标出增长率并补全折线图;(2) 从2011∼2017这7年中随机选取续的2年份,求后一年份增长率高于前一年份增长率的概率;(3) 设2011∼2017这7年全社会固定资产投资总额的中位数为x0,平均数为x,比较x0与x的大小(写出结论即可).19.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(1) 求这次测试数学成绩的众数; (2) 求这次测试数学成绩的中位数.20. 某公交公司为了估计某线路公交公司发车的时间间隔,对乘客在这条线路上的某个公交车站等车的时间进行了调查,以下是在该站乘客候车时间的部分记录:等待时间(分钟)频数频率[0,3) 0.2[3,6) 0.4[6,9)5x [9,12)2y [12,15) 0.05合计z 1 (1) 求 x ,y ,z ;(2) 画出频率分布直方图及频率分布折线图; (3) 计算乘客平均等待时间的估计值.21. 某校从高一全体男生中用简单随机抽样抽取了 20 人测量出体重情况如下:(单位 kg )6556708266725486706258726460767280685866试估计该校高一男生的平均体重,以及体重在 60∼75 kg 之间的人数所占比例.22. 平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点?答案一、选择题(共10题)1. 【答案】B【知识点】频率分布直方图2. 【答案】D,面积表示频率.【解析】频率分布直方图中小长方形的高是频率组距【知识点】频率分布直方图3. 【答案】B【知识点】简单随机抽样4. 【答案】A【解析】根据题意,从9个原始评分中去掉1个最高分,1个最低分,得到7个有效评分,7个有效评分与9个原始评分相比,最中间的一个数不变,即中位数不变.【知识点】样本数据的数字特征5. 【答案】B【解析】根据直方图,直径落在区间[5.43,5.47)之间的零件频率为:(6.25+5.00)×0.02=0.225,则区间[5.43,5.47)内零件的个数为:80×0.225=18.【知识点】频率分布直方图6. 【答案】D=14.7,【解析】依题意,得a=10+12+14+14+15+15+16+17+17+1710中位数b=15,众数c=17,故c>b>a.【知识点】样本数据的数字特征7. 【答案】D【解析】从样本中选出来的8名学生的编号分别为17,37,23,30,35,20,26,34.故该样本中选出的第8名学生的编号为34.【知识点】简单随机抽样8. 【答案】D【知识点】样本数据的数字特征9. 【答案】D【解析】高级职称应抽取:160×40800=8(人),中级职称应抽取:320×40800=16(人),初级职称应抽取:200×40800=10(人),其余人员:120×40800=6(人).【知识点】分层抽样10. 【答案】C【解析】由频率分布直方图可知:5×(0.01+0.02+a+0.04+0.04+0.06)=1,解得:a=0.03,即在[15,20),[20,25),[25,30)三组内的学生数之比为:4:3:1,则从每周使用时间在[15,20),[20,25),[25,30)三组内的学生中用分层抽样的方法选取8人进行访谈,则应从使用时间在[20,25)内的学生中选取的人数为38×8=3.【知识点】分层抽样、频率分布直方图二、填空题(共6题)11. 【答案】1.72【知识点】样本数据的数字特征12. 【答案】33【解析】数学成绩在(80,100)之间的学生人数是(520+620)×60=33.【知识点】频率分布直方图13. 【答案】62;甲【知识点】样本数据的数字特征14. 【答案】次数;最中间;1n(x1+x2+⋯+x n);中点;面积【知识点】样本数据的数字特征15. 【答案】15【解析】高二年级学生人数占总数的310,样本容量为50,则应从高二年级抽取的学生人数为50×310=15.【知识点】分层抽样16. 【答案】400;3【解析】由题意知抽样比为10100+300=140,则50100+300+120+480+z+600=140,解得z=400.可得甲,乙,丙三类车数量的比例为2:3:5,则乙类车抽到的数量为310×50=15,乙类车中,舒适型与标准型的数量比为1:4,所以舒适型的数量为15×15=3.【知识点】分层抽样三、解答题(共6题)17. 【答案】因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而应采用分层抽样的方法.具体过程如下:(1)将3万人分成5层,一个乡镇为一层.(2)按照各乡镇的人口比例随机抽取各乡镇的样本:300×315=60( 人),300×215=40(人),300×515=100( 人),300×215=40( 人),300×315=60( 人).各乡镇分别用分层抽样抽取的人数分别为60,40,100,40,60.(3)将抽取的这300人组到一起,即得到一个样本.【知识点】分层抽样18. 【答案】(1) 由题意在图二中画出2017年通州区全区完成全社会固定资产投资(柱状图),标出增长率并补全折线图,如图.(2) 从2011∼2017这7年里,随机选取连续的2个年份,共6组,分别为:(2011,2012),(2012,2013),(2013,2014),(2014,2015),(2015,2016),(2016,2017),设事件A表示“随机选取续的2年份,后一年份增长率高于前一年份增长率”,则事件A包含的基本事件有2个,分别为:(2011,2012),(2015,2016),所以随机选取续的2年份,后一年份增长率高于前一年份增长率的概率P(A)=26=13.(3) x0<x.【知识点】频率与频数、样本数据的数字特征、频率分布直方图19. 【答案】(1) 由题干图知众数为70+802=75.(2) 由题干图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x−70),所以x≈73.3,即中位数为73.3.【知识点】频率分布直方图、样本数据的数字特征20. 【答案】(1) 由上面表格得0.2+0.4+x+y+0.05=1即x+y=0.35,又52=xy,所以x=0.25,y=0.1.又5z=x=0.25,所以z=20(2) 根据上一问做出的数据画出频率分步直方图.(3) 由频率分步直方图可以知道x=1.5×0.2+4.5×0.4+7.5×0.25+10.5×0.1+13.5×0.05=5.7,即乘客平均等待时间的估计值是5.7.【知识点】频率分布直方图、样本数据的数字特征、频率与频数21. 【答案】这20名男生的平均体重为65+56+70+⋯+68+58+6620=67.85(kg).20名男生中体重在60∼75kg之间的人数为12,故这20名男生体重在60∼75kg之间的人数所占比例为1220=0.6.所以佔计该校高一男生的平均体重约为67.85kg,体重在60∼75kg之间的人数所占比例约为0.6.【知识点】样本数据的数字特征22. 【答案】平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但是平均数受数据中极端值的影响较大.【知识点】样本数据的数字特征。

众数、中位数、平均数与频率分布直方图的关系(精选)共21页PPT

众数、中位数、平均数与频率分布直方图的关系(精选)共21页PPT

41、学问是异常珍贵的东西,从任何源泉吸 收都不可耻。——阿卜·日·法拉兹
42、只有在人群中间,才能认识自 己。——德国
43、重复别人所说的话,只需要教育; 而要挑战别人所说的话,则需要头脑。—— 玛丽·佩蒂博恩·普尔
44、卓越的人一大优点是:在不利与艰 难的遭遇里百折不饶。——贝多芬
45、自己的饭量自己知道。——苏联
众数、中位数、平均数与频率分布直方 图的关系(精选)
56、死去何所道,托体同山阿。 57、春秋多佳日,登高赋新诗。 58、种豆南山下,草盛豆苗我衣 。衣沾 不足惜 ,但使 愿无违 。 59、相见无杂言,但道桑麻长。 60、迢迢新秋夕,亭亭月将圆。

最新众数、中位数、平均数与频率分布直方图的关系

最新众数、中位数、平均数与频率分布直方图的关系
(其中nk是xk的权数, n为样本容量, 且n1+n2 +……nk=n. ) 3、 已知xn的平均数为x, 则kxn+b的平均数为kx+b。
二 、 众数、中位数、平均数 与频率分布直方图的关系
(在只有频率分布直方图的情况下,也可以估计总体特征,而且直方图比较直观 便于形象地进行分析。)
1、众数在样本数据的频率分布直方图中, 就是最高矩形的中点的横坐标。
频数
20 30 80 40 30 200
频率
0.10 0.15 0.40 0.20
0.15 1
累积频率 0.10 0.25 0.65 0.85 1
0 100 200300400 500 600 寿命(h)
总体分布的估计
(3)由频率分布表 出可 ,以 寿看 命 10在 h0~400
的电子元件出现 为的 :0.6频 5,率 所以我们估计电子
1、通过频率分布直方图的估计精度低;
2、通过频率分布直方图的估计结果与数据分组 有关;
3、在不能得到样本数据,只能得到频率分布直 方图的情况下,也可以估计总体特征,而且直方图 比较直观便于形象地进行分析。
20
30
80
40
30
(1)列出频率分布表;
(2)画出频率分布直方图; (3)估计电子元件寿命在100h~400h以内的概率; (4)估计电子元件寿命在400h以上的概率; (5)估计总体的数学期望.
寿命 100~200 200~300 300~400 400~500 500~600
合计
频率/组距
总体分布的估计
1002000.102003000.153004000.40
2
2
2
4005000.205006000.15151409082.5365.

频数、频率和频数分布直方图(共16张PPT)

频数、频率和频数分布直方图(共16张PPT)

身高(shēn ɡāo)(cm)
随堂练习

为了了解某地区八年级学生(xuésheng)的身高情况,现随机抽 取了60名八年级男生,测得他们的身高(单位:cm)分别为:
(1)将数据适当(shìdàng)分组,并绘制相应的频数分布直方图;
(2)如果身高在155-169cm的学生身高为正常身高,试求身高 在正常范围内的学生人数的百分比。
(2)决定组距与组数: 当组距为4时,23÷4=5.75,所以可分为6组。
(3)决定分点:
数据越多,分的组数也应越多,当数据在100以
内时,通常按照数据的多少,分成5~12组.
第十页,共16页。
常用(chánɡ yònɡ)的方法有:
1、半开半闭区间(qū jiān)法
2、把最小值减小一点作为(zuòwéi)最左端分点,把最大值加大一点 作为(zuòwéi)右端分点,即分点数据比已知数据精度高一位。
第十一页,共16页。
(4)列频数(pín shù)分布 表:
2
3 6
12
7
2
第十二页,共16页。
0.0625 0.09375
0.1875
0.375
0.21875 0.0625
频数 (pín
shù1)4 12
10
8 6
4 2
0
12
6
3
2
7
2
146 150 154 158 162 166 170
第十三页,共16页。
频数 频率(pín数lǜ据)=总数
频数(pín频s率hù×)= 数据总数
数据总数=
频数 频率
第六页,共16页。
练习(lià nxí) : 1.某班60名同学中,身高为1.50米 —1.65米的人数为12人,那么这组 数据的频数是___,频率是____. 2.某班学生参加考试,分数是60-70 分的组的人数20,该组的频率是 0.20,则这班有__人.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

谢谢观看! 2020
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
三 三种数字特征的优缺点
1、众数体现了样本数据的最大集中 点,但它对其它数据信息的忽视使得无 法客观地反映总体特征.如上例中众数是 2.25t,它告诉我们,月均用水量为2.25t的 居民数比月均用水量为其它数值的居民 数多,但它并没有告诉我们多多少.
二 、 众数、中位数、平均数 与频率分布直方图的关系
1、众数在样本数据的频率分布直方图 中,就是最高矩形的中点的横坐标。
例如,在上一节调查的100位居民的月 均用水量的问题中,从这些样本数据的频 率分布直方图可以看出,月均用水量的众 数是2.25t.如图所示:
频率分布直方图如下:
频率 组距
众数(Байду номын сангаас高的矩形的中点)
2200 1500
1100
2000 100 6900
(1)指出这个问题中周工资的众数、中
位数、平均数 (2)这个问题中,工资的平均数能客观
地反映该厂的工资水平吗?为什么?
分析:众数为200,中位数为220,
平均数为300。
因平均数为300,由表格中所列 出的数据可见,只有经理在平均数以 上,其余的人都在平均数以下,故用 平均数不能客观真实地反映该工厂的 工资水平。
3、平均数是频率分布直方图的“重 心”.
是直方图的平衡点. n 个样本数据的平均 数的估计值等于频率分布直方图中每个 小矩形的面积乘以小矩形底边中点的横 坐标之和。 给出.下图显示了居民月均用水量的平 均数: x=2.02
频率分布直方图如下:
频率 组距
平均数
0.50
0.40
0.30
0.20
0.10
0.50
0.40
0.30
0.20
0.10
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
2、在样本中,有50%的个体小于或等于 中位数,也有50%的个体大于或等于中位 数,因此,在频率分布直方图中,中位数 左边和右边的直方图的面积应该相等,由 此可以估计中位数的值。下图中虚线代表 居民月均用水量的中位数的估计值,此数 据值为2.02t.
2、中位数是样本数据所占频率 的等分线,它不受少数几个极端值的 影响,这在某些情况下是优点,但它 对极端值的不敏感有时也会成为缺点。 如上例中假设有某一用户月均用水量 为10t,那么它所占频率为0.01,几乎 不影响中位数,但显然这一极端值是不 能忽视的。
3、由于平均数与每一个样本的 数据有关,所以任何一个样本数据的 改变都会引起平均数的改变,这是众 数、中位数都不具有的性质。也正因 如此 ,与众数、中位数比较起来,平
一 众数、中位数、平均数的概念
众数、中位数、平均数都是描述一组数据的集中 趋势的特征数,只是描述的角度不同,其中以平均数 的应用最为广泛.
1众数:在一组数据中,出现次数最多的数据叫做这 组数据的众数.
2中位数:将一组数据按大小依次排列,把处在最中间 位置的一个数据(或最中间两个数据的平均数)叫做这组 数据的中位数.
分别求这些运动员成绩的众数,中位数与 平均数
解:在17个数据中,1.75出现了4次,出现的 次数最多,即这组数据的众数是1.75.
上面表里的17个数据可看成是按从小到大 的顺序排列的,其中第9个数据1.70是最中间的 一个数据,即这组数据的中位数是1.70;
这组数据的平均数是
答:17名运动员成绩的众数、中位数、平均数 依次是1.75(米)、1.70(米)、1.69(米).
均数可以反映出更多的关于样本数据 全体的信息,但平均数受数据中的极 端值的影响较大,使平均数在估计时 可靠性降低。
四 众数、中位数、平均数的 简单应用
例 某工厂人员及工资构成如下:
人员
经理 管理人员 高级技工 工人 学徒 合计
周工资 2200 250
220
200 100
人数
16
5
10 1 23
合计
3平均数 (1) x = (x1+x2+……+xn) /n
(2) x =(x1f1+x2f2+……xkfk)/n
练习: 在一次中学生田径运动会上, 参加男子跳高的17名运动员的成绩如下 表所示:
成绩 (单位:米)
1.50
1.60
1.65
1.70
1.75
1.80
1.85
1.90
人数 2 3 2 3 4 1 1 1
频率分布直方图如下:
频率 组距
中位数
0.50
0.40
0.30
0.20
0.10
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
说明:
2.02这个中位数的估计值,与样本 的中位数值2.0不一样,这是因为样本数 据的频率分布直方图,只是直观地表明 分布的形状,但是从直方图本身得不出 原始的数据内容,所以由频率分布直方 图得到的中位数估计值往往与样本的 实际中位数值不一致.
相关文档
最新文档