用直方图算平均数-中位数、众数、标准差
_众数,中位数,平均数与频率分布直方图
谢谢观看! 2020
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
三 三种数字特征的优缺点
1、众数体现了样本数据的最大集中 点,但它对其它数据信息的忽视使得无 法客观地反映总体特征.如上例中众数是 2.25t,它告诉我们,月均用水量为2.25t的 居民数比月均用水量为其它数值的居民 数多,但它并没有告诉我们多多少.
二 、 众数、中位数、平均数 与频率分布直方图的关系
1、众数在样本数据的频率分布直方图 中,就是最高矩形的中点的横坐标。
例如,在上一节调查的100位居民的月 均用水量的问题中,从这些样本数据的频 率分布直方图可以看出,月均用水量的众 数是2.25t.如图所示:
频率分布直方图如下:
频率 组距
众数(Байду номын сангаас高的矩形的中点)
2200 1500
1100
2000 100 6900
(1)指出这个问题中周工资的众数、中
位数、平均数 (2)这个问题中,工资的平均数能客观
地反映该厂的工资水平吗?为什么?
分析:众数为200,中位数为220,
平均数为300。
因平均数为300,由表格中所列 出的数据可见,只有经理在平均数以 上,其余的人都在平均数以下,故用 平均数不能客观真实地反映该工厂的 工资水平。
3、平均数是频率分布直方图的“重 心”.
是直方图的平衡点. n 个样本数据的平均 数的估计值等于频率分布直方图中每个 小矩形的面积乘以小矩形底边中点的横 坐标之和。 给出.下图显示了居民月均用水量的平 均数: x=2.02
频率分布直方图如下:
频率 组距
平均数
0.50
0.40
0.30
众数、中位数、平均数与样本频率分布直方图的关系
频率 组距
1
初中统计部分曾学过用什么来反映总体的水平? 用什么来考察稳定程度?它们是怎么定义的?
在初中我们学过用平均数、众数和中位数反映总体 的水平,用方差考察稳定程度。
1、众数:在一组数据中,出现次数最多的数据叫做 这组数据的众数
2、中位数:将一组数据按大小依次排列,把处在 最中间位置的一个数据(或最中间两个数据的平均 数)叫做这组数据的中位数
(1)求分数在[120,130) 内的频率,并补全这个 频率分布直方图
(2)估计本次考试的 平均分、众数、 中位数
9
【解析】(1)分数在[120,130)内的频率为: 1-(0.1+0.15+0.15+0.25+0.05)=1-0.7=0.3
频率 组距
0.3 10
0.03补全后的直方图如图:
(2)众数为125
0.6 0.5 0.4 0.3 0.2
面积有样关数本系的数?比据重的愈频大率,所分以布为直了公
0.25 0.22
0.15
0.14
方图乘平样小数图中以中体本,先在用中每小现平我乘,频其,个矩各各 均 们以率 区等 小 形个个数把其分 间于 长 底组小中每所布 的频 方 边的组所个在直 中的占的小率 形 中平平比小组方 点分 面 点均均例长的图 表布 积 的数数的方平在大形均 横的坐面示标积即之,区和然间后的再两相加个所端得到
走进高考
24
走进高考
25
课外探究
26
走进高考
27
走进高考
28
29
30
31
32
33
解题
34
学习
35
思考题
7用频率分布直方图估计总体的数字特征
用频率分布直方图估计总体的数字特征
众数、中位数、平均数、 方差、 标准差
教学目标: 1.能用频率分布直方图估计总体的平均数,
正确理解样本数据标准差的意义,会计算数据 的标准差。
2.会用样本的基本数字特征估计总体的基 本数字特征。
3,理解数形结合的数学思想和逻辑推理 的数学方法。
本课重点:中位数,平均数的计算,方差的意 义和计算方法。
成绩(单 位: 米)
人数
1.50 1.60 1.65
2
3
2
1.70 3
1.75 4
1.80 1
1.85 1
1.90 1
分别求这些运动员成绩的众数,中位数与 平均数
解:在17个数据中,1.75出现了4次,出现的 次数最多,即这组数据的众数是1.75.
上面表里的17个数据可看成是按从小到大 的顺序排列的,其中第9个数据1.70是最中间的 一个数据,即这组数据的中位数是1.70;
解:(1)由直方图的性质可得 (0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1, 解方程得x=0.0075, ∴直方图中x的值为0.0075
(2)月平均用电量的众数是230. 前三组的频率为(0.002+0.0095+0.011)×20=0.45<0.5 第四组的频率为0.0125×20=0.25
利用频率直方图求中位数、众数、平均数-高考数学微专题突破含详解
高考数学微专题突破利用频率分布直方图求中位数、平均数、总数一、单选题1.某校为了解高二年级学生某次数学考试成绩的分布情况,从该年级的1120名学生中随机抽取了100名学生的数学成绩,发现都在[]80,150内现将这100名学生的成绩按照[)8090,,[)90100,,[)100110,,[)110120,,[)120130,,[)130140,,[]140150,分组后,得到的频率分布直方图如图所示,则下列说法正确的是()A .频率分布直方图中a 的值为0.040B .样本数据低于130分的频率为0.3C .总体的中位数(保留1位小数)估计为123.3分D .总体分布在[)90100,的频数一定与总体分布在[)100110,的频数相等2.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n 个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已知学习时长在[)9,11的学生人数为25,则n 的值为()A .40B .50C .80D .1003.某地工商局对辖区内100家饭店进行卫生检查并评分,分为甲、乙、丙、丁四个等级,其中分数在[)60,70,[)70,80,[)80,90,[]90,100内的等级分别为:丁、丙、乙、甲,对饭店评分后,得到频率分布折线图,如图所示,估计这些饭店得分的平均数是()A .80.5B .80.6C .80.7D .80.84.下面是甲、乙两位同学高三上学期的5次联考数学成绩,现在只知其从第1次到第5次分数所在区间段分布的条形图(从左至右依次为第1至第5次),则从图中可以读出一定正确的信息是()A .甲同学的成绩的平均数大于乙同学的成绩的平均数B .甲同学的成绩的方差大于乙同学的成绩的方差C .甲同学的成绩的极差小于乙同学的成绩的极差D.甲同学的成绩的中位数小于乙同学的成绩的中位数5.下面是追踪调查200个某种电子元件寿命(单位:h)频率分布直方图,如图:其中300-400、400-500两组数据丢失,下面四个说法中有且只有一个与原数据相符,这个说法是①寿命在300-400的频数是90;②寿命在400-500的矩形的面积是0.2;③用频率分布直方图估计电子元件的平均寿命为:⨯+⨯+⨯+⨯+⨯1500.12500.153500.454500.155500.15④寿命超过400h的频率为0.3A.①B.②C.③D.④6.为了解某电子产品的使用寿命,从中随机抽取了100件产品进行测试,得到图示统计图.依据统计图,估计这100件产品使用寿命的中位数为()A.218.25B.232.5C.231.25D.241.25 7.为了让学生了解社会,拓宽视野,丰富知识,提高社会实践能力和综合素质,哈三中团委组织学生参加了抽测一批棉花的纤维长度(单位:cm)的社会实践活动.利用所学习的数学知识,同学们作出了样本的频率分布直方图.现在,由于原始数据不全,只能通过直方图来估计这一批棉花的纤维长度的平均值(同一组数据用这组数据所在区间的中点的值代替).则估计的平均值为()A.21.75B.22.25C.23.75D.20.75 8.为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是()A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有32人9.某地气象局把当地某月(共30天)每一天的最低气温作了统计,并绘制了如下图所示的统计图.记这组数据的众数为M,中位数为N,平均数为P,则()A .M N P <<B .N M P <<C .P M N <=D .P N M<<10.在某次高中学科竞赛中,4000名考生的参赛成绩按[)40,50,[)50,60,[)60,70,[)70,80,[)80,90,[)90,100分成六组,其频率分布直方图如图所示,则下列说法中错误的是().A .成绩在[)70,80内的考生人数最多B .不及格(60分以下)的考生人数约为1000人C .考生竞赛成绩平均分的估计值为70.5分D .考生竞赛成绩中位数的估计值为75分11.在2019年某省普通高中学业水平考试(合格考)中,对全省所有考生的物成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[)40,50,[)50,60,[)60,70,[)80,90,[]90,100,90分以上为优秀,则下列说法中不正确的是()A .从全体考生中随机抽取1000人,则其中得优秀考试约有100人B .若要全省的合格考通过率达到96%,则合格分数线约为44分C .若同一组中数据用该组区间中间值作代表值,可得考试物理成绩的平均分约为70D .该省考生物理成绩的中位数为75分第II 卷(非选择题)请点击修改第II 卷的文字说明二、填空题12.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.则估计高一参赛学生的成绩的众数、中位数分别为____________.13.某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:g )绘制的频率分布直方图,样本数据分为8组,分别为[)80,82,[)82,84,[)84,86,[)86,88,[)88,90,[)90,92,[)92,94,[]94,96,则样本的中位数在第______组14.某中学举行了一场音乐知识竞赛,将参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图.根据频率分布直方图,同一组数据用该区间的中点值代替,估计这次竞赛的平均成绩为______分.三、双空题15.根据高二某班50名同学的数学成绩,绘制频率分布直方图如图所示,虽不小心将其中一个数据污染了,但依然可以推断这个被污染的数据为_________,该班同学的成绩众数为_________.16.中小学生的视力状况受到社会的广泛关注,某市有关部门从全市6万名高一学生中随机抽取了400名,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示.从左至右五个小组的频率之比依次是5∶7∶12∶10∶6,则这400名学生视力的众数为________,中位数为________.四、解答题17.有一种鱼的身体吸收汞,一定量身体中汞的含量超过其体重的61.0010-⨯的鱼被人食用后,就会对人体产生危害.某海鲜市场进口了一批这种鱼,质监部门对这种鱼进行抽样检测,在30条鱼的样本中发现的汞含量(乘以百万分之一)如下:0.070.340.950.98 1.020.98 1.37 1.400.39 1.021.44 1.580.54 1.080.710.70 1.20 1.24 1.62 1.681.85 1.300.810.820.84 1.39 1.262.200.91 1.31(1)完成下面频率分布表,并画出频率分布直方图;频率分布表:分组频数频率[)0,0.50[) 0.50,1.001 3[) 1.00,1.50[) 1.50,2.002 15[)2.00,2.5011 30合计301频率分布直方图:(2)根据频率分布直方图估算样本数据的平均值(保留小数点后两位,同一组中的数据用该组区间中点值代表),并根据频率分布直方图描述这批鱼身体中汞含量的分布规律.18.经历过疫情,人们愈发懂得了健康的重要性,越来越多的人们加入了体育锻炼中,全民健身,利国利民,功在当代,利在千秋.一调研员在社区进行住户每周锻炼时间的调查,随机抽取了300人,并对这300人每周锻炼的时间(单位:小时)进行分组,绘制成了如图所示的频率分布直方图:(1)补全频率分布直方图,并估算该社区住户每周锻炼时间的中位数(精确到0.1);(2)若每周锻炼时间超过6小时就称为运动卫士,超过8小时就称为运动达人.现利用分层抽样的方法从运动卫士中抽取5人,再从这5人中抽取2人做进一步调查,求抽到的2人中恰有1人为运动达人的概率.19.经历过疫情,人们愈发懂得了健康的重要性,越来越多的人们加入了体育锻炼中,全民健身,利国利民,功在当代,利在千秋.一调研员在社区进行住户每周锻炼时间的调查,随机抽取了300人,并对这300人每周锻炼的时间(单位:小时)进行分组,绘制成了如图所示的频率分布直方图:(1)补全频率分布直方图,并估算该社区住户每周锻炼时间的中位数(精确到0.1);(2)若每周锻炼时间超过6小时就称为运动卫士,超过8小时就称为运动达人.现利用分层抽样的方法从运动卫士中抽取10人,再从这10人中抽取3人做进一步调查,设抽到的人中运动达人的人数为X ,求随机变量X 的分布列及期望.20.某贫困地区经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入、实现2020年脱贫的工作计划,该地扶贫办统计了2019年50位农民的年收入并制成如图频率分布直方图:(1)根据频率分布直方图,估计这50位农民的平均年收入x (单位:千元,同一组数据用该组数据区间的中点值表示);(2)为推进精准扶贫,某企业开设电商平台,让越来越多的农村偏远地区的农户通过经营网络商城脱贫致富.甲计划在A 店,乙计划在B 店同时参加一个订单“秒杀”抢购活动,其中每个订单由()*2,n n n N ≥∈个商品W 构成,假定甲、乙两人在A 、B 两店订单“秒杀”成功的概率分别为p 、q ,记甲、乙两人抢购成功的订单总数量、商品W 总数量分别为X 、Y .①求X 的分布列及数学期望()E X ;②若27sin4n p n n ππ=-,sin4n q nπ=,求当Y 的数学期望()E Y 取最大值时正整数n 的值.21.某地处偏远山区的古镇约有人口5000人,为了响应国家号召,镇政府多项并举,鼓励青壮劳力外出务工的同时发展以旅游业为龙头的乡村特色经济,到2020年底一举脱贫.据不完全统计该镇约有20%的人外出务工,下图是根据2020年扶贫工作期间随机调查本地100名在外务工人员的年收入(单位:千元)数据绘制的频率分布直方图.(1)根据样本数据估计该镇外出务工人员的创收总额(同一组中的数据用该组区间的中点值为代表);(2)完成脱贫任务后,古镇党政班子并不懈怠,决心带领全镇人民在奔小康道路上再上一个新台阶,出台了多项优惠政策,鼓励本地在外人员返乡创业,调查显示年收入在35千元(含35千元)以上的人中有60%的人愿意返乡投资创业,年收入在35千元以下的人中有40%的人愿意返乡投资创业,请从样本数据中完成下面的22⨯列联表,并判断能否在犯错误的概率不超过0.1的前提下认为“是否愿意返乡投资创业和年收入有关”.35千元(含35千元)以上35千元以下愿意返乡投资创业不愿意返乡投资创业附:()()()()()22n ad bc X a b c d a c b d -=++++,()20P X k ≥0.100.050.0250.0100k 2.7063.8415.0246.63522.某市为大力推进生态文明建设,把生态文明建设融入市政建设,打造了大型植物园旅游景区.为了了解游客对景区的满意度,市旅游部门随机对景区的100名游客进行问卷调查(满分100分),这100名游客的评分分别落在区间[)50,60,[)60,70,[)70,80,[)80,90,[]90,100内,且游客之间的评分情况相互独立,得到统计结果如频率分布直方图所示.(1)求这100名游客评分的平均值(同一区间的数据用该区间数据的中点值为代表);(2)视频率为概率,规定评分不低于80分为满意,低于80分为不满意,记游客不满意的概率为p .(ⅰ)若从游客中随机抽取m 人,记这m 人对景区都不满意的概率为m a ,求数列{}m a 的前4项和;(ⅱ)为了提高游客的满意度,市旅游部门对景区设施进行了改进,游客人数明显增多,对游客进行了继续旅游的意愿调查,若不再去旅游记1分,继续去旅游记2分,每位游客有继续旅游意愿的概率均为p ,且这次调查得分恰为n 分的概率为n B ,求4B .23.2016年春节期间全国流行在微信群里发、抢红包,现假设某人将688元发成手气红包50个,产生的手气红包频数分布表如下:金额分组[)1,5[)5,9[)9,13[)13,17[)17,21[)21,25频数39171182(1)求产生的手气红包的金额不小于9元的频率;(2)估计手气红包金额的平均数(同一组中的数据用该组区间的中点值作代表);(3)在这50个红包组成的样本中,将频率视为概率.①若红包金额在区间[]21,25内为最佳运气手,求抢得红包的某人恰好是最佳运气手的概率;②随机抽取手气红包金额在[)[]1,521,25⋃内的两名幸运者,设其手气金额分别为m ,n ,求事件“16m n ->”的概率.24.绿色已成为当今世界主题,绿色动力已成为时代的驱动力,绿色能源是未来新能源行业的主导.某汽车公司顺应时代潮流,最新研发了一款新能源汽车,并在出厂前对100辆汽车进行了单次最大续航里程(理论上是指新能源汽车所装载的燃料或电池所能够提供给车行驶的最远里程)的测试.现对测试数据进行分析,得到如图所示的频率分布直方图.(1)估计这100辆汽车的单次最大续航里程的平均值x (同一组中的数据用该组区间的中点值代表);(2)根据大量的汽车测试数据,可以认为这款汽车的单次最大续航里程X 近似地服从正态分布()2,N μσ,经计算第(1)问中样本标准差s 的近似值为50.用样本平均数x作为μ的近似值,用样本标准差s 作为σ的估计值;(ⅰ)现从该汽车公司最新研发的新能源汽车中任取一辆汽车,求它的单次最大续航里程恰好在200千米到350千米之间的概率;(ⅱ)从该汽车公司最新研发的新能源汽车中随机抽取10辆,设这10辆汽车中单次最大续航里程恰好在200千米到350千米之间的数量为Y ,求()E Y ;(3)某汽车销售公司为推广此款新能源汽车,现面向意向客户推出“玩游戏,送大奖”活动,客户可根据抛掷硬币的结果,操控微型遥控车在方格图上行进,若遥控车最终停在“胜利大本营”,则可获得购车优惠券.已知硬币出现正、反面的概率都是12,方格图上标有第0格、第1格、第2格、…、第50格.遥控车开始在第0格,客户每掷一次硬币,遥控车向前移动一次,若掷出正面,遥控车向前移动一格(从k 到1k +),若掷出反面,遥控车向前移动两格(从k 到2k +),直到遥控车移到第49格(胜利大本营)或第50格(失败大本营)时,游戏结束.设遥控车移到第n 格的概率为(1,2,,50)n P n = ,其中01P =,试说明{}1n n P P --是等比数列,并解释此方案能否成功吸引顾客购买该款新能源汽车.参考数据:若随机变量ξ服从正态分布()2,N μσ,则()0.6827P μσξμσ-<+≈ ,(22)0.9545P μσξμσ-<+≈ ,(33)0.9973P μσξμσ-<+≈ .25.某地处偏远山区的古镇约有人口5000人,为了响应国家号召,镇政府多项并举,鼓励青壮劳力外出务工的同时发展以旅游业为龙头的乡村特色经济,到2020年底一举脱贫.据不完全统计该镇约有20%的人外出务工.下图是根据2020年扶贫工作期间随机调查本地100名在外务工人员的年收入(单位:千元)数据绘制的频率分布直方图.(1)根据样本数据怙计该镇外出务工人员的创收总额(同一组中的数据用该组区间的中点值为代表);(2)假设该镇外出务工人员年收入服从正态分布()2,N μσ,其分布密度函数为22()2()x f x μσ--=,其中μ为样本平均值.若()f x 的最大值为10π,求σ的值;(3)完成脱贫任务后,古镇党政班子并不懈怠,决心带领全镇人民在奔小康道路上再上一个新台阶,出台了多项优惠政策,鼓励本地在外人员返乡创业.调查显示务工收入在[],2μσμσ++和[]2,3μσμσ++的人群愿意返乡创业的人数比例分别为15%和20%.从样本人群收入在[],3μσμσ++的人中随机抽取3人进行调查,设X 为愿意返乡创业的人数,求随机变量X 的分布列和数学期望.参考答案1.C 【分析】对于A :由频率分布直方图中所有小矩形面积之和为1,列出等式可求得a 的值,进而作出判断;对于B :先计算高于130分的频率,然后再用1减去于高于130分的频率即可得到低于130分的频率,进而作出判断;对于C :先计算[)80,120的频率和[)120130,的频率,再求出总体的中位数,进而作出判断;对于D :根据样本分布在[)90,100的频数一定与样本分布在[)100,110的频数相等,总体分布在[)90,100的频数不一定与总体分布在[)100,110的频数相等作出判断即可.【详解】由频率分布直方图得:()0.0050.0100.0100.0150.0250.005101a ++++++⨯=,解得0.030a =,故A 错误;样本数据低于130分的频率为:()10.0250.005100.7-⨯+=,故B 错误;[)80,120的频率为:()0.0050.0100.0100.015100.4+++⨯=,[)120130,的频率为:0.030100.3⨯=,∴总体的中位数(保留1位小数)估计为:0.50.412010123.30.3-+⨯≈分,故C 正确;样本分布在[)90,100的频数一定与样本分布在[)100,110的频数相等,总体分布在[)90,100的频数不一定与总体分布在[)100,110的频数相等,故D 错误.故选:C .【点睛】本题考查频率分布直方图的应用,考查逻辑思维能力和计算能力,属于基础题.2.B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解.由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =,所以学习时长在[)9,11的频率2520.5x n==,解得50n =.故选:B .【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.3.A 【分析】根据频率分布折线图计算该组数据的平均数为650.15750.4850.2950.25⨯+⨯+⨯+⨯.【详解】由折线图可知,该组数据的平均数为650.15750.4850.2950.2580.5⨯+⨯+⨯+⨯=.故选:A.【点睛】此题考查根据频率分布折线图求平均数,关键在于熟练掌握平均数的求解公式.4.D 【分析】根据频数分布表中的数据,对选项中的命题进行分析,判断正误,即可得到本题答案.【详解】甲同学的成绩的平均数1051201201301401235x ++++<=,乙同学的成绩的平均数1051151251351451255y ++++>=,所以A 错误;甲同学的成绩从第1次到第5次变化波动比乙同学的成绩的变化波动更小一些,所以甲同学的成绩的方差小于乙同学的成绩的方差,所以B 错误;甲同学的成绩的极差介于()30,40之间,乙同学的成绩的极差介于()35,45之间,所以甲同学的成绩的极差不一定小于乙同学的成绩的极差,所以C 错误;甲同学的成绩的中位数介于()115,120之间,乙同学的成绩的中位数介于()125,130之间,所以D 正确.故选:D本题主要考查频数直方图的相关问题,其中涉及中位数、平均数、方差、极差的求解. 5.B【详解】若①正确,则300400-对应的频率为0.45,则400500-对应的频率为0.15,则②错误;电子元件的平均寿命为1500.12500.153500.454500.155500.15⨯+⨯+⨯+⨯+⨯,则③正确;寿命超过400h的频率为0.150.150.3+=,则④正确,故不符合题意;若②正确,则300400-对应的频率为0.4,则①错误;电子元件的平均寿命为1500.12500.153500.44500.25500.15⨯+⨯+⨯+⨯+⨯,则③错误;寿命超过400h的频率为0.20.150.35+=,则④错误,故符合题意.故选:B.6.C【分析】设中位数为x,根据中位数左边的频数为50列等式可求得x的值.【详解】设中位数为x,前2组的频数之和为25,前3组的频数之和为65,由题意可得20025405050x-+⨯=,解得231.25x=.故选:C.7.A【分析】利用频率分布直方图计算平均数的方法求解即可.【详解】所给数据频率之和为(0.010.070.080.020.02)51++++⨯=则估计的平均值为5(12.50.0117.50.0722.50.0827.50.0232.50.02) 4.35521.75⨯+⨯+⨯+⨯+⨯=⨯=故选:A8.D 【分析】根据样本估计总体的知识依次判断各个选项即可得到结果.【详解】对于A ,设中位数为x ,则()()0.020.065250.080.5x +⨯+-⨯=,解得:26.25x =,即该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次,A 正确;对于B ,根据频率分布直方图知众数为:253027.52+=次,B 正确;对于C ,该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有16000.045320⨯⨯=人,C 正确;对于D ,该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有16000.025160⨯⨯=人,D 错误.故选:D.9.A 【分析】由统计图分别求出该月温度的中位数,众数,平均数,由此能求出结果.【详解】解:由统计图得:该月温度的中位数为565.52N +==,众数为5M =,平均数为1(233410566372829210) 5.9730P =⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯≈.∴M N P <<.故选:A .10.D 【分析】A .根据频率分布直方图中哪一组数据的频率除以组距的值最大进行分析;B .先分析60分以下对应的频率,再利用总体数量乘以所求频率即可得到结果;C .利用每组数据的组中值乘以对应频率并将每组计算结果相加即可得到结果;D .分析频率为0.5时对应的横坐标的值即为中位数.【详解】A .根据统计图可知:[)70,80对应的频率除以组距的值最大,即频率最大,所以人数最多,故正确;B .不及格的频率为:()0.0100.015100.25+⨯=,所以不及格的人数约为40000.25=1000⨯人,故正确;C .根据频率分布直方图可知平均数为:()450.01550.015650.02750.03850.015950.011070.5⨯+⨯+⨯+⨯+⨯+⨯⨯=,故正确;D .前三组的频率之和为:()0.01+0.0150.02100.450.5+⨯=<,前四组的频率之和为:()0.01+0.0150.020.03100.750.5++⨯=>,所以中位数在第四组数据中,且中位数为:0.50.45701071.70.0310-+⨯≈⨯,故错误;故选:D.11.D 【分析】利用频率分布直方图的性质直接求解.【详解】解:对于A ,90分以上为优秀,由频率分布直方图得优秀的频率为0.010100.1⨯=,∴从全体考生中随机抽取1000人,则其中得优秀考试生约有:10000.1100⨯=人,故A 正确;对于B ,由频率分布直方图得[40,50)的频率为0.01100.1⨯=,[50,100)的频率为:10.10.9-=,∴若要全省的合格考通过率达到96%,则合格分数线约为44分,故B 正确;对于C ,若同一组中数据用该组区间中间值作代表值,可得考试物理成绩的平均分约为:450.01010550.01510650.02010750.03010850.01510950.0101070.5⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=分,故C 正确;对于D ,[40,70)的频率为:(0.0100.0150.020)100.45++⨯=,[70,80)的频率为0.030100.3⨯=,∴该省考生物理成绩的中位数为:0.50.45701071.670.3-+⨯≈分,故D 错误.故选:D .【点睛】本题考查频数、合格分数线、平均数、中位数的求法,考查频率分布直方图的性质等基础知识,考查运算求解能力,属于基础题.12.65,65【分析】频率分布直方图中最高矩形的中点横坐标即为众数,利用平分矩形面积可得中位数.【详解】由题图可知众数为65,又∵第一个小矩形的面积为0.3,∴设中位数为60+x ,则0.3+x ×0.04=0.5,得x =5,∴中位数为60+5=65.故答案为:65,6513.四【分析】计算前几组的频率之和,判断频率为0.5在哪个区间即可判断中位数.【详解】根据频率分布直方图可知,前三组的频率之和为()0.03750.06250.07520.350.5++⨯=<,前四组的频率之和为()0.03750.06250.0750.120.550.5+++⨯=>,则可以判断中位数在第四组.故答案为:四.【点睛】本题考查根据频率分布直方图判断中位数所在区间,属于基础题.14.67.【分析】本题根据频率分布直方图直接求平均数即可.【详解】解:这次竞赛的平均成绩为:0.03055100.04065100.01575100.01085100.005951067⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=故答案为:67.【点睛】本题考查根据频率分布直方图求平均数,是基础题.15.0.016130【分析】利用频率分布直方图中所有矩形的面积之和为1可求得污染的数据;利用最高矩形底边的中点值可求得众数.【详解】设被污染的数据为a ,利用频率分布直方图中所有矩形的面积之和为1可得0.004100.02100.028100.03210101a ⨯+⨯+⨯+⨯+⨯=,解得0.016a =.由图可知,该班同学的成绩众数为130.故答案为:0.016,13016.4.7 4.75【分析】根据频率分布直方图,取最高矩形底边中点的横坐标即可求出众数,求出第三小组矩形的高,设中位数为x ,由()0.1250.175 4.5510.5x ++-⨯=,解方程即可求解.【详解】由图可知,众数为4.7,第五小组的频率为0.50.30.15⨯=从左至右五个小组的频率之比依次是5∶7∶12∶10∶6,可得第一小组的频率为50.150.1256⨯=,第二小组的频率为70.150.1250.1756⨯==,第三小组的频率为120.150.36⨯=,所以中位在第三小组,第三小组矩形面积为0.3,则第三小组的高为0.310.3=设中位数为x ,则()0.1250.175 4.5510.5x ++-⨯=,解得 4.75x =故答案为:4.7;4.75【点睛】本题考查了根据频率分布直方图求众数、中位数,考查了运算求解能力,属于基础题. 17.(1)填表见解析;作图见解析;(2)平均值为:1.08,答案见解析.【分析】(1)由样本数据,即可完善频率分布表中的数据,并画出频率直方图.(2)由(1)的频率直方图计算样本均值,进而描述汞含量分布规律.【详解】(1)由题设样本数据,则可得频率分布表如下,分组频数频率[)0,0.5031 10[)0.50,1.00101 3[)1.00,1.50122 5[)1.50,2.0042 15[)2.00,2.5011 30合计301(2)根据频率分布直方图估算平均值为:112210.250.75 1.25 1.75 2.25 1.0810351530⨯+⨯+⨯+⨯+⨯≈,分布规律:①该频率分布直方图呈中间高,两边低,大多数鱼身体中汞含量主要集中在区间[]0.5,1.5;②汞含量在区间[]1,1.5的鱼最多,汞含量在区间[]0.5,1的次之,在区间[]2,2.5的最少;③汞含量超过61.0010-⨯的数据所占比例较大,这说明这批鱼被人食用,对人体产生危害的可能性比较大.18.(1)作图见解析;中位数为4.3;(2)35.【分析】(1)设中位数为x ,则有()40.150.05x -⨯=,故可求中位数.(2)利用古典概型的概率公式可求概率.【详解】解:(1)第二组的频率为()120.150.0750.050.10.25-⨯+++=,故第二组小矩形的高为0.125频率分布直方图如图所示,由频率分布直方图可得,第一组和第二组的频率之和为0.20.250.450.5+=<,前三组的频率之和为0.20.250.30.750.5++=>,可知中位数在第三组,设中位数为x ,则有()40.150.50.450.05x -⨯=-=,解得134.33x =≈,所以该社区住户每周锻炼时间的中位数为4.3;。
第63讲 根据频率分布直方图求中位数众数和平均数-高中数学常见题型解法归纳反馈训练
【知识要点】一、用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计总体的数字特征),需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本容量越大,估计的结果也就越精确,分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.二、频率分布是指一个样本数据在各个小范围内所占比例的大小.一般是用频率分布直方图反映样本频率分布.三、样本的数字特征众数:就是数据中出现次数最多的那个,比其他的都多,如果几个数据出现的次数都是最多,则它们都是众数;每个数据都只有一次,那么数据没有众数.所以众数可以不止一个或者没有.中位数:就是这些数据排列好了以后中间的那个数字,那么如果有偶数个数据,那么就是中间两个数字的平均数,如果有奇数个数据,则中间那个就是数据的中位数.所以数据的中位数不一定在数据中.平均数:这个就是把所有数据相加,除以个数,就是数据的平均数. nx n++(n x x ++-(n x x ++-四、茎叶图茎叶图又称“枝叶图”,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少.当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出的叶子,因此通常把这样的图叫做茎叶图.【方法讲评】【例1】对某小区100户居民的月均用水量进行统计,得到样本的频率分布直方图如图,则估计此样本的众数、中位数分别为()A. 2.25,2.5 B.2.25,2.02 C.2,2.5 D.2.5,2.25【点评】(1)求频率分布图中的众数,一般先计算出频率分布直方图中的每个小矩形的面积,找到面积最大的那个矩形,取该矩形的横边中点对应的数为众数.(2)求众数也可以直接找最高矩形的横边的中点.【反馈检测1】某学校900名学生在一次百米测试中,成绩全部介于13秒与18秒之间,抽取其中50个样本,将测试结果按如下方式分成五组:第一组[13,14],第二组[14,15),…,第五组[17,18],如图是按上述分组方法得到的频率分布直方图.(1)若成绩小于14秒认为优秀,求该样本在这次百米测试中成绩优秀的人数;(2)请估计学校900名学生中,成绩属于第四组的人数;(3)请根据频率分布直方图,求样本数据的众数和中位数.【例2】高二某班50名学生在一次百米测试中,成绩全部都介于13秒到18秒之间,将测试结果按如下方式分成五组,第一组[13,14),第二组[14,15)…第五组[17,18],如图是按上述分组方法得到的频率分布直方图.(1)若成绩大于等于14秒且小于16秒规定为良好,求该班在这次百米测试中成绩为良好的人数. (2)请根据频率分布直方图,估计样本数据的众数和中位数(精确到0.01).(3)设n m ,表示该班两个学生的百米测试成绩,已知[)[]18,1714,13, ∈n m ,.6个基本事件组成.【点评】求频率分布直方图中的中位数,一般先计算出每个小矩形的面积,通过解方程找到左边面积为0.5的点P ,点P 对应的数就是中位数.【反馈检测2】某公路段在某一时刻内监测到的车速频率分布直方图如图所示. (Ⅰ)求纵坐标中参数h 的值及第三个小长方形的面积; (Ⅱ)求车速的众数1v ,中位数2v 的估计值;1122n n xx p x p x p 计算.的中点对应的数,n p 代表第n 个矩形的面积【例3】某校从参加考试的学生中抽出60名学生,将其成绩(均为整数)分成六组[40,50),[50,60)...[90,100]后画出如下部分频率分布直方图.观察图形的信息,回答下列问题: (Ⅰ)求成绩落在[70,80)上的频率,并补全这个频率分布直方图; (Ⅱ) 估计这次考试的及格率(60分及以上为及格)和平均分;(Ⅲ) 从成绩是70分以上(包括70分)的学生中选两人,求他们在同一分数段的概率.【解析】(Ⅰ)成绩落在[70,80)上的频率是0.3,频率分布直方图如下图.(Ⅲ) 成绩是70分以上(包括70分)的学生人数为(0.03+0.025+0.005)×10×60=36 所以所求的概率为【点评】求频率分布直方图中的平均数,1122n n x x p x p x p 计算.其中nx 代表第n 个矩形的横边的中点对应的数,n p 代表第n 个矩形的面积.【反馈检测3】某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100]. (1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[50,90)之外的人数.高中数学常见题型解法归纳及反馈检测第63讲: 根据频率分布直方图求中位数众数和平均数参考答案【反馈检测1答案】(1)3;(2)288;(3)15.5,15.74.【反馈检测2答案】(1)0.01h =,第三个小长方形的面积为65;(2)1265,62.5v v ==;(3【反馈检测2详细解析】(Ⅰ)∵所有小长形面积之和为1,∴10h +10×3h +10×4h +10×2h =1, 解得h =0.01, ∴第三个小长方形的面积为:10×4h =10×0.04=0.4. (Ⅱ)车速的众数1v =,车速的中位数是两边直方图的面积相等, 于是得:10×0.01+10×0.03+(2v ﹣60)×0.04=0.5,解得2v =62.5.×10×45+0.03×10×55+0.04×10×65+0.02×10×75=62. 【反馈检测3答案】(1)005.0=a ;(2)73;(3)10.【反馈检测3详细解析】(1)依题意得,()104.003.002.0210=+++a ,解得005.0=a(2)这100名学生语文成绩的平均分为:()分7305.0952.0853.0754.06505.055=⨯+⨯+⨯+⨯+⨯ (3)数学成绩在[50,60)的人数为:100×0.05=5数学成绩在[60,70[70,80数学成绩在[80,90所以数学成绩在[50,90)之外的人数为:102540205100=----。
中位数平均数众数方差
A.304.6 B.303.6 C.302.6 D.
解析:
=303.6.
答案:B
3.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差 为( )
分数
5
4
3
2
1
人数
20
10
30
30
10
A.
B.
C.3
D.
解析:由标准差公式计算可得.
答案:B
4.( ·湖北卷)如图是样本容量为200的频率 分布直方图. 根据样本的频率分布直方图估计, 样本数据落在[6,10)内的频数为________, 数据落在[2,10)内的概率约为________. 解析:200××4=64;(0.02+0.08)×4=0.4. 答案:64
C.丙地:中位体数为方2,差众是数为反3映总体的波动情况的一个量,二者反映的角度不同,不可相
A.甲地:总体均值为3,中位数为4
(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;
A.甲地:总体互均值比为较3,,中位但数有为4些问题在总体期望值差距不大时,可考虑用总体方差进一
根据样本的频率分布直方图估计,
4.众数、中位数、平均数
(1)在一组数据中,出现次数 较多 的数据叫做这组数据的众数.
(2)将一组数据按大小依次排列,把处在中间 位置的一个数据(或中间两个数据的平
均数)叫做这组数据的中位数.
(3)如果有n个数x1,x2,…,xn,那么 5.标准差和方差
叫做这n个数的平均数.
(1)标准差是样本数据到平均数的一种 平均距离 .
思维点拨:已知一组数据x1,x2,…,xn,其平均数为 ,方差为
平均数、中位数、众数描述其集中趋势,方差和标准
经典:众数、中位数、平均数与频率分布直方图的关系
分布直方图如图3,则这20名工人中一天生产
该产品 数量在
的中位 数.
3、平均数是频率分布直方图的“重心”.
是直方图的平衡点. n 个样本数据的平均数由 公式:
X= n 1(x1x2xn)
假设每组数据分别为〔a1, b1)、 〔a2, b2)、 … … 〔ak, bk)时, 且每组数据相应的 频率分别为f1、 f2 、 …… fk;那么样本的平 均数(或总体的数学期望)由下列公式计算即 可。
1002000.102003000.153004000.40
2
2
2
4005000.205006000.15151409082.5365.
2
2
我 们 估 计 总 体 生子产元的件电的 寿 命 的
期 望 值 ( 总 体 均36值5. ) 为
思考:从样本数据可知,所求得该样本的众 数、中位数和平均数,这与我们从样本频率 分布直方图得出的结论有偏差,你能解释一 下原因吗?
频数
20 30 80 40 30 200
频率
0.10 0.15 0.40 0.20
0.15 1
累积频率 0.10 0.25 0.65 0.85 1
0 100 200300400 500 600 寿命(h)
总体分布的估计
(3)由频率分布表 出可 ,以 寿看 命 10在 h0~400
的电子元件出现 为的 :0.6频 5,率 所以我们估计电子
元件寿命 10在 h0~40h0的概率:0为 .65.
( 4) .由 频 率 分 布 表 命可 在 40知 h0以, 上寿 的 电 子
元 件 出 现 的 :0.2频 00率 .15为 0.3, 5 故 我 们
从统计图分析数据的集中趋势优秀教案
从统计图分析数据的集中趋势一、教学内容分析统计的核心是数据分析,统计教学重要目标是鼓励学生从数据中提取尽可能多的有效信息,尤其是图像信息,不是将统计的学习处理成单纯的数字计算和绘图技能而忽视运用方法提取图像信息,尤其是平均数的学习,除了算法理解、概念理解还有统计理解,学生除了喜欢使用众数、中位数,对平均数的理解不应该是单纯的计算,也应该学会通过统计图的估计来加深理解,让学生能在处理数据中想到用平均数,愿意用平均数来刻画数据,体会平均数、众数、中位数在统计图像中的意义和价值。
学生在小学阶段已经了解如何制作条形统计图、扇形统计图、折线统计图以及它们各自的特点,会求平均数,初步了解了统计的意义。
在上一课时从数据计算的角度学习了平均数、中位数、众数之后,本课时主要从统计图中直观的找到或大致估计出平均数、众数、中位数,是上一课时的延续和发展,同时和初一学过的统计图的选择紧密结合在一起,加深对统计图呈现数据的理解,发展几何直观和数据直觉,为下一课时数据的离散程度的学习打下基础,数据的离散程度是相对于集中趋势的偏离情况,所以本课时从图像中快速描述数据的集中趋势对离散程度的学习有很大的帮助,并从分析数据的好与坏体会做出决策的作用。
本节课通过利用统计图的特点和直观信息快速描述数据的集中趋势,培养学生建立数据直觉,发展几何直观有非常重要的作用,也为后续学习数据的离散程度打下基础。
同时为高中阶段从频率分布直方图中分析平均数、众数、中位数以及方差、标准差,用总体密度曲线体会正态分布,了解数据的集中趋势,进而进入变量间相关关系的回归分析,为大学的学习提供必备的基础知识。
纵观各学段,学生都经历了完整的统计过程,在每个过程中不断深入分析数据,培养统计能力。
基于以上分析,确定本节课的教学重点是从统计图中分析数据的集中趋势.二、学情分析知识基础:学生在六年级下册第八章学习了《数据的收集与整理》,经历了数据的收集、整理、描述和分析的过程,经历调查、统计等活动,会绘制扇形统计图和频数直方图,能从条形统计图、折线统计图、扇形统计图中获取信息。
高中数学必修三 18-19 第1章 §4 4.1 平均数、中位数、众数、极差、方差 4.2 标准差
难
(6)样本的标准差和方差都是正数.( )
返 首 页
[解析] (1)×,根据平均数的定义可知错误.
自
当
主 预
(2)×,根据众数定义知众数可以一个,也可以多个.
堂 达
习
标
•
(3)×,由中位数的定义可知错误.
•
探
固
新 知
(4)√,极差与标准差都反映了样本数据的波动性和离散程度.
双 基
(5)×,平均数与数据的波动性无关.
究 •
(4)算出(3)中 n 个平方数的平均数,即为样本方差.
攻
重 难
(5)算出(4)中方差的算术平方根,即为样本标准差.
课 时 分 层 作 业
返 首 页
自
当
主
堂
预
达
习 •
2.标准差(方差)的两个作用:
标 •
探
固
新
(1)标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的 双
知
基
离散程度越小.
达 标
•
•
探
A.茎叶图
B.频率分布直方图
固
新
双
知
C.频率折线图
D.频率分布表
基
合
作
探 究
B [当收集到的数据量很大时,一般用频率分布直方图.]
攻
重 难
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
课 时 分 层 作 业
返 首 页
[解] (1) x 甲=16(99+100+98+100+100+103)=100,
自 主
x 乙=16(99+100+102+99+100+100)=100.
学科核心素养下高中数学教学设计——以“用样本估计总体”为例
学科核心素养下高中数学教学设计———以“用样本估计总体”为例文|傅焕铭一、教材分析我们收集的原始数据往往多而杂,需要对原始数据进行分析、处理,找到数据背后蕴藏的信息。
对总体统计特征的刻画包括两个层面:一是总体统计特征的全面刻画,即刻画出总体中所有个体的取值规律,这个规律可以用总体的频率分布表和频率分布直方图描述或近似描述;二是总体部分统计特征的刻画,如平均数、众数、方差、标准差等数字特征。
二、教学目标(一)核心素养学生初步习得科学处理数据的能力。
(二)教学目标(1)学生用频率分布直方图估计样本的众数、中位数、平均数等数据特征。
(2)学生能自行独立计算样本数据的标准差、方差,并知道分别刻画统计的什么特征。
(3)学生会用样本的频率分布估计总体分布,会用样本特征估计总体特征,理解用样本估计总体的思想,并能利用所学知识解决生活中的一些现实问题。
三、教学重难点教学重点:学生能从频率分布直方图上估计出样本数据特征。
教学难点:学生理解总体分布的概念,形成统计思维。
四、教学过程师:同学们,前面我们已经研究过通过抽样调查来研究数据的方法,了解了提高样本代表性的一些具体方法,收集数据后,我们要从中找到数据背后包含的信息,方可达到用样本估计总体的目的。
今天我们就一起研究“用样本估计总体”。
(一)课前导学师:同学们,根据自学任务,思考下列问题并完成检测。
任务1:样本数字特征有哪些?如何求?这些特征在频率分布直方图上如何估计?任务2:样本数字特征是如何反映样本数据的集中趋势和离散程度的?(设计意图:通过出示自学任务,引导学生自学,相机进行自学效果检测。
学生根据自学情况,检测新知中还有哪些内容没有理解和掌握,从而有针对性地学习本节内容,实现高效学习。
同时也旨在培养学生良好的学习习惯,指导学生学会学习数学的方法。
)(二)课堂设计探究一:样本的数字特征11.探究:众数、中位数、平均数的概念。
师:请同学们根据概念解释,完成概念名词的填空,并揣摩这些概念的含义。
高中统计知识
概率统计01简单随机抽样一、全面调查与抽样调查1、全面调查(1)定义:对每一个调查对象都进行调查的方法,成为全面调查,又称普查.在一个调查中,我们把调查对象的全体称为成为总体,组成总体的每一个调查对象称为个体。
(2)优点和缺点:优点是所有资料较为全面可靠;缺点是调查花费的人力、物力、财力较多,且调查时间较长,全面调查只在样本少的情况下适合采用。
2、抽样调查(1)定义:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查。
(2)相关的概念:①总体:所要考察对象的全体叫做总体②样本:从总体中抽取出的若干个个体组成的集合叫作总体的一个样本③个体:总体中的每一个考察对象叫作个体④样本容量:样本中个体的数目叫作样本容量⑤样本数据:调查样本获得的变量值称为样本的观测数据,简称样本数据。
(3)优点和缺点:优点是迅速及时;节约人力、物力和财力缺点是调查结果不如全面调查全面、系统。
二、简单随机抽样1、放回简单随机抽样一般地,设一个总体含有(为正整数)个个体,从中逐个抽取(1≤<)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样.2、不放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.3、简单随机抽样与简单随机样本放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样,通过简单随机抽样获得的样本成为简单随机样本。
4、简单随机抽样的特点:(1)总体个数有限:简单随机抽样要求被抽取样本的总体个数有限,这样便于通过样本对总体进行分析;(2)逐个抽取:简单随机抽验是从总体中种逐个进行抽取,这样便于实际操作;(3)不放回抽样:简单随机抽样是一种不放回抽样,这样便于样本的获取和一些相关的计算。
(4)等可能抽样:不仅每次从总体中抽取一个个体时各个个体被抽到的可能性相等,而且在整个抽样过程中,各个个体被抽到的可能性也相等,从而保证了这种抽样方法的公平性。
excel 2017 基本统计量
一、引言Excel是微软公司推出的一套电子表格软件,被广泛应用于数据分析、数据可视化、数据处理等领域。
在数据分析中,基本统计量是对数据进行描述和分析的重要手段,可以帮助人们了解数据的分布、集中趋势和离散程度。
本文将介绍如何使用Excel 2017进行基本统计量的计算,并以具体的例子进行说明。
二、平均数1. 平均数是一组数据的算术平均值,可以用来表示数据的集中趋势。
2. 在Excel 2017中,可以使用AVERAGE函数来计算一组数据的平均数。
若要计算A1到A10的平均数,在一个空白单元格中输入“=AVERAGE(A1:A10)”并按下回车即可得到结果。
三、中位数1. 中位数是一组数据按大小排序后的中间数值,可以用来表示数据的位置关系。
2. 在Excel 2017中,可以使用MEDIAN函数来计算一组数据的中位数。
若要计算A1到A10的中位数,在一个空白单元格中输入“=MEDIAN(A1:A10)”并按下回车即可得到结果。
四、众数1. 众数是一组数据中出现次数最多的数值,可以用来表示数据的集中趋势。
2. 在Excel 2017中,可以使用MODE函数来计算一组数据的众数。
若要计算A1到A10的众数,在一个空白单元格中输入“=MODE(A1:A10)”并按下回车即可得到结果。
五、标准差和方差1. 标准差和方差是用来表示数据的离散程度的统计量,可以用来衡量数据的波动情况。
2. 在Excel 2017中,可以使用STDEV.S函数和VAR.S函数来计算一组数据的标准差和方差。
若要计算A1到A10的标准差和方差,在一个空白单元格中分别输入“=STDEV.S(A1:A10)”和“=VAR.S(A1:A10)”并按下回车即可得到结果。
六、相关系数1. 相关系数是用来衡量两组数据之间线性关系强弱的统计量,可以用来表示数据之间的关联程度。
2. 在Excel 2017中,可以使用CORREL函数来计算两组数据的相关系数。
众数、中位数、平均数与频率分布直方图关系
20
30
80
40
30
(1)列出频率分布表;
(2)画出频率分布直方图; (3)估计电子元件寿命在100h~400h以内的概率; (4)估计电子元件寿命在400h以上的概率; (5)估计总体的数学期望.
寿命 100~200 200~300 300~400 400~500 500~600
合计
频率/组距
总体分布的估计
练习.(广东11变式题1)为了调查某厂工人生产 某种产品的能力,随机抽查 了20位工人某天生
产该产品的数量.产品数量的分组区间为 45,55,
5 5 ,6 5 ,6 5 ,7 5 ,7 5 ,8 5 ,85,95 由此得到频率
分布直方图如图3,则这20名工人中一天生产
该产品 数量在
的中位 数.
3、平均数是频率分布直方图的“重心”.
用样本数字特征估计总体数字特征
众数、中位数、平均数与频率分布直方 图的关系
一 众数、中位数、平均数的概念
众数、中位数、平均数都是描述一组 数据的集中趋势的特征数,只是描述的角 度不同,其中以平均数的应用最为广泛.
众数:在一组数据中,出现次数最多 的数据叫做这组数据的众数.
中位数:将一组数据按大小依次排列, 把处在最中间位置的一个数据(或最中 间两个数据的平均数)叫做这组数据的 中位数.
解:平均数是6,方差是8,标准差是 2 2 .
如果求 2a1 、 2a2、 2a3的平均数、方差、 标准差?已知ai的平均数X、方差Y、标准差Z, 则b+kai的平均数
是b+kx, 方差是k的平方与Y的乘积,标准差是k与Z的乘积。
(当然Y=Z的平方!)
总结
众数、中位数、平均数与频率分布直方图的关系:
众数,中位数,平均数,标准差
巧合 频率 组距
分组 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5]
频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02
0.50 0.40 0.30 0.20 0.10
四
众数、中位数、平均数的简单应用
例1 某工厂人员及工资构成如下:
人员 周工资 人数 合计 经理 2200 1 2200 管理人员 250 6 1500 高级技工 220 5 1100 工人 200 10 2000 学徒 合计 100 1 23 100 6900
(1)指出这个问题中周工资的众数、中 位数、平均数 (2)这个问题中,工资的平均数能客观 地反映该厂的工资水平吗?为什么?
? 16
找到啦!有区别了!
上述各偏差的平方和的大小还与什么有关?
——与射击次数有关!
所以要进一步用各偏差平方的平均数来衡量数据的稳定性
设一组数据x1、x2、…、xn中,各数据与它们的平均 数的差的平方分别是(x1-x)2、(x2-x)2 、… (xn-x)2 , 那么我们用它们的平均数,即用
S2=
分析:众数为200,中位数为220,
平均数为300。 因平均数为300,由表格中所列出的数据 可见,只有经理在平均数以上,其余的人 都在平均数以下,故用平均数不能客观真 实地反映该工厂的工资水平。
教练的烦恼
甲,乙两名射击手的测试成绩统计如下:
第一次 第二次 第三次 第四次 第五次
甲命中环数 乙命中环数
O
0.5
1
1.5
2
2.2.2标准差
解:(1)计算得x甲=7,x乙=7;
s甲=1.73,s乙=1.10. (2)由(1)知,甲、乙两人平均成绩相 等,但s乙<s甲,这表明乙的成绩比甲的成 绩稳定一些,从成绩的稳定性考虑,可以 选乙参赛。
(3)标准差和频率直方图的关系
从标准差的定义可知,如果样本各数 据都相等,则标准差得0,这表明数据没 有波动幅度,数据没有离散性;若个体 的值与平均数的差的绝对值较大,则标 准差也较大,表明数据的波动幅度也很 大,数据的离散程度很高,因此标准差 描述了数据对平均数的离散程度。
4 5 6 7 8 9 10 环数
甲的成绩比较分散,极差较大,乙的 成绩相对集中,比较稳定.
标准差
样本的众数、中位数和平均数常用来表示 样本数据的“中心值”,其中众数和中位数容 易计算,不受少数几个极端值的影响,但只能 表达样本数据中的少量信息. 平均数代表了数据 更多的信息,但受样本中每个数据的影响,越 极端的数据对平均数的影响也越大.当样本数据 质量比较差时,使用众数、中位数或平均数描 述数据的中心位置,可能与实际情况产生较大 的误差,难以反映样本数据的实际状况,因此, 我们需要一个统计数字刻画样本数据的离散程 度.
285×25%+315×16%+345×7%+375×2%=2
67.9≈268(天)
这些组中值的方差为
[1×(165-268)2+11×(195-268)2+18×(225- 268)2+20×(255-268)2+25×(285-268)2+16× (315-268)2+7×(345-268)2+2×(375-268)2] ÷100=2128.60(天2).
复习
如何根据样本频率分布直方图,分别估 计总体的众数、中位数和平均数?
用直方图算平均数-中位数、众数、标准差
17
例1:画出下列四组样本数据的直方图,说 明它们的异同点.
(1)
(2)
(3)
(4)
18
例2:甲乙两人同时生产内径为25.40mm的一种零件. 为了对两人的生产质量进行评比,从他们生产的零件 中各抽出20件,量得其内径尺寸如下(单位:mm ) 甲
平均数向我们提供了样本数据的重要信 息,但是,有时它也会影响我们,使我们对 总体作出片面判断。平均数反映数据的集中 趋势,但是,只有平均数还难以概况样本数 据的实际状态。当样本的平均数相等或相差 无几时,就要用样本数据的离散程度来估计 总体的数字特征。这时,我们引进了一个概 念:标准差!
12
标准差
平均数: x = x1f1+x2f2+……+xkfk
练习 课本P74 练习
选择平均数更好:因为,此时的众数20万比中位 数25万还小,所以众数代表的是局部的数。中位数代 表的虽然是大多数公路投资的数额,但由于其不受极端 值的影响,不能代表全体,因而此时成了它的缺点。选 择平均数较好,能比较好的代表整体水平,但缺点是仍
0.5 组距 0.4 0.3
0.2 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 0.1 0.25,0.75,1.25,1.75,2.25,
2.75,3.25,3.75,4.25.
月均用水量/t
3 、底边中点的横坐标之和
0.25×0.04+0.75×0.08+1.25×0.15+1.75 ×0.22+2.25×0.25+2.75×0.14+3.25× 0.06+3.75×0.04+4.25×0.02=2.02(t). 平均数是2.02.
频率分布直方图问题分类解析
频率分布直方图问题分类解析作者:徐惠陈开懋来源:《高中生学习·高二版》2015年第10期频率分布直方图是高中概率统计部分的重要内容,在各省市高考中,几乎每年都考,频率分布直方图问题考查方式多样,一般有“求样本中限制条件下的个体数目或所占频率”、“填充频率分布直方图”、“求频率分布直方图中的参数”、“由频率分布直方图,求平均数、中位数、众数、方差、标准差”等几类考法.本文根据高中数学课程标准、高考考纲和最近几年的高考试题,对有关频率分布直方图的常见问题及解题规律方法进行一个小结,希望对读者有所帮助.例1 某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[[0.3, 0.9]]内,其频率分布直方图如图所示.(1)直方图中的[a=]_________;(2)在这些购物者中,消费金额在区间[[0.5, 0.9]]内的购物者的人数为_________.解析(1)由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解之得[a=3].(2)消费金额在区间[[0.5, 0.9]]内频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[[0.5, 0.9]]内的购物者的人数为:0.6×10000=6000.点拨本题以实际问题为背景,考查频率分布直方图,重点考查了以下三类问题:求频率分布直方图中的参数(例如某长方形的高);求某一范围内的频率;求某一范围内的样本容量.对于第一类问题,根据频率之和等于1,即频率分布直方图中各小矩形的面积之和等于1,即可解决.对于第二类问题,只需要弄清频率分布直方图中,纵轴是频率/组距,各小矩形的面积表示每一组距范围内的频率.对于第三类问题,某一范围内的样本容量=样本容量×某一范围内的频率.例2 某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为[40,50),[50,60),…,[80,90),[90,100].(1)求频率分布图中[a]的值;(2)估计该企业的职工对该部门评分不低于80的概率;(3)从评分在[[40,60)]的受访职工中,随机抽取2人,求此2人评分都在[[40,50]]的概率.[0.028][0.022][0.018][0.004][a][40][50][60][70][80][90][100][O][分数]解析(1)因为(0.004+a+0.0018+0.022×2+0.028)×10=1,所以[a=0.006].(2)由所给频率分布直方图知,50名受访职工评分不低于80的频率为(0.022+0.018)×10=0.4,所以该企业职工对该部门评分不低于80的概率的估计值为[0.4].(3)受访职工评分在[50,60)的有:50×0.006×10=3(人),即为[A1,A2,A3];受访职工评分在[40,50)的有: 50×0.004×40=2(人),即为[B1,B2]. 从这5名受访职工中随机抽取2人,所有可能的结果共有10种,它们是[A1,A2,A1,A3,][A1,B1,A1,B2,][A2,A31,][A2,B1,][A2,B2,][A3,B1,A3,B2,B1,B2,]又因为所抽取2人的评分都在[40,50)的结果有1种,即[B1,B2],故所求的概率为[P=110].点拨本题仍以实际问题为背景,考查频率分布直方图,重点考查了以下三类问题:求频率分布直方图中的参数(例如某长方形的高);求某一范围内的概率;与古典概型相结合求概率.对于第一类问题,仿例1即可解决;对于第二类问题,应弄清频率和概率的关系:频率是概率的估计值,求概率是用频率代替的,再利用求频率的方法即可;对于第三类问题,应先仿例1求某一范围内的频率,进而求出该范围内的样本容量;最后根据古典概型概率计算公式可求概率.点拨本题还是以实际问题为背景,考查频率分布直方图,重点考查了以下三类问题:求频率分布直方图中的参数(例如某长方形的高);利用频率分布直方图估算样本的数字特征(众数、中位数、平均数、标准差、方差);与随机抽样相结合求某一范围内的样本容量.对于第一类问题,仿例1即可解决.对于第二类问题,在频率分布直方图中,样本数字特征的估算方法分别是:众数是最高矩形的横坐标中点,中位数左边和右边的直方图的面积相等,平均数是频率分布直方图的重心,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点横坐标之和,方差估算公式是[s2=]第1个小矩形面积×[(x1中-x均值)2]+第2个小矩形面积×[(x2中-x均值)2]+…,其中,[x1中,x2中,…],表示第一个小矩形底边中点横坐标,第二个小矩形底边中点横坐标,…,标准差估算公式是[s=s2].对于第三类问题,应先仿例1求某一范围内的频率,进而求出该范围内的样本容量,再根据分层抽样知识计算出抽样比,最后可得某一范围内应抽取的样本容量.例4 从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(2)估计这种产品质量指标值的平均值及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解析(1)频率分布直方图如下:所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.8=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.点拨本题依旧以实际问题为背景,考查频率分布直方图,重点考查了以下三类问题:画频率分布直方图;利用频率分布直方图估算样本的数字特征(众数、中位数、平均数、标准差、方差);求某一范围内的频率.对于第一类问题,画频率分布直方图应注意横、纵坐标的意义,横坐标表示组距,纵坐标表示频率/组距.对于第二类问题,在频率分布直方图中,样本数字特征的估算方法见例3.对于第三类问题,仿例1.[练习]1. 20名学生某次数学考试成绩(单位:分)的频率分布直方图如图所示.(1)求频率分布直方图中a的值;(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率.2. 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图(如图所示).(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)。
最新众数、中位数、平均数与频率分布直方图的关系
二 、 众数、中位数、平均数 与频率分布直方图的关系
(在只有频率分布直方图的情况下,也可以估计总体特征,而且直方图比较直观 便于形象地进行分析。)
1、众数在样本数据的频率分布直方图中, 就是最高矩形的中点的横坐标。
频数
20 30 80 40 30 200
频率
0.10 0.15 0.40 0.20
0.15 1
累积频率 0.10 0.25 0.65 0.85 1
0 100 200300400 500 600 寿命(h)
总体分布的估计
(3)由频率分布表 出可 ,以 寿看 命 10在 h0~400
的电子元件出现 为的 :0.6频 5,率 所以我们估计电子
1、通过频率分布直方图的估计精度低;
2、通过频率分布直方图的估计结果与数据分组 有关;
3、在不能得到样本数据,只能得到频率分布直 方图的情况下,也可以估计总体特征,而且直方图 比较直观便于形象地进行分析。
20
30
80
40
30
(1)列出频率分布表;
(2)画出频率分布直方图; (3)估计电子元件寿命在100h~400h以内的概率; (4)估计电子元件寿命在400h以上的概率; (5)估计总体的数学期望.
寿命 100~200 200~300 300~400 400~500 500~600
合计
频率/组距
总体分布的估计
1002000.102003000.153004000.40
2
2
2
4005000.205006000.15151409082.5365.
众数、中位数、平均数标准差、方差
连接频率分布直方图中各小长方形上端的中点, 得到频率分布折线图
总体密度曲线反映了总体在各个范围内取值的 百分比,精确地反映了总体的分布规律。是研究总 体分布的工具.
画茎叶图的步骤:
(1)将每个数据分为茎(高位)和叶(低位)两部分;
(2)将最小茎和最大茎之间的数按大小次序排成一列, 写在一侧; (3)将各个数据的叶按大小次序写在其茎的另一侧.
8 8 9 9 9 9 2 9 3 9 2 9 1 6 4 4 9 ,0 1 解析 当x8 ≥4 时9 8, 9 9 2 9 3 9 7 2 9 1 x 90 7
∴x<4,则
7
=91,∴x=1.
11.下图是某市有关部门根据该市干部的月收入情 况,作抽样调查后画出的样本频率分布直方图, 已知图中第一组的频数为4 000,请根据该图提供 的信息解答下列问题:(图中每组包括左端点, 不包 括右端点,如第一组表示收入在[1 000,1 500))
0.000 4
三种数字特征的优缺点
1、众数体现了样本数据的最大集中点,但它对其它 数据信息的忽视使得无法客观地反映总体特征.
2、中位数它不受少数几个极端值的影响,这在某些 情况下是优点,但它对极端值的不敏感有时也会成为 缺点。
3、由于平均数与每一个样本的数据有关,所以任何 一个样本数据的改变都会引起平均数的改变,这是众 数、中位数都不具有的性质。也正因如此 ,与众数、 中位数比较起来,平均数可以反映出更多的关于样本 数据全体的信息,但平均数受数据中的极端值的影响 较大,使平均数在估计时可靠性降低。
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你应当如何对这次射击作出评价?
如果看两人本次射击的平均成绩,由于x甲7,x乙7
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
练习 课本P74 练习
选择平均数更好:因为,此时的众数20万比中位 数25万还小,所以众数代表的是局部的数。中位数代表 的虽然是大多数公路投资的数额,但由于其不受极端值 的影响,不能代表全体,因而此时成了它的缺点。选择 平均数较好,能比较好的代表整体水平,但缺点是仍不
三种数字特征的优缺点
特征数 众数
平均数向我们提供了样本数据的重要信 息,但是,有时它也会影响我们,使我们对 总体作出片面判断。平均数反映数据的集中 趋势,但是,只有平均数还难以概况样本数 据的实际状态。当样本的平均数相等或相差 无几时,就要用样本数据的离散程度来估计 总体的数字特征。这时,我们引进了一个概 念:标准差!
12
标准差
面积和=0.49 0.5
后四个小矩形的 面积和=0.26
0.4
0.25
0.3 0.22
0.2 0.15
0.1
0.08
0.04
0
0.5 1
1.5
0.14
2
2.5
2.0
0.06 0.04 0.02
3
3.5
4 4.5
月均用水量/t
思考:平均数是频率分布直方图的“重心”,
在城市居民月均用水量样本数据的频率分布
1、众数 在一组数据中,出现次数最多 的数据叫做这一组数据的众数.
2、中位数 将一组数据按大小依次排列, 把处在最中间位置的一个数据(或两个数据 的平均数)叫做这组数据的中位数.
3、平均数 (1) (2)
x = (x1+x2+……+xn) /n x = x1f1+x2f2+……+xkfk
思考 如何从频率分布直方图中估计众数、
2.平均数对数据有“取齐”的作用,代表一组数据 的平均水平。 3.标准差描述一组数据围绕平均数波动的大小,反 映了一组数据变化的幅度。
有两位射击运动员在一次射击测试中各射 靶十次,每次命中的环数如下:
如果你是教练,你应当如何对这次射击情况作出 评价?如果这是一次选拔性考核,你应当如何作出选 择?
标准差
标准差是样本数据到平均数的一种平均距 离.它用来描述样本数据的离散程度.在实际应 用中,标准差常被理解为稳定性.
1、平均距离
标准差
中位数、平均数呢?
众数:最高矩形的中点的横坐标 2.25
频率
中位数:左右两边直方
组距
图的面积相等.
2.02
0.5
平均数:频率分布直方
0.44
图中每个小矩形的面
0.3 0.28 0.16
积乘以小矩形底边中
点的横坐标之和. 2.02
0.08 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
3、算出 xi -x 2 i=1, 2,…,n ,这n个数的 平均数,即为样本方差 s 2
4、算出方差的算术平均值,即为样本标准差s。
s2
=
1 n
x1-x
2
x2-x
2
x3-x
2 …
xn -x
2
1 n
= n i=1
xi -x
2=1 nx12 Nhomakorabeax
2 2
x
2 3
…
xn2
-n
81 练习:若甲、乙两队比赛情况如下,下列说法哪些 说法是不正确的:
平均失球数
平均失球个数的标准差
甲
1. 5
1. 1
乙
2. 1
0. 4
1、平均来说,甲的技术比乙的技术好; 2、乙比甲技术更稳定;
全对 3、甲队有时表现差,有时表现好; 4、乙队很少不失球。 24
小结
1.用样本的数字特征估计总体的数字特征分两类: a.用样本平均数估计总体平均数。 b.用样本标准差估计总体标准差。样本容量越大, 估计就越精确。
标准差是样本数据到平均数的一种平均距离.它 用来描述样本数据的离散程度.在实际应用中,标准 差常被理解为稳定性.
规律:标准差越大,
大则a越大,数据的 离散程度越大;反
之,数据的离散程
度越小.
计算标准差的算法:
1、算出样本数据的平均数 x
2、算出每个样本数据与样本平均数的差
xi -x i=1, 2,…,n
x
2 16
注意:
1、标准差、方差的取值范围: 0,+
当标准差,方差为0时,样本各数据全相等,表 明数据没有波动幅度,数据没有离散性。
2、因为方差与原始数据的单位不同,且平方后可 能增大了偏差的程度,所以虽然方差与标准差在 刻画样本数据的离散程度上是一样的,但在解决 实际问题时,一般采用标准差。
1
问题
在一次射击比赛中,甲、乙两名运动员各射击 10次,命中环数如下﹕
甲运动员﹕7,8,6,8,6,5,8,10,7,4; 乙运动员﹕9,5,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥 的更稳定些吗?
为了从整体上更好地把握总体的规律,我们要通 过样本的数据对总体的数字特征进行研究。——用样 本的数字特征估计总体的数字特征。
直方图中,各个小矩形的重心在哪里?从直
方图估计总体在各组数据内的平均数分别为 频率 多少?
0.5 组距
0.4
0.3
0.2
0.O1
0.5 1 1.5 2 2.5 3 3.5 4 4.5
0.25,0.75,1.25,1.75,2.25,
2.75,3.25,3.75,4.25.
月均用水量/t
3 、平均数 平均数的估计值等于每个小矩形的面积
从生产的零件内径的尺寸来看,谁生产的质量较高?
X甲≈25.401 X乙≈25.406 s甲≈0.037 S乙≈0.068
从样本平均数看,甲生产的零件内径比 乙更接近内径标准,但是差异很小;
从样本标准差看,由于s甲<S乙,因 此甲生产的零件内径比乙的稳定程度高很 多。于是,可以作出判断,甲生产的零件 的质量比乙的高一些。
乘以小矩形底边中点的横坐标之和
0.25×0.04+0.75×0.08+1.25×0.15+1.75 ×0.22+2.25×0.25+2.75×0.14+3.25×
0.06+3.75×0.04+4.25×0.02=2.02(t). 平均数是2.02.
平均数: x = x1f1+x2f2+……+xkfk
优点
缺点
体现了样本数据的最大 无法客观反映总体
集中点
特征
中位数 不受少数极端值的影响 不受少数极端值的
影响有时也是缺点
平均数
与每一个数据有关,更 受少数极端值的影 能反映全体的信息. 响较大,使其在估
计总体时的可靠性 降低.
探究
一个企业中, 有职工的人数很多,他 们的月收入是两千左右,然后有少数人员是 经理以上层次的人,他们的月收入是三万左 右。如果是你老板,去招聘时,回答有关工 资待遇方面的问题,你更愿意用哪个数字特 征来回答这个问题呢?如果你是应聘者,你 更愿意希望老板是用哪个特征数字来回答?
17
例1:画出下列四组样本数据的直方图,说 明它们的异同点.
(1)
(2)
(3)
(4)
例2:甲乙两人同时生产内径为25.40mm的一种零件. 为了对两人的生产质量进行评比,从他们生产的零件 中各抽出20件,量得其内径尺寸如下(单位:mm )
甲
X甲≈25.401
s甲≈0.037
乙
X乙≈25.406
S乙≈0.068
如何在频率分布直方图中估计众数
频率
组距 众数在样本数据的频率分布直方图中,
就是最高矩形的中点的横坐标。
0. 05.4
0.3
0.2
0.
1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月平均用水
量(t)
可将众数看作直方图中面积最大长方形的“中心”
频率
如何在频率分布直方图中估计中位数
组距
0.6 前四个小矩形的
20
练习 课本P79 练习
解: 依题意计算可得
x1=900
x2=900
s1≈23.8 s2 ≈42.6
甲乙两种水稻6年平均产量的平均数相同, 但甲的标准差比乙的小,所以甲的生产比较稳 定.
22
解 : (1) 平均重量约为496.86 g , 标准差约为6.55
(2)重量位于(x-s , x+s)之间有14袋白糖,所占 百分比为66.67%.