直方图求中位数
_众数,中位数,平均数与频率分布直方图
谢谢观看! 2020
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
三 三种数字特征的优缺点
1、众数体现了样本数据的最大集中 点,但它对其它数据信息的忽视使得无 法客观地反映总体特征.如上例中众数是 2.25t,它告诉我们,月均用水量为2.25t的 居民数比月均用水量为其它数值的居民 数多,但它并没有告诉我们多多少.
二 、 众数、中位数、平均数 与频率分布直方图的关系
1、众数在样本数据的频率分布直方图 中,就是最高矩形的中点的横坐标。
例如,在上一节调查的100位居民的月 均用水量的问题中,从这些样本数据的频 率分布直方图可以看出,月均用水量的众 数是2.25t.如图所示:
频率分布直方图如下:
频率 组距
众数(Байду номын сангаас高的矩形的中点)
2200 1500
1100
2000 100 6900
(1)指出这个问题中周工资的众数、中
位数、平均数 (2)这个问题中,工资的平均数能客观
地反映该厂的工资水平吗?为什么?
分析:众数为200,中位数为220,
平均数为300。
因平均数为300,由表格中所列 出的数据可见,只有经理在平均数以 上,其余的人都在平均数以下,故用 平均数不能客观真实地反映该工厂的 工资水平。
3、平均数是频率分布直方图的“重 心”.
是直方图的平衡点. n 个样本数据的平均 数的估计值等于频率分布直方图中每个 小矩形的面积乘以小矩形底边中点的横 坐标之和。 给出.下图显示了居民月均用水量的平 均数: x=2.02
频率分布直方图如下:
频率 组距
平均数
0.50
0.40
0.30
众数中位数平均数与频率分布直方图ppt
频率分布直方图如下:
频率 组距
众数(最高的矩形的中
点)
0.50
0.40
0.30
0.20
0.10
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.
2、在样本中,有50%的个体小于或等于 (1)指出这个问题中周工资的众数、中位数、平均数
解:在17个数据中,1. 01,几乎不影响中位数,但显然这一极端值是不能忽视的。
中位数,也有50%的个体大于或等于中位 分析:众数为200,中位数为220,平均数为300。
2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成 为缺点。
三 三种数字特征的优缺点
1、众数体现了样本数据的最大集中 点,但它对其它数据信息的忽视使得无 法客观地反映总体特征.如上例中众数是 2.25t,它告诉我们,月均用水量为2.25t的 居民数比月均用水量为其它数值的居民 数多,但它并没有告诉我们多多少.
2、中位数是样本数据所占频率 的等分线,它不受少数几个极端值的 影响,这在某些情况下是优点,但它 对极端值的不敏感有时也会成为缺点。 如上例中假设有某一用户月均用水量 为10t,那么它所占频率为0.01,几乎 不影响中位数,但显然这一极端值是不 能忽视的。
3、平均数是频率分布直方图的“重 心”.
是直方图的平衡点. n 个样本数据的平均 数的估计值等于频率分布直方图中每个 小矩形的面积乘以小矩形底边中点的横 坐标之和。
频率分布直方图如下:
频率 组距
平均数
_众数,中位数,平均数与频率分布直方图 ppt课件
2020/12/27
8
频率分布直方图如下:
频率 组距
中位数
0.50 0.40 0.30 0.20 0.10
2020/12/27
0.5
1 1.5 2 2.5 3
3.5 4
月均用水量 /t
4.5
9
说明:
2.02这个中位数的估计值,与样本 的中位数值2.0不一样,这是因为样本数 据的频率分布直方图,只是直观地表明 分布的形状,但是从直方图本身得不出 原始的数据内容,所以由频率分布直方 图得到的中位数估计值往往与样本的 实际中位数值不一致.
2020/12/27
10
3、平均数是频率分布直方图的“重 心”.
是直方图的平衡点. n 个样本数据的平均 数的估计值等于频率分布直方图中每个 小矩形的面积乘以小矩形底边中点的横 坐标之和。 给出.下图显示了居民月均用水量的平 均数: x=2.02
2020/12/27
11
频率分布直方图如下:
频率 组距
例 某工厂人员及工资构成如下:
人员
经理 管理人员 高级技工 工人 学徒 合计
周工资 2200 250
220
200 100
人数
16
5
10 1 23
合计
2200 1500
1100
2000 100 6900
(1)指出这个问题中周工资的众数、中
位数、平均数 (2)这个问题中,工资的平均数能客观
2地020/1反2/27 映该厂的工资水平吗?为什么?
14
3、由于平均数与每一个样本的
数据有关,所以任何一个样本数据的
改变都会引起平均数的改变,这是众
数、中位数都不具有的性质。也正因
直方图众数、中位数、平均数、回归方程
直方图众数、中位数、平均数、回归方程1.某校在高二数学竞赛初赛考试后,对90分以上(含90分)的成绩进行统计,其频率分布直方图如图130,140分数段的学生人数为2.所示,若[]90,140分数段的学生人数;(1)求该校成绩在[](2)估计90分以上(含90分)的学生成绩的众数、中位数和平均数(结果保留整数).2.某学校为担任班主任的教师办理手机语音月卡套餐,为了解通话时长,采用随机抽样的方法,得到该校100位班主任每人的月平均通话时长T(单位:分钟)的数据,其频率分布直方图如图所示,将频率视为概率.(1)求图中m的值;(2)估计该校担任班主任的教师月平均通话时长的中位数;(3)在[450,500),[500,550]这两组中采用分层抽样的方法抽取6人,再从这6人中随机抽取2人,求抽取的2人恰在同一组的概率.3.随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据上述数据得到样本的频率分布表如右:(1)确定样本频率分布表中n 1,n 2,f 1和f 2的值; (2)根据上述频率分布表,画出样本频率分布直方图;4.某校从参加高一年级期末考试的学生中抽出40名学生,将其成绩(均为整数)分成六段[)40,50,[)50,60…[]90,100后画出如下部分频率分布直方图,观察图形的信息,回答下列问题:(1)求第四小组的频率,并补全频率分布直方图;(2)根据频率分布直方图估计这次考试的及格率(60分及以上为及格)和平均分.5.随着移动互联网的发展,与餐饮美食相关的手机APP 软件层出不穷,现从某市使用A 和B 两款订餐软件的商家中分别随机抽取100个商家,对它们的“平均送达时间”进行统计,得到频率分布直方图如下:(1)使用A 订餐软件的商家中“平均送达时间”不超过30分钟的商家有多少个? (2)试估计该市使用A 款订餐软件的商家的“平均送达时间”的众数及中位数;(3)如果以“平均送达时间”的平均数作为决策依据,从A 和B 两款订餐软件中选择一款订餐,你会选择哪款?6.某市十所重点中学进行高三联考,共有5000名考生,为了了解数学学科的学习情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:(1)根据上面频率分布表,推出①,②,③,④处的数值分别为 , , , ;(2)在所给的坐标系中画出区间[80,150]上的频率分布直方图; (3)根据题中信息估计总体: (i )120分及以上的学生数; (ii )成绩落在[126,150]中的概率.7.为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛.为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频率分布表和频数分布直方图,解答下列问题: (1)填充频率分布表的空格(将答案直接填在表格内); (2)补全频数分布直方图;(3)若成绩在75.5~85的学生为二等奖,问获得二等奖的学生约为多少人?8.为了研究某种细菌在特定条件下随时间变化的繁殖情况,得到如下所示实验数据,若t 与y 线性相关.(1)求y 关于x 的回归直线方程; (2)预测8t =时细菌繁殖的个数.(参考公式:1221ni ii nii x y nx yb xnx==-=-∑∑,ˆˆˆˆˆ,ay bx y bx a =-=+)答案1.(1)40;(2)众数115、中位数113,平均数113. 【解析】 【分析】(1)先求得成绩在[]130,140内的频率,结合[]130,140分数段的人数即可求得成绩在[]90,140分数段的学生人数;(2)根据频率分布直方图中最高矩形,即可得众数;从左至右,将小矩形面积求和,至面积和为0.5时,对应底边的数值即为中位数;将各小矩形面积乘以对应底边的中点值,求和即为平均数的估计值. 【详解】(1)∵[]130,140分数段的频率为0.005100.05⨯=, 又[]130,140分数段的人数为2,∴[]90,140分数段的参赛学生人数为20.0540÷=.(2)根据频率分布直方图,最高小矩形底面中点值为115,所以90分以上(含90分)的学生成绩的众数的估计值为115,从左依次计算各小矩形的面积为0.10.250.450.5++>,因而中位数的估计值为0.50.10.25340101101130.453--⨯+=≈,平均数的估计值为950.11050.251150.451250.151350.05113⨯+⨯+⨯+⨯+⨯=. 【点睛】本题考查了频率分布直方图的简单应用,由频率分布直方图估计众数、中位数与平均数,属于基础题. 2.(1) 0.0020m = (2)390分钟. (3) 715P = 【解析】 【分析】(1)根据频率分布直方图中所有矩形的面积和为1,列出方程,即可求解;(2)设该校担任班主任的教师月平均通话时长的中位数为t ,根据频率分布直方图的中位数的计算方法,即可求解.(3)根据分层抽样,可得在[450,500)内抽取4人,分别记为a b c d ,,,,在[500,550]内抽取2人,记为,e f ,利用古典概型及其概率的计算公式,即可求解. 【详解】(1)依题意,根据频率分布直方图的性质,可得:50(0.00400.00500.00660.00160.0008)1m ⨯+++++=,解得0.0020m =.(2)设该校担任班主任的教师月平均通话时长的中位数为t . 因为前2组的频率之和为(0.00200.0040)500.30.5+⨯=<, 前3组的频率之和为(0.00200.00400.0050)500.550.5++⨯=>, 所以350400t <<,由0.30.0050(350)0.5t +⨯-=,得390t =. 所以该校担任班主任的教师月平均通话时长的中位数为390分钟. (3)由题意,可得在[450,500)内抽取0.0016640.00160.0008⨯=+人,分别记为a b c d ,,,,在[500,550]内抽取2人,记为,e f ,则6人中抽取2人的取法有:{,}a b ,{,}a c ,{,}a d ,{,}a e ,{,}a f ,{,}b c ,{,}b d ,{,}b e ,{,}b f ,{,}c d ,{,}c e ,{,}c f ,{,}d e ,{,}d f ,{,}e f ,共15种等可能的取法.其中抽取的2人恰在同一组的有{,}a b ,{,}a c ,{,}a d ,{,}b c ,{,}b d ,{,}c d ,{,}e f ,共7种取法, 所以从这6人中随机抽取的2人恰在同一组的概率715P =. 【点睛】本题主要考查了频率分布直方图的应用,以及古典概型及其概率的计算,其中解答中熟记频率分布直方图的相关性质,合理利用古典概型及其概率的计算公式,准确计算是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题. 3. 【解】(1)(40,45]的频数n 1=7,频率f 1=0.28;(45,50]的频数n 2=2,频率f 2=0.08; (2)绘制频率分布直方图如图所示:4.(1)0.3,直方图见解析;(2)及格率为0.75,平均分为71【解析】【分析】(1)根据频率分布直方图可得除第四小组外各小组频率,再根据所有频率和为1求第4小组的频率,计算第4小组的对应的矩形的高,补全频率分布直方图;(2)计算60分及以上各小组对应频率和即得及格率,利用组中值计算平均分.【详解】解(1)由频率分布直方图可知第1、2、3、5、6小组的频率分别为:0.1、0.15、0.15、0.25、0.05,所以第4小组的频率为:10.10.150.150.250.050.3-----=.∴在频率分布直方图中第4小组的对应的矩形的高为0.30.0310=,对应图形如图所示:(2)考试的及格率即60分及以上的频率∴及格率为0.150.30.250.050.75+++=又由频率分布直方图有平均分为:0.1450.15550.15650.3750.25850.059571⨯+⨯+⨯+⨯+⨯+⨯=.【点睛】本题考查频率分布直方图及其应用,考查基本分析求解能力,属基础题. 5.(1)40个(2)55;1383(3)B 款 【解析】 【分析】(1)根据频率分布直方图计算出概率即可求出频数.(2)利用频率分布直方图能求出使用A 款订餐软件的商家中“平均送达时间”的众数,中位数. (3)使用B 款订餐软件的商家中“平均送达时间”的平均数为35,小于A 款订餐软件的商家中“平均送达时间”的平均数40,以“平均送达时间”的平均数作为决策依据,从A 和B 两款订餐软件中选择B 款订餐. 【详解】解:(1)使用A 款订餐软件的商家中“平均送达时间”不超过30分钟的商家共有100(0.0060.034)1040⨯+⨯=个.(2)依题意可得,使用A 款订餐软件的商家中“平均送达时间”的众数为55, 由频率分布直方图可判断中位数位于[)30,40设中位数为x ,则()()0.0060.03410300.0120.5x +⨯+-⨯=,解得1383x =. (3)使用款A 订餐软件的商家中“平均送达时间”的平均数为150.06250.34350.12450.04550.4650.0440⨯+⨯++⨯+⨯+⨯=使用B 款订餐软件的商家中“平均送达时间”的平均数为150.04250.2350.56450.14550.04650.023540⨯+⨯+⨯+⨯+⨯+⨯=<所以选B 款订餐软件. 【点睛】本题考查频率分布直方图的应用,考查概率的求法,众数、中位数、平均数的求法,考查运算求解能力,考查数形结合思想,是基础题6.(1)3,0.025,0.100,1;(2)直方图见解析;(3)(i )2125;(ii )117.5;(iii )0.260. 【解析】【分析】(1)根据[110,120)的频数和频率可求③,根据频率之和为1可得④和②,然后可求①;(2)求出各组的频率/组距,作图可得频率分布直方图;(3)(i)根据120分及以上的频率可求120分及以上的学生数;(ii)利用每个区间中点值及频率之积可求平均分;(iii)求出[126,150]之间的频率即可得成绩落在[126,150]中的概率.【详解】(1)由[110,120)之间的频率为0.300,频数为36,所以当频数为12时,频率为0.100,即③处的数值为0.100,;由于频率之和为1,所以④处的数值为1,②处的数值为0.025,频数为3,所以①,②,③,④处的数值分别为:3,0.025,0.100,1.(2)频率分布直方图如图所示(3)(i)120分及以上的学生数为:(0.275+0.100+0.050)×5000=2125;(ii)成绩落在[126,150]中的概率为:40.2750.100.0500.26010P=⨯++=.【点睛】本题主要考查频率分布直方图,利用频率分布直方图求解平均数注意利用区间中点值进行求解,侧重考查数据分析的核心素养.7.【分析】(1)计算第二组的频数为8,第三组的频率为0.20,第四组的频数为:12,频率为:0.24,得到答案. (2)根据表格补全频数分布直方图得到答案.(3)计算成绩在75.5~85的学生频率为0.26,得到答案.【详解】(1)由已知样本容量为50,故第二组的频数为0.16508⨯=,第三组的频率为010500.2=, 第四组的频数为:()5048101612-+++=,频率为:120.2450=, 故频率分布表为:(2)如图:(3)成绩在75.5~80的学生占70.5~80的学生的510,因为成绩在70.5~80的学生频率为0.2,所以成绩在75.5~80的学生频率为0.1.成绩在80.5~85的学生占80.5~90的学生的510,因为成绩在80.5~90的学生频率为0.32,所以成绩在80.5~85的学生频率为0.16所以成绩在75.5~85的学生频率为0.26,由于有900名学生参加了这次竞赛, 所以该校获得二等奖的学生约为0.26900234⨯=(人). 【点睛】本题考查了频数分布直方图,根据样本估计总体,意在考查学生的计算能力和应用能力.。
利用频率直方图求中位数、众数、平均数-高考数学微专题突破含详解
高考数学微专题突破利用频率分布直方图求中位数、平均数、总数一、单选题1.某校为了解高二年级学生某次数学考试成绩的分布情况,从该年级的1120名学生中随机抽取了100名学生的数学成绩,发现都在[]80,150内现将这100名学生的成绩按照[)8090,,[)90100,,[)100110,,[)110120,,[)120130,,[)130140,,[]140150,分组后,得到的频率分布直方图如图所示,则下列说法正确的是()A .频率分布直方图中a 的值为0.040B .样本数据低于130分的频率为0.3C .总体的中位数(保留1位小数)估计为123.3分D .总体分布在[)90100,的频数一定与总体分布在[)100110,的频数相等2.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n 个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已知学习时长在[)9,11的学生人数为25,则n 的值为()A .40B .50C .80D .1003.某地工商局对辖区内100家饭店进行卫生检查并评分,分为甲、乙、丙、丁四个等级,其中分数在[)60,70,[)70,80,[)80,90,[]90,100内的等级分别为:丁、丙、乙、甲,对饭店评分后,得到频率分布折线图,如图所示,估计这些饭店得分的平均数是()A .80.5B .80.6C .80.7D .80.84.下面是甲、乙两位同学高三上学期的5次联考数学成绩,现在只知其从第1次到第5次分数所在区间段分布的条形图(从左至右依次为第1至第5次),则从图中可以读出一定正确的信息是()A .甲同学的成绩的平均数大于乙同学的成绩的平均数B .甲同学的成绩的方差大于乙同学的成绩的方差C .甲同学的成绩的极差小于乙同学的成绩的极差D.甲同学的成绩的中位数小于乙同学的成绩的中位数5.下面是追踪调查200个某种电子元件寿命(单位:h)频率分布直方图,如图:其中300-400、400-500两组数据丢失,下面四个说法中有且只有一个与原数据相符,这个说法是①寿命在300-400的频数是90;②寿命在400-500的矩形的面积是0.2;③用频率分布直方图估计电子元件的平均寿命为:⨯+⨯+⨯+⨯+⨯1500.12500.153500.454500.155500.15④寿命超过400h的频率为0.3A.①B.②C.③D.④6.为了解某电子产品的使用寿命,从中随机抽取了100件产品进行测试,得到图示统计图.依据统计图,估计这100件产品使用寿命的中位数为()A.218.25B.232.5C.231.25D.241.25 7.为了让学生了解社会,拓宽视野,丰富知识,提高社会实践能力和综合素质,哈三中团委组织学生参加了抽测一批棉花的纤维长度(单位:cm)的社会实践活动.利用所学习的数学知识,同学们作出了样本的频率分布直方图.现在,由于原始数据不全,只能通过直方图来估计这一批棉花的纤维长度的平均值(同一组数据用这组数据所在区间的中点的值代替).则估计的平均值为()A.21.75B.22.25C.23.75D.20.75 8.为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是()A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有32人9.某地气象局把当地某月(共30天)每一天的最低气温作了统计,并绘制了如下图所示的统计图.记这组数据的众数为M,中位数为N,平均数为P,则()A .M N P <<B .N M P <<C .P M N <=D .P N M<<10.在某次高中学科竞赛中,4000名考生的参赛成绩按[)40,50,[)50,60,[)60,70,[)70,80,[)80,90,[)90,100分成六组,其频率分布直方图如图所示,则下列说法中错误的是().A .成绩在[)70,80内的考生人数最多B .不及格(60分以下)的考生人数约为1000人C .考生竞赛成绩平均分的估计值为70.5分D .考生竞赛成绩中位数的估计值为75分11.在2019年某省普通高中学业水平考试(合格考)中,对全省所有考生的物成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[)40,50,[)50,60,[)60,70,[)80,90,[]90,100,90分以上为优秀,则下列说法中不正确的是()A .从全体考生中随机抽取1000人,则其中得优秀考试约有100人B .若要全省的合格考通过率达到96%,则合格分数线约为44分C .若同一组中数据用该组区间中间值作代表值,可得考试物理成绩的平均分约为70D .该省考生物理成绩的中位数为75分第II 卷(非选择题)请点击修改第II 卷的文字说明二、填空题12.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.则估计高一参赛学生的成绩的众数、中位数分别为____________.13.某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:g )绘制的频率分布直方图,样本数据分为8组,分别为[)80,82,[)82,84,[)84,86,[)86,88,[)88,90,[)90,92,[)92,94,[]94,96,则样本的中位数在第______组14.某中学举行了一场音乐知识竞赛,将参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图.根据频率分布直方图,同一组数据用该区间的中点值代替,估计这次竞赛的平均成绩为______分.三、双空题15.根据高二某班50名同学的数学成绩,绘制频率分布直方图如图所示,虽不小心将其中一个数据污染了,但依然可以推断这个被污染的数据为_________,该班同学的成绩众数为_________.16.中小学生的视力状况受到社会的广泛关注,某市有关部门从全市6万名高一学生中随机抽取了400名,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示.从左至右五个小组的频率之比依次是5∶7∶12∶10∶6,则这400名学生视力的众数为________,中位数为________.四、解答题17.有一种鱼的身体吸收汞,一定量身体中汞的含量超过其体重的61.0010-⨯的鱼被人食用后,就会对人体产生危害.某海鲜市场进口了一批这种鱼,质监部门对这种鱼进行抽样检测,在30条鱼的样本中发现的汞含量(乘以百万分之一)如下:0.070.340.950.98 1.020.98 1.37 1.400.39 1.021.44 1.580.54 1.080.710.70 1.20 1.24 1.62 1.681.85 1.300.810.820.84 1.39 1.262.200.91 1.31(1)完成下面频率分布表,并画出频率分布直方图;频率分布表:分组频数频率[)0,0.50[) 0.50,1.001 3[) 1.00,1.50[) 1.50,2.002 15[)2.00,2.5011 30合计301频率分布直方图:(2)根据频率分布直方图估算样本数据的平均值(保留小数点后两位,同一组中的数据用该组区间中点值代表),并根据频率分布直方图描述这批鱼身体中汞含量的分布规律.18.经历过疫情,人们愈发懂得了健康的重要性,越来越多的人们加入了体育锻炼中,全民健身,利国利民,功在当代,利在千秋.一调研员在社区进行住户每周锻炼时间的调查,随机抽取了300人,并对这300人每周锻炼的时间(单位:小时)进行分组,绘制成了如图所示的频率分布直方图:(1)补全频率分布直方图,并估算该社区住户每周锻炼时间的中位数(精确到0.1);(2)若每周锻炼时间超过6小时就称为运动卫士,超过8小时就称为运动达人.现利用分层抽样的方法从运动卫士中抽取5人,再从这5人中抽取2人做进一步调查,求抽到的2人中恰有1人为运动达人的概率.19.经历过疫情,人们愈发懂得了健康的重要性,越来越多的人们加入了体育锻炼中,全民健身,利国利民,功在当代,利在千秋.一调研员在社区进行住户每周锻炼时间的调查,随机抽取了300人,并对这300人每周锻炼的时间(单位:小时)进行分组,绘制成了如图所示的频率分布直方图:(1)补全频率分布直方图,并估算该社区住户每周锻炼时间的中位数(精确到0.1);(2)若每周锻炼时间超过6小时就称为运动卫士,超过8小时就称为运动达人.现利用分层抽样的方法从运动卫士中抽取10人,再从这10人中抽取3人做进一步调查,设抽到的人中运动达人的人数为X ,求随机变量X 的分布列及期望.20.某贫困地区经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入、实现2020年脱贫的工作计划,该地扶贫办统计了2019年50位农民的年收入并制成如图频率分布直方图:(1)根据频率分布直方图,估计这50位农民的平均年收入x (单位:千元,同一组数据用该组数据区间的中点值表示);(2)为推进精准扶贫,某企业开设电商平台,让越来越多的农村偏远地区的农户通过经营网络商城脱贫致富.甲计划在A 店,乙计划在B 店同时参加一个订单“秒杀”抢购活动,其中每个订单由()*2,n n n N ≥∈个商品W 构成,假定甲、乙两人在A 、B 两店订单“秒杀”成功的概率分别为p 、q ,记甲、乙两人抢购成功的订单总数量、商品W 总数量分别为X 、Y .①求X 的分布列及数学期望()E X ;②若27sin4n p n n ππ=-,sin4n q nπ=,求当Y 的数学期望()E Y 取最大值时正整数n 的值.21.某地处偏远山区的古镇约有人口5000人,为了响应国家号召,镇政府多项并举,鼓励青壮劳力外出务工的同时发展以旅游业为龙头的乡村特色经济,到2020年底一举脱贫.据不完全统计该镇约有20%的人外出务工,下图是根据2020年扶贫工作期间随机调查本地100名在外务工人员的年收入(单位:千元)数据绘制的频率分布直方图.(1)根据样本数据估计该镇外出务工人员的创收总额(同一组中的数据用该组区间的中点值为代表);(2)完成脱贫任务后,古镇党政班子并不懈怠,决心带领全镇人民在奔小康道路上再上一个新台阶,出台了多项优惠政策,鼓励本地在外人员返乡创业,调查显示年收入在35千元(含35千元)以上的人中有60%的人愿意返乡投资创业,年收入在35千元以下的人中有40%的人愿意返乡投资创业,请从样本数据中完成下面的22⨯列联表,并判断能否在犯错误的概率不超过0.1的前提下认为“是否愿意返乡投资创业和年收入有关”.35千元(含35千元)以上35千元以下愿意返乡投资创业不愿意返乡投资创业附:()()()()()22n ad bc X a b c d a c b d -=++++,()20P X k ≥0.100.050.0250.0100k 2.7063.8415.0246.63522.某市为大力推进生态文明建设,把生态文明建设融入市政建设,打造了大型植物园旅游景区.为了了解游客对景区的满意度,市旅游部门随机对景区的100名游客进行问卷调查(满分100分),这100名游客的评分分别落在区间[)50,60,[)60,70,[)70,80,[)80,90,[]90,100内,且游客之间的评分情况相互独立,得到统计结果如频率分布直方图所示.(1)求这100名游客评分的平均值(同一区间的数据用该区间数据的中点值为代表);(2)视频率为概率,规定评分不低于80分为满意,低于80分为不满意,记游客不满意的概率为p .(ⅰ)若从游客中随机抽取m 人,记这m 人对景区都不满意的概率为m a ,求数列{}m a 的前4项和;(ⅱ)为了提高游客的满意度,市旅游部门对景区设施进行了改进,游客人数明显增多,对游客进行了继续旅游的意愿调查,若不再去旅游记1分,继续去旅游记2分,每位游客有继续旅游意愿的概率均为p ,且这次调查得分恰为n 分的概率为n B ,求4B .23.2016年春节期间全国流行在微信群里发、抢红包,现假设某人将688元发成手气红包50个,产生的手气红包频数分布表如下:金额分组[)1,5[)5,9[)9,13[)13,17[)17,21[)21,25频数39171182(1)求产生的手气红包的金额不小于9元的频率;(2)估计手气红包金额的平均数(同一组中的数据用该组区间的中点值作代表);(3)在这50个红包组成的样本中,将频率视为概率.①若红包金额在区间[]21,25内为最佳运气手,求抢得红包的某人恰好是最佳运气手的概率;②随机抽取手气红包金额在[)[]1,521,25⋃内的两名幸运者,设其手气金额分别为m ,n ,求事件“16m n ->”的概率.24.绿色已成为当今世界主题,绿色动力已成为时代的驱动力,绿色能源是未来新能源行业的主导.某汽车公司顺应时代潮流,最新研发了一款新能源汽车,并在出厂前对100辆汽车进行了单次最大续航里程(理论上是指新能源汽车所装载的燃料或电池所能够提供给车行驶的最远里程)的测试.现对测试数据进行分析,得到如图所示的频率分布直方图.(1)估计这100辆汽车的单次最大续航里程的平均值x (同一组中的数据用该组区间的中点值代表);(2)根据大量的汽车测试数据,可以认为这款汽车的单次最大续航里程X 近似地服从正态分布()2,N μσ,经计算第(1)问中样本标准差s 的近似值为50.用样本平均数x作为μ的近似值,用样本标准差s 作为σ的估计值;(ⅰ)现从该汽车公司最新研发的新能源汽车中任取一辆汽车,求它的单次最大续航里程恰好在200千米到350千米之间的概率;(ⅱ)从该汽车公司最新研发的新能源汽车中随机抽取10辆,设这10辆汽车中单次最大续航里程恰好在200千米到350千米之间的数量为Y ,求()E Y ;(3)某汽车销售公司为推广此款新能源汽车,现面向意向客户推出“玩游戏,送大奖”活动,客户可根据抛掷硬币的结果,操控微型遥控车在方格图上行进,若遥控车最终停在“胜利大本营”,则可获得购车优惠券.已知硬币出现正、反面的概率都是12,方格图上标有第0格、第1格、第2格、…、第50格.遥控车开始在第0格,客户每掷一次硬币,遥控车向前移动一次,若掷出正面,遥控车向前移动一格(从k 到1k +),若掷出反面,遥控车向前移动两格(从k 到2k +),直到遥控车移到第49格(胜利大本营)或第50格(失败大本营)时,游戏结束.设遥控车移到第n 格的概率为(1,2,,50)n P n = ,其中01P =,试说明{}1n n P P --是等比数列,并解释此方案能否成功吸引顾客购买该款新能源汽车.参考数据:若随机变量ξ服从正态分布()2,N μσ,则()0.6827P μσξμσ-<+≈ ,(22)0.9545P μσξμσ-<+≈ ,(33)0.9973P μσξμσ-<+≈ .25.某地处偏远山区的古镇约有人口5000人,为了响应国家号召,镇政府多项并举,鼓励青壮劳力外出务工的同时发展以旅游业为龙头的乡村特色经济,到2020年底一举脱贫.据不完全统计该镇约有20%的人外出务工.下图是根据2020年扶贫工作期间随机调查本地100名在外务工人员的年收入(单位:千元)数据绘制的频率分布直方图.(1)根据样本数据怙计该镇外出务工人员的创收总额(同一组中的数据用该组区间的中点值为代表);(2)假设该镇外出务工人员年收入服从正态分布()2,N μσ,其分布密度函数为22()2()x f x μσ--=,其中μ为样本平均值.若()f x 的最大值为10π,求σ的值;(3)完成脱贫任务后,古镇党政班子并不懈怠,决心带领全镇人民在奔小康道路上再上一个新台阶,出台了多项优惠政策,鼓励本地在外人员返乡创业.调查显示务工收入在[],2μσμσ++和[]2,3μσμσ++的人群愿意返乡创业的人数比例分别为15%和20%.从样本人群收入在[],3μσμσ++的人中随机抽取3人进行调查,设X 为愿意返乡创业的人数,求随机变量X 的分布列和数学期望.参考答案1.C 【分析】对于A :由频率分布直方图中所有小矩形面积之和为1,列出等式可求得a 的值,进而作出判断;对于B :先计算高于130分的频率,然后再用1减去于高于130分的频率即可得到低于130分的频率,进而作出判断;对于C :先计算[)80,120的频率和[)120130,的频率,再求出总体的中位数,进而作出判断;对于D :根据样本分布在[)90,100的频数一定与样本分布在[)100,110的频数相等,总体分布在[)90,100的频数不一定与总体分布在[)100,110的频数相等作出判断即可.【详解】由频率分布直方图得:()0.0050.0100.0100.0150.0250.005101a ++++++⨯=,解得0.030a =,故A 错误;样本数据低于130分的频率为:()10.0250.005100.7-⨯+=,故B 错误;[)80,120的频率为:()0.0050.0100.0100.015100.4+++⨯=,[)120130,的频率为:0.030100.3⨯=,∴总体的中位数(保留1位小数)估计为:0.50.412010123.30.3-+⨯≈分,故C 正确;样本分布在[)90,100的频数一定与样本分布在[)100,110的频数相等,总体分布在[)90,100的频数不一定与总体分布在[)100,110的频数相等,故D 错误.故选:C .【点睛】本题考查频率分布直方图的应用,考查逻辑思维能力和计算能力,属于基础题.2.B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解.由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =,所以学习时长在[)9,11的频率2520.5x n==,解得50n =.故选:B .【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.3.A 【分析】根据频率分布折线图计算该组数据的平均数为650.15750.4850.2950.25⨯+⨯+⨯+⨯.【详解】由折线图可知,该组数据的平均数为650.15750.4850.2950.2580.5⨯+⨯+⨯+⨯=.故选:A.【点睛】此题考查根据频率分布折线图求平均数,关键在于熟练掌握平均数的求解公式.4.D 【分析】根据频数分布表中的数据,对选项中的命题进行分析,判断正误,即可得到本题答案.【详解】甲同学的成绩的平均数1051201201301401235x ++++<=,乙同学的成绩的平均数1051151251351451255y ++++>=,所以A 错误;甲同学的成绩从第1次到第5次变化波动比乙同学的成绩的变化波动更小一些,所以甲同学的成绩的方差小于乙同学的成绩的方差,所以B 错误;甲同学的成绩的极差介于()30,40之间,乙同学的成绩的极差介于()35,45之间,所以甲同学的成绩的极差不一定小于乙同学的成绩的极差,所以C 错误;甲同学的成绩的中位数介于()115,120之间,乙同学的成绩的中位数介于()125,130之间,所以D 正确.故选:D本题主要考查频数直方图的相关问题,其中涉及中位数、平均数、方差、极差的求解. 5.B【详解】若①正确,则300400-对应的频率为0.45,则400500-对应的频率为0.15,则②错误;电子元件的平均寿命为1500.12500.153500.454500.155500.15⨯+⨯+⨯+⨯+⨯,则③正确;寿命超过400h的频率为0.150.150.3+=,则④正确,故不符合题意;若②正确,则300400-对应的频率为0.4,则①错误;电子元件的平均寿命为1500.12500.153500.44500.25500.15⨯+⨯+⨯+⨯+⨯,则③错误;寿命超过400h的频率为0.20.150.35+=,则④错误,故符合题意.故选:B.6.C【分析】设中位数为x,根据中位数左边的频数为50列等式可求得x的值.【详解】设中位数为x,前2组的频数之和为25,前3组的频数之和为65,由题意可得20025405050x-+⨯=,解得231.25x=.故选:C.7.A【分析】利用频率分布直方图计算平均数的方法求解即可.【详解】所给数据频率之和为(0.010.070.080.020.02)51++++⨯=则估计的平均值为5(12.50.0117.50.0722.50.0827.50.0232.50.02) 4.35521.75⨯+⨯+⨯+⨯+⨯=⨯=故选:A8.D 【分析】根据样本估计总体的知识依次判断各个选项即可得到结果.【详解】对于A ,设中位数为x ,则()()0.020.065250.080.5x +⨯+-⨯=,解得:26.25x =,即该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次,A 正确;对于B ,根据频率分布直方图知众数为:253027.52+=次,B 正确;对于C ,该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有16000.045320⨯⨯=人,C 正确;对于D ,该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有16000.025160⨯⨯=人,D 错误.故选:D.9.A 【分析】由统计图分别求出该月温度的中位数,众数,平均数,由此能求出结果.【详解】解:由统计图得:该月温度的中位数为565.52N +==,众数为5M =,平均数为1(233410566372829210) 5.9730P =⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯≈.∴M N P <<.故选:A .10.D 【分析】A .根据频率分布直方图中哪一组数据的频率除以组距的值最大进行分析;B .先分析60分以下对应的频率,再利用总体数量乘以所求频率即可得到结果;C .利用每组数据的组中值乘以对应频率并将每组计算结果相加即可得到结果;D .分析频率为0.5时对应的横坐标的值即为中位数.【详解】A .根据统计图可知:[)70,80对应的频率除以组距的值最大,即频率最大,所以人数最多,故正确;B .不及格的频率为:()0.0100.015100.25+⨯=,所以不及格的人数约为40000.25=1000⨯人,故正确;C .根据频率分布直方图可知平均数为:()450.01550.015650.02750.03850.015950.011070.5⨯+⨯+⨯+⨯+⨯+⨯⨯=,故正确;D .前三组的频率之和为:()0.01+0.0150.02100.450.5+⨯=<,前四组的频率之和为:()0.01+0.0150.020.03100.750.5++⨯=>,所以中位数在第四组数据中,且中位数为:0.50.45701071.70.0310-+⨯≈⨯,故错误;故选:D.11.D 【分析】利用频率分布直方图的性质直接求解.【详解】解:对于A ,90分以上为优秀,由频率分布直方图得优秀的频率为0.010100.1⨯=,∴从全体考生中随机抽取1000人,则其中得优秀考试生约有:10000.1100⨯=人,故A 正确;对于B ,由频率分布直方图得[40,50)的频率为0.01100.1⨯=,[50,100)的频率为:10.10.9-=,∴若要全省的合格考通过率达到96%,则合格分数线约为44分,故B 正确;对于C ,若同一组中数据用该组区间中间值作代表值,可得考试物理成绩的平均分约为:450.01010550.01510650.02010750.03010850.01510950.0101070.5⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=分,故C 正确;对于D ,[40,70)的频率为:(0.0100.0150.020)100.45++⨯=,[70,80)的频率为0.030100.3⨯=,∴该省考生物理成绩的中位数为:0.50.45701071.670.3-+⨯≈分,故D 错误.故选:D .【点睛】本题考查频数、合格分数线、平均数、中位数的求法,考查频率分布直方图的性质等基础知识,考查运算求解能力,属于基础题.12.65,65【分析】频率分布直方图中最高矩形的中点横坐标即为众数,利用平分矩形面积可得中位数.【详解】由题图可知众数为65,又∵第一个小矩形的面积为0.3,∴设中位数为60+x ,则0.3+x ×0.04=0.5,得x =5,∴中位数为60+5=65.故答案为:65,6513.四【分析】计算前几组的频率之和,判断频率为0.5在哪个区间即可判断中位数.【详解】根据频率分布直方图可知,前三组的频率之和为()0.03750.06250.07520.350.5++⨯=<,前四组的频率之和为()0.03750.06250.0750.120.550.5+++⨯=>,则可以判断中位数在第四组.故答案为:四.【点睛】本题考查根据频率分布直方图判断中位数所在区间,属于基础题.14.67.【分析】本题根据频率分布直方图直接求平均数即可.【详解】解:这次竞赛的平均成绩为:0.03055100.04065100.01575100.01085100.005951067⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=故答案为:67.【点睛】本题考查根据频率分布直方图求平均数,是基础题.15.0.016130【分析】利用频率分布直方图中所有矩形的面积之和为1可求得污染的数据;利用最高矩形底边的中点值可求得众数.【详解】设被污染的数据为a ,利用频率分布直方图中所有矩形的面积之和为1可得0.004100.02100.028100.03210101a ⨯+⨯+⨯+⨯+⨯=,解得0.016a =.由图可知,该班同学的成绩众数为130.故答案为:0.016,13016.4.7 4.75【分析】根据频率分布直方图,取最高矩形底边中点的横坐标即可求出众数,求出第三小组矩形的高,设中位数为x ,由()0.1250.175 4.5510.5x ++-⨯=,解方程即可求解.【详解】由图可知,众数为4.7,第五小组的频率为0.50.30.15⨯=从左至右五个小组的频率之比依次是5∶7∶12∶10∶6,可得第一小组的频率为50.150.1256⨯=,第二小组的频率为70.150.1250.1756⨯==,第三小组的频率为120.150.36⨯=,所以中位在第三小组,第三小组矩形面积为0.3,则第三小组的高为0.310.3=设中位数为x ,则()0.1250.175 4.5510.5x ++-⨯=,解得 4.75x =故答案为:4.7;4.75【点睛】本题考查了根据频率分布直方图求众数、中位数,考查了运算求解能力,属于基础题. 17.(1)填表见解析;作图见解析;(2)平均值为:1.08,答案见解析.【分析】(1)由样本数据,即可完善频率分布表中的数据,并画出频率直方图.(2)由(1)的频率直方图计算样本均值,进而描述汞含量分布规律.【详解】(1)由题设样本数据,则可得频率分布表如下,分组频数频率[)0,0.5031 10[)0.50,1.00101 3[)1.00,1.50122 5[)1.50,2.0042 15[)2.00,2.5011 30合计301(2)根据频率分布直方图估算平均值为:112210.250.75 1.25 1.75 2.25 1.0810351530⨯+⨯+⨯+⨯+⨯≈,分布规律:①该频率分布直方图呈中间高,两边低,大多数鱼身体中汞含量主要集中在区间[]0.5,1.5;②汞含量在区间[]1,1.5的鱼最多,汞含量在区间[]0.5,1的次之,在区间[]2,2.5的最少;③汞含量超过61.0010-⨯的数据所占比例较大,这说明这批鱼被人食用,对人体产生危害的可能性比较大.18.(1)作图见解析;中位数为4.3;(2)35.【分析】(1)设中位数为x ,则有()40.150.05x -⨯=,故可求中位数.(2)利用古典概型的概率公式可求概率.【详解】解:(1)第二组的频率为()120.150.0750.050.10.25-⨯+++=,故第二组小矩形的高为0.125频率分布直方图如图所示,由频率分布直方图可得,第一组和第二组的频率之和为0.20.250.450.5+=<,前三组的频率之和为0.20.250.30.750.5++=>,可知中位数在第三组,设中位数为x ,则有()40.150.50.450.05x -⨯=-=,解得134.33x =≈,所以该社区住户每周锻炼时间的中位数为4.3;。
频率分布直方图中的基本计算问题
所以该样本的中位数为2.02
3.由频率分布直方图估计样本平均数公式:
每个小矩形底边中点的横坐标与对应矩形面积的 乘积之和
平均数
a1
2
b1
•
S1
a2
2
b2
•
S2
a3
2
b3
•
S3...
an
2
bn
•
Sn
(S为区间a, b对应矩形的面积)
0.4
0.04
0.03 0.3
0.2
0.02
0.1
0.01
各小组内频率的大小。
(2)小矩形面积之和为1
(3)频率
频数 样本容量
频数 频率 样本容量
样本容量
频数 频率
1.求某一小矩形的高:利用所有小矩形面积之和为1
2.求众数:最高矩形底边中点的横坐标
3.求平均数:每个小矩形底边中点的横坐标与对应矩形面 积的乘积之和
4.求中位数:线段之比=面积之比(或面积之和为0.5)
O
取一人,估计其上学路上所需
时间超过60分钟的概率。
时间
10 20 30 40 50 60 70 80 90 100 110
O 0.5
1
1.5 2
2.5 3 3.5 4 4.5
月平均用水量(t)
例题分析:月均用水量的众数是2.25t.如图所示:(2+2.5)/2=2.25
2、从频率分布直方图中估计中位数(中位数左边立方图的小矩形 面积为0.5)
频率/组距
0.404.50
0.40 0.30
0.16 0.20 0.08 0.10
5.求样本数据在某一区间内的频数:样本容量X该区间小 矩形的面积总和
众数、平均数、中位数与频率分布直方图的关系
众数、平均数、中位数与频率分布直方图的关系
众数、平均数、中位数与频率分布直方图的关系,这一块知识点都不难,就是我们在平时的学习过程中不重视或者说不注意所以会导致有时候没有思路,不知道怎么操作,今天给大家详细介绍一下这种关系。
1、众数
众数在样本数据的频率分布直方图中就是最高矩形中点的横坐标大家通过上述图中,应该很明显,众数就是最高矩形中点的位置即为2.25
2、中位数
在样本中,有50%的个体小于或者等于中位数,同时也有50%的个体大于或者等于中位数,所以,在频率分布直方图中,在中位数的左边和右边直方图的面积是相等的。
从而我们可以根据这个来估算出中位数的大小值。
从上数频律分布直方图中,我们可以计算出来,大致的位置。
3、平均数
平均数是频率分布直方图的重心,他等于频率分布直方图中每个小矩形的面积(即落在改组中的频率)乘以小矩形底边中点的横坐标(组中值)之和。
今天比较忙,就先介绍到这里。
2023年高考数学复习----《统计图表》规律方法与典型例题讲解
2023年高考数学复习----《统计图表》规律方法与典型例题讲解【规律方法】1、制作频率分布直方图的步骤.第一步:求极差,决定组数和组距,组距=极差组数第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表;第四步:画频率分布直方图.2、解决频率分布直方图问题时要抓住3个要点.(1)直方图中各小矩形的面积之和为1;(2)直方图中纵轴表示频率组距,故每组样本的频率为组距⨯频率组距(3)直方图中每组样本的频数为频率⨯总体个数.3、用频率分布直方图估计众数、中位数、平均数的方法.(1)众数为频率分布直方图中最高矩形底边中点的横坐标;(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;(3)平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和.【典型例题】例1.(2022·云南昆明·昆明一中模拟预测)为了响应教育部门疫情期间“停课不停学”的号召,某校实施网络授课,为了检验学生上网课的效果,在高三年级进行了一次网络模拟考试,从中抽取了100人的数学成绩,绘制成频率分布直方图(如下图所示),其中数学成绩落在区间[110,120),[120,130),[130,140]的频率之比为4:2:1.(1)根据频率分布直方图求学生成绩在区间[110,120)的频率,并求抽取的这100名同学数学成绩的中位数(2)若将频率视为概率,从全校高三年级学生中随机抽取3个人,记抽取的3人成绩在[100,130)内的学生人数为X ,求X 的分布列与数学期望.【解析】(1)由直方图可知,数学成绩落在区间[70,110)内的频率为(0.0040.0120.0190.030)10+++⨯=0.65,所以数学成绩落在区间[110,140]内的频率为10.650.35−=,因为数学成绩落在区间[110,120),[120,130),[130,140]的频率之比为4:2:1,所以数学成绩落在区间[110,120)的频率为40.35421⨯++0.2=, 数学成绩落在区间[70,100)的频率为(0.0040.0120.019)100.35++⨯=, 所以中位数落在区间[100,110)内,设中位数为x ,则(100)0.0300.50.35x −⨯=−,解得105x =, 所以抽取的这100名同学数学成绩的中位数为105.(2)由(1)知,数学成绩落在区间[100,130)内的频率为0.0310⨯+0.2+20.35421⨯++0.6=,由题意可知,3~(3,)5X B ,X 的所有可能取值为0,1,2,3,033338(0)C ()(1)55125P X ==⋅−=,12333(1)C (1)55P X ==⋅⋅−36125=, 22333(2)C ()(1)55P X ==⋅⋅−54125=,330333(3)C ()(1)55P X ==⋅−27125=,所以X 的分布列为:所以数学期望8365427()0123125125125125E X =⨯+⨯+⨯+⨯95=.例2.(2022·贵州贵阳·贵阳六中校考一模)某校组织1000名学生进行科学探索知识竞赛,成绩分成5组:[)50,60,[)60,70,[)70,80,[)80,90,[]90,100,得到如图所示的频率分布直方图.若图中未知的数据a ,b ,c 成等差数列,成绩落在区间[)60,70内的人数为400.(1)求出直方图中a ,b ,c 的值;(2)估计中位数(精确到0.1)和平均数(同一组中的数据用该组区间的中点值代替); (3)若用频率估计概率,设从这1000人中抽取的6人,得分在区间[]90,100内的学生人数为X ,求X 的数学期望.【解析】(1)依题意可得:4001000100.04a =÷÷=,又a ,b ,c 成等差数列,所以2b a c =+且(0.0050.005)101a b c ++++⨯=,解得:0.02,0.03c b == 所以0.04,0.03,0.02a b c ===.(2)因为(0.0050.04)100.450.5+⨯=<,设中位数为x , 则[70,80)x ∈,所以()()0.0050.0410700.030.5x +⨯+−⨯=,解得:71.7x ≈,即中位数约为71.7,平均数为(550.005650.04750.03850.02950.005)1073⨯+⨯+⨯+⨯+⨯⨯=. (3)由题意可知:得分在区间[]90,100内概率为10.0051020⨯=, 根据条件可知:X 的所有可能值为0,1,2,3,4,5,6,且1(6,)20X ,所以1()60.320E X np ==⨯=.例3.(2022·全国·高三专题练习)为丰富学生课外生活,某市组织了高中生钢笔书法比赛,比赛分两个阶段进行:第一阶段由评委为所有参赛作品评分,并确定优胜者;第二阶段为附加赛,参赛人员由组委会按规则另行确定.数据统计员对第一阶段的分数进行了统计分析,这些分数X 都在[75,100)内,再以5为组距画分数的频率分布直方图(设“Y=频率组距”)时,发现Y 满足:7,15,15019,16,30011,16,1520n Y n k n n ⎧=⎪⎪⎪==⎨⎪⎪−⋅>⎪−⎩,55(1)n N n X n *∈≤<+. (1)试确定n 的所有取值,并求k ;(2)组委会确定:在第一阶段比赛中低于85分的同学无缘获奖也不能参加附加赛;分数在[95,100)内的同学评为一等奖;分数在[90,95)内的同学评为二等奖,但通过附加赛有111的概率提升为一等奖;分数在[85,90)内的同学评为三等奖,但通过附加赛有17的概率提升为二等奖(所有参加附加赛的获奖人员均不降低获奖等级,且附加赛获奖等级在第一阶段获奖等级基础上,最多升高一级).已知学生A 和B 均参加了本次比赛,且学生A 在第一阶段获得二等奖.①求学生B 最终获奖等级不低于学生A 最终获奖等级的概率;②已知学生A 和B 都获奖,记A ,B 两位同学最终获得一等奖的人数为ξ,求ξ的分布列和数学期望.【解析】(1)根据题意,X 在[75,100)内,按5为组距可分成5个小区间, 分别是[75,80),[80,85),[85,90),[90,95),[95,100),因为75100X ≤<,由55(1)n X n ≤<+,n N *∈,所以15,16,17,18,19n =.每个小区间的频率值分别是7,15,30195,1660115,17,18,19320n P Y n k n n ⎧=⎪⎪⎪===⎨⎪⎪−⋅=⎪−⎩由719111511306032k ⎛⎫++−++= ⎪⎝⎭,解得350k =. (2)①由于参赛学生很多,可以把频率视为概率.由(1)知,学生B 的分数属于区间[75,80),[80,85),[85,90),[90,95),[95,100)的概率分别是:730,1960,1460,1160,260.我们用符号ijA (或ijB )表示学生A (或B )在第一轮获奖等级为i ,通过附加赛最终获奖等级为j ,其中(,1,2,3)j i i j ≤=记“学生B 最终获奖等级不低于学生A 的最终获奖等级”为事件W , 则()12122223222()P W P B B B A B A =+++()()()()()()12122223222P B P B P B P A P B P A =+++2111111010141105160601160111160711220=+⋅+⋅⋅+⋅⋅=.②学生A 最终获得一等奖的概率是111A P =,学生B 最终获得一等奖的概率是21112116060272711272796060B P =+⋅=+=,1180(0)1111999P ξ⎛⎫⎛⎫==−−= ⎪⎪⎝⎭⎝⎭,111118(1)1111911999P ξ⎛⎫⎛⎫==⋅−+−⋅=⎪ ⎪⎝⎭⎝⎭, 111(2)11999P ξ==⋅=.所以ξ的分布列为:801812001299999999E ξ=⋅+⋅+⋅=.。
利用直方图求中位数的计算公式
利用直方图求中位数的计算公式
每个矩形的面积就是这组数据的频率,把每个矩形的面积从左加起,加到接近0.5时(没超过)用0.5减去之前加得的面积,再用减得的数值除以下一组的面积,再乘以组距,再加上在与上一组之间的数就得到了中位数。
直方图中位数怎么求
中位数=x+0.5-(s1-s2-……-sn)/h,其中x表示中位数所在的那个方格的前边界数,例如这个方格表示在(15~18)那么x表示15,括号里面表示在这个方格前面的所有方格的面积,也就是频率,h表示中位数所在的方格的高。
小提示:
1.中位数就是频率分布直方图面积的一半所对应的值。
2.频率分布直方图是按照一定的规律排列的,一般是按照由小到大或由大到小,就把组数想成一组数字,如果它是偶数就取它相邻的那组数据的的平均数,得数就是横坐标;如果组数是奇数,就取这些组数的的中间的那组的数据,那组数就是横坐标。
众数中位数平均数与频率分布直方图ppt
二 、 众数、中位数、平均数 与频率分布直方图的关系
1、众数在样本数据的频率分布直方图 中,就是最高矩形的中点的横坐标。
例如,在上一节调查的100位居民的月 均用水量的问题中,从这些样本数据的频 率分布直方图可以看出,月均用水量的众 数是2.25t.如图所示:
频率分布直方图如下:
频率 组距
众数(最高的矩形的中
点)
0.50
0.40
0.30
0.20
0.10
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.
2、在样本中,有50%的个体小于或等于 (1)指出这个问题中周工0
0.40
0.30
0.20
0.10
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
说明:
2.02这个中位数的估计值,与样本 的中位数值2.0不一样,这是因为样本数 据的频率分布直方图,只是直观地表明 分布的形状,但是从直方图本身得不出 原始的数据内容,所以由频率分布直方 图得到的中位数估计值往往与样本的 实际中位数值不一致.
一 众数、中位数、平均数的概念
众数、中位数、平均数都是描述一组数据的集中 趋势的特征数,只是描述的角度不同,其中以平均数 的应用最为广泛.
1众数:在一组数据中,出现次数最多的数据叫做这 组数据的众数.
2中位数:将一组数据按大小依次排列,把处在最中间 位置的一个数据(或最中间两个数据的平均数)叫做这组 数据的中位数.
3平均数 (1) x = (x1+x2+……+xn) /n
利用频率分布直方图计算中位数
2015安徽省高三摸底考试•数学(理科)试题 参考答案第1页(共3页)利用频率分布直方图计算中位数从下列频率分布直方图中估计所有中位数与众数之和为(答案:7400如何用频率分布直方图求方差,中位数,平均数,众数平均数则是每组频率的中间值乘频数再相加 平均数=4 <3*0.02+7^.03+11*0.09+17*0.03)=8 48方差=1/5[(3-8.48r2+(7-8.48f2+(11-8 48r2+(15-8.48r2+(19-8.48f2]=3a .3504 中位数就是频率分布直方图面积的一半所对应的值即左右面积和为d 弓就行了。
设中位数为日" 则V (0.02+0 08+x)=0 5 x=0.025 所以中位数为9.025 众数就是频率最高的中间值 就是11您的满意是我継续的动力!)元。
打频率朗距0.C005 0.00040.00030.0002 0.00011000 1500 200Q 2500 3000 35004000已知一组数据的频率分布直方图如图所示•求众数、中位数、平均数.傅折匕 在频母廿布直方田中■处敷壬良鬲的丿卜杀方降的麻边的中廉横坐标的虫・中位做是所有小疋方邢的両积昶等的井界战,平均敘乞各小世方飛底边中 点的植圭特与对应频卑的职的和.由此求出即叫. 由m 04=0”鼻 所哄面枳相等的廿邪疑沟EE ,即中位皱为E5; 平均如 55X0. 3+S5 X(J. 4+75 XO. ] 6+65X0. 1+95XD, 05=67.斗題利用頻卑廿冇直方囲,老查了苯致宛的应数“申位敷和平均数抽河題,靜腿吋应根据心蚁.中位我限憑平■均数时意56廿别求出它Tl ・是基财更.如图所示是一样本的频率分布直方图, 则由图形中的数据, 可以估计众数与中位数) 分别是( )A • 12.5 12.5B • 12.5 13C . 13 12.5D . 13 13众数是频率分布直方图中最高矩形的底边中点的横坐标, 二中间的一个矩形最高,故10与15的中点是12.5,众数是12.5 而中位数是把频率分布直方图分成两个面积相等部分的平行于Y 轴的直线横坐标第一个矩形的面积是0.2,第三个矩形的面积是0.3,故将第二个矩形分成3 : 2即可 二中位数是13 故选B .为了了解某校1000名初中生右眼视力情况,随机对50名学生右眼视力进行了检查,绘制了如下统计表和频率 分布直方图.视力0.1 0.2 0.3 0.4 0.5 0.6 0.70.8人数1132342解:日频率静布宜方图可知. 歳裁划咚二卫丸亦点评;视力 0.9 1 1.0 1| 1.1 || 1.2 | 1.3 | 1.4 11.5 || | 人数| 2 || 4 || 8 |4 |2 16 II 1请解答下列问题:(1 )补全统计表和频率分布直方图;(2) 填空:在这个问题中,样本是50名学生右眼视力,在这个样本中,视力的中位数是丄,视力的众数落在频 率分布直方图(从左至右依次是第一、二、三、四、五小组)的第四小组内;(3) 如果右眼视力在0.6及0.6以下的必须矫正,试估计该校右眼视力必须矫正的学生约有多少人?(1) 首先根据喪格可以得到第一组的頻率,然后根据频率分布直芳图可以得到第二小 组和第三粗的频率,接着得到其他小组的频率,然后利用这些已知条件可以求出视力为 D 左的人数,也可収得封视力为1」的人数,也就可以补全统计表和頻率分布直肓图,(2) 根据样本的定义可以确定这个问题中的样本,根据中位数的定义可以确定这组数据的中位魏;(3)根据表格可以得到刃人中有多少人的视力必须矫正,然后利用样本估计总体的思想即可得到该校右眼视力必狈矫正的学生约肓多少人.2-2-5.视力沖11的人敌■生0. 1 0 20.30 40.5 0.6 0.7 0.8 1 1 3 2 3 4 25 0 9 1.0 11 1.2 1.3 1.4 1.5 24 38 42 6(2)在这个间题中,样本是刃名学主右眼视力,在这个样本中,视力的中位数是1』, 视力的金数螯在頻率分布直右图(从左至右依次是第一、二、三、四、五小组)的第四小组内;(3)如果右眼视力在0.6^0.61^下的必、须矫正,那么刘人中育沏人必须矫正,由此可以佶计该校右眼视力边颁矫正的学生釣<14^50X 1000-280人.此题比较复朵.内容氏较多,主要考查读频数分布直方图的能丈I 和利用统计图获取信息的能力,利用统计图获取信息时,必须认真观察、分析、研究统计图,才能作出正确的 判斷和禅决问题.分析 解答.fTi" ■(1)第一组育5人,第二组有9人,点评。
众数中位数平均数与频率分布直方图ppt(共15张PPT)
二 、 众数、中位数、平均数与 频率分布直方图的关系
1、众数在样本数据的频率分布直方图中 ,就是最高矩形的中点的横坐标。
例如,在上一节调查的100位居民的月均 用水量的问题中,从这些样本数据的频率分布 直方图可以看出,月均用水量的众数是2.25t. 如图所示:
频率分布直方图如下:
频率 组距
众数(最高的矩形的中
分别求这些运动员成绩的众数,中位数与平 均数
解:在17个数据中,1.75出现了4次,出现的次 数最多,即这组数据的众数是1.75.
上面表里的17个数据可看成是按从小到大的顺 序排列的,其中第9个数据1.70是最中间的一个数据 ,即这组数据的中位数是1.70;
这组数据的平均数是
答:17名运动员成绩的众数、中位数、平均数 依次是1.75(米)、1.70(米)、1.69(米).
人员 经理 管理人员 高级技工 工人 学徒 合计 分析:众数为200,中位数为220,平均数为300。
例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2. 1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。
周工资 2200 250 220 200 100 01,几乎不影响中位数,但显然这一极端值是不能忽视的。
1众数:在一组数据中,出现次数最多的数据叫做这组数据的众数. 1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。 3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。 n 个样本数据的平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。 (2) x =(x1f1+x2f2+……xkfk)/n 3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。 例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2. 3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。
最新众数、中位数、平均数与频率分布直方图的关系
二 、 众数、中位数、平均数 与频率分布直方图的关系
(在只有频率分布直方图的情况下,也可以估计总体特征,而且直方图比较直观 便于形象地进行分析。)
1、众数在样本数据的频率分布直方图中, 就是最高矩形的中点的横坐标。
频数
20 30 80 40 30 200
频率
0.10 0.15 0.40 0.20
0.15 1
累积频率 0.10 0.25 0.65 0.85 1
0 100 200300400 500 600 寿命(h)
总体分布的估计
(3)由频率分布表 出可 ,以 寿看 命 10在 h0~400
的电子元件出现 为的 :0.6频 5,率 所以我们估计电子
1、通过频率分布直方图的估计精度低;
2、通过频率分布直方图的估计结果与数据分组 有关;
3、在不能得到样本数据,只能得到频率分布直 方图的情况下,也可以估计总体特征,而且直方图 比较直观便于形象地进行分析。
20
30
80
40
30
(1)列出频率分布表;
(2)画出频率分布直方图; (3)估计电子元件寿命在100h~400h以内的概率; (4)估计电子元件寿命在400h以上的概率; (5)估计总体的数学期望.
寿命 100~200 200~300 300~400 400~500 500~600
合计
频率/组距
总体分布的估计
1002000.102003000.153004000.40
2
2
2
4005000.205006000.15151409082.5365.
用直方图算平均数,中位数、众数、标准差
,n ,这n个数的 3、算出 x i -x i=1, 2,… 2 平均数,即为样本方差 s 4、算出方差的算术平均值,即为样本标准差s。
2 2 2 2 1 s = x1 - x x 2 - x x 3 - x … x n - x n 2 2 1 n 1 2 2 2 2 = x i - x = x1 x 2 x 3 … x n -nx n i=1 n 2
的更稳定些吗?
为了从整体上更好地把握总体的规律,我们要通 过样本的数据对总体的数字特征进行研究。——用样 本的数字特征估计总体的数字特征。
1、众数
在一组数据中,出现次数最多
的数据叫做这一组数据的众数. 2、中位数 将一组数据按大小依次排列, 把处在最中间位置的一个数据(或两个数据 的平均数)叫做这组数据的中位数. 3、平均数 (1) (2) x = (x1+x2+……+xn) /n x = x1f1+x2f2+……+xkfk
4
4.5
月平均用水
频率 组距
如何在频率分布直方图中估计中位数
0.6 0.5 0.4 0.3 0.2 0.1 0
前四个小矩形的 面积和=0.49
0.25
后四个小矩形的 面积和=0.26
0.22 0.15 0.08 0.04 0.5 1 1.5 2 2.5 3
0.14 0.06
0.04 3.5
0.02 4 4.5
有两位射击运动员在一次射击测试中各射 靶十次,每次命中的环数如下:
如果你是教练,你应当如何对这次射击情况作出 评价?如果这是一次选拔性考核,你应当如何作出选 择?
标准差
标准差是样本数据到平均数的一种平均距 离.它用来描述样本数据的离散程度.在实际应 用中,标准差常被理解为稳定性.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(在只有频率分布直方图的情况下,也可以估计总体特征,而且直方图比较直观 便于形象地进行分析。)
1、众数在样本数据的频率分布直方图中, Nhomakorabea就是最高矩形的中点的横坐标。 当最高矩形的数据组为〔a, b) 时, 那 么(a+b)/2就是众数。
频率 组距
0.5 0.4 0.3 0.2 0.1
练习.(广东11变式题1)为了调查某厂工人生产 某种产品的能力,随机抽查 了20位工人某天生 产该产品的数量.产品数量的分组区间为 45,55 , 55, 65 , 65, 75 , 75,85 85,95 由此得到频率 , 分布直方图如图3,则这20名工人中一天生产 该产品 数量在 的中位 数 .
O
0.5
1
1.5
2
2.5
3
3.5
4
4.5
月平均用水量(t)
例题分析:月均用水量的众数是2.25t.如图所示:(2+2.5)/2=2.25
2、从频率分布直方图中估计中位数
(中位数是样本数据所占频率的等分线。)
• 当最高矩形的数据组为〔a, b) 时, 设中位 数为(a+X),根据中位数的定义得知, 中位 数左边立方图的小矩形面积为0.5, 列方程 得: • 当最高矩形的数据组之前所有小矩形的面 积之和为fm;(频率直方图的面积计算,即组距乘以频率/组距。) • x*最高矩形的(频率/组距)+ fm=0.5
• 求解X, 那么a+X即为中位数。
思考题:如何从频率分布直方图中估计中位数? 频率/组距
0.50 0.44 0.40 0.30 0.16 0.20 0.08 0.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
中位数左边立方图的小矩形面积为0.5 月均用水量 /t 0~2的小矩形面积之和为: 0.5×(0.08+0.16+0.30+0.44)=0.49 0.5-0.49=0.01 0.01/0.5=0.02 如图在直线t=2.02之前所有小矩形的面积为0.5 所以该样本的中位数为2.02