频率分布直方图与茎叶图..
学案4:5.1.3 第1课时 柱形图、折线图、扇形图、茎叶图~5.1.3 第2课时 频数分布
5.1.3 第1课时柱形图、折线图、扇形图、茎叶图~5.1.3 第2课时频数分布直方图与频率分布直方图【课标要求】课程标准:能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.学习重点:柱形图、折线图、扇形图、茎叶图、频数分布直方图、频率分布直方图、频数分布折线图、频率分布折线图的绘制及应用.学习难点:频率分布直方图的绘制.【知识导学】知识点一柱形图(1)柱形图(也称为图)可以形象地各种数据之间的关系.(2)一般地,柱形图中,一条轴上显示的是,另一条轴上对应的是、或者,柱形图中每一矩形都是的.知识点二折线图折线图可以形象地表示出数据的.知识点三扇形图(1)扇形图可以形象地表示出.(2)扇形图中,每一个扇形的以及,都与这一部分表示的数据成正比.知识点四茎叶图一般来说,茎叶图中,所有的都竖直排列,而沿水平方向排列.茎叶图也可以只表示一组数据.知识点五频数分布直方图与频率分布直方图(1)绘制频数分布直方图与频率分布直方图的步骤①;②;③;④.注意:频数分布直方图的纵坐标是频数,每一组数对应的矩形的高度与频数成正比;频率分布直方图的纵坐标是频率组距,每一组数对应的矩形高度与频率成正比,而且每个矩形的面积等于这一组数对应的频率,所有矩形的面积之和为1.(2)频数分布折线图和频率分布折线图的作图方法是:把频数分布直方图与频率分布直方图中每个矩形上面一边的 用线段连接起来,同时,为了方便看图,这两种折线图都画成与横轴 .注意:这两种折线图与横轴的左右两个交点没有实际意义.【新知拓展】1.在制作茎叶图时,重复出现的数据要重复记录,不能遗漏,特别是叶的部分,同一数据出现几次就记录几次.2.几种表示频率分布的方法的优点与不足【基础自测】1.判一判(正确的打“√”,错误的打“×”) (1)柱形图可以形象地表示出数据的变化情况.( ) (2)折线图可以形象地比较各种数据之间的数量关系.( )(3)扇形图中,每个扇形的弧长,与这一部分表示的数据大小无关.( ) (4)茎叶图不可以表示一组数据.( ) (5)频数分布直方图的纵轴表示频数.( )(6)频率分布直方图中每个小矩形的面积等于相应组的频率.( ) 2.做一做(1)反映某种股票的涨跌情况,应选择()A.柱形图B.折线图C.扇形图D.三种图均可(2)果园里有荔枝树150棵,龙眼树50棵,芒果树200棵,若要画出它们的扇形图,则芒果树所占扇形圆心角的度数为()A.37.5°B.12.5° C.180°D.120°(3)下面茎叶图表示某城市一台自动售货机在18天内的销售额情况(单位:元),图中数字7的意义是表示这台自动售货机在该天的销售额为________元.()A.7B.37 C.27D.2337(4)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.【题型探究】题型一柱形图与扇形图例1某省有关部门要求各中小学要把“每天锻炼一小时”写入课程表,为了响应这一号召,某校围绕着“你最喜欢的体育活动项目是什么?(只写一项)”的问题,对在校学生进行了随机抽样调查,从而得到一组数据.图1是根据这组数据绘制的柱形图.请结合柱形图回答下列问题:(1)该校对多少名学生进行了抽样调查?(2)本次抽样调查中,最喜欢篮球活动的有多少人?占被调查人数的百分比是多少?(3)若该校九年级共有200名学生,图2是根据各年级学生人数占全校学生总人数的百分比绘制的扇形图,请你估计全校学生中最喜欢跳绳活动的人数约为多少?【规律方法】(1)柱形图是用一个单位长度表示一定的数量,根据数量的多少画成高度不同的小矩形,然后把这些小矩形按照一定的顺序排列起来.其特点是便于看出和比较各种数量的多少,即柱形图能清楚地表示出每个项目的具体数目.(2)扇形图是用整个圆面积表示总数(100%),用圆内的扇形面积表示各部分所占总数的百分数.总之,用图表来表示数量关系更生动形象、具体,使人一目了然.【跟踪训练1】(1)如图是甲、乙、丙、丁四组人数的扇形图的部分结果,根据扇形图的情况可以知道丙、丁两组人数和为()A.250B.150C.400D.300(2)某班计划开展一些课外活动,全班有40名学生报名参加,他们就乒乓球、足球、跳绳、羽毛球等4项活动的参加人数做了统计,绘制了柱形图(如图所示),那么参加羽毛球活动的人数的频率是________.题型二折线图例2下表给出了2018年A,B两地的降水量(单位:mm)根据统计表绘制折线图.【规律方法】在绘制折线图时,可以先整理和观察数据统计表,然后建立直角坐标系,描出与数据相对应的点,再顺次连接相邻的点,就得到折线图.特别注意,画折线图时,横轴、纵轴表示的实际含义要标明确.【跟踪训练2】如图是某市2019年4月1日至4月7日每天最高、最低气温的折线图,在这7天中,日温差最大的一天是()A.4月1日B.4月2日C.4月3日D.4月5日题型三茎叶图的绘制例3某中学甲、乙两名同学最近几次的数学考试成绩情况如下:甲的得分:95,81,75,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.【规律方法】(1)画茎叶图时,用中间的数表示数据的十位和百位数,两边的数分别表示两组数据的个位数.要先确定中间的数取数据的哪几位,填写数据时边读边填.比较数据时从数据分布的对称性、中位数、稳定性等几方面来比较.(2)绘制茎叶图的关键是分清茎和叶,一般地说数据是两位数时,十位数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶.【跟踪训练3】为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A 药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6,1.2,2.7,1.5,2.8,1.8,2.2,2.3,3.2,3.5,2.5,2.6,1.2,2.7,1.5,2.9,3.0,3.1,2.3,2.4服用B药的20位患者日平均增加的睡眠时间:3.2,1.7,1.9,0.8,0.9,2.4,1.2,2.6,1.3,1.4,1.6,0.5,1.8,0.6,2.1,1.1,2.5,1.2,2.7,0.5根据两组数据完成如图所示的茎叶图,从茎叶图看,哪种药的疗效更好?题型四频率分布直方图的绘制例4某校为了解高一年级学生的身高情况,随机抽取了100名高一年级学生进行测量,测得的身高数据(单位:cm)如下:168 165 171 167 170 165 170 152 175 174165 170 168 169 171 166 164 155 164 158170 155 166 158 155 160 160 164 156 162160 170 168 164 174 171 165 179 163 172180 174 173 159 163 172 167 160 164 169151 168 158 168 176 155 165 165 169 162177 158 175 165 169 151 163 166 163 167178 165 158 170 169 159 155 163 153 155167 163 164 158 168 167 161 162 167 168161165174156167166162161164166试列出这组数据的频率分布表,作出这组数据的频率分布直方图.【规律方法】(1)在列频率分布表时,极差、组距、组数有如下关系: ①若极差组距为整数,则极差组距=组数;②若极差组距不为整数,则极差组距的整数部分+1=组数.(2)组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,以使数据的分布规律能较清楚地呈现出来;组数太多或太少,都会影响我们了解数据的分布情况,若数据个数不超过100,按照数据的多少常分为5~12组.一般数据个数越多,所分组数越多. 【跟踪训练4】美国历届总统中,就任时年龄最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年龄最大的是特朗普,他于2016年就任,当时70岁.下面按时间顺序(从1789年的华盛顿到2016年的特朗普,共45任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,47,70.(1)将数据分为7组,列出频率分布表,并画出相应的频率分布直方图和频率分布折线图;(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.【随堂达标】1.如图是P,Q两国2019年财政经费支出情况的扇形图,根据扇形图,下面对两国全年教育经费支出判断正确的是()A.P国比Q国多B.Q国比P国多C.P国与Q国一样多D.无法确定哪国多2.如图所示是某校高一年级学生到校方式的柱形图,根据图形可得出骑自行车人数占高一年级学生总人数的()A.20%B.30%C.50%D.60%3.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃。
频率分布直方图与茎叶图..
(1)极差为67-28=39,取组距为5,分为8 组. 样本频率分布表:
分 组 频数 频率 [27,32) 3 0.06 [32,37) 3 0.06 [37,42) 9 0.18 [42,47) 16 0.32 [47,52) 7 0.14 [52,57) 5 0.10 [57,62) 4 0.08 [62,67] 3 0.06 合 计 50 1.00
合计
频数
4 8 15 22 25 15 5 4 2 100
频率
0.04
0.08 0.15
0.22 0.25 0.15
0.05 0.04 0.02
1
组距=0.5
频率/组距 0.08 0.16 0.3 0.44 0.5 0.3 0.1 0.08 0.04 2.00
第 频率/组距 (组距=0.5) 五 步: 0.6
出总体上在20—60元之间其 0.024
频率分布直方图如右图所示 0.01
,为具体了解同学们购买课
外读物的具体情况,按支出 的情况进行分层抽样,抽出
元 20 30 40 50 60
一个容量为100的样本进行分
析,其中支出在 [50,60)
元的同学应抽取 30 人。
课堂测试:
例1.关于频率分布直方图中小长方形的高说法,
(2)样本频率分布直方图:
频率 组距
0.06 0.05 0.04 0.03 0.02 0.01
O 27 32 37 42 47 52 57 62 67
年龄
(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在32~52岁的知识分子约占70%.
理论迁移 2 频率
某校共有5000名学生,该校 组距 学生每月课外读物方面的支 0.036
2.2.1频率分布折线图、总体密度曲线和茎叶图
频数为 12. (1)第二小组的频 率是多少?0.08
(2)样本容量是多 少?150
频率/组距 0.036
0.032 0.028 0.024
0.020
(3)若次数在 110 以 上(含 110 次)为达 标,试估计该校全体
高一学生的达标率约
是多少?88%
0.016 0.012 0.008 0.004
A. 32 C. 40
B. 0.2 D. 0.25
o
90 100 110 120 130 140 150 次数
练习
2. 某班级共有学生 54 人,现根据学生的学号, 用系统抽样的方法,抽取一个容量为 4 的样本. 已知 2 号,28 号,41 号同学在样本中,那么样 本中还有一个同学的学号是 15 .
3. 在抽取某产品的尺寸过程中,将其尺寸分成
若干组,[a,b]是其中一组,抽查出的个体数在
2.2 用样本估计总体
第二课时
复习
1. 列出一组样本数据的频率分布表可以分 哪几个步骤进行?
第一步,求极差. 第二步,决定组距与组数. 第三步,确定分点,将数据分组. 第四步,统计频数,计算频率,制成表格.
复习
2. 频率分布直方图是在平面直角坐标系中画若 干个依次相邻的小长方形,这些小长方形的宽、 高和面积在数量上分别表示什么?
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
湖南省长沙市一中卫星远程学校
探究 1:频率分布折线图与总体密度曲线
思考 2:当总体中的个体数很多时(如抽样调查全 国城市居民月均用水量),随着样本容量的增加, 作图时所分的组数增多,组距减少,你能想象出 相应的频率分布折线图会发生什么变化吗?
直方图与茎叶图
中位数
平均数
S2= 方差
1 2 2 2 [( x - x ) + ( x - x ) +…+ ( x - x ) ]. 2 n n 1
1 x =n(x1+x2+…+xn)
其中s为标准差
二、样本的数字特征
数字特征
众 数
定义(直方图中,无原始数据) 最高矩形的中点的横坐标 直方图中使得左边和右边的直方图的
(1)若X=8,求乙组同学植树棵树的平均数与方差。
(2)如果X=9,分别从甲、乙两组中随机选取一名同 学,求这两名同学的植树棵树为19的概率
1.甲、乙两名同学在5次体育测试中的成绩统计如
图所示,若甲、乙两人的平均成绩分别是X甲,X乙, 则下列结论正确的是( A ) A.X甲<X乙,乙比甲成绩稳定 B.X甲>X乙,甲比乙成绩稳定 C.X甲>X乙,乙比甲成绩稳定 D.X甲<X乙,甲比乙成绩稳定 甲 8 7 2 6 2 乙 7 8 8 2 7 9 1 2
(1)直方图中x的值为 0.0044 (2)在这些用户中,用电量落在区间 [100,250] 内的户数为 70
茎叶图的应用
例2:(2011北京)以下茎叶图记录了甲、乙 两组各四名同学的植树棵数,乙组记录中有 一个数据模糊,无法确认,在图中以x表示: 甲组 9 1 9 1 0 1 乙组 X 8 9 0
练 习
2.下图是某学校举行的运动会上七位评委为某体 操项目打出的分数的茎叶图,去掉一个最高分 和一个最低分后,所剩数据的平均数和方差分 别为( C ) 7 9 8 4 4 6 4 7 9 3 A.84, 4.84 C.85,1.6 B.84, 1.6 D.85,4
与概率的综合应用
例3.(2013广东高考改)某车间共有12名工人,随 机抽 取 6名,他们某日加工零件个数的茎叶图如图所 示,其中茎为十位数,叶为个位数. (Ⅰ)根据茎叶图计算样本均值; 1 7 9 (Ⅱ)日加工零件个数大于样本均 2 0 1 5 值的工人为优秀工人.根据茎叶图 推断车间12名工人中有几名优秀工人 3 0 (Ⅲ) 从该车间12名工人中,任取3名, 求至少有2名优秀员工的概率 22 4
判断离散趋势最常用的方法
判断离散趋势最常用的方法在统计学中,判断离散趋势最常用的方法包括茎叶图、箱线图、频率分布表及直方图、累积频率曲线等。
这些方法可以帮助我们判断数据的离散程度、分布形态以及异常值等情况。
下面将逐一对这些方法进行详细介绍。
首先,茎叶图是一种简单而直观的图形展示方法。
它通过将数据的十位和个位数分别绘制在纵轴和横轴上,用直线连接各个叶子,从而构成茎叶图。
茎叶图可以直观地显示出数据的分布情况,特别是对于小型数据集来说。
通过观察茎叶图,我们可以快速判断数据的离散程度以及是否存在异常值。
其次,箱线图是一种较为常用的描述统计方法,通过绘制数据的五数概括(最小值、第一四分位数、中位数、第三四分位数和最大值)和异常值情况,直观地展示数据的分布情况。
在箱线图中,箱体代表数据的四分位距,上下边界为上下四分位数加减1.5倍的四分位距,异常值则用小圆点表示。
箱线图可以帮助我们判断数据的离散情况,特别是异常值的存在。
频率分布表及直方图是一种将数据分组统计的方法。
频率分布表将数据按照一定的区间范围进行划分,并统计各个区间内的观测频数。
而直方图是在频率分布表的基础上,通过绘制矩形条形图来展示数据的分布情况。
直方图的横轴为数据的区间范围,纵轴为频数或频率。
通过观察频率分布表及直方图,我们可以判断数据的分布形态(如对称、偏态、峰态)以及离散程度。
直方图还可以帮助我们直观地比较不同样本或不同群体之间的差异。
最后,累积频率曲线是描述数据分布情况的一种图形方法。
它是在频率分布表的基础上,将各个区间的频数累加得到累积频数,并绘制成曲线图。
累积频率曲线可以直观地展现数据的累积分布情况,帮助我们判断数据的集中程度和离散程度。
特别是在比较多个样本或多个群体之间的分布差异时,累积频率曲线是一种常用的分析工具。
综上所述,茎叶图、箱线图、频率分布表及直方图、累积频率曲线是判断离散趋势最常用的方法。
不同的方法可以从不同的角度帮助我们分析数据的特征,并提供直观的图形展示。
茎叶图
0 . 30 0 . 20
0 . 15
0 . 14
0 . 08
0 . 10
0 . 06
. . 0.04
.
..
. . . . 0.04 0 . 02
o
0.25
0.5
0.75
1 1.5 2
1.25 1.75
2.5
2.25 2.75
3
3.25
3.5
3.75
4 4.5
4.25
2.02
数学 必修3(配人教版)
2.2.2用样本的数字特 征估计总体的数字特征
什么是众数、中位数、平均数?
众数:在一组数据中,出现次数最多 的数称为众数 中位数:在按大小顺序排列的一组 数据中,居于中间的数称为中位数 平均数:一般是一组数据和的算术 平均数
求下面这组数据的众数、中位数、平均数
4、4、4、6、6、6、6、8、8、8
o
0.5 1 1.5
0 . 14
2 2.5
2.02
0 . 06 0 . 04 0 . 02
3 3.5 4 4.5
月均用水量 / t
总结:在频率分布直方图中,把频率分布直方图划分左
右两个面积相等的分界线与x轴交点的横坐标称为中位数。
如何从频率分布直方图中估计平均数 ?
频率 /组距
0 . 50 0 . 40
试利用频率分布直方图求: (1)这50名学生成绩的众数与中位数; (2)这50名学生的平均成绩.
数学 必修3(配人教版)
7994 824590 912
数学 必修3(配人教版)
预习·自主学习
茎叶图的画法 探究·课堂互动
反馈·课堂达标
频率分布折线图与茎叶图
D.如果样本容量无限增大,分组的组距无限减小,那么频率分布直方图就会无限接近于总体密度曲线
2.一个容量为20的样本数据,分组后组距与频数如下: ,2; ,3; ,4; ,5; ,4; ,2,则样本在区间 上的频率为(D)
A. B. C. D.
3.如图是甲、乙两名射击运动员各射击10次后所得到的成绩的茎叶图(茎表示成绩的整数环数,叶表示小数点后的数字),由图可知
(A)
A.甲、乙中位数的和为18.2,乙稳定性高
B.甲、乙中位数的和为17.8,甲稳定性高
C.甲、乙中位数的和为18.5,甲稳定性高
D.甲、乙中位数的和为18.65,乙稳定性高
4.某化肥厂甲、乙两个车间包装化肥,在自动包装传送带上每隔30分钟抽取一包产品,称其重量,分别记录抽查数据如下(单位:kg):
(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5以上的概率.
解:(1)m=2 ,n=0.04, M=50 , N=1.00
(2)略
(3)153.5~157.5范围内的最多,身高在161,。5以上的概率为0.2
例2某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:
1.连接频率分布直方图中各个小长方形上端的中点,就得到频率分布折线图.随着__样本容量______的增加,作图时所分的_组数______增加,相应的频率分布折线图就会越来越接近于一条光滑曲线,称之为总体密度曲线,它能够更加精确的反映出___总体在各个范围内取值的百分比___________
2当样本数据数据较少时,用茎叶图表示数据的效果较好,它不但可以_保留原有信息___________,而且___可以随时记录______________,给数据的___记录________和____表示_________都带来了方便.
茎叶图
知识探究(二)
自主学习课本
茎叶图
70 页内容,交流回答 骤; 重复的数据如何处理?
1. 归纳出制作茎叶图的步 2 . 在制作茎叶图时,出现 3 . 什么是中位数? 4 . 用茎叶图处理数据有何
优缺点?
探究展示
1. 归纳出制作茎叶图的步 骤;
第一步,将每个数据分为“茎”(高位)和 “叶”(低位)两部分; 第二步,将最小的茎和最大的茎之间的数 按小大次序排成一列; 第三步,将各个数据的叶按大小次序写在茎 右(左)侧. 第一步中,如果是两位数字,则茎为十位上的数字, 叶为个位上的数字,如89,茎:8,叶:9; 如果是三位数则茎为百位上的数字,叶为十位上的和 个位上的数字,如123,茎:1,叶:23.
频率
组距
总体密度曲线
月均用 水量/t
总体密度曲线反映了总体在各个范围内取 值的百分比,精确地反映了总体的分布规律。
是研究总体分布的工具.
3. 说出图 2 . 2 - 3中阴影部分表示的意义
频率 组距
月均用 水量/t
a
b
表示总体在某个区间 (a, b) 内取值的百分比)。 总体密度曲线的实际意义在于: 总体密度曲线与x轴,直线x=a,x=b围成的面积 等于x在[a,b]取值时的概率.
知识探究(一)频率分布折线图 总体密度曲线
自主学习课本 69 页内容,交流回答 图? 密度曲线有何联系?
1. 如何做出频率分布折线 2. 频率分布折线图与总体
3. 说出图 2 . 2 - 3中阴影部分表示的意义 4 . 对于一个总体,如果存 这条曲线是否唯一?能 确地画出总体密度曲线 在总体密度曲线, 否通过样本数据准 ?
4.已知样本:12,7,11,12,11,12,10,10, 9,8,13,12,10,9,6,11,8,9,8,10, 那么频率为0.25的样本的范围是( D ) A. [5.5,7.5) B. [7.5,9.5) C. [9.5,11.5) D. [11.5,13.5) 5.频率分布直方图中,小长方体的面积等于( A.相应各组的频数 B.相应各组的频率 C.组数 D.组距
茎叶图方差
x x1 f1 x2 f2 ... xn fn
频率/组距
各组频率
加权平均数
1 f 2
f1 f 2 f 3 f4 x1 x2 x3 x4
1 f 2
fn xn
x
IQ值
《固(第6课时)》:10.已知一组数据125、121、123、125、127、 129、125、128、130、129、126、124、125、127、126、122、 124、125、126、128,共20个数据; (1)填写频率分布表:
中位数左右两边频率各 将n个数据按照从小到大排列 中位数 占1/2 n为奇数,取第(n+1)/2 位的数 n为偶数,取中间两数的平均数 每个小矩形底边中点的 平均数 横坐标 各组频率
x x1 f1 x2 f2 ... xn fn
x1 x2 ... xn x n
《导(第6课时)》:探究二(B).由图象知甲.乙两人五次测试成绩分别为
x 121.5 0.1 123.5 0.15 125.5 0.4 127.5 0.2 129.5 0.15
《导(第6课时)》:探究二(B).由图象知甲.乙两人五次测试成绩分别为
甲:10、13、12、14、16;
10+13+12+14+16 x甲 = =13 5
0.25 0.4
众数: 124.5 126.5 125.5
2
中位数:0.25 2 124.5 125.75
0.4
0.1
0.15
数据
频率 0.1 0.15 0.4 0.2 0.15
120.5 122.5 124.5 126.5 128.5 130.5
频率分布直方图
频率分布直方图与折线图及茎叶图1、频数条形图例1.下表是某学校一个星期中收交来的失物件数,请将5天中收交来的失物数用条形图表示.解:象这样表示每一天频数的柱形图叫频数条形图.我们也可以利用直方图反映样本的频率分布规律,这样的直方图称为,简称频率直方图,下面用例1的数据说明2、频率分布直方图:例2解:(1)根据频率分布表,作直角坐标系,以横轴表示,纵轴表示;(画出频率分布直方图)(2)在横轴上和纵轴上标上表示的点;(3)在上面各点中,分别以连接相邻两点的线段为底作矩形,高等于该组的,每一个矩形的面积等于各个组的。
3、频率分布折线图在频率分布直方图中,取相邻矩形上底边的中点顺次连结起来,就得到频率分布折线图(简称频率折线图),请在例2的频率折线图上画出频率折线图。
4、密度曲线如果样本容量取得足够大,分组的组距取得足够小,则相应的频率折线图将趋于一条光滑的曲线,称这条光滑的曲线为总体的密度曲线.5.茎叶图.某篮球运动员在某赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50.问题:如何有条理地列出这些数据,分析该运动员的整体水平及发挥的稳定程度?【范例点睛】例1 .有一个容量为100的某高校毕业生起始月薪的样本,数据的分组及各组的频数如下:(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计该校毕业生起始月薪低于2000元的可能性.2、为了了解各自受欢迎的程度,甲、乙两个网站分别随机选取了14天,记录下上午8:00-10:00间各自的点击量:甲:73,24,58,72,64,38,66,70,20,41,55,67,8,25;乙:12,37,21,5,54,42,61,45,19,6,19,36,42,14.你能用茎叶图表示上面的数据吗?你认为甲、乙两个网站哪个更受欢迎?【随堂演练】1.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用右侧的条形图表示.根据条形图可得这50名学生这一天平均每天的课外阅读时间为()A.0.6小时B.0.9小时C.1.0小时D.1.5小时2.一般家庭用电(千瓦时)与气温(C )有一定的关系.图(1)表示某年12个月中每月的平均气温.图(2)所示某家庭在这年12个月中每月的用电量.根据这些信息,以下关于该家庭用电量与气温间的关系叙述中,正确的是()A.气温最高时,用电量最多B.气温最低时,用电量最少C.当气温大于某一值时,用电量随气温增高而增加D.当气温小于某一值时,用电量随气温降低而增加3.在频率分布直方图中,所有矩形的面积和为__________.4.为了解高中学生的体能情况,抽了100名学生进行引体向上次数测试,将所得数据整理后,画出频率直方图(如右图所示),图中从左到右依次为第1,2,3,4,5组.(1)第1组的频率为__________,频数为__________.(2)若次数在5次(含5次)以上为达标,则达标率为________________ .5、右面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知()A.甲运动员的成绩好于乙运动员B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异D.甲运动员的最低得分为0分甲12345乙824719936250328754219441。
用样本估计总体
月收入(元)
1000 1500 2000 2500 3000 3500 4000
练习1、如图是150辆汽车通过某路段 时速度的频率分布直方图,则速度在[60, 60 辆. 70)的汽车大约有______
在频率分布直方图中,依次连接各小长 方形上端的中点,就得到一条折线,这条 折线称为频率分布折线图.
练习3、以往招生Biblioteka 计显示,某所大学录 取的新生高考总分的中位数基本稳定在550 分,若某同学今年高考得了520分,他想报 考这所大学还需收集哪些信息?
要点: (1)查往年录取的新生的平均分数.若平均数 小于中位数很多,说明最低录取线较低,可以 报考; (2)查往年录取的新生高考总分的标准差.若 标准差较大,说明新生的录取分数较分散,最 低录取线可能较低,可以考虑报考.
标准差的取值范围是什么?标准差为0 的样本数据有何特点? s≥0,标准差为0的样本数据都相等. 方差的意义: 方差(或标准差)越大离散程度越大,数 据较分散; 方差(或标准差)越小离散程度越小,数 据较集中在平均数周围.
例 2 、有两个班级,每班各自按学号随 机选出 5 名学生,测验铅球成绩,以考察 体育达标程度,测验成绩如下:单位(米) 甲 9.1 7.8 8.5 6.9 5.2 乙 8.8 7.2 7.3 7.5 6.7 两个班相比较,哪个班整体实力强一些 ?
制作频率分布直方图的方法: (1)求极差(即一组数据中最大值与最小 值的差); (2)决定组距与组数;(样本容量不超过
100时,组数常分成5~12组)
(3)将数据分组; (4)列频率分布表; (5)画频率分布直方图.
注:频率分布直方图中
专题12 概率与统计(文)-三年(2022–2024)高考数学真题分类汇编(全国通用)(原卷版)
专题12概率与统计(文)考点三年考情(2022-2024)命题趋势考点1:回归分析2022年高考全国乙卷数学(理)真题2023年天津高考数学真题2024年上海夏季高考数学真题2024年天津高考数学真题统计学是“大数据”技术的关键,在互联网时代具有强大的社会价值和经济价值,在高考中受重视程度越来越大,未来在考试中的出题角度会更加与实际生活紧密联系,背景新颢、形式多样.考点2:信息图表处理2024年新课标全国Ⅱ卷数学真题2022年高考全国甲卷数学(理)真题考点3:频率分布直方图与茎叶图2023年新课标全国Ⅱ卷数学真题2022年新高考天津数学高考真题2022年高考全国乙卷数学(文)真题考点4:古典概型与几何概型2024年新课标全国Ⅱ卷数学真题2023年高考全国乙卷数学(理)真题2023年高考全国乙卷数学(文)真题2023年高考全国甲卷数学(理)真题2022年新高考全国I卷数学真题2022年高考全国甲卷数学(文)真题考点5:平均数、中位数、众数、方差、标准差、极差2023年高考全国乙卷数学(理)真题2023年新课标全国Ⅰ卷数学真题考点6:独立性检验2022年高考全国甲卷数学(文)真题2024年高考全国甲卷数学(理)真题2024年上海夏季高考数学真题考点1:回归分析1.(2022年高考全国乙卷数学(理)真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:2m )和材积量(单位:3m ),得到如下数据:样本号i12345678910总和根部横截面积i x 0.040.060.040.080.080.050.050.070.070.060.6材积量iy 0.250.400.220.540.510.340.360.460.420.403.9并计算得10101022iii i i=1i=1i=10.038, 1.6158,0.2474x y x y ===∑∑∑.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为2186m .已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数iii=122iii=1i=1( 1.896 1.377)()()nnnx x y y r x x y y --=≈--∑∑∑.2.(2023年天津高考数学真题)鸢是鹰科的一种鸟,《诗经·大雅·旱麓》曰:“鸢飞戾天,鱼跃余渊”.鸢尾花因花瓣形如鸢尾而得名,寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm ),绘制散点图如图所示,计算得样本相关系数为0.8642r =,利用最小二乘法求得相应的经验回归方程为 0.75010.6105y x =+,根据以上信息,如下判断正确的为()A.花瓣长度和花萼长度不存在相关关系B.花瓣长度和花萼长度负相关C.花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值为5.8612cmD.若从样本中抽取一部分,则这部分的相关系数一定是0.86423.(2024年上海夏季高考数学真题)已知气候温度和海水表层温度相关,且相关系数为正数,对此描述正确的是()A.气候温度高,海水表层温度就高B.气候温度高,海水表层温度就低C.随着气候温度由低到高,海水表层温度呈上升趋势D.随着气候温度由低到高,海水表层温度呈下降趋势4.(2024年天津高考数学真题)下列图中,线性相关性系数最大的是()A.B.考点2:信息图表处理5.(2024年新课标全国Ⅱ卷数学真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理如下表亩产量[900,950)[950,1000)[1000,1050)[1050,1100)[1100,1150)[1150,1200)频数61218302410根据表中数据,下列结论中正确的是()A.100块稻田亩产量的中位数小于1050kgB.100块稻田中亩产量低于1100kg的稻田所占比例超过80%C.100块稻田亩产量的极差介于200kg至300kg之间D.100块稻田亩产量的平均值介于900kg至1000kg之间6.(2022年高考全国甲卷数学(理)真题)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则()A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差考点3:频率分布直方图与茎叶图7.(2023年新课标全国Ⅱ卷数学真题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:利用该指标制定一个检测标准,需要确定临界值c ,将该指标大于c 的人判定为阳性,小于或等于c 的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为()p c ;误诊率是将未患病者判定为阳性的概率,记为()q c .假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.(1)当漏诊率()0.5p c =%时,求临界值c 和误诊率()q c ;(2)设函数()()()f c p c q c =+,当[]95,105c ∈时,求()f c 的解析式,并求()f c 在区间[]95,105的最小值.8.(2022年新高考天津数学高考真题)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A .8B .12C .16D .189.(2022年高考全国乙卷数学(文)真题)分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h ),得如下茎叶图:则下列结论中错误的是()A .甲同学周课外体育运动时长的样本中位数为7.4B .乙同学周课外体育运动时长的样本平均数大于8C .甲同学周课外体育运动时长大于8的概率的估计值大于0.4D .乙同学周课外体育运动时长大于8的概率的估计值大于0.6考点4:古典概型与几何概型10.(2024年新课标全国Ⅱ卷数学真题)在如图的4×4的方格表中选4个方格,要求每行和每列均恰有一个方格被选中,则共有种选法,在所有符合上述要求的选法中,选中方格中的4个数之和的最大值是.11.(2023年高考全国乙卷数学(理)真题)设O 为平面坐标系的坐标原点,在区域(){}22,14x y x y ≤+≤内随机取一点,记该点为A ,则直线OA 的倾斜角不大于π4的概率为()A .18B .16C .14D .1212.(2023年高考全国乙卷数学(文)真题)某学校举办作文比赛,共6个主题,每位参赛同学从中随机抽取一个主题准备作文,则甲、乙两位参赛同学抽到不同主题概率为()A .56B .23C .12D .1313.(2023年高考全国甲卷数学(理)真题)某校文艺部有4名学生,其中高一、高二年级各2名.从这4名学生中随机选2名组织校文艺汇演,则这2名学生来自不同年级的概率为()A .16B .13C .12D .2314.(2022年新高考全国I 卷数学真题)从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为()A .16B .13C .12D .2315.(2022年高考全国甲卷数学(文)真题)从分别写有1,2,3,4,5,6的6张卡片中无放回随机抽取2张,则抽到的2张卡片上的数字之积是4的倍数的概率为()A .15B .13C .25D .23考点5:平均数、中位数、众数、方差、标准差、极差16.(2023年高考全国乙卷数学(理)真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为i x ,()1,2,,10i y i =⋅⋅⋅.试验结果如下:试验序号i 12345678910伸缩率i x 545533551522575544541568596548伸缩率iy 536527543530560533522550576536记()1,2,,10i i i z x y i =-=⋅⋅⋅,记1210,,,z z z ⋅⋅⋅的样本平均数为z ,样本方差为2s .(1)求z ,2s ;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果2210s z ≥则不认为有显著提高)17.(多选题)(2023年新课标全国Ⅰ卷数学真题)有一组样本数据126,,,x x x ⋅⋅⋅,其中1x 是最小值,6x 是最大值,则()A .2345,,,x x x x 的平均数等于126,,,x x x ⋅⋅⋅的平均数B .2345,,,x x x x 的中位数等于126,,,x x x ⋅⋅⋅的中位数C .2345,,,x x x x 的标准差不小于126,,,x x x ⋅⋅⋅的标准差D .2345,,,x x x x 的极差不大于126,,,x x x ⋅⋅⋅的极差考点6:独立性检验18.(2022年高考全国甲卷数学(文)真题)甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A24020B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,()2P K k0.1000.0500.010k 2.706 3.841 6.63519.(2024年高考全国甲卷数学(理)真题)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:优级品合格品不合格品总计甲车间2624050乙车间70282100总计96522150(1)填写如下列联表:优级品非优级品甲车间乙车间能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲,乙两车间产品的优级品率存在差异?(2)已知升级改造前该工厂产品的优级品率0.5p=,设p为升级改造后抽取的n件产品的优级品率.如果(1)1.65p p p p n->+150件产品的数据,能否认为生15012.247≈)附:22()()()()()n ad bc K a b c d a c b d -=++++()2P K k≥0.0500.0100.001k3.8416.63510.82820.(2024年上海夏季高考数学真题)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学生中抽取580人,得到日均体育锻炼时长与学业成绩的数据如下表所示:时间范围学业成绩[)0,0.5[)0.5,1[)1,1.5[)1.5,2[)2,2.5优秀5444231不优秀1341471374027(1)该地区29000名学生中体育锻炼时长不少于1小时人数约为多少?(2)估计该地区初中学生日均体育锻炼的时长(精确到0.1)(3)是否有95%的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关?(附:()()()()22(),n ad bc a b c d a c b d -=++++χ其中n a b c d =+++,()2 3.8410.05P χ≥≈.)。
怎么画频率分布折线图频数分布表茎叶图作频率分布直方图的步骤
频率分布:样本中所有数据(或者数据组)的频率和样本容量的比就是该数据的频率,所有数据(或者数据组)的频率的分布变化规律叫做频率分布,可以用频率分布表,频率分布折线图,茎叶图,频率分布直方图来表示.频率分布折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图。
频数分布表:反映总体频率分布的表格。
一般地,编制频率分布表的步骤如下:(1)求全距,决定组数和组距;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表。
茎叶图:(1)茎是指中间的一列数,叶是从茎的旁边生长出来的数。
(2)制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出;(3)茎叶图的性质:①茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况。
②茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况。
1、频率分布样本中所有数据(或者数据组)的频率和样本容量的比就是该数据的频率,所有数据(或者数据组)的频率的分布变化规律叫做频率分布,可以用频率分布表,频率分布折线图,茎叶图,频率分布直方图来表示.2、频率分布折线图如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图。
3、频数分布表:反映总体频率分布的表格。
一般地,编制频率分布表的步骤如下:(1)求全距,决定组数和组距;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表茎叶图的性质:①茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况。
②茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况。
6章2节
基础知识梳理
由于上式含绝对值, 运算不太方便, 因此, 通常改为如下公式来计算标准差: s = 1 2 2 2 [( x 1- x ) +(x2- x ) +„+(xn- x ) ] n . (5)方差:从数学的角度考虑,有时 用标准差的平方 s2(方差)来代替标准差, 作为衡量样本数据离散程度的工具, s2 1 = n [(x1 - x )2 + (x2 - x )2 + „ + (xn - x )2].
课堂互动讲练
【点评】 一般用频率分布直方图反映样 本的频率分布,从而对总体的频率分布作出估 计.其具体步骤如下: ①将数据分组,确定合适的组距,列出频 率分布表,本题中已经给出频率分布表;②明 确纵、横轴的意义,纵轴表示 ,频率= ,横 轴表示样本数据,画出直方图;③直方图中每 一个小长方形的面积是样本数据落在这个区间 上的频率,所有的小长方形的面积之和等于1, 即频率之和为1,由此可以估计样本数据落在 某个区间的频率或概率或者总体的数字特征.
三基能力强化
1.200辆汽车经过某一雷达地区, 时速频率分布直方图如图所示,则时速 不低于60 km/h的汽车为________辆.
三基能力强化
解析:由频率分布直方图得时速不 低于60 km/h的车辆数为(0.028×10+0.01 0×10)×200=76. 答案:76
三基能力强化
2.某射手在一次训练中五次射击的 成绩分别为9.4,9.4,9.4,9.6,9.7,则该射 手成绩的方差是________.
直方图和茎叶图
2.下面给出4个茎叶图
则数据6,23,12,13,27,35,37,38,51可以由图 ______表示.
【解析】选A.因为在40~49之间无数据,有数据51,
从而茎4无叶,茎5有叶为1.
5.某班25人的数学成绩茎叶图如下图所示, 则最高分为 ______,最低分为______,优秀
率(90分以上)为 ______.
为3∶2∶1,因此从身高在[140,150]内的学生
中选取的人数应为
18× 1 =3人.答案:0.030
6
3
50辆汽车经过某一段公路的时速记录如图所 示:
将其分成7组. (1)列出样本的频率分布表; (2)画出频率分布直方图以及频率分布折线图; 3)根据上述结果,估计汽车时速在哪组的几率最 大?
【解析】(1)由茎叶图,数据最大值为33,最小值为13,分 为7组,组距为3,则频率分布表为:
【解析】根据茎叶图中数据的排列规 律,分析数据,可得最高分为91,最
1 低分为51,优秀率为 =4%. 25
答案:91
51
4%
6.(2010·福州高一检测)甲、乙两个小组各10 名学生的英语口语测试成绩如下(单位:分): 甲组:76 83 乙组:82 74 84 85 89 79 80 91 89 79 90 84 86 81 87 86 82 85
【例】有关部门从甲、乙两个城市所有的自动售货 机中分别随机抽取16台,记录某天上午各自的销售 情况(单位:元):
甲:18,8,10,43,5,30,10,22,6,27,25, 58,14,18,30,41; 乙:22,31,32,42,20,27,48,23,38,43,
12,34,18,10,34,23.
1)请作出这两组数据的茎叶图;2)将这两组数据
茎叶图
高中数学新课程中茎叶图的考点茎叶图又称“枝叶图”,与频率分布直方图一样,都是用来表示样本数据的一种统计图。
通常我们将数的大小基本不变或者变化不大的位作为“茎”,将变化大的位作为“叶”。
1.茎叶图的书写规则书写规则是:“茎”一般要求按照从小到大的顺序从上到下列出。
公用“茎”的“叶”一般也按照从小到大的顺序同行列出,注意重复的项也必须写上。
2.特点图形形状的特点:(1)若图形扁而宽,则说明整体的样本数据集中,样本数据的差异性不大。
(2)若图形长而窄,则说明样本数据比较分散,标准差较大,距组较大。
3.优缺点同频率分布直方图比较,茎叶图中所有的原始数据都可以得到。
并且在以后新增加数据的时候容易修改,但直方图这样操作起来就很困难了。
茎叶图也有其缺点,就是当样本数据比较多的时候,很难进行此操作。
如果我们将茎叶图的茎和叶按逆时针方向旋转90度,得到的是一个没有坐标的直方图。
通过此操作,很容易求出各个数据段的频率分布或频率百分比。
下面我们通过几个例子来阐述上述问题。
例1右图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图。
其中左边两位数字从左到右的分别表示学生身高的百位数字和十位数字,15 5 5 7 8右边的数字表示学生身高的个位数字,从图中可以得到这10个同学16 1 3 3 5身高的中位数是()17 1 2A.161cm B. 162cm解析:15 ∣5表示身高155cm。
这10个数字分别是:155cm、155cm、157cm、158cm、161cm、163c m、163cm、165cm、171cm、172cm。
所以中位数为 =162cm。
评注:由样本数据来求样本的中位数,一般先将所有的数据按从小到大排序。
若个数为奇数则取正中间一个,若个数为偶数,则取中间两个数的平均值。
茎叶图的优点就是对数据不需要排序,可以快速的求出统计量。
例2某中学高一(1)班中段考试数学成绩的茎叶图如右图所示,那么优秀率(90分以上)和最低分分别是() 5 1235%,15 %,51 6 09%,51 %,15 7 98 023367789 1245解析:我们可以将茎叶图转化为样本数据,可以知道最低分为51分。
高三数学 备考冲刺140分 问题41 统计图表的应用(含解析)-人教版高三全册数学试题
问题41 统计图表的应用一、考情分析统计图表有频率分布直方图、茎叶图、折线图、条形图、饼形图、雷达图等,它们广泛应用于实际生活之中,也是历年高考的热点,求解此类的关键是由图表读出有用的数据,再根据数据进行分析.二、经验分享1.明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.2.对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.3.频率分布直方图是高考考查的热点,考查频率很高,题型有选择题、填空题,也有解答题,难度为低中档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.三、知识拓展统计图是利用点、线、面、体等绘制成几何图形,以表示各种数量间的关系及其变动情况的工具。
表现统计数字大小和变动的各种图形总称。
其中有条形统计图、扇形统计图、折线统计图、象形图等。
在统计学中把利用统计图形表现统计资料的方法叫做统计图示法。
其特点是:形象具体、简明生动、通俗易懂、一目了然。
其主要用途有:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况。
一般采用直角坐标系.横坐标用来表示事物的组别或自变量x,纵坐标常用来表示事物出现的次数或因变量y;或采用角度坐标(如圆形图)、地理坐标(如地形图)等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
衡阳县六中高一年级 刘碧华
用样本的频率分布估计总体分布 一 频率分布图和频率分布直方图
二 频率分布折线图 和总体密度曲线
三
莖叶图
理论迁移
1
某地区为了了解知识分子的年龄结构, 随机抽样50名,其年龄分别如下: 42,38,29,36,41,43,54,43,34,44, 40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44, 42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58. (1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计年龄在32~52岁的知识分子所占的比 例约是多少.
0.6
0.5 0.5请大家阅读第 0.44 67页,直方图有 0.4 哪些优点和缺 0.3 0.3 0.3 点?
小长方形的面 月均用水量最 多的在哪个区 积总和 积=?=? 间?
0.2
0.16
0.1 0.08 0
0.1
0.08
0.04
0.5
1 1.5
2
2.5
3
3.5 4
4.5
月均用水量/t
频率分布直方图的特征: 从频率分布直方图可以清楚的看出数据分布 的总体趋势。 从频率分布直方图得不出原始的数据内容, 把数据表示成直方图后,原有的具体数据信 息就被抹掉了。
极差 4.1 组数= 8.2 组距 0.5
所以将数据分成9组较合适. 第三步: 将数据分组:( 给出组的界限) [0, 0.5), [0.5, 1), [1, 1.5),……[4, 4.5) 共9组.
第四步: 列频率分布表.
(包括分组、频数、频率、频率/组距)
组距=0.5
分组 [0-0.5) [0.5-1) [1-1.5) [1.5-2) [2-2.5) [2.5-3) [3-3.5) [3.5-4) [4-4.5) 合计
思考:从频率分布直方图中,你能得到任意 区间(a,b)的频率?有什么困难?
一、频率分布折线图与概率密度曲线
频率/组距 (取组距中点, 并连线 )
0.6
0.5
0.4
0.44
0.5
0.3
0.2
0.16
0.3
0.3
0.1 0.08 0
0.1
0.08
0.04
0.5
1 1.5
2
2.5
3
3.5 4
4.5
月均用水量/t
频数 4 8 15 22 25 15 5 4 2 100
频率
0.04
0.08 0.15 0.22 0.25 0.15 0.05 0.04 0.02 1
频率/组距 0.08
0.16
0.3 0.44 0.5 0.3
0.1 0.08 0.04 2.00
第 五 步: 画 出 频 率 分 布 直 方 图.
频率/组距 (组距=0.5)
总体密度曲线:
在样本频率分布直方图中,当样本容量增加,作图时所 分的组数增加,组距减少,相应的频率折线图会越来越 接近于一条光滑曲线,统计中称这条光滑曲线为总体密 度曲线. 它能够精确地反映了总体在各个范围内取值的 百分比,它能给我们提供更加精细的信息. 频率
(1)极差为67-28=39,取组距为5,分为8组.
样本频率分布表: 分 组 [27,32) [32,37) [37,42) [42,47) [47,52) [52,57) [57,62) [62,67] 合 计 频数 3 3 9 16 7 5 4 3 50 频率 0.06 0.06 0.18 0.32 0.14 0.10 0.08 0.06 1.00
答案:C
3.统计某校1000名学生的数学水平测试成绩, 得到样本频率分布直方图如图所示,若满分为 100分,规定不低于60分为及格,则及格率是 ( ) D A.20% B.25% C.60% D.80%
下表给出100位居民的月均用水量表
为此我们要对这些数据进行整理与分析
第一步: 求极差: (数据组中最大值与最小值的差距) 最大值= 4.3 最小值= 0.2 所以极差= 4.3-0.2 = 4.1 第二步: 决定组距与组数: (强调取整) 当样本容量不超过100时, 按照数据的多少, 常分成5~12组. 为方便组距的选择应力求”取整”. 本题如果组距为0.5(t). 则
元 20 30 40 50 60
课堂测试:
例1.关于频率分布直方图中小长方形的高说法, 正确的是( D ) A. 表示该组上的个体在样本中出现的频率
B. 表示某数的频率
C. 表示该组上的个体数与组距的比值 D. 表示该组上的个体在样本中出现的频率与组距 的比值
2.根据《中华人民共和国道路 交通安全法》规定:血液酒精 浓度在80mg/100ml(含80)以 上时,属醉酒驾车,处十五日 以下拘留和暂扣三个月以上六 个月以下驾驶证,并处500元以 上2000元以下罚款.据《法制 晚报》报道,2009年8月15日至 8月28日,全国查处酒后驾车和 醉酒驾车共500人,如图1是对 这500人酒后驾车血 液中酒精 含量进行检测所得结果的频率 分布直方图,则属于醉酒驾车 的人数约为( ) A.25 C.75 B.50 D.100
频率分布直方图如下:
频率 组距
连接频率分布直方图 中各小长方形上端的 中点,得到频率分布折 线图
0.50 0.40 0.30 0.20 0.10 0.5 月均用水量 /t 4.5
1 1.5 2 2.5 3
3.5 4
思考:上例的样本容量为100,如果增至1000,其频率分布直方
图的情况会有什么变化(组距和组数)?假如增至10000呢?
(2)样本频率分布直方图:
频率 组距
0.06 0.05 0.04 0.03 0.02 0.01
O 27 32 37 42 47 52 57 62 67 年龄
(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在32~52岁的知识分子约占70%.
理论迁移
2
频率 组距
某校共有5000名学生,该校 0.036 学生每月课外读物方面的支 出总体上在20—60元之间其 0.024 频率分布直方图如右图所示 0.01 ,为具体了解同学们购买课 外读物的具体情况,按支出 的情况进行分层抽样,抽出 一个容量为100的样本进行分 析,其中支出在 [50,60) 元的同学应抽取 30 人。