频率分布直方图与茎叶图的应用
频率分布直方图与茎叶图..
(1)极差为67-28=39,取组距为5,分为8 组. 样本频率分布表:
分 组 频数 频率 [27,32) 3 0.06 [32,37) 3 0.06 [37,42) 9 0.18 [42,47) 16 0.32 [47,52) 7 0.14 [52,57) 5 0.10 [57,62) 4 0.08 [62,67] 3 0.06 合 计 50 1.00
合计
频数
4 8 15 22 25 15 5 4 2 100
频率
0.04
0.08 0.15
0.22 0.25 0.15
0.05 0.04 0.02
1
组距=0.5
频率/组距 0.08 0.16 0.3 0.44 0.5 0.3 0.1 0.08 0.04 2.00
第 频率/组距 (组距=0.5) 五 步: 0.6
出总体上在20—60元之间其 0.024
频率分布直方图如右图所示 0.01
,为具体了解同学们购买课
外读物的具体情况,按支出 的情况进行分层抽样,抽出
元 20 30 40 50 60
一个容量为100的样本进行分
析,其中支出在 [50,60)
元的同学应抽取 30 人。
课堂测试:
例1.关于频率分布直方图中小长方形的高说法,
(2)样本频率分布直方图:
频率 组距
0.06 0.05 0.04 0.03 0.02 0.01
O 27 32 37 42 47 52 57 62 67
年龄
(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在32~52岁的知识分子约占70%.
理论迁移 2 频率
某校共有5000名学生,该校 组距 学生每月课外读物方面的支 0.036
茎叶图的应用
新课讲授
初中我们学过用平均数、众数和中位数反映总体的水平,用方差考察稳定程度。
我们还有一种简易的方法,就是将这些数据有条理的列出来,从中观察数据的分布情况, 这种方法就是茎叶图。
制作茎叶图的方法 将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按 从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。
3、茎叶图便于记录和表示; 4、不足的是其分析只是粗略的,对差异不大的两组数据不易分析;表示三位 数以上的数据时不够方便;
例2:甲、乙两篮球运动员上赛季每场比赛的得分如下,试比较这两位运动 员的得分水平: 甲 12,15,24,25,31,31,36,36,37,39,44,49,50 乙 8,13,14,16,23,26,28,33, 38,39,51,33,29
例1:某篮球运动员在某赛季各场比赛的得分情况如下:12,15,24,25,31, 31,36,36,37,39,44,49,50
茎叶图:
1 2
25
45
116679
茎:十位 数字
3
4 5
叶:表示个位 数字
49
0
注: 1、重复出现的数据要重复记录,不能遗漏;特别是“叶”部分;
2、所有的信息都可以从这个茎叶图中得到;
• 1.将每个数据分为茎(高位)和叶(低位)两部分,在此例中,茎为十位上的数字,叶 为个位上的数字。 • 2.将最小茎和最大茎之间的数按大小次序排成一列。 • 3.将各个数据的叶按读数次序(或按大小次序)写在其茎的左(右)侧。
图形 频率分布 直方图
小结 优点 1)易表示大量数据 2)直观地表明分布地 情况 1)无信息损失
缺点 丢失一些 信息 只能处理样本
高考数学易错题10.2 统计图表的应用-2019届高三数学提分精品讲义
专题十概率、统计问题二:统计图表的应用一、考情分析统计图表有频率分布直方图、茎叶图、折线图、条形图、饼形图、雷达图等,它们广泛应用于实际生活之中,也是历年高考的热点,求解此类的关键是由图表读出有用的数据,再根据数据进行分析.二、经验分享1.明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.学科-网2.对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.3.频率分布直方图是高考考查的热点,考查频率很高,题型有选择题、填空题,也有解答题,难度为低中档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.三、知识拓展统计图是利用点、线、面、体等绘制成几何图形,以表示各种数量间的关系及其变动情况的工具。
表现统计数字大小和变动的各种图形总称。
其中有条形统计图、扇形统计图、折线统计图、象形图等。
在统计学中把利用统计图形表现统计资料的方法叫做统计图示法。
其特点是:形象具体、简明生动、通俗易懂、一目了然。
其主要用途有:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况。
一般采用直角坐标系.横坐标用来表示事物的组别或自变量x,纵坐标常用来表示事物出现的次数或因变量y;或采用角度坐标(如圆形图)、地理坐标(如地形图)等。
2018届高考数学分类练习 第72练 用样本估计总体 含答案
一、选择题1.对于一组数据x i (i =1,2,3,…,n),如果将它们改变为x i +C(i =1,2,3,…,n),其中C ≠0,则下列结论正确的是( )A .平均数与方差均不变B .平均数变,方差保持不变C .平均数不变,方差变D .平均数与方差均发生变化2.甲、乙两位运动员在5场比赛的得分情况如茎叶图所示,记甲、乙两人的平均得分分别为x甲,x 乙,则下列判断正确的是( )A.x甲>x 乙;甲比乙成绩稳定B.x 甲>x 乙;乙比甲成绩稳定C.x 甲<x 乙;甲比乙成绩稳定D.x甲<x乙;乙比甲成绩稳定3.容量为100的样本数据,按从小到大的顺序分为8组,如下表:89第三组的频数和频率分别是( ) A .14和0.14 B .0.14和14 C.114和0.14 D.13和1144.(2016·全国丙卷)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15 ℃,B 点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )A .各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个5.某班级统计一次数学测试后的成绩,并制成了如下的频率分布表,根据该表估计该班级的数学测试平均分为( )A.80 B.81C.82 D.836.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A.6 B.8。
茎叶图 (2)
高中数学新课程中茎叶图的考点茎叶图又称“枝叶图”,与频率分布直方图一样,都是用来表示样本数据的一种统计图。
通常我们将数的大小基本不变或者变化不大的位作为“茎”,将变化大的位作为“叶”。
1.茎叶图的书写规则书写规则是:“茎”一般要求按照从小到大的顺序从上到下列出。
公用“茎”的“叶”一般也按照从小到大的顺序同行列出,注意重复的项也必须写上。
2.特点图形形状的特点:(1)若图形扁而宽,则说明整体的样本数据集中,样本数据的差异性不大。
(2)若图形长而窄,则说明样本数据比较分散,标准差较大,距组较大。
3.优缺点同频率分布直方图比较,茎叶图中所有的原始数据都可以得到。
并且在以后新增加数据的时候容易修改,但直方图这样操作起来就很困难了。
茎叶图也有其缺点,就是当样本数据比较多的时候,很难进行此操作。
如果我们将茎叶图的茎和叶按逆时针方向旋转90度,得到的是一个没有坐标的直方图。
通过此操作,很容易求出各个数据段的频率分布或频率百分比。
下面我们通过几个例子来阐述上述问题。
例1右图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图。
其中左边两位数字从左到右的分别表示学生身高的百位数字和十位数字,15 5 5 7 8 右边的数字表示学生身高的个位数字,从图中可以得到这10个同学16 1 3 3 5身高的中位数是()17 1 2A.161cm B. 162cm C.163cm D.164cm解析:15 ∣5表示身高155cm。
这10个数字分别是:155cm、155cm、157cm、158cm、161cm、163c m、163cm、165cm、171cm、172cm。
所以中位数为 =162cm。
评注:由样本数据来求样本的中位数,一般先将所有的数据按从小到大排序。
若个数为奇数则取正中间一个,若个数为偶数,则取中间两个数的平均值。
茎叶图的优点就是对数据不需要排序,可以快速的求出统计量。
例2某中学高一(1)班中段考试数学成绩的茎叶图如右图所示,那么优秀率(90分以上)和最低分分别是() 5 1235A.15%,15B.15%,51 6 023*******C.10%,51D.10%,15 7 122345556677898 023367789 1245解析:我们可以将茎叶图转化为样本数据,可以知道最低分为51分。
判断离散趋势最常用的方法
判断离散趋势最常用的方法在统计学中,判断离散趋势最常用的方法包括茎叶图、箱线图、频率分布表及直方图、累积频率曲线等。
这些方法可以帮助我们判断数据的离散程度、分布形态以及异常值等情况。
下面将逐一对这些方法进行详细介绍。
首先,茎叶图是一种简单而直观的图形展示方法。
它通过将数据的十位和个位数分别绘制在纵轴和横轴上,用直线连接各个叶子,从而构成茎叶图。
茎叶图可以直观地显示出数据的分布情况,特别是对于小型数据集来说。
通过观察茎叶图,我们可以快速判断数据的离散程度以及是否存在异常值。
其次,箱线图是一种较为常用的描述统计方法,通过绘制数据的五数概括(最小值、第一四分位数、中位数、第三四分位数和最大值)和异常值情况,直观地展示数据的分布情况。
在箱线图中,箱体代表数据的四分位距,上下边界为上下四分位数加减1.5倍的四分位距,异常值则用小圆点表示。
箱线图可以帮助我们判断数据的离散情况,特别是异常值的存在。
频率分布表及直方图是一种将数据分组统计的方法。
频率分布表将数据按照一定的区间范围进行划分,并统计各个区间内的观测频数。
而直方图是在频率分布表的基础上,通过绘制矩形条形图来展示数据的分布情况。
直方图的横轴为数据的区间范围,纵轴为频数或频率。
通过观察频率分布表及直方图,我们可以判断数据的分布形态(如对称、偏态、峰态)以及离散程度。
直方图还可以帮助我们直观地比较不同样本或不同群体之间的差异。
最后,累积频率曲线是描述数据分布情况的一种图形方法。
它是在频率分布表的基础上,将各个区间的频数累加得到累积频数,并绘制成曲线图。
累积频率曲线可以直观地展现数据的累积分布情况,帮助我们判断数据的集中程度和离散程度。
特别是在比较多个样本或多个群体之间的分布差异时,累积频率曲线是一种常用的分析工具。
综上所述,茎叶图、箱线图、频率分布表及直方图、累积频率曲线是判断离散趋势最常用的方法。
不同的方法可以从不同的角度帮助我们分析数据的特征,并提供直观的图形展示。
高中数学频率分布直方图
频率分布直方图作频率分布直方图的方法为:(1)把横轴分成若干段,每一线段对应一个组的组距;(2)以此线段为底作矩形,它的高等于该组的组距频率,这样得出一系列的矩形;(3)每个矩形的面积恰好是该组上的频率.频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图.作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.知识点1:利用频率分布直方图分析总体分布例题1: 2000辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,时速在[50,60)的汽车大约有 A .30辆 B .60辆 C .300辆 D .600辆变式:某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是 [96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是A.90B.75C. 60D.45变式:某初一年级有500名同学,将他们的身高(单位:cm )数据绘制成频率分布直方图(如图),若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[)130,140内的学生中选取的人数为 .知识点2:用样本分估计总体例题2某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,96 98 100 102 104 106 0.1500.125 0.1000.0750.050 克 频率/组距100 110 120130 140 150 身高频率|组距0.0050.0100.020a0.035(Ⅰ) 完成频率分布表;(Ⅱ)作出频率分布直方图;(Ⅲ)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染。
了解概率与统计中的频率分布与直方
了解概率与统计中的频率分布与直方了解概率与统计中的频率分布与直方图频率分布与直方图是统计学中常用的概念与工具,能够对一组数据的分布进行可视化和分析。
本文将介绍频率分布与直方图的基本概念、用途和绘制方法。
一、频率分布在统计学中,频率分布是指用统计变量(如身高、成绩等)的取值及其出现的频次来描述数据的分布情况。
频率分布能够帮助我们了解数据的集中趋势、离散程度以及可能存在的异常值。
以成绩为例,我们可以统计某班级同学的考试成绩,并将不同成绩段的频次进行统计和展示。
例如,我们可以将成绩分为60-69分、70-79分、80-89分、90-100分四个区间,然后统计每个区间的频次,得到频数分别为10、20、15、5。
这样,我们就得到了成绩的频率分布。
二、直方图直方图是一种常用的统计图表,用于展示数据的频率分布。
它以横轴表示数据的取值范围或分组区间,纵轴表示对应的频率或频次。
直方图的特点是柱状图的柱子相邻且不重叠,且柱子的高度表示频率或频次的大小。
绘制直方图的步骤如下:1. 对数据进行分组。
根据数据的范围和分布情况,确定合适的分组区间和组数。
通常可以使用等距分组或者等频分组的方法。
2. 统计每个分组的频次或频率。
计算每个分组中数据的个数或百分比。
3. 绘制直方图。
在纵轴上表示频率或频次,在横轴上表示分组区间或数据的取值范围。
绘制柱形图,每根柱子的宽度为分组区间的宽度,高度表示频率或频次。
4. 标记轴线和标题。
添加横轴和纵轴的标签,以及直方图的标题。
直方图的优点在于能够直观地展示数据的分布特征,有助于我们观察数据的集中趋势、离散程度和异常情况。
通过对直方图的分析,我们可以快速了解数据的分布模式,以便进一步进行分析和决策。
总结起来,频率分布与直方图是概率与统计学中常用的工具。
频率分布用于描述数据的分布情况,而直方图则是一种可视化方式来展示频率分布。
频率分布和直方图的应用范围广泛,涵盖了各个领域的数据分析与决策。
通过了解概率与统计中的频率分布与直方图,我们可以更好地理解和分析数据,为科学研究和实际问题的解决提供指导。
用样本估计总体
月收入(元)
1000 1500 2000 2500 3000 3500 4000
练习1、如图是150辆汽车通过某路段 时速度的频率分布直方图,则速度在[60, 60 辆. 70)的汽车大约有______
在频率分布直方图中,依次连接各小长 方形上端的中点,就得到一条折线,这条 折线称为频率分布折线图.
练习3、以往招生Biblioteka 计显示,某所大学录 取的新生高考总分的中位数基本稳定在550 分,若某同学今年高考得了520分,他想报 考这所大学还需收集哪些信息?
要点: (1)查往年录取的新生的平均分数.若平均数 小于中位数很多,说明最低录取线较低,可以 报考; (2)查往年录取的新生高考总分的标准差.若 标准差较大,说明新生的录取分数较分散,最 低录取线可能较低,可以考虑报考.
标准差的取值范围是什么?标准差为0 的样本数据有何特点? s≥0,标准差为0的样本数据都相等. 方差的意义: 方差(或标准差)越大离散程度越大,数 据较分散; 方差(或标准差)越小离散程度越小,数 据较集中在平均数周围.
例 2 、有两个班级,每班各自按学号随 机选出 5 名学生,测验铅球成绩,以考察 体育达标程度,测验成绩如下:单位(米) 甲 9.1 7.8 8.5 6.9 5.2 乙 8.8 7.2 7.3 7.5 6.7 两个班相比较,哪个班整体实力强一些 ?
制作频率分布直方图的方法: (1)求极差(即一组数据中最大值与最小 值的差); (2)决定组距与组数;(样本容量不超过
100时,组数常分成5~12组)
(3)将数据分组; (4)列频率分布表; (5)画频率分布直方图.
注:频率分布直方图中
高考一轮复习第10章统计统计案例第2讲用样本估计总体
第二讲 用样本估计总体知识梳理·双基自测 知识梳理知识点一 用样本的频率分布估计总体分布 (1)频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,从中可以看到整个样本数据的频率分布情况.绘制频率分布直方图的步骤为:①_求极差__;②_决定组距与组数__;③_将数据分组__;④_列频率分布表__;⑤_画频率分布直方图__.(2)频率分布折线图顺次连接频率分布直方图中_各小长方形上端的中点__,就得到频率分布折线图. (3)总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,它能提供更加精细的信息. 知识点二 茎叶图(1)茎叶图中茎是指_中间__的一列数,叶是从茎的_旁边__生长出来的数.(2)茎叶图的优点是可以_保留__原始数据,而且可以_随时__记录,这对数据的记录和表示都能带来方便.知识点三 样本的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x =_x 1+x 2+…+x nn__,反映了一组数据的平均水平.(4)标准差: s =_1n[x 1-x2+x 2-x2+…+x n -x2]__,反映了样本数据的离散程度.(5)方差:s 2=_1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]__,反映了样本数据的离散程度.重要结论(1)若一组数据x i (i =1,2,…,n)的平均数为x -,方差为s 2,则数据组ax i +b(i =1,2,…,n ,a ,b 为常数)的平均数为a x -+b ,方差为a 2·s 2.(2)频率分布直方图与众数、中位数与平均数的关系 ①最高的小长方形底边中点的横坐标即是众数.②中位数左边和右边的小长方形的面积和是相等的,均为12.③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.双基自测题组一 走出误区1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × ) 题组二 走进教材2.(P 81A 组T1改编)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( B )A .95,94B .92,86C .99,86D .95,91[解析]由茎叶图可知,此组数据由小到大排列依次76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B .3.(P 7T1)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有_25__人.[解析]100×(0.5×0.5)=25(人).题组三走向高考4.(2020·新课标Ⅲ)设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为( C )A.0.01 B.0.1C.1 D.10[解析]∵样本数据x1,x2,…,x n的方差为0.01,∴根据任何一组数据同时扩大几倍方差将变为平方倍增长,∴数据10x1,10x2,…,10x n的方差为:100×0.01=1,故选C.5.(2020·天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( B )A.10 B.18C.20 D.36[解析]直径落在区间[5.43,5.47)的频率为(6.25+5)×0.02= 0.225,则被抽取的零件中,直径落在区间[5.43,5.47)内的个数为0.225×80 =18个,故选B.考点突破·互动探究考点一频率分布直方图——自主练透例1 (1)(2021·江西赣州十四县联考)中央电视台播出《中国诗词大会》火遍全国,下面是组委会在选拔赛时随机抽取的100名选手的成绩,按成绩分组,得到的频率分布表如下所示:组号分组频数频率第1组[160,165) 0.100笫2组[165,170) ①第3组[170,175) 20 ②第4组[175,180) 20 0.200第5组[180,185) 10 0.100合计100 1.00(ⅰ)请先求出频率分布表中①、②位置的相应数据,再完成频率分布直方图(用阴影表示).(ⅱ)为了能选拔出最优秀的选手,组委会决定在笔试成绩高的第3,4,5组中用分层抽样抽取5名选手进入第二轮面试,则第3,4,5组每组各抽取多少名选手进入第二轮面试?(ⅲ)在(ⅱ)的前提下,组委会决定在5名选手中随机抽取2名选手接受考官A面试,求第4组至少有一名选手被考官A面试的概率.(2)(2021·福建漳州质检)2018年9月的台风“山竹”对我国多个省市的财产造成重大损害,据统计直接经济损失达52亿元.某青年志愿者组织调查了某地区的50个农户在该次台风中造成的直接经济损失,将收集的损失数据分成五组:[0,2 000],(2 000,4 000],(4 000,6 000],(6 000,8 000],(8 000,10 000](单位:元),得到如图所示的频率分布直方图.(ⅰ)试根据频率分布直方图估计该地区每个农户的损失(同一组中的数据用该区间的中点值代表);(ⅱ)台风后该青年志愿者与当地政府向社会发出倡议,为该地区的农户捐款帮扶,现从这50户损失超过4 000元的农户中随机抽取2户进行重点帮扶,设抽出损失超过8 000元的农户数为X,求X的分布列和数学期望.[解析](1)(ⅰ)第1组的频数为100×0.100=10,所以①处应填的数为100-(10+20+20+10)=40, 从而第2组的频率为40100=0.400.②处应填的数为1-(0.1+0.4+0.2+0.1)=0.200. 频率分布直方图如图所示.(ⅱ)因为第3,4,5组共有50名选手,所以利用分层抽样在50名选手中抽取5名选手进入第二轮面试时,每组抽取的人数分别为:第3组:2050×5=2,第4组:2050×5=2,第5组:1050×5=1,所以第3,4,5组分别抽取2人,2人,1人进入第二轮面试. (ⅲ)记“第4组至少有一名选手被考官A 面试”为事件A , 则P(A)=C 12C 13+C 22C 25=710. ⎝ ⎛⎭⎪⎫或P A =1-P A -=1-C 23C 25=710 (2)(ⅰ)记每个农户的平均损失为x -元,则x -=1 000×0.3+3 000×0.4+5 000×0.18+7 000×0.06+9 000×0.06=33 601;(ⅱ)由频率分布直方图,可得损失超过 4 000元的农户共有(0.000 09+0.000 03+0.000 03)×2 000×50=15(户),损失超过8 000元的农户共有0.000 03×2 000×50=3(户),随机抽取2户,则X 的可能取值为0,1,2; 计算P(X =0)=C 212C 215=2235,P(X =1)=C 112C 13C 215=1235,P(X =2)=C 23C 215=135.所以X 的分布列为:X0 1 2P2235 1235 135数学期望为E(X)=0×2235+1×1235+2×135=25.名师点拨应用频率分布直方图时的注意事项用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距;(2)频率分布直方图中各长方形高的比也就是其频率之比;(3)频率分布直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.〔变式训练1〕(1)(2021·安徽“皖南八校”摸底)某校高三年级有400名学生,在一次数学测试中,成绩都在[80,130](单位:分)内,其频率分布直方图如图,则这次测试数学成绩不低于100分的人数为_220__.(2)(2021·山西适应性考试)某病毒引起的肺炎的潜伏期平均为7天左右,短的约2~3天,长的约10~14天,甚至有20余天.某医疗机构对400名确诊患者的潜伏期进行统计,整理得到以下频率分布直方图.根据该直方图估计:要使90%的患者显现出明显病状,需隔离观察的天数至少是( C )A .12B .13C .14D .15[解析] (1)根据频率分布直方图知: (2a +0.04+0.03+0.02)×10=1⇒a =0.005; 计算出数学成绩不低于100分的频率为: (0.03+0.02+0.005)×10=0.55;所以这次测试数学成绩不低于100分的人数为0.55×400=220人.(2)由题可知,第一,二,三,四,五组的频率分别为0.16,0.4,0.32,0.08,0.04. 因为前三组的频率和为0.88, 故要使90%的患者显现出明显病状,则需隔离观察的天数至少是:13+0.9-0.880.02=14,故选C .考点二 茎叶图——师生共研例2 (多选题)(2021·四川省乐山市调研改编)胡萝卜中含有大量的β-胡萝卜素,摄入人体消化器官后,可以转化为维生素A ,现从a ,b 两个品种的胡萝卜所含的β-胡萝卜素(单位mg)得到茎叶图如图所示,则下列说法正确的是( ABD )A .x a <x bB .a 的方差大于b 的方差C .b 品种的众数为3.31D .a 品种的中位数为3.27 [解析] 由茎叶图得:b 品种所含β-胡萝卜素普遍高于a 品种, ∴x a <x b ,故A 正确;a 品种的数据波动比b 品种的数据波动大, ∴a 的方差大于b 的方差,故B 正确; b 品种的众数为3.31与3.41,故C 错误; a 品种的数据的中位数为:3.23+3.312=3.27,故D 正确.名师点拨茎叶图的绘制及应用(1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.〔变式训练2〕(2019·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 与y 的值分别为( A )A .3,5B .5,5C .3,7D .5,7[解析] 甲组数据的中位数为65,由甲、乙两组数据的中位数相等,得y =5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78),∴x =3.故选A . 考点三 样本数字特征——多维探究 角度1 样本数字特征与频率分布直方图例3 (1)如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是( B )A .12.5,12.5B .12.5,13C .13,12.5D .13,13[解析] 由频率分布直方图可知,众数为10+152=12.5,因为0.04×5=0.2,0.1×5=0.5,在频率分布直方图中,中位数左边和右边的面积相等,所以中位数在区间[10,15)内.设中位数为x ,则(x -10)×0.1=0.5-0.2,解得x =13.角度2 样本数字特征与茎叶图(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:⎪⎪⎪897 74 0 1 0 x 9 1则7个剩余分数的方差为_367__.[解析] 由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4,∴s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.角度3 样本数字特征的计算(3)(2021·湖北武汉、襄阳、荆门、宜昌四地六校考试联盟联考)已知某7个数据的平均数为5,方差为4,现又加入一个新数据5,此时这8个数的方差s 2为( C )A .52B .3C .72D .4[解析] 设某7个数据分别为a 1,a 2,…,a 7, 则由题意得a 1+a 2+…+a 7=5×7=35, (a 1-5)2+(a 2-5)2+…+(a 7-5)2=4×7=28, 加入新数据5后的平均数x -=35+58=5,方差s 2=a 1-52+a 2-52+…+a 7-52+5-528=288=72.故选C .名师点拨平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数,中位数,众数描述其集中趋势,方差和标准差描述其波动大小.〔变式训练3〕(1)(角度1)某小区共有1 000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为_155__,平均数为_156.8__.(2)(角度2)(2021·陕西西安八校联考)在一次技能比赛中,共有12人参加,他们的得分(百分制)茎叶图如图,则他们得分的中位数和方差分别为( B )A .89 54.5B .89 53.5C .87 53.5D .89 54(3)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x 1,x 2,x 3,…,x 100,它们的平均数为x -,方差为s 2:其中扫码支付使用的人数分别为3x 1+2,3x 2+2,3x 3+2,…,3x 100+2,它们的平均数为x -′,方差为s′2,则x -′,s′2分别为( C )A .3x -+2,3s 2+2 B .3x -,3s 2C .3x -+2,9s 2D .3x -+2,9s 2+2[解析] (1)中位数为:150+(170-150)×0.10.02×20=155.该组数据的平均数为x =0.005×20×120+0.015×20×140+0.020×20×160+0.005×20×180+0.003×20×200+0.002×20×220=156.8.(2)由题可知,中位数为:87+912=89,先求平均数:x -=78+79+84+86+87+87+91+94+98+98+99+9912=90,S 2=112[(-12)2+(-11)2+(-6)2+(-4)2+(-3)2+(-3)2+12+42+82+82+92+92]=53.5,故中位数为:89,方差为53.5,故选:B .(3)显然x -′=3x -+2,而每个数据上都加上或减去相同数不影响方差,但每个数据都乘以a ,则方差变为原方差的a 2倍,故选C .考点四 折线图——师生共研例4 (多选题)(2021·河南顶级名校模拟改编)如图是某地某月1日至15日的日平均温度变化的折线图,根据该折线图,下列结论不正确的是( BCD )A .连续三天日平均温度的方差最大的是7日,8日,9日三天B .这15天日平均温度的极差为15 ℃C .由折线图能预测16日温度要低于19 ℃D .由折线图能预测本月温度小于25 ℃的天数少于温度大于25 ℃的天数[解析] A 选项,日平均温度的方差的大小取决于日平均温度的波动的大小,7,8,9三日的日平均温度的波动最大,故日平均温度的方差最大,正确;B 选项,这15天日平均温度的极差为18 ℃,B 错;C 选项,由折线图无法预测16日温度是否低于19 ℃,故C 错误;D 选项,由折线图无法预测本月温度小于25 ℃的天数是否少于温度大于25 ℃的天数,故D 错误.故选B 、C 、D .名师点拨折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.〔变式训练4〕(多选题)甲乙两名同学在本学期的六次考试成绩统计如图,甲乙两组数据的平均值分别为x -甲、x -乙,则( BC )A .每次考试甲的成绩都比乙的成绩高B .甲的成绩比乙稳定C .x -甲一定大于x -乙D .甲的成绩的极差大于乙的成绩的极差[解析] 第二次考试甲的成绩比乙低,A 错;由图可知甲的成绩比乙的成绩波动小,B 正确,D 错;甲的平均成绩显然比乙的平均成绩高,C 正确;故选B 、C .名师讲坛·素养提升 高考与频率分布直方图例5 (2021·安徽省池州市期末)高三年级某班50名学生期中考试数学成绩的频率分布直方图如图所示,成绩分组区间为:[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150].其中a ,b ,c 成等差数列且c =2a ,物理成绩统计如表.(说明:数学满分150分,物理满分100分)分组 [50,60) [60,70) [70,80) [80,90) [90,100]频数6920105(1)根据频率分布直方图,请估计数学成绩的平均分; (2)根据物理成绩统计表,请估计物理成绩的中位数;(3)若数学成绩不低于140分的为“优”,物理成绩不低于90分的为“优”,已知本班中至少有一个“优”同学总数为6人,从此6人中随机抽取3人.记X 为抽到两个“优”的学生人数,求X 的分布列和期望值.[解析] (1)根据频率分布直方图得, (a +b +2c +0.024+0.020+0.004)×10 =1, 又因a +c =2b ,c =2a ,解得a =0.008,b =0.012,c =0.016, 故数学成绩的平均分x -=85×0.04+95×0.12+105×0.16+115×0.2+125×0.24 +135×0.16+145×0.08=117.8(分),(2)总人数50分,由物理成绩统计表知,中位数在成绩区间[70,80), 所以物理成绩的中位数为75分.(3)数学成绩为“优”的同学有4人,物理成绩为“优”有5人,因为至少有一个“优”的同学总数为6名同学,故两科均为“优”的人数为3人,故X 的取值为0、1、2、3.P(X =0)=C 33C 36=120,P(X =1)=C 13C 23C 36=920,P(X =2)=C 23C 13C 36=920,P(X =3)=C 33C 36=120,所以分布列为:X 0 1 2 3 P120920920120∴期望值为E(X)=0×120+1×920+2×920+3×120=32.名师点拨(1)通过统计图可以很清楚地表示出各部分数量同总数之间的关系. (2)准确理解频率分布直方图的数据特点是解题关键. 〔变式训练5〕(2019·高考全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).[解析](1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05,乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.。
直方图和其他频率分布图(histogram and other frequency distributions)
直方图和其他频率分布图(histogram and other frequency distributions)直方图和其他频率分布图(histogram and other frequency distributior.s包括多边形图、茎叶图、点图、分位图、CDF图、累积多边形图。
概述频率分布表明了一组数据不同数值出现的频数。
直方图是最常用的频率分布图,与条形图很相似,但是两者之问有些重要的区别。
这部分也包含了其他的频率分布图。
多边形图和直方图的形状一样,但是用线而不是条柱连接频率值;茎叶图通过运用单个数值作为数据点的标识来保存单个数值:点图是在一条垂线上用小圆圈表示每个数据点;分位图和累积点线图表示有多少测量值(或测量值的百分比)小于或等于每个值。
适用场合·数据是数值型时;·想弄清楚数据分布的形状;·确定一个过程的输出是否近乎符合正态分布;·分析一个过程是否满足顾客的要求;·分析供应商的过程输出的分布情况;·检查两个时间段内过程是否发生交化;·确定两个或多个过程输出是否不同;·将分布情况快速简单地表示出来。
决策树(图表5. 68)有助于确定最适合于表示不同的数据和目的的图形。
实施步骤构建1.从一个过程中搜集至少50个连续的数据点。
如果没有那么多数据,就使用点图。
2.用直方图计算表(参阅图表5.81)建立直方图。
通过填写计算表确定组数,组距和组边界值。
计算完步骤2的组距(W)后,判断并将其调整到一个方便计算的数比如,你可以将0.9调整到1.0。
W的小数位不能比图中数的小数位多。
3.在图纸上画x轴和y轴。
y轴表示数据出现的个数。
用计算表中计算得到的L值在x轴标刻度。
这些数值之差是组距。
条柱间不要留空隙。
4.对于每个数据,准确找出其落入的组,并在该组上增加一个x或涂上一段条柱。
如果数据刚好落在组限处,则将该数据记入其右侧的一组内。
怎么画频率分布折线图频数分布表茎叶图作频率分布直方图的步骤
频率分布:样本中所有数据(或者数据组)的频率和样本容量的比就是该数据的频率,所有数据(或者数据组)的频率的分布变化规律叫做频率分布,可以用频率分布表,频率分布折线图,茎叶图,频率分布直方图来表示.频率分布折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图。
频数分布表:反映总体频率分布的表格。
一般地,编制频率分布表的步骤如下:(1)求全距,决定组数和组距;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表。
茎叶图:(1)茎是指中间的一列数,叶是从茎的旁边生长出来的数。
(2)制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出;(3)茎叶图的性质:①茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况。
②茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况。
1、频率分布样本中所有数据(或者数据组)的频率和样本容量的比就是该数据的频率,所有数据(或者数据组)的频率的分布变化规律叫做频率分布,可以用频率分布表,频率分布折线图,茎叶图,频率分布直方图来表示.2、频率分布折线图如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图。
3、频数分布表:反映总体频率分布的表格。
一般地,编制频率分布表的步骤如下:(1)求全距,决定组数和组距;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表茎叶图的性质:①茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况。
②茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况。
数学苏教版3教案:2.2.3茎叶图含解析
2。
2.3茎叶图整体设计教材分析通过比较甲、乙两个运动员比赛得分情况引入茎叶图,从而得出画茎叶图的步骤,从茎叶图中的枝叶分布情况就可以感受到样本数据的分布特点。
结合实例说明,可根据数据的特点灵活地决定茎叶图中数据的茎和叶的划分.茎叶图,频率分布表和频率分布直方图都是用来描述样本数据的分布情况的。
茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.三维目标1。
通过实例使学生掌握茎叶图的意义及画法,体会分布的意义和作用,在表示样本数据的过程中,进一步学会列频率分布表及画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2。
使学生进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布。
重点难点教学重点:1。
使学生掌握茎叶图的意义及画法,结合实例体会茎叶图的优点;2.继续掌握如何用样本频率分布估计总体分布。
教学难点:对频率分布直方图的理解和应用.课时安排1课时教学过程导入新课设计思路一:(复习导入)一般地,对于n 个数x 1,x 2,…,x n ,我们把n n x x x n +++...21叫做这n个数的算术平均数,简称平均数。
平均数常用于表示一组数据的平均水平。
计算平均数时,所有数据都参加运算,它能充分利用数据所描述的信息,因此在生活中较为常见,但它易受端点值的影响。
一般地,n 个数根据大小顺序排列后,处于中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数。
由中位数的定义可知,当数据的个数是奇数时最中间的一个数据是中位数;当数据的个数是偶数时,则最中间两个数据的平均数是中位数.中位数受端点值的影响小,但不能充分利用所有数据的信息.众数则是一组数据中出现次数最多的那个数据.为了避开以上缺点,今天学习——茎叶图.因为所有信息都可以从茎叶图中得到体现。
设计思路二:(事例导入)某篮球运动员某赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50.如何分析该运动员的整体水平及发挥的稳定程度?推进新课新知探究除了前几天学的图、表以及上面的各种数能帮助我们分析数据外,统计中还有一种用来表示数据的茎叶图(stem and leaf display).顾名思义,茎是指中间的一列数,叶就是指从茎的两旁生长出来的数,中间的数字表示得分的十位数,旁边的数字分别表示两名运动员得分的个位数,像这样用来表示数据,帮助我们理解样本数据的图,我们称为茎叶图.制作茎叶图的方法是:当所给数据为一位数时,可将0作为茎叶较长的茎,而它本身作为叶;当所给数据为两位数时,将所有两位数的十位数字作为“茎”,个位数字作为“叶”;当所给的数据为三位数时,可将百位和十位作为“茎”,而个位数字作为“叶”.茎相同的数据共用一个茎,茎按从小到大的顺序从上到下排列,共用茎的叶一般要按从大到小(也可以从小到大)的顺序同行排出.制作茎叶图时,一般用一个竖线将茎叶隔开,竖线的左边是茎,右边是叶。
茎叶图
高中数学新课程中茎叶图的考点茎叶图又称“枝叶图”,与频率分布直方图一样,都是用来表示样本数据的一种统计图。
通常我们将数的大小基本不变或者变化不大的位作为“茎”,将变化大的位作为“叶”。
1.茎叶图的书写规则书写规则是:“茎”一般要求按照从小到大的顺序从上到下列出。
公用“茎”的“叶”一般也按照从小到大的顺序同行列出,注意重复的项也必须写上。
2.特点图形形状的特点:(1)若图形扁而宽,则说明整体的样本数据集中,样本数据的差异性不大。
(2)若图形长而窄,则说明样本数据比较分散,标准差较大,距组较大。
3.优缺点同频率分布直方图比较,茎叶图中所有的原始数据都可以得到。
并且在以后新增加数据的时候容易修改,但直方图这样操作起来就很困难了。
茎叶图也有其缺点,就是当样本数据比较多的时候,很难进行此操作。
如果我们将茎叶图的茎和叶按逆时针方向旋转90度,得到的是一个没有坐标的直方图。
通过此操作,很容易求出各个数据段的频率分布或频率百分比。
下面我们通过几个例子来阐述上述问题。
例1右图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图。
其中左边两位数字从左到右的分别表示学生身高的百位数字和十位数字, 15 5 5 7 8 右边的数字表示学生身高的个位数字,从图中可以得到这10个同学 16 1 3 3 5身高的中位数是() 17 1 2A.161cm B. 162cm C.163cm D.164cm解析:15 ∣5表示身高155cm。
这10个数字分别是:155cm、155cm、157cm、158cm、161cm、163cm、163cm、165cm、171cm、172cm。
所以中位数为 =162cm。
评注:由样本数据来求样本的中位数,一般先将所有的数据按从小到大排序。
若个数为奇数则取正中间一个,若个数为偶数,则取中间两个数的平均值。
茎叶图的优点就是对数据不需要排序,可以快速的求出统计量。
例2某中学高一(1)班中段考试数学成绩的茎叶图如右图所示,那么优秀率(90分以上)和最低分分别是() 5 1235A.15%,15B.15%,51 6 023*******C.10%,51D.10%,15 7 122345556677898 023367789 1245解析:我们可以将茎叶图转化为样本数据,可以知道最低分为51分。
统计(5)茎叶图与直方图的比较
谢谢观看!
合计
频数 4 8 15 22 25 15 5 4 2 100
频率
0.04 0.08
频率/组距 0.08
0.16
0.15
0.22 0.25 0.15 0.05 0.04 0.02 1
0.3 0.44
0.5 0.3 0.1 0.08 0.04
2.00
第 五 步: 画 出 频 率 分 布 直 方 图.
频率/组距 (组距=0.5)
例2: 甲乙两人比赛得分记录如下: 甲:13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39 乙:49, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36, 39 用茎叶图表示两人成绩,说明哪一个成 绩好.
二、茎叶图
当数据是两位有效数字时,用中间的数字表示十位数,即第一 个有效数字,两边的数字表示个位数,即第二个有效数字,它 的中间部分像植物的茎,两边部分像植物茎上长出来的叶子, 因此通常把这样的图叫做茎叶图
1Hale Waihona Puke 2 3 434536 8 389
5
1
茎叶图的特征:
两个优点: 一是:没有原始数据信息的损失; 二是:茎叶图中的数据可以随时记录,随时添 加,方便记录与表示。 三个局限: 一是:只便于表示两位有效数字的数据; 二是:茎叶图只方便记录两组的数据; 三是:数据量不能太大
小结:
1.茎叶图只便于表示两位有效数字的数据,而且茎叶 图只方便记录两组的数据,两个以上的数据虽然能 够记录,但是没有表示两个记录那么直观、清晰。 2.当总体中的个体取值很少时,用茎叶图估计总体 的分布;当总体中的个体取值较多时,将样本数据 恰当分组,用各组的频率分布描述总体的分布,方 法是用频率分布表或频率分布直方图。
2019艺体生文化课-数学(文科)第十章 第2节 频率直方图、2x2列联表、茎叶图、线性回归方程、相关关系
(ti t)2
i 1
【解析】 (1)由折线图中数据和附注中参考数据得t 4,
7
7
(ti t)2 28, ( yi y)2 0.55.
i 1
i 1
7
7
7
(ti t)( yi y) ti yi t yi 40.17 4 9.32 2.89,
3.求方差公式:S 2
1 n [(x1
x)2
( x2
x)2
( x3
x)2
...
( xn
x)2 ].
频率分布直方图中求方差的参考公式: S 2 (x1 x)2 f1 (x2 x)2 f2 (x3 x)2 f3 ... (xn x)2 fn (其中x1,x2,…,xn取各分段的中间值)
考点2:2×2列联表 【例2】 为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对 30名六年级学生进行了问卷调查得到如下2×2列联表:平均每天 喝500ml以上为常喝,体重超过50kg为肥胖.
常喝 不常喝 合计
肥胖
6
2
8
不肥胖
4
18
22
合计
10
20
30
已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为
9.32 7
1.331及(1)得
b
(ti
i 1 n
t)( yi y) (ti t)2
2.89 28
0.103,
i 1
a
y
b
t
1.331
《频率分布直方图》参考教学方案
频率分布直方图1.通过实例体会分布的意义和作用。
2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。
4.通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。
5.通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。
【教学重点】会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
【教学难点】能通过样本的频率分布估计总体的分布。
(一)知识回顾(二)新课导入【探究】同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。
不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。
分别以1和0.1为组距重新作图,然后谈谈你对图的印象。
(三)新课讲授连接频率直方图中各小长方形上端中点的折线,叫频率分布折线图。
画一组数据的频率分布直方图,可以按以下的步骤进行:第一步:求极差,即数据中最大值与最小值的差;第二步:决定组距与组数:组距=极差/组数;第三步:分组,通常对组内数值所在区间,取左闭右开区间 , 最后一组取闭区间;第四步:登记频数,计算频率,列出频率分布表;第五步:画出频率分布直方图(纵轴表示频率/组距)。
当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线。
总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。
是研究总体分布的工具。
用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。
1、茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。
频率分布直方图、茎叶图
例 某市政府为了节约生活用水,计划在本市试 行居民生活用水定额管理,即确定一个居民月用水 量标准a ,用水量不超过a的部分按平价收费,超过 a的部分按议价收费。
①如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?
②为了较合理地确定这个标准,你认为需要做 哪些工作?
取左闭右开区间 , 最后一组取闭区间 四、登记频数,计算频率,列出频率分布表
五、画出频率分布直方图(纵轴表示频率/组距)
频率/组距
0.ห้องสมุดไป่ตู้0 0.40 0.30 0.20 0.10
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t
如果当地政府希望85%以上的居民每月的用水量不超出 标准,根据频率分布表和频率分布直方图,你能对制定 月用水量提出建议吗?
1)、列出频率分布表 2)、估计电子元件寿命在100h~400h以内的频率 3)、估计电子元件寿命在400h以上频率
课堂练习:
1、为检测某种产品的质量,抽取了一个容量为30的样本, 检测结果为一级品5件,二级品8件,三级品13件,次品4件.
(1) 列出样本的频率分布表; (2)根据上述结果,估计此种产品为二级品或三级品的概率 约是多少.
1
频率/ 组距
0.020 0.053 0.060 0.073 0.067 0.033 0.027
频率分布直方图如下: 频率/组距
0.070 0.060 0.050 0.040 0.030 0.020 0.010
12.5 15.5
例2、对某电子元件进行寿命跟踪调查,情况如下:
寿命(h) 100~200 200~300 300~400 400~500 500~600 个数 20 30 80 40 30
高考数学一轮复习第十一章统计与统计案例2用样本估计总体课件新人教A版2
;b.决定组距与
组数;c. 将数据分组
;d.列频率分布表;e.画频率分布直方
图.
-3知识梳理
双基自测
(3)总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中
点,就得到频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,
底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方
24
图如图所示,则在抽测的60株树木中,有
株树木的底部
周长小于100 cm.
解析 由题意知,在抽测的60株树木中,底部周长小于100 cm的株
数为(0.015+0.025)×10×60=24.
-11考点1
考点2
考点3
考点 1
组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,
统计中称这条光滑曲线为总体密度曲线.总体密度曲线反映了总体
在各个范围内取值的百分比,它能提供更加精细的信息.
(4)茎叶图:茎叶图中茎是指 中间 的一列数,叶是从茎的 旁边
生长出来的数.当样本数据较少时,用茎叶图表示数据的效果较好,
它不但可以保留所有信息,而且可以随时记录,给数据的记录和表
月平均用电量在[260,280)的用户有0.005×20×100=10(户),
月平均用电量在[280,300]的用户有0.002 5×20×100=5(户),抽
11
1
= ,
取比例为
25+15+10+5
5
所以月平均用电量在[220,240)的用户中应抽取25×
1
5 =5(户).
-14考点1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
B
)
6 7 D、 7
(三) 、学习评价 自我测评一 1、下图是样本容量为 200 的频率分布直方图。 根据样本的频率分布直方图估计, 样本数据落在 6,10 内的频数为 64 数据落在 2,10 内的概率约为 ,
0.4
。
2、 为了了解某地区高三学生的身体发育情况,抽查了该地区 100 名 年龄为 17.5 岁-18岁的男生体重(kg) ,得到频率分布直方图如下:
[10, 20)
新疆 源头学子小屋
/wxc/
特级教师 王新敞
wxckt@
新疆 源头学子小屋
/wxc/
特级教师 王新敞
wxckt@
[20,30)
[30, 40)
[40,50)
[50,60)
[60,70)
变式训练 、 将某选手的 9 个得分去掉 1 个最高分,去掉 1 个最低 分,7 个剩余分数的平均分为 91,现场做的 9 个分数的茎叶图后来 有一个数据模糊,无法辨认,在图中以 x 表示: 8 9 7 4 7 0 1 0 9 1
x
则 7 个剩余分数的方差为(
116 36 A、 B、 C、36 9 7
根据上图可得这 100 名学生中体重在 56.5,64.5 的学生人数是( A、 20 B、 30 C、 40 D、 50
C
)
3、 图 2 是某学校一名篮球运动员在五场比赛中所得分数的茎叶图 ,
0 8 9
则该运动员在这五场比赛中得分的方差为 _________. 1 0 3 5
1 2 2 2 2 2 s (8 11) (9 11) (10 11) (13 11) (15 11) 5 1 (9 4 1 4 16) 5 34 5
二、学习探究 (一)基础演练 1.下列说法错误的是 ( B ) A、在统计里,把所需考察对象的全体叫做总体 B、一组数据的平均数一定大于这组数据中的每个数据 C 、平均数、众数与中位数从不同的角度描述了一组数据的集中趋势 D、一组数据的标准差越大,说明这组数据的波动越大 5 2、 已知一个容量为 20 的样本,某组的频率为 0.25 ,则该组的频数为__________ 3、容量为 20 的样本数据,分组后的频数如下表 分组 频数
分组
[1.30, 1.34) [1.34, 1.38)
频数
4
25 30 29
[1.381.42) , [1.42, 1.46)
[1.46, 1.50) [1.50, 1.54)
10
2
合计
100
变式训练、 某学校随机抽取 20 个班,调查各班中有网上购物经历的人数,所得数据的 茎叶图如图所示 .以组距为 5 将数据分组成 [0,5) , [5,10) ,, [30,35) , [35,40] 时, 所作 的频率分布直方图是 (A )
0
0
10
20
30
40 人数
(A)
(B)
(C)
(D)
例 3、以下茎叶图记录了甲、乙两组各四名同学的植树棵树 . 乙组记录中有一个数据模糊,无法确认,在图中以 X 表示.
如果 X=8,求乙组同学植树棵树的平均数和方差; 1 (注:方差 s 2 [( x1 x) 2 ( x 2 x) 2 ( x n x) 2 ], 其中 x 为 n
2
1 x (8 9 10 13 15) 11 5
图2
茎叶图 当数据是两位有效数字时,用中间的数字表示 十位数,即第一个有效数字,两边的数字表示 个位数,即第二个有效数字,它的中间部分像 植物的茎,两边部分像植物茎上长出来的叶子, 因此通常把这样的图叫做茎叶图
3、茎叶图: 4、众数、中位数、平均数:
;
众数、中位数、平均数
1、众数 在一组数据中,出现次数最多的数据叫做这 一组数据的众数。
2、中位数 将一组数据按大小依次排列,把处在最 中间位置的一个数据(或两个数据的平均数)叫做 这组数据的中位数。
1 3、平均数 x ( x1 x2 x3 ...... xn ) n
变式训练、 (2009 浙江文)某个容量为 100 的 样本的频率分布直方图 如下,则在区间 [4,5) 上 的 数 据 的 频 . 数 . 为 30 .
例 2、在生产过程中,测得纤维产品的纤度 (表示纤维粗细的一种量)共有 100 个数据, 将数据分组如右表: (1) 画出频率分布表, 并画出频率分布直方图; , 中的概率及纤度 (2)估计纤度落在 [1.381.50) 小于 1.40 的概率是多少? (3)从频率分布直方图估计出纤度的众数、中 位数和平均数.
A、0.09 C、0.25
B、0.2 D、0.45
(二) 、典型题型剖析 例 1、有一个容量为 66 的样本,数据的分组及各组的频数如下: [11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5)1l [31.5,35.5) 12 [35.5.39.5) 7 [39.5,43.5) 3 根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是( B ) 1 1 1 2 A、 B、 C、 D、 6 3 2 3
一、学习准备: 1、频率分布:
指一个样本数据在各个小范围内所占比例的大小
;
2、频率分布直方图:
以每个组距为底,以各频率除以组距的商为高分 (1)概念: 别画长方形得到的图形,叫做频率分布直方图 ;
(2)绘制频率分布直方图的步骤:
①求极差 ②决定组距与组数 ③将数据分组 ④列频率分布表 ⑤画频率分布直方图
2
3
4
5
4
2 (B )
则样本数据落在区间 [10, 40) 的频率为 A. 0.35 B. 0.45 C. 0.55 D. 0.65
4 、对一批产品的长度(单位: mm)进行抽样检测, 下图是 检测结果的频率分布直方图 . 根据标准 , 产品长度在区 间 [20,25) 上的为一等品, 在区间[15,20)和区间[25,30) 上的为二等品, 在区间 [10,15)和 [30,35)上的为三等品. 用频率估计概率 , 现从该批产品中随机抽取一件 , 则其 为二等品的概率为( D )
x1 , x2 ,, xn 的平均数)
解:当 X=8 时,由茎叶图可知,乙组同学的植树棵数是: 8,8,9,10, 所以平均数为 x
8 8 9 10 35 ; 4 4
2 2 2 2
1 35 35 35 35 2 s 8 8 9 10 4 4 4 4 4 方差为 1 9 9 1 25 11 4 16 16 16 16 16
频率 组距
0.04 0.03 0.02 0.01
0.05 0.04 0.03 0.02 0.01
频率 组距
频率 组距
频率 组距
0.04 0.03 0.0210 20 30 40 人数
0 5 10 15 20 25 30 35 40 人数
0 5 10 15 20 25 30 35 40 人数