频率分布直方图茎叶图 (1)
2.2.1频率分布直方图
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
频率 组距
总体密度曲线
总体在区间 (a,b)内取 值的百分比.
O
a b 月均用水量/t
探究:在上述背景下,相应的频率分布折线 图越来越接近于一条光滑曲线,统计中称这 条光滑曲线为总体密度曲线.那么图中阴影部 分的面积有何实际意义?
6、(2016•海口模拟)某中学举行了一次“环保知识竞赛”, 全校学生参加了这次竞赛.为了了解本次竞赛成绩情况, 从中抽取了部分学生的成绩(得分取正整数,满分为100 分)作为样本进行统计.请根据下面尚未完成并有局部 污损的频率分布表和频率分布直方图(如图所示)解决 下列问题: 组别 分组 频数 频率 频率分布表
0.15
0.22 0.25 0.15 0.05 0.04 0.02 1
0.44 0.5
0.3 0.1 0.08 0.04 2.00
第一步,画平面直角坐标系. 第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度. 第三步,以组距为宽,各组的频率与组距的商为高,分别画出 第 各组对应的小长方形. 五 频率 步: 组距 画 出 小长方形的面 小长方形的面 月均用水量最 频 积=? =? 积总和 多的在那个区 率 0.5 0.50 0.44 间? 分 0.40 布 0.3 0.3 直 0.30 方 0.16 0.20 0.1 图. 0.08 月均用水量 0.08 0.10 0.04 /t 0.5 1 1.5 2 2.5 3 3.5 4 4.5
A
)
A.19、13
B.13、19
C.20、18
D.18、20
3. (2016•漳平市校级模拟) 某市重点中学奥数培训班共 有 14 人, 分为两个小组, 在一次阶段考试中两个小组成 绩的茎叶图如图所示,其中甲组学生成绩的平均数是 88, 乙组学生成绩的中位数是 89, 则 m+n 的值是 (
2.2.1频率分布直方图
41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.3 32.5 34.6 33.0 30.8 31.0 28.6 31.5 28.8
28.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.1
32.8 29.4 25.6 24.7 30.0 30.1 29.5 30.3
必修3 第二章
统 计
栏目导引
(1)将数据进行适当的分组,并画出相应的频率 分布直方图和频率分析折线图. (2)用自己的语言描述一下历届美国总统就任时 年龄的分布情况. 解析: (1)以4为组距,列表如下:
必修3 第二章
统 计
栏目导引
分组
频数累计
频数
频率
[41.5,45.5) [45.5,49.5) [49.5,53.5) [53.5,57.5) [57.5,61.5) [61.5,65.5) [65.5,69.5]
必修3 第二章
统 计
栏目导引
[策略点睛]
必修3 第二章
统 计
栏目导引
[解题过程] 甲、乙两人数学成绩的茎叶图如 图所示.从这个茎叶图上可以看出,乙同学的 得分情况是大致对称的,中位数是98分;甲同 学的得分情况除一个特殊得分外,也大致对称, 中位数是88分,但分数分布相对于乙来说,趋 向于低分阶段.因此乙同学发挥比较稳定,总 体得分情况比甲同学好.
必修3 第二章
统 计
栏目导引
2.某良种培育基地正在培育一种 小麦新品种 A,将其与原有的一个优良品种 B 进行对照试验,两种小麦各种植了 25 亩,所得 亩产数据(单位:千克)如下:
必修3 第二章
统 计
栏目导引
品种A: 357,359,367,368,375,388,392,399,400,405,412,41 4,415,421,423,423,427,430,430,434,443,445,445, 451,454 品种B: 363,371,374,383,385,386,391,392,394,394,395,39 7,397,400,401,401,403,406,407,410,412,415,416, 422,430 (1)完成数据的茎叶图; (2)用茎叶图处理现有的数据,有什么优点?
茎叶图
思考3:一般地,画出一组样本数据的茎叶图的步骤如
何?
第一步,将每个数据分为“茎”(高位)和“叶”(低位) 两部分; 第二步,将茎上的数据按大小次序排成一列,写在中间; 第三步,将各个数据的叶按大小次序写在茎右(左)侧.
A.甲、乙中位数的和为18.2,乙稳定性高 B.甲、乙中位数的和为17.8,甲稳定性高 C.甲、乙中位数的和为18.5,甲稳定性高 D.甲、乙中位数的和为18.65,乙稳定性高 解析:选A.求中位数时,必须先将这组数据从小到大或从大到小排列, 数据的个数为奇数,则中位数是最中间的一个,若数据的个数为偶数, 则中位数是最中间的两个数据的平均数,据此易知两人中位数和为18.2, 又分析茎叶图可知乙数据分布比较集中,即乙的稳定性较高.
课堂小结:
1、实际问题进行比较分析。
3、了解用茎叶图分析数据的优点与不足。
优点:(1)是所有的信息都可以从这个茎叶图中得到; (2)是茎叶图便于记录和表示,能够展示数据的分布情况。 缺点: 当样本数据较多或数据位数较多时,茎叶图就显得不太 方便了.
2.2用样本估计总体
(第三课时)
复习引入:
1.用样本的频率分布估计总体分布 (1)频率分布表与频率分布直方图 (2)频率分布折线图 (3)总体密度曲线 2、用样本的数字特征估计总体的数字特征
(1)众数、中位数、平均数(均值)
(2)标准差、方差
除了上面的几种处理方式外,我们还有一种用来表示数据的
图——茎叶图(stem-and-leap display)
引例:
某赛季甲、乙两名篮球运动员每场比赛得分情况如下。 甲的得分:12,15,24,25,31,31,36,36,37,39,44, 49 , 50 。 乙的得分:8,13,14,16,23,26,28,33,38,39,51。 上述的数据可以用下图来表示如下: 个位数 十位数
频率分布表
例2、为了了解一大片经济林的生长情况,随机测量其中的100株的 底部周长,得到如下数据表(长度单位:cm):
135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112 109 124 87 131 97 102 123 104 104 128 105 123 111 103 105 92 114 108 104 102 129 126 97 100 115 111 106 117 104 109 111 89 110 121 80 120 121 104 108 118 129 99 90 99 121 123 107 111 91 100 99 101 116 97 102 108 101 95 107 101 102 108 117 99 118 106 119 97 126 108 123 119 98 121 101 113 102 103 104 108
合计
பைடு நூலகம்
100 1
频率分布表的制作
1、计算数据中最大值与最小值的差,
即全距。据此,决定组数和组距。
组距
全距 组数
2、分组:通常对组内数据所在区间取 左闭右开区间,最后一组取闭区间。
3、登记频数,计算频率,列出频率分 布表
练习1
1. 某电子元件厂生产一批同型号的电子元件,今 从中随机地抽取40个测得其电阻值如下:
168 165 171 167 170 165 170 152 175 174 165 170 168 169 171 166 164 155 164 158 170 155 166 158 155 160 160 164 156 162 160 170 168 164 174 171 165 179 163 172 180 174 173 159 163 172 167 160 164 169 151 168 158 168 176 155 165 165 169 162 177 158 175 165 169 151 163 166 163 167 178 165 158 170 169 159 155 163 153 155 167 163 164 158 168 167 161 162 167 168 161 165 174 156 167 166 162 161 164 166
频率分布表
B、1/14
C、0.03
D、3/14
3、将一个容量为50的样本数据分组后,组距和频数如下:
[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9; [21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),6; [30.5,33.5],3.
则估计小于30的数据大约占总体的( A)
161
165
174
156
167
166
162
161
164
166
168
165
171
167
170
165
170
152
175
174
165
170 160 180 151 177 178 167 161
170
155 170 174 168 158 165 163 165
168
166 168 173 158 175 158 164 174
练习1
1. 某电子元件厂生产一批同型号的电子元件,今 从中随机地抽取40个测得其电阻值如下:
101 101 107 92 99 97 102 98 99 113 93 106 103 101 90 87 95 99 98 103 102 96 94 100 94 97 110 103 99 103 108 102 102 100 94 105 98 97 107 101
问题情境
为了了解7月25日至8月24日北京地区的气温分布状况, 我们对以往年份此段时间的日最高气温进行抽样,得到如 下样本(单位:C )
7月25 日至8 月10 日
41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.3 32.5 34.6 33.0 30.8 31.0 28.6 31.5 28.8 28.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.1 32.8 29.4 25.6 24.7 30.0 30.1 29.5 30.3
茎叶图
知识探究(二)
自主学习课本
茎叶图
70 页内容,交流回答 骤; 重复的数据如何处理?
1. 归纳出制作茎叶图的步 2 . 在制作茎叶图时,出现 3 . 什么是中位数? 4 . 用茎叶图处理数据有何
优缺点?
探究展示
1. 归纳出制作茎叶图的步 骤;
第一步,将每个数据分为“茎”(高位)和 “叶”(低位)两部分; 第二步,将最小的茎和最大的茎之间的数 按小大次序排成一列; 第三步,将各个数据的叶按大小次序写在茎 右(左)侧. 第一步中,如果是两位数字,则茎为十位上的数字, 叶为个位上的数字,如89,茎:8,叶:9; 如果是三位数则茎为百位上的数字,叶为十位上的和 个位上的数字,如123,茎:1,叶:23.
频率
组距
总体密度曲线
月均用 水量/t
总体密度曲线反映了总体在各个范围内取 值的百分比,精确地反映了总体的分布规律。
是研究总体分布的工具.
3. 说出图 2 . 2 - 3中阴影部分表示的意义
频率 组距
月均用 水量/t
a
b
表示总体在某个区间 (a, b) 内取值的百分比)。 总体密度曲线的实际意义在于: 总体密度曲线与x轴,直线x=a,x=b围成的面积 等于x在[a,b]取值时的概率.
知识探究(一)频率分布折线图 总体密度曲线
自主学习课本 69 页内容,交流回答 图? 密度曲线有何联系?
1. 如何做出频率分布折线 2. 频率分布折线图与总体
3. 说出图 2 . 2 - 3中阴影部分表示的意义 4 . 对于一个总体,如果存 这条曲线是否唯一?能 确地画出总体密度曲线 在总体密度曲线, 否通过样本数据准 ?
4.已知样本:12,7,11,12,11,12,10,10, 9,8,13,12,10,9,6,11,8,9,8,10, 那么频率为0.25的样本的范围是( D ) A. [5.5,7.5) B. [7.5,9.5) C. [9.5,11.5) D. [11.5,13.5) 5.频率分布直方图中,小长方体的面积等于( A.相应各组的频数 B.相应各组的频率 C.组数 D.组距
9.2用样本估计总体
授课主题用样本估计总体教学目标1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.3.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.4.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.教学内容1.频率分布直方图(1)列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且=极差组距组数;③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图。
(2)频率分布直方图的特点:①==⨯频率小长方形的面积组距频率组距,②个小长方形的面积等于1,③1==频率小长方形的高,所有小长方形的高的和组距组距.(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x=来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地n;n①众数、中位数、平均数都是描述一组数据集中趋势的量,平均数是最重要的量;x的平均数为x,则一组数,,n的平均数为用样本的标准差估计总体的标准差)数据的离散程度可以用极差、方差或标准差来描述;定义样本方差为222212()()()n x x x x x x s n-+-++-=;简化公式:22222121[()]n s x x x nx n=+++-=2222121()n x x x x n+++-(方差等于原数据平方的平均数减去平均数的平方)(4)样本的标准差是方差的算术平方根.样本标准差22212()()()0n x x x x x x s s n-+-++-=≥,.标准差越大数据离散程度越大,数据家分散;标准差越小,数据集中在平均数周围. (5)方差相关结论:①如果一组数12,,,n x x x 的方差为2s ,则一组数12,,,n x a x a x a +++的方差为2s ;②如果一组数12,,,n x x x 的方差为2s ,则一组数12,,,n kx kx kx 的方差为22k s 。
第八章第一讲频率分布直方图
第一讲 频率分布直方图一:考纲解读、有的放矢统计部分要求不太高,主要是考抽样方法与频率分布直方图和茎叶图有关的问题,最多一个小题(选择或填空)属容易题,但应充分注意以统计为载体、问题实质涉及期望与方差计算的综合解答题.二:核心梳理、茅塞顿开3. 作频率分布直方图的方法为:(1)把横轴分成若干段,每一线段对应一个组的组距;(2)以此线段为底作矩形,它的高等于该组的组距频率,这样得出一系列的矩形;(3)每个矩形的面积恰好是该组上的频率.4. 频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图.5. 作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.三:例题诠释,举一反三知识点1:利用频率分布直方图分析总体分布例题1:(2011中山期末A )2000辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,时速在[50,60)的汽车大约有 ( ) A .30辆 B .60辆 C .300辆D .600辆变式:(2009山东卷理B)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的 产品净重(单位:克)数据绘制的频率分布直方图,其中产品 净重的范围是[96,106],样本数据分组为[96,98),[98,100), [100,102),[102,104),[104,106],已知样本中产品净重小于 100克的个数是36,则样本中净重大于或等于98克并且 小于104克的产品的个数是 ( ). A.90 B.75 C. 60 D.45变式:(2011杭州质检B )某初一年级有500名同学,将他们的身高(单位:cm )数据绘制成频率分布直方图(如图),若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[)130,140内的学生中选取的人数为 .知识点2:用样本分估计总体例题2(2010安徽卷B )某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91, 77,86,81,83,82,82,64,79,86,85,75,71,49,45, (Ⅰ) 完成频率分布表;(Ⅱ)作出频率分布直方图;(Ⅲ)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染。
用样本估计总体
月收入(元)
1000 1500 2000 2500 3000 3500 4000
练习1、如图是150辆汽车通过某路段 时速度的频率分布直方图,则速度在[60, 60 辆. 70)的汽车大约有______
在频率分布直方图中,依次连接各小长 方形上端的中点,就得到一条折线,这条 折线称为频率分布折线图.
练习3、以往招生Biblioteka 计显示,某所大学录 取的新生高考总分的中位数基本稳定在550 分,若某同学今年高考得了520分,他想报 考这所大学还需收集哪些信息?
要点: (1)查往年录取的新生的平均分数.若平均数 小于中位数很多,说明最低录取线较低,可以 报考; (2)查往年录取的新生高考总分的标准差.若 标准差较大,说明新生的录取分数较分散,最 低录取线可能较低,可以考虑报考.
标准差的取值范围是什么?标准差为0 的样本数据有何特点? s≥0,标准差为0的样本数据都相等. 方差的意义: 方差(或标准差)越大离散程度越大,数 据较分散; 方差(或标准差)越小离散程度越小,数 据较集中在平均数周围.
例 2 、有两个班级,每班各自按学号随 机选出 5 名学生,测验铅球成绩,以考察 体育达标程度,测验成绩如下:单位(米) 甲 9.1 7.8 8.5 6.9 5.2 乙 8.8 7.2 7.3 7.5 6.7 两个班相比较,哪个班整体实力强一些 ?
制作频率分布直方图的方法: (1)求极差(即一组数据中最大值与最小 值的差); (2)决定组距与组数;(样本容量不超过
100时,组数常分成5~12组)
(3)将数据分组; (4)列频率分布表; (5)画频率分布直方图.
注:频率分布直方图中
茎叶图
17 ,超过 50%,说明该市空气质量有待进一步改善。 30
5 300
41 51 61 71 81 91 101 111 空气污染指 数
(Ⅲ)答对下述两条中的一条即可: (1) 该市一个月中空气污染指数有 2 天处于优的水平,占当月天数的
1 ,有 26 天处于良的水平,占当 15
13 14 月天数的 ,处于优或良的天数共有 28 天,占当月天数的 。说明该市空气质量基本良好。 15 15 1 轻微污染有 2 天,占当月天数的 。污染指数在 80 以上的接近轻微污染的天数有 15 天,加上处于轻微 15
.解:(1)频率分1,71) [71,81) [81,91) [91,101) [101,111) 频数 2 1 4 6 10 5 2 频率 2 30 1 30 4 30 6 30 10 30 5 30 2 30
(2)频率分布直方图
10 300
频率/组距
注: 1、重复出现的数据要重复记录,不能遗 漏;特别是“叶”部分;
2、所有的信息都可以从这个茎叶图中得到; 3、茎叶图便于记录和表示;
4、不足的是其分析只是粗略的,对差异不 大的两组数据不易分析;表示三位数以上 的数据时不够方便;
例:甲、乙两篮球运动员上赛季每场比赛 的得分如下,试比较这两位运动员的得分 水平:
茎叶图
知识回顾
频率分布直方图
注意 1.纵轴 :频率/组距 2.小长方形面积表示频率
1.求极差 2.决定组距与组数
步骤
3.将数据分组
4.列频率分布表 5.画频率分布直方图
3.小长方形的面积之和为1
我们将样本的数据有条理的列出来,从中观察数据 的分布情况,这种方法就是茎叶图。 制作茎叶图的方法 将所有两位数的十位数字作为“茎”,个位数字作 为“叶”,茎相同者共用一个茎,茎按从小到大的 顺序从上向下列出,共茎的叶依次在同一行列出。
直方图和其他频率分布图(histogram and other frequency distributions)
直方图和其他频率分布图(histogram and other frequency distributions)直方图和其他频率分布图(histogram and other frequency distributior.s包括多边形图、茎叶图、点图、分位图、CDF图、累积多边形图。
概述频率分布表明了一组数据不同数值出现的频数。
直方图是最常用的频率分布图,与条形图很相似,但是两者之问有些重要的区别。
这部分也包含了其他的频率分布图。
多边形图和直方图的形状一样,但是用线而不是条柱连接频率值;茎叶图通过运用单个数值作为数据点的标识来保存单个数值:点图是在一条垂线上用小圆圈表示每个数据点;分位图和累积点线图表示有多少测量值(或测量值的百分比)小于或等于每个值。
适用场合·数据是数值型时;·想弄清楚数据分布的形状;·确定一个过程的输出是否近乎符合正态分布;·分析一个过程是否满足顾客的要求;·分析供应商的过程输出的分布情况;·检查两个时间段内过程是否发生交化;·确定两个或多个过程输出是否不同;·将分布情况快速简单地表示出来。
决策树(图表5. 68)有助于确定最适合于表示不同的数据和目的的图形。
实施步骤构建1.从一个过程中搜集至少50个连续的数据点。
如果没有那么多数据,就使用点图。
2.用直方图计算表(参阅图表5.81)建立直方图。
通过填写计算表确定组数,组距和组边界值。
计算完步骤2的组距(W)后,判断并将其调整到一个方便计算的数比如,你可以将0.9调整到1.0。
W的小数位不能比图中数的小数位多。
3.在图纸上画x轴和y轴。
y轴表示数据出现的个数。
用计算表中计算得到的L值在x轴标刻度。
这些数值之差是组距。
条柱间不要留空隙。
4.对于每个数据,准确找出其落入的组,并在该组上增加一个x或涂上一段条柱。
如果数据刚好落在组限处,则将该数据记入其右侧的一组内。
茎叶图
体密度曲线。
2.用样本分布直方图去估计相应的总体分布时,一
般样本容量越大,频率分布直方图就会无限接近 总体密度曲线,就越精确地反映了总体的分布规 律,即越精确地反映了总体在各个范围内取值百 分比。
二.茎叶图
• 茎叶图,类似直方图,但又与直方图不同,它的 思路是将数组的数按位数进行比较,将数大小基 本不变或变化不大的位作为一个主杆(茎),将 变化大的位的数作为分枝(叶),列在主杆的后 面,这样就可以清楚地看到每个主杆后面的几个 数,每个数具体是多少。 · 茎叶图在质量管理上用途与直方图差不多,但它通 常是作为更细致的分析阶段使用。由于它是用数字 组成直方图,所以在做的时候比直方图还,通常我 们常使用专业的软件进行绘制。
2.茎叶图的特征:
1)用茎叶图表示数据有两个优点:一是从统计图 上没有原始数据信息的损失,所有数据信息都可以 从茎叶图中得到;二是茎叶图中的数据可以随时记 录,随时添加,方便记录与表示; (2)茎叶图只便于表示两位(或一位)有效数字 的数据,对位数多的数据不太容易操作;而且茎叶 图只方便记录两组的数据,两个以上的数据虽然能 够记录,但是没有表示两个记录那么直观,清晰; (3)茎叶图对重复出现的数据要重复记录,不能 遗漏.
学习目标
1、会列频率分布表,会画频率分布直方图; 2、会运用频率分布表和直方图分析和估计总 体分布;
自主学习
• 阅读教材 P6567 完成《导航》“知识梳理”
思考题: 某市政府为了节约生活用水,计划在 本市试行居民生活用水定额管理,即确定一个居 民月用水量标准a ,用水量不超过a的部分按平价 收费,超过a的部分按议价收费。
3.频率分布折线图的优点是它反映了数据 的变化趋势,如果样本容量不断增大, 分组的组距不断缩小,那么折线图就趋 向于总体分布的密度曲线。
怎么画频率分布折线图频数分布表茎叶图作频率分布直方图的步骤
频率分布:样本中所有数据(或者数据组)的频率和样本容量的比就是该数据的频率,所有数据(或者数据组)的频率的分布变化规律叫做频率分布,可以用频率分布表,频率分布折线图,茎叶图,频率分布直方图来表示.频率分布折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图。
频数分布表:反映总体频率分布的表格。
一般地,编制频率分布表的步骤如下:(1)求全距,决定组数和组距;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表。
茎叶图:(1)茎是指中间的一列数,叶是从茎的旁边生长出来的数。
(2)制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出;(3)茎叶图的性质:①茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况。
②茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况。
1、频率分布样本中所有数据(或者数据组)的频率和样本容量的比就是该数据的频率,所有数据(或者数据组)的频率的分布变化规律叫做频率分布,可以用频率分布表,频率分布折线图,茎叶图,频率分布直方图来表示.2、频率分布折线图如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图。
3、频数分布表:反映总体频率分布的表格。
一般地,编制频率分布表的步骤如下:(1)求全距,决定组数和组距;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表茎叶图的性质:①茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况。
②茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况。
频率分布直方图如下
(1)解:如图:茎为成绩的整环数,叶为小数点后的数字
甲
乙
85 2 74
7
1
8
57
4
9
112 78
8751
10
11
(2)乙成绩大致对称,甲成绩的中位数为9.05, 乙成绩的中位数为9.15,所以乙成绩较甲好, 乙成绩较集中于峰值,甲成绩分散
所以乙发挥的稳定性好,甲波动大
练习2:课本71页练习第三题
作业:课本71页练习1,上面的练习1和2。
优化设计
小结:1.什么是频率折线图
2.什么是总体密度曲线及其意义 3.1)认识茎叶图,如何做茎叶图 2)分析茎叶图,3)茎叶图的优缺点
频率分布直方图如下:
频率
连接频率分布直方图
组距
中各小长方形上端的
中点,得到频率分布折
线图
0.50
0.40
0.30
0.20
0.10
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
利用样本频率分布对总体分布进行相应估计
(1)上例的样本容量为100,如果增至1000, 其频率分布直方图的情况会有什么变化?假如增 至10000呢?
26
思考: 数据大于俩位数的整数时又如何选茎,叶?
数据为小数时又如何选茎,叶?
结论:1>当数据为整数时:通常个位数字在叶上, 其他位数在茎上(一位数时,茎为0)
2>当数据为小数时:通常小数部分在叶上, 整数部分在茎上
甲的茎叶图画法
也可以画一组数据的茎叶图,竖线左边为茎,
右边为叶。
茎
叶
08
1 364
甲的中位数为26,乙的中位数为36,所以乙较甲成绩要好, 另,乙的叶较甲的更集中于峰值附近,所以乙较甲发挥 更稳定
数学苏教版3教案:2.2.3茎叶图含解析
2。
2.3茎叶图整体设计教材分析通过比较甲、乙两个运动员比赛得分情况引入茎叶图,从而得出画茎叶图的步骤,从茎叶图中的枝叶分布情况就可以感受到样本数据的分布特点。
结合实例说明,可根据数据的特点灵活地决定茎叶图中数据的茎和叶的划分.茎叶图,频率分布表和频率分布直方图都是用来描述样本数据的分布情况的。
茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.三维目标1。
通过实例使学生掌握茎叶图的意义及画法,体会分布的意义和作用,在表示样本数据的过程中,进一步学会列频率分布表及画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2。
使学生进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布。
重点难点教学重点:1。
使学生掌握茎叶图的意义及画法,结合实例体会茎叶图的优点;2.继续掌握如何用样本频率分布估计总体分布。
教学难点:对频率分布直方图的理解和应用.课时安排1课时教学过程导入新课设计思路一:(复习导入)一般地,对于n 个数x 1,x 2,…,x n ,我们把n n x x x n +++...21叫做这n个数的算术平均数,简称平均数。
平均数常用于表示一组数据的平均水平。
计算平均数时,所有数据都参加运算,它能充分利用数据所描述的信息,因此在生活中较为常见,但它易受端点值的影响。
一般地,n 个数根据大小顺序排列后,处于中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数。
由中位数的定义可知,当数据的个数是奇数时最中间的一个数据是中位数;当数据的个数是偶数时,则最中间两个数据的平均数是中位数.中位数受端点值的影响小,但不能充分利用所有数据的信息.众数则是一组数据中出现次数最多的那个数据.为了避开以上缺点,今天学习——茎叶图.因为所有信息都可以从茎叶图中得到体现。
设计思路二:(事例导入)某篮球运动员某赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50.如何分析该运动员的整体水平及发挥的稳定程度?推进新课新知探究除了前几天学的图、表以及上面的各种数能帮助我们分析数据外,统计中还有一种用来表示数据的茎叶图(stem and leaf display).顾名思义,茎是指中间的一列数,叶就是指从茎的两旁生长出来的数,中间的数字表示得分的十位数,旁边的数字分别表示两名运动员得分的个位数,像这样用来表示数据,帮助我们理解样本数据的图,我们称为茎叶图.制作茎叶图的方法是:当所给数据为一位数时,可将0作为茎叶较长的茎,而它本身作为叶;当所给数据为两位数时,将所有两位数的十位数字作为“茎”,个位数字作为“叶”;当所给的数据为三位数时,可将百位和十位作为“茎”,而个位数字作为“叶”.茎相同的数据共用一个茎,茎按从小到大的顺序从上到下排列,共用茎的叶一般要按从大到小(也可以从小到大)的顺序同行排出.制作茎叶图时,一般用一个竖线将茎叶隔开,竖线的左边是茎,右边是叶。
茎叶图
高中数学新课程中茎叶图的考点茎叶图又称“枝叶图”,与频率分布直方图一样,都是用来表示样本数据的一种统计图。
通常我们将数的大小基本不变或者变化不大的位作为“茎”,将变化大的位作为“叶”。
1.茎叶图的书写规则书写规则是:“茎”一般要求按照从小到大的顺序从上到下列出。
公用“茎”的“叶”一般也按照从小到大的顺序同行列出,注意重复的项也必须写上。
2.特点图形形状的特点:(1)若图形扁而宽,则说明整体的样本数据集中,样本数据的差异性不大。
(2)若图形长而窄,则说明样本数据比较分散,标准差较大,距组较大。
3.优缺点同频率分布直方图比较,茎叶图中所有的原始数据都可以得到。
并且在以后新增加数据的时候容易修改,但直方图这样操作起来就很困难了。
茎叶图也有其缺点,就是当样本数据比较多的时候,很难进行此操作。
如果我们将茎叶图的茎和叶按逆时针方向旋转90度,得到的是一个没有坐标的直方图。
通过此操作,很容易求出各个数据段的频率分布或频率百分比。
下面我们通过几个例子来阐述上述问题。
例1右图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图。
其中左边两位数字从左到右的分别表示学生身高的百位数字和十位数字, 15 5 5 7 8 右边的数字表示学生身高的个位数字,从图中可以得到这10个同学 16 1 3 3 5身高的中位数是() 17 1 2A.161cm B. 162cm C.163cm D.164cm解析:15 ∣5表示身高155cm。
这10个数字分别是:155cm、155cm、157cm、158cm、161cm、163cm、163cm、165cm、171cm、172cm。
所以中位数为 =162cm。
评注:由样本数据来求样本的中位数,一般先将所有的数据按从小到大排序。
若个数为奇数则取正中间一个,若个数为偶数,则取中间两个数的平均值。
茎叶图的优点就是对数据不需要排序,可以快速的求出统计量。
例2某中学高一(1)班中段考试数学成绩的茎叶图如右图所示,那么优秀率(90分以上)和最低分分别是() 5 1235A.15%,15B.15%,51 6 023*******C.10%,51D.10%,15 7 122345556677898 023367789 1245解析:我们可以将茎叶图转化为样本数据,可以知道最低分为51分。
2019艺体生文化课-数学(文科)第十章 第2节 频率直方图、2x2列联表、茎叶图、线性回归方程、相关关系
(ti t)2
i 1
【解析】 (1)由折线图中数据和附注中参考数据得t 4,
7
7
(ti t)2 28, ( yi y)2 0.55.
i 1
i 1
7
7
7
(ti t)( yi y) ti yi t yi 40.17 4 9.32 2.89,
3.求方差公式:S 2
1 n [(x1
x)2
( x2
x)2
( x3
x)2
...
( xn
x)2 ].
频率分布直方图中求方差的参考公式: S 2 (x1 x)2 f1 (x2 x)2 f2 (x3 x)2 f3 ... (xn x)2 fn (其中x1,x2,…,xn取各分段的中间值)
考点2:2×2列联表 【例2】 为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对 30名六年级学生进行了问卷调查得到如下2×2列联表:平均每天 喝500ml以上为常喝,体重超过50kg为肥胖.
常喝 不常喝 合计
肥胖
6
2
8
不肥胖
4
18
22
合计
10
20
30
已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为
9.32 7
1.331及(1)得
b
(ti
i 1 n
t)( yi y) (ti t)2
2.89 28
0.103,
i 1
a
y
b
t
1.331
茎叶图
高中数学新课程中茎叶图的考点茎叶图又称“枝叶图”,与频率分布直方图一样,都是用来表示样本数据的一种统计图。
通常我们将数的大小基本不变或者变化不大的位作为“茎”,将变化大的位作为“叶”。
1.茎叶图的书写规则书写规则是:“茎”一般要求按照从小到大的顺序从上到下列出。
公用“茎”的“叶”一般也按照从小到大的顺序同行列出,注意重复的项也必须写上。
2.特点图形形状的特点:(1)若图形扁而宽,则说明整体的样本数据集中,样本数据的差异性不大。
(2)若图形长而窄,则说明样本数据比较分散,标准差较大,距组较大。
3.优缺点同频率分布直方图比较,茎叶图中所有的原始数据都可以得到。
并且在以后新增加数据的时候容易修改,但直方图这样操作起来就很困难了。
茎叶图也有其缺点,就是当样本数据比较多的时候,很难进行此操作。
如果我们将茎叶图的茎和叶按逆时针方向旋转90度,得到的是一个没有坐标的直方图。
通过此操作,很容易求出各个数据段的频率分布或频率百分比。
下面我们通过几个例子来阐述上述问题。
例1右图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图。
其中左边两位数字从左到右的分别表示学生身高的百位数字和十位数字,15 5 5 7 8右边的数字表示学生身高的个位数字,从图中可以得到这10个同学16 1 3 3 5身高的中位数是()17 1 2A.161cm B. 162cm解析:15 ∣5表示身高155cm。
这10个数字分别是:155cm、155cm、157cm、158cm、161cm、163c m、163cm、165cm、171cm、172cm。
所以中位数为 =162cm。
评注:由样本数据来求样本的中位数,一般先将所有的数据按从小到大排序。
若个数为奇数则取正中间一个,若个数为偶数,则取中间两个数的平均值。
茎叶图的优点就是对数据不需要排序,可以快速的求出统计量。
例2某中学高一(1)班中段考试数学成绩的茎叶图如右图所示,那么优秀率(90分以上)和最低分分别是() 5 1235%,15 %,51 6 09%,51 %,15 7 98 023367789 1245解析:我们可以将茎叶图转化为样本数据,可以知道最低分为51分。
频率分布直方图与茎叶图.ppt
频数 2 11 13 4
茎叶 10 7, 8 11 2, 7, 6, 3, 6, 8, 6, 7, 2, 2,0 12 6, 8, 4, 2, 7, 8, 6, 1, 0, 4, 3, 2, 0 13 4, 2, 3, 0
思考:从频率分布直方图中,你能得到任意 区间(a,b)的频率?有什么困难?
一、频率分布折线图与概率密度曲线
频率/组距 (取组距中点, 并连线 )
0.6
0.5
0.5
0.44
0.4
0.3
0.3
0.3
0.2
0.16
0.1 0.08
0.1 0.08 0.04
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5
0.3
分
布 0.2
0.16
小月长均方用形水的量面最 多积的积总在=和哪?=个? 区
间?
直 0.1 0.08
0.1 0.08
方 图.
0
0.04
0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
频率分布直方图的特征: 从频率分布直方图可以清楚的看出数据分布 的总体趋势。 从频率分布直方图得不出原始的数据内容, 把数据表示成直方图后,原有的具体数据信 息就被抹掉了。
第四步: 列频率分布表.
(包括分组、频数、频率、频率/组距)
分组
[0-0.5) [0.5-1) [1-1.5) [1.5-2) [2-2.5) [2.5-3) [3-3.5) [3.5-4) [4-4.5)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用样本估计总体
例一、1、为了了解某中学高二女生的身高情况,该校对高二女生的身高(单位:cm)进行了一次随机抽样测量,所得数据整理后列出了频率分布表如下:
分组频数频率
[150.5,154.5)10.02
[154.5,158.5)40.08
[158.5,162.5)200.40
[162.5,166.5)150.30
[166.5,170.5)80.16
[170.5,174.5]m n
合计M N
(1)
(2)绘制频率分布折线图;
(3)估计该校女生身高小于162.5 cm的百分比.
2、为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组数如下:
[10.75,10.85),3;[10.85,10.95),9;[10.95,11.05),13;[11.05,11.15),16;
[11.15,11.25),26;[11.25,11.35),20;[11.35,11.45),7;[11.45,11.55),4;[11.55,11.65],2.
(1)列出频率分布表;
(2)画出频率分布直方图以及频率分布折线图;
(3)根据上述图表,估计数据落在[10.95,11.35)范围内的可能性是多大?
例二、1、[2016·盐城高一检测]为了了
解高一年级学生的体能情况,某校抽取部分学
生进行一分钟跳绳次数测试,将所得数据整理
后,画出频率分布直方图(如图所示),图中从
左到右各小长方形的面积之比为2∶4∶17∶
15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
2、从某小学随机抽取100名同学,将他们的
身高(单位:厘米)数据绘制成频率分布直方图(如
下图).由图中数据可知a=________.若要从身高
在[120,130),[130,140),[140,150]三组内的学生中,
用分层抽样的方法选取18人参加一项活动,则从
身高在[140,150]内的学生中选取的人数应为
________.
例三、1、在某高中篮球联赛中,甲、乙两名运动员的得分如下(单位:分):甲的得分:14,17,25,26,30,31,35,37,38,39,44,48,51,53,54;
乙的得分:6,15,17,18,21,27,28,33,35,38,40,44,56.
(1)用茎叶图表示上面的样本数据;
(2)分析甲、乙两名运动员中哪一位发挥得更加稳定.
2、甲、乙两个小组各10名学生的英语口语测试成绩(单位:分)如下:
甲组76908486818786828583
乙组82848589798091897974
用茎叶图表示两个小组的成绩,并判断哪个小组的成绩更整齐一些.
作业:
1.如图所示的茎叶图表示的是某城市一台自动售
货机某天的销售额情况(单位:元),图中的数字7表示
的意义是这台自动售货机该天的销售额为()
A.7元B.70元C.27元D.72元
2.[2016·贵州思南中学月考]某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()
A.90 B.75C.60 D.45
3.[2016·河南高一检测]下图是12名同学某次测验的分数的茎叶图,由此可知,这些分数中最低分与最高分之和为________.
5
6
7
8 9⎪
⎪
⎪
⎪3
28
5577 3345 4
4.如图是容量为100的样本的频率分布直方图,试根据图形中的数据填空.
(1)样本数据落在范围[6,10)内的频率为________;
(2)样本数据落在范围[10,14)内的频数为________.
5.[2016·四川省遂宁市期末]从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布和频率分布直方图.
(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的频率;
(2)求频率分布直方图中的a,b的值.组号分组频数1[0,2) 6 2[2,4)8 3[4,6)17 4[6,8)22 5[8,10)25 6[10,12)12 7[12,14) 6 8[14,16) 2 9[16,18] 2 合计100
6.[2016·湖北省随州市期末]我市三所重点中学进行高二期末联考,共有6000名学生参加,为了了解数学学科的学习情况,现从中随机抽取若干名学生在这次测试中的数学成绩,制成如下频率分布表:
分组频数频率
[80,90)①②
[90,100)0.050
[100,110)0.200
[110,120)360.300
[120,130)0.275
[130,140)12③
[140,150]0.050
合计④
(1)________、________、________、________.
(2)在所给的坐标系中画出[80,150]上的频率分布直方图.。