2015高考数学总复习专题系列——统计.板块三.茎叶图.学生版

合集下载

2015届高考数学二轮专题板块案例分析:统计.板块三.茎叶图 (北师大版)

2015届高考数学二轮专题板块案例分析:统计.板块三.茎叶图 (北师大版)

板块三.茎叶图题型一 茎叶图【例1】 (2010丰台二模)甲、乙两名运动员的5次测试成绩如下图所示7乙甲63926886877设12,s s 分别表示甲、乙两名运动员测试成绩的标准差,12,x x 分别表示甲、乙两名运动员测试成绩的平均数,则有( )A .12x x =,12s s <B .12x x =,12s s >C .12x x >,12s s >D .12x x =,12s s =【例2】 (2010宣武二模)随机抽取某中学甲,乙两班各10名同学,测量他们的身高(单位:cm ),获得身高数据的茎叶图如图 ,则下列关于甲,乙两班这10名同学身高的结论正确的是 ( )A . 甲班同学身高的方差较大B . 甲班同学身高的平均值较大C . 甲班同学身高的中位数较大D . 甲班同学身高在175以上的人数较多【例3】 (2010天津高考)甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为 和 .4女甲903222111110098754321【例4】 右图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,571267847945368553乙甲4321则甲、乙两人这几场比赛得分的中位数之和是( ) A .62 B .63 C .64 D .65【例5】 在某五场篮球比赛中,甲、乙两名运动员得分的茎叶图如右.下列说法正确的是2340210891乙甲3210A .在这五场比赛中,甲的平均得分比乙好,且甲比乙稳定B .在这五场比赛中,甲的平均得分比乙好,但乙比甲稳定C .在这五场比赛中,乙的平均得分比甲好,且乙比甲稳定D .在这五场比赛中,乙的平均得分比甲好,但甲比乙稳定【例6】 (2009年福建12)某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示,记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清.若记分员计算无误,则作品A 8 98 9 92 3 x 2 1 4。

高中数学茎叶图

高中数学茎叶图

2.茎叶图的作用:茎叶图也是用来表示数据分布的一种方法.茎叶图既可以用于分析单组数据,也可以用于对两组数据进行比较分析

父亲年龄
母亲年龄
相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.
茎叶图的茎一定是位数相同的吗?
从图中可以看出,这个兴趣小组成员的学习成绩集中在60~100分之间.
高中数学茎叶图
自学导引 1.将样本数据有 条理 地列出来,从中观察样本分布情 况的图称为茎叶图. 2.茎叶图刻画数据的优点是所有的 信息 都可以从这张图 中得到,方便 记录 和表示.缺点是当样本数据 较多 时, 茎叶图的效果就不是很好. 想一想:1.茎叶图的茎一定是位数相同的吗? 提示 不一定.可以是一位数,也可以是两位数,还可以 同时是一位数或两位数等. 2.用茎叶图如何表示三位数的数据? 提示 茎表示前两位数,叶表示最后一位数.
父亲年龄
母亲年龄
②茎叶图便于记录与表示.
[正解] 茎叶图如图所示
而母亲的年龄分布大致呈对称分布,平均年龄约为45岁,可见父亲的平均年龄要比母亲的平均年龄大.
120 112 124 110 123 122 11】 下面一组数据是某生产车间30名工人某日加工零 件的个数.请设计适当的茎叶图表示这组数据.
题型三 茎叶图的应用 【例3】 (14分)甲、乙两个学习小组在一次测验中的得分如 下: 甲:53 56 64 69 71 72 72 73 74 75 75 76 78 81 83 90 乙:48 54 57 58 64 65 66 66 68 69 70 71 72 75 80 91 试比较这两组学生的学习成绩. 审题指导 本题画出两组得分的茎叶图,可以很直观地观察 出两组数据的情况.

高考茎叶图知识点

高考茎叶图知识点

高考茎叶图知识点高考是每个学生都经历的一场重要考试。

为了能够高效备考和顺利应对考试,掌握一些重要的知识点非常关键。

而茎叶图作为一种统计图表,在高考数学中扮演着重要的角色。

本文将重点介绍高考茎叶图的知识点,以帮助学生更好地掌握这一内容。

什么是茎叶图?茎叶图,也称为“数据的茎叶显示图”,是一种用来展示数据分布情况的统计图表。

它能够清晰地展示出数据的相对大小、分布情况和聚集趋势等信息。

茎叶图的构成由两部分组成,即“茎”和“叶”。

茎部通常表示数据的十位数和个位数,而叶部表示数据的个位数。

例如,给定一组数据:12, 23, 34, 45, 56, 67, 78, 89, 90。

将数据的十位数写在一排上,即1、2、3...,然后将个位数依次排列在相应的十位数下方。

这样茎叶图的构成就完成了。

茎叶图的优势茎叶图作为一种统计图表,有以下几个优势:1. 直观清晰:茎叶图能够以一种直观清晰的方式展示数据的分布情况,使人更容易理解和分析数据。

2. 不丢失数据:与其他统计图表相比,茎叶图能够保留原始数据的每一个数字,不会对数据进行任何的修改或丢失。

3. 容易绘制和理解:茎叶图的构建十分简单,只需按照一定的规则将数据排列即可,同时茎叶图的结构也非常直观,学生能够迅速理解和运用。

如何绘制茎叶图?绘制茎叶图的过程需要按照一定的步骤进行,主要包括以下几个步骤:1. 确定数据的范围:首先需要确定数据的最大值和最小值,以便确定茎部和叶部的范围。

2. 确定茎部和叶部的规模:根据数据的范围确定茎部和叶部的规模,即多少个十位数和多少个个位数。

3. 将数据分配到茎叶图中:按照数据的个位数先后顺序,将每一个数字分配到相应的茎叶图中。

4. 编写茎叶图:确定好茎部和叶部之后,按照茎部的大小顺序,将相应的个位数写在相应的茎叶图上。

5. 添加标题和解释:最后,在茎叶图的顶部添加图表的标题,同时提供必要的文字解释。

茎叶图的应用茎叶图在实际应用中有着广泛的应用领域。

茎叶图及其例题讲解

茎叶图及其例题讲解

茎叶图一.茎叶图1.茎叶图:茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。

2.茎叶图的特征(1)用茎叶图表示数据有两个优点:一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。

(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两组以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰。

当样本数据较多时,因为每一个数据都要在图中占据一个空间,用茎叶图很不方便。

3.制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出. 茎叶图对于分布在0~99的容量较小的数据比较合适,此时,茎叶图比直方图更详尽地表示原始数据的信息. 在茎叶图中,茎也可以放两位,后面位数多可以四舍五入后再制图.4.画茎叶图时的注意事项(1)将每个数据分为茎(高位)和叶(低位)两部分,当数据是两位整数时,茎为十位上的数字,叶为个位上的数字;当数据是由整数部分和小数部分组成时,可以把整数部分作为茎,小数部分作为叶。

(2)将茎上的数字按大小次序排成一列。

(3)为了方便分析数据,通常将各数据的叶按大小次序写在其茎右(左)侧。

(4)用茎叶图比较数据时,一般从数据分布的对称性、中位数,稳定性等方面来比较。

二.茎叶图中常用的几个量:众数.中位数.平均数(样本的数字特征) (1)众数:出现次数最多的数叫做众数.(2)中位数:如果将一组数据按大小顺序依次排列,把处在最中间位置的一个数据或中间两个数据的平均是叫做这组数据的中位数. (例:2、3、4、5、6、7 中位数:(4+5)/2= (例:1、2、3、6、7的中位数是3。

)(3)平均数与加权平均数:如果有n 个数,,,,n x x x x ⋯⋯321那么12nx x x x n++⋅⋅⋅+=叫做这n个数的平均数. 如果在n 个数中,1x 出现次1f 次, 2x 出现次2f 次,……,k x 出现次2f 次,(这里),n f f f k =+⋯⋯++21那么11221()k k x x f x f x f n=++⋅⋅⋅+叫做这n 个数的加权平均数,其中k f f f ⋯⋯,,21叫做权.(4)标准差与方差:设一组数据123nx x x x ⋯,,,,的平均数为x ,则nx x x x x x s s n 222212)()()(-++-+-== ,其中2s 表示方差,s 表示标准差. 例1 下面一组数据是某生产车间30名工人某日加工零件的个数,请设计适当的茎叶图表示这组数据,并由图出发说明一下这个车间此日的生产情况。

茎叶图、特征数

茎叶图、特征数

8. 在如图所示的茎叶图中,甲、乙两组数据的中位数分别是
9. 某校开展绘画比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最 高分和一个最低分后,算得平均分为91,但复核员在复核时,发现有一个数字(茎叶图中的 x)无法看清.若记分员计算无误,则数字x应该是 .
10. 为了了解一片经济林的生长情况,随机抽测了其中 60株树木的底部周长(单位:cm),所得数据均在 区间 80,130 上,其频率分布直方图如图所示,则在 抽测的60株树木中,有 小于100cm. 株树木的底部周长
A.
0.27,78
B.
0.27,83
C.
2.7,78
D.
2.7,83
2. 从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,前三组不超过80分的 人,其频数之和为20,其频率之和为0.4,则所抽取的样本容量是 ( A. 100 B. 80 C. 40 ) D. 50
3. 茎叶图表示数据的两个突出优点是 ① 形象直观;② 图上没有原始数据的损失,所有信息都可以从图中得到; ③ 积累数据时,随时记录. A. ①②③ B. ①② C. ①③ D. ②③
茎叶图与特征数(2)
11. 某校为了解高三同学寒假期间学习情况,抽查了 100名同学,统计他们每天平均学习时间, 绘成频率分布直方图(如图).则这100名同学中学习时间在6到8小时内的人数 为 .
ቤተ መጻሕፍቲ ባይዱ
12. 某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是: 50,60 , 60,70 , 70,80 , 80,90 , 90,100 . (1)求图中a的值; (2)根据频率分布直方图,估计这100名学生语文成绩众数、 中位数和平均分; (3)若这100名学生语文成绩某些分数段的人数 x 与数学 成绩相应分数段的人数 y 之比如下表所示,求数学成绩在 50,90 之外的人数. 分数段 x: y 50,60 1: 1 60,70 2: 1 70,80 3: 4 80,90 4: 5

数学高考知识点茎叶图

数学高考知识点茎叶图

数学高考知识点茎叶图数学高考知识点:茎叶图茎叶图是统计学中一种常用的数据展示方式,主要用于描述数据的分布情况和集中趋势。

它由茎和叶两部分组成,茎部代表数据的十位和百位,叶部代表数据的个位和十分位。

茎叶图能够直观地显示数据的整体分布,便于进行观察和分析。

在高考数学中,茎叶图是一个重要的知识点,它不仅考察学生对茎叶图的理解和应用能力,还能培养学生的数据处理和分析能力。

1. 什么是茎叶图茎叶图是一种将数据进行可视化展示的图形,它的构造方法很简单。

首先,将数据按照从小到大的顺序排列。

然后,将每个数据拆分成两部分,即茎和叶。

茎部是数据的十位和百位部分,叶部是数据的个位和十分位部分。

最后,依照茎部的大小和顺序,将叶部数据以竖直方式排列在茎的两侧,形成茎叶图。

2. 茎叶图的优点茎叶图有多种优点,使得它在统计学和高考数学中得到广泛应用。

首先,茎叶图能够直观地展示数据的分布情况,让人一目了然。

其次,它能够同时展示数据的每一个值,避免了只关注平均值或总体特征的缺点。

再次,茎叶图的构造方法简单,容易理解和应用。

最后,茎叶图可以携带较多信息,如数据的具体值以及数据的分布形状等。

3. 茎叶图的实际应用茎叶图在实际应用中有很多用途。

在生活中,我们可以用茎叶图来描述和比较不同蔬菜的价格、产品销量等信息。

在商业领域,茎叶图可用于分析客户消费行为、产品竞争力等。

在教育中,茎叶图可以用于展示学生的成绩分布,帮助教师了解班级学生的学习情况。

茎叶图还可以在医学、环境科学等领域中得到应用,帮助分析和解读大量数据。

4. 茎叶图的练习与应用在高考数学中,茎叶图经常出现在统计学或概率统计的题目中。

学生需要掌握茎叶图的构造和解读方法,能够灵活运用茎叶图进行数据分析。

为了提高解题能力,学生可以多做一些茎叶图的练习题。

同时,学生还可以结合实际问题,自行收集数据并制作茎叶图,提高数据分析和表达能力。

5. 拓展思考除了茎叶图,还有其他的统计图形可以用于数据的展示和分析。

茎叶图及其例题讲解

茎叶图及其例题讲解

茎叶图一.茎叶图1.茎叶图:茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。

2.茎叶图的特征(1)用茎叶图表示数据有两个优点:一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。

(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两组以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰。

当样本数据较多时,因为每一个数据都要在图中占据一个空间,用茎叶图很不方便。

3.制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出. 茎叶图对于分布在0~99的容量较小的数据比较合适,此时,茎叶图比直方图更详尽地表示原始数据的信息. 在茎叶图中,茎也可以放两位,后面位数多可以四舍五入后再制图.4.画茎叶图时的注意事项(1)将每个数据分为茎(高位)和叶(低位)两部分,当数据是两位整数时,茎为十位上的数字,叶为个位上的数字;当数据是由整数部分和小数部分组成时,可以把整数部分作为茎,小数部分作为叶。

(2)将茎上的数字按大小次序排成一列。

(3)为了方便分析数据,通常将各数据的叶按大小次序写在其茎右(左)侧。

(4)用茎叶图比较数据时,一般从数据分布的对称性、中位数,稳定性等方面来比较。

二.茎叶图中常用的几个量:众数.中位数.平均数(样本的数字特征) (1)众数:出现次数最多的数叫做众数.(2)中位数:如果将一组数据按大小顺序依次排列,把处在最中间位置的一个数据或中间两个数据的平均是叫做这组数据的中位数. (例:2、3、4、5、6、7 中位数:(4+5)/2= (例:1、2、3、6、7的中位数是3。

)(3)平均数与加权平均数:如果有n 个数,,,,n x x x x ⋯⋯321那么12nx x x x n++⋅⋅⋅+=叫做这n个数的平均数. 如果在n 个数中,1x 出现次1f 次, 2x 出现次2f 次,……,k x 出现次2f 次,(这里),n f f f k =+⋯⋯++21那么11221()k k x x f x f x f n=++⋅⋅⋅+叫做这n 个数的加权平均数,其中k f f f ⋯⋯,,21叫做权.(4)标准差与方差:设一组数据123nx x x x ⋯,,,,的平均数为x ,则nx x x x x x s s n 222212)()()(-++-+-== ,其中2s 表示方差,s 表示标准差. 例1 下面一组数据是某生产车间30名工人某日加工零件的个数,请设计适当的茎叶图表示这组数据,并由图出发说明一下这个车间此日的生产情况。

高中数学 第六章 第21课时《 茎叶图》教案(学生版) 苏教版必修3

高中数学 第六章 第21课时《 茎叶图》教案(学生版) 苏教版必修3

word第21课时茎叶图[学习导航]学习要求1.体会茎叶图的制作方法,一组数据中的的每个数,何为茎,何为叶?主要的数字为茎,次要的数字为叶,因此对于两位数而言,十位数字为茎,个位数字为叶,;2.要能够通过茎叶图,分析单组数据,以及比较两组数据的差异。

;[课堂互动]自学评价案例某篮球运动员在某赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50.如何分析该运动员的整体水平及发挥的稳定程度.[分析]初中统计部分曾学习过用平均数、众数和中位数反映总体的水平,用方差考察稳定程度.我们还有一种简易的方法,就是将这些数据有条理地列出来,从中观察数据的分布情况.这种方法就是画出该运动员得分的茎叶图.制作茎叶图的方法是:将所有两位数的十位数字作为“茎〞,个位数字作为“叶〞,茎相同者共用一个茎,茎按从小到大的顺序从上向以下出,共茎的叶一般按从大到小〔或从小到大〕的顺序同行列出.[解]茎叶图除了课本中示例外,还有其它的形式,常见如下四种形式:〔1〕〔2〕〔3〕〔4〕从茎叶图可以粗略地看出,该运动员平均得分及中位数、众数都在20到40之间,且分布较对称,集中程度高,说明其发挥比较稳定。

[小结]1.讨论分析,上面四种茎叶图中,哪些能更有益于观察数据?茎叶图有什么优点?又有什么缺陷?如,第一种茎叶图能很方便地从小到大来还原所有的原始数据;第二种茎叶图能让数据重心更倾向茎叶分界线;第三种和第四种在两组数据的比较中有作用.2.茎叶图的优点在于保持的情况下较为直观地反映数据分布特征,对两位数(或只有末两位不同的多位数)的数据表示很方便,缺点在于多位数的表示不太方便、直观.3.茎叶图可用于展示原始数据的分布,同时还保留原始数据在图形里面,相当直观.从茎叶图中,可直接看出数据是否对称、是否有极端值以及数据的趋势和趋势.4.茎叶图可以分析单组数据,也能对两组数据进行比较,,左侧的叶按顺序写,右侧的叶按顺序写,相同的得分要,。

(完整版)高三复习高中数学统计案例习题(有详细答案)

(完整版)高三复习高中数学统计案例习题(有详细答案)

2015年高三复习高中数学统计案例习题(有详细答案)一.选择题(共15小题)1.(2014?四川模拟)为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样2.(2014?湖北模拟)某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福广东的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次被抽取的总户数为()A. 2 0 B.24 C.30 D.363.(2014?湖南一模)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A. 5 ,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,324.(2014?锦州一模)为了研究一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出的样本频率分布直方图如图,那么在这片树木中底部周长大于100cm的株树大约中()A. 3 000 B.6000 C.7000 D.80005.(2014?许昌二模)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a}.已知a=2a,且样本容量为300,则小长方形面积最大的一组的频数为()12n A.1 00 B.120 C.150 D.2006.(2014?云南模拟)已知一组数据如图所示,则这组数据的中位数是()A. 2 7.5 B.28.5 C.27 D.287.(2014?青浦区三模)已知图1、图2分别表示A、B两城市某月1日至6日当天最低气温的数据折线图(其中横和,标准差分别为6s天的最低气温平均数分别为和两城市这、,记xn轴表示日期,纵轴表示气温)AB A s),则它们的大小关系是(B.A.B.C.D.<,<ss>,s<s >s <>,s>s ,s BAABBBAA)得到的散点图,由这些散点图可10,)x(8.2014?天门模拟)如图是根据变量x,y的观测数据(,y(i=12,…ii,以判断变量xy具有相关关系的图是()①④②③③④①②B. C .D.A.9.(2014?邯郸二模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程,利用下表中数据推断a的值为()零件数x(个)10 20 30 40 50加工时间y(min)62 a 75 81 89A. 6 8.2 B.68 C.69 D.6710.(2013?福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A. 5 88 B.480 C.450 D.12011.(2013?陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0 .09 B.0.20 C.0.25 D.0.4512.(2013?辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A. 4 5 B.50 C.55 D.6013.(2012?成都一模)某小区有125户高收入家庭、280户中等收入家庭、95户低收人家庭.现采用分层抽样的方法从中抽取100户,对这些家庭社会购买力的某项指标进行调查,则中等收入家庭中应抽选出的户数为()A.7 0 户B.17 户C.56 户D.25 户14.(2012?泸州一模)某校高三680名学生(其中男生360名、女生320名)在学术报告厅听了应考心理讲座,为了解有关情况,学校用分层抽样的方法抽取了一个样本,已知该样本中的女生人数为16名,那么该样本中的男生人数为()A. 1 5 B.16 C.17 D.1815.(2012?绵阳二模)要从60人中抽取6人进行身体健康检查,现釆用分层抽样方法进行抽取,若这60人中老年人和中年人分别是40人,20人,则老年人中被抽取到参加健康检查的人数是()A. 2 人B.3人C.4人D.5人二.解答题(共15小题)16.为了了解学生的身体发育情况,某校对年满16周岁的60名男生的身高进行测量,其结果如下:身高(m)1.57 1.59 1.60 1.62 1.63 1.64 1.65 1.66 1.68人数 2 1 4 2 3 4 2 7 6身高(m)1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77人数8 7 4 3 2 1 2 1 1(1)根据上表,估计这所学校,年满16周岁的男生中,身高不低于1.65m且不高于1.71m的约占多少?不低于1.63m的约占多少?(2)将测量数据分布6组,画出样本频率分布直方图;(3)根据图形说出该校年满16周岁的男生在哪一范围内的人数所占的比例最大?如果年满16周岁的男生有360人,那么在这个范围的人数估计约有多少人?17.改革开放以来,我国高等教育事业有了突飞猛进的发展,有人记录了某村2001到2005年五年间每年考入大学的人数,为了方便计算,2001年编号为1,2002年编号为2,…,2005年编号为5,数据如下:年份(x) 1 2 3 4 5人数(y) 3 5 8 11 13x+所表示的直线必经的点.x的回归方程=关于求y次,绘制成.甲、乙两位同学参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取418 茎叶图如图:乙甲7 9 75 3 58 1 2 8)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(Ⅰ)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.(Ⅱ月份用水量(单位:百吨)的一组数据:1﹣519.下表是某单位在2013年5 4 1 2 3 月份x1.82.5 4 3 用水量y 4.5,通过公式得”“预测可靠(Ⅰ)若由线性回归方程得到的预测数据与实际检验数据的误差不超过0.05,视为月份的用水量是否可靠?说明理由;个月的数据中所得到的线性回归方程预测5,那么由该单位前4 7(单位:百吨)的概率.个月的用水量之和小于个月中任取2个月的用水量,求所取2(Ⅱ)从这5,.参考公式:回归直线方程是:,将成绩按150分)20.某校高三数学竞赛初赛考试后,对考生的成绩进行统计(考生成绩均不低于90分,满分为,如图为其频率分布直方图的一部]150,第六组[140,)、第二组[100,110)…如下方式分成六组,第一组[90,100 人.分,若第四、五、六组的人数依次成等差数列,且第六组有4 )求第四和第五组频率,并补全频率分布直方图;(Ⅰ列联表(即填写空格处的22×140Ⅱ)若不低于120分的同学进入决赛,不低于分的同学为种子选手,完成下面(.进入决赛的同学成为种子选手与专家培训有关”数据),并判断是否有99%的把握认为“合计[140,150][120 ,140)8 8 参加培训未参加培训4 合计2 K=附:20.001 0.005 0.10 0.150.025 .25 00.05 0.010 K≥k)(P010.8282.0721.3232.7063.8415.0246.6357.879K021.为了了解某中学高二女生的身高情况,该校对高二女生的身高进行了一次随机抽样测量,所得数据整理后列出了频率分布表如下:(单位:cm)(1)表中m、n、M、N所表示的数分别是多少?(2)绘制频率分布直方图;(3)估计该校女生身高小于162.5cm的百分比.22.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].(1)求x值;(2)(理科)从成绩不低于80分的学生中随机的选取2人,该2人中成绩在90以上(含90分)的人数记为ξ,求ξ的概率分布列及数学期望Eξ.(文)从从成绩不低于80分的学生中随机的选取3人,该3人中至少有2人成绩在90以上(含90分)的概率.23.某网站针对2014年中国好声音歌手A,B,C三人进行网上投票,结果如下观众年龄支持A 支持B 支持C20岁以下200 400 80020岁以上(含20岁)100 100 400(1)在所有参与该活动的人中,用分层抽样的方法抽取n人,其中有6人支持A,求n的值.(2)在支持C的人中,用分层抽样的方法抽取6人作为一个总体,从这6人中任意选取2人,求恰有1人在20岁以下的概率.24.某校100名学生期中考试数学成绩的频率分布直方图如图,其中成绩分组区间如下:组号第一组第二组第三组第四组第五组分组[50,60)[60,70)[70,80)[80,90)[90,100](Ⅰ)求图中a的值;(Ⅱ)根据频率分布直方图,估计这100名学生期中考试数学成绩的平均分;(Ⅲ)现用分层抽样的方法从第3、4、5组中随机抽取6名学生,将该样本看成一个总体,从中随机抽取2名,求其中恰有1人的分数不低于90分的概率?25.从某实验中,得到一组样本容量为60的数据,分组情况如下:(Ⅰ)求出表中m,a的值;分组5~15 15~25 25~35 35~45频数 6 2l m频率 a 0.05(Ⅱ)估计这组数据的平均数.26.某校高三文科分为四个班.高三数学调研测试后,随机地在各班抽取部分学生进行测试成绩统计,各班被抽取的学生人数恰好成等差数列,人数最少的班被抽取了22人.抽取出来的所有学生的测试成绩统计结果的频率分布条形图如图所示,其中120~130(包括120分但不包括130分)的频率为0.05,此分数段的人数为5人.(1)问各班被抽取的学生人数各为多少人?(2)求平均成绩;(3)在抽取的所有学生中,任取一名学生,求分数不小于90分的概率.27.在参加世界杯足球赛的32支球队中,随机抽取20名队员,调查其年龄为25,21,23,25,27,29,25,28,30,29,26,24,25,27,26,22,24,25,26,28.(1)填写下面的频率分布表(2)并画出频率分布直方图.(3)据此估计全体队员在哪个年龄段的人数最多?占总数的百分之几?分组频数频率20.5~22.522.5~24.524.5~26.526.5~28.528.5~30.5合计28.如图是调查某地某公司1000名员工的月收入后制作的直方图.(1)求该公司员工的月平均收入及员工月收入的中位数;(2)在收入为1000至1500元和收入为3500至4000元的员工中用分层抽样的方法抽取一个容量15的样本,员工甲、乙的月收入分别为1200元、3800元,求甲乙同时被抽到的概率.29.某市为了解全市居民日常用水量的分布情况,现采用抽样调查的方式,获得了n位居民某年的月均用水量(单位:t),样本统计结果如图表:(Ⅰ)分别求出x,n,y的值;(Ⅱ)若从样本中月均用水量在[5,6]内的5位居民a,b,c,d,e中任选2人作进一步的调查研究,求居民a被选中的概率.分组频数频率[0,1)25 y[1,2)0.19[2,3)50 x[3,4)0.23[4,5)0.18[5,6] 530.为了分析某次考试数学成绩情况,用简单随机抽样从某班中抽取25名学生的成绩(百分制)作为样本,得到频率分布表如下:分数[50,60)[60,70)[70,80)[80,90)[90,100]频数 2 3 9 a 1频率0.08 0.12 0.36 b 0.04(Ⅰ)求样本频率分布表中a,b的值,并根据上述频率分布表,在下表中作出样本频率分布直方图;(Ⅱ)计算这25名学生的平均数及方差(同一组中的数据用该组区间的中点值作代表);(Ⅲ)从成绩在[50,70)的学生中任选2人,求至少有1人的成绩在[60,70)中的概率.参考答案与试题解析一.选择题(共15小题)1.(2014?四川模拟)为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样考点:分层抽样方法.专题:阅读型.分析:若总体由差异明显的几部分组成时,经常采用分层抽样的方法进行抽样解答:解:我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,而事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.了解某地区中小学生的视力情况,按学段分层抽样,这种方式具有代表性,比较合理.故选C.点评:本小题考查抽样方法,主要考查抽样方法,属基本题.2.(2014?湖北模拟)某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福广东的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次被抽取的总户数为()A. 2 0 B.24 C.30 D.36考点:分层抽样方法.专题:计算题.分析:根据社区里的高收入家庭户和高收入家庭户要抽取的户数,得到每个个体被抽到的概率,用求到的概率乘以低收入家庭户的户数,得到结果.解答:解:∵区现有480个住户,高收入家庭120户,抽取了6户∴每个个体被抽到的概率是=24,∴该社区本次被抽取的总户数为故选B.点评:本题考查分层抽样方法,这种题目类型是高考题目中一定会出现的题目,运算量不大,是一个必得分题目.3.(2014?湖南一模)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A. 5 ,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,32考点:系统抽样方法.专题:计算题.分析:由系统抽样的特点知,将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,这时间隔一般为总体的个数除以样本容量.从所给的四个选项中可以看出间隔相等且组距为10的一组数据是由系统抽样得到的.解答:解:从50枚某型导弹中随机抽取5枚,采用系统抽样间隔应为=10,只有B答案中导弹的编号间隔为10,故选B.点评:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本.4.(2014?锦州一模)为了研究一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出的样本频率分布直方图如图,那么在这片树木中底部周长大于100cm的株树大约中()A. 3 000 B.6000 C.7000 D.8000考点:频率分布直方图.专题:概率与统计.分析:在频率分布表中,频数的和等于样本容量,频率的和等于1,每一小组的频率等于这一组的频数除以样本容量.频率分布直方图中,小矩形的面积等于这一组的频率.底部周长小于100cm的矩形的面积求和乘以样本容量即可.解答:解:由图可知:底部周长小于100cm段的频率为(0.01+0.02)×10=0.3,则底部周长大于100cm的段的频率为1﹣0.3=0.7那么在这片树木中底部周长大于100cm的株树大约10000×0.7=7000人.故选C.点评:本小题主要考查样本的频率分布直方图的知识和分析问题以及解决问题的能力.统计初步在近两年高考中每年都以小题的形式出现,基本上是低起点题.5.(2014?许昌二模)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a}.已知a=2a,且样本容量为300,则小长方形面积最大的一组的频数为()1n2A.1 00 B.120 C.150 D.200考点:频率分布直方图.专题:概率与统计.分析:根据直方图中的各个矩形的面积代表了频率,各个矩形面积之和为1,求出小长方形面积最大的一组的频率,再根据频数=频率×样本容量,求出频数即可.解答:解:∵直方图中的各个矩形的面积代表了频率,这5个小方形的面积由小到大构成等差数列{a},a=2a,1n2∴d=a,a=3a,a=4a,a=5a 1531141根据各个矩形面积之和为1,则a+a+a+a+a=15a=1 114253∴a=,小长方形面积最大的一组的频率为a=5×= 51根据频率=可求出频数=300×=100故选:A.点评:本题考查了频率、频数的应用问题,各小组频数之和等于样本容量,各小组频率之和等于1.6.(2014?云南模拟)已知一组数据如图所示,则这组数据的中位数是()A. 2 7.5 B.28.5 C.27 D.28考点:众数、中位数、平均数.专题:概率与统计.分析:利用中位数的定义即可得出.解答:36,40的中位数是=27.5.,30,32,3016,17,19,22,25,27,28,解:这组数据为故选:A.点评:本题考查了中位数的定义及其计算方法,属于基础题.7.(2014?青浦区三模)已知图1、图2分别表示A、B两城市某月1日至6日当天最低气温的数据折线图(其中横6天的最低气温平均数分别为和,标准差分别为B两城市这s和A轴n表示日期,纵轴x表示气温),记、A),则它们的大小关系是(s BA.B.C.D.<,ss >,s<s >s ,<s>>,ss <BBBAAABA考点:众数、中位数、平均数.专题:概率与统计.分析:本题可以由折线图上的数据做出两个城市的平均气温和方差,也可以根据两个折线图的高低和变化的趋势即波动的大小,得到结果.解答:解:由折线图可知A市的平均气温是,B市的平均气温是=11.7,由折线图也可以看出B市的气温较高,可以看出B市的气温的变化不大,方差较小;故选D.点评:本题考查了折线图以及平均数和方差的求法;求两组数据的平均值和方差是研究数据常做的两件事,平均值反映数据的平均水平,而方差反映数据的波动大小,从两个方面可以准确的把握数据的情况.8.(2014?天门模拟)如图是根据变量x,y的观测数据(x,y)(i=1,2,…10)得到的散点图,由这些散点图可ii以判断变量x,y具有相关关系的图是()①④②③③④①②B.C.A. D .考点:散点图.专题:计算题.分析:通过观察散点图可以知道,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,u随v的增大而增大,各点整体呈上升趋势,u与v正相关.解答:解:由题图③可知,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,由题图④可知,u随v的增大而增大,各点整体呈上升趋势,u与v正相关.故选D.点评:本题考查散点图,是通过读图来解决问题,考查读图能力,粗略的反应两个变量之间的关系,是不是线性相关,是正相关还是负相关.9.(2014?邯郸二模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程,利用下表中数据推断a的值为()40 50 10 20 30 零件数x(个)8981 加工时间y(min)62 a 75C.69D.68.2 A.6 B.68 7线性回归方程.:考点计算题;概率与统计.专题:分析:可得68.2,故可能值为68.由题意,将20代入解答:解:由题意,y=0.68×20+54.6=68.2,又由表可知加工时间y(min)都是以整数记,故a可能为68,故选B.点评:本题考查了线性回归方程的应用及数学问题与实际问题的转化,属于基础题.10.(2013?福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A. 5 88 B.480 C.450 D.120:考点频率分布直方图.专题:图表型.分析:根据频率分布直方图,成绩不低于60分的频率,然后根据频数=频率×总数可求出所求.解答:解:根据频率分布直方图,成绩不低于60(分)的频率为1﹣10×(0.005+0.015)=0.8.由于该校高一年级共有学生600人,利用样本估计总体的思想,可估计该校高一年级模块测试成绩不低于60(分)的人数为600×0.8=480人.故选B.点评:本小题主要考查频率、频数、统计和概率等知识,考查数形结合、化归与转化的数学思想方法,以及运算求解能力.11.(2013?陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0 .09 B.0.20 C.0.25 D.0.45考点:频率分布直方图.分析:在频率分布表中,频数的和等于样本容量,频率的和等于1,小矩形的面积等于这一组的频率,则所以面积和为1,建立等量关系即可求得长度在[25,30)内的频率即得.解答:解:设长度在[25,30)内的频率为a,根据频率分布直方图得:a+5×0.02+5×0.06+5×0.03=1?a=0.45.则根据频率分布直方图估计从该批产品中随机抽取一件,则其为二等品的概率为0.45.故选D.点评:本小题主要考查样本的频率分布直方图的知识和分析问题以及解决问题的能力.统计初步在近两年高考中每年都以小题的形式出现,基本上是低起点题.12.(2013?辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A. 4 5 B.50 C.55 D.60考点:频率分布直方图.:专题概率与统计.分析:由已知中的频率分布直方图,我们可以求出成绩低于60分的频率,结合已知中的低于60分的人数是15人,结合频数=频率×总体容量,即可得到总体容量.解答:解:∵成绩低于60分有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20则成绩低于60分的频率P=(0.005+0.010)×20=0.3,又∵低于60分的人数是15人,则该班的学生人数是=50.故选B.点评:本题考查的知识点是频率分布直方图,结合已知中的频率分布直方图,结合频率=矩形的高×组距,求出满足条件的事件发生的频率是解答本题的关键.13.(2012?成都一模)某小区有125户高收入家庭、280户中等收入家庭、95户低收人家庭.现采用分层抽样的方法从中抽取100户,对这些家庭社会购买力的某项指标进行调查,则中等收入家庭中应抽选出的户数为()A.7 0 户B.17 户C.56 户D.25 户考点:分层抽样方法.专题:概率与统计.分析:由分层抽样的计算方法:中等收入家庭的户数占总户数的比例再乘以要抽取的户数,即可得出答案.解答:解:由已知可得中等收入家庭中应抽选出的户数==56.故选C.点评:本题考查了分层抽样,掌握分层抽样的计算方法是解决问题的关键.14.(2012?泸州一模)某校高三680名学生(其中男生360名、女生320名)在学术报告厅听了应考心理讲座,为了解有关情况,学校用分层抽样的方法抽取了一个样本,已知该样本中的女生人数为16名,那么该样本中的男生人数为()A. 1 5 B.16 C.17 D.18考点:分层抽样方法.专题:计算题.分析:设该样本中的男生人数为x,则由分层抽样的定义和方法可得=,由此解得x 的值.解答:解:设该样本中的男生人数为x,则由分层抽样的定义和方法可得=,解得x=18,故选D.点评:本题主要考查分层抽样的定义和方法,利用了总体中各层的个体数之比等于样本中对应各层的样本数之比,属于基础题.15.(2012?绵阳二模)要从60人中抽取6人进行身体健康检查,现釆用分层抽样方法进行抽取,若这60人中老年人和中年人分别是40人,20人,则老年人中被抽取到参加健康检查的人数是()A. 2 人B.3人C.4人D.5人考点:分层抽样方法.专题:计算题.分析:先求出每个个体被抽到的概率,用该层的个体数乘以每个个体被抽到的概率,就等于该层应抽取的个体数.解答:解:每个个体被抽到的概率等于=,老年人中被抽取到参加健康检查的人数是40×=4,故选C.点评:本题主要考查分层抽样的定义和方法,用每层的个体数乘以每个个体被抽到的概率等于该层应抽取的个体数,属于基础题.二.解答题(共15小题)16.为了了解学生的身体发育情况,某校对年满16周岁的60名男生的身高进行测量,其结果如下:身高(m)1.57 1.59 1.60 1.62 1.63 1.64 1.65 1.66 1.68人数 2 1 4 2 3 4 2 7 6身高(m)1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77人数8 7 4 3 2 1 2 1 1(1)根据上表,估计这所学校,年满16周岁的男生中,身高不低于1.65m且不高于1.71m的约占多少?不低于1.63m的约占多少?(2)将测量数据分布6组,画出样本频率分布直方图;(3)根据图形说出该校年满16周岁的男生在哪一范围内的人数所占的比例最大?如果年满16周岁的男生有360人,那么在这个范围的人数估计约有多少人?考点:频率分布直方图;频率分布表.专题:概率与统计.分析:(1)根据上表求出身高不低于1.65m且不高于1.71m的频率与不低于1.63m的频率;(2)将测量数据分组,求频数与频率,列出频率分布表,画出频率分布直方图;(3)根据图形得出正确的结论以及估计结果.解答:解:(1)根据上表得,身高不低于1.65m且不高于1.71m的频率是,=≈0.567 ;约占总体的56.7%∴0.15=0.85,﹣的频率是1﹣=1不低于1.63m 85%;约占总体的0.04组,∴∴,组距是,=0.0336(2)将测量数据分布计算频数与频率,列出频率分布表,如下;分组频数频率0.11 ﹣160.5 7 156.50.15 ﹣160.5164.5 90.25 ﹣164.5168.5 150.37 ﹣168.5172.5 220.10 6 ﹣172.5176.50.02 1 ﹣176.5180.51.00合计60画出样本频率分布直方图,如图所示;(3)根据图形知,该校年满16周岁的男生在168.5﹣172.5内的人数所占的比例最大,如果年满16周岁的男生有360人,那么在这个范围的人数估计约为360×0.37=133人.点评:本题考查了频率分布直方图的应用问题,也考查了列表和画图的能力,解题时应根据图中数据进行有关的计算,是基础题.17.改革开放以来,我国高等教育事业有了突飞猛进的发展,有人记录了某村2001到2005年五年间每年考入大学的人数,为了方便计算,2001年编号为1,2002年编号为2,…,2005年编号为5,数据如下:年份(x) 1 2 3 4 5人数(y) 3 5 8 11 13的回归方程=x+关于x所表示的直线必经的点.求y考点:回归分析的初步应用.专题:计算题;概率与统计.分析:求平均值,回归直线必过样本点的中心.解答:解:==3,。

茎叶图及其例题讲解

茎叶图及其例题讲解

茎叶图一.茎叶图1.茎叶图:茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。

2.茎叶图的特征(1)用茎叶图表示数据有两个优点:一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。

(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两组以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰。

当样本数据较多时,因为每一个数据都要在图中占据一个空间,用茎叶图很不方便。

3.制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.茎叶图对于分布在0~99的容量较小的数据比较合适,此时,茎叶图比直方图更详尽地表示原始数据的信息. 在茎叶图中,茎也可以放两位,后面位数多可以四舍五入后再制图.4.画茎叶图时的注意事项(1)将每个数据分为茎(高位)和叶(低位)两部分,当数据是两位整数时,茎为十位上的数字,叶为个位上的数字;当数据是由整数部分和小数部分组成时,可以把整数部分作为茎,小数部分作为叶。

(2)将茎上的数字按大小次序排成一列。

(3)为了方便分析数据,通常将各数据的叶按大小次序写在其茎右(左)侧。

(4)用茎叶图比较数据时,一般从数据分布的对称性、中位数,稳定性等方面来比较。

二.茎叶图中常用的几个量:众数.中位数.平均数(样本的数字特征) (1)众数:出现次数最多的数叫做众数.(2)中位数:如果将一组数据按大小顺序依次排列,把处在最中间位置的一个数据或中间两个数据的平均是叫做这组数据的中位数. (例:2、3、4、5、6、7 中位数:(4+5)/2= (例:1、2、3、6、7的中位数是3。

)(3)平均数与加权平均数:如果有n 个数,,,,n x x x x ⋯⋯321那么12nx x x x n++⋅⋅⋅+=叫做这n个数的平均数. 如果在n 个数中,1x 出现次1f 次, 2x 出现次2f 次,……,k x 出现次2f 次,(这里),n f f f k =+⋯⋯++21那么11221()k k x x f x f x f n =++⋅⋅⋅+叫做这n 个数的加权平均数,其中k f f f ⋯⋯,,21叫做权.(4)标准差与方差:设一组数据123nx x x x ⋯,,,,的平均数为x ,则nx x x x x x s s n 222212)()()(-++-+-==Λ,其中2s 表示方差,s 表示标准差. 例1 下面一组数据是某生产车间30名工人某日加工零件的个数,请设计适当的茎叶图表示这组数据,并由图出发说明一下这个车间此日的生产情况。

统计.板块三.茎叶图.教师版 普通高中数学复习讲义Word版

统计.板块三.茎叶图.教师版 普通高中数学复习讲义Word版

一.随机抽样1.随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法:⑴简单随机抽样:从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. 抽出办法:①抽签法:用纸片或小球分别标号后抽签的方法.②随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表.表中每一位置出现各个数字的可能性相同. 随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法.简单随机抽样是最简单、最基本的抽样方法.⑵系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.抽出办法:从元素个数为N 的总体中抽取容量为n 的样本,如果总体容量能被样本容量整除,设Nk n=,先对总体进行编号,号码从1到N ,再从数字1到k 中随机抽取一个数s 作为起始数,然后顺次抽取第2(1)s k s k s n k +++-,,,个数,这样就得到容量为n 的样本.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样.系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样.⑶分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样.分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛.2.简单随机抽样必须具备下列特点:⑴简单随机抽样要求被抽取的样本的总体个数N 是有限的. ⑵简单随机样本数n 小于等于样本总体的个数N . ⑶简单随机样本是从总体中逐个抽取的. ⑷简单随机抽样是一种不放回的抽样.⑸简单随机抽样的每个个体入样的可能性均为nN.3.系统抽样时,当总体个数N 恰好是样本容量n 的整数倍时,取Nk n=;若Nn不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量n 整除.因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍知识内容板块三.茎叶图然相等,为N n.二.频率直方图列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:取组距,用极差组距决定组数;③决定分点:决定起点,进行分组;④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图,知小长方形的面积=组距×频率组距=频率.频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x =来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.三.茎叶图制作茎叶图的步骤:①将数据分为“茎”、“叶”两部分;②将最大茎与最小茎之间的数字按大小顺序排成一列,并画上竖线作为分隔线; ③将各个数据的“叶”在分界线的一侧对应茎处同行列出.四.统计数据的数字特征用样本平均数估计总体平均数;用样本标准差估计总体标准差. 数据的离散程序可以用极差、方差或标准差来描述.极差又叫全距,是一组数据的最大值和最小值之差,反映一组数据的变动幅度; 样本方差描述了一组数据平均数波动的大小,样本的标准差是方差的算术平方根. 一般地,设样本的元素为12n x x x ,,,样本的平均数为x , 定义样本方差为222212()()()n x x x x x x s n-+-++-=,样本标准差s =简化公式:22222121[()]n s x x x nx n=+++-.五.独立性检验1.两个变量之间的关系;常见的有两类:一类是确定性的函数关系;另一类是变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的.当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.2.散点图:将样本中的n 个数据点()(12)i i x y i n =,,,,描在平面直角坐标系中,就得到了散点图.散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系.3.如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域.反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.此时,散点图中的点在从左上角到右下角的区域.散点图可以判断两个变量之间有没有相关关系.4.统计假设:如果事件A 与B 独立,这时应该有()()()P AB P A P B =,用字母0H 表示此式,即0:()()()H P AB P A P B =,称之为统计假设. 5.2χ(读作“卡方”)统计量:统计学中有一个非常有用的统计量,它的表达式为22112212211212()n n n n n n n n n χ++++-=,用它的大小可以用来决定是否拒绝原来的统计假设0H .如果2χ的值较大,就拒绝0H ,即认为A 与B 是有关的.2χ统计量的两个临界值:3.841、6.635;当2 3.841χ>时,有95%的把握说事件A 与B 有关;当2 6.635χ>时,有99%的把握说事件A 与B 有关;当2 3.841χ≤时,认为事件A 与B 是无关的.独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立的. 1.独立性检验的步骤:统计假设:0H ;列出22⨯联表;计算2χ统计量;查对临界值表,作出判断.2.几个临界值:222()0.10( 3.841)0.05( 6.635)0.01P P P χχχ≈≈≈≥2.706,≥,≥.22⨯联表的独立性检验:如果对于某个群体有两种状态,对于每种状态又有两个情况,这样排成一张22⨯的表,如下:如果有调查得来的四个数据11122122n 4个数据来检验上述的两种状态A 与B 是否有关,就称之为22⨯联表的独立性检验.六.回归分析1.回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性. 回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.最小二乘法:记回归直线方程为:ˆy a bx =+,称为变量Y 对变量x 的回归直线方程,其中a b ,叫做回归系数.ˆy是为了区分Y 的实际值y ,当x 取值i x 时,变量Y 的相应观察值为i y ,而直线上对应于i x 的纵坐标是ˆi i ya bx =+. 设x Y ,的一组观察值为()i i x y ,,12i n =,,,,且回归直线方程为ˆya bx =+, 当x 取值i x 时,Y 的相应观察值为i y ,差ˆ(12)i i y yi n -=,,,刻画了实际观察值i y 与回归直线上相应点的纵坐标之间的偏离程度,称这些值为离差.我们希望这n 个离差构成的总离差越小越好,这样才能使所找的直线很贴近已知点. 记21()ni i i Q y a bx ==--∑,回归直线就是所有直线中Q 取最小值的那条.这种使“离差平方和为最小”的方法,叫做最小二乘法.用最小二乘法求回归系数a b ,有如下的公式:1221ˆni ii nii x ynxy bxnx ==-=-∑∑,ˆˆa y bx =-,其中a b ,上方加“^”,表示是由观察值按最小二乘法求得的回归系数.3.线性回归模型:将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型. 产生随机误差的主要原因有:①所用的确定性函数不恰当即模型近似引起的误差; ②忽略了某些因素的影响,通常这些影响都比较小; ③由于测量工具等原因,存在观测误差. 4.线性回归系数的最佳估计值:利用最小二乘法可以得到ˆˆab ,的计算公式为 1122211()()()()nnii iii i nniii i xx y y x ynxyb xx xn x ====---==--∑∑∑∑,ˆˆa y bx =-,其中11n i i x x n ==∑,11nii y y n ==∑ 由此得到的直线ˆˆya bx =+就称为回归直线,此直线方程即为线性回归方程.其中ˆa ,b 分别为a ,b 的估计值,ˆa称为回归截距,b 称为回归系数,ˆy 称为回归值. 5.相关系数:()()nnii i ixx y y x ynx yr ---==∑∑6.相关系数r 的性质: ⑴||1r ≤;⑵||r 越接近于1,x y ,的线性相关程度越强; ⑶||r 越接近于0,x y ,的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. 7.转化思想:根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数. 8.一些备案 ①回归(regression )一词的来历:“回归”这个词英国统计学家Francils Galton 提出来的.1889年,他在研究祖先与后代的身高之间的关系时发现,身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们父母的平均身高高.Galton 把这种后代的身高向中间值靠近的趋势称为“回归现象”.后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析.②回归系数的推导过程:22222[()]222i i i i i i i i Q y a bx y a y na b x y ab x b x =--=-+-++∑∑∑∑∑∑ 22222()2i i i i i i na a b x y b x b x y y =+-+-+∑∑∑∑∑,把上式看成a 的二次函数,2a 的系数0n >,因此当2()2i i i ib x y y b x a n n --=-=∑∑∑∑时取最小值. 同理,把Q 的展开式按b 的降幂排列,看成b 的二次函数,当2i iiix y a xb x-=∑∑∑时取最小值.解得:12221()()()ni iii i niii x ynxyx x y y b x x xnx==---==--∑∑∑∑,a y bx =-, 其中1i y y n =∑,1i x x n=∑是样本平均数. 9. 对相关系数r 进行相关性检验的步骤: ①提出统计假设0H :变量x y ,不具有线性相关关系;②如果以95%的把握作出推断,那么可以根据10.950.05-=与2n -(n 是样本容量)在相关性检验的临界值表中查出一个r 的临界值0.05r (其中10.950.05-=称为检验水平); ③计算样本相关系数r ;④作出统计推断:若0.05||r r >,则否定0H ,表明有95%的把握认为变量y 与x 之间具有线性相关关系;若0.05||r r ≤,则没有理由拒绝0H ,即就目前数据而言,没有充分理由认为变量y 与x 之间具有线性相关关系. 说明:⑴对相关系数r 进行显著性检验,一般取检验水平0.05α=,即可靠程度为95%.⑵这里的r 指的是线性相关系数,r 的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系.⑶这里的r 是对抽样数据而言的.有时即使||1r =,两者也不一定是线性相关的.故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释.题型一 茎叶图【例1】 甲、乙两名运动员的5次测试成绩如下图所示7乙甲63926886877设12,s s 分别表示甲、乙两名运动员测试成绩的标准差,12,x x 分别表示甲、乙两名运动员测试成绩的平均数,则有( )A .12x x =,12s s <B .12x x =,12s s >C .12x x >,12s s >D .12x x =,12s s =【考点】茎叶图 【难度】2星 【题型】选择题典例分析【关键词】2010年,北京丰台2模【解析】∵18787989692925x ++++==,28688939697925x ++++== ∴12x x =;∵22222155642s =++++106=,22222264145s =++++94= ∴12s s > 【答案】B ;【例2】 随机抽取某中学甲,乙两班各10名同学,测量他们的身高(单位:cm ),获得身高数据的茎叶图如图 ,则下列关于甲,乙两班这10名同学身高的结论正确的是 ( )A . 甲班同学身高的方差较大B . 甲班同学身高的平均值较大C . 甲班同学身高的中位数较大D . 甲班同学身高在175以上的人数较多【考点】茎叶图 【难度】2星 【题型】选择【关键词】2010年,北京宣武2模【解析】容易计算得知,甲班乙班平均值相同为170,故而B 错误;从茎叶图可以看出,乙班同学身高分布较甲班更为集中于均值附近,故而甲班同学身高方差大于乙班.甲班同学身高的中位数为169,乙班同学身高的中位数为171.5.故而C 错误.甲班同学身高175以上的有3人,乙班有4人,故而D 错误.【答案】A ;【例3】 甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为 和 .4女甲903222111110098754321【考点】茎叶图 【难度】1星 【题型】填空【关键词】2010年,天津高考 【解析】略 【答案】24,23;【例4】 右图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,571267847945368553乙甲4321则甲、乙两人这几场比赛得分的中位数之和是( ) A .62 B .63 C .64 D .65【考点】茎叶图 【难度】2星 【题型】选择 【关键词】无 【解析】283664+=【答案】C ;【例5】 在某五场篮球比赛中,甲、乙两名运动员得分的茎叶图如右.下列说法正确的是2340210891乙甲3210A .在这五场比赛中,甲的平均得分比乙好,且甲比乙稳定B .在这五场比赛中,甲的平均得分比乙好,但乙比甲稳定C .在这五场比赛中,乙的平均得分比甲好,且乙比甲稳定D .在这五场比赛中,乙的平均得分比甲好,但甲比乙稳定【考点】茎叶图 【难度】2星【题型】选择 【关键词】无 【解析】略【答案】C ;【例6】 某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示,记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清.若记分员计算无误,则数字x 应该是 .【考点】茎叶图 【难度】3星 【题型】填空【关键词】2009年,福建高考【解析】由茎叶图可知所有评分为:88898992939929194x ,,,,,,,,,若4x >,去掉9x ,易知剩下的数的平均数大于91;故94为最高分,去掉88与94后,有89899293909291791x +++++++=⨯,解得1x =.【答案】1;【例7】 在一次数学统考后,某班随机抽取10名同学的成绩进行样本分析,获得成绩数据的茎叶图如下.⑴计算样本的平均成绩及方差;⑵在这10个样本中,现从不低于84分的成绩中随机抽取2个,求93分的成绩被抽中的概率.435468736789【考点】茎叶图 【难度】3星 【题型】解答【关键词】2010年,东城一模 【解析】略【答案】⑴样本的平均成绩80x =.样本方差为22222221[(9380)(9780)(9880)(8680)(8480)(7580)10s =-+-+-+-+-+-2222(7380)(7480)(6080)(6080)]174.4+-+-+-+-=,⑵设A 表示随机事件“93分的成绩被抽中”,从不低于84分的成绩中随机抽取2个的样本总数是:(98,84),(98,86),(98,93),(98,97),(97,84),(97,86),(97,93),(93,84),(93,86),(86,84)共10种.而事件A 含有4个基本事件:(98,93),(97,93),(93,84),(93,86).所以所求概率为42105P ==.【例8】 某班甲、乙两学生的高考备考成绩如下:甲:512554528549536556534541522538 乙:515558521543532559536548527531 ⑴用茎叶图表示两学生的成绩;⑵分别求两学生成绩的中位数和平均分. 【考点】茎叶图 【难度】2星 【题型】解答 【关键词】无 【解析】略【答案】⑴两学生成绩绩的茎叶图如右所示8964553819261846172852乙甲54535251⑵将甲、乙两学生的成绩从小到大排列为: 甲:512522528534536538541549554556, 乙:515521527531532536543548558559.从以上排列可知甲学生成绩的中位数为5365385372+=,乙学生成绩的中位数为5325365342+=. 甲学生成绩的平均数为:1222283436384149545650053710++++++++++=,乙学生成绩的平均数为:1521273132364348585950053710++++++++++=.【例9】 某电脑杂志的一篇文章中,每个句子的字数如下:10283117232718152624201936271425152211242717,,,,,,,,,,,,,,,,,,,,,,某报纸的一篇文章中,每个句子所含的字数如下: 27393324281932413327351236412713222318463222,,,,,,,,,,,,,,,,,,,,,.⑴将两组数据用茎叶图表示; ⑵比较分析,能得到什么结论? 【考点】茎叶图 【难度】2星 【题型】解答 【关键词】无 【解析】略【答案】⑴茎叶图如右.11622335696122347778877765443202389987755410报纸文章电脑杂志4321⑵电脑杂志上每个句子的字数集中在10~30之间,中位数为23;而报纸上每个句子的字数集中在20~40之间,中位数为28.电脑杂志上每个句子的平均字数比报纸上的平均字数要少.说明电脑杂志作为科普读物需要简明.【例10】 随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm ),获得身高数据的茎叶图如图.乙班甲班988653920198893182021*******⑴根据茎叶图判断哪个班的平均身高较高;⑵计算甲班的样本方差.⑶现从乙班这10名同学中随机抽取两名身高不低于173cm 的同学,求身高为176cm 的同学被抽中的概率.【考点】茎叶图【难度】3星【题型】解答【关键词】2009年,广东高考【解析】略【答案】⑴由茎叶图可知:甲班身高集中于160~179之间,而乙班身高集中于170~180之间. 因此乙班平均身高高于甲班; ⑵15816216316816817017117917918217010x +++++++++==. 甲班的样本方差为()()()()222221[(158170)16217016317016817016817010-+-+-+-+-()()()()()22222170170171170179170179170182170]57.2+-+-+-+-+-=.⑶设身高为176cm 的同学被抽中的事件为A ;从乙班10名同学中抽中两名身高不低于173cm 的同学有:()181173,()181176, ()181178,()181179,()179173,()179176,()179178,()178173,()178176,()176173,共10个基本事件,而事件A 含有4个基本事件; ∴()42105P A ==.。

茎叶图及其例题讲解

茎叶图及其例题讲解

茎叶图一.茎叶图1.茎叶图:茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。

2.茎叶图的特征(1)用茎叶图表示数据有两个优点:一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。

(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两组以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰。

当样本数据较多时,因为每一个数据都要在图中占据一个空间,用茎叶图很不方便。

3.制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.茎叶图对于分布在0~99的容量较小的数据比较合适,此时,茎叶图比直方图更详尽地表示原始数据的信息. 在茎叶图中,茎也可以放两位,后面位数多可以四舍五入后再制图.4.画茎叶图时的注意事项(1)将每个数据分为茎(高位)和叶(低位)两部分,当数据是两位整数时,茎为十位上的数字,叶为个位上的数字;当数据是由整数部分和小数部分组成时,可以把整数部分作为茎,小数部分作为叶。

(2)将茎上的数字按大小次序排成一列。

(3)为了方便分析数据,通常将各数据的叶按大小次序写在其茎右(左)侧。

(4)用茎叶图比较数据时,一般从数据分布的对称性、中位数,稳定性等方面来比较。

二.茎叶图中常用的几个量:众数.中位数.平均数(样本的数字特征) (1)众数:出现次数最多的数叫做众数.(2)中位数:如果将一组数据按大小顺序依次排列,把处在最中间位置的一个数据或中间两个数据的平均是叫做这组数据的中位数. (例:2、3、4、5、6、7 中位数:(4+5)/2= (例:1、2、3、6、7的中位数是3。

)(3)平均数与加权平均数:如果有n 个数,,,,n x x x x ⋯⋯321那么12nx x x x n++⋅⋅⋅+=叫做这n个数的平均数. 如果在n 个数中,1x 出现次1f 次, 2x 出现次2f 次,……,k x 出现次2f 次,(这里),n f f f k =+⋯⋯++21那么11221()k k x x f x f x f n =++⋅⋅⋅+叫做这n 个数的加权平均数,其中k f f f ⋯⋯,,21叫做权.(4)标准差与方差:设一组数据123nx x x x ⋯,,,,的平均数为x ,则nx x x x x x s s n 222212)()()(-++-+-==Λ,其中2s 表示方差,s 表示标准差. 例1 下面一组数据是某生产车间30名工人某日加工零件的个数,请设计适当的茎叶图表示这组数据,并由图出发说明一下这个车间此日的生产情况。

统计.板块三.茎叶图.学生版

统计.板块三.茎叶图.学生版

一.随机抽样1.随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法:⑴简单随机抽样:从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. 抽出办法:①抽签法:用纸片或小球分别标号后抽签的方法.②随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表.表中每一位置出现各个数字的可能性相同.随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法. 简单随机抽样是最简单、最基本的抽样方法.⑵系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.抽出办法:从元素个数为N 的总体中抽取容量为n 的样本,如果总体容量能被样本容量整除,设Nk n=,先对总体进行编号,号码从1到N ,再从数字1到k 中随机抽取一个数s 作为起始数,然后顺次抽取第2(1)s k s k s n k +++-L ,,,个数,这样就得到容量为n 的样本.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样.系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样.⑶分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样.分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛. 2.简单随机抽样必须具备下列特点:⑴简单随机抽样要求被抽取的样本的总体个数N 是有限的. ⑵简单随机样本数n 小于等于样本总体的个数N . ⑶简单随机样本是从总体中逐个抽取的. ⑷简单随机抽样是一种不放回的抽样.⑸简单随机抽样的每个个体入样的可能性均为nN.3.系统抽样时,当总体个数N 恰好是样本容量n 的整数倍时,取Nk n=;若Nn不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量n 整除.因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍然相等,为Nn.二.频率直方图列出样本数据的频率分布表和频率分布直方图的步骤: ①计算极差:找出数据的最大值与最小值,计算它们的差;知识内容板块三.茎叶图②决定组距与组数:取组距,用极差组距决定组数; ③决定分点:决定起点,进行分组;④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图,知小长方形的面积=组距×频率组距=频率.频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x =来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.三.茎叶图制作茎叶图的步骤:①将数据分为“茎”、“叶”两部分;②将最大茎与最小茎之间的数字按大小顺序排成一列,并画上竖线作为分隔线; ③将各个数据的“叶”在分界线的一侧对应茎处同行列出.四.统计数据的数字特征用样本平均数估计总体平均数;用样本标准差估计总体标准差. 数据的离散程序可以用极差、方差或标准差来描述.极差又叫全距,是一组数据的最大值和最小值之差,反映一组数据的变动幅度; 样本方差描述了一组数据平均数波动的大小,样本的标准差是方差的算术平方根. 一般地,设样本的元素为12n x x x L ,,,样本的平均数为x , 定义样本方差为222212()()()n x x x x x x s n-+-++-=L ,样本标准差s =简化公式:22222121[()]n s x x x nx n=+++-L .五.独立性检验1.两个变量之间的关系;常见的有两类:一类是确定性的函数关系;另一类是变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的.当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.2.散点图:将样本中的n 个数据点()(12)i i x y i n =L ,,,,描在平面直角坐标系中,就得到了散点图. 散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系. 3.如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域.反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.此时,散点图中的点在从左上角到右下角的区域.散点图可以判断两个变量之间有没有相关关系.4.统计假设:如果事件A 与B 独立,这时应该有()()()P AB P A P B =,用字母0H 表示此式,即0:()()()H P AB P A P B =,称之为统计假设.5.2χ(读作“卡方”)统计量:统计学中有一个非常有用的统计量,它的表达式为22112212211212()n n n n n n n n n χ++++-=,用它的大小可以用来决定是否拒绝原来的统计假设0H .如果2χ的值较大,就拒绝0H ,即认为A 与B 是有关的.2χ统计量的两个临界值:3.841、6.635;当2 3.841χ>时,有95%的把握说事件A 与B 有关;当2 6.635χ>时,有99%的把握说事件A 与B 有关;当2 3.841χ≤时,认为事件A 与B 是无关的.独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立的.1.独立性检验的步骤:统计假设:0H ;列出22⨯联表;计算2χ统计量;查对临界值表,作出判断. 2.几个临界值:222()0.10( 3.841)0.05( 6.635)0.01P P P χχχ≈≈≈≥2.706,≥,≥.22⨯联表的独立性检验:如果对于某个群体有两种状态,对于每种状态又有两个情况,这样排成一张22⨯的表,如下:状态B 状态B 合计 状态A 11n 12n 1n + 状态A21n 22n 2n +1n +2n +n如果有调查得来的四个数据11122122n n n n ,,,,并希望根据这样的4个数据来检验上述的两种状态A 与B 是否有关,就称之为22⨯联表的独立性检验.六.回归分析1.回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性.回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.最小二乘法:记回归直线方程为:ˆy a bx =+,称为变量Y 对变量x 的回归直线方程,其中a b ,叫做回归系数.ˆy是为了区分Y 的实际值y ,当x 取值i x 时,变量Y 的相应观察值为i y ,而直线上对应于i x 的纵坐标是ˆi i ya bx =+. 设x Y ,的一组观察值为()i i x y ,,12i n =L ,,,,且回归直线方程为ˆya bx =+, 当x 取值i x 时,Y 的相应观察值为i y ,差ˆ(12)i i y y i n -=L ,,,刻画了实际观察值i y 与回归直线上相应点的纵坐标之间的偏离程度,称这些值为离差.我们希望这n 个离差构成的总离差越小越好,这样才能使所找的直线很贴近已知点.记21()ni i i Q y a bx ==--∑,回归直线就是所有直线中Q 取最小值的那条.这种使“离差平方和为最小”的方法,叫做最小二乘法.用最小二乘法求回归系数a b ,有如下的公式:1221ˆni ii nii x ynxy bxnx ==-=-∑∑,ˆˆa y bx =-,其中a b ,上方加“^”,表示是由观察值按最小二乘法求得的回归系数.3.线性回归模型:将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型. 产生随机误差的主要原因有:①所用的确定性函数不恰当即模型近似引起的误差; ②忽略了某些因素的影响,通常这些影响都比较小; ③由于测量工具等原因,存在观测误差. 4.线性回归系数的最佳估计值:利用最小二乘法可以得到ˆˆab ,的计算公式为 1122211()()()()nnii iii i nniii i xx y y x ynxybxx xn x ====---==--∑∑∑∑$,ˆˆa y bx =-,其中11n i i x x n ==∑,11nii y y n ==∑ 由此得到的直线ˆˆya bx =+$就称为回归直线,此直线方程即为线性回归方程.其中ˆa ,b $分别为a ,b 的估计值,ˆa称为回归截距,b $称为回归系数,ˆy 称为回归值. 5.相关系数:()()nnii i ixx y y x ynx yr ---=∑∑6.相关系数r 的性质:⑴||1r ≤;⑵||r 越接近于1,x y ,的线性相关程度越强; ⑶||r 越接近于0,x y ,的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. 7.转化思想:根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数. 8.一些备案①回归(regression )一词的来历:“回归”这个词英国统计学家Francils Galton 提出来的.1889年,他在研究祖先与后代的身高之间的关系时发现,身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们父母的平均身高高.Galton 把这种后代的身高向中间值靠近的趋势称为“回归现象”.后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析. ②回归系数的推导过程:22222[()]222i i i i i i i i Q y a bx y a y na b x y ab x b x =--=-+-++∑∑∑∑∑∑ 22222()2i i i i i i na a b x y b x b x y y =+-+-+∑∑∑∑∑,把上式看成a 的二次函数,2a 的系数0n >,因此当2()2i i i ib x y y b x a n n --=-=∑∑∑∑时取最小值. 同理,把Q 的展开式按b 的降幂排列,看成b 的二次函数,当2i iiix y a xb x-=∑∑∑时取最小值.解得:12221()()()ni iii i niii x ynxyx x y y b x x xnx==---==--∑∑∑∑,a y bx =-, 其中1i y y n =∑,1i x x n=∑是样本平均数. 9. 对相关系数r 进行相关性检验的步骤: ①提出统计假设0H :变量x y ,不具有线性相关关系;②如果以95%的把握作出推断,那么可以根据10.950.05-=与2n -(n 是样本容量)在相关性检验的临界值表中查出一个r 的临界值0.05r (其中10.950.05-=称为检验水平); ③计算样本相关系数r ;④作出统计推断:若0.05||r r >,则否定0H ,表明有95%的把握认为变量y 与x 之间具有线性相关关系;若0.05||r r ≤,则没有理由拒绝0H ,即就目前数据而言,没有充分理由认为变量y 与x 之间具有线性相关关系. 说明:⑴对相关系数r 进行显著性检验,一般取检验水平0.05α=,即可靠程度为95%.⑵这里的r 指的是线性相关系数,r 的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系.⑶这里的r 是对抽样数据而言的.有时即使||1r =,两者也不一定是线性相关的.故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释.题型一 茎叶图【例1】 (2010丰台二模)甲、乙两名运动员的5次测试成绩如下图所示7乙甲63926886877设12,s s 分别表示甲、乙两名运动员测试成绩的标准差,12,x x 分别表示甲、乙两名运动员测试成绩的平均数,则有( )A .12x x =,12s s <B .12x x =,12s s >C .12x x >,12s s >D .12x x =,12s s =【例2】 (2010宣武二模)随机抽取某中学甲,乙两班各10名同学,测量他们的身高(单位:cm ),获得身高数据的茎叶图如图 ,则下列关于甲,乙两班这10名同学身高的结论正确的是 ( ) A . 甲班同学身高的方差较大 B . 甲班同学身高的平均值较大 C . 甲班同学身高的中位数较大D . 甲班同学身高在175以上的人数较多【例3】 (2010天津高考)甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为 和 .典例分析4女甲903222111110098754321【例4】 右图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,571267847945368553乙甲4321则甲、乙两人这几场比赛得分的中位数之和是( ) A .62 B .63 C .64 D .65【例5】 在某五场篮球比赛中,甲、乙两名运动员得分的茎叶图如右.下列说法正确的是2340210891乙甲3210A .在这五场比赛中,甲的平均得分比乙好,且甲比乙稳定B .在这五场比赛中,甲的平均得分比乙好,但乙比甲稳定C .在这五场比赛中,乙的平均得分比甲好,且乙比甲稳定D .在这五场比赛中,乙的平均得分比甲好,但甲比乙稳定【例6】 (2009年福建12)某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示,记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清.若记分员计算无误,则数字x 应该是 .作品A 8 98 9 92 3 x 2 1 4【例7】 (2010东城一模)在一次数学统考后,某班随机抽取10名同学的成绩进行样本分析,获得成绩数据的茎叶图如下. ⑴计算样本的平均成绩及方差;⑵在这10个样本中,现从不低于84分的成绩中随机抽取2个,求93分的成绩被抽中的概率.435468736789【例8】 某班甲、乙两学生的高考备考成绩如下:甲:512554528549536556534541522538 乙:515558521543532559536548527531 ⑴用茎叶图表示两学生的成绩;⑵分别求两学生成绩的中位数和平均分.【例9】 某电脑杂志的一篇文章中,每个句子的字数如下:10283117232718152624201936271425152211242717,,,,,,,,,,,,,,,,,,,,,, 某报纸的一篇文章中,每个句子所含的字数如下: 27393324281932413327351236412713222318463222,,,,,,,,,,,,,,,,,,,,,. ⑴将两组数据用茎叶图表示; ⑵比较分析,能得到什么结论?【例10】 (2009广东18)随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm ),获得身高数据的茎叶图如图.乙班甲班9886539201988931820215161718⑴根据茎叶图判断哪个班的平均身高较高; ⑵计算甲班的样本方差.⑶现从乙班这10名同学中随机抽取两名身高不低于173cm 的同学,求身高为176cm 的同学被抽中的概率.。

历年高考数学真题精选41 茎叶图

历年高考数学真题精选41 茎叶图

历年高考数学真题精选(按考点分类)专题41茎叶图(学生版)一.选择题(共7小题)1.(2017•山东)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B.5,5C.3,7D.5,7 2.(2015•重庆)重庆市2013年各月的平均气温(︒C)数据的茎叶图如,则这组数据的中位数是()A.19B.20C.21.5D.23 3.(2015•山东)为比较甲,乙两地某月14时的气温,随机选取该月中的5天,将这5天中14时的气温数据(单位:︒C)制成如图所示的茎叶图,考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为()A.①③B.①④C.②③D.②④(9B.7C.36(4.(2015•湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1-35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是()A.3B.4C.5D.6 5.2013•重庆)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )A.2,5B.5,5C.5,8D.8,8 6.(2013•山东)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场做的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以x表示:则7个剩余分数的方差为()A.11636D.677 7.2012•陕西)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示),设甲乙两组数据的平均数分别为x,x,中位数分别甲乙为m,m,则()甲乙A.x<x,m>m甲乙甲乙B.x<x,m<m甲乙甲乙(注:方差 s 2 = [(x - x )2 + ( x - x )2 +⋯+ (x - x )2 ] ,其中 x 为 x , x ,⋯ , x 的平均数);C . x > x , m > m甲乙甲乙D . x > x , m < m甲 乙 甲 乙二.填空题(共 2 小题)8.(2018•江苏)已知 5 位裁判给某运动员打出的分数的茎叶图如图所示,那么这 5 位裁判打出的分数的平均数为.9.(2012•湖南)如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动 员在这五场比赛中得分的方差为.1 n 12 n 1 2 n三.解答题(共 3 小题)10.(2015•新课标Ⅱ)某公司为了解用户对其产品的满意度,从 A , B 两地区分别随机调查了 20 个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B 地区:73 83 62 51 91 46 53 73 64 8293 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分满意度等级 低于 70 分不满意 70 分到 89 分满意 不低于 90 分非常满意记事件 C :“ A 地区用户的满意度等级高于 B 地区用户的满意度等级”,假设两地区用户的评价结果相互独立,根据所给数据,以事件发生的频率作为相应事件发生的概率,求 C 的概率.((注:方差s2=[(x-x)2+(x-x)2+⋯+(x-x)2],其中x为x,x,⋯x的平均数)(11.2013•安徽)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,现从这两个学校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图:(Ⅰ)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(Ⅱ)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x、x,估计x-x的值.1212 12.2011•北京)以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X表示.(Ⅰ)如果X=8,求乙组同学植树棵数的平均数和方差;(Ⅱ)如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数Y 的分布列和数学期望.1n12n12n历年高考数学真题精选(按考点分类)专题41茎叶图(教师版)一.选择题(共7小题)1.(2017•山东)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B.5,5C.3,7D.5,7【答案】A【解析】由已知中甲组数据的中位数为65,故乙组数据的中位数也为65,即y=5,则乙组数据的平均数为:66,故x=32.(2015•重庆)重庆市2013年各月的平均气温(︒C)数据的茎叶图如,则这组数据的中位数是()A.19B.20C.21.5D.23【答案】B【解析】样本数据有12个,位于中间的两个数为20,20,则中位数为20+20=2023.(2015•山东)为比较甲,乙两地某月14时的气温,随机选取该月中的5天,将这5天中14时的气温数据(单位:︒C)制成如图所示的茎叶图,考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.可得:甲地该月14时的平均气温:(26+28+29+31+31)=29,乙地该月14时的平均气温:(28+29+30+31+32)=30,S2=[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2⎤⎦=3.65S2=[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2⎤⎦=2,5其中根据茎叶图能得到的统计结论的编号为()A.①③B.①④C.②③D.②④【答案】B【解析】由茎叶图中的数据,我们可得甲、乙两地某月14时的气温抽取的样本温度分别为:甲:26,28,29,31,31乙:28,29,30,31,32;1515故甲地该月14时的平均气温低于乙地该月14时的平均气温;甲地该月14时温度的方差为:1甲乙地该月14时温度的方差为:1乙故S2>S2,甲乙所以甲地该月14时的气温的标准差大于乙地该月14时的气温标准差.4.(2015•湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1-35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是()A.3B.4C.5D.6【答案】B【解析】由已知,将个数据分为三个层次是[130,138],[139,151],[152,153],根据系统抽样方法从中抽取7人,得到抽取比例为,所以成绩在区间[139,151]中共有20名运动员,抽取人数为20⨯=4(9B.7C.36∴这这组数据的方差是(16+1+1+0+0+9+9)=(15155.2013•重庆)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )A.2,5B.5,5C.5,8D.8,8【答案】C【解析】乙组数据平均数=(9+15+18+24+10+y)÷5=16.8;∴y=8;甲组数据可排列成:9,12,10+x,24,27.所以中位数为:10+x=15,∴x=5.6.(2013•山东)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场做的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以x表示:则7个剩余分数的方差为()A.11636D.677【答案】B【解析】Q由题意知去掉一个最高分和一个最低分后,所剩数据的数据是87,90,90,91,91,94,90+x.∴这组数据的平均数是87+90+90+91+91+94+90+x=91,∴x=4.717367.7.2012•陕西)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示),设甲乙两组数据的平均数分别为x,x,中位数分别甲乙为m,m,则()甲乙x=5+6+8+10+10+14+18+18+22+25+27+30+30+38+41+431616x=10+12+18+20+22+23+23+27+31+32+34+34+38+42+43+481616它们的平均数为⨯(89+89+90+91+91)=90.(注:方差s2=[(x-x)2+(x-x)2+⋯+(x-x)2],其中x为x,x,⋯,x的平均数)A.x<x,m>m甲乙甲乙C.x>x,m>m甲乙甲乙【答案】B【解析】甲的平均数B.x<x,m<m甲乙甲乙D.x>x,m<m甲乙甲乙甲乙的平均数=345,乙=457,所以x<x.甲乙甲的中位数为20,乙的中位数为29,所以m<m甲乙二.填空题(共2小题)8.(2018•江苏)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为.【答案】90【解析】根据茎叶图中的数据知,这5位裁判打出的分数为89、89、90、91、91,159.(2012•湖南)如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为.1n12n12n∴ 这组数据的方差是 [(8 - 11)2 + (9 - 11)2 + (10 - 11)2 + (13- 11)2 + (15 - 11)2 ];【答案】6.8【解析】Q 根据茎叶图可知这组数据的平均数是8 + 9 + 10 + 13 + 155= 111 51= [9 + 4 + 1 + 4 + 16] = 6.8 5三.解答题(共 3 小题)10.(2015•新课标Ⅱ)某公司为了解用户对其产品的满意度,从 A , B 两地区分别随机调查了 20 个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B 地区:73 83 62 51 91 46 53 73 64 8293 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分满意度等级 低于 70 分不满意 70 分到 89 分满意 不低于 90 分非常满意记事件 C :“ A 地区用户的满意度等级高于 B 地区用户的满意度等级”,假设两地区用户的评价结果相互独立,根据所给数据,以事件发生的频率作为相应事件发生的概率,求 C 的概率.解:(1)两地区用户满意度评分的茎叶图如下, , , ,, P(C ) = , P(C ) = , P(C ) = , 20 20 20 4 ⨯ +⨯ = 0.48 .(通过茎叶图可以看出,A 地区用户满意评分的平均值高于 B 地区用户满意评分的平均值;A地区用户满意度评分比较集中, B 地区用户满意度评分比较分散;(2)记 C 表示事件“ A 地区用户满意度等级为满意或非常满意”,A1记 C 表示事件“ A 地区用户满意度等级为非常满意”,A2记 C 表示事件“ B 地区用户满意度等级为不满意”,B1记 C 表示事件“ B 地区用户满意度等级为满意”,B2则 C 与 C 独立, C 与 C 独立, C 与 C 互斥,A1B1 A2 B2 B1 B2则 C = C C U C C ,A1 B1A2B 2P (C ) = P(C C ) + P(C C ) = P(C )P(C ) + P(C ) P (C ) ,A1 B1A2B 2A1B1A2B2由所给的数据 C , C , C , C ,发生的频率为 A1 A2 B1 B2 16 4 10 820 20 20 20所以 P(C ) = A1 16 10 8A2 B1 B2所以 P (C ) = 16 10 8 420 20 20 2011. 2013•安徽)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,现从这两个学校中各抽取 30 名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图:∴估计甲校高三年级这次联考数学成绩的及格率1-5=;30((Ⅰ)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(Ⅱ)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x、x,估计x-x的值.1212解:(I)设甲校高三年级总人数为n,则30=0.05,∴n=600,n又样本中甲校高三年级这次联考数学成绩的不及格人数为5,5306(I I)设样本中甲、乙两校高三年级学生这次联考数学平均成绩分别为a,a,12由茎叶图可知,30(a-a12)=(7-5)+55+(2-8)+(5-0)+(5-6)+⋯+92=15,∴a-a=15=0.5.12∴利用样本估计总体,故估计x-x12的值为0.5.12.2011•北京)以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X表示.(Ⅰ)如果X=8,求乙组同学植树棵数的平均数和方差;(注:方差s2=[(x-x)2+(x-x)2+⋯+(x-x)2],其中x为x,x,⋯x的平均数)平均数是X=8+8+9+10方差为⨯[(8-)2+(8-)2+(9-)2+(10-)2]=;∴随机变量的期望是EY=17⨯+18⨯1+19⨯+20⨯+21⨯=19.(Ⅱ)如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数Y 的分布列和数学期望.1n12n12n解:(Ⅰ)当X=8,乙组同学植树棵数是8,8,9,10,35=44,135********4444416(Ⅱ)当X=9时,甲组同学的植树棵数是9,9,11,11;乙组同学的植树棵数是9,8,9,10,分别从甲和乙两组中随机取一名同学,共有4⨯4=16种结果,这两名同学植树的总棵数Y可能是17,18,19,20,21,事件Y=17,表示甲组选出的同学植树9棵,乙组选出的同学植树8棵,∴P(Y=17)=21= 168P(Y=18)= P(Y=19)= P(Y=20)= P(Y=21)=1 4 1 4 1 4 1 8,Y P170.125180.25190.25200.25210.125111184448。

统计高考真题

统计高考真题

统计测试1.(15北京文科)某辆汽车每次加油都把油箱加满,下表记录了该车相邻两次加油时的情况.注:“累计里程“指汽车从出厂开始累计行驶的路程,在这段时间内,该车每100千米平均耗油量为( ) A .6升 B .8升 C .10升 D .12升2.(15年湖南理科)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图4所示. 若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是 . 13 0 0 3 4 5 6 6 8 8 8 914 1 1 1 2 2 2 3 3 4 4 5 5 5 6 6 7 8 15 0 1 2 2 3 3 33.(15年陕西文科)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( ) A .93 B .123 C .137 D .1674.(15年福建理科)为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程ˆˆˆybx a =+ ,其中ˆˆˆ0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元频率5.([17.5,20), [20,22.5), [22.5,25),[25,27.5),[27.5,22.5小时的人数是( )(A ) (D )140(高中部)(初中部)男男女女60%70%6.(15年江苏)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________.7.(15北京文科)高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ; ②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 .8.(15年广东理科)某工厂36名工人的年龄数据如下表。

高中数学必修三茎叶图

高中数学必修三茎叶图
将其分成7组并要求: (1)列出样本的频率分布表; (2)画出频率分布直方图以及密度曲线
再见
茎叶图
复习引入
1、中位数
将数据按从小到大或从大到小,处 在中间的数据;但当数据为偶数个 时,处于中间两个的数据的平均数 为中位数;
2、众数 在数据中出现次数最多的数。但众 数不一定是唯一的。
引入:某篮球运动员在某赛季各场比赛 的得分情况如下: 12,15,24,25,31,31,36,37,39, 44,49,50.
注意:在制作茎叶图时,重复出现的数据要 重复记录,不能遗漏,特别是“叶”部分; 同一数据出现几次,就要在图中体现几次.
例5 甲、乙两篮球运赛 动季 员每 上场比赛的下 得, 试比较这两位运得 动分 员水 的. 平 甲 12,15,24,25,31,31,36,36,37,39,44,49,50. 乙 8,13,14,16,23,26,28,33,38,39,51.
133 130 124 116 117 123 122 120 112 112
茎叶 10 7, 8 11 2, 7, 6, 3, 6, 8, 6, 7, 2, 2,0 12 6, 8, 4, 2, 7, 8, 6, 1, 0, 4, 3, 2, 0 13 4, 2, 3, 0
该车间的工人加工零件数大多都在110到130之间,且分 布较对称,集中程度高,说明日生产情况较稳定,工人 的技术水平较接近。
第二行表示甲 得分为 15 分、 12 分 , 乙 得 分为 13 分、 14 分、 16 分 , 其他各行与此 同.
从 这 个茎叶图可以看出 ,甲运动员 的得分大致对称 , 平均得分、众数 及中位 数 都是 30 多分 .乙运 动员的 得 分除一个 51 分外 , 也大挥比较 稳定 , 总体得分情况比乙好 .

【优】高中数学茎叶图PPT资料

【优】高中数学茎叶图PPT资料

题型三 茎叶图的应用 【例3】 (14分)甲、乙两个学习小组在一次测验中的得分如 下: 甲:53 56 64 69 71 72 72 73 74 75 75 76
78 81 83 90 追本溯源 在绘制茎叶图时,“左叶”中数字一般按从大到小排列,“右叶”中的数字则按从小到大排列.
甲:15 24 12 25 36 31 35 30 48 39 44 49 50
乙:48 54 57 优点:①所有的信息都可以从茎叶图中得到. 58 64 65 66 66 68 69 70 71
127 118 吗?
72 75 80 91 将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎
②茎叶图便于记录与表示.
题型一 茎叶图的制作 【例1】 下面一组数据是某生产车间30名工人某日加工零 件的个数.请设计适当的茎叶图表示这组数据.
134 112 117 126 128 124 122 116 113 107 116 132 127 128 126 121 120 118 108 110 133 130 124 116 117 123 122 120 112 112 [思路探索] 以前两位数为茎,个位数为叶,可以作出相应 的茎叶图.
名师点睛 1.茎叶图的制作(两位数的情况) 将所有两位数的十位数字作为“茎”,个位数字作为 “叶”,茎 相同者共用一个茎,茎按从小到大的顺序从上向下列出, 共茎的叶一般按从大到小(或从小到大)的顺序同行列出. 2.茎叶图的作用:茎叶图也是用来表示数据分布的一种方 法.茎叶图既可以用于分析单组数据,也可以用于对两组数据 进行比较分析.
(7 分)
从茎叶图可以看出,甲组的学生得分大致对称,平均分、
(10 分)
众数及中位数都是 70 多分.乙组的学生得分也大致对称,平
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一.随机抽样1.随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法: ⑴简单随机抽样:从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. 抽出办法:①抽签法:用纸片或小球分别标号后抽签的方法.②随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表.表中每一位置出现各个数字的可能性相同.随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法.简单随机抽样是最简单、最基本的抽样方法.⑵系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法. 抽出办法:从元素个数为N 的总体中抽取容量为n 的样本,如果总体容量能被样本容量整除,设Nk n=,先对总体进行编号,号码从1到N ,再从数字1到k 中随机抽取一个数s 作为起始数,然后顺次抽取第2(1)s k s k s n k +++- ,,,个数,这样就得到容量为n 的样本.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样. 系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样.⑶分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样.分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛.2.简单随机抽样必须具备下列特点:⑴简单随机抽样要求被抽取的样本的总体个数N 是有限的. ⑵简单随机样本数n 小于等于样本总体的个数N . ⑶简单随机样本是从总体中逐个抽取的. ⑷简单随机抽样是一种不放回的抽样.⑸简单随机抽样的每个个体入样的可能性均为nN.3.系统抽样时,当总体个数N 恰好是样本容量n 的整数倍时,取Nk n=;若Nn不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量n 整除.因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍然相等,为Nn.知识内容板块三.茎叶图二.频率直方图列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:取组距,用极差组距决定组数;③决定分点:决定起点,进行分组;④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图,知小长方形的面积=组距×频率组距=频率.频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x =来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.三.茎叶图制作茎叶图的步骤:①将数据分为“茎”、“叶”两部分;②将最大茎与最小茎之间的数字按大小顺序排成一列,并画上竖线作为分隔线; ③将各个数据的“叶”在分界线的一侧对应茎处同行列出.四.统计数据的数字特征用样本平均数估计总体平均数;用样本标准差估计总体标准差. 数据的离散程序可以用极差、方差或标准差来描述.极差又叫全距,是一组数据的最大值和最小值之差,反映一组数据的变动幅度; 样本方差描述了一组数据平均数波动的大小,样本的标准差是方差的算术平方根.一般地,设样本的元素为12n x x x ,,,样本的平均数为x , 定义样本方差为222212()()()n x x x x x x s n-+-++-= ,样本标准差s =简化公式:22222121[()]n s x x x nx n=+++- .五.独立性检验1.两个变量之间的关系;常见的有两类:一类是确定性的函数关系;另一类是变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的.当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.2.散点图:将样本中的n 个数据点()(12)i i x y i n = ,,,,描在平面直角坐标系中,就得到了散点图.散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系.3.如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域.反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.此时,散点图中的点在从左上角到右下角的区域.散点图可以判断两个变量之间有没有相关关系.4.统计假设:如果事件A 与B 独立,这时应该有()()()P AB P A P B =,用字母0H 表示此式,即0:()()()H P AB P A P B =,称之为统计假设. 5.2χ(读作“卡方”)统计量:统计学中有一个非常有用的统计量,它的表达式为22112212211212()n n n n n n n n n χ++++-=,用它的大小可以用来决定是否拒绝原来的统计假设0H .如果2χ的值较大,就拒绝0H ,即认为A 与B 是有关的.2χ统计量的两个临界值:3.841、6.635;当2 3.841χ>时,有95%的把握说事件A 与B 有关;当2 6.635χ>时,有99%的把握说事件A 与B 有关;当2 3.841χ≤时,认为事件A 与B 是无关的.独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立的. 1.独立性检验的步骤:统计假设:0H ;列出22⨯联表;计算2χ统计量;查对临界值表,作出判断.2.几个临界值:222()0.10( 3.841)0.05( 6.635)0.01P P P χχχ≈≈≈≥2.706,≥,≥.22⨯联表的独立性检验:22⨯的表,如下:如果有调查得来的四个数据11122122n 4个数据来检验上述的两种状态A 与B 是否有关,就称之为22⨯联表的独立性检验.六.回归分析1.回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性.回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.最小二乘法:记回归直线方程为:ˆya bx =+,称为变量Y 对变量x 的回归直线方程,其中ab ,叫做回归系数.ˆy是为了区分Y 的实际值y ,当x 取值i x 时,变量Y 的相应观察值为i y ,而直线上对应于i x 的纵坐标是ˆi i ya bx =+. 设x Y ,的一组观察值为()i i x y ,,12i n = ,,,,且回归直线方程为ˆy a bx =+, 当x 取值i x 时,Y 的相应观察值为i y ,差ˆ(12)i i y yi n -= ,,,刻画了实际观察值i y 与回归直线上相应点的纵坐标之间的偏离程度,称这些值为离差.我们希望这n 个离差构成的总离差越小越好,这样才能使所找的直线很贴近已知点. 记21()ni i i Q y a bx ==--∑,回归直线就是所有直线中Q 取最小值的那条.这种使“离差平方和为最小”的方法,叫做最小二乘法.用最小二乘法求回归系数a b ,有如下的公式: 1221ˆni ii nii x ynxy bxnx ==-=-∑∑,ˆˆay bx =-,其中a b ,上方加“^”,表示是由观察值按最小二乘法求得的回归系数.3.线性回归模型:将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型. 产生随机误差的主要原因有:①所用的确定性函数不恰当即模型近似引起的误差; ②忽略了某些因素的影响,通常这些影响都比较小; ③由于测量工具等原因,存在观测误差. 4.线性回归系数的最佳估计值:利用最小二乘法可以得到ˆˆa b ,的计算公式为 1122211()()()()nnii iii i nniii i xx y y x ynx ybxx xn x ====---==--∑∑∑∑ ,ˆˆay bx =-,其中11n i i x x n ==∑,11ni i y y n ==∑ 由此得到的直线ˆˆya bx =+ 就称为回归直线,此直线方程即为线性回归方程.其中ˆa ,b 分别为a ,b 的估计值,ˆa称为回归截距,b 称为回归系数,ˆy 称为回归值. 5.相关系数:()()nnii i ixx y y x ynx yr ---==∑∑6.相关系数r 的性质:⑴||1r ≤;⑵||r 越接近于1,x y ,的线性相关程度越强; ⑶||r 越接近于0,x y ,的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. 7.转化思想:根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数. 8.一些备案①回归(regression )一词的来历:“回归”这个词英国统计学家Francils Galton 提出来的.1889年,他在研究祖先与后代的身高之间的关系时发现,身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们父母的平均身高高.Galton 把这种后代的身高向中间值靠近的趋势称为“回归现象”.后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析.②回归系数的推导过程:22222[()]222i i i i i i i i Q y a bx y a y na b x y ab x b x =--=-+-++∑∑∑∑∑∑22222()2i i i i i i na a b x y b x b x y y =+-+-+∑∑∑∑∑, 把上式看成a 的二次函数,2a 的系数0n >,因此当2()2i i i ib x y y b x a n n--=-=∑∑∑∑时取最小值.同理,把Q 的展开式按b 的降幂排列,看成b 的二次函数,当2i iiix y a xb x-=∑∑∑时取最小值.解得:12221()()()ni iii i niii x ynxyx x y y b x x xnx==---==--∑∑∑∑,a y bx =-, 其中1i y y n =∑,1i x x n=∑是样本平均数. 9. 对相关系数r 进行相关性检验的步骤: ①提出统计假设0H :变量x y ,不具有线性相关关系;②如果以95%的把握作出推断,那么可以根据10.950.05-=与2n -(n 是样本容量)在相关性检验的临界值表中查出一个r 的临界值0.05r (其中10.950.05-=称为检验水平); ③计算样本相关系数r ;④作出统计推断:若0.05||r r >,则否定0H ,表明有95%的把握认为变量y 与x 之间具有线性相关关系;若0.05||r r ≤,则没有理由拒绝0H ,即就目前数据而言,没有充分理由认为变量y 与x 之间具有线性相关关系. 说明:⑴对相关系数r 进行显著性检验,一般取检验水平0.05α=,即可靠程度为95%. ⑵这里的r 指的是线性相关系数,r 的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系.⑶这里的r 是对抽样数据而言的.有时即使||1r =,两者也不一定是线性相关的.故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释.题型一 茎叶图【例1】 (2010丰台二模)甲、乙两名运动员的5次测试成绩如下图所示7乙甲63926886877设12,s s 分别表示甲、乙两名运动员测试成绩的标准差,12,x x 分别表示甲、乙两名运动员测试成绩的平均数,则有( )A .12x x =,12s s <B .12x x =,12s s >C .12x x >,12s s >D .12x x =,12s s =【例2】 (2010宣武二模)随机抽取某中学甲,乙两班各10名同学,测量他们的身高(单位:cm ),获得身高数据的茎叶图如图 ,则下列关于甲,乙两班这10名同学身高的结论正确的是 ( )A . 甲班同学身高的方差较大B . 甲班同学身高的平均值较大典例分析C . 甲班同学身高的中位数较大D . 甲班同学身高在175以上的人数较多【例3】 (2010天津高考)甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为 和 .4女甲903222111110098754321【例4】 右图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,571267847945368553乙甲4321则甲、乙两人这几场比赛得分的中位数之和是( ) A .62 B .63 C .64 D .65【例5】 在某五场篮球比赛中,甲、乙两名运动员得分的茎叶图如右.下列说法正确的是2340210891乙甲3210A .在这五场比赛中,甲的平均得分比乙好,且甲比乙稳定B .在这五场比赛中,甲的平均得分比乙好,但乙比甲稳定C .在这五场比赛中,乙的平均得分比甲好,且乙比甲稳定D .在这五场比赛中,乙的平均得分比甲好,但甲比乙稳定【例6】 (2009年福建12)某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示,记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清.若记分员计算无误,则数字x 应该是 .【例7】 (2010东城一模)在一次数学统考后,某班随机抽取10名同学的成绩进行样本分析,获得成绩数据的茎叶图如下.⑴计算样本的平均成绩及方差;⑵在这10个样本中,现从不低于84分的成绩中随机抽取2个,求93分的成绩被抽中的概率.435468736789【例8】 某班甲、乙两学生的高考备考成绩如下:甲:512554528549536556534541522538 乙:515558521543532559536548527531⑴用茎叶图表示两学生的成绩;⑵分别求两学生成绩的中位数和平均分.【例9】 某电脑杂志的一篇文章中,每个句子的字数如下:10283117232718152624201936271425152211242717,,,,,,,,,,,,,,,,,,,,,,某报纸的一篇文章中,每个句子所含的字数如下: 27393324281932413327351236412713222318463222,,,,,,,,,,,,,,,,,,,,,.⑴将两组数据用茎叶图表示; ⑵比较分析,能得到什么结论?【例10】 (2009广东18)随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm ),获得身高数据的茎叶图如图.乙班甲班9886539201988931820215161718⑴根据茎叶图判断哪个班的平均身高较高; ⑵计算甲班的样本方差.⑶现从乙班这10名同学中随机抽取两名身高不低于173cm 的同学,求身高为176cm 的同学被抽中的概率.。

相关文档
最新文档