必修三第二章统计小结

合集下载

人教B版数学必修三章末归纳总结2

人教B版数学必修三章末归纳总结2
数 学 必 修 ③ · 人 教 B 版
返回导航
第二章 统 计
专题二 ⇨用样本分布估计总体分布
命题方向 用样本的频率分布估计总体的频率分布
有一个容量为 100 的样本,数据的分组及各组的频数如下:
导学号 95064542
[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),
估计,有时也利用频率分布折线图和茎叶图对总体估计.直方图能够很容易地表
示大量数据,非常直观地表明分布的特征,使我们能够看到在分布表中看不清
楚的数据模式,这样根据样本的频率分布,我们可以大致估计出总体的分布.当
总体的个体数较多时,所需抽样的样本容量也不能太小,随着样本容量的增
加,频率分布折线图会越来越接近于一条光滑曲线,统计中称这条曲线为总体
三种抽样方法比较
类别
共同点
相互联系
适用范围
各自特点
简单随 (1)抽样过 机抽样 程中每个个
总体中的个 体数较少
从总体中逐个抽取
数 学
系统抽样
体被抽到的 机会相等
在起始部分抽样时 采用简单随机抽样
总体中的个 体数较多
将总体均分成几部分,按事 先确定的规则在各部分抽取
必 修 ③
· 人 教
分层抽样
(2)抽样过 程都是不放 回的抽样
S3 从选定的27开始向右读下去,得到下一个两位数字代码26,将它取 出;继续向右读,又得到27,将它去掉;继续向右读,得到39,将它取出;然 后向下读,得到20、21、34、12、28、22、13,至此,10个样本号码已经取满. 于是所要抽取的样本号码是27、26、39、20、21、34、12、28、22、13.

高中数学 第二章 统计 知识点总结 新人教A版必修3

高中数学 第二章 统计 知识点总结 新人教A版必修3

第二章 统计 简单随机抽样1. 简单随机抽样的含义一般地,设一个总体有N 个个体, 从中逐个不放回地抽取n 个个体作为样本(n ≤N ), 如果每次抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽样. ⑴每个个体每次被抽到的概率是 ; ⑵每个个体被抽到的概率是 ;●根据你的理解,简单随机抽样有哪些主要特点? ⑴总体的个体数有限;⑵样本的抽取是逐个进行的,每次只抽取一个个体; ⑶抽取的样本不放回,样本中无重复个体; ⑷每个个体被抽到的机会都相等,抽样具有公平性. 2.简单随机抽样常用的方法:⑴抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。

★抽签法的操作步骤?第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上. 第二步,将号签放在一个容器中,并搅拌均匀第三步,每次从中抽取一个号签,连续抽取n 次,就得到一个容量为n 的样本. ●抽签法有哪些优点和缺点?优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大;误差相比其它抽样也比较大。

★利用随机数表法从含有N 个个体的总体中抽取一个容量为n 的样本,其抽样步骤如何? 第一步,将总体中的所有个体编号.第二步,在随机数表中任选一个数作为起始数.第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n 个号码为止,就得到一个容量为n 的样本.系统抽样:1. 系统抽样的定义:一般地,要从容量为N 的总体中抽取容量为n 的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样. ●由系统抽样的定义可知系统抽样有以下特征:⑴当总体容量N 较大时,采用系统抽样。

⑵将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,间隔一般为k =nN . ⑶预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号★系统抽样的一般步骤⑴用系统抽样从总体中抽取样本时,首先要做的工作是什么?将总体中的所有个体编号.如果用系统抽样从605件产品中抽取60件进行质量检查,由于605件产品不能均衡分成60部分,⑵应先从总体中随机剔除5个个体,再均衡分成60部分.一般地,用系统抽样从含有N个个体的总体中抽取一个容量为n的样本,其操作步骤如何?第一步,将总体的N个个体编号.第二步,确定分段间隔k,对编号进行分段.第三步,在第1段用简单随机抽样确定起始个体编号l.第四步,按照一定的规则抽取样本.分层抽样1. 分层抽样的定义:若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本,这样的抽样叫做分层抽样. 所以分层抽样又称类型抽样.●应用分层抽样应遵循以下要求及具体步骤:⑴分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。

人教B版高中数学必修三《第二章 统计 本章小结》_1

人教B版高中数学必修三《第二章 统计 本章小结》_1

统计章末随机抽样、用样本估计总体一、复习目标1.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.2.能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.3.理解样本数据标准差的意义和作用,会计算数据标准差.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.二、知识梳理1.随机抽样抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的都相等,就把这种抽样的方法叫作简单随机抽样.最常用的简单随机抽样的方法有两种——(抓阄法)和.(2)系统抽样:当总体的个体数目时,可将总体分成的几部分,然后按照事先定出的规则,从每一部分抽取个体,得到所需要的样本,称此抽样为系统抽样.(3)分层抽样:总体由,常将总体按差异分成几个部分,然后按各部分所占的比值进行抽样,其中所分成的各部分叫作层.简单随机抽样、系统抽样、分层抽样的共同特点是在抽样过程中每一个个体被抽取的,体现了这些抽样方法的客观性和公平性.2.用样本估计总体(1)用样本的频率分布估计总体的分布①频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各小组数据在样本容量中所占比例的大小的角度,来表示数据分布的规律.它可以使我们看到整个样本数据的频率分布情况.绘制频率分布直方图的步骤:a.求极差;b.决定组距与组数;c.将数据分组;d.列频率分布表;e.画频率分布直方图.②频率分布折线图连接频率分布直方图中各小长方形上端的,就得到频率分布折线图.③茎叶图茎是指中间的一列数,叶是从生长出来的数.茎叶图表示数据有两个突出的优点.其一是统计图上没有的损失,其二是方便记录与表示.(2)用样本的数字特征估计总体的数字特征①众数、中位数、平均数众数:一组数据中出现次数最多的数.中位数:将数据从小到大(或从大到小)排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两个数的平均数是中位数.平均数:样本数据的算术平均数,即x -= 1n(x 1+x 2+…+x n ) . 反映了一组数据的平均水平.②标准差和方差计算公式s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]. s 2= 1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2] . 标准差和方差都反映了样本数据的离散程度.三、热身练习1.(2014·湖南卷)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A .p 1=p 2<p 3B .p 2=p 3<p 1C .p 1=p 3<p 2D .p 1=p 2=p 3解:在简单随机抽样、系统抽样和分层抽样中,每个个体被抽取的概率均为n N, 所以p 1=p 2=p 3.答案 D2.(2015·重庆卷)重庆市2013年各月的平均气温(℃)数据的茎叶图如右图,则这组数据的中位数是( )A .19B .20C .21.5D .23解:由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为20+202=20. 答案 B3.微课讲解插入微课,讲解高考考察形式和侧重点,分析三道重点题型。

人教A版高中数学必修3《二章 统计 小结》优质课教案_14

人教A版高中数学必修3《二章 统计  小结》优质课教案_14

第二章统计复习教案一、教学目标:1、整合本章知识点,完善知识结构,体会知识之间的相关关系,能应用所学知识解决一些简单的统计问题。

2、在归纳总结知识的过程中完善知识结构。

3、让学生在学习中自觉应用类比,数形结合等数学思想方法帮助学习。

二、教学重难点重点:构建本章(统计)的知识结构,能应用所学知识解决简单的统计问题。

难点:应用所学知识解决简单的统计问题。

三、教学方法:归纳总结法,讲练结合法四、教学用时:1课时五、教学过程设计2、用样本估计总体(1)用样本估计总体的两种情况 ①用样本的频率分布估计总体的分布.②用样本的数字特征估计总体的数字特征. (2)绘制频率分布直方图的步骤 (3)频率分布折线图和总体密度曲线频率分布直方图――――――――→连接各小长方形上端的中点频率分布折线图 ――――――――――――→样本容量不断增大,频率折线图接近于一条光滑曲线总体密度曲线 (4)茎叶图的制作步骤 ①将数据分为茎和叶两部分;②将最大茎和最小茎之间数据按大小次序排成一列; ③将各个数据的“叶”按大小次序写在茎右(左)侧.(5)数字特征①众数:一组数据中重复出现次数最多的数.②中位数:把一组数据按从小到大的顺序排列,处在中间位置(或中间两个数的平均数)的数叫做这组数据的中位数.③平均数:如果n 个数x 1,x 2,…,x n ,那么x =1n (x 1+x 2+…+x n )叫做这n 个数的平均数.④标准差的计算公式: s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2 ⑤方差的计算公式:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],想一想:众数、中位数、平均数与频率分布直方图的关系。

3、两个变量的线性相关(1)散点图:将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形. (2)正相关与负相关:① 正相关:散点图中的点散布在从左下角到右上角的区域. ② 负相关:散点图中的点散布在从左上角到右下角的区域. (3)回归直线的方程① 回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.② 回归方程:回归直线对应的方程叫做回归直线的方程,简称回归方程.二、巩固练习1、要从已编号(1—60)的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的枚导弹的编号可能是( ) A 、5,10,15,20,25,30 B 、3,13,23,33,43,53 C 、1,2,3,4,5,6 D 、2,4,8,16,32,482、某公司现有普通职员160人,中级管理人员30人,高级管理人员10人,要从其中抽取20个人进行身体健康检查,如果采用分层抽样的方法,则普通职员,中级管理人员和高级管理人员各应该抽取多少人( )A 、8,15,7B 、16,2,2C 、16,3,1D 、12,3,5 3、右图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是( ) A 、161cm B 、162cmC 、163cm D 、164cm4、为了了解某地区高中学生的身体发育情况,抽查了该地区100名年龄在17.5~18岁的男生体重(单位:kg ),得到频率分布直方图如下: 求这100名学生中体重在56.5~64.5范围内的人数.5、某商场为了调查旅游鞋的销售情况,抽取了部分顾客购鞋的尺寸,将所得数据整理后,画出频率分布直方图如下,已知图中从左到右前3个小矩形的面积之比为1︰2︰3,第二小组的频数为10. (1)求样本容量;(2)估计购鞋尺寸在37.5~43.556.5 60.5 64.5 68.5 72.56、已知某人5次上班途中所花时间的平均数为10分钟,方差为2分钟,其中有三次上班途中所花时间分别为9分钟,10分钟和11分钟,求另两次上班途中所花的时间.7、随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:(1)判断家庭平均收入与月平均生活支出是否相关? (2)若二者线性相关,求回归直线方程.8、某工厂经过技术改造后,生产某种产品的产量x 吨与相应的生产能耗y 吨标准煤有如下几组样本数据:(1)样本数据是否具有线性相关关系?若是,求出其回归方程; (2)预测生产100吨产品的生产能耗约需多少吨标准煤?三、课堂小结1、本章中统计的相关知识。

高中数学必修三统计总结

高中数学必修三统计总结
n i 1 i
n
n i 1 i
i 1
i 1 i
( 2)
(y y ) (xi x ) xi y i n x y i d i 1 i 1 n 2 n 2 2 x n x ( x x ) i i 1 i i 1
n
a y bx

(3)得出回归方程:
的个体,再将取出的各个个体合起来作为样本
二、用样本估计总体 1、用样本的频率分布估计总体分布 (1)频率分布表:①求极差=最大值-最小值
②决定组数与组距 ③再将数据分组 ④列表:分组 频数
频率 频数 样本容量 组距 频率2)频率分布直方图: 长方形的高 频率 组距 (3)频率分布折线图:连接频率分布直方图中各长方形上端的中点 (4)总体密度曲线:样本容量增加,组数增加,组距减小。频率分布折线图





(3)标准差:方差的算术平方根叫做标准差
s 1 n x x 2 x x 2 x x 2 1 2 3





三、变量间的相关关系 (x n ,y n) 1、求回归方程: (x1 ,y 1)(x 2 ,y 2)(x 3 ,y 3) n n n n 1 ( 1) x 1 xi y i x y y x2
第二章 统计
人教版数学必修三
一、随机抽样 1、放回抽样 2、不放回抽样 (1)简单随机抽样 ①抽签法:编号 制签 搅拌 抽签确定样本 ②随机数法:编号 确定开始的数字 随机数表选号 确定样本 N (2)系统抽样:编号 分段间隔 K n 确定第一个个体编号
(n 1)K
取样本
(3)分层抽样:将总体分成互不相交的层,按照一定比例,从各层中一定数量

人教课标实验B版-必修3-第二章 统计-本章小结 全国获奖

人教课标实验B版-必修3-第二章 统计-本章小结 全国获奖

“小结”的教学建议
教科书在小节中对本章的知识点进行了总结.这里的总结以两种形式给出,即“本章的知识结构”和“回顾与思考”.教学中,要注意引导学生利用知识结构框图梳理本章的各个知识点之间的逻辑关系,按照知识框图提供的线索复习回忆各个知识点的内容及相关的应用.
教科书在回顾与思考栏目中,主要简单回顾了一些重要的知识点,同时通过提出一些问题,考查学生是否掌握了本章的知识以及在本章的知识的实际应用中所需要注意的问题,其中特别注意强调了统计思想.这些问题的答案大部分可以从前面的内容中找到,这里不再重述.
下面列出了部分问题的解答要点.
1.你能给国家统计局的城乡调查队设计一个调查公众当前最关心的十大问题的抽样方案吗?
解答要点:该问题可以用分层抽样的思想来设计抽样方案,可分如下几个步骤:
(1)按行政区分层;
(2)确定各层抽取个体的数目;
(3)用简单随机抽样方法在各层中抽取个体.
2.在什么情况下用中位数比用众数、平均数好一些?
解答要点:在样本数据质量比较差,即有很多错误数据的情况下.
3.为什么说,如果平均数的大小与中位数大小差不多时,用平均数比用中位数更合适些?
解答要点:因为平均数包含了更多的样本信息.。

人教版高中数学必修三第二章《统计》优化总结

人教版高中数学必修三第二章《统计》优化总结

章末优化总结抽样方法及应用应用抽样方法抽取样本时,应注意以下几点:(1)用随机数法抽样时,对个体所编的号码位数要相等.当问题所给位数不相等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.(2)用系统抽样法抽样时,如果总体容量N 能被样本容量n 整除,则抽样间隔为k =Nn ;如果总体容量N 不能被样本容量n 整除,则先用简单随机抽样剔除多余个体,抽样间隔为k =⎣⎡⎦⎤N n .⎝⎛⎭⎫⎣⎡⎦⎤N n 表示取N n 的整数部分 (3)三种抽样方法的适用范围:当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量较大,样本容量较小时,可采用随机数法;当总体容量较大,样本容量也较大时,可采用系统抽样;当总体中个体差异较显著时,可采用分层抽样.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本.(1)采用简单随机抽样法,将零件编号为00,01,02,…,99,利用抽签法随机抽取20个.(2)采用系统抽样法,将所有零件分成20组,每组5个,然后从每组中随机抽取1个.(3)采用分层抽样法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.对于上述问题,下面说法是否正确,说明理由.①不论采用哪一种抽样方法,这100个零件中每一个被抽到的机会都相等.②(1)(2)两种抽法,这100个零件中每一个被抽到的机会相等,而(3)并非如此.③采用不同的抽样方法,这100个零件中每一个被抽到的机会是不相等的.[解]①是正确的,②③都不正确.因为无论是简单随机抽样还是系统抽样,分层抽样,由其操作步骤知,都能保证每一个个体被抽到的机会是均等的.用样本的频率分布估计总体的分布利用样本的频率分布表和频率分布直方图对总体情况作出估计,有时也利用频率分布折线图和茎叶图对总体情况作出估计.(1)用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,作频率分布表与频率分布直方图时要注意其方法步骤.(2)茎叶图刻画数据有两个优点:一是所有信息都可以从图中得到,二是便于记录和表示,但数据较多时不方便.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料(单位:cm):区间界限[122,126)[126,130)[130,134)[134,138)[138,142)人数58102233区间界限[142,146)[146,150)[150,154)[154,158]人数20116 5(1)列出样本的频率分布表(频率保留两位小数);(2)画出频率分布直方图;(3)估计身高低于134 cm的人数占总人数的百分比.[解](1)列出样本频率分布表:分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142) 33 0.28 [142,146) 20 0.17 [146,150) 11 0.09 [150,154) 6 0.05 [154,158] 5 0.04 合计1201.00(2)画出频率分布直方图,如图所示.(3)因为样本中身高低于134 cm 的人数的频率为 5+8+10120=23120≈0.19. 所以估计身高低于134 cm 的人数约占总人数的19%.用样本的数字特征估计总体的数字特征样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括平均数、众数、中位数;另一类是反映样本数据的波动大小,包括样本方差及标准差.通常,我们用样本的数字特征估计总体的数字特征.甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如图所示:(1)填写下表:平均数方差中位数命中9环及以上甲7 1.2 1乙 5.4 3(2)请从四个不同的角度对这次测试进行分析:①从平均数和方差结合分析偏离程度;②从平均数和中位数结合分析谁的成绩好些;③从平均数和命中9环以上的次数相结合看谁的成绩好些;④从折线图上两人射击命中环数及走势分析谁更有潜力.[解](1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10.所以x-乙=110(2+4+6+8+7+7+8+9+9+10)=7;乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是7+82=7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:(2)①甲、乙的平均数相同,均为7,但s2甲<s2乙,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶成绩比甲好.③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.求回归方程除了函数关系这种确定性的关系外,还有大量因变量的取值带有一定随机性的两个变量之间的关系——相关关系.分析两个变量的相关关系时,我们可根据样本数据的散点图给出判断.若是线性相关,还可以利用最小二乘法求出回归方程.求回归方程的步骤:平均数方差中位数命中9环及以上甲7 1.271乙7 5.47.53(1)由已知数据计算出x-,y-,∑i=1nx2i,∑i=1nx i y i;(2)计算回归方程的系数a^,b^,(3)写出回归归方程y^=b^x+a^下表数据是退水温度x(℃)对黄酮延长性y(%)效应的试验结果,y是以延长性计算的,且x(℃)300 400 500 600 700 800y(%)40 50 55 60 67 70 (1)画出散点图;(2)指出x,y是否线性相关;(3)若线性相关,求y关于x的回归方程;(4)估计退水温度是1 000 ℃时,黄酮延长性的情况.[解](1)散点图如图:(2)由散点图可以看出样本点分布在一条直线的附近,可见y与x线性相关.,(3)列出下表并用科学计算器进行有关计算.i 123456x i300400500600700800y i405055606770x i y i12 00020 00027 50036 00046 90056 000x2i90 000160 000250 000360 000490 000640 000x=550, y=57,∑i=16x i2=1 990 000, ∑i=16x i y i=198 400于是可得因此所求的回归直线的方程为:y^=0.058 86x+24.627.(4)将x=1 000代入回归方程得y^=0.058 86×1 000+24.627=83.487,即退水温度是1 000 ℃时,黄酮延长性大约是83.487%.1.(2015·聊城高一检测)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种.现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是()A.4 B.5C.6 D.7解析:选C.食品共有100种,抽取容量为20的样本,即抽样比为15,故抽取植物油类与果蔬类食品种数之和为2+4=6.故选C.2.如图所示是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知()A.甲运动员的成绩好于乙运动员B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异D.甲运动员的最低得分为0分解析:选A.从茎叶图可以看出:甲运动员的成绩集中在大茎上的叶多,故成绩好. 3.设矩形的长为a ,宽为b ,其比满足b ∶a =5-12≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确的结论是( ) A .甲批次的总体平均数与标准值更接近 B .乙批次的总体平均数与标准值更接近C .两个批次总体平均数与标准值接近程度相同D .两个批次总体平均数与标准值接近程度不能确定解析:选A.计算可得甲批次样本的平均数为0.617,乙批次样本的平均数为0.613,由此估计两个批次的总体平均数分别为0.617,0.613,则甲批次的总体平均数与标准值更接近.故选A.4.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温(℃) 18 13 10 -1 用电量(度)24343864由表中数据得线性回归方程y =b ^x +a ^中b ^=-2,预测当气温为-4 ℃时,用电量的度数约为________.解析:x -=18+13+10-14=10,y -=24+34+38+644=40,将点(x -,y -)代入线性回归方程,得a ^=y --b ^x -=40+20=60,所以线性回归方程为y =-2x +60.将x =-4代入线性回归方程,得y =68.答案:68[A.基础达标]1.抽签法中确保样本代表性的关键是( ) A .制签 B .搅拌均匀 C .逐一抽取 D .抽取不放回解析:选B.只有搅拌均匀每个个体被抽取的可能性相等,这样抽取的样本才有代表性,故选B. 2.下列抽样方式是简单随机抽样的是( )A .按居民身份证号码的后3位数字是632作为样本,来进行中央电视台春节联欢晚会的收视率的调查B .对不同地区,不同职业的人,按一定比例抽取作为样本,来进行中央电视台春节联欢晚会的收视率的调查C .从产品生产流水线上随机抽取100个个体作为样本D .某公司从800袋牛奶中抽取60袋.利用随机数表法抽取样本,检验某项指标是否合格解析:选D.因为随机数表法是简单随机抽样,故选D.3.某市政府在人大会上,要从农业、工业和教育系统的代表中抽查对政府工作报告的意见,为了更具有代表性, 抽样应采取( )A .抽签法B .随机数表法C .系统抽样法D .分层抽样解析:选D.因为样本来自差异较大的三个部分:农业、工业、教育,故选D.4.某校为了了解高三学生的身体状况,抽取了100名女生的体重.将所得的数据整理后,画出了如图所示的频率分布直方图,则所抽取的女生中体重在40~45 kg 的人数是( )A .10B .2C .5D .15解析:选A.由图可知频率=频率组距×组距, 故频率=0.02×5=0.1. ∴0.1×100=10人.5.有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下: 甲 7 , 8 , 7 , 9 , 5 , 4 , 9 , 10 , 7 , 4 乙 9 , 5 , 7 , 8 , 7 , 6 , 8 , 6 , 7 , 7那么,根据这次测试成绩得出的结论是( ) A .甲与乙技术一样稳定 B .甲比乙技术稳定C .乙比甲技术稳定D .无法确定解析:选C.因为x -甲=x -乙=7,s 甲=2,s 乙≈1.1,故选C.6.如图是2005年至2014年某省城镇居民百户家庭人口数的茎叶图, 图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到2005年至2014年我省城镇居民百户家庭人口数的平均数为________.解析:这10年的家庭人口数为291,291,295,298,302,306, 310,312,314,317,再求这10个数的平均数为291+291+295+298+302+306+310+312+314+31710=303.6.答案:303.6 7.(2015·山东滨州质检)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人)篮球组 书画组 乐器组 高一 4530a高二15 10 20学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a 的值为________.解析: 根据分层抽样各层抽样比是一样的,则有30120+a =1260,解得a =30.答案:308.某服装商场为了了解毛衣的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4月平均气温x (℃) 17 13 8 2 月销售量y (件)24334055由表中数据算出线性回归方程y ^=b ^x +a ^中的b ^≈-2.气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月毛衣的销售量约为________件.解析:x -=17+13+8+24=10,y -=24+33+40+554=38,a ^=y --b ^x -=58,所以下个月的平均气温约为6 ℃,下个月的销售量估计值为y ^=b ^x +a ^=58-12=46.答案:469.从甲、乙两种棉花苗中各抽10株,测得它们的株高分别如下(单位:cm): 甲:25 41 40 37 22 14 19 39 21 42 乙:27 16 44 27 44 16 40 40 16 40 估计两种棉花苗总体的长势: (1)哪种棉花的苗长得高一些? (2)哪种棉花的苗长得整齐一些?解:(1) x -甲=110(25+41+40+37+22+14+19+39+21+42)=30,x -乙=110(27+16+44+27+44+16+40+40+16+40)=31,从棉花株样本的平均数来看,乙苗长得高一些.(2)s2甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=104.2;同样s2乙=128.8,所以s2甲<s2乙.即s甲<s乙.因此,甲苗株高较平稳,即甲苗长得整齐一些.10.某车站在春运期间为了了解旅客购票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的分组频数频率一组0≤t<500二组5≤t<10100.10三组10≤t<1510②四组15≤t<20①0.50五组20≤t≤25300.30合计100 1.00解答下列问题:(1)这次抽样的样本容量是多少?(2)在表中填写出缺失的数据并补全频率分布直方图;(3)旅客购票用时的平均数可能落在哪一组?解:(1)样本容量是100.(2)①50②0.10所补频率分布直方图如图中的阴影部分:(3)设旅客平均购票用时为t min,则有0×0+5×10+10×10+15×50+20×30100≤t <5×0+10×10+15×10+20×50+25×30100,即15≤t <20.所以旅客购票用时的平均数可能落在第四组.[B.能力提升]1.某校共有学生2 000名,各年级男、女生人数如下表,现用分层抽样的方法在全校抽取64A.24 B .18 C .16D .12解析:选C.一、二年级的人数为750+750=1 500,所以三年级人数为2 000-1 500=500, 又64∶2 000=4∶125,因此三年级应抽取人数为500×4125=16.2.总体容量为832, 若采用系统抽样, 当抽样间隔为多少时不需要剔除个体( ) A .12B .13C .14D .15解析:选B.因为分段间隔k =N n ,所以n =N k =83213=64.故选B.3.一个容量为100的样本,其数据的分组与各组的频数如下表则样本数据落在(10,40]上的频率为________.解析:由题意可知频数在(10,40]的有13+24+15=52,由频率=频数÷总数可得,样本数据落在(10,40]上的频率为0.52.答案:0.52 4.(2015·寿光高一检测)从甲、乙两个品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:甲品种:271 273 280 285 285 287 292 294 295 301 303 303 307 308 310 314 319 323325 325 328 331 334 337 352乙品种:284 292 295 304 306 307 312 313 315 315 316 318 318 320 322 322 324 327329331333336337343356由以上数据设计的茎叶图如图所示:根据以上茎叶图,对甲、乙两个品种棉花的纤维长度作比较,写出两个统计结论:(1)________________________________________________________________________________________________________________________________________________;(2)________________________________________________________________________________________________________________________________________________.解析:由茎叶图可以看出甲品种棉花的纤维长度比较分散,乙品种棉花的纤维长度比较集中(大部分集中在312~337之间)等,通过分析可以得到答案.答案:(1)从茎叶图上看,甲品种棉花的纤维长度较分散,而乙品种棉花的纤维长度比较集中(2)甲品种棉花的纤维长度中位数是307,乙品种棉花的纤维长度中位数是318,并且它们的对称性较好,因此乙品种的平均长度大于甲品种的平均长度5.以下是在某地搜集到的不同楼盘新房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:房屋面积x(m2)11511080135105销售价格y(万元)24.821.619.429.222(1)画出数据对应的散点图;(2)判断新房屋的销售价格和房屋面积之间是否具有相关关系?如果有相关关系,是正相关还是负相关?解:(1)数据对应的散点图如图所示:(2)通过以上数据对应的散点图可以判断,新房屋的销售价格和房屋的面积之间具有相关关系,且是正相关.6.(选做题)(2014·高考广东卷)某车间20名工人年龄数据如下表:年龄(岁)工人数(人)19 128 329 330 531 432 3401合计20(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.解:(1)这20名工人年龄的众数为:30;这20名工人年龄的极差为:40-19=21.(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下:(3)这20名工人年龄的平均数为:(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;所以这20名工人年龄的方差为:12+320(30-28)2+320(30-29)2+520(30-30)2+420(30-31)2+320(30-32)2+120(30-40)2 20(30-19)=12.6.(时间:100分钟,满分:120分)一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列说法错误的是()A.在统计里,最常用的简单随机抽样方法有抽签法和随机数法B.一组数据的平均数一定大于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越大解析:选B.平均数不大于最大值,不小于最小值.2.已知某乡农田有山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩.现抽取农田480亩估计全乡农田粮食平均亩产量,则采用________抽样比较合适.( )A .抽签法B .随机数表法C .系统抽样法D .分层抽样法解析:选D.该乡农田由差异明显的四种类型组成,应采用分层抽样法.故选D.3.有一个容量为80的样本,数据的最大值是140,最小值是51,组距为10,则可以分为( ) A .10组 B .9组 C .8组D .7组解析:选B.据题意:最大值与最小值的差为89,8910=8.9,故应分9组较合适.4.某学校有老师200人,男学生1 200人,女学生1 000人,现用分层抽样的方法从全体师生中抽取一个容量为n 的样本,已知女学生一共抽取了80人,则n 的值是( )A .193B .192C .191D .190解析:选B. 1 000×n 200+1 200+1 000=80,解得n =192.5.某班学生父母年龄的茎叶图如图,左边是父亲年龄,右边是母亲年龄,则该班同学父亲的平均年龄比母亲的平均年龄大( )A .2.7岁B .3.1岁C .3.2岁D .4岁解析:选C.分别求出父亲年龄和母亲年龄的平均值,可得父亲的平均年龄比母亲的平均年龄大3.2岁,故选C.6.在某项体育比赛中,七位裁判为一选手打出的分数如下:90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( ) A .92,2 B .92,2.8 C .93,2 D .93,2.8解析:选B.去掉最高分95,最低分89,所剩数据的平均值为15(90×2+93×2+94)=92,方差s 2=15[(90-92)2×2+(93-92)2×2+(94-92)2]=2.8.7.(2014·高考湖北卷)根据如下样本数据x 3 4 56 7 8 y4.02.5-0.50.5-2.0-3.0得到的回归方程为y ^=bx +a ,则( ) A .a >0,b >0 B .a >0,b <0 C .a <0,b >0D .a <0,b <0解析:选B.作出散点图如下:观察图象可知,回归直线y ^=bx +a 的斜率b <0,当x =0时,y ^=a >0.故a >0,b <0. 8.小波一星期的总开支分布如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为( )图1图2A .1%B .2%C .3%D .5%解析:选C.由图2知,小波一星期的食品开支为300元,其中鸡蛋开支为30元,占食品开支的10%,而食品开支占总开支的30%,所以小波一星期的鸡蛋开支占总开支的百分比为3%,故选C.9.某校高一、高二年级各有7个班参加歌咏比赛,他们的得分的茎叶图如图所示,对这组数据分析正确的是( )A .高一的中位数大,高二的平均数大B .高一的平均数大,高二的中位数大C .高一的平均数、中位数都大D .高二的平均数、中位数都大解析:选A.由茎叶图可以看出,高一的中位数为93,高二的中位数为89,所以高一的中位数大.由计算得,高一的平均数为91,高二的平均数为6477,所以高二的平均数大.故选A. 10.(2014·高考山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18 解析:选C.志愿者的总人数为20(0.16+0.24)×1=50,所以第三组人数为50×0.36=18,有疗效的人数为18-6=12.二、填空题(本大题共5小题,每小题4分,共20分.把答案填在题中的横线上) 11.(2014·高考天津卷)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.解析:根据题意,应从一年级本科生中抽取的人数为44+5+5+6×300=60.答案:60 12.(2015·广州调研)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的数字特征(众数、中位数、平均数、方差)对应相同的是________.解析:由s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],可知B 样本数据每个变量增加2,平均数也增加了,但s 2不变,故方差不变.答案:方差13.某校开展“爱我济宁,爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示,记分员去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x 应该是________.解析:最低分为88,最高分若为90+x ,则计算平均分x -=6407≠91,所以最高分应为94,则有91×7-(89×2+92×2+93+91)=91,∴x =1.答案:114.已知回归方程y =4.4x +838.19,则可估计x 与y 的增长速度之比约为________.解析:x 与y 的增长速度之比应是回归方程斜率的倒数,即522.答案:52215.某校从参加高一年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的部分频率分布直方图.在统计方法中,同一组数据常用该组区间的中点值作为代表,观察图形的信息,据此估计本次考试的平均分为________.解析:在频率分布直方图中,所有小长方形的面积和为1,设[70,80)的小长方形面积为x ,则(0.01+0.015×2+0.025+0.005)×10+x =1,解得x =0.3,即该组频率为0.3,所以本次考试的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.答案:71三、解答题(本大题共5小题,共50分.解答时应写出必要的文字说明、证明过程或演算步骤) 16.(本小题满分8分)有以下三个案例:案例一:从同一批次同类型号的10袋牛奶中抽取3袋检测其三聚氰胺含量;案例二:某公司有员工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.从中抽取容量为40的样本,了解该公司职工收入情况;案例三:从某校1 000名高一学生中抽取10人参加一项主题为“学雷锋,树新风”的志愿者活动.(1)你认为这些案例应采用怎样的抽样方式较为合适? (2)在你使用的分层抽样案例中写出抽样过程;(3)在你使用的系统抽样案例中按以下规定取得样本编号:如果在起始组中随机抽取的号码为L(编号从0开始),那么第K 组(组号K 从0开始,K =0,1,2,…,9)抽取的号码的百位数为组号,后两位数为L +31K 的后两位数.若L =18,试求出K =3及K =8时所抽取的样本编号.解:(1)案例一用简单随机抽样,案例二用分层抽样,案例三用系统抽样. (2)①分层,将总体分为高级职称、中级职称、初级职称及其余人员四层; ②确定抽样比例k =40800=120;③按上述比例确定各层样本数分别为8人、16人、10人、6人; ④按简单随机抽样方式在各层确定相应的样本; ⑤汇总构成一个容量为40的样本.(3)K =3时,L +31K =18+31×3=111,故第三组样本编号为311.K =8时,L +31K =18+31×8=266,故第8组样本编号为866.17.(本小题满分8分)某制造商为运动会生产一批直径为40 mm 的乒乓球,现随机抽样检查20只,测得每只球的直径(单位:mm ,保留两位小数)如下:40.02 40.00 39.98 40.00 39.99 40.00 39.98 40.01 39.98 39.99 40.00 39.99 39.95 40.01 40.02 39.98 40.00 39.99 40.00 39.96(1)(2)假定乒乓球的直径误差不超过0.02 mm为合格品,若这批乒乓球的总数为10 000只,试根据抽样检查结果估计这批产品的合格只数.解:(1)分组频数频率频率组距[39.95,39.97) 2 0.10 5[39.97,39.99) 4 0.20 10[39.99,40.01) 10 0.50 25[40.01,40.03] 4 0.20 10合计20 1 50(2)∵抽样的20只产品中在[39.98,40.02]范围内有18只,∴合格率为1820×100%=90%,∴10 000×90%=9 000(只).即根据抽样检查结果,可以估计这批产品的合格只数为9 000.18.(本小题满分10分)甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲:82 81 79 78 95 88 93 84 乙:92 95 80 75 83 80 90 85 (1)用茎叶图表示这两组数据;(2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中选两个)考虑,你认为选派哪位学生参加合适?请说明理由.解:(1)作出茎叶图如下:(2)x -甲=18(78+79+81+82+84+88+93+95)=85,x -乙=18(75+80+80+83+85+90+92+95)=85.s 2甲=18[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,s 2乙=18[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41.∵x -甲=x -乙,s 2甲<s 2乙,∴甲的成绩较稳定,派甲参赛比较合适.19.(本小题满分12分)有5名学生的数学和化学成绩如下表所示:学生学科 A B C D E 数学成绩(x) 8876736663化学成绩(y)78 65 71 64 61 (1)如果y 与x 具有相关关系,求线性回归方程;(2)预测如果某学生数学成绩为79分,他的化学成绩为多少(结果保留整数)?20.(本小题满分12分)(2015·河南三市调研)PM2.5是指环境空气中直径小于等于25微米的颗粒物,对人体健康及环境影响很大.某市2014年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.解:(1)频率分布表:分组频数频率[41,51) 2 2 30[51,61) 1 1 30[61,71) 4 4 30[71,81) 6 6 30[81,91) 10 10 30[91,101) 5 5 30[101,111] 2 2 30(2)频率分布直方图:(3)答对下述两条中的一条即可:(ⅰ)该市一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数共有28天,占当月天数的1415.说明该市空气质量基本良好.(ⅱ)轻微污染有2天,占当月天数的115.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.。

人教A版高中数学必修3《第二章 统计 小结》_0

人教A版高中数学必修3《第二章 统计 小结》_0

第二章统计本章小结学习目标1.正确理解随机抽样的概念;掌握抽签法、随机数法的一般步骤;能够从现实生活或其他学科中提出具有一定价值的统计问题;在解决统计问题的过程中,学会用简单随机抽样的方法从总体中抽取样本.2.通过对现实生活和其他学科中统计问题的提出,体会数学知识与现实世界及各学科知识之间的联系,认识数学的重要性.3.正确理解系统抽样与简单随机抽样的关系;通过对实际问题的探究,归纳应用数学知识解决实际问题的方法,理解分类讨论的数学方法.4.掌握分层抽样的一般步骤;区分简单随机抽样、系统抽样和分层抽样,并选择适当的方法进行抽样.通过对现实生活中实际问题进行分层抽样,感知应用数学知识解决实际问题的方法.感悟由具体到一般的研究方法,培养归纳概括能力.5.通过实例体会频率分布直方图的特征,能准确地作出对总体的估计.通过对样本分析和总体估计的过程,感受实际生活需要数学,认识数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.6.了解回归方程的建立步骤以及作用.合作学习一、典型题归纳(一)判断抽样方法及其过程【例1】某政府机关在编人员共100人,其中副处级以上干部10人,一般干部20人,普通工作人员70人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人进行调查,下列方法最合适的是()A.系统抽样B.简单随机抽样C.分层抽样D.随机数法【例2】下列说法正确的个数是()①总体的个体数不多时宜用简单随机抽样法②在总体均分后的每一部分进行抽样时,采用的是简单随机抽样③百货商场的抓奖活动是抽签法④整个抽样过程中,每个个体被抽到的机率相等(有剔除时例外)A.1B.2C.3D.4(二)频率分布直方图【例3】某中学高一女生共有450人,为了了解高一女生的身高情况,随机抽取部分高一女生测量身高,所得数据(单位:cm)整理后列出频率分布表如下:(1)求出表中字母m,n,M,N所对应的数值;(2)画出频率分布直方图;(3)估计该校高一女生身高在149.5~165.5cm范围内有多少人?【例4】对某电子元件进行寿命追踪调查,情况如下:(1)列出频率分布表;(2)画出频率分布直方图;(3)估计电子元件寿命在400h以上的概率.(三)回归方程【例5】下面变量间具有相关关系的是()A.出租车费与行驶的里程B.房屋面积与房屋价格C.身高与体重D.铁的大小与质量【例6】下表提供了某厂节能降耗技术改造后,生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y关于x的回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?二、章末巩固(一)选择题(每小题4分,共48分)1.①学校为了了解高一学生情况,从每班抽2人进行座谈;②一次数学竞赛中,某班有10人成绩在110分以上,40人成绩在90~100分,12人成绩低于90分.现从中抽取12人了解有关情况;③运动会服务人员为参加400m决赛的6名同学安排跑道.就这三件事,合适的抽样方法为()A.分层抽样,分层抽样,简单随机抽样B.系统抽样,系统抽样,简单随机抽样C.分层抽样,简单随机抽样,简单随机抽样D.系统抽样,分层抽样,简单随机抽样2.下列说法中,正确的是()①数据4,6,6,7,9,4的众数是4和6;②平均数、众数与中位数从不同的角度描述了一组数据的集中趋势;③平均数是频率分布直方图的“重心”;④频率分布直方图中各小长方形的面积等于相应各组的频数.A.①②③B.②③C.②④D.①③④3.下列各图中的两个变量具有线性相关关系的是()4.某大学数学系共有本科生5000人,其中一、二、三、四年级的人数比为4∶3∶2∶1,要用分层抽样的方法从所有本科生中抽取一个容量为200的样本,则应抽取三年级的学生人数为()A.80B.40C.60D.205.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年进球数的标准差为3;乙队平均每场进球数是1.8,全年进球数的标准差为0.3.下列说法中,正确的个数为()①甲队的技术比乙队好;②乙队发挥比甲队稳定;③乙队几乎每场都进球;④甲队的表现时好时坏.A.1B.2C.3D.46.已知200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[60,70)内的汽车辆数大约是()A.8B.80C.65D.707.设有两组数据x1,x2,…,x n与y1,y2,…,y n,它们的平均数分别是和,则新的一组数据2x1-3y1+1,2x2-3y2+1,…,2x n-3y n+1的平均数是()A.2-3B.2-3+1C.4-9D.4-9+18.某校高一、高二年级各有7个班参加歌咏比赛,他们得分的茎叶图如图所示,对这组数据分析正确的是()A.高一的中位数大,高二的平均数大B.高一的平均数大,高二的中位数大C.高一的平均数、中位数都大D.高二的平均数、中位数都大9.:则y 对x 的回归方程为( )A. ^=x-1B. ^=x+1C. ^=88+xD. ^=17610.某工厂对一批产品进行了抽样检测,根据抽样检测后的产品净重(单位:g)数据绘制了频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100 g 的个数是36,则样本中净重大于或等于98 g 并且小于104 g 的产品个数是( )A.90B.75C.60D.4511.为了了解某校高中学生的近视眼发病率,在该校学生中进行分层抽样调查,已知该校高一、高二、高三分别有学生800名、600名、500名,若从高三学生中共抽取25名,则从高一学生中抽取的人数是( )A.30B.40C.60D.7512.某校开展“爱我中华,爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示,记分员去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是( )A.4B.3C.2D.1 (二)填空题(每小题3分,共12分)13.)之间有如下一组数据:则回归方程为 .14.其中产量比较稳定的小麦品种是.15.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.估计这次测试中数学成绩的平均分为.16.从某校1000名高一学生中抽取10人参加一项主题为“学雷锋,树新风”的志愿者活动.在使用的系统抽样案例中按以下规定取得样本编号:如果在起始组中随机抽取的号码为L(编号从0开始),那么第K组(组号K从0开始,K=0,1,2,…,9)抽取的号码的百位数为组号,后两位数为L+31K的后两位数.若L=18,则K=8时所抽取的样本编号为.(三)解答题(每小题10分,共40分)17.某制造商为运动会生产一批直径为40mm的乒乓球,现随机抽样检查20个,测得每个球的直径(单位:mm,保留两位小数)如下:40.0240.0039.9840.0039.9940.0039.9840.0139.9839.9940.0039.9939.9540.0140.0239.9840.0039.9940.0039.96(1)(2)假定乒乓球的直径误差不超过0.02mm为合格品,若这批乒乓球的总数为10000,试根据抽样检查结果估计这批产品的合格数.18.某班甲、乙两学生的高考备考成绩(单位:分)如下:甲:512554528549536556534541522538乙:515558521543532559536548527531(1)用茎叶图表示两学生的成绩;(2)分别求两学生成绩的中位数和平均数.19.农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高(单位:cm),数据如下:甲:9,10,11,12,10,20乙:8,14,13,10,12,21(1)画出所抽取的甲、乙两种麦苗株高的茎叶图;(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况.20.一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表为抽样试验的结果:(1)画出散点图;(2)如果y对x有线性相关关系,求回归方程;(3)若实际生产中,允许每小时生产的产品中有缺点的零件最多为10个,那么机器的运转速度应控制在什么范围内?参考答案一、典型题归纳(一)判断抽样方法及其过程【例1】C【例2】C(二)频率分布直方图【例3】解:(1)由题意得M==50,落在区间165.5~169.5内数据频数m=50-(8+6+14+10+8)=4,频率为n=0.08,N=1.00.(2)频率分布直方图如下:(3)该校高一女生身高在149.5~165.5cm之间的比例为0.12+0.28+0.20+0.16=0.76,则该校高一女生在此范围内的人数为450×0.76=342.【例4】解:(1)(2)频率分布直方图如图:(3)由频率分布表可知,寿命在400h以上的电子元件出现的频率为0.20+0.15=0.35,故估计电子元件寿命在400h以上的概率为0.35.(三)回归方程【例5】C【例6】解:(1)散点图如图:(2)=4.5,=3.5,^----=0.7,^=3.5-0.7×4.5=0.35,∴回归方程为 ^=0.7x+0.35.(3)90-(0.7×100+0.35)=19.65(t), ∴降低了19.65吨标准煤. 二、章末巩固 (一)选择题1.D2.A3.B4.B5.D6.B7.B8.A9.C 10.A 11.B 12.D (二)填空题13. ^=6.5x+17.5 14.甲 15.72 16.866 (三)解答题 17.解:(1)(2)∵抽样的20个产品中在[39.98,40.02]范围内的有18个, ∴合格率为×100%=90%,∴10 000×90%=9 000(个).即根据抽样检查结果可以估计这批产品的合格数为9 000.18.解:(1)两学生成绩的茎叶图如图所示:(2)将甲、乙两学生的成绩从小到大排列为甲:512 522 528 534 536 538 541 549 554 556 乙:515 521 527 531 532 536 543 548 558 559从以上排列可知甲学生成绩的中位数为=537(分),乙学生成绩的中位数为=534(分).甲学生成绩的平均数为 500+=537(分),乙学生成绩的平均数为 500+=537(分).19.解:(1)茎叶图如图所示:(2) 甲=12(cm),乙=13(cm),甲 ≈13.67, 乙 ≈16.67.因为 甲 乙,所以乙种麦苗平均株高较高,又因为 甲 乙 ,所以甲种麦苗长得较为整齐. 20.解:(1)散点图如下:(2)由散点图可知,设所求回归方程为 ^^x+ ^,则由上表可得^- -,^=8.25-×12.5=-.所以回归方程为 ^x-.(3)由y ≤10,得x-≤10,解得x ≤14.9,所以机器的运转速度应控制在14.9转/秒内.。

高中数学 第二章 统计本章小结 新人教A版必修3

高中数学 第二章 统计本章小结 新人教A版必修3

【金版学案】2015-2016学年高中数学第二章统计本章小结新人教A版必修3知识网络构建热点专题聚焦抽样方法的学习与应用►专题归纳三种抽样方法的概念和抽样方法的具体实施以及三种抽样方法的区别与联系是本部分的基础知识和重要内容.三种抽样方法的特点:(1)简单随机抽样.①要求被抽取样本的总体的个数有限,以便于对其中各个个体被抽取的可能性进行分析,一般地,从个体数为N的总体中抽取一个容量为n的样本,每个个体被抽取的机会是均等的.②从总体中逐个不放回地抽取,易操作,且抽样方法比较简单,所以成为其他较复杂的抽样方法的基础.③简单随机抽样体现了抽样的客观性与公平性.(2)系统抽样.①系统抽样与简单随机抽样的联系在于:在总体均分后的每一部分进行抽样时,采用的是简单随机抽样.②整个抽样过程中,每个个体被抽取的机会均等.(3)分层抽样.①它适用于总体由差异明显的几部分组成的情况.②在每一层进行抽样时,采用简单随机抽样或系统抽样.③分层抽样充分利用已掌握的信息,使样本具有良好的代表性.分层抽样也是机会均等抽样,而且在每层抽样时,可以根据具体情况采用不同的抽样方法,因此应用较为广泛.►例题分析一批产品,有一级品100个,二级品60个,三级品40个,分别用系统抽样和分层抽样方法,从这批产品中抽取一容量为20的样本.解析:系统抽样方法:将200个产品编号后,随机地分为20个组,每组10个产品,从号码为1~10的第一组中随机抽取1个号码,假如抽到的是6号,然后从6号开始,每隔10个号码抽取1个,得到6,16,26,…,196,这样就得到容量为20的一个样本.分层抽样方法:∵一、二、三级品的个数之比为5∶3∶2,∴需要从一级品中抽取510×20=10(个),二级品中抽取310×20=6(个),三级品中抽到210×20=4(个). ►跟踪训练1.某服装厂平均每小时大约生产服装362件,要求质检员每小时抽取40件服装检验其质量状况,请你设计一个调查方案.解析:因为总体中的个体数较多,并且总体是由没有明显差异的个体组成,所以本题宜采用系统抽样法.第一步,把这些服装分成40组,由于36240的商是9,余数是2,所以每个组有9件服装还剩2件服装,这时分段间隔就是9.第二步,先用简单随机抽样的方法从这些服装中抽取2件服装不进行检验. 第三步,将剩下的服装进行编号,编号分别为0,1,2, (359)第四步,从第一组(编号分别为0,1,…,8)的服装中按照简单随机抽样的方法抽取1件服装,比如,编号为k .第五步,依次抽取编号分别为下面数字的服装k ,k +9,k +18,k +27,…,k +39×9,这样就抽取了一个容量为40的样本.2.在120个零件中,一级品24个,二级品36个,三级品60个,从中抽取容量为20的样本,则总体中每个个体被抽取的机会是多少?解析:因为总体中的个体数N =120,样本容量n =20,故每个个体被抽取的机会为16.3.经问卷调查,某班学生对摄影分别执“喜欢”、“不喜欢”和“一般”三种态度,其中执“一般”态度的比“不喜欢”态度的多12人,按分层抽样方法从全班选出部分学生座谈摄影,如果选出的5位“喜欢”摄影的同学、1位“不喜欢”摄影的同学和3位执“一般”态度的同学,那么全班学生中“喜欢”摄影的比全班人数的一半还多________人.解析:设班里“喜欢”摄影的同学有y 人,“一般”的有x 人,“不喜欢”的有x -12人,则⎩⎪⎨⎪⎧x -12x =13,y x =53, 解得⎩⎪⎨⎪⎧x =18,y =30.∴全班共有30+18+6=54人,又30-542=3.∴“喜欢”摄影的比全班人数的一半还多3人. 答案:3统计图、表及其应用►专题归纳收集、整理与分析以及处理数据的能力是信息时代每一个公民基本素养的一部分.统计所提供的“运用数据进行推断”的思考方法已经成为现代社会一种普遍适用并且强有力的思维方式.统计图表就是表达和分析数据的重要工具,它不仅可以帮助我们从数据中获得有用的信息,还可以帮助我们直观、准确地理解相应的结果.用样本估计总体的方法在高中数学中主要有频率分布表、频率分布直方图、频率分布折线图、总体密度曲线、茎叶图等.►例题分析为了保护学生视力,教室内的日光灯在使用一段时间后必须更换,已知某校使用的天数/天151~180181~210211~240241~270271~300301~330331~360361~390灯管数/只111182025167 2 试估计这种日光灯的平均使用寿命.若定期更换,可选择多长时间统一更换合适?解析:总体的平均数与标准差往往是很难求的,甚至是不可求的,通常的做法是用样本的平均数与标准差去估计总体的平均数与标准差.各组中值分别为165,195,225,255,285,315,345,375,由此可算得平均数约为:165×1%+195×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天).将组中值对于此平均数求方差得:1100×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2 128.60(天2) 故标准差为 2 128.60≈46(天).答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天,故可在222天到314天左右统一更换较合适.甲、乙两人在相同条件下打靶十次,每次打靶的成绩情况如下图:(1)请填写下表:平均数中位数命中9环以上次数甲7乙(2)从下列三个不同角度对这次测验结果进行分析:从平均数和中位数相结合看,谁的成绩好些?从平均数和命中9环以上的次数相结合看,谁的成绩好些?从折线图两人射击命中环数的走势看,谁更有潜力?解析:(1)甲的数据为:2,4,6,7,7,8,8,9,9,10,所以甲的中位数为7.5,命中9环以上次数为3.乙的数据为:5,6,6,7,7,7,7,8,8,9,所以乙的平均数为7,乙的中位数为7,命中9环以上次数为1.(2)从平均数和中位数相结合看,甲成绩比乙稳定;从平均数和命中9环以上的次数相结合看,甲成绩比乙好一些;从折线图两人射击命中环数的走势看,甲的潜力更大一些.►跟踪训练4.某公司销售部有营销人员15人,销售部为了制订某种商品的月销售定额,统计了这15人某月的销售量(如下表):每人销售件数/件1800510250210150120人数/人11353 2(1)求这15位营销人员该月销售量的平均数、中位数和众数;(2)假设销售部负责人把每位营销人员的月销售额定为320件,你认为是否合理,为什么?如不合理,请你制订一个较合理的销售定额.解析:(1)由表可知平均数x=115(1 800×1+510×1+250×3+210×5+150×3+120×2)=320(件).中位数为210(件),众数为210(件).(2)不合理.因为15人中就有13人的销售额达不到320件,也就是说320虽是这一组数据的平均数,但它却不能反映营销人员的一般水平.销售额定为210件要合理些.这是由于210既是中位数,又是众数,是绝大部分人都能达到的定额.5.公交车的数量太多容易造成资源的浪费,太少又难以满足乘客的需求.为此,公交公司在某站台随机调查了80名乘客,他们的候车时间如下所示(单位:分):17 14 20 12 10 24 18 17 1 2213 19 28 5 34 7 25 18 28 115 31 12 11 10 16 12 9 10 1319 10 12 12 16 22 17 23 16 1516 11 9 3 13 2 18 22 19 923 28 15 21 28 12 11 14 15 311 6 2 18 25 5 12 15 20 1612 28 20 12 28 15 8 32 18 9(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率折线图.(2)这80名乘客候车时间的平均数是多少?标准差呢?(3)你能为公交公司提出什么建议?解析:时间分组频数频率[0,5)60.075[5,10)90.1 175[10,15)220.275[15,20)220.275[20,25)100.125[25,30)80.100[30,35)30.0 375频率分布直方图如下所示:频率折线图如下所示:(2)这80名乘客候车时间的平均数是15.475 min,标准差约是7.5.(3)公交公司可以适当增加公交车的数量.回归分析及其应用►专题归纳回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.相关性问题是日常生活中普遍存在的问题.生活中有些变量之间存在着明显的函数关系,有些变量之间不满足函数关系,但是它们之间又存在着一种明显的依赖关系.利用回归分析的方法对两个具有线性相关关系的变量研究的步骤为:(1)画出这两个变量的散点图;(2)求回归直线方程;(3)利用回归直线方程进行预报.某农场对单位面积化肥用量x(kg)和水稻相应产量y(kg)的关系作了统计,得到数据如下:x 15202530354045y 330345365405445450455如果x 与y 之间具有线性相关关系,求出回归直线方程,并预测当单位面积化肥用量为32 kg 时,水稻的产量大约是多少(精确到0.01 kg)?解析:用列表的方法计算a 与回归系数b .序号 x y x 2 xy1 15 330 225 4 9502 20 345 400 6 9003 25 365 625 9 1254 30 405 900 12 150 5 35 445 1 225 15 5756 40 450 1 600 18 000 745 455 2 02520 475x =17×(15+20+…+45)=30, y =17×(330+345+…+455)≈399.3,∑x 2i =225+400+…+2 025=7 000,∑x i y i =4 950+6 900+…+20 475=87 175, b ^=87 175-7×30×399.37 000-7×302≈4.746, a ^=399.3-4.746×30=256.92.y 对x 的回归直线方程为y ^=a ^+b ^x =256.92+4.746x .当x =32时,y ^=256.92+4.746×32≈408.79.故所求回归直线方程为y ^=256.92+4.746x .当单位面积化肥用量为32 kg 时,水稻的产量大约为408.79 kg. ►跟踪训练6.高三(1)班学生每周用于数学学习的时间x (单位:h)与数学成绩y (单位:分)之间有x 24 15 23 19 16 11 20 16 17 13 y92799789644783687159某同学每周用于数学学习的时间为18小时,试预测该生数学成绩. 解析:两个有相关关系的变量间的关系可以用线性回归方程来表示,而对总体的预测可由回归直线方程帮助解决.i 1 2 3 4 5 6 7 8 9 10 x i 24 15 23 19 16 11 20 16 17 13 y i 92 79 97 89 64 47 83 68 71 59 x i y i2 2081 1852 2311 6911 0245171 6601 0881 207767于是可得b ^==545.4154.4≈3.53, a ^=y -b ^x =74.9-3.53×17.4≈13.5,因此可求得回归直线方程y ^=3.53x +13.5, 当x =18时,y ^=3.53×18+13.5=77.04≈77, 故该同学预计可得77分左右.。

高中必修三统计知识点整理

高中必修三统计知识点整理

高中数学必修3知识点总结第二章统计2.1.1 简单随机抽样1.简单随机抽样,也叫纯随机抽样。

就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。

特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。

简单随机抽样是其它各种抽样形式的基础。

通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

2.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。

在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。

3.抽签法:(1)给调查对象群体中的每一个对象编号;(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。

4.随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。

2.1.2系统抽样1.系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。

第一个样本采用简单随机抽样的办法抽取。

K(抽样距离)=N(总体规模)/n(样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。

可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。

如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。

2.系统抽样,即等距抽样是实际中最为常用的抽样方法之一。

因为它对抽样框的要求较低,实施也比较简单。

更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。

2.1.3分层抽样1.分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。

人教版高中数学必修三 第二章 统计《简单随机抽样》反思总结

人教版高中数学必修三  第二章 统计《简单随机抽样》反思总结

《简单随机抽样》反思总结
在三种随机抽样方法中,《课程标准》特别重视简单随机抽样,要求学生不仅理解简单随机抽样的涵义,还要能用简单随机抽样方法从总体中抽取样本。

因此,本片段在如何进行简单随机抽样上,花了较长的时间鼓励学生积极讨论,并亲自实践。

教学中没有直接告诉学生简单随机抽样的步骤,而是首先提出了一个学生身边的实际问题,使学生在尝试解决问题的过程中自然产生学习简单随机抽样方法的愿望。

然后组织学生讨论如何进行抽样,并在此基础上,选择抽签法引导学生亲自实践,在实践中解决问题、加深对随机抽样意义的理解。

接着,通过引入另一个例子,学生认识到了抽签法的适用范围及局限性,从而产生了学习新的抽样方法的愿望。

教师利用教材这一资源,鼓励学生通过自学掌握知识,在编制实例中应用知识,在交流中总结运用随机数表进行抽样的一般步骤。

教师还根据实际情况,介绍了有关随机数表的历史,并使用了现代信息技术。

在小结反思中,教师鼓励学生提出问题,鼓励感兴趣的学生进一步对简单随机抽样的方法深入研究。

本片段注重多种教学方式和教学媒体的使用,既有学生的独立思考、合作交流,又有教师的介绍演示;既鼓励学生动手实践,又引导学生独立自学;既有学生对实物的操作,又有现代信息技术的使用。

第1页共1页。

高中数学必修3_第二章_统计_总结

高中数学必修3_第二章_统计_总结

第二章统计一、随机抽样三种常用抽样方法:1.简单随机抽样:设一个总体的个数为N。

如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。

实现简单随机抽样,常用抽签法和随机数表法。

(1)抽签法制签:先将总体中的所有个体编号(号码可以从1到N),并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行均匀搅拌;抽签:抽签时,每次从中抽出1个号签,连续抽取n次;成样:对应号签就得到一个容量为n的样本。

抽签法简便易行,当总体的个体数不多时,适宜采用这种方法。

(2)随机数表法编号:对总体进行编号,保证位数一致;数数:当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等。

在读数过程中,得到一串数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。

成样:对应号签就得到一个容量为n的样本。

结论:①用简单随机抽样,从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时任一个体被抽到的概率为1/N;在整个抽样过程中各个个体被抽到的概率为n/N;②基于此,简单随机抽样体现了抽样的客观性与公平性;③简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样。

2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样)。

系统抽样的步骤可概括为:(1)将总体中的个体编号。

采用随机的方式将总体中的个体编号;(2)将整个的编号进行分段。

为将整个的编号进行分段,要确定分段的间隔k.当N/n是整数时,k=n/N;当N/n不是整数时,通过从总体中剔除一些个体使剩下的个体数N´能被n整除,这时k=N’/n;(3)确定起始的个体编号。

人教A版高中数学必修3《第二章 统计 小结》_0

人教A版高中数学必修3《第二章 统计 小结》_0

1.5.2用样本的数字特征估计总体的数字特征教案1、知识与技能(1)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.(2)会用样本的基本数字特征估计总体的基本数字特征.(3)形成对数据处理过程进行初步评价的意识.在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.3、情感态度与价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.二、教学重点:用样本平均数和标准差估计总体的平均数与标准差.三、教学难点:能应用相关知识解决简单的实际问题.四、教学建议教科书结合实例展示了频率分布的众数、中位数和平均数.对于众数、中位数和平均数的概念,重点放在比较它们的特点,以及它们的适用场合上,使学生能够发现,在日常生活中某些人通过混用这些(描述平均位置的)统计术语进行误导.另一方面,教科书通过思考栏目让学生注意到,直接通过样本计算所得到的中位数与通过频率直方图估计得到的中位数不同.在得到这个结论后,教师可以举一反三,使学生思考对于众数和平均数,是否也有类似的结论.进一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的特点.在知道样本数据的具体数值时,通常通过样本计算中位数、平均值和众数,并用它们估计总体的中位数、均值和众数.但有时我们得到的数据是整理过的数据,比如在媒体中见到的频数表或频率表,用教科书中的方法也可以得到总体的中位数、均值和众数的估计.教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还需要描述样本数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性思维的过程.教科书通过例题向学生展示如何用样本数字特征解决实际问题, 通过小资料栏目“估计二战期间德国坦克的总数”,让学生进一步体会分布的数字特征在实际中的应用.新课导入设计导入一在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?当然不能把所有灯泡一一测试,因为测试后灯泡则报废了.于是,需要通过随机抽样,把这批灯泡的寿命看作总体,从中随机取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征来估计总体的数字特征.导入二用随机抽样的方法获得样本,我们就会得到一组数据,统计思想的本质就是用样本估计总体.用样本估计总体,一般有两种方法:一是用样本的频率分布估计总体分布;二是用样本的数字特征估计总体的数字特征.第一种方法我们已经学习了啦,本节我们继续学习第二种方法.1.创设情景,揭示课题上一节我们学习了用图、表组织样本数据,并且学习了如何通过图、表提供的信息,用样本的频率分布估计总体的分布. 在日常生活中,我们往往并不需要了解总体的分布形态,而是关心总体的某一数字特征,例如:居民月均用水量问题,我们关心的是数字,而不是总体的分布形态.因此我们要通过样本的数据对总体的数字特征进行研究.——用样本的数字特征估计总体的数字特征(板出课题).2.探究:(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?我们初中时学习众数、中位数、平均数等数字特征.我们共同回忆一下?什么是众数、中位数、平均数?众数—一一组数中出现次数最多的数.中位数——将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.平均数——将所有数相加再除以这组数的个数,所得到得数.热身训练:求下列各组数据的众数、中位数、平均数(1)1 ,2,3,3,3,4,6,7,7,8,8,8(2)1 ,2,3,3,3,4,6,7,8,9,9答案:(1)众数是:3和8 中位数是:5 平均数是:5(2)众数是:3 中位数是:4 平均数是:5 例如,在上一节抽样调查的100位居民的月均用水量的数据中,我们如何得知这一组样本数据的众数、中位数和平均数?众数=2.3(t)、中位数=2.0(t)、平均数=1.973(t)那么从频率分布直方图你能得到这些数据的众数,中位数,平均数吗? 3.如何在频率直方图中估计众数、中位数、平均数呢?1)如何从频率分布直方图中估计众数?学生交流讨论,回答从频率分布直方图可以看出:月均用水量的众数是2.25t(最高的矩形的中点),它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.思考1:请大家看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?请学生思考交流,回答这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.显然通过频率分布直方图的估计精度较低,其估计结果与数据分组有关,在不能得到样本数据,只能得到频率分布直方图的情况下,也可以估计总体的特征.归纳总结:因为在频率分布直方图中,各小长方形的面积表示相应各组的频率,也显示出样本数据落在各小组的比例的大小,所以从图中可以看到,在区间[2,2.5)的小长方形的面积最大,即这组的频率是最大的,也就是说月均用水量在区间[2,2.5)内的居民最多,即众数就是在区间[2,2.5)内. 众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标.2) 如何从频率分布直方图估计中位数?表2-1 100为居民的月均用水量(单位:t) 2.20.61.81.21.01.52.02.22.52.82.4 0.8 1.7 1.0 1.0 1.6 2.1 2.3 2.6 2.5 2.4 0.5 1.5 1.2 1.4 1.7 2.1 2.4 2.7 2.6 2.3 0.9 1.6 1.3 1.3 1.8 2.3 2.3 2.8 2.5 2.0 0.7 1.8 1.4 1.3 1.9 2.4 2.4 2.93.04.3 0.8 1.9 3.5 1.4 1.8 2.3 2.4 2.9 3.2 4.1 0.6 1.7 3.6 1.3 1.7 2.2 2.3 2.8 3.3 3.8 0.5 1.5 3.7 1.2 1.6 2.1 2.3 2.7 3.2 0.4 0.3 0.4 0.2 1.2 1.5 2.2 2.2 2.6 3.4 1.6 1.9 1.8 1.6 1.0 1.5 2.0 2.0 2.5 3.1学生交流讨论,回答分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等. 由此可以估计中位数的值.设中位数为x ,则5.05.0)2(22.015.008.004.0=⨯-++++x求出02.2=x在上图中,红色虚线代表居民月平均用水量的中位数的估计值.其左边的直方图的面积是50个单位.右边的直方图的面积也是50个单位.由此可以估计出中位数的值为2.02. 思考2:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(样本数据的频率分布直方图把原始的一些数据给遗失了) 3) 如何从频率分布直方图中估计平均数? 学生交流讨论,回答平均数等于是频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.以上图为例来讲解求解过程;02.202.025.404.075.306.025.314.075.225.025.222.075.115.025.108.075.004.025.0=⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯平均数为2.02由此居民的月用水量的平均数是2.02t.月均用水量/t大部分居民的月均用水量在中部(2.02t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考3:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?让学生讨论,并举例优点:对极端数据不敏感的方法能够有效地预防错误数据的影响.对极端值不敏感有利的例子:如当样本数据质量比较差,即存在一些错误数据(如数据录入错误、测量错误等)时,如:考察表中2-1中的数据如果把最后一个数据错写成22,并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能过有效地预防错误数据的影响.用抗极端数据强的中位数表示数据的中心值更准确.缺点:(1)出现错误的数据也不知道;(2)对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作.这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数作为参考指标,选择平均工资较高且中位数较大的公司就业.4)对众数,中位数,平均数估计总体数字特征的认识(1)样本众数通常用来表示分类变量的中心值,比较容易计算,但是它只能表示样本数据中的很少一部分信息.(2) 中位数不受少数几个极端值的影响, 容易计算,它仅利用了数据排在中间的数据的信息.(3)样本平均数与每个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数,众数都不具有的性质,也正因为这个原因,与众数,中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.探究:“用数据说话”这是我们经常可以听到的一句话.但是数据有时也会被利用,从而产生误导.例如一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多,尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数回答有关工资待遇方面的提问.你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释? 以员工平均工资收入水平去描述他们单位的收入情况.这是不合理的,因为这些员工当中,少数经理层次的收入与大多数一般员工收入的差别比较大,平均数受数据中的极端值的影响大,所以平均数不能反映该单位员工的收入水平.这个老板的话有误导与蒙骗行 例题例:某公司的33名职工的月工资(单位:元)如下表:(1) 求该公司职工月工资的平均数、中位数、众数.(2) 若董事长、副董事长的工资分别从5500元、5000元提升到30000元、20000元,那么公司职工新的平均数、中位数和众数又是什么?(3) 你认为哪个统计量更能反映这个公司员工的工资水平? 解析:(1)公司职工月工资的平均数为:2091336900033201500320005250030002350050005500≈=⨯+⨯+⨯++⨯++=x(元)若把所有数据从大到小排序,则得到:中位数是1500元,众数是1500元.(2)若董事长、副董事长的工资提升后,职工月工资的平均数为:3288331085003320150032000525003000235002000030000≈=⨯+⨯+⨯++⨯++=x (元)中位数是1500元,众位是1500元.(3)在这个问题中,中位数和众数都能反映出这个公司员工的工资水平,因为公司少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.巩固练习假设你是一名交通部门的工作人员,你打算向市长报告国家对本市26个公路项目投资的平均资金数额,其中一条新公路的建设投资为2000万元人民币,另外25个项目的投资是20~100万元。

高中数学必修三教案:第2章+统计复习与小结

高中数学必修三教案:第2章+统计复习与小结

第2章统计复习与小结教学目标:1.结合具体的实际问题情境,理解随机抽样的必要性和重要性.2.学会用简单随机抽样方法从总体中抽取样本;3.通过对实际问题的分析,了解分层抽样和系统抽样方法.教学重点、难点:1.简单随机抽样,分层抽样和系统抽样的准确应用;2.会列频率分布表,画频率分布直方图,频率折线图,茎叶图;3.计算数据的标准差和方差;4.利用散点图直观认识变量间的相关关系.能根据给出的线性回归方程的系数公式建立线性回归方程.教学方法:讲练结合.教学过程:一、复习统计相关知识点1.抽样方法.(1)简单随机抽样(2)系统抽样(3)分层抽样2.样本分布估计总体分布.(1)频率分布表(2)直方图(3)折线图(4)散点图(5)茎叶图3.样本特征数估计总体特征数.(1)平均数(2)方差(标准差)(3)众数(4)中位数二、数学运用例1 在一次有奖明信片的100000个有机会中奖的号码(编号00000—99999)中,邮政部门按照随机抽取的方式确定后两位是23的作为中奖号码,这是运用了________抽样方法.例2 某单位有500名职工,其中不到35岁的有125人,35岁~49岁的有280人,50岁以上的有95人.为了了解该单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本,应该用___________抽样法.例3 某社区有500个家庭,其中高收入家庭125户,中等收入家庭280 户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取1个容量为100户的样本,记做①;某学校高一年级有12名女排运动员,要从中选出3个调查学习负担情况,记做②.那么完成上述2项调查应采用的抽样方法是①__________②______________.例4 某公司生产三种型号的轿车,产量分别为1200辆,6000辆和2000辆.为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取______________辆.例5 两名跳远运动员在10次测试中的成绩分别如下(单位:m):甲:5.58 5.93 6.07 5.91 5.99 6.13 5.89 6.05 6.00 6.19 乙:6.11 6.08 5.83 5.92 5.84 5.81 6.18 6.17 5.85 6.21 试估计哪位运动员的成绩比较稳定.例6 如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)79.5~89.5这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛的及格率(60分及以上为及格)练习:1.如图,是某单位职工年龄(取正整数)的频数分布图,根据图形提供的信息,回答下列问题(直接写出答案)注:每组可含最低值,不含最高值.(1)该单位职工共有多少人?(2)不小于38岁但小于44岁的职工人数占职工总人数的百分比是多少?(3)如果42岁的职工有4人,那么年龄在42岁以上的职工有几人?2.为了解某地初三年级男生的身高情况,从其中的一个学校选取容量为60 的样本(60名男生的身高),分组情况如下:(1)求出表中a,m的值.(2)画出频率分布直方图和频率折线图.三、归纳小结根据简单随机抽样,分层抽样和系统抽样的特点准确应用;会列频率分布表,画频率分布直方图,能够根据数据的平均数及方差对总体估计.精美句子1、善思则能“从无字句处读书”。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


2.3 总体特征数的估计
a1 a2 1.平均数 a n
an
2.方差,标准差
设一组样本数据 x1 , x2 ,
s
2
, xn ,
,其平均数为 x ,则称
s 1 n 2 ( x x ) i n i 1
1 n
2 ( x x ) i i 1
n
为这个样本的方差,其算术平方根
0.026
频率/组距
0.50
0.022
0.018 0.36
0.5 0.0025 0.014
0.010 0.006
0.04 0.05 0.05
[230,250] 5 0.05 0.0025
合计 100
0.002
1
150 170 190 210 230 250 万元
例子: 2009年义乌小商品博览会共设国际标准展位 5000个。为了解展览期间成交状况,现从中抽取若干展 位的成交额(万元),制成如下频率分布表和频率分布 直方图: 试通过直方图估计: 频率/组距 0.50 0.026 (1)众数; 220万元 最高矩形区间中点 212万元 (2)中位数; 面积相等(概率0.5)
的个体个 过程中 数较少 每个个 将总体平均分 在起始部 总体中 体被抽 的 个体 到的可 成几部分,按事 分抽样时, 先确定的规则分 采用 简 单随 个数较多 能性相 同 别在各部分中抽 机抽样 取
将总体分成几 各层抽样时 总体由
分层 抽样
层,按各层个体 采用简单随 数之比抽取 机抽样或系 统抽样
0.022
0.018 0.014 0.36
(3)平均数; 209.4万元 0.010 区间中点与相应概率 之积的和
0.006
0.002 0.04 0.05 0.05
150 170 190 210 230 250 万元
小结:
频率 1.频率直方图中矩形条的面积= 组距 组距=频率;
2.频率分布表 频率直方图 后者更直观 形象地反映样本的分布规律.
为样本的标准差,分别简称样本方差、样本标准差.
小结:1.方差,标准差是用来刻画样本的稳定性;
2.比较的标准——越小越好。
2.4线性相关关系: ˆ bx a 能用直线方程 y 近似表示的相关关系叫做线性相关关系.
线性回归方程: 一般地,设有n个观察数据如下:
x x1 x2 x3
y y1 y2 y3
第8行
(3)从数7开始向右读下去,每次读两位,凡不在01到50中的数跳过 去不读,遇到已经读过的数也跳过去,便可依次得到
12,07,44,39,38,33,21,34,29,42
这10个号码,就是所要抽取的10个样本个体的号码.
小结:
1.抽样无放回; 2.抽样公平性; 3.抽签法,随机数表法—简单的随机抽样.
到大依次分成
50 段,每段 10 人;
定首号 S3:在第一段1~10号中用的 简单随机抽样 的方法
抽取一个号码,比如3;
取余号 S4:依次抽取 3,13,23,33,
„„这50个Βιβλιοθήκη 码。这样就得到了一个容量为50的样本。
2.1 抽样方法
(2).随机数表法:
将总体中的N个个体编号时可以从0开始,例如当N=100时, 编号可以是00,01,02, …,99.这样,总体中的所有个体均可用两位 数字号码表示,便于使用随机数表. 当随机地选定开始的数后,读数的方向可以向右,也可以向 左、向上、向下等.由此可见,用随机数表法抽取样本的步骤是:
(1)对总体中的个体进行编号(每个号码位数一致); (2)在随机数表中任选一个数作为开始; (3)从选定的数开始按一定的方向读下去,得到的数码 若不在编号中,则跳过;若在编号中,则取出;如果得到 的号码前面已经取出,也跳过;如此继续下去,直到取满 为止; (4)根据选定的号码抽取样本.
例子:
下面我们用随机数表法求解本节开头的问题. (1)对50个同学进行编号,编号分别为01,02,03,…,50; (2)在随机数表中随机地确定一个数作为开始,如第8行第29列的 数7开始.为便于说明,我们将附表中的第6行至第10行摘录如下: 第29列
第二章 统计小结
本章回顾(知识结构) 总体 抽样 分析 分 层 抽 样 样 本 分 布 样 本 特 征 数
估计 总 体 分 布
总 体 特 征 数
简 单 随 机 抽 样
系 统 抽 样
2.1 抽样方法 1.简单随机抽样
(1)抽签法 1.将总体中的所有个体编号(号码可以从1到 N); 2.将1到N 这N 个号码写在形状、大小相同的号签上 (号签可以用小球、卡片、纸条等制作); 3.将号签放在同一箱中,并搅拌均匀; 4.从箱中每次抽出1个号签,并记录其编号,连续抽 取k次; 5.从总体中将与抽到的签的编号相一致的个体取出.
3.某校有行政人员、教学人员和教辅 人员共200人,其中教学人员与教辅 人员的比为101,行政人员有24人, 现采取分层抽样容量为50的样本,那 么行政人员应抽取的人数为 ( C ) A3 B4 C6 D8
教学人员和教辅人员应抽取的人数 40 和_____. 4 分别为_____
用样本估计总体
说明: 1.抽样公平性原则—等概率—随机性;
2.抽签法适用与总体中个数N不大的情形.
例题 1 系统抽样(等距抽样) 例子—— . 为了解高一年级 500名同学的视力情况,试用系 统抽样从中抽取50名同学进行检查。 编号 分段
S1:把500人从1到500编号;
500 S2:计算分段间隔为 k= 50 =10 人。把编号从小
1.作样本频率分布直方图的步骤:
(1)求极差; (2)决定组距与组数; (组数=极差/组距) (3)将数据分组;
(4)列频率分布表(分组,频数,频率);
(5)画频率分布直方图。
例子: 2009年义乌小商品博览会共设国际标准展位 5000个。为了解展览期间成交状况,现从中抽取100展 位的成交额(万元),制成如下频率分布表和频率分布 直方图: 频 频率 频率/ 数 组距 [150,170) 4 0.4 0.002 [170,190) 5 [190,210) 36 0.36 0.018 [210,230) 50 0.50 0.025 分组
… …
xn
yn
当a,b使
ˆ bx a 为拟合 取得最小值时,就称 y 这n对数据的线性回归方程,该方程所表 示的直线称为回归直线
.
Q ( y1 bx1 a)2 ( y2 bx2 a)2 ... ( yn bxn a)2
1.已 知 回 归 方 程 y 0.5x 0.81 , 则x 25
说明:
1.适用与总体中个体有明显的层次差异,层次 分明的特点; 2.总体中个体数 N较大时,系统抽样,分层抽样 二者选其一.
以上我们学习了三种抽样方法,这些抽样方法 的特点及适用范围可归纳如下:
类别 特 点 相互联系 适用范围 共同点
总体中 抽样
简单随 从总体中逐个 机抽样 抽取
系统 抽样
2.系统抽样:
系统抽样的步骤为: (1)采用随机的方式将总体中的个体编号; (2)将整个的编号按一定的间隔(设为k)分段, N 当 n (N为总体中的个体数,n为样本容量)是整数 N N 时,k= n ;当 n 不是整数时,从总体中剔除一些个 体,使剩下的总体中个体的个数N′能被n 整除,这 N 时k= ,并将剩下的总体重新编号; n (3)在第一段中用简单随机抽样确定起始的个体编 号l ; (4)将编号为l , l +k,l +2k,…, l +(n-1)k的个 体抽出.
^
11.69 时 ,y的 估 计 值 为 ______.
2.用 最 小 二 乘 法 求 回 归 数 系
n n n x i y i xi yi i 1 i 1 i 1 2 n n 2 n x i xi i 1 1 i _______, __________ a
16 22 77 94 39 84 42 17 53 31 63 01 63 78 59 33 21 12 34 29 57 60 86 32 44 49 54 43 54 82 57 24 55 06 88 16 95 55 67 19 78 64 56 07 82 09 47 27 96 54 17 37 93 23 78 77 04 74 47 67 98 10 50 71 75 52 42 07 44 38 49 17 46 09 62 87 35 20 96 43 21 76 33 50 25 12 86 73 58 07 15 51 00 13 42 90 52 84 77 27 84 26 34 91 64 83 92 12 06 76 44 39 52 38 79 99 66 02 79 54 08 02 73 43 28
2.要从已编号(1~60)的60枚最新 研制的某型导弹中随机抽取6枚来进 行发射试验, 用每部分选取的号码间 隔一样的系统抽样方法确定所选取 的6枚导弹的编号可能是 ( B) A.5,10,15,20,25,30 B.3,13,23,33,43,53 C.1,2,3,4,5,6 D.2,8,14,20,26,32
(1)对总体中的个体进行编号(每个号码位数一致); (2)在随机数表中任选一个数作为开始; (3)从选定的数开始按一定的方向读下去,得到的数码 若不在编号中,则跳过;若在编号中,则取出;如果得到 的号码前面已经取出,也跳过;如此继续下去,直到取满 为止; (4)根据选定的号码抽取样本.
将总体中的N个个体编号时可以从0开始,例如当N=100时, 编号可以是00,01,02, …,99.这样,总体中的所有个体均可用两位 数字号码表示,便于使用随机数表. 当随机地选定开始的数后,读数的方向可以向右,也可以向 左、向上、向下等.由此可见,用随机数表法抽取样本的步骤是:
相关文档
最新文档