必修三数学第二章统计

合集下载

高中高中数学第二章统计2.3.1变量之间的相关关系2.3.2两个变量的线性相关课件新人教A版必修3

高中高中数学第二章统计2.3.1变量之间的相关关系2.3.2两个变量的线性相关课件新人教A版必修3

解:(1)画出散点图.
(2)判断变量x,y是否具有相关关系?如果具有相关关系,那么是正相关还是 负相关?
解:(2)具有相关关系.根据散点图,左下角到右上角的区域,变量x的值由小 变大时,另一个变量y的值也由小变大,所以它们具有正相关关系.
方法技巧 两个随机变量x和y是否具有相关关系的确定方法: (1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断 (如本题); (2)表格、关系式法:结合表格或关系式进行判断; (3)经验法:借助积累的经验进行分析判断.
4
4
解:(2)由表中的数据得: xi yi =52.5, x =3.5, y =3.5, xi2 =54,
i 1
i 1
n
所以 b =
xi yi n x y
i 1
n
xi2

2Hale Waihona Puke nx=52.5 4 3.5 3.5 54 4 3.52
=0.7,
i 1
a = y - b x =3.5-0.7×3.5=1.05,
年份x
储蓄存款 y(千亿元)
2013 5
2014 6
2015 7
2016 8
2017 10
为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2 012,z=y-5 得到表2:
时间代号t
1
2
3
4
5
z
0
1
2
3
5
(1)求z关于t的线性回归方程;
5
5
解:(1) t =3, z =2.2, ti zi=45, ti2 =55,
知识探究
1.相关关系与函数关系不同 函数关系中的两个变量间是一种确定性关系,相关关系是一种不确定性关系. 2.正相关和负相关 (1)正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关 关系,我们就称它为正相关. (2)负相关 在散点图中,点散布在从左上角到右下角的区域,对于两个变量的这种相关 关系,我们就称它为负相关.

高中数学人教A版必修3--第二章 统计本章教材分析教案

高中数学人教A版必修3--第二章  统计本章教材分析教案

第二章统计
本章教材分析
现代社会是信息化的社会,数字信息随处可见,因此专门研究如何收集、整理、分析数据的科学——统计学就备受重视.统计学是研究如何收集、整理、分析数据的科学,它可以为人们制定决策提供依据.在客观世界中,需要认识的现象无穷无尽.要认识某现象的第一步就是通过观察或试验取得观测资料,然后通过分析这些资料来认识此现象.如何取得有代表性的观测资料并能够正确地加以分析,是正确地认识未知现象的基础,也是统计所研究的基本问题.本章主要介绍最基本的获取样本数据的方法,以及几种从样本数据中提取信息的统计方法,其中包括用样本估计总体分布、数字特征和线性回归等内容.从义务教育阶段来看,统计知识的教学从小学到初中分为三个阶段,在每个阶段都要学习收集、整理、描述和分析数据等处理数据的基本方法,教学目标随着学段的升高逐渐提高.在义务教育阶段的统计与概率知识的基础上,《课程标准》要求通过实际问题及情境,进一步介绍随机抽样、样本估计总体、线性回归的基本方法,了解用样本估计总体及其特征的思想,体会统计思维与确定性思维的差异;通过实习作业,较为系统地经历数据收集与处理的全过程,进一步体会统计思维与确定性思维的差异.。

高中数学必修3 第二章《统计》

高中数学必修3 第二章《统计》
样方法是( )C
A. 抽 签 法 B . 随 机 数 表 法 D.分层抽样法
C.系统抽样法
3.某校高中生共有900人,其中高一年级300人,高二
年级200人,高三年级400人,现采取分层抽样抽取容量
为45的样本,那么高一、高二、高三各年级抽取的人数
分别为( )
D
A.15,5,25 B.15,15,15
C, 系统抽样法, 分层抽样法;
D, 简单随机抽样法, 分层抽样法;
5.某中学有学生2000名,高一、高二、高三的学生人数之比 为5:3:2,现要抽取一个容量为200的样本,则学生甲被抽
到的概率是___1_/_1_0________。若高一学生抽取50人,则样本
的容量为____1_0_0_____.
06 16 26 36 46 56
3.分层抽样
当已知总体由差异明显的几部分组成时,为了使样本 充分地反映总体的情况,常将总体分成几部分,然后按照各 部分所占的比例进行抽样。这种抽样叫做分层抽样。
说明:1、分层抽样适用于总体由差异明显的几个部分组成。
2、在每一层进行抽样时,采用简单随机抽样或系统 抽样; 3、分层抽样也是等概率抽样。 4、每一层的个数不同,则抽取的个数也应不同。
150个销售点, 公司为了调查产品销售情况,需从这600个
销售点中抽取容量为100的样本,记这项调查为①; 在C
地区有20个特大型销售点,现从中抽取7个调查它的销售
收入和销后服务情况,记这项调查为②;则完成①,②这两
ห้องสมุดไป่ตู้
项调查应采取的抽样方法依次为( A, 分层抽样法, 系统抽样法;
B)
B, 分层抽样法, 简单随机抽样法;
用系统抽样方法,从某校高二(19)班60人中抽取6人 参加初中招生服务队。

高中数学必修三第二章 统计 本章整合(共35张PPT)课件

高中数学必修三第二章 统计 本章整合(共35张PPT)课件

定义:散点图中的点分布在一条直线附近
相关关系→线性相关
回归方程
求法:最小二乘法求回归方程系数 应用:已知一个变量值预测另一个变量值
专题一 三种抽样方法的比较
简单随机抽样、系统抽样、分层抽样的比较如下表:
类别 共同点
各自特点
联系
适用范围
简单
总体中个

从总体中逐个
体无差异
机抽 样
系统 抽样
分层 抽样
答案:0.02 600
专题三 用样本的数字特征估计总体的数字特征
为了从整体上更好地把握总体的规律,我们还可以通过样本数 据的众数、中位数、平均数和标准差等数字特征对总体的数字特征
作出估计.众数就是样本数据中出现次数最多的那个值;中位数就是 把样本数据按照由小到大(或由大到小)的顺序排列,若数据的个数 是奇数,就是处于中间位置的数;若数据的个数是偶数,就是中间两个 数据的平均数.平均数就是所有样本数据的平均值,用������表示;标准差 是反映样本数据分散程度大小的最常用统计量,其计算公式如下:
提示:分层抽样时,在各层所抽取的样本个数与该层个体数的比 值等于抽样比;系统抽样抽取的号码按从小到大排列后,每一个号码 与前一个号码的差都等于分段间隔.
解析:按分层抽样时,在一年级抽取 108×21700=4(人),在二年级、 三年级各抽取 81×21700=3(人),则在号码段 1,2,…,108 中抽取 4 个号码, 在号码段 109,110,…,189 中抽取 3 个号码,在号码段 190,191,…,270 中抽取 3 个号码,①②③符合,所以①②③可能是分层抽样,④不符合, 所以④不可能是分层抽样;如果按系统抽样时,抽取出的号码应该是 “等距”的,①③符合,②④不符合,所以①③都可能为系统抽样,②④ 都不能为系统抽样.

人教版高一数学必修三第二章统计全部教案和测试题

人教版高一数学必修三第二章统计全部教案和测试题

人教版高一数学必修三第二章统计目录2.1.1 简单随机抽样(新授课)2.1.2 系统抽样(新授课)2.1.3 分层抽样(新授课)2.2.1用样本的频率分布估计总体分布(2课时)(新授课) 2.2.2用样本的数字特征估计总体的数字特征(2课时)(新授课) 2.3.1变量之间的相关关系(新授课)2.3.2两个变量的线性相关(第一课时)(新授课)2.3.2两个变量的线性相关(第二课时)(新授课)2.3.2生活中线性相关实例(第三课时)(新授课)第二章统计单元检测题(一)第二章统计单元检测题(一)参考答案第二章统计单元检测题(二)第二章统计单元检测题(二)参考答案第二章统计单元检测题(三)第二章统计单元检测题(三)参考答案第二章统计一、课程目标:本章主要介绍最基本的获取样本数据的方法,以及集中从样本数据中提取信息的统计方法,其中包括用样本估计总体分布、数字特征和线性回归等内容。

本章通过实际问题,进一步介绍随机抽样、样本估计总体、线性回归的基本方法。

二、学习目标:1、随机抽样(1)能从现实生活或其他学科中提出具有一定价值的统计问题。

(2)结合具体的实际问题情境,理解随机抽样的必要性和重要性。

(3)在参与解决统计问题的过程中,学会用简单随机抽样从总体中抽取样本;通过对实例的分析,了解分层抽样和系统抽样方法。

(4)通过试验、查阅资料、设计调查问卷等方法收集数据。

2、用样本估计总体(1)通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布彪、花频率分布直方图、频率折线图、茎叶土,体会它们各自的特点。

(2)通过实例理解样本数据标准差的意义和作用,学会计算数据样本差。

(3)能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征,并做出合理的解释。

(4)进一步体会用样本估计总体的思想。

(5)会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题。

(6)形成对数据处理过程进行初步评价的意识。

人教版高中数学必修三第二章统计课件PPT2.3

人教版高中数学必修三第二章统计课件PPT2.3

数学 必修3
第二章 统计
学案·新知自解 教案·课堂探究 练案·学业达标
解析:
(1)由题意,可得
x
=12.5,
y
=8.25,
4
xiyi=
438,
4
x2i =660,则

b
i=1
i=1
=4386-604-×41×2.152×.582.25≈0.728 6,a∧= y -b∧ x =-0.857 5. 所以回归直线的方程为∧y=0.728 6x-0.857 5. (2)要使 y≤10,则 0.728 6x-0.857 5≤10, 解得 x≤14.90.所以机器的转速应该控制在 15 转/秒以下.
学案·新知自解 教案·课堂探究 练案·学业达标
转速 x(转/秒)(x∈N*)
16 14 12 8
每小时生产有缺点的零件数 y(件) 11 9 8 5
(1)如果 y 与 x 具有线性相关关系,求回归方程;
(2)若实际生产中,允许每小时的产品中有缺点的零件数最多为 10 个,那么
机器的转速应该控制在什么范围内?
答案: D
数学 必修3
第二章 统计
学案·新知自解 教案·课堂探究 练案·学业达标
3.正常情况下,年龄在 18 岁到 38 岁的人,体重 y(kg)对身高 x(cm)的回归 方程为∧y=0.72x-58.2,张红同学(20 岁)身高 178 cm,她的体重应该在______kg 左右.
解析: 当 x=178 时,∧y=0.72×178-58.2=69.96(kg). 答案: 69.96
第二章 统计
学案·新知自解 教案·课堂探究 练案·学业达标
n
xiyi-n x y
i=1

高中数学第2章统计2.1抽样方法2.1.2系统抽样教案苏教版必修3

高中数学第2章统计2.1抽样方法2.1.2系统抽样教案苏教版必修3

2.1.2 系统抽样整体设计教材分析当总体中个体比拟多,抽签法与随机数表法用于选取样本就比拟烦琐,而且也不能保证样本代表性,所以本节课将要学习又一种新抽样方法——系统抽样.在教学时教师不仅要让学生了解系统抽样概念,而且还要让学生掌握如何进展系统抽样,以及在进展系统抽样时所要注意一些事项,如怎样进展分段,应该分成多少段,分段时如总体个数不能被样本容量整除怎么办等等.在教学中要教会学生会比拟各种方法适用范围与各自优缺点,并会根据实际情况选择恰当抽样方法,且在讲解系统抽样时必须紧扣“每个个体被抽取概率是相等〞理论依据.黑格尔说:“教师是学生心目中‘权威人物’,是儿童心目中最神圣偶像.〞因此,我们教师在教学中要建立民主师生关系,要有意突破常规,让学生敢于在课堂上表现自己,教师也要善于表扬他们.教学时,教师要让学生充分发挥自己潜能,培养他们会对现有知识独立钻研创新精神,并培养他们会用现有知识合理辐射数学思维,得出一些具有个人特色正确结论.三维目标了解系统抽样概念及抽样步骤,会用系统抽样从总体中抽取样本,能运用所学知识判断、分析与选择抽取样本方法.能从现实生活或其他学科提出有价值数学问题,并能加以解决,培养学生运用统计思想表达思考与解决现实世界中问题能力,让学生感受数学美学价值在于鲜活实际应用,立志于学习与研究数学,最大限度地用数学知识效劳于社会,同时自身也能获得最正确生存环境.重点难点教学重点:系统抽样应用.教学难点:对系统抽样中“系统〞思想理解;对样本随机性理解.课时安排1课时教学过程导入新课当总体中个体数比拟多时,采用抽签法或随机数表法那么比拟烦琐,那么该如何抽样?如:某校高一年级共有20个班,每班有50名学生.为了了解高一学生视力状况,从这1 000人中抽取一个容量为100样本进展检查,应该怎样抽取?学生思考,交流讨论,然后代表发言,教师修改总结.推进新课新知探究1.将总体平均分成几个局部,然后按照一定规那么,从每个局部中抽取一个个体作为样本,这样抽样方法称为系统抽样〔systematic sampling〕.2.假设要沉着量为N总体中抽取容量为n样本,系统抽样步骤为:〔1〕采用随机方式将总体中N 个个体编号;〔2〕将编号按间隔k 分段,当n N 是整数时,取k=n N ;当n N 不是整数时,从总体中剔除一些个体,使剩下总体中个体个数N′能被n 整除,这时取k=nN ,并将剩下总体重新编号; 系统抽样与简单随机抽样联系:将总体均分后每一局部进展抽样时,采用是简单随机抽样.系统抽样优点是简便易行,当对总体构造有一定了解时,充分利用已有信息对总体中个体进展排队再抽样,可提高抽样效率;当总体中个体存在一种自然编号时,便于施行系统抽样法.系统抽样缺点是在不了解样本总体情况下,所抽出样本具有一定偏差.〔3〕在第一段中用简单随机抽样确定起始个体编号l ;〔4〕按照一定规那么抽取样本,通常将编号为l,l+k,l+2k,…,l+(n-1)k 个体抽出.应用例如〔多媒体出示题目,学生思考〕例1 一条流水线生产某种产品,每天都可生产128件这种产品,我们要对一周内生产这种产品作抽样检验,方法是抽取这一周内每天下午2点到2点半之间下线8件产品作检验.这里采用了哪种抽取样本方法分析:此抽样选用了“等时〞抽样,与“等间距〞类似而作出判断.解:系统抽样.点评:解决此题要弄清楚目前所学两种抽样概念与特点.例2 某校为了了解全校住校生对学校食堂意见,打算从全校1 000名住校生中抽取50名进展调查,用系统抽样法进展抽取,并写出过程.分析:根据系统抽样步骤可解此题.解:首先将这1 000名学生从1开场进展编号,然后按号码顺1000=20,再从号码1~20第一段中序均分成50段,每段个体数为50用简单随机抽样抽取一个号码,假设抽到是9号,然后从9 开场,每隔20个号码抽取一个,这样就得到容量为50样本编号:9、29、49、…、989,这样,我们就得到一个容量为50样本,这种抽样方法就是系统抽样.N是整数.点评:此题“分段〞比拟方便,因为分段间隔k=n例3 某单位在岗职工共624人,为了调查工人用于上班途中所用时间,决定抽取10%工人进展调查,如何采用系统抽样方法完成这一抽样?分析:总体中每一个个体,都必须等可能地入样.为了实现“等距〞入样,且又等概率,应先剔除,再“分段〞,后定起始数.解:抽样过程如下:〔1〕先将在岗工人624人,用随机方式编号〔如按出生年月日编号〕:000,001,002, (623)〔2〕由题知应抽取62人作为样本,因为624不能被62整除,所以应从总体中剔除4个,将余下620人按编号顺序补齐000,001,002,…,619,并分成62个段,每段10人.〔3〕在第一段000,001,002,…,009这十个编号中,随机定一个起始号l 〔如006〕.〔4〕最后编号为006,016,026,…,59610名工人就为所要抽取样本.点评:1.系统抽样步骤可概括为:〔1〕编号〔采用随机方式将总体中个体编号,为简便起见,有时可直接利用个体所带号码,如考生准考证号、街道上各户门牌号,等等〕.n N 〔N 为总体中个体数,n 为样本容量〕是整数时, k=n N ;当n N 不是整数时,通过从总体中剔除一些个体,使剩下个体数N′能被n 整除,这时k=nN 〕. 〔3〕确定起始个体编号l 〔在第一段用简单随机抽样确定起始个体编号l 〕.〔4〕按照事先确定规那么.......抽取样本〔通常是将l 加上间隔k ,得第二个编号l+k ,再将〔l+k 〕加上k ,得第三个编号l+2k ,这样继续下去,直至获取整个样本〕.“事先确定规那么〞说明不一定按“通常〞方法〔即将l 加上间隔k ,得第二个编号l+k ,再将〔l+k 〕加上k ,得第三个编号l+2k ,这样继续下去,直至获取整个样本〕来抽取样本.2.学生解答,归纳步骤后由学生修改整理,教师巡视点拨,对整理较好同学进展及时表扬或鼓励,激发学生自信.思考:在用系统抽样方法抽样过程中,会用怎样“规那么〞来取除起始号以外其他编号呢?看例4.例4 一个总体中有100个个体,随机编号为0、1、2、 (99)依编号顺序平均分成10个小组,组号依次为1、2、3、…、10,现用系统抽样方法抽取一个容量为10样本,规定如果在第1组随机抽取号码为m,那么在第k(k≥2)组中抽取号码个位数字与m+k个位数字一样.假设m=6,那么第7组中抽取号码为__________________.分析:此题与课本中总结“通常〞方法〔即每隔10抽出一个号码〕有所不同,挖掘点在于条件“第一个号码m之后,在第k组中抽取号码个位数字与m+k个位数字一样〞.解:因为,第1组号码0~9;第2组号码10~19;第3组号码20~29;依次下去第7组中抽取号码十位数字是6.此题要求“在抽取了第一个号码m之后,在第k组中抽取号码个位数字与m+k 个位数字一样〞限制了各组抽出号码个位数.利用m及k值,求出m+k个位数字,即此题中由m=6,k=7得m+k=13,显然,m+k=13个位数字是3,故从第7组中抽取号码是63.所有被抽出号码依次为:6,18,29,30,41,52,63,74,85,96.它们“不等距〞.点评:此题是福建2004年高考卷第15〔文〕题,如果按照系统抽样经历做法“等间距〞做此题话,那么不达.一位教育专家曾指出:学习如果过分地依赖学习者经历或感情世界,即通过纯粹经历积累,而不是通过认知活动对经历进展加工,那么学习将会出现危机,因此必须重视人思维教育.所以,我们在教学时要留足够时间给学生探究,充分暴露学生思维,让学生自己打破思维中过多“经历〞束缚,展示学生创造性学习思维活动过程.知能训练课本本节练习.解答:1.系统抽样中总体与样本比必须是整数,而1 252被50整除余2,因此必须随机剔除2人.应选A.2.具体步骤为:第一步,将1 003名学生,用随机方式编号〔如按出生年月日编号〕:0000,0001,0002,…,1 002.第二步,由题知:应抽取20名学生作为样本,因为1 003不能被20整除,所以应从总体中随机剔除3名学生,将余下1 000名学生按编号顺序补齐为0000,0001,0002,…,0999,并分成20个段,每段50名学生.第三步,在第一段0000,0001,0002,…,0049这50个编号中,随机定一个起始号l〔如0006〕.第四步,编号为0006,0056,0106,…,095620名学生就是所要抽取样本.3.可选择在某个年级进展,如选择高一年级.先将所有学生随机地进展编号;然后将他们分成m段,每段n人〔如总人数不能被均分,可随机地剔除几个人再分〕;再从第一段随机抽取一个号码〔如l〕;那么编号为l,l+n,l+2n,…,l+(m-1)n学生就是需要.最后测量这些学生两臂平展长度及身高,再分别计算两组数据平均数.课堂小结〔先让一位同学总结,其他同学补充,教师完善,并用多媒体展示出来〕(1)系统抽样适用于总体中个数较多情况,因为这时采用简单随机抽样显得不方便.(2)系统抽样与简单随机抽样之间存在着密切联系,即在将总体中个体均分后每一段进展抽样时,采用是简单随机抽样.(3)与简单随机抽样一样,系统抽样也属于等概率抽样.作业为了了解某地参加英语口语水平测试5 027名学生成绩,从中抽取了200名学生成绩进展统计分析,请写出运用系统抽样抽取样本步骤.解:具体步骤为:第一步,将参加计算机水平测试5 027名学生用随机方式编号〔如按准考证编号〕0000,0001, (5026)第二步,由题知:应抽取200人作为样本,因为5 027不能被200整除,所以应从总体中剔除27个,将余下5 000人按编号顺序补齐0000,0001,…,4999,分成200个段,每段25人.第三步,在第一段0000,0001,…,0024这25个编号中,随机定一个起始号l〔如0022〕.第四步,编号为0022,0047,…,4997工人就为所要抽取样本.设计感想由于这局部内容比拟简单,所以整节课以学生为主,尤其是根底在中下游学生,要激发他们学习积极性,从而活泼课堂气氛,使每个学生都全身心投入,动脑、举例.。

最新人教版高中数学必修3第二章统计

最新人教版高中数学必修3第二章统计

“统计”……周计划.下面通过以下几点对本章内容作一简要说明.1.与旧知识的联系.这一章是在初中“统计初步”和高中“概率”的基础上学习的.它所介绍的抽样方法不仅在内容上比初中更为系统和详细,而且运用了刚刚学过的概率知识和观念来表述和解释抽样的有关问题,这样就可以使同学们对抽样问题的理解更加深入.2.内容编排.本章共分4小节.由于抽样是运用统计方法解决问题的第一步,所以第1小节介绍了抽样方法.第2小节与第3小节从两个侧面介绍用样本估计总体的问题,前者介绍如何对总体的分布进行估计,后者介绍如何对总体的特征数进行估计.第4小节是实习作业,它通过综合运用前面知识解决一个简单的实际问题,使同学们初步体会统计知识的实用价值,并使大家的应用能力和动手能力得到锻炼. 3.重点难点.简单随机抽样和用样本的某种特征去估计总体的相应特征,在本章中既是重点又是难点.4.注意事项.本章内容总的来看,所介绍的仍属于统计中的一些极其初步的知识,同学们在学习中应重其所重,轻其所轻,对有关理论不要追根寻底,把握好学习的深浅度.5.学习要求.通过本周的学习大家应达到以下要求:①会用简单随机抽样、系统抽样、分层抽样等常用的抽样方法从总体中抽取样本;②③会用样本频率分布去估计总体分布;④了解累积频率分布的意义,会根据样本的频率分布求得其累积频率分布;⑤通过生产过程中的质量控制图了解假设检验的基本思想.[重点分析和讲解]一、抽样方法1.简单随机抽样(1)概念:一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等.就称这样的抽样为简单随机抽样.(2)具体实施方法:①抽签法先将总体中的所有个体编号,并把号码写在大小形状相同的号签上,然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本.②随机数表法利用随机数表来抽取样本的方法称为随机数表法.(ⅰ)随机数表:若一数表满足下列性质:(a)表中共随机出现0,1,2,……,9这十个数字;(b)表中每个位置上出现各个数字的概率都是相等的,则称此表为随机数表.表中各位置上的数(字)称为随机随机数(字).(ⅱ)随机数表法抽样的步骤从开始数字算起,向左或右、或上或下等方向读取数字,从而获得样本号码(在这应注意,样本号码不应超过总体中的个体号码,否则舍去;样本号码不得重复,否则舍去,直到选够号码).(3)注意事项在简单随机抽样中,不但每次从总体中抽取一个个体时,各个个体被抽取的概率相等,而且在整个抽样过程中,各个个体被抽取的概率也相等(可以证明,如果用简单随机抽样2.系统抽样(1)概念:当总体中的个体数较多时,可将总体成分成均衡的几部分,然后按照预先给定的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样方法叫做系统抽样.(2)步骤:第一步:采用随机的方式将总体中的个体编号.第三步:从第一段中用简单随机抽样确定超始的个体编号L第四步:按照事先的规则从各段内各抽取一个个体,从而获得整个样本.3.分层抽样(1)概念:当已知总体由差异明显的几部分组成时,为了使样本能更充分地反映总体的情况,将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样.其中所分成的各部分叫做层.(2)步骤:第一步:先确定各层及需抽取的个体数(按比例).第二步:在各层中采用简单随机抽样或系统抽样的方法抽取所需的个体.第三步:将各层抽取的个体合在一起,就得到所要抽取的样本. 4.三种抽样方法的联系与区别在三种抽样方法中,简单随机抽样是最简单、最基本的抽样方法,其他两种方法都是建立在它的基础上的;三种抽样方法的共同点是,它们都是等概率抽样,体现了抽样的公平性,三种方法各有其特点和适用范围,在抽样实践中要根据具体情况选用相应的抽样方法.二、总体分布的估计(一)总体分布的估计通常,我们不易知道一个总体的分布情况,在实践中,往往是从总体中抽取一个样本,用样本的频率分布去估计总体分布.1.当总体中的个体所取的不同数值较少时,总体的频率分布表可由所取样本的不同数值及相应的频率来表示,其几何表示为相应的条形图.2.当总体中的个体所取数值较多,甚至无限时,对其频率分布的研究,要用到初中学过的整理数据的知识,得出其频率分布的步骤如下:(1)计算样本数据中最大值与最小值的差;(2)决定组距与组数;(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点.(4)列出频率分布表(5)画出频率分布直方图.3.总体分布与频率分布的关系.(二)累积频率分布1.累积频率:样本数据小于某一数值的频率.2.频率分布和累积频率分布,从不同角度反映了一组数据的分布情况,起着相互补充的作用.3.由于累积频率分布图是一条折线,利用它可以近似得到样本数据任意两端点值之间的频率(它等于这两个端点值的累积频率之差).在累积分布曲线上任意一点P(a , b)的纵坐标b表示总体取小于a 的值概率.(三)生产过程中的质量控制图1.正态总体①什么是正态总体是在连续型总体中,应用最为广泛的一种呈正态分布的总体.②正态总体的概率密度函数式中的μ、σ(σ>0)是参数,分别表示总体的平均数与标准差,正态总体常记作N(μ,σ).③正态总体概率密度函数的图象特征ⅰ)曲线在X轴上方,并且关于直线X=μ对称.ⅱ)曲线在X=μ时于最高点,由这一点向左、右两边延伸时,曲线逐渐降低.ⅲ)曲线的对称轴位置由μ确定,曲线的形状由σ确定.总体分布为标准正态分布.2.小概率事件①什么是小概率事件通常指发生的概率小于5%的事件②小概率事件在一次试验中几乎不可能发生.3.假设检验①基本思想:根据小概率事件在一次试验中几乎不可能发生的原性和从总体中抽测的个体的数值,对事先所作的统计假设作出判断:②假设检验的步骤;ⅰ)提出统计假设ⅱ)确定一次试验中的取值a是否落入范围(μ-3σ,μ+3σ)ⅲ)作出推断三、总体特征数的估计对于总体情况的估计,除用样本的频率分布估计,还需用样本的一些特征数来估计.1.平均数对于总体的平均水平,可用总体平均数来反映,而总体的平均数μ,可用样本平均数估计.2.方差对于总体中数据的波动情况,可用总体方差σ2来反映,而总体方差σ2可用样本方差另外,还可用样本的偏估方差3.标准差对于总体标准差,也可用[典型应用]例1 采用简单随机抽样从含有6个个体的总体中抽取一个容量为3的样本,个体a前两次未被抽到,第三次被抽到的概率是多少?分析此题可视为分步抽取问题也可视为一个定位排列问题,所以可用两种方法来解.解法2 事件“a前两次未被抽到而第三次被抽到”包含的结果:从6个元素中选出例2 某校高中三年级的195名学生已编号为1 ,2 ,3 , (195)为了了解学生的某种情况,要按1:5的比例抽取一个样本.用系统抽样方法进行抽取,并写出过程.解由题意知学生已编号,下面先将整体进行分段.因为按1:5的比例抽取样本,所在第一段用简单随机抽样确定起始的个体编号L,再加上间隔5,依次得到各段的抽取号,所以抽取的样本号依次为:L,L+5,L+10,… ,L+190.例3 一个单位有职工160人,其中业务人员120人,管理人员16人,后勤服务人员24人.为了了解职工的某种情况,要从中抽取一个容量为20的样本.用分层抽样方法抽取样本,并写出过程.解由题意有:样本容量与总体的个数的比为20:160=1:8接下来用系统抽样方法分别抽取业务人员15人,管理人员2人,后勤人员3人,从而获得容量为20的样本.例4 举例说明三种常用抽样方法中,无论使用哪一种抽样方法,总体的每个个体被抽到的概率都相等.解:在100个零件中,一级品20个,二级品30个,三级品50个,从中抽取一个容量为20的样本,下面分别用三种抽样方法来计算总体中每个个体被抽取的概率.(2)系统抽样法:将100个零件分成20组,每组5个零件,每组取出1个,显然例5.为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件.(1)列出样本的频率分布表;(2)画出表示样本频率分布的条形图;(3)根据上述结果,估计此种产品为二级品或三级品的概率约是多少?解:(1)样本频率分布表:(2)条形图:(3)此产品为二级品或三级品的概率为:0.27+0.43=0.7 例6.某产品规定尺寸的偏差统计如下表:(1)完成上面的频率分布表;(2)根据上表,画出频率分布直方图和累积频率分布图;(3)根据上面的表和图,估计数据落在[10.95,11.35)范围内的概率约是多少?数据小于11.20的概率约是多少?解:(1)频率分布表:(2)频率分布直方图:累积频率分布图:(3)数据落在[10.95,11.35)范围的频率为0.13+0.16+0.26+0.20=0.75,故落在[10.95,11.35)的概率约为0.75;由累积频率分布图可知数据小于11.20的频率约为0.54,因此数据小于11.20的概率约为0.54.例7.假设某自动车床生产的弹簧的自由长度ξ服从N(1.5,0.022),且已知P(|ξ<1.5|<3×0.02)=99.7%,质检员抽检的5件弹簧的自由长度为1.47,1.53,1.49,1.57,1.41,据此可判定生产情况是否正常?(本题类型是否要求请注意新教材及考试说明要求)解:在假设自由长度ξ服从N(1.5,0.022)的前提下,ξ的值落在(1.5-3×0.02,1.5+3×0.02)以内的概率为99.7%,则ξ在(1.5-3×0.02,1.5+3×0.02)以外取值的概率只有0.3%,这是一个小概率事件,因此在一次试验中ξ的值落在(1.5-3×0.02,1.5+3×0.02)以外是几乎不可能发生的,如这种事件发生,即ξ的值满足|ξ-1.5|≥3×0.02,这时我们就有理由认为生产过程出现了异常情况.区间(1.5-3×0.02,1.5+3×0.02)即区间(1.44,1.56),∵ξ的值1.41∈(1.44,1.56),故小概率事件发生,故可判定生产情况异常.例8.从总体x中抽取一容量为7的样本,其样本值为(88,85,93,93,64,71,77),分别例9.为了了解高三年级一、二班的数学学习情况,从两个班各抽出10名学生进行数学水平测试,成绩如下(单位:分)一班:76 90 84 86 81 87 86 82 85 83二班:82 83 85 89 79 80 91 88 79 74比较两组数据的方差,并估计一、二两个班哪个班的数学成绩比较整齐分析:此题应先利用公式求方差,由方差反映两个班数学成绩的波动情况由S12<S22表明,从高三年级一班抽取的10名学生的数学成绩比二班的10名学生的数学成绩波动小,从而估计出一班学生数学成绩比二班的数学成绩整齐.例10.某贫困山区居民家庭收入可认为服从正态分布,调查10户,得各户的人均收出(单位:元/户):97.89,102.14,143.20,151.30,103.43,88.90,144.20,120.34,123.50,131.64.试以95%以上的可靠性估计该地区居民家庭人均收入平均值的所在范围.解:在正态总体中,μ为总体平均数,σ为总体标准差,在这里可以用样本来估计总体.总体的标准差σ可以用S*来估计=7.815由于正态分布在(μ-2σ,μ+2σ)内取值概率为95.4%,故以(120.65-2×7.815,120.65+2×7.815)=(105.02,136.28)来估计该地区居民人均收入的范围,可靠性在95%以上.[练习题]A题一、选择题:1.简单随机抽样、系统抽样、分层抽样之间的共同点是()(A)都是从总体中逐个抽取(B)将总体分成几部分,按事先确定的规则在各部分抽取(C)抽样过程中每个个体被抽到的概率相等(D)将总体分成几层,然后分层按比例抽取2.简单随机抽样中,某个个体被抽到的可能性是()(A)与第n次抽样有关,第一次抽到的可能性小(B)与第n次抽样无关,每次抽中的可能性相等(C)与第n次抽样有关,最后一次抽中的可能性大(D)与第n次抽样无关,每次都是等可能的概率,但各次抽取的可能性不一样(A)简单随机抽象(B)系统抽样(C)分层抽样(D)分类抽样二、填空题:4.为了了解某地参加计算机水平测试的5008名学生的成绩,从中抽取了200名学生的成绩进行统计分析,运用系统抽样方法抽取样本时,每组的容量为__________.5.观察新生婴儿的体重,其频率分布的直方图如图所示,则新生婴儿体重在[2700,3000)的频率为________.6.某种电池使用寿命的累积频率分布曲线如右图所示,则该种电池使用寿命在[10,15)的概率为________________.7.下列一组数据的标准差为_______________.(9.9,10.3,9.7,10.1,10.4,10.1,9.8,9.7)8.从甲、乙两种棉花苗中各抽10株,测得它们的株高分别如下(单位:cm)甲:25,41,40,37,22,14,19,39,21,42乙:27,16,44,27,44,16,40,40,16,40估计两种棉花苗总体的长势,_____种棉花的苗长得高一些.B组一、选择题:1.某人从湖中打了一网鱼,共m条.做上记号再放入湖中,数日后又打了一网鱼共n条,其中k条有记号,估计湖中有鱼()条.2.在抽查汽车排放尾气的合格率,某环保局在一路口随机抽查,这种抽查是()(A)简单随机抽样(B)系统抽样(C)分层抽样(D)有放回抽样3.将容量为100的样本数据,按由小到大排列分成8个组如表第3组的频率和累积频率为:4.某中学高考数学成绩近似地服从正态分布N(100,10),则此校数学成绩在120分以上的考生占总人数的百分比为()(A)10% (B)23% (C)2.3% (D)以上均不对二、填空题5.公共汽车门的高度是按照保证成年男子与车门顶部碰头的概率在1%以下设计的,如果某地成年男子的身高η~N(175,6)(单位:cm),则车门应设计为 _____高.6.设有一个样本x1,x2,…,x n,其标准差为S x,另有一个样本y1,y2,…,y n,其中y k=3x k+5(k=1,2,…,n),其标准差为S y.则S x与S y的关系式是____________.三、解答题:7.在自动精密旋床的加工过程中,任抽取200个轴,测得轴的直径与规定尺寸偏差统计如下表:(1)完成表格(2)画出频率分布直方图和累积频率分布图(3)求出偏差在(-10,5]之间的概率8.某农场为了从三种不同的西红柿品种中选取高产稳定的西红柿品种,分别是在5块试验田上试种,每块试验田均为0.5公顷,产量情况如下:问:哪一品种的西红柿既高产又稳定?[练习题答案及提示]A组一、选择题1.C 2.B 3.C二、填空题4.25 5.0.3 6.0.25 7.0.71 8.乙B组1.B 2.D 3.A4.C(提示:设ξ表示此中学数学高考成绩,依题意P(ξ>120)即为所求.二、填空题:5.183cm.(提示:设公共汽车门设计为xcm高,由题意P(η≥x)<1%,∵η~N(175,6.S y=3S x7.解(3)由上表可知,偏差在(-10,15]之间的概率为P(-10<ξ≤15)=P(ξ≤15)-P(ξ≤-10)=0.865-0.165=0.7因此第一个西红柿品种既高产又稳定.。

最新人教版高中数学必修3第二章《第二章统计》示范教案

最新人教版高中数学必修3第二章《第二章统计》示范教案

示范教案整体设计教学分析本节是对第二章知识和方法的归纳和总结,从总体上把握本章,使学生的基本知识系统化和网络化,基本方法条理化,本章内容是相互独立的,随机抽样是基础,在此基础上学习了用样本估计总体和变量间的相关关系,要注意它们的联系.本章介绍了从总体中抽取样本的常用方法,并通过实例,研究了如何利用样本对总体的分布规律、整体水平、稳定程度及相关关系等特性进行估计和预测.当总体容量大或检测具有一定的破坏性时,可以从总体中抽取适当的样本,通过对样本的分析、研究,得到对总体的估计,这就是统计分析的基本过程.而用样本估计总体就是统计思想的本质.要准确估计总体,必须合理地选择样本,我们学习的是最常用的三种抽样方法.获取样本数据后,将其用频率分布表、频率直方图、频率折线图或茎叶图表示后,蕴涵于数据之中的规律得到直观的揭示.运用样本的平均数可以对总体水平作出估计,用样本的极差、方差(标准差)可以估计总体的稳定程度.对两个变量的样本数据进行相关性分析,可发现存在于现实世界中的回归现象.用最小二乘法研究回归现象,得到的线性回归方程可用于预测和估计,为决策提供依据.总之,统计的基本思想是从样本数据中发现统计规律,实现对总体的估计.三维目标1.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.2.能通过对数据的分析,为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异.3.通过本节学习,培养学生的直觉思维和归纳能力.重点难点教学重点:会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.教学难点:能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异.课时安排1课时教学过程导入新课思路1.为了系统掌握本章的知识,我们复习本章内容,教师直接点出课题.思路2.同一支球队,在不同的教练带领下战斗力会有很大的不同,例如达拉斯小牛队在“小将军”约翰逊的带领下攻防俱佳所向披靡,同样一张书桌有的整洁、有的凌乱,为什么呢?因为球队需要系统的训练、清晰的战术、完整的攻防体系.书桌需要不断整理,我们学习也是一样需要不断归纳整理、系统总结、升华提高,现在我们就统计这章进行归纳复习,教师点出课题.推进新课新知探究提出问题(1)随机抽样的内容包括哪些?(2)用样本估计总体包括几部分?(3)变量的相关性包括几部分?(4)画出本章知识网络.讨论结果:(1)随机抽样①简单随机抽样抽签法:将总体中的所有个体编号(号码可以从1到 N);将1到N 这N 个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作).将号签放在同一不透明的容器中,并搅拌均匀;从箱中每次抽出1个号签,并记录其编号,连续抽取k 次;从总体中将与抽到的签的编号相一致的个体取出.抽样具有公平性原则:等可能性、随机性;抽签法适用于总体中个数N 不大的情形.随机数表法:对总体中的个体进行编号(每个号码位数一致);在随机数表中任选一个数作为开始;从选定的数开始按一定的方向读下去,得到数码.若不在编号中,则跳过;若在编号中,则取出;如果得到的号码前面已经取出,也跳过;如此继续下去,直到取满为止;根据选定的号码抽取样本.②系统抽样采用随机的方式将总体中的个体编号;将整个的编号按一定的间隔(设为k)分段,当N n (N 为总体中的个体数,n 为样本容量)是整数时,k =N n ;当N n不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N ′能被n 整除,这时k =N ′n,并将剩下的总体重新编号;在第一段中用简单随机抽样或系统抽样确定起始的个体编号;将编号为,+k ,+2k ,…,+(n -1)k 的个体抽出. ③分层抽样将总体按一定标准分层;计算各层的个体数与总体的个体数的比;按各层个体数占总体的个体数的比确定各层应抽取的样本容量;在每一层进行抽样(可用简单随机抽样或系统抽样).适用于总体中个体有明显的层次差异.(2)用样本估计总体①用样本的频率分布估计总体分布频率分布是指一个样本数据在各个小范围内所占比例的大小;一般用频率分布直方图反映样本的频率分布.其一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数;决定分点;列频率分布表;画频率分布直方图.频率分布直方图的特征:从频率分布直方图可以清楚地看出数据分布的总体趋势;从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.茎叶图.画茎叶图的步骤如下:a .将每个数据分为茎(高位)和叶(低位)两部分.b .将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;c .将各个数据的叶按大小次序写在其茎右(左)侧.用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观、清晰.②用样本的数字特征估计总体的数字特征a .利用频率分布直方图估计众数、中位数、平均数估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.b .标准差考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示.s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. c .方差从数学的角度考虑,人们有时用标准差的平方s 2(即方差)来代替标准差,作为测量样本数据分散程度的工具:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.(3)变量间的相关关系①变量之间的相关关系自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.两个变量之间的关系分两类:a .确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;b .带有随机性的变量间的相关关系,例如“身高者,体重也重”,我们就说身高与体重这两个变量具有相关关系.相关关系是一种非确定性关系.②两个变量的线性相关a .散点图:将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫作散点图.b .正相关与负相关:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)c .最小二乘法与回归直线方程:y ^=a ^+b ^x ,其中b ^=∑i =1n x i y i -n x y∑i =1n x 2i -n x 2,a ^=y -b ^x . 上述方程中的b ^,a ^是在所得样本数据的点到这条直线的距离的平方和最小的情形下得到的,这种使“偏差平方和为最小”的方法就是最小二乘法.(4)本章知识网络应用示例 思路1例1某单位有老人28人,中年人54人,青年人81人,为了调查他们的身体状况,从他们中抽取容量为36的样本,最适合抽取样本的方法是( )A .简单随机抽样B .系统抽样C .分层抽样D .先从老人中剔除1人,再用分层抽样解析:总体总人数163人,样本容量为36,由于总体由差异明显的三部分组成,考虑用分层抽样.若按36∶163分配无法得到整数解,故考虑先剔除1人,抽取比例变为36∶162=2∶9,则依次为12、18、6.答案:D点评:选择抽样方法过程中,应结合三种抽样方法的使用范围和实际情况灵活使用各种抽样方法.在现实生活中,由于资金、时间有限,人力、物力不足,加之不断变化的环境条件,普查往往不可能,因此采取抽样调查.在实际操作中,为了使样本具有代表性,通常要了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的14,且该组中,青年人占50%,中年人占40%,老年人占10%. 为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:(1)游泳组中,青年人、中年人、老年人分别所占的比例;(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.分析:本题的抽样方法属于分层抽样,根据分层抽样的方法求解.解:(1)设登山组人数为x ,游泳组中,青年人、中年人、老年人各占比例分别为a 、b 、c ,则有x ×40%+3xb 4x =47.5%,x ×10%+3xc 4x=10%,解得b =50%,c =10%. 故a =100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%.(2)游泳组中,抽取的青年人数为200×34×40%=60(人);抽取的中年人数为200×34×50%=75(人);抽取的老年人数为200×34×10%=15(人). 点评:分层抽样适用于数目较多且各部分之间具有明显差异的总体,由于在分层抽样中抽取样本应该在各层用同一抽样比抽取,所以应首先求出各个年级的人数分别是多少,再根据抽样比计算各层分别应该抽取的人数,另外还要注意,不论用哪一种抽样方法,在整个抽程.分析:因为1 002=20×50+2,为保证“等距”分段,应先剔除2人.对“多余”个体的剔除应不影响总体中每个个体被抽到的可能性,仍然能保证抽样的公平性.解:(1)将1 002名学生用随机方式编号;(2)从总体中剔除2人(可用随机数表法),将剩下的 1 000名学生重新编号(000,001,002,…,999),并分成20段;(3)在第一段000,001,002,…,049这50个编号中用简单随机抽样抽出一个(如003)作为起始号码;(4)将编号为003,053,103,…,953的个体抽出,组成样本.点评:选用系统抽样方法时,应着力解决N不能被n整除的问题.在剔除“多余”的思路1例1为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如下图),已知图中从左到右的前三个小组的频率分别是0.1,0.3,0.4.第一小组的频数是5.(1)求第四小组的频率和参加这次测试的学生的总人数;(2)在这次测试中,学生跳绳次数的中位数落在第几小组内?(3)参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩的优秀率.解:(1)由于各小组概率的和是1,因此第四小组的频率为1-0.1-0.3-0.4=0.2;由于第一小组的频数是5,频率为0.1,因此总人数为5÷0.1=50.(2)由于第三小组的频率最大,因此学生跳绳次数的中位数落在第三小组内.(3)由于第三小组的频率和第四小组的频率和为0.6,因此该校此年级跳绳成绩的优秀率是0.6.点评:本题考查对直方图的理解及读图能力,直方图中横轴表示试验结果,纵轴表示频率与组距的比值.例2下面是关于世界20个地区受教育的人口的百分比与人均收入的散点图.(1)两个变量有什么样的相关关系?(2)利用散点图中的数据建立的回归方程为y ^=3.193x +88.193,若受教育的人口百分比相差10%,其人均收入相差多少?解:(1)散点图中的样本点基本集中在一个条型区域中,因此两个变量呈线性相关关系.(2)回归系数为3.193,因此当人口的百分比相差10%时,其人均收入相差3.193×10=知能训练1.为了了解所加工的一批零件的长度,抽测了200个零件的长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量答案:C2.为了解电视对生活的影响,就平均每天看电视的时间,一个社会调查机构对某地居民调查了10 000人,并根据所得数据画出样本的频率分布直方图(如下图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人做进一步调查,则在[2.5,3](小时)时间段内应抽出的人数是()A.25 B.30C.50 D.75解析:抽出的100人中平均每天看电视的时间在[2.5,3](小时)时间内的频率是0.5×0.5=0.25,所以这10 000人中平均每天看电视的时间在[2.5,3](小时)时间内的人数是10000×0.25=2 500,抽样比是10010 000=1100,则在[2.5,3](小时)时间段内应抽出的人数是 2500×1100=25.答案:A3.某校共有师生1 600人,其中教师有100人,现用分层抽样的方法,从所有师生中抽取一个容量为80的样本,则抽取的学生数为________.解析:抽样比是801 600=120,该校有学生 1 600-100=1 500(人).则抽取的学生为 1500×120=75.答案:754.从两个班中各随机抽取10名学生,他们的数学成绩如下:通过作茎叶图,分析两个班学生的数学学习情况.解:茎叶图为:从这个茎叶图中可以看出乙班的数学成绩更好一些.5.假设要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从下面随机数表第2行第18列的数7开始向右读,请你依次写出最先检测的5袋牛奶的编号.84 42 17 53 3157 24 55 06 8877 04 74 47 6721 76 33 50 2583 92 12 06 7663 01 63 78 5916 95 56 67 1998 10 50 71 7512 86 73 58 0744 39 62 58 7973 21 12 34 2978 64 56 07 8252 42 07 44 3815 51 06 13 4299 66 02 79 54……解:从第2行第18列的数开始向右读,是小于或等于799的数就为1个,即719,050,717,512,358是最先检测的5袋牛奶的编号.6.某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为应怎样进行抽样?分析:因为总体中人数较多,所以不宜采用简单随机抽样.又由于持不同态度的人数差异较大,故也不宜用系统抽样方法,所以应采用分层抽样.解:可用分层抽样方法,其总体容量为12 000.“很喜爱”占2 43512 000=4872 400,应取60×4872 400≈12人;“喜爱”占4 56712 000,应取60×4 56712 000≈23人;“一般”占3 92612 000,应取60×3 92512 000≈20人;“不喜爱”占1 07212 000,应取60×1 07212 000≈5人.因此,采用分层抽样的方法在“很喜爱”“喜爱”“一般”和“不喜爱”的2 435人、4 567人、3 926人和1 072人中分别抽取12人、23人、20人和5人.拓展提升为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛.为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频率分布表和频率分布直方图,解答下列问题:(Ⅰ)填充频率分布表的空格(将答案直接填在表格内);(Ⅱ)补全频率分布直方图;(Ⅲ)若成绩在75.5~85.5分的学生为二等奖,问获得二等奖的学生约为多少人?分析:(Ⅰ)利用频率分布表的第2行求出样本容量,根据频率=频数/样本容量,来填充频率分布表的空格;(Ⅱ)根据(Ⅰ)补全频率分布直方图;根据频率分布表解决.解:(1)(2)频率分布直方图如下图所示.(3)成绩在75.5~80.5分的学生占70.5~80.5分的学生的510=12,因为成绩在70.5~80.5分的学生频率为0.2,所以成绩在75.5~80.5分的学生频率为0.1,成绩在80.5~85.5分的学生占80.5~90.5分的学生的510=12,因为成绩在80.5~90.5分的学生频率为0.32,所以成绩在80.5~85.5分的学生频率为0.16.所以成绩在75.5~85.5分的学生频率为0.1+0.16=0.26,由于有900名学生参加了这次竞赛,所以该校获得二等奖的学生约为0.26×900=234(人).课堂小结本节课主要是对第二章基本知识进行系统化、网络化,并对常见题型加以巩固提高.作业本章小结Ⅲ.巩固与提高1、5.设计感想本教学设计依据高中数学课程标准,并结合高考,对本章进行了全面复习和巩固.所选题例新颖,贴近学生实际,是一节非常好的探究性复习课.备课资料广告中数据的可靠性今天已进入数字时代,各种各样的统计数字和图表充斥着媒体,由于数字给人的印象直观具体,所以让数据说话是许多广告的常用手法,但广告中的数据可靠吗?在各类广告中,你会经常遇到由“方便样本(即样本没有代表性)”所产生的结论.例如,某减肥药的广告称,其减肥的有效率为75%.见到这样的广告你会怎么想?通过学习统计这部分内容,你会提出下面的问题吗?这个数据是如何得到的;该药在多少人身上做过试验,即样本容量是多少;样本是如何选取的;等等.假设该药仅在4个人身上做过试验,样本容量为4,用这样小的样本容量来推断总体是不可信的.“现代研究证明,99%以上的人感染有螨虫……”这是一家化妆品公司的广告.第一次听到此话的人会下意识地摸一下自己的皮肤,甚至会感觉到有虫在里面蠕动,恨不得立即弄些药膏抹抹,广告的威慑作用不言而喻.但这里99%是怎么得到的?研究共检测了多少人?这些人是如何挑选的?如果检测的人都是去医院看皮肤病的人,这个数据就不适用于一般人群.某化妆品的广告声称:“它含有某种成分,可以彻底地清除脸部皱纹,只需10天,就能让肌肤得到改善.”我们看到的数字很精确,而“能让肌肤得到改善”却是很模糊的.这样的数字能相信吗?试验是在什么样的皮肤上做的?试验的人数是多少?当我们见到广告中的数据时一定要多提几个问题.。

高中数学必修3_第二章_统计_总结学生版

高中数学必修3_第二章_统计_总结学生版

第二章统计一、随机抽样三种常用抽样方法:1.简单随机抽样:设一个总体的个数为N。

如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。

实现简单随机抽样,常用抽签法和随机数表法。

(1)抽签法制签:先将总体中的所有个体编号(号码可以从1到N),并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行均匀搅拌;抽签:抽签时,每次从中抽出1个号签,连续抽取n次;成样:对应号签就得到一个容量为n的样本。

抽签法简便易行,当总体的个体数不多时,适宜采用这种方法。

(2)随机数表法编号:对总体进行编号,保证位数一致;数数:当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等。

在读数过程中,得到一串数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。

成样:对应号签就得到一个容量为n的样本。

结论:①用简单随机抽样,从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时任一个体被抽到的概率为1/N;在整个抽样过程中各个个体被抽到的概率为n/N;②基于此,简单随机抽样体现了抽样的客观性与公平性;③简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样。

2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样)。

系统抽样的步骤可概括为:(1)将总体中的个体编号。

采用随机的方式将总体中的个体编号;(2)将整个的编号进行分段。

为将整个的编号进行分段,要确定分段的间隔k .当N/n 是整数时,k=n/N ;当N/n 不是整数时,通过从总体中剔除一些个体使剩下的个体数N ´能被n 整除,这时k=N ’/n ;(3)确定起始的个体编号。

高中数学必修3(人教A版)第二章统计2.1知识点总结含同步练习及答案

高中数学必修3(人教A版)第二章统计2.1知识点总结含同步练习及答案

⑤确定样本:从总体中找出与号签上的号码对应的个体,组成样本.
随机数表法是随机数表由数字 0 ,1 ,2,3,⋯,9 这 10 个数字组成,并且每个数字在表中 各个位置上出现的机会都是一样的,通过随机数表,根据实际需要和方便使用的原则,将几个数
组成一组,然后通过随机数表抽取样本.随机数表的优点是简单易行,它很好的解决了当总体中
样.因为 50 名官兵是从中挑出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单 随机抽样中“等可能抽样”的要求.(3)是简单随机抽样.因为总体中的个体数是有限的,并且
是从总体中逐个进行抽取的,是不放回、等可能的抽取.
2013年第27届世界大学生运动会在俄罗斯举行,为了支持这次运动会,某大学从报名的 20 名大 三学生中选取 6 人组成志愿小组,请用抽签法设计抽样方案. 解:(1)将 20 名志愿者编号,编号为 1,2,3,4,⋯,20; (2)将 20 个号码分别写在 20 张形状相同的卡片上,制成号签; (3)将 20 张卡片放入一个不透明的盒子里,搅拌均匀; (4)从盒子中逐个不放回地抽取 6 个号签,并记录上面的号码;
A.2
B.3
C.6
D.7
解:C
间隔相等,所以 126 − 8 × 15 = 6.
4.分层抽样
描述: 将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在 总体中所占比例进行简单随机抽样或系统抽样,这种抽样的方法叫做分层抽样.当总体由明显差 别的几部分组成时,为了使抽取样本更好地反映总体的情况,常采用分层抽样.
③简单随机抽样是一种不放回抽样.
④简单随机抽样是一种等可能的抽样,每个个体被抽取到的可能性均为
n N

常用的简单随机抽样方法有抽签法和随机数表法.

最新人教版高中数学必修3第二章《第二章统计》本章概要

最新人教版高中数学必修3第二章《第二章统计》本章概要

第二章统计本章综述今天,我们已经进入了数字时代,例如,某减肥广告称,其减肥成功率达到85%;“现代研究证明,99%以上的人感染有螨虫……”.这是一家化妆品公司的广告……看到这些广告中精确的数字你会怎样想呢?是否应该相信呢?另外,我们知道,工厂生产的产品必须经过检验,只有合格产品才能进入市场流通,而有些检验带有极大的破坏性,那么我们应该如何解决既要确保出厂的产品必须合格,又不能对其造成大面积破坏的矛盾呢?每年高考过后,考试中心的工作人员需要对考生的答卷进行分析,总结经验,找出问题,以利于下一年度的高考命题,指导下一届考生备考,而调研每位考生答卷的工作量太大,那么应如何科学地进行调研呢? ……总之,无论是生活、工作、学习,我们每时每刻都要同数据打交道,那么如何从众多的数据中科学地提取有效数据,又如何科学地对数据进行分析,从而使我们能够作出科学的决策呢?这正是统计的内涵.本章是在义务教育阶段所学《统计初步》的基础上,通过实际问题情景,较系统地学习随机抽样和用样本估计总体的基本方法以及变量间的相关关系.通过案例分析系统地经历数据收集与处理的全过程,并逐步触及统计学的基本思想——用样本估计总体,而这种思想正是研究、调查问题的“开路先锋”,所以《统计》具有极高的应用价值.本章先介绍了简单随机抽样、系统抽样、分层抽样这三种常用的抽样方法.在学会用随机抽样的方法在总体中抽取样本后,接着介绍如何用样本估计总体,一是如何用样本的频率分布估计总体分布;二是如何用样本的某种特征数去估计总体的相应的特征数,其中用样本平均数估计总体平均数的问题在初中已作介绍,而本章内容完全是初中相关内容的继续和深入.最后介绍了两个变量之间的关系,除了函数关系这种确定性的关系以外,还存在因变量的取值带有一定随机性的两个变量之间的关系——相关性.学习本章需注意:①不同的问题需选择适当的抽样方法收集数据,并用适当的统计图表或数字特征来表达数据的信息.②统计的学习,本质上是统计活动的学习,而不是概念和公式的学习,即是“做”而不是记忆和运算.要特别注重统计的过程,即经历“收集数据——整理数据——分析数据——作出推断”的全过程.现代社会是信息化的社会,在日常生活中,我们可以随处看到各种各样的利用统计解决问题的现象.本章的重点是会用随机抽样的基本方法和用样本去估计总体的思想解决实际问题,难点是用不同的估算方法描述两个变量线性相关,以及最小二乘法的思想.。

2020年高中数学必修三第二章《统计》2.3.1变量之间的相关关系-2.3.2两个变量的线性相关

2020年高中数学必修三第二章《统计》2.3.1变量之间的相关关系-2.3.2两个变量的线性相关

2020年高中数学必修三第二章《统计》2.3.1变量之间的相关关系2.3.2两个变量的线性相关学习目标 1.了解变量间的相关关系,会画散点图;2.根据散点图,能判断两个变量是否具有相关关系;3.了解线性回归思想,会求回归直线的方程.知识点一变量间的相关关系思考1粮食产量与施肥量间的相关关系是正相关还是负相关?答案在施肥不过量的情况下,施肥越多,粮食产量越高,所以是正相关.思考2怎样判断一组数据是否具有线性相关关系?答案画出散点图,若点大致分布在一条直线附近,就说明这两个变量具有线性相关关系,否则不具有线性相关关系.梳理1.相关关系的定义变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,那么这两个变量之间的关系叫做相关关系,两个变量之间的关系分为函数关系和相关关系.2.散点图将样本中n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中得到的图形叫做散点图.3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.知识点二两个变量的线性相关思考任何一组数据都可以由最小二乘法得出线性回归方程吗?答案用最小二乘法求线性回归方程的前提是先判断所给数据是否具有线性相关关系(可利用散点图来判断),否则求出的线性回归方程是无意义的.梳理 回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)线性回归方程:回归直线对应的方程叫做回归直线的方程,简称回归方程. (3)最小二乘法:求线性回归方程y ^=b ^x +a ^时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2=∑i =1nx i y i-n x y ∑i =1nx 2i-n x 2,a ^=y -b ^x ,其中,b ^是线性回归方程的斜率,a ^是线性回归方程在y 轴上的截距.类型一 相关关系的判断与应用 命题角度1 判断两个变量的相关性例1 为了研究质量对弹簧长度的影响,对6根相同的弹簧进行测量,所得数据如下:判断它们是否有相关关系,若有,判断是正相关还是负相关. 解 散点图如图:由散点图可以看出两个变量对应的点大致分布在一条直线附近,因此可以得出结论:质量与弹簧长度这两个变量具有相关关系,且它们是正相关关系.反思与感悟在研究两个变量之间是否存在某种关系时,必须从散点图入手,对于散点图,可以作出如下判断:(1)如果所有的样本点都落在某一函数曲线上,那么就用该函数来描述变量之间的关系,即变量之间具有函数关系;(2)如果所有的样本点都落在某一直线附近,那么变量之间就有线性相关关系;(3)如果散点图中的点的分布几乎没有什么规律,那么这两个变量之间不具有相关关系,即两个变量之间是相互独立的.跟踪训练1下表是某地的年降雨量与年平均气温的统计表,判断两者是否具有相关关系,求线性回归方程有意义吗?解以x轴为年平均气温,y轴为年降雨量,可得相应的散点图如图.因为图中各点并不在一条直线的附近,所以两者不具有线性相关关系,没必要用回归直线进行拟合,即使用公式法求出线性回归方程也是没有意义的.命题角度2函数关系与相关关系的区别与联系例2下列关系中,是相关关系的是________.①正方形的边长与面积之间的关系;②农作物的产量与施肥量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.答案②④解析①中,正方形的边长与面积之间的关系是函数关系;②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人达到一定年龄后,身高就不发生明显变化了,所以它们不具有相关关系;④中,降雪量与交通事故的发生率之间具有相关关系. 反思与感悟 相关关系与函数关系的区别与联系如表所示:跟踪训练2 下列图形中两个变量具有相关关系的是( )答案 C解析A 是一种函数关系;B 也是一种函数关系;C 中从散点图中可看出所有点看上去都在某条直线附近波动,具有相关关系,而且是一种线性相关;D 中所有的点在散点图中没有显示任何关系,因此变量间是不相关的. 类型二 回归直线的求解与应用例3 一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:(1)画出散点图;(2)如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系;(3)在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内? 解 (1)散点图如图所示:(2)近似直线如图所示:(3)由y ≤10得5170x -67≤10,解得x ≤14.9,所以机器的运转速度应控制在14转/秒内.引申探究1.本例(3)中近似方程不变,若每增加一个单位的转速,生产有缺点的零件数近似增加多少? 解 因为y =5170x -67,所以当x 增加一个单位时,y 大约增加5170.2.本例(3)中近似方程不变,每小时生产有缺点的零件件数是7,估计机器的转速. 解 因为y =5170x -67,所以当y =7时,7=5170x -67,解得x ≈11.反思与感悟 求线性回归方程的一般步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)计算x ,y,∑i =1nx 2i ,∑i =1nx i y i .(5)代入公式计算b ^,a ^,公式为⎩⎪⎨⎪⎧b ^=∑i =1nx i y i-n x y ∑i =1nx 2i-n x2,a ^=y -b ^x .(6)写出线性回归方程y ^=b ^x +a ^.跟踪训练3 (1)变量y 与x 满足线性回归方程y ^=b ^x +a ^,现在将y 的单位由厘米变为米,x的单位由毫米变为米,则在新的线性回归方程y ^=b ^*x +a ^*中,b ^*是b ^的____________倍.(2)为了均衡教育资源,加大对偏远地区的教育投入,调查了某地区若干户家庭的年收入x (单位:万元)和年教育支出y (单位:万元),调查显示年收入x 与年教育支出y 具有相关关系,并由调查数据得到y 对x 的线性回归方程为y ^=0.15x +0.2.由线性回归方程可知,家庭年收入每增加1万元,年教育支出平均增加________万元. 答案 (1)10 (2)0.15解析 (1)由回归系数公式知,当y 的值变为原来的10-2倍,x 的值变为原来的10-3倍时,b^*的值应为原来的10倍.(2)回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增加0.15万元.1.设有一个线性回归方程为y ^=2-1.5x ,则变量x 增加1个单位时,y 平均( ) A .增加1.5个单位 B .增加2个单位 C .减少1.5个单位 D .减少2个单位答案 C2.由三点(3,10),(7,20),(11,24)确定的线性回归方程为( ) A.y ^=1.75x -5.75 B.y ^=1.75x +5.75 C.y ^=-1.75x +5.75 D.y ^=-1.75x -5.75答案 B解析 设线性回归方程为y ^=b ^x +a ^, 则b ^=x 1y 1+x 2y 2+x 3y 3-3x y x 21+x 22+x 23-3x2=3×10+7×20+11×24-3×7×189+49+121-3×49=1.75,a ^=y -b ^x =18-1.75×7=5.75. 故y ^=1.75x +5.75,故选B.3.某地区近10年居民的年收入x 与年支出y 之间的关系大致符合y ^=0.8x +0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元. 答案 12.1解析 将x =15代入y ^=0.8x +0.1,得y ^=12.1.4.某市居民2012~2016年家庭年平均收入x (单位:万元)与年平均支出y (单位:万元)的统计资料如表所示:根据统计资料,居民家庭年平均收入的中位数是__________万元,家庭年平均收入与年平均支出有________线性相关关系. 答案 13 正解析 考查中位数的定义,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时需取中间两数的平均数.由统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.5.某5名学生的总成绩和数学成绩(单位:分)如表所示:(1)画出散点图;(2)求y 对x 的线性回归方程(结果保留到小数点后3位数字); (3)如果一个学生的总成绩为450分,试预测这个学生的数学成绩. 解 (1)散点图如图所示:(2)由题中数据计算可得x =391.6,y =67.8,∑i =15x 2i =770 654,∑i =15x i y i =133 548.代入公式得b ^=133 548-5×391.6×67.8770 654-5×391.62≈0.204,a ^=67.8-0.204×391.6≈-12.086,所以y 对x 的线性回归方程为y ^=-12.086+0.204x .(3)由(2)得当总成绩为450分时,y ^=-12.086+0.204×450≈80,即这个学生的数学成绩大约为80分.1.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关还是负相关. 2.求线性回归方程时应注意的问题(1)知道x 与y 成线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出线性回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的. (2)用公式计算a ^、b ^的值时,要先计算b ^,然后才能算出a ^.3.利用回归方程,我们可以进行估计和预测.若回归方程为y ^=b ^x +a ^,则x =x 0处的估计值为y ^0=b ^x 0+a ^.40分钟课时作业一、选择题1.某商品销售量y (件)与销售价格x (元/件)负相关,则其线性回归方程可能是( ) A.y ^=-10x +200 B.y ^=10x +200 C.y ^=-10x -200 D.y ^=10x -200答案 A解析 x 的系数为负数,表示负相关,排除B 、D ,由实际意义可知x >0,y >0,C 中,散点图在第四象限无意义,故选A.2.根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关 答案 D解析 由柱形图可知:A 、B 、C 均正确,2006年以来我国二氧化硫年排放量在逐渐减少,所以排放量与年份负相关,所以D 不正确.3.对变量x ,y 有观测数据(x i ,y i )(i =1,2,3,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,3,…,10),得散点图2,由这两个散点图可以判断( )A .y 与x 正相关,v 与u 正相关B .y 与x 正相关,v 与u 负相关C .y 与x 负相关,v 与u 正相关D .y 与x 负相关,v 与u 负相关 答案 C解析 根据散点图直接进行判断.4.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( ) A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5 D.y ^=-0.3x +4.4答案 A解析 由变量x 与y 正相关知C 、D 均错,又回归直线经过样本点的中心(3,3.5),代入验证得A 正确,B 错误.故选A. 5.已知x 与y 之间的一组数据:若y 与x 线性相关,则y 与x 的回归直线y ^=b ^x +a ^必过( ) A .点(2,2) B .点(1.5,0) C .点(1,2) D .点(1.5,4)答案 D 解析 ∵x =0+1+2+34=1.5,y =1+3+5+74=4, ∴回归直线必过点(1.5,4).故选D. 6.已知x ,y 的取值如表所示:如果y 与x 线性相关,且线性回归方程为y ^=b ^x +132,则b ^等于( )A .-12B.12 C .-110D.110答案 A 解析 ∵x =2+3+43=3,y =6+4+53=5, ∴回归直线过点(3,5),∴5=3b ^+132,∴b ^=-12,故选A.二、填空题7.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的数据,计算得回归方程为y ^=0.85x -0.25.由以上信息,可得表中c 的值为________.答案 6解析 x =3+4+5+6+75=5,y =2.5+3+4+4.5+c 5=14+c 5,代入回归方程中得14+c5=0.85×5-0.25,解得c =6.8.如图所示的五组数据(x ,y )中,去掉________后,剩下的四组数据相关性增强.答案 (4,10)解析 去掉点(4,10)后,其余四点大致在一条直线附近,相关性增强. 9.在一次试验中测得(x ,y )的四组数据如下:根据上表可得线性回归方程y ^=-5x +a ^,据此模型预报当x =20时,y 的值为________. 答案 26.5解析 x =16+17+18+194=17.5,y =50+34+41+314=39,∴回归直线过点(17.5,39), ∴39=-5×17.5+a ^, ∴a ^=126.5,∴当x =20时,y =-5×20+126.5=26.5.10.某工厂对某产品的产量与成本的资料分析后有如下数据:由表中数据得到的线性回归方程y ^=b ^x +a ^中b ^=1.1,预测当产量为9千件时,成本约为________万元. 答案 14.5解析 由表中数据得x =4,y =9,代入线性回归方程得a ^=4.6,∴当x =9时,y ^=1.1×9+4.6=14.5. 三、解答题11.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求两变量之间的回归方程y ^=b ^x +a ^;(2)利用(1)中所求出的回归方程预测该地第6年的粮食需求量. 解 (1)由所给数据得 x =3,y =5.8,b ^=∑i =15(x i -x )(y i -y )∑i =15(x i -x )2=1.1,a ^=y -b ^x =2.5, ∴y ^=1.1x +2.5.故所求的回归方程为y ^=1.1x +2.5. (2)第6年的粮食需求量约为 y ^=1.1×6+2.5=9.1(万吨).12.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求月储蓄y (千元)关于月收入x (千元)的线性回归方程; (2)若该居民区某家庭的月收入为7千元,预测该家庭的月储蓄. 解 (1)由题意知n =10,x =1n ∑i =110x i =110×80=8,y =1n ∑i =110y i =110×20=2,又∑i =110x 2i -n x 2=720-10×82=80, ∑i =110x i y i -n x y =184-10×8×2=24,由此得b ^=2480=0.3,a ^=y -b ^x =2-0.3×8=-0.4, 故所求线性回归方程为y ^=0.3x -0.4.(2)将x =7代入线性回归方程,可以得到该家庭的月储蓄约为y ^=0.3×7-0.4=1.7(千元). 13.为了分析某高三学生的学习状态,对其下一阶段的学习提供指导性建议,现对他前7次考试的数学成绩x 、物理成绩y 进行分析.下面是该生7次考试的成绩(单位:分).(1)他的数学成绩与物理成绩哪个更稳定?并说明理由;(2)已知该学生的物理成绩y 与数学成绩x 是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少分,并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.解 (1)x =100+-12-17+17-8+8+127=100,y =100+-6-9+8-4+4+1+67=100,s 2数学=142,s 2物理=2507,因为s 2数学>s 2物理, 所以他的物理成绩更稳定.(2)由于x 与y 之间具有线性相关关系,经计算得b ^=0.5,a ^=100-0.5×100=50. 所以线性回归方程为y ^=0.5x +50. 当y =115时,x =130. 估计他的数学成绩是130分.建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.。

高中数学课件归纳必修3第二章统计2.2.2-1众数、中位数、平均数(1)

高中数学课件归纳必修3第二章统计2.2.2-1众数、中位数、平均数(1)

解:在17个数据中,1.75出现了4次,出现的 次数最多,即这组数据的众数是1.75.
上面表里的17个数据可看成是按从小到大 的顺序排列的,其中第9个数据1.70是最中间的 一个数据,即这组数据的中位数是1.70;
这组数据的平均数是
答:17名运动员成绩的众数、中位数、平均数 依次是1.75(米)、1.70(米)、1.69(米).
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月平均用水量(t)
2、在样本中,有50%的个体小于或等于 中位数,也有50%的个体大于或等于中位 数,因此,在频率分布直方图中,中位数 左边和右边的直方图的面积应该相等,由 此可以估计中位数的值。下图中虚线代表 居民月均用水量的中位数的估计值,此数 据值为2.03t.
二 、 众数、中位数、平均数 与频率分布直方图的关系
1、众数在样本数据的频率分布直方图 中,就是最高矩形的中点的横坐标。
例如,在上一节调查的100位居民的月 均用水量的问题中,从这些样本数据的频 率分布直方图可以看出,月均用水量的众 数是2.25t.如图所示:
频率 组距
0.5 0.4 0.3 0.2 0.1
平均数: 一组数据的算术平均数,即
xx=
1 n (x1 x 2
xn )
练习: 在一次中学生田径运动会上,
参加男子跳高的17名运动员的成绩如下 表所示:
成绩(单 位: 米)
人数
1.50 1.60 1.65
2
3
2
1.70 3
1.75 4
1.80 1
1.85 1
1.90 1
分别求这些运动员成绩的众数,中位数与 平均数
3、由于平均数与每一个样本的 数据有关,所以任何一个样本数据的 改变都会引起平均数的改变,这是众 数、中位数都不具有的性质。也正因 如此 ,与众数、中位数比较起来,平

【公开课】高中数学必修3第二章《统计》小结与复习课件

【公开课】高中数学必修3第二章《统计》小结与复习课件
n
标准差:s s2 ( x1 x)2 ( xn x)2 n
12
分析样本的分布情况可用 样本的频率分布表
样本的频率分布直方图
频率分布直方图的特征: (1)从频率分布直方图可以清楚的看出数据分布的
总体趋势。 (2)从频率分布直方图得不出原始的数据内容,每
个小矩形的面积等于此项的概率,所有面积和为1.
9
4.分层抽样步骤:
(1) 将总体按一定标准分层; (2) 计算各层的个体数与总体的个体数的
比;抽样比k=n/N (3) 按比例确定各层应抽取的样本数目 (4) 在每一层进行抽样(可用简单随机抽样
或系统抽样)
10
类别 抽样方式 使用范围 共同点 相互联系
简单随机 从总体中逐 总体中个体
抽样
个抽取
20
2
总体、个体、样本、样本容量
总体:在统计中,所有考察对象的全体。 个体:总体中的每一个考察对象。 样本:从总体中抽取的一部分个体叫做 这个总体的一个样本。 样本容量:样本中个体的数目。
3
抽样方法:
(1)简单随机抽样 (抽签法、随机数法) (2)系统抽样 (3)分层抽样
4
1、抽签法步骤
(1)先将总体中的所有个体(共有N个) 编号(号码可从0到N-1). (2)把号码写在形状、大小相同的号签上, 号签可用小球、卡片、纸条等制作。 (3)将这些号签放在同一个容器中,搅拌均 匀。 (4)抽签时,每次从中抽出一个号签,连续 抽取n次。 (5)抽出样本。
人数
5
8
10
22
33
20
区间界限 [146,150) [150,154) [154,158)
人数
11
6
5

高中数学第2章统计2.1抽样方法2.1.3分层抽样教案苏教版必修3

高中数学第2章统计2.1抽样方法2.1.3分层抽样教案苏教版必修3

2.1.3 分层抽样整体设计教材分析本课是在学生已经学习了简单随机抽样与系统抽样之后所要学习又一种抽样方法——分层抽样.由前两节课我们知道简单随机抽样或系统抽样有时获得样本不具有很好代表性,比方,当个体间差异比拟大时,如果采用简单随机抽样,不同人就有可能得到差异很大结果;同样,如果采用系统抽样也很可能得不到具有代表性样本.为此,为了更大程度地提高样本代表性,我们需要事先对总体有一定了解,然后根据已有了解,再按照一定方式抽取,这就是分层抽样.本教案着眼点是让学生主体参与,让学生动手、动脑,并通过观察、分析、比拟、归纳等进展合情推理,鼓励学生积极活动,勇于探索.针对本节课概念性强、思维量大、例习题较多特点,本课教法是以启发学生观察思考分析讨论为主启发式教学.三维目标1.了解分层抽样概念,理解科学、合理选用抽样方法必要性.2.掌握分层抽样操作步骤,对实际问题比照分析.3.了解各种抽样方法使用范围,使学生能根据具体情况选择适当抽样方法.4.结合教学内容培养学生学习数学兴趣以及“用数学〞意识,培养学生科学探索精神.重点难点教学重点:通过实例了解分层抽样方法.教学难点:分层抽样步骤.课时安排1课时教学过程导入新课设计思路一:〔事例引入〕有一条消息“抽查局部考生成绩了解知道,江苏省2005年高考物理学科平均分约为95分.〞请问这个数据是用什么样抽样方法得到?分析:不能单纯地用简单随机抽样或系统抽样,因为江苏省有很多地区,而每个地区学生成绩不平衡,甚至相差太大.那么,设计抽样方法时,最核心问题是什么,应该注意什么呢?一定要使抽取样本具有很好代表性.为此,在设计抽样方法时,我们应充分利用自己对总体情况已有了解,选择适合抽样方法.师:请同学们一起来探讨一例,你认为应当怎样抽取样本?设计思路二:〔实例引入〕某校高一、高二与高三年级分别有学生1 000,800与700名,为了了解全校学生视力情况,欲从中抽取容量为100样本,怎样抽样较为合理?〔让中档生配合教师引入新课,增强他们赶超意识;优秀生补充,树立他们“我要更强〞竞争意识;后进生主动参与,提高他们课堂上有效思考活动时间〕分析:由于不同年级学生视力状况有一定差异,不能在2 500名学生中随机抽取100名学生,也不宜在三个年级平均抽取.为准确反映客观实际,不仅要使每个个体被抽到概率相等,而且要注意总体中个体层次性,所以,先将全体学生分成高一、高二与高三年级三层,分别抽样.三局部学生人数有较大差异,应考虑各层个体数在总体中所占比例.用各层个体数与总体个体数比乘以样本容量就可得各层所要抽取个体数.推进新课新知探究学生思考,交流讨论,然后代表发言.一般地,当总体由差异明显几个局部组成时,为了使样本更客观地反映总体情况,我们常常将总体中个体按不同特点分成层次比拟清楚几局部,然后按各局部在总体中所占比实施抽样,这种抽样方法叫做分层抽样〔stratified sampling〕,其中所分成各个局部称为“层〞.分层抽样步骤是:〔1〕将总体按一定标准分层;〔2)计算各层个体数与总体个体数比;〔3〕按各层个体数占总体个体数比确定各层应抽取样本容量;〔4〕在每一层进展抽样〔可用简单随机抽样或系统抽样〕.分层抽样特点是:分层抽样时,每个个体被抽到可能性是相等.由于分层抽样充分利用了信息,使样本具有较好代表性,而且在各层抽样时,可以根据具体情况采取不同抽样方法,因此分层抽样在实践活动中有着广泛应用.应用例如例1 某电视台在因特网上就观众对其某一节目喜爱程度进展调查,参加调查总人数为12 000人,其中持各种态度人数如下表所示:很喜爱喜爱一般不喜爱2 435 4 5673 926 1 072电视台为进一步了解观众具体想法与意见,打算从中抽选出60人进展更为详细调查,应怎样进展抽样?分析:因为总体中人数较多,所以不宜采取简单随机抽样,又由于持不同态度人数差异较大,故也不宜用系统抽样,而以分层抽样为妥.解:采用分层抽样.具体抽样步骤如下:①把总体分成四层:“很喜爱〞“喜爱〞“一般〞“不喜爱〞;②因为总人数为12 000人,所以各层个体数与总体个体数之比分别为“很喜爱〞占;“喜爱〞占;“一般〞占;“不喜爱〞占;③因为抽选出60人,所以从每层中抽出人数为:“很喜爱〞有×60≈12人,“喜爱〞有×60≈23人,“一般〞有×60≈20人,“不喜爱〞有×60≈5人.④在每层中用系统抽样方法抽取样本,把各层抽得个体合在一起就得到了所需样本.点评:〔1〕分层抽样四个步骤中按比例分配各层所要抽取个体数时,有时计算出个体数可能是一个近似数,但这并不影响样本容量.〔2〕分层抽样适用于总体由差异比拟明显几个局部组成情况,是等概率抽样,它是客观、公平.〔3〕分层抽样是建立在简单随机抽样或系统抽样根底上,由于它充分利用了调查者对被调查对象〔总体〕事先所掌握各种信息,并充分考虑了保持样本构造与总体构造一致性,从而使抽取样本具有较好代表性.并且在各层抽样时可以根据情况采用不同抽样方法,因此分层抽样在实践中有着非常广泛应用.例2 一工厂生产了某种产品16 800件,他们来自甲、乙、丙生产三条线.为检查这批产品质量,决定采用分层抽样方法进展抽样,从甲、乙、丙3条生产线抽取个体数组成一个等差数列,那么乙生产线生产了________________件产品.分析:审题是思维入口,抓住问题透露信息,进展分检、组合与加工,找出解题思路.非常有价值信息是从甲、乙、丙3条生产线抽取个体数组成一个等差数列.解法一:因为从甲、乙、丙3条生产线抽取个体数组成一个等差数列,故设从甲、乙、丙三条生产线抽出个体数分别为a,a+d,a+2d,那么各层抽出个体合在一起就得到了所需样本容量3a+3d,所以从各条生产线抽出个体数占总体比为.设乙生产线生产了x件产品,那么×x=a+d,x=5 600.解法二:设从甲、乙、丙三条生产线抽出个体数分别为:a-d,a,a+d,那么各层抽得个体合在一起就得到了所需样本容量为3a,所以从各条生产线抽出个体数占总体比为.设乙生产线生产了x件产品,那么×x=a,x=5 600.解法三:因为从甲、乙、丙3条生产线抽取个体数组成一个等差数列,由分层抽样原理知甲、乙、丙3条生产线生产产品件数也组成一个等差数列.故设甲、乙、丙生产线生产产品件数分别为y-m,y,y+m件,那么(y-m)+y+(y+m)=16 800,即y=5 600.点评:解法二妙在设三数时考虑了“三数成等差且它们与〞条件.解法三思路:由于此题采用分层抽样方法进展抽样,从甲、乙、丙3条生产线抽取个体数组成一个等差数列,那么甲、乙、丙3条生产线生产产品件数也组成一个等差数列.因为从各条生产线抽出人数占总体比〔设为k〕是不变,那么设从甲、乙、丙三条生产线抽出个体数分别为:a-d,a,a+d〔等差数列〕,那么甲、乙、丙3条生产线生产产品件数分别为:〔等差数列〕.思考:求出了乙生产线生产了5 600件产品,能否求出甲与丙生产线分别生产了多少件产品.如果不能,能否加一些条件,求出甲与丙生产线分别生产产品件数.解:不能,因d,k,a都不知.可以通过加条件求出甲与丙生产线分别生产产品件数,如a=56,d=4,那么k==1100,所以甲、丙生1,那么产线生产产品件数分别为:=5 200,=6 000.或者d=4,k=1001,所以a=56,以下解法同前.k=3a16 800=100例3 为了考察某校教学水平,将抽查这个学校高三年级局部学生本学年考试成绩.为了全面地反映实际情况,采用以下三种方式进展抽查〔该校高三年级共有20个教学班,并且每个班内学生已经按随机方式编好了学号,假定该校每班学生人数都一样〕:①从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们学习成绩;②每个班抽取一人,共计20人,考察这20个学生成绩;③把学生按成绩分成优秀、良好、普通三个级别,从中抽取100名学生进展考察〔:假设按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人〕.根据上面表达,试答复以下问题:〔1〕上面三种抽取方式中,其中总体、个体、样本分别指是什么?每一种抽取方式抽取样本中,其样本容量分别是多少?〔2〕上面三种抽取方式中各自采用何种抽取样本方法?〔3〕试分别写出上面三种抽取方式各自抽取样本步骤.分析:此题主要考察数理统计中一些根本概念与根本方法.做这种题目时,应该注意表达完整性与条理性.解:〔1〕这三种抽样方式中,其总体都是指该校高三全体学生本年度考试成绩,个体都是指高三年级每个学生本年度考试成绩.其中第一种抽取方式中样本为所抽取20名学生本年度考试成绩,样本容量为20;第二种抽取方式中样本为所抽取20名学生本年度考试成绩,样本容量为20;第三种抽取方式中样本为所抽取100名学生本年度考试成绩,样本容量为100.〔2〕上面三种抽样方式中,第一种方式采用方法是简单随机抽样法;第二种方式采用方法是系统抽样法与简单随机抽样法;第三种方式采用方法是分层抽样法与简单随机抽样法.〔3〕第一种方式抽样步骤如下:第一步:在这20个班中用抽签法任意抽取一个班;第二步:从这个班中按学号用随机数表法或抽签法抽取20名学生,考察其考试成绩.第二种方式抽样步骤如下:第一步:在第一个班中,用简单随机抽样法任意抽取某一个学生,记其学号为a;第二步:在其余19个班中,选取学号为a学生,共计19人.第三种方式抽样步骤如下:第一步:分层.因为假设按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应该把全体学生分成三个层次.第二步:确定各个层次抽取人数.因为样本容量与总体个体数比为:100∶1000=1∶10,所以在每个层次抽取个体数依次为,即15,60,25.第三步:按层次分别抽取.在优秀生中用简单随机抽样法抽取15人;在良好生中用简单随机抽样法抽取60人;在普通生中用简单随机抽样法抽取20人.点评:1.弄清考察对象是明确总体、个体、样本关键,这里考察对象指是数据.样本中有多少个个体,样本容量就是多少.总体、个体、样本考察对象是同一,所不同是范围大小.2.判断采用何种抽样方法时,应充分理解三种抽样方法定义.三种抽样方法共同点、各自特点、三者之间联系以及适用范围:类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取概率相等从总体中逐个抽取总体中个数较少系统抽样将总体均分成几局部,按事先确定规那么分别在各局部中抽取在起始局部抽样时采用简单随机抽样总体中个数较多分层抽样将总体分成几层,分层进展抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显几局部组成例4 以下问题中,采用怎样抽样方法较为合理〔1〕从10台冰箱中抽取3台进展质量检查;〔2〕某电影院有32排座位,每排有40个座位,座位号为1~40.有一次报告会坐满了听众,报告会完毕后为听取意见,需留下32名听众进展座谈;〔3〕某学校有160名教职工,其中教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面意见,拟抽取一个容量为20样本.此题考察统计中抽样方法有关知识,要求学生会区别几种抽样方法.分析:此题特征是:总体情况来分析选择抽样方法.解:〔1〕总体容量比拟小,用抽签法或随机数表法都很方便. 〔2〕总体容量比拟大,用抽签法或随机数表法比拟麻烦.由于人员没有明显差异,且刚好32排,每排人数一样,可用系统抽样.具体做法是:将每排40人组成一组,共32组,从第1排至第32排分别为1~32组,先在第1排用简单随机抽样抽取一名听众,再将其他各排与此听众座位号一样听众全部取出.〔3〕由于学校各类人员对这一问题看法可能差异较大,故应采用分层抽样方法.具体做法是:总体容量为160,故样本中教师人数应为20×160120=15名,行政人员人数应为20×16016=2名,后勤人员应为20×16024=3名. 点评:此题考察统计中抽样方法有关知识,要求学生会区别几种抽样方法.知能训练1.在10 000个有时机中奖参加港澳七日游号码〔编号为0000~9999〕中,在公证部门监视下按照随机抽取方法确定后三位数为369号码为中奖号码.请你分析这里运用了哪种抽样方法来确定中奖号码?依次写出这10个中奖号码.2.某校共有118名教师,为了支援西部教育事业,现要从中抽出16名教师组成暑期西部讲师团.请用系统抽样法选出讲师团成员.3.某大学共有全日制学生15 000人,其中专科生3 788人、本科生9 874人、研究生1 338人,现为了调查学生上网查找资料情况,欲从中抽取225人,为了使样本具有代表性,应该怎样抽取样本?〔充分给予学生思考时间,由学生分析思路,写出详细解题过程,培养学生标准化书写解题过程意识,教师点拨与指导.出示投影片上准备好解题过程,让学生对照自己书写过程,扬长避短〕4.某市3个区共有高中学生2 000人,且3个区高中学生人数之比为2∶3∶5,现要用分层抽样方法从所有学生中抽取一个容量为200样本,这3个区分别应抽取多少人?写出抽样过程.解答:1.因为中奖号码后三位数一样,因此10个中奖号码依次为:0369,1369,2369,3369,4369,5369,6369,7369,8369,9369.它们间隔一样,因此采用是系统抽样方法.2.(1)对这118名教师进展编号1,2, (118)(2)计算间隔k=16118=7.375.由于k 不是一个整数,我们从总体中随机剔除6个样本,再来进展系统抽样.例如我们随机剔除了3、46、59、57、112、93这6名教师,然后再对剩余112名教师编号,计算间隔k=7.(3)在1~7之间随机选取一个数字,例如选5,将5加上间隔7得到第二个个体编号12,再加上7得到第三个个体编号19,依次进展下去,直到获取整个样本.3.采用分层抽样.具体抽样步骤如下:①将总体分成三层:“专科生〞“本科生〞“研究生〞;②因为总人数为15 000人,所以各层个体数与总体个体数之比分别为:“专科生〞占;“本科生〞占;“研究生〞占;③因为抽选出225人,所以从各层中抽出人数为:“专科生〞有×225≈57人;“本科生〞有×225≈148人;“研究生〞有×225≈20人;④在每层中用系统抽样方法抽取样本,把各层抽得个体合在一起就得到了所需样本.4.由分层抽样原理知从各层中抽取样本个数之比等于各层个体数之比,所以从各层中抽出人数为:“第一区〞有102×200=40人;“第二区〞有103×200=60 人;“第三区〞有105×200=100人;然后在每层中用系统抽样方法抽取样本,把各层抽得个体合在一起就得到了所需样本.点评:有针对性与例题配套,加强学生对上课例题理解.课堂小结〔先让一位同学总结,其他同学补充,教师完善,并用多媒体展示出来〕〔1〕分层抽样定义;〔2〕分层抽样实施方法及步骤;〔3〕简单随机抽样、系统抽样及分层抽样区别与联系.作业课本习题2.1 2、8.设计感想由于课程标准对分层抽样要求层次为“了解〞,因此没有在如何合理分层这个层面上花过多时间,而是以例题、习题形式补充了一些与学习、生活、生产相关背景材料,让学生感受分层抽样应用广泛性与必要性.习题详解1.解:采用分层抽样方法.具体为:①将全市800家企业分成四个层:“中外合资企业〞“私营企业〞“国有企业〞“其他性质企业〞;②“中外合资企业〞与全市企业总数之比为160∶800=1∶5;“私营企业〞与全市企业总数之比为320∶800=2∶5;“国有企业〞与全市企业总数之比为240∶800=3∶10;“其他性质企业〞与全市企业总数之比为80∶800=1∶10;③应抽取“中外合资企业〞40×51=8家 ;“私营企业〞40×52=16家;“国有企业〞 40×103=12家;“其他性质企业〞40×101=4家; ④将抽出40家企业合在一起就组成所要样本.2.解:由题意知:抽取高二年级学生15人.故抽取高二年级学生与高二年级学生总数之比为15∶300=1∶20,所以高一年级学生总数为20×20=400人,高三年级学生总数为10×20=200人,全校学生总数为400+300+200=900人.3.解:因为4个区学生人数之比为3∶2.8∶2.2∶2,因此各个区学生数分别占总数3∶(3+2.8+2.2+2)=3∶10,2.8∶(3+2.8+2.2+2)=7∶25, 2.2∶(3+2.8+2.2+2)=11∶50,2∶(3+2.8+2.2+2)=2∶10,所以应分别从各个区抽取学生200×103=60人,200×257=56人,200×5011=44人,200×102=40人. 4.解:可先将高一年级学生按年龄分为15岁、16岁、17岁,然后再将每一个年龄段内学生分为男、女调查他们身高,这样整个年级学生就可分为9个层,最后采用分层抽样方法抽取一些学生调查他们作为样本.5.解:可对全校学生分为三个层:“高一学生〞“高二学生〞“高三学生〞,然后在每一层中采用系统抽样方法抽取出各层学生,最后调查这些学生身高与心率,获得数据,制成表格.6.解:先将学生按年级分为几个局部,然后对每一局部学生采用随机抽样方法抽取一些学生组成样本,调查他们父母年龄,收集数据以制成表格.7.可对班级学生按男、女分为两个局部,然后按男、女生在班级所占比例在每一局部采用随机抽样方法抽取一些学生,以调查他们对这一问题看法.8.解:〔1〕采用分层抽样方法,具体步骤如下:①将500名学生分为4个层:“血型为O 型学生〞“血型为A 型学生〞“血型为B 型学生〞“血型为AB 型学生〞;②“血型为O 型学生〞占总人数比为,“血型为A 型学生〞占总人数比为,“血型为B 型学生〞占总人数比为,“血型为AB 型学生〞占总人数比为;③应抽取血型为O 型学生40×52=16人;血型为A 型学生40×41=10人;血型为B 型学生40×41=10人;血型为AB 型学生40×101=4人; ④从各层用随机抽样方法抽出学生组成样本.〔2〕AB 血型样本抽样过程〔抽签法〕步骤:①将血型为AB 型学生进展随机编号为1,2, (50)②用白纸做成形状、大小完全一样1至50号签;③把1至50号签集中在一起放在一个大容器中充分搅拌均匀; ④沉着器中随机地抽出4个签;⑤最后把编号与抽中号码相一致学生抽出即可.9.解:抽签法或随机数表法:如检查某个班级同学对英语单词掌握情况;系统抽样:检查高一年级同学对英语单词掌握情况;分层抽样:检查全校同学对英语单词掌握情况.10.略.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

必修三 第二章统计考试时间:120分钟;满分150分第I 卷(选择题)一、选择题(每题5分,总分60分)为:96, 112, 97, 108, 99, 104, 86, 98,则他们的中位数是( ) A .100 B .99 C .98.5 D .982.用样本频率分布估计总体频率分布的过程中,下列说法准确的是( ) A .总体容量越大,估计越精确 B .总体容量越小,估计越精确 C .样本容量越大,估计越精确 D .样本容量越小,估计越精确3.已知某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图(如图所示),则 ( )A 、甲篮球运动员比赛得分更稳定,中位数为26B 、甲篮球运动员比赛得分更稳定,中位数为27C 、乙篮球运动员比赛得分更稳定,中位数为31D 、乙篮球运动员比赛得分更稳定,中位数为364.甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生( )A.30人, 30人,30人B.30人,45人,15人C.20人,30人,10人D.30人,50人,10人 5第三组的频数和频率分别是 ( ) A .14和0.14 B .0.14和14 C .141和0.14 D . 31和1416.完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户,调查社会购买水平的某项指标;②从某中学的15名艺术特长生中选出3名调查学习负担情况,宜采用的抽样方法依次是( ) A .①简单随机抽样,②系统抽样 B .①分层抽样,②简单随机抽样C .①系统抽样,②分层抽样D .①②都用分层抽样7.已知随机变量,x y 的值如下表所示,如果x 与y 线性相关且回归直线方程为7ˆ2ybx =+,则实数b =( ) 6 7463452yx A.12-B. 12C. 110-D. 1108.某班有50名同学,将其编为1、2、3、…、50号,并按编号从小到大平均分成5组.现用系统抽样方法,从该班抽取5名同学实行某项调查,若第1组抽取的学生编号为3,第2组抽取的学生编号为13,则第4组抽取的学生编号为 A .14 B .23 C .33 D .43 9.下列说法:①将一组数据中的每一个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程35y x ∧=-,变量x 增加一个单位时,y 平均增加5个单位; ③相关系数r 越接近1,说明模型的拟和效果越好; 其中错误的个数是( )A.1B.2C.3D.0 10.设有一个回归方程为2 2.5y x =-,变量x 增加一个单位时,则 A.y 平均增加2.5个单位B.y 平均增加2个单位 C.y 平均减少2.5个单位 D .y 平均减少2个单位11.已知数据12,,...,n a a a 的平均数为a ,方差为2S ,则数据122,2,...,2n a a a 的平均数和方差为 ( )A .2,a SB .22,a SC .22,4a SD . 22,2a S12.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取个 容量为50的样本,且在第一段中随机抽得的号码是003.这600名学生分别住在三个营区,从001到300在第一营区,从301到495在第二营区,从496到600在第三营区.则三个营区被抽到的人数分别为A .25,17,8B .25,16,9C .26,16,8D .24,17,9二、填空题(每题6分,总分36分)13.从10个篮球中任取一个,检验其质量,则应采用的抽样方法为_______________。

14.样本数据18,16,15,16,20的方差2s = .15.为了了解1200名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样考虑用系统抽样,则分段的间隔k 为_______________16.将容量为n 的样本中数据分成6个组,制成一个频率分布表,若第一组至第六组的数据频率之比为2:3:4:6:4:1,且前三组数据的频数之和为27,则n = 。

x 的线性回归方程y=bx+a 必过点______袋实行检验,将它们编号为001,002,…800,利用随机数表抽取样本,从第..7.行.第1个数8开始,依次向右,再到下一行,继续从左到右.请问选出的第七袋...牛奶的标号是_____(为了便于说明,下面摘取了随机数表的第.6.行.至第10行).16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 9643 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 5025 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 7358 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 0013 42 99 66 02 79 5457 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 8477 27 08 02 73 43 28三、解答题(三题分别为16、18、20分,总分为54分)19.如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)79.589.5这个组的频数、频率分别是多少?(2)估计这次环保知识竞赛的及格率(60分及以上为及格)20.我校高三年级实行了一次水平测试.用系统抽样的方法抽取了50名学生的数学成绩,准备实行分析和研究.经统计成绩的分组及各组的频数如下:[40,50), 2; [50,60), 3; [60,70), 10; [70,80), 15; [80,90), 12;[90,100], 8.(Ⅰ)完成样本的频率分布表;画出频率分布直方图.(Ⅱ)估计成绩在85分以下的学生比例;(Ⅲ)请你根据以上信息去估计样本的众数、中位数、平均数.(精确到0.01)频率分布表频率分布直方图21.某种产品的广告费支出x 与销售额y (单位:百万元)之间有如下对应数据: x 2 4 5 6 8 y3040605070其中 ∑∑==--=ni ini ii xn xyx n yx 1221b(1)画出散点图; (2)求回归直线方程;(3)试预测广告支出为10百万元时,销售额多大?参考答案1.C【解析】试题分析:根据题意,某种轮胎的性能,随机抽取了8个实行测试,那么其结果分别是86,96, 97, 98, 99, 104, 108, 112,从小到大排列,那么中位数是最中间的两数的平均值,即为98+99=197,其平均值为98.5,故可知答案为C.考点:中位数点评:主要是考查了数据中中位数的求解和简单的使用,属于基础题。

2.C【解析】试题分析:根据用样本估计总体的原则可知,样本容量越大,估计越精确,总体容量越小,估计越不精确,故选C。

考点:样本估计总体点评:主要是考查了样本频率分布估计总体频率分布的使用,属于基础题。

3.D【解析】因为乙篮球运动员比赛得分比较集中在31—39之间,所以乙篮球运动员比赛得分更稳定,按从小到大的顺序排列可知中位数为364.B【解析】试题分析:根据题意,因为分层抽样的方法适合与差异比较明显的个体,而甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,并且死等比例性质,即可知90:10800=1:120,则可知应在这三校分别抽取学生111360030,540045,180015,⨯=⨯=⨯=故答案为B.120120120考点:分层抽样点评:主要是考查了分层抽样方法的使用,属于基础题。

5.A【解析】试题分析:根据表格可知,第三组的频数为x,那么因为题目中是容量100为的样本数据,那么可知10+13+x+14+15+13+12+9=100,x=14,同时根据频数比上容量100,即为频率,那么可知为0.14,故答案为A.考点:频数与频率点评:主要是考查了频数与频率概念的使用,属于基础题。

6.B【解析】试题分析:根据题意,因为①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户,调查社会购买水平的某项指标;个体差异比较大,故选择分层抽样,对于从某中学的15名艺术特长生中选出3名调查学习负担情况,因为总体较少,则可知抽样方法为简单随机抽样,故答案为B考点:抽样方法点评:主要是考查了抽样方法的基本运算,属于基础题。

7.B【解析】试题分析:2345463,5,33x y ++++==== 所以10122433514916392b ++-⨯⨯==++-⨯考点:线性相关的随机变量的回归直线方程8.C 【解析】试题分析:∵第1组抽取的学生编号为3,第2组抽取的学生编号为13,∴各组间隔为10,∴第4组抽取的学生编号为3+30=33.故选C 考点:本题考查了系统抽样的使用点评:熟练掌握系统抽样的步骤是解决此类问题的关键,属基础题 9.A 【解析】试题分析:根据方程的的运算性质知①准确;根据回归方程35y x ∧=-可知,变量x 增加一个单位时,y 平均减少5个单位,所以②准确;相关系数r 越接近0,说明模型的拟和效果越好,所以③准确.考点:本小题主要考查统计中的概念。

点评:统计中的概念性问题也比较多,要仔细思考,准确区分应用. 10.C 【解析】试题分析:根据题意,对于回归方程为2 2.5y x =-,当x 增加一个单位时,则y 的平均变化为y-2.5(x+1)-(y-2.5x)=-2.5,故可知y 平均减少2.5个单位,选C.考点:线性回归方程点评:本题考查线性回归方程的应用,考查线性回归方程自变量变化一个单位,对应的预报值是一个平均变化,这是容易出错的知识点. 11.C 【解析】 试题分析:数据12,,...,n a a a 的平均数为a ,方差为S2,则另一组数据122,2, (2)a a a 的平均数为x 2x 2a '==,方差是22s 4s '=,∵222222212n 1211S [2x 2x 2x 2x 2x 2][4()4()......4()]n n x x x x x x x n'=-+-+⋯+-=-+-++-()()(),故选D .考点:本题主要考查平均数、方差的计算公式及其性质。

相关文档
最新文档