2018-2019学年高中数学人教A版必修3教学案:第二章2.3变量间的相关关系-含解析
高中数学23变量间的相关关系一二全册精品教案新人教A版必修3教案
高中数学23变量间的相关关系一二全册精品教案新人教A版必修3教案教案名称:高中数学23变量间的相关关系一、二全册精品教案教材版本:新人教A版必修3教学目标:1.掌握变量之间的相关关系的概念;2.理解相关系数的含义和计算方法;3.能够应用相关关系解决实际问题;4.培养学生分析和解决问题的能力。
教学重点:1.相关系数的计算方法;2.相关关系的实际应用。
教学难点:1.相关系数的计算和解释;2.相关关系在实际问题中的应用。
教学准备:1.教师准备板书工具,包括黑板、彩色粉笔等;2.教师准备教学用具,如教学课件、实验仪器等。
教学过程:第一课时:1.导入(5分钟)教师通过引入相关关系在日常生活中的例子,引起学生的思考和兴趣,如“你有没有觉得吃得越多睡得越香?”、“你觉得天气越热人们购买冷饮的数量会有什么变化?”等。
2.引入(10分钟)教师通过示意图和简单的计算,引导学生理解变量之间的相关关系,并介绍相关系数的定义和计算方法。
3.基础知识讲解(25分钟)3.1相关系数的含义和计算方法:教师通过示例和公式解释相关系数的含义和计算方法,让学生掌握相关系数的计算公式。
3.2相关系数的性质和意义:教师讲解相关系数的性质和意义,引导学生理解相关系数与变量之间的线性关系程度的关系。
4.练习(10分钟)教师布置一些相关系数的计算练习题,让学生进行个人或小组练习。
第二课时:5.复习(5分钟)回顾上节课学习的内容,教师提问学生相关系数的计算方法及其含义,并解答学生疑惑。
6.拓展(15分钟)6.1相关系数的解读:教师通过实例和图表解释如何解读相关系数的大小和正负号。
6.2相关系数的应用:教师介绍相关系数在实际问题中的应用,如市场调研、经济预测等。
7.实验(20分钟)教师组织学生进行相关系数实验,通过观察和数据统计,让学生进一步理解相关系数的计算方法和含义。
8.总结归纳(10分钟)教师引导学生总结相关系数的计算方法、含义和应用,并与学生一起完成相关关系的概念思维导图。
人教A版高中数学必修3《二章 统计 2.3 变量间的相关关系 2.3.1 变量之间的相关关系》优质课教案_17
《变量间的相关关系》教学设计(2课时)一、教材分析学生情况分析:学生已经具备了对样本数据进行初步分析的能力,且掌握了一定的计算机基础,主要是电子表格的使用。
教材地位和作用:变量间的相关关系是高中新教材人教A版必修3第二章2.3节的内容, 本节课主要探讨如何利用线性回归思想对实际问题进行分析与预测。
为以后更好地研究选修2-3第三章3.2节回归分析思想的应用奠定基础。
结合教材特点及学情,特制定三维教学目标如下:二、教学目标1、知识与技能:利用散点图判断线性相关关系,了解最小二乘法的思想及2回归方程系数公式的推导过程,利用电子表格求出回归直线的方程并对实际问题进行分析和预测,通过实例加强对回归直线方程含义的理解2 、过程与方法:①通过自主探究体会数形结合、类比、及最小二乘法的数学思想方法。
②通过动手操作培养学生观察、分析、比较和归纳能力,引出利用计算机等现代化教学工具的必要性。
3、情感、态度与价值观:类比函数的表示方法,使学生理解变量间的相关关系,增强应用回归直线方程对实际问题进行分析和预测的意识。
利用计算机让学生动手操作,合作交流激发学生的学习兴趣。
三、教学重点、难点重点:利用散点图直观认识两个变量之间的线性相关关系,了解最小二乘法的思想并利用此思想借助电子表格求出回归方程。
教学内容的难点:对最小二乘法的数学思想和回归方程的理解教学实施过程中的难点:根据给出的线性回归方程的系数公式建立线性回归方程。
四、教学媒体设计本节课涉及大量数据计算及分析,用传统方法很难突破,故我主要采用电子表格和几何画板,通过学生动手操作、教师动画演示、师生合作交流来突出重点、突破难点。
学生学习效果有明显提高。
五、教学设计(具体如下表)(一)、创设情境导入新课1、相关关系的理解师:我们曾经研究过两个变量之间的函数关系:一个自变量对应着唯一的一个函数值,这两者之间是一种确定关系。
生活中的任何两个变量之间是不是只有确定关系呢?让学生举例,教师总结如:生:不是。
[精品]新人教A版必修三高中数学第二章2.2.3变量间的相关关系导学案
23 变量间的相关关系1.了解相关关系、线性相关、回归直线、最小二乘法的定义.2.会作散点图,并能利用散点图和定义判断两个变量之间是否具有相关关系.3.会求回归直线方程,并能用回归直线方程解决有关问题.1.相关关系(1)定义:如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的性,那么这两个变量之间的关系,叫做相关关系.(2)两类特殊的相关关系:如果散点图中点的分布是从角到角的区域,那么这两个变量的相关关系称为正相关,如果散点图中点的分布是从角到角的区域,那么这两个变量的相关关系称为负相关.两个变量间的关系分为三类:一类是确定性的函数关系,如正方形的边长与面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,这种关系就是相关关系,例如,某位同的“物理成绩”与“数成绩”之间的关系,我们称它们为相关关系;再一类是不相关,即两个变量间没有任何关系.【做一做1】下列图形中具有相关关系的两个变量是( )[]2.线性相关(1)定义:如果两个变量散点图中点的分布从整体上看大致在一条附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做.(2)最小二乘法:求线性回归直线方程(y,^) =(b,^)+(a,^)时,使得样本数据的点到它的最小的方法叫做最小二乘法,其中(a,^),(b,^)的值由以下公式给出:错误!其中,(b,^)是回归方程的,(a,^)是回归方程在y轴上的.线性回归分析涉及大量的计算,形成操作上的一个难点,可以利用计算机非常方便地作散点图、回归直线,并能求出回归直线方程.因此在习过程中,要重视信息技术的应用.【做一做2】某单位为了解用电量y(千瓦时)与气温(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得线性回归方程(y,^) =(b,^)+(a,^)中(b,^)≈-2,则(a,^)≈答案:1.(1)随机(2)左下右上左上右下【做一做1】A项中显然任给一个都有唯一确定的y和它对应,是一种函数关系;B项也是一种函数关系;项中从散点图可以看出所有点看上去都在某条直线附近波动,具有相关关系,而且是一种线性相关关系;D项中所有的点在散点图中没有显示任何关系,因此变量间是不相关的.[]2.(1)直线回归直线(2)距离的平方和\t(y)-(b,^)\t() 斜率截距【做一做2】60\t()=18+13+10-14=10,\t(y)=24+34+38+644=40,则(a,^)=\t(y)-(b,^)\t()≈40+2×10=601.相关关系与函数关系的异同剖析:相同点:两者均是指两个变量的关系.不同点:①函数关系是一种确定的关系.如匀速直线运动中时间t与路程s的关系;相关关系是一种非确定的关系.如一块农田的水稻产量与施肥量之间的关系.②函数关系是一种因果关系,而相关关系不一定是因果关系,可能是伴随关系.2.线性回归直线方程的性质剖析:(1)回归直线过样本数据的中心.所谓样本数据的中心,对于单变量样本数据而言,平均数是样本数据的中心;对于以(n,y n)为样本数据而言,(\t(),\t(y))为样本点的中心,根据最小二乘法原理,回归直线一定过样本点的中心.(2)回归直线的单调性与样本数据的相关性.如果样本数据对应的点具有线性相关关系,从回归直线方程看,当系数b>0时,直线单调递增,此时这两个变量正相关;当b <0时,直线单调递减,此时这两个变量负相关.3.理解最小二乘法剖析:结合最小二乘法的发展过程和在实际生活中的应用了解最小二乘法.如果以不同精度多次观测一个或多个未知量,为了求出各未知量的最可靠值,各观测量必须改为正数,使其所改正数的平方乘以观测值的权数的总和为最小,这种方法称为最小二乘法,所谓“权”就是表示观测结果质量相对可靠程度的一种权衡值.最小二乘法的思想是通过最小化误差的平方和找到一组数据的最佳函数匹配,是用最简单的方法求得一些绝对不可知的真值,而令误差平方之和为最小,是处理各种观测数据测量方差的一种基本方法,是一种数优化技术.在统计中,主要是利用最小二乘法求线性回归方程,这是最小二乘法思想的应用.最小二乘法不仅是数理统计中一种常用的方法,在工业技术和其他研究中也有着广泛的应用,比如洪水实时预报等.题型一判断相关关系【例题1】设对变量,y有如下观察的数据:1542(1)画出散点图.(2)判断变量,y是否具有相关关系?如果具有相关关系,那么是正相关还是负相关?[||]分析:对于给定一组观察数据,可以借助作散点图这样有效的手段进行处理.反思:两个随机变量和y是否具有相关关系的确定方法:①散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断(如本题);②表格、关系式法:结合表格或关系式进行判断;③经验法:借助积累的经验进行分析判断.题型二求回归直线方程【例题2】每立方米混凝土的水泥用量(单位:g)与28天后混凝土的抗压强度y(单位:g/c2)之间的关系有如下数据:求两个变量间的回归直线方程.分析:由题目可获取以下主要信息:①两个变量具有线性相关关系;②由两个变量的对应数据求回归直线方程.解答本题要先列出相应的表格,有了表格中的那些相关数据,回归方程中的系数就都容易求出了.反思:(1)用公式求回归方程的一般步骤是:①列表i,y i,i y i②计算\t(),\t(y),错误!错误!,错误!i y i③代入公式计算(b,^),(a,^)的值.④写出回归直线方程.(2)求回归直线方程时应注意的问题:①用公式计算(a,^),(b,^)的值时,要先算出(b,^),然后才能算出(a,^)②使用计算器能大大简化手工的计算,迅速得出正确的结果,但输入数据时要细心,不能出任何差错;不同计算器的按键方式可能不同,可参考计算器的使用说明书进行相关的计算.题型三线性回归分析的应用【例题3】下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于的线性回归方程(y,^) =(b,^)+(a,^);(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?(参考数值:3×25+4×3+5×4+6×45=665)分析:(1)以产量为横坐标,以生产能耗对应的测量值为纵坐标,在平面直角坐标系内画散点图;(2)应用计算公式求得线性相关系数(b,^),(a,^)的值;(3)实际上就是求当=100时,对应的y的值.反思:(1)回归分析是寻找相关关系中非确定性关系的某种确定性,通常转化为求出回归直线方程.已知(y)估计相应的(y,^) ((,^)),这时代入回归直线方程即可解决;(2)求回归直线方程,关键在于正确地求出系数(a,^),(b,^),由于(a,^),(b,^)的计算最大,计算时要仔细,避免计算失误.题型四易错辨析【例题4】下列变量之间的关系属于相关关系的是( )A.圆的周长和它的半径之间的关系B.价格不变的条件下,商品销售额与销售量之间的关系.家庭收入愈多,其消费支出也有增长的趋势D.正方形面积和它的边长之间的关系错解:选B或A或D.错因分析:两个变量间的相关关系不同于函数关系.所谓函数关系,就是其中一个变量(自变量)的每一个值,唯一确定了另一个变量(因变量)的值;而对于相关关系,两个变量间则没有确定的关系,它们的关系相对说是随机的.错解正是混淆了这两者之间的关系,而造成了误选.答案:【例题1】解:(1)画出散点图.(2)具有相关关系.根据散点图,左下角到右上角的区域,变量的值由小变大时,另一个变量y的值也由小变大,所以它们具有正相关关系.【例题2】 解:列表如下:23 322则(b ,^)=182 943-12×205×726518 600-12×2052=4 34714 300≈0304,(a ,^)=\t(y )-(b ,^)\t()=726-0304×205=1028, 于是所求的回归直线方程是(y ,^)=0304+1028 【例题3】 解:(1)散点图,如图所示.(2)由题意,得错误!i y i =3×25+4×3+5×4+6×45=665, \t()=3+4+5+64=45,\t(y )=25+3+4+454=35,错误!错误!=32+42+52+62=86,则(b ,^)=665-4×45×3586-4×452=665-6386-81=07,(a ,^)=\t(y )-(b ,^)\t()=35-07×45=035, 故线性回归方程为(y ,^) =07+035(3)根据线性回归方程的预测,现在生产100吨产品消耗的标准煤的数量为07×100+035=7035,故消耗能减少了90-7035=1965(吨).【例题4】 正解:因选项A ,B ,D 中的两个变量间都有唯一确定的关系,因而它们都是函数关系;而选项中家庭收入会对消费支出产生一定的影响,但高收入未必有高消费,因而选项中的关系才是相关关系.故选.1.(2011·北京丰台二模,文7)已知,y 的取值如下表:从散点图可以看出y 与线性相关,且回归方程为y =095+a ,则a =( )A .325B .26 .22 D .0 2.某考察团对全国10个城市进行职工人均工资水平(千元)与居民人均消费水平y (千元)统计调查,y 与具有相关关系,回归方程为y =066+1562若某城市居民人均工资为9 000元,则其居民人均消费水平为千元.3.某商店统计了最近6个月某商品的进价与售价y (单位:元)的对应数据如下:则x =,y =,621i i x =∑=,61i i i x y =∑=,回归直线方程为.4.已知10只狗的血细胞体积及红细胞数的测量值如下表: 红细胞数y (1)根据上表画出散点图;(2)根据散点图,判断血细胞体积与红细胞数y 之间是否具有相关关系.5.假设关于某设备的使用年限和所支出的维修费用y (万元)有如下的统计资料:若由资料知y 对成线性相关关系.试求: (1)线性回归方程y =bx a +的回归系数b 与a ; (2)估计使用年限为10年时,维修费用是多少?答案:1.B 线性回归方程一定经过样本取值的平均数点(x ,y ),由取值表可计算x =01344+++=2,y =2.2 4.3 4.8 6.74+++=92,知回归方程为y =095+a ,又经过点(2,92),代入得a =262.7502 当=9千元时,y =066×9+1562=75023.65 8 327 396 y =114+059 根据公式代入即可求得,也可以利用计算器求得,x =65,y =8,621i i x =∑=327,61i i i x y =∑=396,回归直线方程为y =114+0594.分析:准确画出散点图,并用散点图判断血细胞体积与红细胞数y 之间是否具有相关关系是解决本题的关键.解:(1)散点图如图所示.(2)从散点图可以看出,两个变量的对应点都集中在一条直线的附近,且y 随的增大而增大,因此血细胞体积与红细胞数y 之间具有相关关系.5.分析:因为y 对成线性相关关系,所以可以用线性相关的方法解决问题.(1)利用公式b =1221ni ii nii x y nx yxnx==--∑∑,a =y bx -计算回归系数.有时为了方便常制表对应地求出i y i ,,以利于求和.(2)获得线性回归方程后,取=10,即得所求. 解:列表:于是有b =29054-⨯=10=123, a y bx =-=5-123×4=008(2)回归直线方程是y =123+008,当=10(年)时,y =123×10+008=1238(万元),即估计使用10年时维修费用是1238万元.。
高中数学人教A版必修3《2.3.1变量间的相关关系》教案4
必修三 2.3.1 变量间的相关关系教学目标1、知识与技能(1)了解变量之间的相关关系。
(2)会区别变量之间的函数关系与变量相关关系。
(3)会举例说明现实生活中变量之间的相关关系。
(4)让学生了解产生变量之间的相关关系是由许多不确定的随机因素的影响。
2、过程与方法(1)通过复习变量之间的函数关系引出变量相关关系,有熟悉到生疏的过程便于学生理解。
(2)通过对变量之间的关系的学习让学生了解从总的变化趋势来看变量之间存在某种关系,但这种关系又不能用确定的函数关系精确表达出来,也让学生了解变量之间的不确定性关系是很普遍的,帮助学生树立科学的辨证唯物主义观点,感受自然的辩证法。
(3)通过对本课的学习,引导学生关注社会,关注生活,进一步学会观察、比较、归纳、分析等一般方法的运用。
3、情感、态度与价值观(1)通过引导学生观察生活中的例子,使学生由能直接找出变量之间的函数关系引出到无法直接找出变量之间的函数关系,即变量之间的相关关系,激发学生的求知欲。
(2)通过引导学生感受生活中实际问题转化为数学问题,学会查找资料,收取信息,学会用统计知识对实际问题进行数学分析。
教学重点1、变量之间的相关关系。
2、会区别变量之间的函数关系与变量相关关系。
3、会举例说明现实生活中变量之间的相关关系。
教学难点1、对变量之间的相关关系的理解。
2、变量之间的函数关系与变量相关关系的区别。
教辅手段教学过程一、情景设置问题1:将汽油以均匀的速度注入桶里,注入的时间t与注入的油量y的关系如下表:从表里数据得出油量y与时间t之间的函数关系式为:问题2、甲、乙两地相距150千米,某人骑车从甲地到乙地,则他的速度v(千米/时)和时间t(小时)的函数大致图象是怎样的?问题3、小麦的产量y千克每亩与施肥量x千克每亩之间的关系如下表:从表里数据能得出小麦的产量y与施肥量x之间的函数关系式吗?提问学生以下三个问题。
问题1:因为是以均匀的速度注入桶里,所以注入的油量y与注入的时间t成正比例关系,由数据表格知,注入的油量y与注入的时间t之间的函数关系式为y=2t(t 0)(实际问题,因此自变量的取值范围应该有意义)问题2:路程一定,所以走完全程所用的时间t与速度v成反比例关系所以其函数图象是反例函数图象。
高中数学人教A版必修3第二章《2.3.1 变量之间的相关关系》优质课公开课教案教师资格证面试试讲教案
高中数学人教A版必修3第二章《2.3.1 变量之间的相关关系》优质课公开课教案教师资格证面试试讲教案
1教学目标
1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.
2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. (线性回归方程系数公式不要求记忆公式)
3.通过典型案例了解回归分析的思想、方法。
并能初步应用回归分析的思想、方法解决一些简单的实际问题。
4.通过典型案例了解独立检验(只要求2×2列联表)的思想、方法.并能初步应用独立检验的思想、方法解决一些简单的实际问题.
2学情分析
变量之间的关系是人们感兴趣的问题.教科书通过思考栏目“物理成绩与数学成绩之间的关系”,引导学生考察变量之间的关系.在教师的引导下,可使学生认识到在现实世界中存在不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性.随后,通过探究人体脂肪百分比和年龄之间的关系,引入描述两个变量之间关系的线性回归方程(模型).教科书在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想.通过气温与饮料销售量的例子及随后的思考,使学生了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能犯的错误.进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性.
3重点难点
1、通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;利用散点图直观认识两个变量之间的线性关系;根据给出的线性回归方程的系数公式建立线性回归方程.
2、变量之间相关关系的理解;作散点图和理解两个变量的正相关和负相关;理解最小二乘法的思想
4教学过程
4.1第一学时。
高中数学 第2章 统计 2.3 变量间的相关关系(教师用书)教案 新人教A版必修3-新人教A版高一必
2.3 变量间的相关关系2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关学 习 目 标核 心 素 养1.了解变量间的相关关系,会画散点图,并利用散点图判断两个变量之间是否具有相关关系.(重点)2.了解线性回归思想,会求回归直线方程.(难点)1.通过对数据的分析、统计,培养数据分析素养.2.借助变量间相关关系的研究,提升数学运算素养.1.变量间的相关关系 (1)相关关系的定义变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,那么这两个变量之间的关系叫做相关关系,两个变量之间的关系分为函数关系和相关关系.(2)散点图将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形叫做散点图. (3)正相关与负相关①正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.②负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.2.回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)线性回归方程:回归直线对应的方程叫做回归直线的方程,简称回归方程. (3)最小二乘法:求线性回归方程y ^=b ^x +a ^时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.⎩⎪⎨⎪⎧b ^=i =1n (x i-x )(y i-y )i =1n (x i-x )2=∑i =1nx i y i-n x y ∑i =1nx 2i-n x 2,a ^=y -b ^x ,其中,b ^是线性回归方程的斜率,a ^是线性回归方程在y 轴上的截距.1.以下两个变量具有相关关系的是( ) A .角度和它的余弦值 B .圆的半径和该圆的面积 C .正n 边形的边数和它的内角和 D .居民的收入与存款D [A 、B 、C 中两变量是确定的函数关系.]2.变量x ,y 之间具有线性相关关系,其散点图如下图,那么其回归方程可能为( )A.y ^x +2 B.y ^x +2 C.y ^x -2 D.y ^x -2B [由散点图知,变量x ,y 之间负相关,回归直线在y 轴上的截距为正数,故只有B 选项符合.]3.5位学生的数学成绩和物理成绩如下表:学科 A B C D E 数学 80 75 70 65 60 物理7066686462那么数学成绩与物理成绩之间( ) A .是函数关系B .是相关关系,但相关性很弱C .具有较好的相关关系,且是正相关D .具有较好的相关关系,且是负相关 C [数学成绩x 和物理成绩y 的散点图如下图.从图上可以看出数学成绩和物理成绩具有较好的相关关系,且成正相关.]4.设有一个回归方程为y ^x ,那么变量x 每增加1个单位时,y 平均减少________个单位. 1.5[因为y ^x ,所以变量x 每增加1个单位时,y 1-y 2=[2-1.5(xx )=-1.5,所以y 平均减少1.5个单位.]相关关系及判断【例1】 某个男孩的年龄与身高的统计数据如下表所示. 年龄x (岁) 1 2 3 4 5 6 身高y (cm) 788798108115120(1)画出散点图;(2)判断y 与x 是否具有线性相关关系. [解] (1)散点图如下图.(2)由图知,所有数据点接近一条直线排列,因此,认为y 与x 具有线性相关关系.相关关系的判断方法(1)两个变量x 和y 具有相关关系的判断方法①散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;②表格、关系式法:结合表格或关系式进行判断; ③经验法:借助积累的经验进行分析判断.(2)判断两个变量x 和y 之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.[跟进训练]1.以下关系中,属于相关关系的是________(填序号). ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③出租车费与行驶的里程;④降雪量与交通事故的发生率之间的关系.②④[在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③为确定的函数关系;在④中,降雪量与交通事故的发生率之间具有相关关系.]求回归方程1.任意两个统计数据是否均可以作出散点图? [提示]任意两个统计数据均可以作出散点图.2.任何一组数据都可以由最小二乘法得出回归方程吗?[提示]用最小二乘法求回归方程的前提是先判断所给数据具有线性相关关系,否那么求回归方程是无意义的.3.回归系数b ^的含义是什么?[提示](1)b ^代表x 每增加一个单位,y 的平均增加单位数,而不是增加单位数. (2)当b ^>0时,两个变量呈正相关关系,含义为:x 每增加一个单位,y 平均增加b ^个单位数;当b ^<0时,两个变量呈负相关关系,含义为:x 每增加一个单位,y 平均减少b ^个单位数. 【例2】 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:零件数x (个) 10 20 30 40 50 60 70 80 90 100 加工时间y (分)626875818995102108115122(1)y 与x 是否具有线性相关关系?(2)如果y 与x 具有线性相关关系,求y 关于x 的回归直线方程.思路点拨:画散点图→确定相关关系→求回归直线系数→写回归直线方程. [解] (1)画散点图如下:由上图可知y 与x 具有线性相关关系. (2)列表、计算: i 1 2 3 4 5 6 7 8 9 10 x i 10 20 30 40 50 60 70 80 90 100 y i 62 68 75 81 89 95 102 108 115 122 x i y i6201 3602 2503 2404 4505 7007 1408 64010 35012 200x =55,y =91.7,∑i =110=x 2i =38 500,∑i =110y 2i =87 777,∑i =110x i y i =55 950求回归直线方程的步骤(1)收集样本数据,设为(x i,y i)(i=1,2,…,n)(数据一般由题目给出).(2)作出散点图,确定x,y具有线性相关关系.[跟进训练]2.某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x 24568y 3040605070(1)(2)求回归方程.[解](1)散点图如下图.(2)列出下表,并用科学计算器进行有关计算.i 1 2 3 4 5 x i 2 4 5 6 8 y i 30 40 60 50 70 x i y i 60 160 300 300 560 x 2i4162536 64x =5,y =50,∑i =15x 2i =145,∑i =15x i y i =1 380于是可得,b ^=∑i =15x i y i -5x y∑i =15x 2i -5x2=1 380-5×5×50145-5×52=6.5,a ^=y -b ^x ×5=17.5. 于是所求的回归方程是y ^x +17.5.回归方程的应用响,对近五年该农产品的年产量和价格统计如表:x 1 2 3 4 5 y86542x 和y (1)求x ,y ;(2)求y 关于x 的线性回归方程y ^=b ^x +a ^; (3)假设年产量为4.5吨,试预测该农产品的价格.[解] (1)计算可得x =1+2+3+4+55=3,y =8+6+5+4+25=5.因为线性回归直线过(x ,y ),那么a ^=y -b ^x ×3)=9.2, 故y 关于x 的线性回归方程是y ^x +9.2. (3)当x =4.5时,y ^×4.5+9.2=2.9(千元/吨).利用线性回归方程解题的常见思路及注意点(1)利用回归直线过样本点的中心,可以求参数问题,参数可涉及回归方程或样本点数据. (2)利用回归方程中系数b ^的意义,分析实际问题.(3)利用回归直线进行预测,此时需关注两点;①所得的值只是一个估计值,不是精确值;②变量x 与y 成线性相关关系时,线性回归方程才有意义,否那么即使求出线性回归方程也是毫无意义的,用其估计和预测的量也是不可信的.[跟进训练]3.在一段时间内,分5次测得某种商品的价格x (万元)和需求量y (吨)之间的一组数据为价格x 2 需求量y1210753(1)根据上表数据,求出回归直线方程y ^=b ^x +a ^;(2)试根据(1)中求出的回归方程预估当价格为1.9万元时,需求量大约是多少吨?[解] (1)因为x =15×9=1.8,y =15×37=7.4,1.判断变量之间有无相关关系,简便可行的方法就是绘制散点图.根据散点图,可看出两个变量是否具有相关关系,是否线性相关,是正相关还是负相关.2.求回归直线的方程时应注意的问题(1)知道x 与y 呈线性相关关系,无需进行相关性检验,否那么应首先进行相关性检验.如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.(2)用公式计算a ^,b ^的值时,要先算出b ^,然后才能算出a ^.3.利用回归方程,我们可以进行估计和预测.假设回归方程为y ^=b ^x +a ^,那么x =x 0处的估计值为y ^0=b ^x 0+a ^.1.判断以下结论的正误(正确的打“√〞,错误的打“×〞) (1)相关关系是两个变量之间的一种确定的关系.( ) (2)回归直线方程一定过样本中心点.( )(3)选取一组数据的部分点得到的回归方程与由整组数据得到的回归方程一定相同.( )[答案](1)× (2)√ (3)×2.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^( ) A .不能小于0 B .不能大于0 C .不能等于0D .只能小于0C [当b ^=0时,不具有相关关系,b ^可以大于0,也可以小于0.]3.假设施化肥量x (千克/亩)与水稻产量y (千克/亩)的回归方程为y ^=5x +250,当施化肥量为80千克/亩时,预计水稻产量为亩产________千克左右.650[当x =80时,y ^=400+250=650.]4.2019年元旦前夕,某市统计局统计了该市2018年10户家庭的年收入和年饮食支出的统计资料如下表:如果y 与x 是线性相关的,求回归方程.(参考数据:∑i =110x i y i =117.7,∑i =110x 2i =406)[解] 依题意可计算得:x =6,y =1.83,x 2=36,x y =10.98,又∵∑i =110x i y i =117.7,∑i =110x 2i =406,∴b ^=∑i =110x i y i -10x y∑i =110x 2i -10x2≈0.17,a ^=y -b ^x =0.81, ∴y ^x +0.81.∴所求的回归方程为y ^x +0.81.。
高中数学必修3(人教A版)教案—2.3变量间的相关关系
2. 3变量间的相关关系一、教材分析本节知识内容不多,但分析本节内容,至少有下列特点:1)知识的联系面广,应用性强,概念的真正理解有难度,教学既要承前启后,完成统计必修基础知识的构建;也要知道知识的来龙去脉,提升学生运用统计知识解决实际问题的能力,更要抓住本质,正确理解统计推断的结论。
2)通过典型案例进行教学,使知识形成的过程中具有可操作性,易于创设问题情境,引导学生参与,而学生借助解决问题,通过自主思维活动,会产生感悟、发现,能提出问题,思考交流,不仅能正确、全面地理解基础知识和基本方法,而且能促进、发展学生的统计意识、统计思想。
二、教学目标1.通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;2.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
三、教学重点难点重点:作出散点图和根据给出的线性回归方程系数公式建立线性回归方程。
难点:对最小二乘法的理解。
四、学情分析本节是一种对样本数据的处理方法,但侧重的是由样本推断总体,其方法是学生初识的、知识的作用也是学生初见的。
知识量并不大,但涉及的数学方法、数学思想较充分,同时,在教材中留有供发现的点,设有开放性问题,既具有体验数学方法、数学思想的功能,也具有培养学生从具体到抽象能力、锻炼创造性思维能力的作用。
五、教学方法1.自主探究,互动学习2.学案导学:见后面的学案。
3.新授课教学基本环节:预习检查、总结疑惑→情境导入、展示目标→合作探究、精讲点拨→反思总结、当堂检测→发导学案、布置预习六、课前准备1.学生的学习准备:预习课本,初步把握必须的定义。
2.教师的教学准备:多媒体课件制作,课前预习学案,课内探究学案,课后延伸拓展学案。
七、课时安排:1课时八、教学过程〖复习回顾〗标准差的公式为:______________________________________________________〖创设情境〗1、函数是研究两个变量之间的依存关系的一种数量形式.对于两个变量,如果当一个变量的取值一定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个函数关系2、在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题。
人教版高中数学必修三学案设计:2.3变量间的相关关系导学案设计(教师用)
课题: 变量的相关关系 课时:第1课时【学习目标】1.正确作出关于两个变量统计数据的散点图,并利用散点图判断两个变量之间是否具有相关关系.2.理解两个变量之间的线性相关,回归直线方程的推导.3.理解回归分析实际上是将非确定性的相关关系问题转化成确定性的函数关系进行研究.,4.能准确求得回归方程并能利用回归方程对两个变量间的相关关系进行估计.第一环节:导入学习(激情导入)1.两个变量的线性相关 (1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.回归方程 (1)最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法. (2)回归方程方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ^,b ^是待定参数.⎩⎨⎧b ^=∑ni =1(x i -x )(y i -y )∑n i =1(x i-x )2=∑ni =1x i y i -n x y ∑ni =1x 2i -n x2,a ^=y -b ^x .3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x ,y )称为样本点的中心. (3)相关系数当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.第二环节:自主学习(知识点以题的形式呈现)(一)基础学习(本课需要掌握的基础知识)1判断下面结论是否正确(请在括号中打“√”或“×”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( × ) (2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( √ ) (3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( √ )(4)某同学研究卖出的热饮杯数y 与气温x (℃)之间的关系,得回归方程y ^=-2.352x +147.767,则气温为2℃时,一定可卖出143杯热饮.( × )2.已知变量x 和y 满足关系y ^=-0.1x +1,变量y 与z 正相关.下列结论中正确的是( C ) A.x 与y 正相关,x 与z 负相关 B.x 与y 正相关,x 与z 正相关 C.x 与y 负相关,x 与z 负相关 D.x 与y 负相关,x 与z 正相关3.试从下面四个图中的点在散点图上的分布状态,直观上初步判断两个变量之间有线性相关关系的是( C )4.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423;②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493;④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( D ) A .①② B .②③ C .③④D .①④5.为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下:父亲身高x(cm) 174 176 176 176 178 儿子身高y(cm)175175176177177则y 对x 的线性回归方程为( C ) A .y =x -1 B .y =x +1 C .y =88+12xD .y =1765.C 计算得,x =174+176+176+176+1785=176,y =175+175+176+177+1775=176,根据回归直线经过样本中心(x ,y )检验知,C符合.(二)深入学习(需掌握的知识转化成能力——知识运用)某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:零件的个数x (个) 2 3 4 5 加工的时间y (小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y 关于x 的线性回归方程y ^=b ^x +a ^,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少小时?(注:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x )解 (1)散点图如图.(2)由表中数据得:∑i =14x i y i =52.5,x =3.5,y=3.5,∑i =14x 2i =54,∴b ^=0.7,∴a ^=1.05,∴y ^=0.7x +1.05,回归直线如图所示.(3)将x =10代入线性回归方程, 得y ^=0.7×10+1.05=8.05,故预测加工10个零件约需要8.05小时.第三环节:互助学习 第四环节:展示学习第五环节:精讲学习(学生对应的是反思学习)。
高中数学人教A版必修三2.3.1教学设计《变量之间的相关关系》
变量之间的相关关系1.知识与技能(1)通过收集现实问题中两个有关联变量的数据认识变量间的相关关系和函数关系。
(2)明确事物间的相互联系,认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系并利用散点图直观体会这种相关关系。
(3)通过实例体会并利用散点图直观体会相关关系,了解正相关,负相关。
2.过程与方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。
3.情感态度与价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。
【教学重点】会画散点图,利用散点图直观认识两个变量之间的线性关系。
【教学难点】会画散点图,利用散点图直观认识两个变量之间的线性关系。
(一)新课导入在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题。
”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,显然,这种关系不能用我们熟悉的函数关系来描述,那么这究竟是一种什么关系?下面我们共同来研究。
(二)新课讲授(1)两变量之间的关系①函数关系:当自变量取值一定时,因变量取值由它唯一确定;例:正方形面积S与其边长x之间的函数关系S=x2 ,对自变量边长的每一个确定值,都有唯一确定的面积的值与之对应。
(确定关系)②相关关系:当自变量取值一定时,因变量的取值带有一定的随机性;例:一块农田的水稻产量与施肥量之间的关系。
水稻产量并不是由施肥量唯一确定,在取值上带有随机性。
(不确定关系)思考1:当一个变量的取值一定时,另一个变量的取值被唯一确定,则这两个变量之间是怎样的关系?考察下列问题中两个变量之间是什么关系?为什么?(1)商品销售收入与广告支出经费;(2)粮食产量与施肥量;(3)人体内的脂肪含量与年龄。
答:当一个变量的取值一定时,另一个变量的取值被唯一确定,这两个变量是一个函数关系。
推荐-新人教版高中数学2.3变量间的相关关系教案必修三
变量间的相关关系的教学设计本节教学设计主要是使用TI92图形计算器,对普通高中课程标准实验教科书数学③第二章《统计》中的“两个变量的线性相关”进行有益的教与学探究。
学生通过对 TI图形计算器的操作,具体形象地利用散点图等直观图形认识变量之间的相关关系,同时,经历描述两个变量的相关关系的过程。
学生亲自体验了发现数学、领悟数学的全过程。
与此同时,教师在落实新课程标准的相关理念上作了一些有益的探讨。
教学设计与实践:[教学目标]:1、明确事物间的相互联系。
认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系。
2、通过TI技术探究用不同的估算方法描述两个变量的线性相关关系的过程,学会用数学的有关变量来描述现实关系。
3、知道最小二乘法思想,了解其公式的推导。
会用TI图形计算器来求回归方程,相关系数。
[教学用具]:学生每人一台TI图形计算器、多媒体展示台、幻灯[教学实践情况]:一、问题引出:请同学们如实填写下表(在空格中打“√” )然后回答如下问题:①“你的数学成绩对你的物理成绩有无影响?”②“ 如果你的数学成绩好,那么你的物理成绩也不会太差,如果你的数学成绩差,那么你的物理成绩也不会太好。
”对你来说,是这样吗?同意这种说法的同学请举手。
根据同学们回答的结果,让学生讨论:我们可以发现自己的数学成绩和物理成绩存在某种关系。
(似乎就是数学好的,物理也好;数学差的,物理也差,但又不全对。
)教师总结如下:物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法。
数学成绩的高低对物理成绩的高低是有一定影响的。
但决非唯一因素,还有其它因素,如图所示(幻灯片给出):(影响你的物理成绩的关系图)因此,不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少。
但这两个变量是有一定关系的,它们之间是一种不确定性的关系。
如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义。
高中数学必修3第二章第三节《变量间的相关关系》全套教案
2.3.变量间的相关关系2.3.1变量间的相关关系【教学目标】(1)了解变量之间的相关关系。
(2)会区别变量之间的函数关系与变量相关关系。
(3)会举例说明现实生活中变量之间的相关关系。
【教学重点难点】1、变量之间的相关关系。
2、会区别变量之间的函数关系与变量相关关系。
3、会举例说明现实生活中变量之间的相关关系。
【学前准备】:多媒体,预习例题个准确的函数来表示,广告费(自变量x)一定时销售额(因变量y)并没有确定,而是因为受多种因素的影响带有一定的随机性。
2、你能试着总结一下相关关系的定义吗?变量间的相关关系定义:自变婴儿出生率也高,天鹅少的地方婴儿出生率低,于是他得出了一个结论:天鹅能够带来孩子。
你认为这样的结论可靠吗?如何证明这个问题的可靠性?分析:(1)吸烟只是影响健康的一个因素,对健康的影响还有其他的一些因素,两者之间非函数关系即非因果关系;(2)不对,这也是相关关系而不是函数关系。
上面提到了很多相关关系,那它们之间的相关关系强还是弱?我们下面来研究一下。
散点图.2.3.2两个变量的线性相关【教学目标】(1)了解最小二乘法的思想及回归直线方程的推导过程;(2)通过实例加强对回归直线方程含义的理解。
【教学重难点】重点:利用散点图直观地判断两个变量之间的线性相关关系,了解统计学中,数据处理的经典方法——最小二乘法,掌握回归方程系数公式求回归方程,且进行实际预测。
难点:通过代数的方法刻画“从整体上看,各点与回归直线的距离最小”的几何特征,让学生了解最小二乘法思想,形成回归分析思想。
【学前准备】:多媒体,预习例题学生预分类情况:分类1:分成三组(1)(5),(2)(3(4)(8), 其中(1)(5)图中的点分布在一条直线上;(3)(6)(7)图中的点大部分的点落在某条直线附近,呈带状分布;(4)(8)图中的点分布比2.为考虑广告费用x与销售额y之间的关系,抽取了5家餐厅,得到如下数据:广告费用(千元) 1.0 4.0 6.0 10.0 14.销售额(千元) 19.0 44.0 40.0 52.0 53.(1)画出散点图。
高中数学人教A版必修3《2.3.1变量间的相关关系》教案1
课型:新授课年月日
教
学
目
标
知识与技能:
1.了解线性回Βιβλιοθήκη 的意义,了解最小二乘法思想;2.会求回归直线方程。
过程与方法:
经历描述两个变量的相关关系的过程,了解最小二乘法的思想。
情感、态度与价值观:
学生亲自体验了发现数学、领悟数学的全过程
教学重点
用不同估算方法描述两个变量线性相关的过程
教学难点
用不同估算方法描述两个变量线性相关的过程
教学方法
讨论法
教学过程:
批注
活动一:创设情景,揭示课题(5分钟)
问题:
1.函数是研究两个变量之间的依存关系的一种数量形式.对于两个变量,如果当一个变量的取值一定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个函数关系. 2.在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?3.这两个变量是有一定关系的,它们之间是一种不确定性的关系.类似于这样的两个变量之间的关系,有必要从理论上作些探讨,如果能通过数学成绩对物理成绩进行合理估计,将有着非常重要的现实意义.活动二:步入新知,师生交流(20分钟)
练习2.今有一组试验数据如下表所示:现准备用下列函数中的一个近似地表示这些数据满足的规律,其中最接近的一个是(C)
A.y=log2xB.y=2xC.y=(x2-1)/2 D.y=2x-2
问题提出
1.两个变量之间的相关关系的含义如何?成正相关和负相关的两个相关变量的散点图分别有什么特点?
人教A版高中数学必修三变量之间的相关关系教案(2)
变量间的相关关系的教学设计本节教学设计主要是使用TI92图形计算器,对普通高中课程标准实验教科书数学③第二章《统计》中的“两个变量的线性相关”进行有益的教与学探究。
学生通过对 TI图形计算器的操作,具体形象地利用散点图等直观图形认识变量之间的相关关系,同时,经历描述两个变量的相关关系的过程。
学生亲自体验了发现数学、领悟数学的全过程。
与此同时,教师在落实新课程标准的相关理念上作了一些有益的探讨。
教学设计与实践:[教学目标]:1、明确事物间的相互联系。
认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系。
2、通过TI技术探究用不同的估算方法描述两个变量的线性相关关系的过程,学会用数学的有关变量来描述现实关系。
3、知道最小二乘法思想,了解其公式的推导。
会用TI图形计算器来求回归方程,相关系数。
[教学用具]:学生每人一台TI图形计算器、多媒体展示台、幻灯[教学实践情况]:一、问题引出:请同学们如实填写下表(在空格中打“√” )然后回答如下问题:①“你的数学成绩对你的物理成绩有无影响?”②“ 如果你的数学成绩好,那么你的物理成绩也不会太差,如果你的数学成绩差,那么你的物理成绩也不会太好。
”对你来说,是这样吗?同意这种说法的同学请举手。
根据同学们回答的结果,让学生讨论:我们可以发现自己的数学成绩和物理成绩存在某种关系。
(似乎就是数学好的,物理也好;数学差的,物理也差,但又不全对。
)教师总结如下:物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法。
数学成绩的高低对物理成绩的高低是有一定影响的。
但决非唯一因素,还有其它因素,如图所示(幻灯片给出):(影响你的物理成绩的关系图)因此,不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少。
但这两个变量是有一定关系的,它们之间是一种不确定性的关系。
如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义。
人教课标版高中数学必修三《变量间的相关关系》教案-新版
第二章统计2.3 变量间的相关关系一、教学目标1.核心素养通过本节学习,让学生初步形成数据处能理.2.学习目标(1)两个变量之间的相关关系的理解;(2)利用散点图直观认识两个变量之间的线性关系.(2)根据给出的线性回归方程的系数公式建立线性回归方程.3.学习重点根据线性回归方程的系数公式建立线性回归方程.4.学习难点回归思想的建立,对回归直线与观测数据关系的理解.二、教学设计(一)课前设计1.预习任务任务1阅读P84-P91,思考:两个变量的关系有哪些?如何发现两个变量的关系?任务2写出线性回归直线方程的系数公式,明白公式各部分的意义2.预习自测1.下列两个变量之间的关系不是函数关系的是()A.圆的半径和它的面积B.正方形边长和它的面积C.正n边形的边数和内角和D.人的年龄和身高解:D2.设有一个回归方程为y^=2-1.5x,则变量x增加一个单位时,y平均() A.增加1.5个单位B.增加2个单位C.减少1.5个单位D.减少2个单位解:C3.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是()A.y^=1.23x+4B.y^=1.23x+5C.y^=1.23x+0.08D.y^=0.08x+1.23解:C(二)课堂设计1.知识回顾(1)频率分布表,频率分布直方图,频率分布折线图,密度曲线.(2)中数,众数,平均数,方差,标准差.2.问题探究问题探究一两个变量之间有哪些关系,如何呈现?(★▲)●活动一创设情景,感知相关关系考察下列问题中两个变量之间的关系,想一想这些问题中两个变量之间的关系是函数关系吗?(1)商品销售收入与广告支出经费(2)粮食产量与施肥量;(3)人体内的脂肪含量与年龄.(1)(2)(3)都不是函数关系,因为前者的好坏或多与少还由其它因素来确定. 述两个变量之间的关系是一种非确定性关系,称之为相关关系,也即是说自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.●活动二增设反例,深化相关关系的理解下列两个变量间,哪些是函数关系?哪些是相关关系?①已知二次函数y=ax2+bx+c,其中a、c是已知常数,取b为自变量,因变量是这个函数的判别式△=b2-4ac;②光照时间和果树亩产量;③每亩施用肥料量和粮食产量.它们之间的关系是函数关系的有①,是相关关系的有②③.函数关系中的两个变量间是一种确定性关系;相关关系是一种非确定性关系.函数关系是一种因果关系而相关关系不一定是因果关系,也可能是伴随关系.函数关系与相关关系之间有着密切联系,在一定条件下可以互相转化.问题探究二 在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:50494541392723年龄28.226.327.525.921.217.89.5脂肪61605857565453年龄34.635.233.530.831.430.229.6脂肪其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数. ●活动一 初识案例,感知两个变量间的关系思考1:观察上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?随着年龄的增加,人体脂及含量在增加.思考2:以x 轴表示年龄,y 轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.一般地,如果两个变量成正相关,散点图中的点散布在从左上角到右下角的区域两个变量成负相关. ●活动二 再析案例,用直线拟合两变量的关系有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点大致分布在一条直线附近.称这两个变量线性相关.思考3:对于一组具有线性相关关系的样本数据,你认为其回归直线是一条还是几条?在样本数据的散点图中,能否用直尺准确画出回归直线?借助计算机怎样画出回归直线呢?●活动三 回归直线方程的求法在直角坐标系中,任何一条直线都有相应的方程,回归直线的方程称为回归方程.对一组具有线性相关关系的样本数据,如果能够求出它的回归方程,那么我们就可以比较具体、清楚地了解两个相关变量的内在联系,并根据回归方程对总体进行估计.回归直线与散点图中各点的位置整体上最接近 .如何求回归直线呢?思考4:对一组具有线性相关关系的样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),设其回归方程为a bx y +=∧可以用哪些数量关系来刻画各样本点与回归直线的接近程度?.)(||2a bx y y y y y i i i i i i +=--∧∧∧其中,或可以用21ˆ()ni i i Q y y==-∑2221122()()()n n y bx a y bx a y bx a =--+--++--为了从整体上反映n 个样本数据与回归直线的接近程度,你认为选用哪个数量关系来刻画比较合适?根据有关数学原理分析,当1122211()(),()n niii ii i nniii i x x y y x y nx yb a y bx x x xnx ====---===---∑∑∑∑时,总体偏差21)ˆ(∑=-=ni i yy Q 最小,这样就得到了回归方程,这种求回归方程的方法叫做最小二乘法.回归方程中,a ,b 的几何意义分别是什么?因此利用计算器或计算机可求得年龄和人体脂肪含量的样本数据的回归方程为48.0577.0-=x y ,由此我们可以根据一个人个年龄预测其体内脂肪含量的百分比的回归值.若某人37岁,则其体内脂肪含量的百分比约为20.9% 问题探究三例1.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得线性回归方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648;③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A.①② B.②③ C.③④ D.①④ 【知识点:正相关、负相关】解 D :由回归方程y ^=b ^x +a ^知当b ^>0时,y 与x 正相关,当b ^<0时,y 与x 负相关,∴①④一定错误.例2.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A.y 与x 具有正的线性相关关系B.回归直线过样本点的中心(x ,y )C.若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 【知识点:回归方程的简单应用】解:D ∵0.85>0,∴y 与x 正相关,∴A 正确;∵回归直线经过样本点的中心(x ,y ),∴B 正确;∵Δy =0.85(x +1)-85.71-(0.85x -85.71)=0.85,∴C 正确.例 3.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:(1)(2)求出y 关于x 的线性回归方程y ^=b ^x +a ^,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少小时? 【知识点:回归方程】 解:(1)散点图如图.(2)由表中数据得:x =3.5,y =3.5 ∴b ^=0.7,∴a ^=1.05, ∴y ^=0.7x +1.05,回归直线如图所示.(3)将x =10代入线性回归方程,得y ^=0.7×10+1.05=8.05,故预测加工10个零件约需要8.05小时. 3.课堂总结(1)相关关系与函数关系的区别与联系①函数关系中的两个变量间是一种确定性关系,相关关系是一种非确定性的关系.线性相关关系是相关关系的一种特殊性况,它也是一种不确定的关系.②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. ③函数关系与相关关系之间有着密切联系,在一定条件下可以相互转化.而对于具有线性相关关系的两个变量来说,当求得其回归直线方程后,又可以用一种确定性的关系对这两个变量间的取值进行估计.④相关关系在现实生活中大量存在,从某种意义上讲,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.因此研究相关关系,不仅可以用来处理更为广泛的数学应用问题,还可以将对函数关系的认识上升到一个新的高度.(2)回归直线①回归直线的特征:像平均数可以作为一个变量的数据代表一样,回归直线也可以作为两个变量之间具有相关关系的代表.回归直线是样本数据点最大程度的吻合,即散点回归.②线性回归思想:把相关关系(不确定性关系)转化为函数关系(确定性关系).当两个具有相关关系的变量近似满足一次函数关系时,所进行的回归分析叫线性回归分析.③求回归直线方程的步骤:第一步:计算平均数x 和y ; 第二步:计算211,nni i i i i x y x ==∑∑;第三步:计算x b y axn x yx n yx x x y y x xbn i i ni ii ni i ni i iˆˆ,)()()(ˆ2121121-=--=--⋅-=∑∑∑∑====; 第四步:写出回归直线方程y bx a =+.(称点),(y x 为样本中心点,样本中心点),(y x 一定位于回归直线上)④得用回归直线方程对总体进行估计:利用回归直线方程对总体进行估计时,虽然这个值只是估计值,不是精确值,具有随机性,但它是根据统计规律得到 4.随堂检测 1.有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩; ③某人每日吸烟量和身体健康情况; ④圆的半径与面积; ⑤汽车的重量和每千米耗油量. 其中两个变量成正相关的是( )A .①③B .②④C .②⑤D .④⑤ 【知识点:正相关,负相关】解:C 由变量的相关关系的概念知,②⑤是正相关,①③是负相关,④为函数关系.2. 设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是( )A .直线l 过点(x ,y )B .x 和y 的相关系数为直线l 的斜率C .x 和y 的相关系数在0到1之间D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同 【知识点:回归直线】解A. 由样本的中心(x ,y )落在回归直线上可知A 正确;x 和y 的相关系数表示为x 与y 之间的线性相关程度,不表示直线l 的斜率,故B 错;x 和y 的相关系数应在-1到1之间,故C 错;分布在回归直线两侧的样本点的个数并不绝对平均,即无论样本点个数是奇数还是偶数,故D 错. 3. 某产品的广告费用x 与销售额y 的统计数据如下表:6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元 【知识点:回归直线】 解:B经计算可知,回归方程为9.4x +9.1, ∴当x =6(万元)时,9.4×6+9.1=65.5(万元). (三)课后作业 基础型 自主突破1.判断下面结论是否正确(请在括号中打“√”或“×”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( × ) (2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( √ )(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( √ ) (4)某同学研究卖出的热饮杯数y 与气温x (℃)之间的关系,得回归方程y ^=-2.352x +147.767,则气温为2℃时,一定可卖出143杯热饮.( × ) 【知识点:正相关、负相关概念;回归方程】 解:× √ √ ×2. 在下列各图中,两个变量具有线性相关关系的图是( )(1)(2)(3)(4)A.(1)(2) B.(1)(3) C.(2)(4) D.(2)(3)【知识点:散点图】解:D3.在对两个变量x,y进行线性回归分析时,有下列步骤:①对所求出的线性回归方程作出解释;②收集数据(x i,y i),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可行性要求能够作出变量x,y具有线性相关结论,则在下列操作顺序中正确的是()A.①②⑤③④B.③②④⑤①C.②④③①⑤D.②⑤④③①【知识点:散点图,回归直线】解:D4. 下列结论正确的是()①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①②B.①②③C.①②④D.①②③④【知识点:相关关系,函数关系】解:C能力型师生共研5.根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关 【知识点:相关关系】 解:D6.根据如下样本数据得到的回归方程为y ^=b ^x +a ^,则( ) A.a ^>0,b ^>0 B.a ^>0,b ^<0 C.a ^<0,b ^>0 D.a ^<0,b ^<0 【知识点:回归方程】解B :作出散点图如下:观察图象可知,回归直线y ^=b ^x +a ^的斜率b ^<0,当x =0时,y ^=a ^>0.故a ^>0,b ^<0.7.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A.y 与x 具有正的线性相关关系B.回归直线过样本点的中心(x ,y )C.若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 【知识点:回归方程】解B ∵0.85>0,∴y 与x 正相关,∴A 正确;∵回归直线经过样本点的中心(x ,y ),∴B 正确;∵Δy =0.85(x +1)-85.71-(0.85x -85.71)=0.85,∴C 正确.故选D.8.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入i x (单位:千元)与月储蓄i y (单位:千元)的数据资料,算得10180i i x ==∑,10120i i y ==∑,101184i i i x y ==∑,1021720i i x ==∑.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y bx a =+; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y bx a =+中,1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-,其中x ,y 为样本平均值,线性回归方程也可写为y bx a =+. 【知识点:回归方程】 解析:(1)由题知21,81,1011=====∑∑==n i n i i i y n y x n x n ,80640720212=-=-∑=x n x ni i ,241601841=-=-∑=y x n y x ni i .因此4.083.02ˆ,3.0ˆ-=⨯-=-==x b y a b,故所求的回归方程为4.03.0-=x y (2)由0>b ,故x 与y 是正相关的.(3)代入回归方程中可以预测该项家庭的月储蓄为7.14.073.0=-⨯=y . 探究型 多维突破9.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y (i =1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中i w =,w =81ii w=∑(Ⅰ)根据散点图判断,y=a +bx 与y =c +d y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由) (Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程; (Ⅲ)已知这种产品的年利率z 与x 、y 的关系为z =0.2y -x.根据(Ⅱ)的结果回答下列问题:(ⅰ)年宣传费x =49时,年销售量及年利润的预报值是多少? (ⅱ)年宣传费x 为何值时,年利率的预报值最大? 【知识点:回归方程】解析:(1)由散点图可以判断x d c y +=适合作为年销售y 关于年宜传费用x 的回归方程类型(2)先建立y 关于w 的线性回归方程,由于68168.108)())((ˆ81281==---=∑∑==i ii i iw wy y w wd6.1008.668563ˆˆ=⨯-=-=∴d c,所以y 关于w 的线性回归方程为w y686.100ˆ+=,即y 关于x 的线性回归方程为x y 686.100ˆ+=. (3)由(1)和(2)知,当49=x 时,年销售量y 的预报值为6.57649686.100ˆ=+=y, 32.66492.06.576ˆ=-⨯=z,年利润z 的预报值为 12.206.13)686.100(2.0ˆ++-=-+=x x x x z, 所以当8.626.13==x ,即24.46=x 时,zˆ取得最大值. 自助餐1.已知变量x ,y 呈线性相关关系,线性回归方程为y =0.5+2x ,则变量x ,y 是( )A .线性正相关关系B .由回归方程无法判断其正负相关C .线性负相关关系D .不存在线性相关关系 【知识点: 相关关系】 解:A2.已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测的数据算得的线性回归方程可能是( ).0.4 2.3A y x =+ .2 2.4B y x =- .29.5C y x =-+ .0.3 4.4C y x =-+ 【知识点: 回归直线】 解:A3.已知变量x 和y 满足关系y ^=-0.1x +1,变量y 与z 正相关.下列结论中正确的是( )A.x 与y 正相关,x 与z 负相关B.x 与y 正相关,x 与z 正相关C.x 与y 负相关,x 与z 负相关D.x 与y 负相关,x 与z 正相关 【知识点:相关关系】 解 C.4.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程ˆˆˆybx a =+ ,其中ˆˆˆ0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元【知识点: 回归直线】 解B :由已知得8.28.610.011.311.9105x ++++==(万元),6.27.58.08.59.885y ++++==(万元),故80.76100.4a =-⨯=,所以回归直线方程为ˆ0.760.4y x =+,当社区一户收入为15万元家庭年支出为ˆ0.76150.411.8y=⨯+=(万元). 5.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12 D .1【知识点:散点图,回归直线】 解 D6.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得线性回归方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648;③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A.①② B.②③ C.③④ D.①④ 【知识点:正相关、负相关概念】解D :由回归方程y ^=b ^x +a ^知当b ^>0时,y 与x 正相关,当b ^<0时,y 与x 负相关,∴①④一定错误.7.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为a x b yˆˆˆ+=.若某同学根据上表中前两组数据)0,1(和)2,2(求得的直线方程为y b x a ''=+,则以下结论正确的是( )A.a a b b'>'>ˆ,ˆ B.a a b b '<'>ˆ,ˆ C. ˆˆ,b b a a ''<> D.a a b b '<'<ˆ,ˆ 【知识点:回归直线】 解:C ,画图即可求得8.如图所示,有A ,B ,C ,D ,E,5组数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.【知识点:散点图】 解:D9.工人月工资y (元)与劳动生产率x (千元)的回归方程为y ^=50+80x ,当劳动生产率提高1000元时,月工资平均提高________元. 【知识点:回归直线】解D:回归直线是用来估计总体的,所以我们求的值都是估算值,所以我们得到的结果也是近似的,只要把自变量的值代入回归直线方程即可求得结果为145.83(cm).10.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:(1)(2)求出y 关于x 的线性回归方程y ^=b ^x +a ^,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少小时? 【知识点:回归方程的综合应用】 解 (1)散点图如图.(2)由表中数据得:x =3.5,y =3.5 ∴b ^=0.7,∴a ^=1.05, ∴y ^=0.7x +1.05,回归直线如图所示.(3)将x =10代入线性回归方程,得y ^=0.7×10+1.05=8.05,故预测加工10个零件约需要8.05小时.11.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =bx +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)由于x -=16(x 1+x 2+x 3+x 4+x 5+x 6)=8.5,y -=16(y 1+y 2+y 3+y 4+y 5+y 6)=80.所以a =y --b x -=80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得L =x (-20x +250)-4(-20x +250)=-20x 2+330x -1000=-20⎝ ⎛⎭⎪⎫x -3342+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.12.下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(Ⅰ)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;(Ⅱ)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:719.32i i y ==∑,7140.17i i i t y ==∑0.55=,7≈2.646.参考公式:相关系数()()niit t y y r --=∑ 回归方程y a bt =+ 中斜率和截距的最小二乘估计公式分别为:121()()()nii i nii tt y y b tt ==--=-∑∑,=.a y bt -解:(1)99.0646.2255.089.2,89.2))((,28)(,471271≈⨯⨯≈=--=-=∑∑==r y y t t t t t i i i i i(Ⅱ)103.02889.2)())((ˆ71271≈=---=∑∑==i ii i it ty tb, 92.04103.0331.1ˆˆ≈⨯-≈-=t b y a. 所以,y 关于t 的回归方程为:t y 10.092.0ˆ+=.将2016年对应的9=t 代入回归方程得:82.1910.092.0ˆ=⨯+=y. 所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.考点:线性相关与线性回归方 程的求法与应用. 五、数学视野最小二乘法最早称为回归分析法.由著名的英国生物学家、统计学家道尔顿(F .Gallton )——达尔文的表弟所创,早年,道尔顿致力于化学和遗传学领域的研究.他研究父亲的身高与儿子的身高之间的关系时,建立了回归分析法.在科学研究和实际工作中,常常会遇到这样的问题:给定两个变量x ,y 的n 组试验数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),如何从中找出这两个变量间的函数关系的近似解析表达式(也称为经验公式),使得能对x 与y 之间的除了数据外的对应情况作出判断. 这样的问题一般可以分为两类:一类是对x 与y 之间所存在的对应规律一无所知,这时要从试验数据中找出切合实际的近似解析表达式是相当困难的,俗称这类问题为黑箱问题;另一类是依据对问题所作的分析,通过数学建模或者通过整理归纳试验数据,能够判断出x 与y 之间满足或大体上满足某种类型的函数关系式y=f (x ,a ),其中a=(a 1,a 2,…,a n )是n 个待定的参数,这些参数的值可以通过m 组试验数据来确定(一般要求m>n ),这类问题称为灰箱问题.解决灰箱问题的原则通常是使用拟合函数在x i 处的值与试验数据的偏差平方和最小,即[f (x i ,a )-y i ]2取得最小值.这种在方差意义下对试验数据实现最佳拟合的方法称为“最小二乘法”,a 1,a 2,…,a n 称为最小二乘解,y=f (x ,a )称为拟合函数.现在回归分析法已远非道尔顿的本意,已经成为探索变量之间关系最重要的方法,用以找出变量之间关系的具体表现形式.。
人教A版数学必修三教案:§2.3变量间的相关关系(2)
第2课时(一)导入新课思路1客观事物是相互联系的,过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系.比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说.事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度.所以说,函数关系存在着一种确定性关系,但还存在着另一种非确定性关系——相关关系.为表示这种相关关系,我们接着学习两个变量的线性相关——回归直线及其方程.思路2某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表:气温/℃26 18 13 10 4 -1杯数20 24 34 38 50 64如果某天的气温是-5 ℃,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?为解决这个问题我们接着学习两个变量的线性相关——回归直线及其方程.(二)推进新课、新知探究、提出问题(1)作散点图的步骤和方法?(2)正、负相关的概念?(3)什么是线性相关?(4)看人体的脂肪百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢?(5)什么叫做回归直线?(6)如何求回归直线的方程?什么是最小二乘法?它有什么样的思想?(7)利用计算机如何求回归直线的方程?(8)利用计算器如何求回归直线的方程?活动:学生回顾,再思考或讨论,教师及时提示指导.讨论结果:(1)建立相应的平面直角坐标系,将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)(2)如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关的关系.(4)大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加,呈正相关的趋势,我们可以从散点图上来进一步分析.(5)如下图:从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附近.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线(regression line).如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性.就像平均数可以作为一个变量的数据的代表一样,这条直线可以作为两个变量具有线性相关关系的代表.(6)从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线.那么,我们应当如何具体求出这个回归方程呢?有的同学可能会想,我可以采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置,测量出此时的斜率和截距,就可得到回归方程了.但是,这样做可靠吗?有的同学可能还会想,在图中选择这样的两点画直线,使得直线两侧的点的个数基本相同.同样地,这样做能保证各点与此直线在整体上是最接近的吗?还有的同学会想,在散点图中多取几组点,确定出几条直线的方程,再分别求出各条直线的斜率、截距的平均数,将这两个平均数当成回归方程的斜率和截距.同学们不妨去实践一下,看看这些方法是不是真的可行?(学生讨论:1.选择能反映直线变化的两个点.2.在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.3.多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.)教师:分别分析各方法的可靠性.如下图:上面这些方法虽然有一定的道理,但总让人感到可靠性不强.实际上,求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与此直线的距离最小”.人们经过长期的实践与研究,已经得出了计算回归方程的斜率与截距的一般公式⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====.)1(,)())((2121121x b y a x n x yx n yx x x y y x x b n i i ni ii n i i ni i i其中,b 是回归方程的斜率,a 是截距.推导公式①的计算比较复杂,这里不作推导.但是,我们可以解释一下得出它的原理. 假设我们已经得到两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ), 且所求回归方程是^y =bx+a,其中a 、b 是待定参数.当变量x 取x i (i=1,2,…,n)时可以得到^y =bx i +a(i=1,2,…,n), 它与实际收集到的y i 之间的偏差是y i -^y =y i -(bx i +a)(i=1,2,…,n).这样,用这n 个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的.由于(y i -^y )可正可负,为了避免相互抵消,可以考虑用∑=-ni i iy y1^||来代替,但由于它含有绝对值,运算不太方便,所以改用Q=(y 1-bx 1-a)2+(y 2-bx 2-a)2+…+(y n -bx n -a)2 ② 来刻画n 个点与回归直线在整体上的偏差.这样,问题就归结为:当a,b 取什么值时Q 最小,即总体偏差最小.经过数学上求最小值的运算,a,b 的值由公式①给出.通过求②式的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法(method of least square ). (7)利用计算机求回归直线的方程.根据最小二乘法的思想和公式①,利用计算器或计算机,可以方便地求出回归方程.以Excel 软件为例,用散点图来建立表示人体的脂肪含量与年龄的相关关系的线性回归方程,具体步骤如下:①在Excel 中选定表示人体的脂肪含量与年龄的相关关系的散点图(如下图),在菜单中选定“图表”中的“添加趋势线”选项,弹出“添加趋势线”对话框.②单击“类型”标签,选定“趋势预测/回归分析类型”中的“线性”选项,单击“确定”按钮,得到回归直线.③双击回归直线,弹出“趋势线格式”对话框.单击“选项”标签,选定“显示公式”,最后单击“确定”按钮,得到回归直线的回归方程^y =0.577x-0.448.(8)利用计算器求回归直线的方程.用计算器求这个回归方程的过程如下:所以回归方程为^y =0.577x-0.448.正像本节开头所说的,我们从人体脂肪含量与年龄这两个变量的一组随机样本数据中,找到了它们之间关系的一个规律,这个规律是由回归直线来反映的. 直线回归方程的应用:①描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系.②利用回归方程进行预测;把预报因子(即自变量x )代入回归方程对预报量(即因变量Y )进行估计,即可得到个体Y 值的容许区间.③利用回归方程进行统计控制规定Y 值的变化,通过控制x 的范围来实现统计控制的目标.如已经得到了空气中NO 2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO 2的浓度.(三)应用示例思路1例1 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表: 摄氏温度/℃ -5 0 4 7 12 15 19 23 27 31 36 热饮杯数15615013212813011610489937654(1)画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律; (3)求回归方程;(4)如果某天的气温是2 ℃,预测这天卖出的热饮杯数.解:(1)散点图如下图所示:(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式①求出回归方程的系数. 利用计算器容易求得回归方程^y =-2.352x+147.767.(4)当x=2时,^y =143.063.因此,某天的气温为2 ℃时,这天大约可以卖出143杯热饮.思考气温为2 ℃时,小卖部一定能够卖出143杯左右热饮吗?为什么? 这里的答案是小卖部不一定能够卖出143杯左右热饮,原因如下:1.线性回归方程中的截距和斜率都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果的偏差.2.即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x 的预报值,能够与实际值y 很接近.我们不能保证点(x,y )落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近,事实上,y=bx+a+e=^y +e.这里e 是随机变量,预报值^y 与实际值y 的接近程度由随机变量e 的标准差所决定.一些学生可能会提出问题:既然不一定能够卖出143杯左右热饮,那么为什么我们还以“这天大约可以卖出143杯热饮”作为结论呢?这是因为这个结论出现的可能性最大.具体地说,假如我们规定可以选择连续的3个非负整数作为可能的预测结果,则我们选择142,143和144能够保证预测成功(即实际卖出的杯数是这3个数之一)的概率最大.例2 下表为某地近几年机动车辆数与交通事故数的统计资料. 机动车辆数x /千台 95 110 112 120 129 135 150 180 交通事故数y /千件6.27.57.78.58.79.810.213(1)请判断机动车辆数与交通事故数之间是否有线性相关关系,如果不具有线性相关关系,说明理由; (2)如果具有线性相关关系,求出线性回归方程.解:(1)在直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系. (2)计算相应的数据之和:∑=81i ix=1 031,∑=81i iy=71.6,∑=812i ix=137 835,∑=81i ii yx =9 611.7.将它们代入公式计算得b≈0.077 4,a=-1.024 1, 所以,所求线性回归方程为=0.077 4x-1.024 1.思路2例1 给出施化肥量对水稻产量影响的试验数据: 施化肥量x 15 20 25 30 3540 45 水稻产量y330345365405445450455(1)画出上表的散点图; (2)求出回归直线的方程.解:(1)散点图如下图.(2)表中的数据进行具体计算,列成以下表格:i 1 2 3 4 5 6 7 x i 15 20 25 30 35 40 45 y i 330 345 365 405 445 450 455 x i y i4 9506 9009 12512 15015 57518 00020 47587175,1132725,7000,3.399,3071712712=====∑∑∑===i i i i ii iy x y x y x故可得到 b=230770003.39930787175⨯-⨯⨯-≈4.75, a=399.3-4.75×30≈257.从而得回归直线方程是^y =4.75x+257.例2 一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,测得数据如下: 零件个数x (个) 10 20 30 40 50 60 70 80 90 100 加工时间y (分)626875818995102108115122请判断y 与x 是否具有线性相关关系,如果y 与x 具有线性相关关系,求线性回归方程.解:在直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:∑===1012,7.91,55i ix y x =38 500,∑=1012i iy =87 777,∑=101i i i y x =55 950.b=22101210155********.915510559501010⨯-⨯⨯-=--∑∑==x xyx yx i ii ii≈0.668.a=x b y -=91.7-0.668×55≈54.96.因此,所求线性回归方程为^y =bx+a=0.668x+54.96.例3 已知10条狗的血球体积及红血球数的测量值如下: 血球体积x(mL) 45 42 46 48 4235 58 40 39 50 红血球数y(百万)6.536.309.527.506.995.909.496.206.558.72(1)画出上表的散点图; (2)求出回归直线的方程.解:(1)散点图如下.(2)101=x (45+42+46+48+42+35+58+40+39+50)=44.50, 101=y (6.53+6.30+9.52+7.50+6.99+5.90+9.49+6.20+6.55+8.72)=7.37. 设回归直线方程为^y =bx+a,则b=210121011010x xyx yx i ii ii --∑∑===0.175,a=x b y -=-0.418,所以所求回归直线的方程为^y =0.175x-0.148.点评:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a,b 的计算公式,算出a,b .由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误,求线性回归方程的步骤:计算平均数y x ,;计算x i 与y i 的积,求∑x i y i ;计算∑x i 2;将结果代入公式求b ;用a=x b y 求a ;写出回归直线方程.(四)知能训练1.下列两个变量之间的关系哪个不是函数关系( )A.角度和它的余弦值B.正方形边长和面积C.正n边形的边数和它的内角和D.人的年龄和身高答案:D2.三点(3,10),(7,20),(11,24)的线性回归方程是( ) A.^y =5.75-1.75x B.^y =1.75+5.75x C.^y =1.75-5.75x D.^y =5.75+1.75x答案:D3.已知关于某设备的使用年限x 与所支出的维修费用y (万元),有如下统计资料: 使用年限x 2 3 4 5 6 维修费用y2.23.85.56.57.0设y 对x 呈线性相关关系.试求: (1)线性回归方程^y =bx+a 的回归系数a,b ;(2)估计使用年限为10年时,维修费用是多少?答案:(1)b=1.23,a=0.08;(2)12.38.4.我们考虑两个表示变量x 与y 之间的关系的模型,δ为误差项,模型如下: 模型1:y=6+4x ;模型2:y=6+4x+e .(1)如果x=3,e=1,分别求两个模型中y 的值;(2)分别说明以上两个模型是确定性模型还是随机模型.解:(1)模型1:y=6+4x=6+4×3=18; 模型2:y=6+4x+e=6+4×3+1=19.(2)模型1中相同的x 值一定得到相同的y 值,所以是确定性模型;模型2中相同的x 值,因δ的不同,所得y 值不一定相同,且δ为误差项是随机的,所以模型2是随机性模型.5.以下是收集到的新房屋销售价格y 与房屋大小x 的数据: 房屋大小x (m 2) 80 105 110 115 135 销售价格y (万元)18.42221.624.829.2(1)画出数据的散点图;(2)用最小二乘法估计求线性回归方程.解:(1)散点图如下图.(2)n=5,∑=51i ix=545,x =109,∑=51i iy=116,y =23.2,∑=512i ix=60 952,∑=51i ii yx =12 952,b=2545609525116545129525-⨯⨯-⨯≈0.199,a=23.2-0.199×109≈1.509,所以,线性回归方程为y=0.199x+1.509.(五)拓展提升某调查者从调查中获知某公司近年来科研费用支出(X i )与公司所获得利润(Y i )的统计资料如下表: 科研费用支出(X i )与利润(Y i )统计表 单位:万元年份 科研费用支出利润 1998 1999 2000 2001 2002 2003 5 11 4 5 3 2 31 40 30 34 25 20 合计30180要求估计利润(Y i )对科研费用支出(X i )的线性回归模型.解:设线性回归模型直线方程为:i i X Y 1^0^^ββ+=,因为:630==∑nX x i=5,6180==∑nYY i=30, 根据资料列表计算如下表: 年份 X i Y i X i Y i X i 2 X i -X Y i -Y (X i -X )2 (X i -X )(Y i -Y )19981999 2000 2001 2002 2003 5 11 4 5 3 2 31 40 30 34 25 20 155 440 120 170 75 40 25 121 16 25 9 4 0 6 -1 0 -2 -3 1 10 0 4 -5 -10 0 36 1 0 4 9 0 60 0 0 10 30 合计301801 00020050100现求解参数β0、β1的估计值:方法一:3006009001200540060003020061803010006)(2221^=--=-⨯⨯-⨯=--=∑∑∑∑i i ii i X X n Y Y X n β=2, x Y 1^0^ββ-==30-2×5=20.方法二:501005620030561000)(2221^=⨯-⨯⨯-=--=∑∑x n X Y x n Y X ii i β=2, x Y 1^0^ββ-==30-2×5=20.方法三:50100)())((21^=---=∑∑x X Y Y x X ii iβ=2,x Y 1^0^ββ-==30-2×5=20.所以利润(Y i )对科研费用支出(X i )的线性回归模型直线方程为:i Y ^=20+2X i .(六)课堂小结1.求线性回归方程的步骤: (1)计算平均数y x ,; (2)计算x i 与y i 的积,求∑x i y i ; (3)计算∑x i 2,∑y i 2,(4)将上述有关结果代入公式⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====xb y a x n x yx n yx x x y y x x b n i i ni ii ni i ni i i ,)())((1221121求b,a,写出回归直线方程.2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.(七)作业习题2.3A 组3、4,B 组1、2.。
【优质文档】人教A版数学必修三教案:§2.3变量间的相关关系(1)
2.3 变量间的相关关系2.3.1 变量之间的相关关系2.3.2 两个变量的线性相关一、教材分析变量之间的关系是人们感兴趣的问题.教科书通过思考栏目“物理成绩与数学成绩之间引导学生考察变量之间的关系.在教师的引导下,可使学生认识到在现实世界中存在的关系”,不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性.随后,通过探究人体脂肪百分比和年龄之间的关系,引入描述两个变量之间关系的线性回归方程(模型).教科书在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想.通过气温与饮料销售量的例子及随后的思考,使学生了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能犯的错误.进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性.二、教学目标1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系.2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.3.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.三、重点难点教学重点:通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;利用散点图直观认识两个变量之间的线性关系;根据给出的线性回归方程的系数公式建立线性回归方程.教学难点:变量之间相关关系的理解;作散点图和理解两个变量的正相关和负相关;理解最小二乘法的思想.四、课时安排2课时五、教学设计第1课时(一)导入新课思路 1在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?):请同学们如实填写下表(在空格中打“√” 好中差你的数学成绩你的物理成绩学生讨论:我们可以发现自己的数学成绩和物理成绩存在某种关系.(似乎就是数学好的,物理也好;数学差的,物理也差,但又不全对.)物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法.数学成绩的高低对物理成绩的高低是有一定影响的.但决非唯一因素,还有其他因素,如是否喜欢物理,用在物理学习上的时间等等.(总结:不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少.但这两个变量是有一定关系的,它们之间是一种不确定性的关系.如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义.)为很好地说明上述问题,我们开始学习变量之间的相关关系和两个变量的线性相关.(教师板书课题)思路 2某地区的环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低,于是,他就得出一个结论:天鹅能够带来孩子.你认为这样得到的结论可靠吗?如何证明这个结论的可靠性?(二)推进新课、新知探究、提出问题(1)粮食产量与施肥量有关系吗?“名师出高徒”可以解释为教师的水平越高,学生的水平也越高.教师的水平与学生的水平有什么关系?你能举出更多的描述生活中两个变量的相关关系的成语吗?(2)两个变量间的相关关系是什么?有几种?(3)两个变量间的相关关系的判断.讨论结果:(1)粮食产量与施肥量有关系,一般是在标准范围内,施肥越多,粮食产量越高;教师的水平与学生的水平是相关的,如水滴石穿,三人行必有我师等.我们还可以举出现实生活中存在的许多相关关系的问题.例如:商品销售收入与广告支出经费之间的关系.商品销售收入与广告支出经费有着密切的联系,但商品销售收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关.粮食产量与施肥量之间的关系.在一定范围内,施肥量越大,粮食产量就越高.但是,施肥量并不是决定粮食产量的唯一因素.因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响.人体内的脂肪含量与年龄之间的关系.在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关.应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、但是,不管你的经验多么丰富,如果只凭经学习经验作出相应的判断,因为“经验当中有规律”.验办事,还是很容易出错的.因此,在分析两个变量之间的相关关系时,我们需要一些有说服力的方法.在寻找变量之间相关关系的过程中,统计同样发挥着非常重要的作用.因为上面提到的这种关系,并不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.这就需要通过收集大量的数据(有时通过调查,有时通过实验),在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出判断.(2)相关关系的概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.两个变量之间的关系分两类:①确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;我们就说身高与体重这两个变②带有随机性的变量间的相关关系,例如“身高者,体重也重”,量具有相关关系.相关关系是一种非确定性关系.如商品销售收入与广告支出经费之间的关系.(还与商品质量、居民收入、生活环境等有关)(3)两个变量间的相关关系的判断:①散点图.②根据散点图中变量的对应点的离散程度,可以准确地判断两个变量是否具有相关关系.③正相关、负相关的概念.①教学散点图出示例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:年龄23 27 38 41 45 49 50 脂肪9.5 17.8 21.2 25.9 27.5 26.3 28.2 年龄53 54 56 57 58 60 61 脂肪29.6 30.2 31.4 30.8 33.5 35.2 34.6 分析数据:大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加.我们可以作散点图来进一步分析.②散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,如下图.从散点图我们可以看出,年龄越大,体内脂肪含量越高.图中点的趋势表明两个变量之间确实存在一定的关系,这个图支持了我们从数据表中得出的结论.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系. b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)③正相关与负相关的概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)(三)应用示例思路 1例1 下列关系中,带有随机性相关关系的是_____________.①正方形的边长与面积之间的关系②水稻产量与施肥量之间的关系③人的身高与年龄之间的关系④降雪量与交通事故的发生率之间的关系解析:两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系,因此填②④.答案:②④例 2 有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语.吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?分析:学生思考,然后讨论交流,教师及时评价.解:从已经掌握的知识来看,吸烟会损害身体的健康,但是除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果.我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题.但吸烟引起健康问题的可能性大.因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.点评:在探究研究的过程中,如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么.本题的意义在于引导学生重视对统计结果的解释,从中发现进一步研究的问题.思路 2例1 有时候,一些东西吃起来口味越好,对我们的身体越有害.下表给出了不同类型的某种食品的数据.第二列表示此种食品所含热量的百分比,第三列数据表示由一些美食家以百分制给出的对此种食品口味的评价:品牌所含热量的百分比口味记录A 25 89B 34 89C 20 80D 19 78E 26 75F 20 71G 19 65H 24 62I 19 60J 13 52(1)作出这些数据的散点图.(2)关于两个变量之间的关系,你能得出什么结论?解:(1)散点图如下:(2)基本成正相关关系,即食品所含热量越高,口味越好.例2 案例分析:一般说来,一个人的身高越高,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系.为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学生的身高与右手一拃长的数据如下表.性别身高/cm 右手一拃长/cm 性别身高/cm 右手一拃长/cm 女152 18.5 女153 16.0女156 16.0 女157 20.0女158 17.3 女159 20.0女160 15.0 女160 16.0女160 17.5 女160 17.5女160 19.0 女160 19.0女160 19.0 女160 19.5女161 16.1 女161 18.0女162 18.2 女162 18.5女163 20.0 女163 21.5女164 17.0 女164 18.5女164 19.0 女164 20.0女165 15.0 女165 16.0女165 17.5 女165 19.5女166 19.0 女167 19.0女167 19.0 女168 16.0女168 19.0 女168 19.5女170 21.0 女170 21.0女170 21.0 女171 19.0女171 20.0 女171 21.5女172 18.5 女173 18.0女173 22.0 男162 19.0男164 19.0 男165 21.0男168 18.0 男168 19.0男169 17.0 男169 20.0男170 20.0 男170 21.0男170 21.5 男170 22.0男171 21.5 男171 21.5男171 22.3 男172 21.5男172 23.0 男173 20.0男173 20.0 男173 20.0男173 20.0 男173 21.0男174 22.0 男174 22.0男175 16.0 男175 20.0男175 21.0 男175 21.2男175 22.0 男176 16.0男176 19.0 男176 20.0男176 22.0 男176 22.0男177 21.0 男178 21.0男178 21.0 男178 22.5男178 24.0 男179 21.5男179 21.5 男179 23.0男180 22.5 男181 21.1男181 21.5 男181 23.0男182 18.5 男182 21.5男182 24.0 男183 21.2男185 25.0 男186 22.0男191 21.0 男191 23.0 (1)根据上表中的数据,制成散点图.你能从散点图中发现身高与右手一拃长之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系.(3)如果一个学生的身高是188 cm,你能估计他的一拃大概有多长吗?解:根据上表中的数据,制成的散点图如下.从散点图上可以发现,身高与右手一拃长之间的总体趋势是成一直线,也就是说,它们之间是线性相关的.那么,怎样确定这条直线呢?同学1:选择能反映直线变化的两个点,例如(153,16),(191,23)两点确定一条直线.同学2:在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.同学3:多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.同学4:从左端点开始,取两条直线,如下图.再取这两条直线的“中间位置”作一条直线.同学5:先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧的点数尽可能一样多.同学6:先将所有的点分成两部分,一部分是身高在170 cm以下的,一部分是身高在170 cm 以上的;然后,每部分的点求一个“平均点”——身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即(164,19),(177,21);最后,将这两点连接成一条直线.同学7:先将所有的点按从小到大的顺序进行排列,尽可能地平均分成三等份;每部分的点按照同学3的方法求一个“平均点”,最小的点为(161.3,18.2),中间的点为(170.5,20.1),最大的点为(179.2,21.3).求出这三个点的“平均点”为(170.3,19.9).我再用直尺连接最大点与最小点,然后平行地推,画出过点(170.3,19.9)的直线.同学8:取一条直线,使得在它附近的点比较多.在这里需要强调的是,身高和右手一拃长之间没有函数关系.我们得到的直线方程,只是对其变化趋势的一个近似描述.对一个给定身高的人,人们可以用这个方程来估计这个人的右手一拃长,这是十分有意义的.(四)知能训练一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:零件数x(个)10 20 30 40 50 60 70 80 90 100 加工时间y(min) 62 68 75 81 89 95 102 108 115 122 画出散点图;关于加工零件的个数与加工时间,你能得出什么结论?答案:(1)散点图如下:(2)加工零件的个数与所花费的时间呈正线性相关关系.(五)拓展提升以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积(m2)115 110 80 135 105销售价格(万元)24.8 21.6 18.4 29.2 22 (1)画出数据对应的散点图;(2)指出是正相关还是负相关;(3)关于销售价格y和房屋的面积x,你能得出什么结论?解:(1)数据对应的散点图如下图所示:(2)散点图中的点散分布在从左下角到右上角的区域内,所以是正相关.(3)关于销售价格y和房屋的面积x,房屋的面积越大,价格越高,它们呈正线性相关的关系.(六)课堂小结通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.(七)作业习题2.3A组3、4(1).。
人教A版高中数学必修3第二章统计2.3变量间的相关关系导学案
合作的能力,
.
精品文档
活动 26’ 45’’探—究活动由 6 32’ 56’’学生利用媒
体技术独立 完成,让学 生体验利用 数学知识, 利用电子信 息技术研究 进行科学研 究的过程。
在一次对人体脂肪含量 两名学生利
学生利用 Excel
和年龄关系的研究中, 用媒体技术 软件对数据进行分
研究人员获得了一组样 制作散点图 析,做出散点图以
段。
四、 教学重难点分析及解决措施 重难点:
1、对变量之间的相关关系的理解。 2、变量之间的函数关系与变量相关关系的区别。 3、散点图的制作,回归模型的建立。 解决措施: 传统课堂在讲这一部分的时候过于强调,死记硬背,机械训练,很难提高学生学 习的兴趣。 为了改变这种状况,我使用信息技术,使用 Excel软件对数据进行分析,建立数学 模型,解决现实问题。 本堂课倡导学生主动参与,乐于探究,勤于动手,培养学生搜集,和处理信息的 能力,获取新知识的能力,分析和解决问题的能力,以及交流与合作的能力,
立完成,让 学生体验利 用数学知 识,利用电 子信息技术 研究进行科 学研究的过 程。产生自 己主动进行 科学研究的 愿望。
下表为我国在 1000年到
学生利 Excel软件不仅
2000年间的人口数量 . 用Excel软 可以模拟出直线模
件制作散点 型,还可以模拟出
图,模拟函 指数函数模型,幂
数模型。 函数模型,对数函
因为新技术新 媒体技术的应用, 会使这个目标变得 轻松。
在课堂上不仅要 解决学生解决问题 的能力,更重要的 是要培养学生发现 问题的能了。发现 问题的能力,比解 决问题的能力更重 要。信息技术对学 习发现问题的能力 提升起到了帮助作 用。
研究 44’ 01’’在—具体的应 型作 44’ 33’’用中,巩固
人教版数学必修三第二章2.3.2 两个变量之间的线性相关 经典教学教案
设计意图 联系现实问题,提升学生的求知欲、探索欲,使学生保持良好、积极的情
感体验。
第二阶段:形成思路,实施探究
1/8
知识像烛光,能照亮一个人,也能照亮无数的人。--培根
下面我分以下几步来实施探究: Step1:探究增长方式,引出“线性”回归 Step2:师生合作探究回归直线的确定方法 Step3:用数学的语言来描述回归直线的定义 Step4:探求距离的简化 Step5:解析问题,获得新知 下面首进行第一步:
4/8
知识像烛光,能照亮一个人,也能照亮无数的人。--培根
例 2 我国是一个人口大国,估计人口数量及发展趋势是我们制定经济发展计划等一系 列相关政策的基础,人口数量预测是一个复杂的问题,不仅是人口与时间两个变量之间 的 关系,还与国家经济状况,科技发展,自然灾害和战争等其他因素有关。我们看下面的统计 表 1949 至 1994 年人口数据资料如下
三、教学目标
根据上述简析,考虑到学生已有认知结构和心理特征,结合本节课内容我制定了以下教 学目标:
1、知识与技能目标
(1)知道最小二乘法的思想,了解其公式的推导过程;(2)会用公式求解回归方程。
2、过程与方法目标
(1)通过自主探究体会数形结合、类比、及最小二乘法的数学思想方法。培养学生观
0/8
知识像烛光,能照亮一个人,也能照亮无数的人。--培根
i =1
i =1
i =1
(3)代入公式求 aˆ , bˆ ;
(4)列出直线方程。
这样,使学生能回顾总结梳理所学知识,系统掌握所学知识,使课堂效果得到加强。
第五阶段:练习反馈
高考题是高考要求的具体体现,让学生以它们为范例,对于强化“高考意识”十分必要。 因此设计了以下练习题:
2017-2018学年高中数学人教A版必修3教学案:第二章 2.3 变量间的相关关系
变量间的相关关系(1)函数关系与相关关系的区别与联系是什么?(2)如何判断两个变量之间是否具备相关关系?(3)什么是正相关、负相关?与散点图有什么关系?[新知初探]1.相关关系如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的随机性,那么这两个变量之间的关系叫做相关关系.2.散点图将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关.3.正相关和负相关(1)正相关:散点图中的点散布在从左下角到右上角的区域.(2)负相关:散点图中的点散布在从左上角到右下角的区域.[点睛]对正相关和负相关的理解(1)正相关随自变量的变大(或变小),因变量也随之变大(或变小),这种带有随机性的相关关系,我们称为正相关.例如,人年龄由小变大时,体内脂肪含量也由少变多.(2)负相关随自变量的变大(或变小),因变量却随之变小(或变大),这种带有随机性的相关关系,我们称为负相关.例如,汽车越重,每消耗1 L 汽油所行驶的平均路程就越短.4.回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程:回归直线的方程,简称回归方程. (3)回归方程的推导过程:①假设已经得到两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ).②设所求回归方程为y ^=b ^x +a ^,其中a ^,b ^是待定参数. ③由最小二乘法得⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n (x i-x )2=∑i =1nx i y i-n x y ∑i =1n x 2i-n x 2a ^=y -b ^x其中:b ^是回归方程的斜率,a ^是截距.[小试身手]1.下列命题正确的是( ) ①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.A .①③④B .②③④C .③④⑤D .②④⑤解析:选C ①显然不对,②是函数关系,③④⑤正确.2.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图图2.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:选C 由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关. 3.若施肥量x (kg)与水稻产量y (kg)的线性回归方程为y ^=5x +250,当施肥量为80 kg 时,预计水稻产量约为________kg.解析:把x =80代入回归方程可得其预测值y ^=5×80+250=650(kg). 答案:6504.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.x 2 4 5 6 8 y3040605070若已求得它们回归直线的方程为______________________.解析:由题意可知x =2+4+5+6+85=5,y =30+40+60+50+705=50.即样本中心为(5,50).设回归直线方程为y ^=6.5x +a ^, ∵回归直线过样本中心(x ,y ), ∴50=6.5×5+a ^,即a ^=17.5, ∴回归直线方程为y ^=6.5x +17.5 答案:y ^=6.5x +17.5相关关系的判断①正方形的边长与面积之间的关系;②农作物的产量与施肥量之间的关系;③出租车费与行驶的里程;④降雪量与交通事故的发生率之间的关系.(2)某个男孩的年龄与身高的统计数据如下表所示.年龄x(岁)12345 6身高y(cm)788798108115120①画出散点图;②判断y与x是否具有线性相关关系.[解析](1)在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③为确定的函数关系;在④中,降雪量与交通事故的发生率之间具有相关关系.答案:②④(2)解:①散点图如图所示.②由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.[活学活用]如图所示的两个变量不具有相关关系的是________(填序号).解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x ,y 不具有相关关系.答案:①④[典例] (1)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5D.y ^=-0.3x +4.4(2)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的运转的速度的变化而变化,下表为抽样试验的结果:转速x (转/秒)16 14 12 8 每小时生产有缺点的零件数y (件)11985②如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系; ③在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内?[解析] (1)依题意知,相应的回归直线的斜率应为正,排除C 、D.且直线必过点(3,3.5),代入A 、B 得A 正确.答案:A(2)解:①散点图如图所示:②近似直线如图所示:③由y ≤10得5170x -67≤10,解得x ≤14.9,所以机器的运转速度应控制在14转/秒内.求回归直线方程的步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)计算x ,y,∑i =1nx 2i ,∑i =1nx i y i . (5)代入公式计算b ^,a ^,公式为⎩⎪⎨⎪⎧b ^=∑i =1n x i y i -n x y∑i =1n x 2i-n x2,a ^=y -b ^x .(6)写出回归直线方程y ^=b ^x +a ^. [活学活用]已知变量x ,y 有如下对应数据:x 1 2 3 4 y1345(1)作出散点图;(2)用最小二乘法求关于x ,y 的回归直线方程. 解:(1)散点图如图所示.(2)x =1+2+3+44=52,y =1+3+4+54=134, ∑i =14x i y i =1+6+12+20=39.∑i =14x 2i =1+4+9+16=30,b ^=39-4×52×13430-4×⎝⎛⎭⎫522=1310,a ^=134-1310×52=0,所以y ^=1310x 为所求的回归直线方程.利用线性回归方程对总体进行估计[典例] 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:x 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y 关于x 的回归直线方程y ^=b ^x +a ^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?[解] (1)散点图如图:(2)x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5,∑i =14x i y i =3×2.5+4×3+5×4+6×4.5=66.5,∑i =14x 2i =32+42+52+62=86, 所以b ^=∑i =14x i y i -4x y ∑i =14x 2i -4x2=66.5-4×4.5×3.586-4×4.52=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35. 所以所求的线性回归方程为y ^=0.7x +0.35.(3)当x =100时,y ^=0.7×100+0.35=70.35(吨标准煤),90-70.35=19.65(吨标准煤).即生产100吨甲产品的生产能耗比技改前降低了19.65吨标准煤.只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.[活学活用](重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(1)求y 关于t 的回归方程y ^=b ^t +a ^;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 解:(1)列表计算如下:i t i y i t 2i t i y i 1 2 3 4 51 2 3 4 55 6 7 8 101 4 9 16 255 12 21 32 50这里n =5,t -=1n ∑i =1n t i =155=3,y -=1n ∑i =1ny i =365=7.2.∑i =1nt 2i -n t -2=55-5×32=10,∑i =1nt i y i -n t -y -=120-5×3×7.2=12,从而b ^=1210=1.2,a ^=y --b ^t -=7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).[层级一 学业水平达标]1.下列变量具有相关关系的是( ) A .人的体重与视力B .圆心角的大小与所对的圆弧长C .收入水平与购买能力D .人的年龄与体重解析:选C B 为确定性关系;A ,D 不具有相关关系,故选C. 2.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为A.y ^=1.5x +2 B.y ^=-1.5x +2 C.y ^=1.5x -2 D.y ^=-1.5x -2解析:选B 设回归方程为y ^=b ^x +a ^,由散点图可知变量x ,y 之间负相关,回归直线在y 轴上的截距为正数,所以b ^<0,a ^>0,因此方程可能为y ^=-1.5x +2.3.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是( )A .直线l 过点(x ,y )B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同解析:选A A 是正确的;回归直线可以不经过散点图中的任何点,故B 错误;回归直线的斜率不确定,故C 错误;分布在l 两侧的样本点的个数不一定相同,故D 错误.4.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^( ) A .不能小于0 B .不能大于0 C .不能等于0D .只能小于0解析:选C 当b ^=0时,r =0,这时不具有线性相关关系,但b ^能大于0,也能小于0. 5.2016年元旦前夕,某市统计局统计了该市2015年10户家庭的年收入和年饮食支出的统计资料如下表:(2)若某家庭年收入为9万元,预测其年饮食支出. (参考数据:∑i =110x i y i =117.7,∑i =110x 2i =406)解:依题意可计算得:x =6,y =1.83,x 2=36,x y =10.98, 又∵∑i =110x i y i =117.7,∑i =110x 2i =406,∴b ^=∑i =110x i y i -10x y∑i =110x 2i -10x2≈0.17,a ^=y -b ^x =0.81,∴y ^=0.17x +0.81. ∴所求的回归方程为y ^=0.17x +0.81.(2)当x =9时,y ^=0.17×9+0.81=2.34(万元).可估计年收入为9万元的家庭每年饮食支出约为2.34万元.[层级二 应试能力达标]1.一个口袋中有大小不等的红、黄、蓝三种颜色的小球若干个(大于5个),从中取5次,那么取出红球的次数和口袋中红球的数量是( )A .确定性关系B .相关关系C .函数关系D .无任何关系解析:选B 每次从袋中取球取出的球是不是红球,除了和红球的个数有关外,还与球的大小等有关系,所以取出红球的次数和口袋中红球的数量是一种相关关系.2.农民工月工资y (元)依劳动生产率x (千元)变化的回归直线方程为y ^=50+80x ,下列判断正确的是( )A .劳动生产率为1 000元时,工资为130元B .劳动生产率提高1 000元时,工资水平提高80元C .劳动生产率提高1 000元时,工资水平提高130元D .当月工资为210元时,劳动生产率为2 000元解析:选B 由回归直线方程y ^=50+80x 知,x 每增加1,y 增加80,但要注意x 的单位是千元,y 的单位是元.3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下:父亲身高x (cm) 174 176 176 176 178 儿子身高y (cm)175175176177177则y 对x 的线性回归方程为( ) A .y =x -1 B .y =x +1 C .y =88+12xD .y =176解析:选C 计算得,x =174+176+176+176+1785=176,y =175+175+176+177+1775=176,根据回归直线经过样本中心(x ,y )检验知,C 符合.4.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y ^=b ^x +a ^,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.y ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′D.y ^<b ′,a ^<a ′解析:选C 由(1,0),(2,2)求b ′,a ′. b ′=2-02-1=2,a ′=0-2×1=-2.求b ^,a ^时,∑i =16x i y i =0+4+3+12+15+24=58,x =3.5,y =136, ∑i =16x 2i =1+4+9+16+25+36=91,∴b ^=58-6×3.5×13691-6×3.52=57, a ^=136-57×3.5=136-52=-13,∴b ^<b ′,a ^>a ′.5.正常情况下,年龄在18岁到38岁的人,体重y (kg)对身高x (cm)的回归方程为y ^=0.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右.解析:用回归方程对身高为178 cm 的人的体重进行预测,当x =178时,y ^=0.72×178-58.2=69.96(kg).答案:69.966.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中数据,求得线性回归方程为y =-4x +a ,则a =________. 解析:x =4+5+6+7+8+96=132,y =92+82+80+80+78+686=80,由回归方程过样本中心点(x ,y ) 得80=-4×132+a ^.即a ^=80+4×132=106.答案:1067.对某台机器购置后的运行年限x (x =1,2,3,…)与当年利润y 的统计分析知x ,y 具备线性相关关系,回归方程为y ^=10.47-1.3x ,估计该台机器最为划算的使用年限为________年.解析:当年利润小于或等于零时应该报废该机器,当y =0时,令10.47-1.3x =0,解得x ≈8,故估计该台机器最为划算的使用年限为8年.答案:88.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的人数5~32人,船员人数y 关于吨位x 的回归方程为y ^=9.5+0.006 2x ,(1)若两艘船的吨位相差1 000,求船员平均相差的人数; (2)估计吨位最大的船和最小的船的船员人数. 解:(1)设两艘船的吨位分别为x 1,x 2,则 y ^1-y ^2=9.5+0.006 2x 1-(9.5+0.006 2x 2) =0.006 2×1 000≈6, 即船员平均相差6人.(2)当x =192时,y ^=9.5+0.006 2×192≈11, 当x =3 246时,y ^=9.5+0.006 2×3 246≈30.即估计吨位最大和最小的船的船员数分别为30人和11人.9.某个体服装店经营某种服装在某周内所获纯利y (元)与该周每天销售这种服装的件数x (件)之间有一组数据如下表:(1)求x ,y ;(2)若纯利y 与每天销售这种服装的件数x 之间是线性相关的,求回归直线方程; (3)若该店每周至少要获纯利200元,请你预测该店每天至少要销售这种服装多少件? (提示:∑i =17x 2i =280,∑i =17y 2i =45 309,∑i =17x i y i =3 487)解:(1)x =3+4+5+6+7+8+97=6,y =66+69+73+81+89+90+917≈79.86.(2)∵b ^=3 487-7×6×79.86280-7×62≈4.75,a ^=79.86-4.75×6=51.36,∴纯利与每天销售件数x 之间的回归直线方程为y ^=51.36+4.75x . (3)当y ^=200时,200=4.75x +51.36,所以x ≈31.29.因此若该店每周至少要获纯利200元,则该店每天至少要销售这种服装32件.(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列三个抽样:①一个城市有210家某商品的代理商,其中大型代理商有20家,中型代理商有40家,小型代理商有150家,为了掌握该商品的销售情况,要从中抽取一个容量为21的样本;②在某公司的50名工人中,依次抽取工号为5,10,15,20,25,30,35,40,45,50的10名工人进行健康检查;③某市质量检查人员从一食品生产企业生产的两箱(每箱12盒)牛奶中抽取4盒进行质量检查.则应采用的抽样方法依次为( )A .简单随机抽样;分层抽样;系统抽样B .分层抽样;简单随机抽样;系统抽样C .分层抽样;系统抽样;简单随机抽样D .系统抽样;分层抽样;简单随机抽样解析:选C ①中商店的规模不同,所以应利用分层抽样;②中抽取的学号具有等距性,所以应是系统抽样;③中总体没有差异性,容量较小,样本容量也较小,所以应采用简单随机抽样.故选C.2.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是( )A .09,14,19,24B .16,28,40,52C .10,16,22,28D .08,12,16,20解析:选B 分成5组,每组12名学生,按等间距12抽取.选项B 正确.3.某学校有教师200人,男学生1 200人,女学生1 000人.现用分层抽样的方法从全体师生中抽取一个容量为n 的样本,若女学生一共抽取了80人,则n 的值为( )A .193B .192C .191D .190解析:选B 1 000×n200+1 200+1 000=80,求得n =192.4.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )A.y ^=-10x +200 B.y ^=10x +200 C.y ^=-10x -200D.y ^=10x -200解析:选A 由于销售量y 与销售价格x 成负相关,故排除B ,D.又因为销售价格x >0,则C 中销售量全小于0,不符合题意,故选A.5.设有两组数据x 1,x 2,…,x n 与y 1,y 2,…,y n ,它们的平均数分别是x 和y ,则新的一组数据2x 1-3y 1+1,2x 2-3y 2+1,…,2x n -3y n +1的平均数是( )A .2x -3yB .2x -3y +1C .4x -9yD .4x -9y +1解析:选B 设z i =2x i -3y i +1(i =1,2,…,n ),则z =1n (z 1+z 2+…+z n )=2n (x 1+x 2+…+x n )-3n (y 1+y 2+…+y n )+⎝⎛⎭⎫1+1+…+1n =2x -3y +1.6.有一个容量为66的样本,数据的分组及各组的频数如下: [11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12 [35.5,39.5) 7 [39.5,43.5) 3则总体中大于或等于31.5的数据所占比例约为( ) A.211 B.13 C.12D.23解析:选B 由题意知,样本的容量为66,而落在[31.5,43.5)内的样本个数为12+7+3=22,故总体中大于或等于31.5的数据约占2266=13.7.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各有1人,则该小组数学成绩的平均数、众数、中位数分别是( )A .85,85,85B .87,85,86C .87,85,85D .87,85,90解析:选C ∵得85分的人数最多为4人, ∴众数为85,中位数为85,平均数为110(100+95+90×2+85×4+80+75)=87.8.某出租汽车公司为了了解本公司司机的交通违章情况,随机调查了50名司机,得到了他们某月交通违章次数的数据,结果制成了如图所示的统计图,根据此统计图可得这50名出租车司机该月平均违章的次数为( )A .1B .1.8C .2.4D .3解析:选B5×0+20×1+10×2+10×3+5×450=1.8.9.下表是某厂1~4月份用水量情况(单位:百吨)的一组数据月份x 1 2 3 4 用水量y4.5432.5用水量y 与月份x 之间具有线性相关关系,其线性回归方程为y ^=-0.7x +a ,则a 的值为( )A .5.25B .5C .2.5D .3.5解析:选A 线性回归方程经过样本的中心点,根据数据可得样本中心点为(2.5,3.5),所以a =5.25.10.如图是在元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,1.2D .85,4解析:选C 去掉一个最高分95,去掉一个最低分77,平均数为80+15(5+3+6+5+6)=85,方差为15[(85-85)2+(85-83)2+(85-86)2+(85-85)2+(85-86)2]=1.2,因此选C.11.如果数据x 1,x 2,x 3,…,x n 的平均数是x ,方差是s 2,则3x 1+2,3x 2+2,…,3x n +2的平均数和方差分别是( )A.x 和s 2 B .3x 和9s 2 C .3x +2和9s 2D .3x +2和12s 2+4解析:选C 3x 1+2,3x 2+2,…,3x n +2的平均数是3x +2,由于数据x 1,x 2,…x n的方差为s2,所以3x1+2,3x2+2,…,3x n+2的方差为9s2.12.如图是某赛季甲、乙两名篮球运动员5场比赛得分的茎叶图,已知甲的成绩的极差为31,乙的成绩的平均值为24,则下列结论错误的是()A.x=9B.y=8C.乙的成绩的中位数为26D.乙的成绩的方差小于甲的成绩的方差解析:选B因为甲的成绩的极差为31,所以其最高成绩为39,所以x=9;因为乙的成绩的平均值为24,所以y=24×5-(12+25+26+31)-20=6;由茎叶图知乙的成绩的中位数为26;对比甲、乙的成绩分布发现,乙的成绩比较集中,故其方差较小.二、填空题(本大题共4小题,每小题5分,共20分)13.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为________.解析:由平均数为10,得(x+y+10+11+9)×15=10,则x+y=20;又方差为2,∴[(x-10)2+(y-10)2+(10-10)2+(11-10)2+(9-10)2]×15=2,得x2+y2=208,2xy=192,∴|x-y|=(x-y)2=x2+y2-2xy=4.答案:414.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.解析:抽取的男运动员的人数为2148+36×48=12.答案:1215.要考察某种品牌的500颗种子的发芽率,抽取60粒进行实验,利用随机数表抽取种子时,先将500颗种子按001,002,…,500进行编号,如果从随机数表第7行第8列的数3开始向右读,请你依次写出最先检测的5颗种子的编号:________,________,________,________,________.(下面摘取了随机数表第7行至第9行)84 42 17 53 3157 24 55 06 8877 04 74 47 6721 76 33 50 2583 92 12 06 7663 01 63 78 5916 95 55 67 1998 10 50 71 7512 86 73 58 0744 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 解析:选出的三位数分别为331,572,455,068,877,047,447,…,其中572,877均大于500,将其去掉,剩下的前5个编号为331,455,068,047,447.答案:331 455 068 047 44716.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如下图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为________.解析:∵0.005×10+0.035×10+a ×10+0.020×10+0.010×10=1, ∴a =0.030.设身高在[120,130),[130,140),[140,150]三组的学生分别有x ,y ,z 人, 则x100=0.030×10,解得x =30.同理,y =20,z =10. 故从[140,150]的学生中选取的人数为1030+20+10×18=3.答案:0.030 3三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤) 17.(本小题满分10分)为调查某班学生的平均身高,从50名学生中抽取110,应如何抽样?若知道男生、女生的身高显著不同(男生30人,女生20人),应如何抽样?解:从50名学生中抽取110,即抽取5人,采用简单随机抽样法(抽签法或随机数法).若知道男生、女生的身高显著不同,则采用分层抽样法,按照男生与女生的人数比为30∶20=3∶2进行抽样,则男生抽取3人,女生抽取2人.18.(本小题满分12分)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示.(1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?解:(1)样本均值为17+19+20+21+25+306=1326=22.(2)由(1)知样本中优秀工人所占比例为26=13,故推断该车间12名工人中有12×13=4名优秀工人.19.(本小题满分12分)2016年春节前,有超过20万名广西、四川等省籍的外出务工人员选择驾乘摩托车沿321国道长途跋涉返乡过年,为防止摩托车驾驶人员因长途疲劳驾驶,手脚僵硬影响驾驶操作而引发交通事故,肇庆市公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让返乡过年的摩托车驾乘人员有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的有5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员广西籍的有5+20+25+20+30=100(人); 四川籍的有15+10+5+5+5=40(人).设四川籍的驾驶人员应抽取x 人,依题意得5100=x 40,解得x =2,即四川籍的应抽取2人.20.(本小题满分12分)某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量(单位:kg),分别记录抽查数据如下:甲:102,101,99,98,103,98,99; 乙:110,115,90,85,75,115,110. (1)这种抽样方法是哪一种方法?(2)试计算甲、乙车间产品重量的平均数与方差,并说明哪个车间产品较稳定? 解:(1)甲、乙两组数据间隔相同,所以采用的方法是系统抽样. (2)x 甲=17(102+101+99+98+103+98+99)=100,x 乙=17(110+115+90+85+75+115+110)=100,s 2甲=17(4+1+1+4+9+4+1)≈3.43,s 2乙=17(100+225+100+225+625+225+100)=228.57, ∴s 2甲<s 2乙,故甲车间产品比较稳定.21.(本小题满分12分)对某校高一年级学生参加社区服务次数进行统计,随机抽取M 名学生作为样本,得到这M 名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:(1)求出表中M ,p 及图中a 的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)的人数.解:(1)由分组[10,15)的频数是10, 频率是0.25知, 10M =0.25,所以M =40. 因为频数之和为40,所以10+25+m +2=40,解得m =3. 故p =340=0.075.因为a 是对应分组[15,20)的频率与组距的商, 所以a =2540×5=0.125.(2)因为该校高一学生有360人,分组[10,15)的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为360×0.25=90.22.(本小题满分12分)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.解:(1)由题意知n =10,x =1n ∑i =1n x i =8010=8, y =1n ∑i =1n y i =2010=2, 又∑i =110x 2i -10x 2=720-10×82=80,∑i =110x i y i -10x y =184-10×8×2=24,由此得b ^=∑i =110x i y i -10x y∑i =110x 2i -10x 2=2480=0.3, a ^=y -b ^x =2-0.3×8=-0.4,故所求回归方程为y ^=0.3x -0.4.(2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关.(3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7千元.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
变量间的相关关系
(1)函数关系与相关关系的区别与联系是什么?
(2)如何判断两个变量之间是否具备相关关系?
(3)什么是正相关、负相关?与散点图有什么关系?
[新知初探]
1.相关关系
如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的随机性,那么这两个变量之间的关系叫做相关关系.
2.散点图
将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关.
3.正相关和负相关
(1)正相关:散点图中的点散布在从左下角到右上角的区域.
(2)负相关:散点图中的点散布在从左上角到右下角的区域.
[点睛]对正相关和负相关的理解
(1)正相关
随自变量的变大(或变小),因变量也随之变大(或变小),这种带有随机性的相关关系,我们称为正相关.例如,人年龄由小变大时,体内脂肪含量也由少变多.
(2)负相关
随自变量的变大(或变小),因变量却随之变小(或变大),这种带有随机性的相关关系,我们称为负相关.例如,汽车越重,每消耗1 L 汽油所行驶的平均路程就越短.
4.回归直线方程
(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
(2)回归方程:回归直线的方程,简称回归方程.
(3)回归方程的推导过程:
①假设已经得到两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ).
②设所求回归方程为y ^=b ^x +a ^,其中a ^,b ^是待定参数.
③由最小二乘法得
⎩⎪⎨⎪⎧ b ^=∑i =1n (x i -x )(y i -y )∑i =1n (x i -x )2=∑i =1n x i y i -n x y ∑i =1n x 2i -n x 2a ^=y -b ^x
其中:b ^是回归方程的斜率,a ^是截距.
[小试身手]
1.下列命题正确的是( )
①任何两个变量都具有相关关系;
②圆的周长与该圆的半径具有相关关系;
③某商品的需求量与该商品的价格是一种非确定性关系;
④根据散点图求得的回归直线方程可能是没有意义的;
⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.
A .①③④
B .②③④
C .③④⑤
D .②④⑤
解析:选C ①显然不对,②是函数关系,③④⑤正确.
2.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图图2.由这两个散点图可以判断( )。