江西省吉安市井冈山大学附中高中数学选修2-3《可线性化的回归分析》导学案
可线性化的回归分析
【学习目标】
1.进一步体会回归分析的基本思想.
2.通过非线性回归分析,判断几种不同模型的拟合程度. 【教学重点】非线性回归分析的常用模型 【教学难点】非线性回归分析的常用模型 【学习方法】合作探究法,学案导学法
②处理方法:两边取对数得ln y =ln e bx +a
再根据线性回归模型的方法求出b ,a .
探究点一 非线性回归模型
问题1 有些变量间的关系并不是线性相关,怎样确定回归模型?问题2 如果两个变量呈现非线性相关关系,怎样求出回归方程?在一次抽样调查中测得样本的5个样本点,数值如下表:
试建立y 与x 之间的回归方程.
x 0.25 0.5 y 16 12
A.1 B
3.变量x与y
A.x与y之间的函数关系
C.x与y之间的真实关系形式。
高中数学 第三章 第三课时 可线性化的回归分析教案 北师大版选修2-3
江西省九江市实验中学高中数学 第三章 第三课时 可线性化的回归分析教案 北师大版选修2-3一、教学目标:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用。
二、教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。
三、教学方法:讨论交流,探析归纳四、教学过程:(一)、复习引入:1、给出例题:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间的回归方程. /y 个 (学生描述步骤,教师演示)2、讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系.(二)、新课探究:1. 探究非线性回归方程的确定:① 如果散点图中的点分布在一个直线状带形区域,可以选线性回归模型来建模;如果散点图中的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模.② 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y =2C 1e x C 的周围(其中12,c c 是待定的参数),故可用指数函数模型来拟合这两个变量.③ 在上式两边取对数,得21ln ln y c x c =+,再令ln z y =,则21ln z c x c =+,而z 与x 间的关系如下:方程来拟合.④ 利用计算器算得 3.843,0.272a b =-=,z 与x 间的线性回归方程为0.272 3.843z x =-,因此红铃虫的产卵数对温度的非线性回归方程为0.272 3.843x y e -=.⑤ 利用回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行.其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题.2. 小结:(1)、用回归方程探究非线性回归问题的方法、步骤.(2)、化归思想(转化思想)在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式.(1)b y a x =+,令'y y =,1'x x =,则有''y a bx =+. (2)b y ax =,令'ln y y =,'ln x x =,'ln a a =,则有'''y a bx =+.(3)bx y ae =,令'ln y y =,'x x =,'ln a a =,则有'''y a bx =+.(4)bx y ae =,令'ln y y =,1'x x=,'ln a a =,则有'''y a bx =+. (5)ln y a b x =+,令'y y =,'ln x x =,则有''y a bx =+.(三)、巩固练习:为了研究某种细菌随时间x 变化,繁殖的个数,收集数据如下:(2)试求出预报变量对解释变量的回归方程。
最新人教版高中数学选修2-3《回归分析的基本思想及其初步应用》示范教案(第2课时)
第二课时教学目标知识与技能从相关指数和残差分析角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤.过程与方法在发现直接求回归直线方程存在缺陷的基础上,引导学生去发现解决问题的新思路——进行回归分析,进而介绍残差分析的方法和利用R2来表示解释变量对于预报变量变化的贡献率.情感、态度与价值观通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,掌握处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识解决实际问题的能力.教学中适当地利用学生的合作与交流,使学生在学习的同时,体会与他人合作的重要性.重点难点教学重点:从残差分析、相关指数角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤;教学难点:了解评价回归效果的两个统计量:相关指数、残差和残差平方和.教学过程引入新课上表是上一节课我们从某大学选取8名女大学生其身高和体重数据组成的数据表,在上一节课中我们通过数据建立了回归直线方程,并根据方程预测了身高为172 cm的女大学生的体重.当时,我们提到根据回归直线方程求得的体重数据,仅是一个估计值,其与真实值之间存在着误差,为了综合分析身高和体重的关系,我们引入了线性回归模型y=bx+a+e 来表示两变量之间的关系,其中e为随机变量,又称随机误差.线性回归模型y=bx+a+e 增加了随机误差项e,因变量y的值由自变量x和随机误差e共同确定.假设随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图中所有的点将完全落在回归直线上.但是,在图中,数据点并没有完全落在回归直线上.这些点散布在回归直线附近,所以一定是随机误差把这些点从回归直线上“推”开了,即自变量x只能解释部分y的变化.同学们考虑一下,随机变量e的均值是多少?方差又是多少?活动设计:学生思考回答问题.学情预测:学生回答E(e)=0,D(e)=σ2>0.教师提问:能否通过D(e)来刻画线性回归模型的拟合程度?学情预测:随机误差e的方差越小,通过回归直线预报真实值y的精度越高.随机误差是引起预报值与真实值y之间的误差的原因之一,其大小取决于随机误差的方差.设计意图:说明研究随机误差e的必要性,通过研究随机误差e可以分析预报值的可信度.提出问题:既然可以用随机变量e的方差来衡量随机误差的大小,即通过方差σ2来刻画预报变量(体重)的变化在多大程度上与随机误差有关,那么如何获得方差σ2呢?学生活动:学生独立思考,小组合作交流讨论.活动结果:可以采用抽样统计的思想,通过随机变量e的样本来估计σ2的大小.设计目的:复习抽样统计思想,以便通过随机变量e 的样本来估计总体. 探究新知提出问题:既然e 表示了除解释变量以外其他各种影响预报值的因素带来的误差,那么如何获得e 的样本来计算σ2呢?学生活动:分组合作讨论交流.学情预测:由函数模型y ^=b ^x +a ^和回归模型y =bx +a +e 可知e =y -y ^,这样根据图表中女大学生的身高求出预报值,再与真实值作差,即可求得e 的一个估计值.教师:由于在计算回归直线方程时,利用公式求得的b ^和a ^为斜率和截距的估计值,它们与真实值a 和b 之间存在误差,因此y ^是估计值,所以e ^=y -y ^也是一个估计值.由上可知,对于样本点(x 1,y 1),(x 2,y 2),…,(x n ,y n )而言,它们的随机误差为e i =y i -bx i -a ,i =1,2,…n ,称其估计值e ^i =y i -y ^i 为相应于点(x i ,y i )的残差.将所有残差的平方加起来,即∑i =1ne ^2i ,这个和称作残差平方和.类比样本方差估计总体方差的思想,可以用σ^2=1n -2∑i =1n e ^ 2i =1n -2∑i =1n(y i -y ^i )2(n>2) 作为σ2的估计量,通常,σ^2越小,预报精度越高.这样,当我们求得回归直线方程后,可以通过残差来判断模型拟合程度的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析.设计目的:通过问题诱思,引入残差概念. 理解新知提出问题:对照女大学生的身高和体重的原始数据,结合求出的回归直线方程,求出相应的残差数据.学生活动:独立完成.样的散点图称作残差图).学生活动:分组合作,共同完成. 活动结果:残差图提出问题:观察上面的残差图,你认为哪几个样本点在采集时可能存在人为的错误?为什么?学生活动:分组讨论. 活动结果:第一个和第六个样本点在采集过程中可能存在错误,因为其他的样本点基本都集中在一个区域内,只有这两个样本点的残差比较大,相对其他样本点来说,分布得较为分散.提出问题:如何从残差图来判断模型的拟合程度? 学生活动:独立思考也可相互讨论.活动结果:因为σ^2越小,预报精度越高,即模型的拟合程度越高,而σ^2越小,e ^的取值越集中,故若残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适,且带状区域的宽度越窄,说明拟合精度越高,回归直线的预报精度越高.教师:在统计学上,人们经常用相关指数R 2来刻画回归的效果,其计算公式是:R 2=1-∑i =1n(y i -y ^i )2∑i =1n(y i -y )2提出问题:分析上面计算相关指数R 2的公式,如何根据R 2来判断模型的拟合效果? 学生活动:独立思考也可相互讨论,教师加以适当的引导提示.活动结果:因为对于确定的样本数据而言,∑i =1n(y i -y )2是一个定值,故R 2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.提出问题:在线性回归模型中,R 2表示解释变量对于预报变量变化的贡献率,R 2越接近1,表示回归的效果越好,即解释变量和预报变量的线性相关性越强,试计算关于女大学生身高与体重问题中的相关指数R 2.学生活动:学生独立计算获得数据. 活动结果:R 2≈0.64.根据R 2≈0.64就可得出“女大学生的身高解释了64%的体重变化”,或者说“女大学生的体重差异有64%是由身高引起的”.由此就不难理解为什么预报体重和真实值之间有差距了.设计目的:结合图象,让学生直观感受残差图在刻画回归模型拟合效果方面的应用,体会残差分析和相关指数的意义.提出问题:根据前面得到的回归方程,能否预测一名美国女大学生的体重?建立回归模型后能否一劳永逸,在若干年后还可以使用,或者适用于多年以前的女大学生体重预测?学生活动:讨论交流总结发言.活动结果:在使用回归方程进行预报时要注意: (1)回归方程只适用于我们所研究的样本的总体; (2)我们建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预报值就是预报变量的精确值.提出问题:结合我们刚学习的概念,现在能否将建立回归模型的步骤补充完整? 学生活动:讨论交流,合作完成.活动结果:一般地,建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程). (4)按一定规则(如最小二乘法)估计回归方程中的参数.(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,或残差呈现不随机的规律性,等等).若存在异常,则检查数据是否有误,或模型是否合适等.设计意图:设计问题,让学生讨论分析,得出使用回归方程进行预报需注意的问题,并让学生完善建立回归模型的步骤.在这个过程中,教师不宜做太多引导,要放手给学生,让学生讨论,充分参与进来.运用新知例1一个车间为了规定工时定额,需确定加工零件所花费的时间,为此进行了10次试(1)建立零件数为解释变量,加工时间为预报变量的回归模型,并计算残差; (2)你认为这个模型能较好地刻画零件数和加工时间的关系吗? 分析:首先根据散点图粗略判断变量是否具有线性相关性,判断是否可以用线性回归模型来拟合数据,然后通过残差e ^1,e ^2,…,e ^n 来判断模型拟合的效果,判断原始数据是否存在可疑数据.解:(1)根据表中数据作出散点图如下:散点图由散点图可知变量之间具有线性相关关系,可以通过求线性回归方程来拟合数据.根据公式可求得加工时间对零件数的线性回归方程为y ^=0.668x +54.96.残差数据如下表:残差图由图可知,残差点分布较均匀,即用上述回归模型拟合数据效果很好,但需注意,由残差图也可以看出,第4个样本点和第5个样本点残差较大,需要确认在采集这两个样本点的过程中是否有人为的错误.点评:由散点图判断两个变量的线性相关关系,误差较大,利用残差图可以较好地评价模型的拟合程度,并能发现样本点中的可疑数据.【变练演编】例2求出y 对x 的回归方程,并说明拟合效果的好坏.思路分析:先根据散点图判断两个变量是否线性相关,若相关,求出回归直线方程,然后通过相关指数的大小来评价拟合效果的好坏.解:作出散点图:从作出的散点图可以看出,这些点在一条直线附近,可用线性回归模型来拟合数据.由数据可得x =18,y =45.4,由计算公式得b ^=-2.35,a ^=y -b ^x =87.7.故y 对x 的回归方程为y ^=-2.35x +87.7,列表:所以∑i =15(y i -y ^i )2=8.3,∑i =15(y i -y )2=229.2.相关指数R 2=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2≈0.946.因为0.964很接近1,所以该模型的拟合效果很好.变式1:若要分析是否在上述样本的采集过程中存在可疑数据,应如何分析? 活动设计:学生分组讨论,回顾课本解答问题. 活动成果:可以画出残差图来进行分析.变式2:既然利用残差图和相关指数都能够评价回归模型的拟合效果,能否总结一下两种方法各自的特点?活动成果:利用残差图可以直观展示拟合的效果,而且还可以发现样本数据中的可疑数据;而相关指数是把对拟合效果的评价转换为数值大小的判断,易于量化处理,并能在数量上表现解释变量对于预报变量变化的贡献率.设计意图:进一步熟悉判断拟合效果的方法以及各自的特点. 【达标检测】1.分析下列残差图,所选用的回归模型效果最好的是()ABC D 2.下列说法正确的是( )①回归直线方程适用于一切样本和总体;②回归直线方程一般都有时间性;③样本的取值范围会影响回归直线方程的适用范围;④根据回归直线方程得到的预测值是预测变量的精确值.A .①③④B .②③C .①②D .③④3.在研究气温和热茶销售杯数的关系时,若求得相关指数R 2≈__________,表明“气温解释了85%的热茶销售杯数变化”或者说“热茶销售杯数差异有85%是由气温引起的”.答案:1.D 2.B 3.0.85.课堂小结学生回顾本节课学习的内容,尝试总结,然后不充分的地方由学生相互补充,最后在老师的引导下,用精炼的语言进行概括:1.判断变量是否线性相关的方法以及各自的特点; 2.在运用回归模型时需注意的事项; 3.建立回归模型的基本步骤. 设计意图:让学生自己小结,这是一个多维整合的过程,是一个高层次的自我认识过程. 补充练习 【基础练习】1.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适.②用相关指数R 2来刻画回归的效果,R 2值越接近于1,说明模型的拟合效果越好.③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.正确的是( )A .①②B .②③C .①③D .①②③2.甲、乙、丙、丁四位同学各自对A ,B 两变量做回归分析,分别得到散点图与残差平方和∑i =1n(y i -y ^i )2如下表115106124103哪位同学的实验结果体现拟合A ,B 两变量关系的模型拟合精度高?( ) A .甲 B .乙 C .丙D .丁 3.关于x 与y 为了对x ,y 两个变量进行统计分析,现有以下两种线性模型:甲:y ^=6.6x +17.5,乙:y ^=7x +17.试比较哪一个模型拟合效果更好.答案或提示:1.D 2.D3.解析:设甲模型的相关指数为R 21,则R 21=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2=1-1551 000=0.845;设乙模型的相关指数为R 22,则可求得R 22=0.82,因为R 21>R 22,所以甲模型的拟合效果更好.【拓展练习】 4.假设某种农作物基本苗数x 与有效穗数y 之间存在相关关系,今测得5组数据如下:(1)以x 为解释变量,y 为预报变量,作出散点图;(2)求y 与x 之间的回归方程,对于基本苗数56.7预报有效穗数. (3)计算各组残差;(4)求R 2,并说明随机误差对有效穗数的影响占百分之几? 解:(1)散点图如图:(2)由图可以看出,样本点呈条状分布,有比较好的线性相关关系,因此可用线性回归方程来建立两个变量之间的关系.设线性回归方程为y ^=b ^x +a ^,由数据可以求得:b ^≈0.291,a ^=y -b ^x =34.67.故所求的线性回归方程为y ^=0.291x +34.67.当x =56.7时,y ^=0.291×56.7+34.67=51.169 7. 估计有效穗数为51.169 7.(3)各组数据的残差分别是e ^1≈0.37,e ^2≈0.72,e ^3≈-0.5,e ^4≈-2.22,e ^5≈1.61. (4)残差平方和:∑i =15(y i -y ^i )2=8.425 8,又∑i =15(y i -y )2=50.18,∴R 2=1-∑i =15(y i -y ^i )2∑i =15 (y i -y )2=1-8.425 850.18≈0.832.即解释变量(农作物基本苗数)对有效穗数的影响约占了83.2%,所以随机误差对有效穗数的影响约占1-83.2%=16.8%.设计说明 本课时从上一节课的案例出发,通过分析随机误差产生的原因,引入随机变量、残差、残差平方和、相关指数的有关概念,从相关指数和残差分析等角度探讨回归模型拟合的效果,并通过案例说明利用所建立的回归模型进行预报时需要注意的问题,然后总结建立回归模型的基本步骤.在教学过程中以问题为引导思考的动机,注重对学生合作意识的培养,通过对案例的分析,培养学生对数据的处理能力,让学生初步了解回归分析思想在实际生活中的运用.备课资料有关总偏差平方和、回归平方和、残差平方和以及相关指数等概念的说明 1.总偏差平方和:SST =∑i =1n(y i -y )2,刻画了预报变量y 的变化剧烈程度.2.回归平方和:SSR =∑i =1n(y ^i -y )2,公式中所有预测值的平均值也等于y ,故1n ∑i =1n y ^ i =1n ∑i =1n (b ^x i +a ^ )=b ^ x +a ^ =b ^ x +y -b ^x =y , 因此回归平方和又可以写成.从而回归平方和刻画了估计量y ^=a ^+b ^x 的变化程度.由于估计量由解释变量x 所决定,所以,回归平方和刻画了预报变量的变化中由解释变量通过线性回归模型引起的那一部分的变化程度.3.残差平方和:SSE =∑i =1n(y i -y ^i )2,刻画了残差变量变化的程度.4.偏差平方和分解:即指公式∑i =1n(y i -y )2=∑i =1n(y ^i -y )2+∑i =1n(y i -y ^i )2,称为平方和分解公式,用文字表示为: 总偏差平方和=回归平方和+残差平方和. 公式证明如下:假设观测数据为(x i ,y i ),i =1,2,…,n ,则∑i =1n(y i -y )2=∑i =1n(y i -y ^i +y ^i -y )2=∑i =1n(y i -y )2+∑i =1n(y i -y ^i )2+2∑i =1n(y ^ i -y )(y i -y ^i ).而∑i =1n(y ^ i -y )(y i -y ^i )=∑i =1n(b ^ x i -b ^ x )(y i -a ^ -b ^x i )=∑i =1nb ^(x i -x )[]y i -a ^ -b ^x -b(x i -x )=b ^∑i =1n(x i -x )[](y i -y )-b ^(x i -x )=b ^⎣⎢⎢⎡⎦⎥⎥⎤∑i =1n (x i-x )(y i -y )-b ^ ∑i =1n (x i -x )2=0, 代入上式即可证得平方和分解公式. 这样,可以把平方和分解公式解释为:预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量引起的变化程度之和.由平方和分解公式得1=∑i =1n(y ^i -y )2∑i =1n(y i -y )2+∑i =1n(y i -y ^i )2∑i =1n(y i -y )2这意味着在线性回归模型中,预报变量的1个单位的变化,需要由解释变量贡献∑i =1n(y ^i -y )2∑i =1n(y i -y )2,由残差变量贡献∑i =1n(y i -y ^i )2∑i =1n(y i -y )2,因此在线性回归模型中,我们说预报变量y的变化中的100×∑i =1n(y ^i -y )2∑i =1n(y i -y )2%是由解释变量x 所引起的,或者说解释变量x 可以解释预报变量y 的100×∑i =1n(y ^i -y )2∑i =1n(y i -y )2%的变化.又∑i =1n(y ^i -y )2∑i =1n(y i -y )2=1-∑i =1n(y i -y ^i )2∑i =1n(y i -y )2=R 2,即R 2=∑i =1n(y ^i -y )2∑i =1n(y i -y )2,这说明“预报变量y 的变化中的百分之100R 2是由解释变量x 所引起的,或者说解释变量x 可以解释预报变量y 的百分之100R 2的变化.因此,R 2越大拟合效果越好,反之越小.(设计者:杨雪峰)。
高中数学选修2-3精品教案8:§3.1 回归分析的基本思想及其初步应用教学设计
§3.1 回归分析的基本思想及其初步应用教学目标知识与技能能根据散点分布特点,建立不同的回归模型;知道有些非线性模型通过变换可以转化为线性回归模型;通过散点图及相关指数比较不同模型的拟合效果.过程与方法通过将非线性模型转化为线性回归模型,使学生体会“转化”的思想;让学生经历数据处理的过程,培养他们对数据的直观感觉,体会统计方法的特点,认识统计方法的应用;通过使用转化后的数据,利用计算器求相关指数,使学生体会使用计算器处理数据的方法.情感、态度与价值观通过案例的解决,开阔学生的思路,培养学生的探索精神和转化能力,并通过合作学习,培养学生的团队合作意识.重点难点教学重点:通过探究使学生体会有些非线性模型运用等量变换、对数变换可以转化为线性回归模型;教学难点:如何启发学生“对变量作适当的变换(等量变换、对数变换)”,变非线性为线性,建立线性回归模型.教学过程引入背景材料我国是世界产棉大国,种植棉花是我国很多地区农民的主要经济来源,在棉花的种植过程中,病虫害的防治是棉农的一项重要任务,如果处置不当就会造成棉花的减产.其中红铃虫就是危害棉花生长的一种常见害虫,在1953年,我国18省曾发生红铃虫大灾害,受灾面积300万公顷,损失皮棉约二十万吨.如图就是红铃虫的有关图片:红铃虫喜高温高湿,适宜各虫态发育的温度为25~32 ℃,相对湿度为80%~100%,低于20 ℃和高于35 ℃卵不能孵化,相对湿度60%以下成虫不产卵.冬季月平均气温低于-4.8 ℃时,红铃虫就不能越冬而被冻死.为采取有效防治方法,有必要研究红铃虫的产卵数和温度之间的关系.现收集了红铃虫的产卵数y和温度x之间的7组观测数据列于下表:温度x/℃21 23 25 27 29 32 35产卵数y/个7 11 21 24 66 115 325(1)试建立y与x之间的回归方程;并预测温度为28 ℃时产卵的数目.(2)你所建立的模型中温度在多大程度上解释了产卵数的变化?学生活动:类比前面所学过的建立线性回归模型的步骤,动手实施.活动结果:(1)画散点图:通过计算器求得线性回归方程:y ^=19.87x -463.73.当x =28 ℃时,y ^=19.87×28-463.73≈93,即温度为28 ℃时,产卵数大约为93. (2)进行回归分析计算得: R 2≈0.746 4,即这个线性回归模型中温度解释了74.64%产卵数的变化.设计目的:通过背景材料,加深学生对问题的理解,并明白“为什么要学”.体会问题产生于生活,并通过问题的解决复习建立回归模型的基本步骤.探究新知提出问题:结合数据可以发现,随着自变量的增加,因变量也随之增加,气温为28 ℃时,估计产卵数应该低于66个,但是从推算的结果来看93个比66个却多了27个,是什么原因造成的呢?学生活动:分组合作讨论交流.学情预测:由于我们所建立的线性回归模型的相关指数约等于0.746 4,即解释变量仅能解释预报变量大约74.64%的变化,所占比例偏小.这样根据我们建立的模型进行预报,会存在较大的误差.我们还可以从残差图上分析一下我们所建立的回归模型的拟合效果:残差数据表: x 21 23 25 27 29 32 35 y 7 11 21 24 66 115 325 残差53.4617.72-12.02-48.78-46.5-57.1193.28画出残差图根据残差图可以发现,残差点分布的带状区域较宽,并不集中,这表明我们所建立的回归模型拟合效果并不理想.之所以造成预报值偏差太大的原因是所选模型并不理想.实际上根据散点图也可以发现,样本点并没有很好地集中在一条直线附近,故变量之间不会存在很强的线性相关性.设计目的:引导学生对结果进行分析,从而发现存在的问题,激发好奇心、求知欲.同时培养学生对问题的洞悉能力,增强对结果的敏感自检能力.理解新知提出问题:如何选择合适的回归模型进行预测呢?学生活动:学生讨论,教师合理引导学生观察图象特征,联想学过的基本函数. 学情预测:方案一:建立二次函数模型y =bx 2+a . 方案二:建立指数函数模型y =c 1ac 2x .提出问题:如何求出所建立的回归模型的系数呢?我们不妨尝试解决方案一中的系数. 学生活动:分组合作,教师引导学生观察y =bx 2+a 与y =bx +a 的关系.学情预测:通过比较,发现可利用t =x 2,将y =bx 2+a (二次函数)转化成y =bt +a (一次函数).求出x ,t ,y 间的数据转换表:x 21 23 25 27 29 32 35 t =x 2 441 529 625 729 841 1 024 1 225 y711212466115325利用计算器计算出y 和t 的线性回归方程:y ^=0.367t -202.54,转换回y 和x 的模型:y ^=0.367x 2-202.54.当x =28 ℃时,y ^=0.367×282-202.54≈85,即温度为28 ℃时,产卵数大约为85. 计算相关指数R 2≈0.802,这个回归模型中温度解释了80.2%产卵数的变化. 提出问题:提出问题“如果选用指数模型,是否也能转换成线性模型,如何转化?” 学生活动:独立思考也可相互讨论.教师可启发学生思考“幂指数中的自变量如何转化为自变量的一次幂?”可引导学生回忆对数的运算性质以及指对数关系.学情预测:可利用取对数的方法,即在y =c 1ac 2x 两边取对数,得log a y =c 2x +log a c 1. 提出问题:在上面的运算中,由于底数a 不确定,对于x 的值无法求出相应的log a y ,这时可取a =10时的情况,以便利用计算器进行计算,试求出回归模型.学生活动:合作协作,讨论解决. 学情预测:建立数据转换表:x 21 23 25 27 29 32 35 z =lg y 0.85 1.04 1.32 1.38 1.82 2.06 2.51 y711212466115325根据数据,可求得变量z 关于x 的回归方程:z ^=0.118x -1.665. 转换回y 和x 的模型:y ^=100.118x-1.665.当x =28 ℃时,y ^≈44,即温度为28 ℃时,产卵数大约为44.计算相关指数R 2≈0.985,这个回归模型中温度解释了98.5%产卵数的变化.提出问题:试选择合适的方法,比较方案一和方案二在数据拟合程度上的效果有什么不同?学生活动:独立思考也可相互讨论,教师加以适当的引导提示. 活动结果:相关指数R 2残差平方和残差图方案一0.802 15 448.432方案二0.985 1 450.673无论从图形上直观观察,还是从数据上分析,指数函数模型都是更好的模型.设计目的:引导学生进行不同模型的比较,体会“虽然任意两个变量的观测数据都可以用线性回归模型来拟合,但不能保证这种模型对数据的拟合效果最好,为更好地刻画两个变量之间的关系,要根据观测数据的特点来选择回归模型”.提出问题:由上面的分析可以看出,回归模型不一定是线性回归模型,对于非线性回归模型,我们的处理方法是什么?学生活动:独立思考,回顾上面的解决过程.学情预测:选用非线性回归模型时,一般思路是转化成线性回归模型,往往要用“等量变换、对数变换”等方法.设计目的:让学生整理建立非线性回归模型的思路.运用新知例1为了研究某种细菌繁殖个数y与时间x的关系,收集数据如下:天数x(天) 1 2 3 4 5 6繁殖个数y(个) 6 12 25 49 95 190 试建立y与x之间的回归方程.解:根据上表中的数据,作出散点图由图可以看出,样本点分布在某指数函数曲线y =c 1ec 2x 的周围,于是令z =lny ,则上表变换后如下:x 1 2 3 4 5 6 z1.792.483.223.894.555.25作出散点图从图中可以看出,变换后的样本点分布在某条直线附近,因此可用线性回归模型来拟合. 由表中数据可得,z 与x 之间的线性回归方程为z ^=0.69x +1.112, 则y 与x 之间的回归方程为y ^=e 0.69x +1.112. 变练演编例2混凝土的抗压强度X 较易测定,其抗弯强度Y 不易测定,已知X 与Y 由关系式Y=AX b 表示,工程中希望由X 估算出Y ,以便应用.现测得一批对应数据如下:X 141 152 168 182 195 204 223 254 277 Y23.125.325.929.831.131.832.534.835.2试求Y 对X 的回归方程.解:对Y =AX b 两边取自然对数得:ln Y =b ln X +ln A ,做变换y =ln Y ,x =ln X ,a =ln A ,则上述数据对应表格如下:X 141 152 168 182 195 204 223 254 277 Y 23.1 25.3 25.9 29.8 31.1 31.8 32.5 34.8 35.2 x 4.95 5.02 5.12 5.20 5.27 5.32 5.41 5.54 5.62 y3.143.233.253.393.443.463.483.553.56根据公式可求得y ^=0.64x +0.017 2,则 Y ^=e 0.64ln x+0.017 2=1.02X 0.64.变式1:若X 与Y 的关系由关系式Y ^=β^X b +α^表示,试根据给出的数据求Y 对X 的回归方程.活动设计:学生分组讨论,尝试解决. 活动成果:Y ^=0.086X +13.005.变式2:试选择合适的方法比较上述两种回归模型,相对于给出的数据哪一个的拟合效果更好?活动成果:计算残差平方和与相关指数,对于模型Y =AX b,残差平方和Q ^(1)=9.819,相关指数R 21=0.930 4;对于模型Y ^=β^X b +α^,残差平方和Q ^(2)=12.306,相关指数R 22=0.908,故模型Y =AX b 的拟合效果较好.设计意图:熟悉判断回归模型拟合效果的方法. 达标检测1.变量x ,y 的散点图如图所示,那么x ,y 之间的样本相关系数r 最接近的值为( )A.1B.-0.5C.0 D.0.52.变量x与y之间的回归方程表示()A.x与y之间的函数关系B.x与y之间的不确定性关系C.x与y之间的真实关系形式D.x与y之间的真实关系达到最大限度的吻合3.非线性回归分析的解题思路是__________.【答案】1.C 2.D 3.通过变量置换转化为线性回归分析课堂小结1.数学知识:建立回归模型及残差图分析的基本步骤;非线性模型向线性模型的转换方法;不同模型拟合效果的比较方法:相关指数和残差的分析.2.数学思想:数形结合的思想,化归思想及整体思想.3.数学方法:数形结合法,转化法,换元法.补充练习基础练习1.相关指数R2,残差平方和与模型拟合效果之间的关系是()A.R2的值越大,残差的平方和越大,拟合效果越好B.R2的值越小,残差的平方和越大,拟合效果越好C.R2的值越大,残差的平方和越小,拟合效果越好D .以上说法都不正确2.如果散点图的所有点都在一条直线上,则残差均为____________________,残差平方和为__________,相关指数为______________.【答案】1.C 2.0 0 1 拓展练习3.某种书每册的成本费Y 元与印刷册数x (千册)有关,经统计得到数据如下: x 1 2 3 5 10 20 30 50 100 200 Y10.155.524.082.852.111.621.411.301.211.15检验每册书的成本费Y 元与印刷册数的倒数1x 之间是否有线性相关关系,如有,求出Y对1x的回归方程. 解:把1x 置换为z ,则z =1x ,从而z 与Y 的数据为:z 1 0.5 0.333 0.2 0.1 0.05 0.033 0.02 0.01 0.005 Y10.155.524.082.852.111.621.411.301.211.15根据数据可得r ≈0.999 8>0.75,故z 与Y 具有很强的线性相关关系. 所以b ^≈8.976,a ^≈1.120,从而y ^=8.976z +1.120.又z =1x ,所以y ^=8.976x+1.120.设计说明本课时内容教材中只安排了一道关于“红铃虫”的例题,但是它却代表了一种“回归分析”的类型.如何利用这道例题使学生掌握这类问题的解决方法呢?为此,本课时设计了“引导发现、合作探究”的教学方法.首先展示“红铃虫”的背景资料来激发学生的学习兴趣;鼓励学生用已有知识解决问题,引导学生检查结果从而发现新问题;通过分组合作来对不同方案进行探索;使学生在合作探索的过程中体会“选择模型——将非线性转化成线性”的方法,体会“化未知为已知、用已知探索未知”思想,同时认识不同模型的效果.培养学生观察、类比联想以及分析问题的能力.在教学过程中让学生自主探索、动手实践,养成独立思考、积极探索的习惯.在“选模型”这个环节中,注意引导学生将散点分布和已学函数图象进行比较,从而发现二次函数和指数函数模型.在“转化”这个环节中,通过引导学生观察所选模型,联系已学知识选择“等量变换或对数变换”,从而找到转化的途径.在运算过程中,如求“相关指数”引导人教版高中数学选修2-3教学设计学生使用转化后的数据,利用计算器求其相关系数即为相关指数,使学生体会使用计算器处理数据的方法和技能.11。
高中数学 3.2回归分析 精品导学案 苏教版选修2-3
3.2 回归分析1.线性回归方程y ^=a ^+b ^x 称为数据的回归直线,此直线方程即为线性回归方程,其中a ^称为回归截距,b ^称为回归系数,y ^称为回归值,其中:⎩⎪⎨⎪⎧b ^=∑i =1nx i y i-n x y ∑i =1nx 2i-n x2,a ^=y -b ^x .预习交流1线性回归直线方程y ^=a ^+b ^x 与一次函数y =a +kx 有何区别?提示:一次函数y =a +kx 是y 与x 的确定关系,给x 一个值,y 有唯一确定的值与之对应,而线性回归直线方程是y 与x 的相关关系的近似反映,两个数据x ,y 组成的点(x ,y )可能适合线性回归直线方程,也可能不适合.2.相关系数对于x ,y 随机取到的n 对数据(x i ,y i )(i =1,2,…,n )样本,相关系数r 的计算公式为:r =∑i =1n(x i -x)(y i -y )∑i =1n(x i -x )2∑i =1n (y i -y)2=∑i =1nx i y i -n x y(∑i =1nx 2i -n x 2)(∑i =1ny 2i -n y 2),r 具有如下性质:(1)|r |≤1;(2)|r |越接近于1,x ,y 的线性程度越高;(3)|r |越接近于0,x ,y 的线性相关程度越弱.预习交流2如何利用r 的临界值判断两个变量的线性相关关系?提示:(1)提出统计假设H 0:变量x ,y 不具有线性相关关系;(2)如果以95%的把握作出推断,那么可以根据1-0.95=0.05与n -2在相关性检验的临界值表中查出一个r 的临界值r 0.05(其中1-0.95=0.05称为检验水平);(3)计算样本相关系数r ;(4)作出统计推断:若|r |>r 0.05,则否定H 0,表明有95%的把握认为x 与y 之间具有线性相关关系;若|r |≤r 0.05,则没有理由拒绝原来的假设H 0,即就目前数据而言,没有充分理由认为y 与x 之间有线性相关关系.1.线性回归方程的求法(1)(2)如果y 与x 之间具有线性相关关系,求回归直线方程. 思路分析:求回归直线方程必须先对两个变量进行相关性判断,若两个变量存在较大的相关性,则可利用公式求回归直线方程的系数;若两个变量不具备相关关系,则求回归直线方程将变得毫无意义.解:(1)散点图如图.(2)由散点图可知,y 与x 呈相关关系,设回归直线方程为:y ^=b ^x +a ^. 经计算,得x =6,y =210.4,∑5i =1x 2i =220,∑5i =1x i y i =7 790. ∴b ^=7 790-5×6×210.4220-5×62=36.95, a ^=210.4-36.95×6=-11.3.∴回归直线方程为y ^=36.95x -11.3.某地植被面积x ((1)请用最小二乘法求出y 关于x 的线性回归方程y =b x +a ;(2)根据(1)中所求线性回归方程,如果植被面积为200公顷,则下降的气温大约是多少℃?解:(1)x =20+40+50+60+805=50,y =3+4+4+4+55=4.∑i =15x i y i =20×3+40×4+50×4+60×4+80×5=1 060,∑i =15x 2i =202+402+502+602+802=14 500. 所以b ^=1 060-5×50×414 500-5×502=0.03,a ^=4-0.03×50=2.5.故y 关于x 的线性回归方程y ^=0.03x +2.5.(2)由(1)得:当x =200时,y ^=0.03×200+2.5=8.5. 所以植被面积为200公顷时,下降的气温大约是8.5 ℃.先作出散点图可直观地判断两个变量的相关关系,线性回归直线方程一定过样本中心(x ,y ).2.相关系数及相关性检验现随机抽取了我校10名学生在入学考试中的数学成绩(x )与入学后的第一次考试中的思路分析:先利用相关系数计算公式r =∑i =1nx i y i -n x y(∑i =1nx 2i -n x 2)(∑i =1ny 2i -n y 2)计算出r ,当|r |越接近于1时,两个变量越具有很强的线性关系.解:由题意得:x =110×(120+108+…+99+108)=107.8,y =110×(84+64+…+57+71)=68,∑i =110x 2i =1202+1082+…+992+1082=116 584, ∑i =110y 2i =842+642+…+572+712=47 384,i =1nx i y i =120×84+108×64+…+108×71=73 796,∴r =73 796-10×107.8×68(116 584-10×107.82)·(47 384-10×682)≈0.750 6.∵0.750 6接近于1,∴两次数学考试成绩有显著性线性相关关系.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系,如果已测得炉料熔化完毕时,钢水的含碳量x 与冶炼时间y (从(1)y 与x 是否具有线性相关关系?(2)如果y 与x 具有线性相关关系,求线性回归方程.(3)预测当钢水含碳量为160个0.01%时,应冶炼多少分钟?于是r =∑i =1x i y i -10x y(∑10i =1x 2i -10x 2)(∑10i =1y 2i -10y 2)≈0.990 6.∵0.990 6非常接近于1,∴y 与x 具有显著的线性相关关系.(2)设所求的线性回归方程为y ^=b ^x +a ^,其中a ^,b ^的值使Q =∑10i =1(y i -b ^x i -a ^)2的值最小. b ^=∑10i =1x i y i -10x y∑10i =1x 2i -10x2≈1.267,a ^=y -b ^x ≈-30.47,即所求的线性回归方程为y ^=1.267x -30.47.(3)当x =160时,y ^=1.267×160-30.47≈172,即大约冶炼172 min. 如果两个变量不具备线性相关关系或者线性相关关系不显著,即使求出线性回归方程也无意义,用于估计和测量的结果也是不可信的.1.已知x ,y则y 与x 的回归直线方程y =b x +a 必过定点__________.答案:⎝ ⎛⎭⎪⎫32,4 解析:x =14×(0+1+2+3)=32.y =14×(1+3+5-a +7+a )=4,而y ^=b ^x +a ^过(x ,y ). 2.已知x ,y从散点图分析,y 与x 线性相关,且y =0.95x +a ,则a =__________. 答案:2.6解析:x =14×(0+1+3+4)=2,y =14×(2.2+4.3+4.8+6.7)=4.5.4.5=0.95×2+a ^,∴a ^=2.6.3根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为__________.答案:65.5万元解析:x =3.5,y =4.2,∵4.2=9.4×3.5+a ^,∴a ^=9.1.∴y ^=9.4x +9.1.当x =6时,y ^=65.5(万元).4.如下表中给出五组数据(x ,y ),从中选出四组使其线性相关最大,且保留第一组(-5,-3)答案:三解析:应去掉第三组;画散点图可以发现.5.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了4次试验.收集的数据如下:(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^; (2)现需生产20件此零件,预测需用多长时间?解:(1)x =1+2+3+44=2.5,y =2+3+5+84=4.5,b ^=∑i =14x i y i -4x y∑i =14x 2i -4x 2=(2+6+15+32)-4×2.5×4.5(1+4+9+16)-4×2.5×2.5=2, a ^=y -b ^x =4.5-2×2.5=-0.5,所以y ^=2x -0.5.(2)因为y ^=2×20-0.5=39.5(小时),所以生产20件此零件,预测需用39.5小时.教师个人研修总结在新课改的形式下,如何激发教师的教研热情,提升教师的教研能力和学校整体的教研实效,是摆在每一个学校面前的一项重要的“校本工程”。
江西省吉安县第三中学高中数学选修2-3课件:回归分析(共31张PPT)
a, b的意义是:
以a为基数,x每增加1个单位,y相应地平均增加 b 个单位。
4、求线性回归直线方程的步骤:
(1)求x
1 n
n i 1
xi ,
y
1 n
n i 1
yi
n
n
(2)求 xi2, xi yi. n
n
i1
i1
y ^
(xi x)(yi y)
xi
nx y
i
(3)代入公式
b i1 n
2、最小二乘估计
最小二乘估计下的线性回归方程: yˆ bˆx aˆ
n
n
(xi X )( yi Y )
xi yi nxy
bˆ i1 n
(Xi X )2
i1 n
xi 2
2
nx
i1
i1
aˆ Y bˆX 你能推导出这个公式吗?(见p74)
其中x
1 n
n i 1
xi , y
1 n
n i 1
产量 x(吨)与相应的生产能耗 y(吨标准煤)的几组对照数据.
x3456
展
y 2.5 3 4 4.5
评 4
b((性回12))i归1i请请4方1x画根ixy程yi2出据iay上上404x表表bx2.yx7y数提xab据供^;6x的的60.散数853.6点据3.545图,40;用4.4.7最57.50小2932.二.355乘0.法6365求.55出 6y3关于0.7x 的线
(3)已知该厂技改前 100 吨甲产品的生产能耗为 90 吨标准煤.试
根据(2)求出的线性回归方程,预测生产 100 吨甲产品的生产
能所耗以比预技测改前生降产低1多0少0吨标吨准甲煤产?品的生产能耗比技术改造 (前参降考低数1值9: .362.55吨4标3准 5煤.4 64.5 66.5)
人教课标版高中数学选修2-3《回归分析基本思想及其初步应用(第1课时)》教学设计
第3章 统计案例3.1 回归分析基本思想及其初步应用第一课时一、教学目标 1.核心素养:通过学习回归分析的基本思想及其初步应用,初步形成基本的数据分析能力. 2.学习目标(1)1.1.1.1 温习散点图,复习相关关系与函数关系.(2)1.1.1.2 理解回归分析的基本思想,会求线性回归方程.(3)1.1.1.3 理解回归模型与函数模型的差别,了解随机误差产生的原因. 3.学习重点线性回归分析的一般步骤,,回归分析的应用. 4.学习难点理解随机误差产生的原因以及函数模型与回归模型的差别. 二、教学设计 (一)课前设计 1.预习任务 任务1阅读教材P 2-P 4,思考求解线性回归方程一般步骤是什么?回归模型和函数模型有何区别?随机误差产生的原因? 任务2什么是解样本中心点,什么是回归分析?2.预习自测 1.两个变量有线性相关关系且正相关,则回归直线方程中,a bx y +=的系数b ( )A.0>bB.0<bC.0=bD.1=b解:A2.在画两个变量的散点图时,下面哪个叙述是正确的( ) A.预报变量在x 轴上,解释变量在y 轴上 B.解释变量在x 轴上,预报变量在y 轴上 C.可以选择两个变量中任意一个变量在x 轴上D.可以选择两个变量中任意一个变量在y 轴上 解:B3.回归直线y bx a =+必过( )A. (0,0)B. (,0)xC. (0,)yD. (,)x y 解:D (二)课堂设计 1.知识回顾(1)线性回归方程:∧∧∧+=a x b y ,其中.1122211()()()n niii ii i nniii i x x y y x y nx yb x x xnx∧====---==--∑∑∑∑, ˆy ab x ∧=- (2)线性相关:如果所有点看上去都在一条直线附近波动,则两个变量间是线性相关,可用一条直线来近似表示(3)非线性相关:若所有点看上去都在某条曲线附近波动,则两个变量间是非线性相关,可用一条曲线来拟合.(4)回归分析:是对具有相关关系的两个变量进行的统计分析的一种常用方法. 2.问题探究问题探究一 相关关系与函数关系是什么,如何画散点图? ●活动一 回顾旧知,回忆相关关系与函数关系在《必修3》中,我们已经学习过函数关系与相关关系,那么什么是函数关系,什么是相关关系?想一想:在以往数学学习和日常生活中,我们接触了哪些函数关系与相关关系? 举例:请大家试着列举生活与学习中的相关例子.例如圆的周长2C r π=,周长C 与半径r 之间就是一种确定性的关系,对于自变量半径的每一个确定的值,都有唯一确定的周长的值与之相对应.又如人的体重y 与身高x ,一般来说,身高越高,体重越重,但不能用一个函数来严格表示它们之间的关系.即变量之间有一定的联系,但取值也具有一定的随机性.即: 1. 函数关系与相关关系 (1) 函数关系是一种确定关系. (2) 相关关系是一种不确定关系.注意:判断两个变量是否具有相关关系,应该先看它们是否有关,再看这种关系是否是确定的函数关系.●活动二 旧知推进,回忆散点图的画法 2. 散点图在分析两个变量的关系时,为了对变量之间的关系有一个大概的了解,我们通常将一个变量的数据作为横坐标,另一个变量的数据作为纵坐标,将这些点描在平面直角坐标系中,形成的图形就是散点图(1)散点图直观反映了实例的成对观测值之间是否存在相关关系和存在什么样的相关关系. (2)若散点图中点的分布由左下方到右上方,则两个变量正相关;点的分析由左上方到右下方,则两个变量负相关问题探究二 线性回归分析步骤是什么?●活动一 通过实例,亲身体验在《必修3》中,我们利用回归分析的方法对两个具有线性相关关系的变量进行了研究,你能利用回归分析对下列实例进行分析吗?例1 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm 的女大学生的体重.【知识点:线性回归方程,回归分析;】详解:(1) 作散点图,由于问题是根据身高预报体重,因此要求身高与体重的回归直线方程,取身高为自变量x ,体重为因变量y ,作散点图:40455055606570150155160165170175180从散点图可以看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用回归直线y =bx +a 来近似刻画它们之间的关系,从而可利用我们学过的最小二乘估计思想及计算公式求得线性回归直线方程.其计算公式如下:1122211()()()n niii ii i nniii i x x y y x y nx yb x x xnx∧====---==--∑∑∑∑,y a b x ∧∧=-其中1211,n n i i x x x x x n n =+++==∑…121y y y 1y y ,nn i i n n=+++==∑…根据上面公式,可以得到712.85,849.0-==∧∧a b 于是得到线性回归方程712.85849.0-=∧x y对于身高172cm 女大学生,由回归方程可以预报体重为)(316.60712.85172849.0kg y =-⨯=∧,预测身高为172cm 的女大学生的体重为约60.316kg.点拨:回归分析的基本过程: (1)画出两个变量的散点图; (2)判断是否线性相关;(3)求回归直线方程(利用最小二乘法); (4)并用回归直线方程进行预报 ●活动二 整理旧知,得出新概念 1.样本中心点对于一组具有线性相关关系的数据1122(,),(,),,(,)n n x y x y x y ,1211,nni i x x x x x n n=+++==∑121y y y 1y y ,nni i n n=+++==∑则称点),y x (为样本点的中心.●活动三 总结反思,得出新结论 由上计算过程可以得出:(1)样本点的中心坐标分别是两个变量的观测数据的算术平均数. (2)点),y x (在回归直线上,即回归直线一定过样本点的中心.问题探究三 线性回归模型与函数模型有何差异,随机误差是怎么产生的??●活动一结合实际,反思结果想一想:身高为172cm 的女大学生的体重一定是60.316kg吗?如果不是,你能解释一下原因吗?答:不一定,但一般可以认为她的体重在60.316kg左右.由样本点和回归直线的相互位置可以说明这一点.从散点图可观察出,女大学生的体重y和身高x之间的关系并不能用一次函数y=bx+a来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61kg,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,这时我们把身高和体重的关系可用下面的线性回归模型y=bx+a+e来表示,其中a和b为模型的未知参数,e称为随机误差.●活动二层层推进,答疑解惑那么,产生随机误差项e的原因是什么呢?实际上,一个人的体重除了受身高影响外,还受其他许多因素的影响,例如饮食习惯、是否喜欢运动、度量误差等.另一方面,没有人知道身高和体重之间的真正关系是什么,现在只是利用线性回归方程来近似这种关系.而这种近似和上面提到的影响因素都会导致随机误差e的产生.即随机误差产生的原因:(1)线性回归方程中的∧b和∧a为估计值,与真实值b和a之间存在误差.(2)影响变量y的因素不止变量x一个,可能还包括许多因素(例如农作物的生长不仅要收日照时间的影响,还会受土壤的肥沃程度,施肥量等影响)(3)观测误差,由于测量工具及测量值一般也存在一定的误差,这样的误差也包含在e中所以随机误差e中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.●活动三新知学习在统计中,我们把自变量x称为解释变量,因变量y称为预报变量.线性回归模型与我们熟知的一次函数模型的不同之处就在于增加了随机误差e,预报变量y的值由解释变量x和随机误差e共同决定,即解释变量x只能解释部分预报变量y的变化3.课堂总结【知识梳理】(1)线性回归方程:∧∧∧+=a x b y ,其中.1122211()()()n niii ii i nniii i x x y y x y nx yb x x xnx∧====---==--∑∑∑∑,a ∧=x b ∧-y(2)回归分析的基本过程:①画出两个变量的散点图;②判断是否线性相关,③求回归直线方程(利用最小二乘法),④并用回归直线方程进行预报(3)对于一组具有线性相关关系的数据1122(,),(,),,(,)n n x y x y x y ,1211,nni i x x x x x n n=+++==∑121y y y 1y y ,nni i n n=+++==∑则称点),y x (为样本点的中心.(4)线性回归模型:y =bx +a +e ,其中a 和b 为模型的未知参数,e 称为随机误差.【重难点突破】(1)利用回归分析的方法对两个具有线性相关关系的变量进行研究的步骤: ①作出散点图 ②求回归直线方程 ③利用所求方程进行预测.(2) 随机误差产生的原因:①线性回归方程中的∧b 和∧a 为估计值,与真实值b 和a 之间存在误差.②影响变量y 的因素不止变量x 一个,可能还包括许多因素(例如农作物的生长不仅要收日照时间的影响,还会受土壤的肥沃程度,施肥量等影响)③观测误差,由于测量工具及测量值一般也存在一定的误差,这样的误差也包含在e 中. 4.随堂检测1.下面两个变量间的关系不是函数关系的是() A.正方体的棱长与体积 B.角的度数与它的正弦值C.单位产量为常数时,土地面积与粮食总产量 D.日照时间与水稻亩产量【知识点:函数关系,相关关系】解:D2. 设有一个回归方程为25.2+-=∧x y ,则变量x 增加一个单位时,y 的值得变化情况是( ) A.平均增加2.5个单位 B.平均增加2个单位 C.平均减少2.5个单位 D.平均减少2个单位【知识点:回归方程,函数】 答案:C3. 为了研究两个变量x 与y 之间的线性相关性,甲、乙两个同学并且利用线性回归方法,求得回归直线分别为1l 和2l ,已知在两个人的试验中发现y x 和分别相等,那么下列说法正确的是( )A.1l 与2l 一定平行B. 1l 与2l 重合C.1l 与2l 相交于点),y x (D.无法判断1l 与2l 是否相交【知识点:回归方程,样本点中心】 答案:C4.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程∧∧∧+=a x b y ,其中 x b y a b ^^,76.0-==∧,据此估计,该社区一户收入为15万元家庭年支出为( ) A. 11.4万元 B. 11.8万元 C.12.0万元 D.12.2万元【知识点:回归方程,回归分析】 答案:B5.已知x 与y 有如下数据:则y 关于x 的回归直线方程∧∧∧+=a x b y 必过点 . 【知识点:回归方程,样本点的中心】 解:(1.5,5) (三)课后作业 基础型 自主突破1.对具有相关关系的两个变量统计分析的一种常用的方法是( ) A.回归分析 B.相关系数分析 C.残差分析 D.相关指数分析 【知识点:回归分析】 解:A2.对于具有线性相关关系的变量x 和y ,由测得的数据已求得回归直线的斜率为 6.5,且恒过点(2,3),则回归直线的方程为 . 【知识点:回归方程,样本点的中心】 解:105.6-=∧x y3.一位母亲记录了儿子3—9岁的身高,数据(略),由此建立的身高与年龄的回归模型为y =7.19x +73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ) A.身高一定是145.83cm B.身高在145.83cm 以上 C.身高在145.83cm 左右 D.身高在145.83cm 以下【知识点:回归方程,回归分析】 答案:C4.为了了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了他某月1号到5号每天打篮球的时间x (单位:小时)与当天投篮命中率y 之间的关系:小李这5天平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为_______.【知识点:回归方程,样本点的中心】 解:0.5,0.53 能力型 师生共研1.在一次实验中,测得(x ,y )的四组值分别是A (1,2)、B (2,3)、C (3,4)、D (4,5),则y 与x 之间的回归直线方程为( )A.1ˆ+=x yB.2ˆ+=x yC.12ˆ+=x yD.1ˆ-=x y【知识点:回归直线方程】 解:A2.如果某地的财政收入x 与支出y 满足线性回归方程e a bx y ++=∧(单位:亿元),其中5.0||,2,8.0≤==e a b ,如果今年该地区财政收入10亿元,则年支出预计不会超过( )A.10亿元B.9亿元C.10.5亿元D.9.5亿元【知识点:回归模型,】解:C 点拨:带入数据,得,10e y +=∧又,5.0||≤e 得5.105.9≤≤∧y . 3.已知y x ,的值如下表所示,若y 与x 具有相关关系且其回归直线方程为,2741x y +=∧则a =( )A.4B.5C. 6D. 7【知识点:回归直线方程】解: A 点拨:又表格求得y x ,的值,带入回归直线方程,建立关于a 的方程求解. 4. 有下列关系:①人的年龄与他(她)拥有的财富之间的关系; ②曲线上的点与该点的坐标之间的关系; ③苹果的产量与气候之间的关系;④森林中的同一种树木,其横断面直径与高度之间的关系, ⑤学生他(她)的学号之间的关系.(填序号) 【知识点:函数关系,相关关系】 答案:①③④ 探究型 多维突破1.下表提供了某厂节能降耗技术改造后,生产甲产品过程中记录的产量x (单位:吨)与相应的能耗y (单位:吨标准煤)的几组对照数据(1)请画出上表数据的散点图.(2)y 与x 是否具有线性相关关系?若是,则求出y 关于x 的线性回归方程.(3)已知该厂技术改造前100吨甲产品的生产能耗为90吨标准煤,试根据(2)中求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤(参考值:5.665.4645345.23=⨯+⨯+⨯+⨯) 【知识点:散点图,相关关系,回归分析】 解:(1)略(2)由散点图可知,各数据点大致分布在一条直线的附近,故具有线性相关关系.计算得86412=∑=i ix,5.6641=∑=i i i y x ,,5.3,5.4==y x 又最小二乘法确定的线性回归方程的参数为.35.0,7.0==∧∧a b 故所求的线性回归方程为35.07.0+=∧x y .(3)由(2)中的线性回归方程及技术改造前100吨甲产品的生产能耗,得降低的生产能耗为65.1935.01007.090=+⨯-)((吨标准煤). (四)自助餐1.下面列两个变量之间呈相关关系的是( ) A.圆的面积与半径 B.球的体积与半径 C.角的度数与它的正切值D.一个考生的数学成绩与物理成绩 【知识点:相关关系】 解:D2.下列关于回归分析说法错误的是( ) A.回归分析是研究两个具有相关关系的变量的方法 B.在散点图中,解释变量在x 轴,预报变量在y 轴 C.回归模型中一定存在随机误差 D.散点图能明确反映变量间的关系 【知识点:回归分析】 解:D3.已知变量x 与y 正相关,且由观测数据算得样本平均数5.3,3==y x ,由此该观测数据算得的线性回归方程可能是( ) A.3.24.0+=∧x y B.4.2-2x y =∧ C.5.92-+=∧x y D.4.43.0-+=∧x y【知识点:回归方程,样本点中心】 解:A4.为了了解儿子身高与父亲身高的关系,随机抽取5对父子的身高数据如下则y 对于x 的线性回归方程为( )A.1+=∧x y B.1+=∧x y C.885.0+=∧x y D.12+=∧x y【知识点:回归方程】 解:C5.小李同学根据下表记录的产量x (吨)和能耗y (吨标准煤)对应的四组数据,用最小二乘法求出了y 对于x 的线性回归方程是070.35y x ∧=+.,之后不慎将一滴墨水滴于表内,表中第二行第四列的数据已经无法看清,据你判断这个数据应该是( )A.3.5B.3.75C. 4D. 4.25【知识点:回归方程,样本点中心】 解:C6.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且623.0-347.2x y =∧;②y 与x 负相关且648.5476.3-+=∧x y ;③y 与x 正相关且493.8437.5+=∧x y ;④y 与x 正相关且578.4-326.4-x y =∧. 其中一定不正确的结论序号是( ) A.①② B.②③ C.③④ D.①④【知识点:回归方程,正相关、负相关】 解:D7.若施化肥量x 与小麦产量y 之间的回归直线方程为x y 4250ˆ+=,当施化肥量为50kg 时,预计小麦产量为__________.解析:当50=x 时,450450250ˆ=⨯+=y . 答案:kg 450.8.年或者更少教育的百分比(x )和收入低于官方规定的贫困线人数占本地区的人数的百分比(y )的数据,建立的回归直线方程6.48.0+=∧x y ,斜率的估计值为0.8,说明__________;成年人受过9年或者更少教育的百分比(x )与收入低于官方规定的贫困线的人数占本地区人数的百分比(y )之间的相关系数__________(填“大于0”或“小于0”). 【知识点:回归方程,回归分析】解:一个地区受过9年或者更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本地区人数的百分比将增加0.8%左右 大于0.9.对具有线性相关关系的变量x ,y 有一组观测数据),8,,2,1)(, =i y x i i (其回归直线方程是a x y +=∧31,且,6)(2821821=+++=+++y y y x x x 则实数a 的值是__________. 【知识点:回归方程,回归分析】解:8110.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y bx a ∧=+,其中20-=b ,a y bx =-;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本) 【知识点:回归方程,相关关系,回归分析】解:(1)由于x =16(x 1+x 2+x 3+x 4+x 5+x 6)=8.5,y =16(y 1+y 2+y 3+y 4+y 5+y 6)=80,所以a =y -b x =80+20×8.5=250,从而回归直线方程为y =-20x +250. (2)设工厂获得的利润为L 元,依题意得L =x (-20x +250)-4(-20x +250)=-20x 2+330x -1 000=-20(x-334)2+361.25, 当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.11. 下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 参考数据:719.32i i y ==∑,7140.17i i i t y ==∑,()7210.55i i y y=-=∑,7≈2.646.参考公式:相关系数1221t)(y y)(t t)(y y)niii niii r ==--=--∑∑回归方程 中斜率和截距的最小二乘估计公式分别为: 121(t t)(y y)(t t)niii ni i b ∧==--=-∑∑,a y b t =-【知识点:回归方程,相关关系,回归分析】 解:(1)由折线图这数据和附注中参考数据得4=t ,28)(712=-∑=i i t t ,55.0)(712=-∑=i iy y,89.232.9417.40))((717171=⨯-=-=--∑∑∑===i i i iii i iy t yt y y t t,99.0646.2255.089.2≈⨯⨯≈r .因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由9.321.3317y =≈及(1)得7121()()2.890.10328()iii ni i t t y y b t t ∧==--==≈-∑∑, 92.04103.0331.1ˆˆ≈⨯-≈-=t b y a .所以,y 关于t 的回归方程为:t y10.092.0ˆ+=. 将2016年对应的9=t 代入回归方程得:82.1910.092.0ˆ=⨯+=y. 所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.。
高中数学苏教版选修2-3 精品导学案:3.2 回归分析
§3.2回归分析(一)课时目标1.掌握建立线性回归模型的步骤.2.了解回归分析的基本思想和初步应用.1.对于n 对观测数据(x i ,y i )(i =1,2,3,…,n ),直线方程____________称为这n 对数据的线性回归方程.其中________称为回归截距,________称为回归系数,________称为回归值.2.a ^,b ^的计算公式⎩⎨⎧b ^=∑ni =1x i y i -n x y ∑ni =1x 2i-n (x )2,a ^ =y -b ^x .3.相关系数r 的性质(1)|r |≤1;(2)|r |越接近于1,x ,y 的线性相关程度越强; (3)|r |越接近于0,x ,y 的线性相关程度越弱.一、填空题1.下列关系中正确的是________(填序号). ①函数关系是一种确定性关系; ②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.2.回归直线y ^=a ^+b ^x 恒经过定点________.3.为了解决初中二年级平面几何入门难的问题,某校在初中一年级代数教学中加强概念和推理教学,并设有对照班,下表是初中二年级平面几何期中测试成绩统计表的一部分,其χ2≈________(保留小数点后两位).70和70分以下70分以上合计 对照班 32 18 50 实验班 12 38 504.从某学校随机选取8名女大学生,其身高x (cm)和体重y (kg)的回归方程为y ^=0.849x -85.712,则身高172 cm 的女大学生,由线性回归方程可以估计其体重为________ kg.5.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,且y 关于x 的回归直线的斜率是b ^,那么b ^与r 的符号________(填写“相同”或“相反”).6.某小卖部为了了解冰糕销售量y (箱)与气温x (℃)之间的关系,随机统计了某4天卖出的冰糕的箱数与当天气温,并制作了对照表(如下表所示),且由表中数据算得线性回归方程y ^=b ^x+a ^中的b ^=2气温(℃) 18 13 10 -1 冰糕(箱) 64 38 34 247.今年一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y (件)与月平均气温x (℃)由表中数据算出线性回归方程y =b x +a 中的b ≈-2.气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月羽绒服的销售量的件数约为________.8.已知线性回归方程为y ^=0.50x -0.81,则x =25时,y 的估计值为________.二、解答题9.某企业上半年产品产量与单位成本资料如下:(1)求出线性回归方程;(2)指出产量每增加1 000件时,单位成本平均变动多少? (3)假定产量为6 000件时,单位成本为多少元?10(1)求年推销金额(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.能力提升11.下表提供了某厂节能降耗技术改造后,生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.x 3 4 5 6 y 2.53 4 4.5y x ________. 12房屋面积(米2) 115 110 80 135 105 销售价格(万元) 24.8 21.6 18.4 29.2 22(1)(2)求线性回归方程,并在散点图中加上回归直线;(3)根据(2)的结果估计当房屋面积为150 m 2时的销售价格.1.(1)求线性回归方程的步骤为①作出散点图;②利用公式计算回归系数b ^及a ^的值;③写出线性回归方程.(2)一般地,我们可以利用线性回归方程进行预测,这里所得到的值是预测值,但不是精确值.2.计算相关系数r 可以判断变量x ,y 的线性相关程度.3.2 回归分析(一)答案知识梳理1.y ^=a ^+b ^x a ^b ^y ^作业设计 1.①②④ 2.(x ,y ) 3.16.23 4.60.316解析 当x =172时,y ^=0.849×172-85.172=60.316. 5.相同解析 可以分析b ^、r 的计算公式. 6.70解析 由线性回归方程必过点(x ,y ),且b ^=2,得a ^=20,所以当x =25时,y ^=70.7.46解析 ∵样本点的中心为(10,38),∴38=-2×10+a ^,∴a ^=58,∴当x =6时,y ^=-2×6+58=46. 8.11.69解析 y 的估计值就是当x =25时的函数值,即0.50×25-0.81=11.69.9.解 (1)n =6,∑6i =1x i =21,∑6i =1y i =426,x =3.5, y =71,∑6i =1x 2i =79,∑6i =1x i y i =1 481, b ^=∑6i =1x i y i -6x y ∑6i =1x 2i -6x 2=1 481-6×3.5×7179-6×3.52≈-1.82. a ^=y -b ^x =71+1.82×3.5=77.37.线性回归方程为y ^=a ^+b ^x =77.37-1.82x .(2)因为单位成本平均变动b ^=-1.82<0,且产量x 的计量单位是千件,所以根据回归系数b ^的意义有:产量每增加一个单位即1 000件时,单位成本平均减少1.82元. (3)当产量为6 000件时,即x =6,代入线性回归方程:y ^=77.37-1.82×6=66.45(元)当产量为6 000件时,单位成本约为66.45元.10.解 (1)设所求的线性回归方程为y ^=b ^x +a ^,则b ^=∑5i =1(x i -x )(y i -y )∑5i =1(x i -x )2=1020=0.5,a ^ =y -b ^ x =0.4. 所以年推销金额y 关于工作年限x 的线性回归方程为y ^=0.5x +0.4.(2)当x =11时,y ^=0.5×11+0.4=5.9(万元).所以可以估计第6名推销员的年推销金额为5.9万元.11.y ^=0.7x +0.35解析 对照数据,计算得:∑4i =1x 2i =86, x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5. 已知∑4i =1x i y i =66.5, 所以b ^=∑4i =1x i y i -4x y∑4i =1x 2i -4(x )2=66.5-4×4.5×3.586-4×4.52=0.7. a ^=y -b ^x =3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y ^=0.7x +0.35. 12.解 (1)散点图如图所示:(2)x =15∑5i =1x i =109,∑5i =1 (x i -x )2=1 570, y =23.2,∑5i =1(x i -x )(y i -y )=308. 设所求线性回归方程为y ^=b ^x +a ^,则b ^=3081 570≈0.196 2, a ^=y -b ^x =23.2-109×3081 570≈1.816 6. 故所求线性回归方程为y ^=0.196 2x +1.816 6.(3)根据(2),当x =150 m 2时,销售价格的估计值为y ^=0.196 2×150+1.816 6=31.246 6≈31.2(万元).教学反思在新课改的形式下,如何激发教师的教研热情,提升教师的教研能力和学校整体的教研实效,是摆在每一个学校面前的一项重要的“校本工程”。
高中数学选修2-3导学案,正规模版31.doc
《回归分析的基本思想及其初步应用》导学案【学习目标】1.了解回归分析的基本思想和方法,培养学生•观察分析计算的能力【学习目标】学习重点:回归方程学习难点:2、&公式的推到【学法指导】1.使值最小时,值的推到工(兀一兀)(”一刃_ _2.结论0= -------------------------------- a - y-/3x£(召-汙1=13.y = bx + a{Va和&的含义是什么4.(;,$)—定通过回归方程吗?【教学过程】例1.研究某灌溉倒水的流速y与水深xZ间的关系,测得一组数据如下:(1)求y与x的回归直线方程;(2)预测水深为1.95m时水的流速是多少?分析:(1)y与x的回归直线方程为9 = 0.733%+ 0.6948(2)当水深为1.95m时,可以预测水的流速约为2.12m/s【当堂检测】1.对两个变量y和x进行回归分析,得到一组样本数据:(X],开),(兀2,力),(兀3,儿),…,(百,儿)・则F列说法不正确的是()A.山样本数据得到的回归方程y = bx + a必过样本中心GI) B.残差平方和越小的模型,拟合的效果越好C.用相关指数F来刻画I叫归效果,F越小,说明模型的拟合效果越好D.若变量y与x之间的相关系数r = -0.9362,则变量y与x之间具有线性相关关系2.已知某地每单位面积菜地年平均使用氮肥最xkg与每单位曲积蔬菜年平均产最yt Z间的关系冇如下数据:若x与y之间线性相关,求蔬菜年平均产量y与使用氮肥量x之间的回归直线方程, 并估计每单位面积蔬菜的年平均产最.(已知_ _ 15 15兀= 101,"10. 11,工好=161,工x.y. = 16076.8)/=! (=1课后练习与提髙32.51、下表提供了某厂节能降耗技术改造后生产甲产晶过程中记录的产量X (吨)与相 应的生产能耗y (吨标准煤)的儿组对照数据:X 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;⑵ 请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y = bx-^a ; ⑶ 已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线 性冋归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3x2.5 + 4x3 + 5x4 + 6x4.5 = 66.5) 解:(1)由题设所给数据,可得散点图如卜图仙(能耗:吨标准煤)24 5 6 x (产最:吨)一、预习目标通过截距;与斜率b分别是使Q(a, 0) = £ (x- - 0兀-a)2取最小值时,求a,0的/=1值。
江西省吉安市井冈山大学附中高中数学选修2-3《回归分析》导学案
(一)导案1.两个变量的关系与回归分析函数关系是一种 关系,而相关关系是一种 关系。
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
2.线性回归方程 (1).必修课程中,我们已经会用最小二乘法求变量之间的线性回归方程。
假设样本点为112233(,),(,),(,),(,)n n x y x y x y x y …,,设线性回归方程为 ,我们的想法就是要求a 、b ,使这n 个点与直线 的“距离”平方之和 。
(2).在统计中,我们使用 表示一组数据123,,,,n x x x x …的平均值,即 。
为了简化表示,我们引进求和符号,记作 。
(3).1()n ii x x =-=∑ 。
1()nii y y =-=∑ 。
(4).._____________=xxl ._____________=xy l ._______________=yy l(5).线性回归方程y a bx =+,其中.__________________=b .____________________=a对于样本点为112233(,),(,),(,),(,)n n x y x y x y x y …,,设线性回归方程y a bx =+。
如何使使这n 个点与直线y a bx =+的“距离”平方之和即2222211)()()(),(n n bx a y bx a y bx a y b a Q --+⋅⋅⋅⋅⋅⋅+--+--=最小。
你能求出此时的a 和b 吗?(二)讲案回归分析概念辨析例1:在下列说法中正确命题的个数是 ( )①回归分析就是用样本点去寻找一条直线方程,刻画这些样本点之间的关系的数学方法; ②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过线性回归方程a bx y += 及其回归系数分析b ,可以估计和预测变量的取值和变化趋势 ④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验。
江西省吉安市井冈山大学附中高中数学选修2-3《相关系数》导学案
(一)导案1.相关系数对于变量y x ,有观测数据),(i i y x ),,2,1(n i =其相关系数:r = . 2.相关性检验 变量之间线性相关系数r 的取值范围为 , r 值越大,变量之间的线性相关程度越 ; r 的值越接近0,变量之间的线性相关程度越 , 当0>r 时,0>b ,两个变量正相关; 当0<r 时,0<b ,两个变量负相关; 当0=r 时,称两个变量线性不相关。
当从散点图中不容易判断变量之间的线性关系时,你有没有其他的方法来判断呢?又如何通过计算相关系数来判断线性相关程度的大小?(二)讲案、如何求线性相关系数例1:如何求出例题(见书第3页)中的线性相关系数r ?如何用相关系数作相关性检验例2:假设关于某设备的使用年限x 和所支出的维修费用y (万元),有统计数据如下表。
用散点图及相关系数两种方法判断y 与x 的相关性。
(参考数据:5521190,112.3i i i i i xx y ====∑∑)(三)练案1. 对于线性相关系数r ,以下说明正确的是( ) A 、r 只能是正值,不能为负值; B 、1r ≤,且r 越接近于1,相关程度越大;相反则越小;C 、1r ≤,且r 越接近于1,相关程度越小;相反则越大;D 、不能单纯以r 来确定线性相关程度。
2.如右图,有5组),(y x 数据,去掉 组(即填A ,B ,C ,D ,E中的某一个)后,剩下的四组数据的线性相关系数最大。
使用年限x2 3 4 5 6 维修费用y2.23.8 5.5 6.5 7.03.许多先进国家对驾驶员的培训,大多采用室内模拟教学和训练,而后再进行实地训练并考试,这种方法可以大大节约训练的费用。
问题是这种方法有效吗?下表是12名学员的模拟驾驶成绩x 与实际考试成绩y 的记录(单位:分)(四)小结与作业1掌握回归分析的基本思想. 2. 能够根据所给数据作出散点图,并会求相关系数,从而确定回归方程,并能利用回归方程进行预测。
最新人教版高中数学选修2-3《回归分析的基本思想及其初步应用》示范教案(第1课时)
第三章统计案例本章概览整体设计教材分析1.本章内容在学科知识中的地位与重要性在实际生活中,我们经常面临着一些需要作出推断的问题,例如研制出的一种新药,需要推断它是否有效;吸烟是否与患癌症有关等等,在对于类似的问题作出推断时,我们不能仅凭主观臆断作出结论,而是需要通过实验来收集数据,并对这些数据作出相应的分析,从而做出合理的判断.两个变量之间是否存在关系?又是何种关系?这些问题的解决,也是数学中一种重要的思想方法.本章是数学与生产、生活实际相结合、相联系的重要体现,是数学重要思想方法的应用,是数学与生产、生活相联系的桥梁之一.2.本章主要内容本章知识是新课标教材的新增内容,目的是通过案例介绍一些统计方法,体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用.本章的重点是:独立性检验和回归分析的基本思想与方法;难点是:独立性检验和回归分析的初步应用.主要内容具体有:(1)线性相关关系的判断;(2)残差分析;(3)建立回归模型的基本步骤;(4)拟合效果的比较;(5)等高条形图的应用;(6)独立性检验的基本思想.课标要求1.通过典型案例的探究,进一步了解回归分析的基本思想、方法及其初步应用.2.通过典型案例的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及其初步应用.教学建议本章在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用.在进行本章教学时,应注意以下几点:(1)通过对典型案例的讨论,了解回归分析的基本思路、方法及其初步应用.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.教学中应该通过生活中详实事例理解回归分析的方法,其步骤为通过散点图,直观地了解两个变量的关系,然后,通过最小二乘法建立回归模型,最后通过分析残差、相关指数等,评价模型的好坏.重点是了解回归分析的思想方法,对其理论基础不做要求,避免学生单纯记忆和机械套用公式进行计算.(2)通过对典型案例的分析,了解独立性检验的基本思想、方法及其初步应用.教学中应用实例分析总结得出独立性检验的意义,并且认真体会独立性检验的基本思路类似于反证法,会用类比的思想方法得出独立性检验的基本步骤.重点是了解独立性检验的思想方法,对其理论基础不做要求,避免学生单纯记忆和机械套用公式进行计算.(3)回归分析和独立性检验两种思想方法的学习重在使用.这部分内容是《必修3》统计内容的深化,反映了对已学知识的螺旋式上升的认识过程,也充分体现了两种思想的应用价值,在应用中不断提高对两种思想方法的认识.课时分配本章教学时间大约需10课时,具体分配如下(仅供参考)3.1回归分析的基本思想及其初步应用约4课时3.2独立性检验的基本思想及其初步应用约3课时实习作业约2课时本章复习约1课时3.1 回归分析的基本思想及其初步应用整体设计教材分析1.教材的地位和作用高中新课程中增加了有关统计学初步的内容,先后出现在必修3和选修12(文科)、选修23(理科)中.《数学3(必修)》中的“统计”一章,给出了运用统计的方法解决问题的思路.“线性回归分析”是其介绍的一种分析、整理数据的方法.在这一部分中,学习了如何画散点图、利用最小二乘法的思想、利用计算器求回归直线方程、利用回归直线方程进行预报等内容.然而在大量的实际问题中,两个变量不一定都呈线性相关关系,它们可能呈指数关系或对数关系等非线性关系,本节就是在学习了如何建立线性回归模型的基础上,探索如何建立非线性关系的回归模型.通过本节的学习,使学生了解回归分析的必要性和回归分析的基本思想,明确回归分析的基本方法和基本步骤,学会以科学的态度评价两个变量的相互关系,培养学生运用所学内容解决实际问题的能力.2.课时划分《回归分析的基本思想及其初步应用》的教学分四个课时完成.第一课时:介绍线性回归模型的数学表达式,解释随机误差项产生的原因,使学生能正确理解回归方程的预报结果;第二课时:从相关系数、相关指数和残差分析角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤;第三课时:介绍两个变量非线性相关关系;第四课时:回归分析的应用.第一课时教学目标知识与技能通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.过程与方法让学生经历数据处理的过程,培养他们对数据的直观感觉,体会统计方法的特点,认识统计方法的应用;通过使用转化后的数据,利用计算器求相关指数,使学生体会使用计算器处理数据的方法.情感、态度与价值观从实际问题中发现已有知识的不足,激发好奇心、求知欲;通过寻求有效的数据处理方法,开阔学生的思路,培养学生的探索精神和转化能力;通过案例的分析,使学生了解回归分析在生活实际中的应用,增强数学“取之生活,用于生活”的意识,提高学习兴趣.重点难点教学重点:理解回归分析的基本思想,掌握求回归直线方程的步骤以及对随机误差e的认识.教学难点:掌握利用回归分析的基本思想处理实际问题的方法,理解随机误差的来源和对预报变量的影响.教学过程引入新课“名师出高徒”这句谚语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?活动设计:学生独立思考回答问题.学情预测:学生可能会说“有名气的老师不一定能教出厉害的学生”.教师提问:为什么?学情预测:两者之间有一定的关系,但不是必然关系,即名师也不一定出高徒,二者之间是相关关系.设计意图:复习两个变量之间的关系,为线性分析做好铺垫.提出问题:我们知道函数关系是一种确定性关系,而相关关系是一种非确定性关系.上面所提的“名师”与“高徒”之间的关系就是相关关系.那么,在一般情况下,人的身高与体重之间是什么关系?试设计一个方案,来分析某大学女大学生的身高与体重之间的关系,并以此为依据来预报身高172 cm的女大学生的体重.学生活动:学生独立思考,小组合作交流讨论.活动结果:可以采用统计的方法解决这一问题,先采用随机抽样的方法,从在校女大学生中抽取样本,记录其身高和体重,然后通过所得数据建立线性回归模型,并根据所得模型来预报身高为172 cm女生的体重.其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报.设计目的:合理设计问题,使学生进一步掌握用统计方法解决问题的基本步骤:提出问题、收集数据、分析整理数据、进行预测或决策.探究新知若从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:的女大学生的体重.学生活动:分组合作探究,查阅课本中的计算公式.活动结果:1.画散点图选取身高为自变量x,体重为因变量y,画出散点图形象展示两个变量之间的关系,并判断二者是否具有线性关系.由散点图可以发现,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用线性回归直线近似刻画它们之间的关系.2.建立回归方程由计算器可得a ^=-85.712,b ^=0.849.于是得到回归方程为y ^=0.849x -85.712. 3.预报和决策当x =172时,y ^=0.849×172-85.712=60.316(kg).即一名身高为172 cm 的女大学生的体重预报值为60.316 kg.设计目的:进一步熟悉线性回归分析的具体步骤.提高学生的数据处理能力,并让学生在应用中进一步掌握公式的应用.理解新知 提出问题:散点图可以直观地判断两个变量是否具有线性相关性,那么还有什么方法可以描述线性相关性的强弱?学生活动:独立思考或相互讨论. 活动结果:还可以通过必修3中的相关系数r 来衡量两个变量之间的线性相关关系的强弱.提出问题:如何根据相关系数r 描述线性相关性的强弱?相关系数的计算公式是什么? 学生活动:独立思考或相互讨论,查阅课本. 活动结果:其具体计算公式是r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑j =1n(y j -y )2当r>0时,表示两个变量正相关;当r<0时,表示两个变量负相关.r 的绝对值越接近1,表明两个变量的线性相关性越强,r 的绝对值越接近0,表明两个变量之间几乎不存在线性相关关系.通常,当|r|>0.75时,认为两个变量有很强的线性相关关系.提出问题:在本例中,身高和体重的线性相关系数是多少?我们建立的线性回归方程是否有实际意义?学生活动:独立计算,求解相关系数.活动结果:利用计算器可求得r =0.798,这表明体重与身高有很强的线性相关关系,从而表明我们建立的回归模型是有意义的.设计目的:复习判断变量线性相关的方法,进一步熟悉线性相关系数的计算公式. 提出问题:身高为172 cm 的女大学生的体重一定是60.316 kg 吗? 学生活动:独立思考也可相互讨论.学情预测:不一定,但一般可以认为她的体重在60.316 kg 左右. 提出问题:为什么根据得到的一次函数求出的结论不一定是实际值?产生误差的原因是什么?学生活动:独立思考也可相互讨论,教师加以适当的引导提示. 活动结果:观察上述散点图,我们可以发现女大学生的体重y 和身高x 之间的关系并不能用一次函数y =bx +a 来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系).在数据表中身高为165 cm 的3名女大学生的体重分别为48 kg 、57 kg和61 kg ,如果能用一次函数来描述体重与身高的关系,那么身高为165 cm 的3名女大学生的体重应相同.这就说明体重不仅受身高的影响还受其他因素的影响,如生理因素、饮食锻炼、测量工具等其他因素.为了更准确地刻画身高和体重的关系,可用下列线性回归模型来表示:y =bx +a +e.我们把自变量x 称作解释变量,因变量y 称作预报变量,e 称为随机误差.提出问题:函数模型y =bx +a 与线性回归模型y =bx +a +e 有什么关系? 学生活动:独立思考也可相互讨论,教师加以适当的引导提示.活动结果:线性回归模型:y =bx +a +e 当理想化时,即所有人的遗传因素都一样、所有人的生活方式都一样、所有测量都没有误差等等,此时e =0,线性回归模型就变成函数模型了.因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.设计目的:突破本节课的难点,充分认识随机误差e 的来源和对预报变量的影响. 运用新知例1假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下统计数据:若由此资料可知y 对x 呈线性相关关系,试求: (1)回归直线方程;(2)估计使用年限为10年时,维修费用为多少?分析:正确理解计算b ^,a ^的公式和准确的计算,是求线性回归方程的关键. 解:(1)故x =4,y=5,∑i =15x 2i =90,∑i =15x i y i =112.3,于是b ^=∑i =15x i y i -5x y∑i =15x 2i -5x2=112.3-5×4×590-5×42=1.23, a ^=y -b ^x =5-1.23×4=0.08,∴回归直线方程为y ^=b ^x +a ^=1.23x +0.08.(2)当x =10时,y ^=1.23×10+0.08=12.38(万元),估计当使用10年时的维修费用为12.38万元.点评:由于本节课题目计算量大,公式较多,所以在求解时易出现公式乱用,数据出错等问题,对这一点,同学们在解题时尤为需要注意.【变练演编】例2其中x 为高一数学成绩,y 为高二数学成绩. (1)y 与x 是否具有线性相关关系;(2)如果y 与x 具有线性相关关系,求线性回归方程.思路分析:先根据数据计算相关系数,然后根据相关系数的大小,判断两个变量是否线性相关.解:(1)由已知表格中的数据,利用计算器进行计算得x =71,y=72.3,∑i =110x i y i =51 467,∑i =110x 2i =50 520,∑i =110y 2i =52 541,r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑j =1n(y j-y )2≈0.785 3>0.75,故两个变量有很强的线性相关关系.(2)y 与x 具有线性相关关系,可设线性回归方程为y ^=a ^+b ^x ,则b ^=∑i =110(x i -x )(y i -y )∑i =110(x i -x )2≈1.22,a ^=y -b ^ x =72.3-1.22×71=-14.32,所以y 关于x 的线性回归方程为y ^=1.22x -14.32.点评:本题通过计算相关系数,将两个变量相关性的判断转化为数据大小的比较.变式:在确定上题中y 与x 的线性相关关系中,是否还有别的方法?若有,请加以说明. 活动设计:学生分组讨论,回顾课本解答问题. 活动成果:还可以通过画散点图的方法来判断两个变量是否具有相关性.如选取x 的值作为自变量,y 的值作为因变量,画出散点图.由图可知两个变量有线性相关性,求其回归直线方程是有实际意义的. 设计意图:进一步熟悉判断变量线性相关的各种方法. 【达标检测】1.对于回归分析,下列说法错误的是( )A .在回归分析中,两个变量的关系若是非确定关系,那么其中一个变量不能由另一个变量唯一确定B .回归系数可以是正的,也可以是负的C .回归分析中,如果r 2=1或r =±1,说明变量x 与变量y 之间完全线性相关D .相关样本系数r ∈(-1,1)2.下列各组变量之间具有线性相关关系的是( )A .出租车费与行使的里程B .学习成绩与学生身高C .身高与体重D .铁的体积与质量3.若劳动生产率x(千元)与月工资y(元)之间的回归直线方程为y ^=50+80x ,则下列判断正确的是( )A .劳动生产率为1 000元时,月工资为130元B .劳动生产率提高1 000元时,月工资平均提高80元C .劳动生产率提高1 000元时,月工资平均提高130元D .月工资为210元时,劳动生产率为2 000元 答案:1.D 2.C 3.B 课堂小结(给学生1~2分钟的时间默写本节的主要基础知识、方法、例题、题目类型、解题规律等;然后用精炼的、准确的语言概括本节的知识脉络、思想方法、解题规律)1.知识收获:进一步学习回归分析的基本思想以及求回归直线方程的步骤,正确认识随机误差e 的产生原因、了解线性回归模型与函数的不同之处.2.方法收获:线性回归方程的求法、用样本估计总体的统计思想.3.思维收获:体会模型诊断的思想,提高利用回归方法解决实际问题的能力,培养探索和创新的精神.设计意图:让学生自己小结,这是一个多维整合的过程,是一个高层次的自我认识过程. 补充练习 【基础练习】1.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图2.由这两个散点图可以判断( )图1 图2A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关 2.实验测得四组(x ,y)的值是(1,2),(2,3),(3,4),(4,5),则y 对x 的回归直线方程是( )A.y ^ =x +1B.y ^ =x +2C.y ^ =2x +1D.y ^=x -1 3.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是( )A.y ^=1.23x +4 B.y ^=1.23x +5C.y ^=1.23x +0.08 D.y ^=0.08x +1.234.若已知∑i =1n(x i -x )2是∑i =1n(y i -y )2的2倍,∑i =1n(x i -x )(y i -y )是∑i =1n(y i -y )2的1.2倍,则相关系数r =____________.答案:1.C 2.A 3.C 4.325【拓展练习】(1)对变量y 与x 进行相关性检验;(2)如果y 与x 之间具有线性相关关系,求线性回归方程; (3)如果父亲的身高为73英寸,估计儿子的身高.解:(1)x =66.8,y =67.01,∑i =110x 2i =44 794,∑i =110y 2i =44 941.93,x y =4 476.27,x 2=4 462.24,y 2=4 490.34,∑i =110x i y i =44 842.4.所以r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑j =1n(y j -y )2≈0.980 2>0.75.所以y 与x 之间具有线性相关关系.(2)设线性回归方程为y ^=b ^x +a ^.计算得b ^≈0.464 5,a ^=y -b ^x =67.01-0.464 5×66.8≈35.98.故所求的线性回归方程为y ^=0.464 5x +35.98.(3)当x =73时,y ^=0.464 5×73+35.98≈69.9,所以当父亲身高为73英寸时,估计儿子的身高约为69.9英寸.设计说明本设计通过不断提出问题,研究问题,解决问题,使学生在不断探索中体会发现与成功的快乐.本节课主要通过具体的实际例子,体会线性回归思想在处理实际问题中的应用,既是对必修3相关内容的延伸,更是对必修3相关内容的复习,通过解决具体实际案例,让学生掌握判断变量是否线性相关的方法和求线性回归方程的具体步骤.通过本节课的学习培养学生对数据的处理能力和应用数学解决实际问题的数学意识,同时在问题解决的过程中,让学生体会与他人合作的重要性.备课资料 1.在Excel 软件中做散点图的步骤如下:(1)进入Excel 软件操作界面,在A1,B1分别输入“身高”和“体重”,在A ,B 列输入相应的数据.(2)选中数据后点击“图表向导”图标,进入“图表类型”对话框,选择“标准类型”中的“XY 散点图”,单击“下一步”.(3)在“图表向导”中的“图表数据源”对话框中,选择“系列”选项,单击“添加”按钮添加“系列1”,在“X 值”栏中输入身高所在数据区域,在“Y 值”栏中输入体重所在数据区域,单击“下一步”.(4)进入“图表向导”中的“图表选项”对话框,对图表的一些属性进行设置. (5)单击“完成”按钮.(设计者:杨雪峰)。
【优课】高中数学选修2-3课件:3.1.3《可线性化的回归分析》 (共30张PPT)
由散点图也可以看出y与t呈近似的线性相关关系,列表如下:
序号
ti
yi
tiyi
t2i
y2i14ຫໍສະໝຸດ 16 6416256
2
2 12 24
4
144
3
1
5
5
1
25
4
0.5 2
1
0.25
4
5
0.25 1 0.25 0.062 5
1
∑ 7.75 36 94.25 21.312 5 430
∴ t =1.55, y =7.2.
思考交流
b
3. 倒指数曲线:y ae x
(a 0,b 0)
(a 0,b 0)
作怎样的变换,得到线形函数的方程如何??
4. 对数曲线:y a b ln x
b0
b0
作怎样的变换,得到线形函数的方程如何??
总结:
曲线方程 曲线图形
变换公 变换后的
式
线性函数
y=axb
c=ln a u=c+bv
bˆx
aˆ
相应的直线叫做回归直线。
2)对两个变量进行的线性分析叫做线性回归分析。
n
n
y bˆ
(xi
i1 n
x)( yi y) (xi x)2
xi
nx y
i
i1
n
xi2
n
2
x
,
i1
i1
aˆ y bˆx
a, b 的意义是:以a为基数,x每增加1个单位,
v=ln x
u=ln y
曲线方 程
曲线图形
3.2 回归分析 学案(人教B版高中数学选修2-3)
3.2 回归分析学案(人教B版高中数学选修2-3)3.2回归分析回归分析学习目标1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度知识点一回归分析及回归直线方程思考1什么叫回归分析答案回归分析是对具有相关关系的两个变量进行统计分析的一种方法思考2回归分析中,利用回归直线方程求出的函数值一定是真实值吗答案不一定是真实值,利用回归直线方程求的值,在很多时候是个预测值梳理1回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法若两个变量之间具有线性相关关系,则称相应的回归分析为线性回归分析2回归直线方程为ybxa,且bi1nxixyiyi1nxix2,aybx,其中x1ni1nxi,y1ni1nyi,x,y称为样本点的中心,回归直线一定过样本点的中心知识点二相关系数1对于变量x与Y随机抽到的n对数据x1,y1,x2,y2,,xn,yn,检验统计量是样本相关系数rni1xixyiyni1xix2ni1yiy2ni1xiyinxyni1x2inx2ni1y2iny2.2相关系数r的取值范围是1,1,|r|越接近1,变量之间的线性相关程度越强;|r|越接近0,变量之间的线性相关程度越弱当|r|r0.05时,表明有95的把握认为两个变量之间具有线性相关关系1求回归直线方程前可以不进行相关性检验2利用回归直线方程求出的值是准确值类型一回归直线方程例1若从某大学中随机选取8名女大学生,其身高和体重数据如下表所示编号_________12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据女大学生的身高预测体重的回归直线方程,并预测一名身高为172cm的女大学生的体重考点线性回归分析题点回归直线的应用解1画散点图选取身高为自变量x,体重为因变量y,画出散点图,展示两个变量之间的关系,并判断二者是否具有线性关系由散点图可以发现,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用回归直线方程ybxa 来近似刻画它们之间的关系2建立回归方程由计算器可得b0.848,a85.632.于是得到回归直线方程为y0.848x85.632.3预测和决策当x172时,y0.84817285.63260.224kg即一名身高为172cm的女大学生的体重预测值为60.224kg.反思与感悟在使用回归直线方程进行预测时要注意1回归直线方程只适用于我们所研究的样本的总体2我们所建立的回归直线方程一般都有时间性3样本取值的范围会影响回归直线方程的适用范围4不能期望回归直线方程得到的预测值就是因变量的精确值跟踪训练1假设关于某设备的使用年限x年和所支出的维修费用y万元有如下的统计数据x23456y2.23.85.56.57.0由此资料可知y对x呈线性相关关系1求回归直线方程;2求使用年限为10年时,该设备的维修费用为多少考点回归直线方程题点求回归直线方程解1由题干表中的数据可得x4,y5,i15x2i90,i15xiyi112.3,bi15xiyi5xyi15x2i5x2112.3545905421.23,aybx51.2340.08.回归直线方程为y1.23x0.08.2当x10时,y1.23100.0812.38.即使用年限为10年时,该设备的维修费用约为12.38万元类型二相关性检验例2维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度xg/L 去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据甲醛浓度g/L18202224262830缩醛化度克分子26.8628.3528.7528.8729.7530.0030.361画散点图;2求回归直线方程;3求相关系数r,并进行相关性检验考点线性相关系数题点线性相关系数的概念及计算解1散点图如图2可以看出,两变量之间有近似的线性相关关系,下面用列表的方法计算a,b.ixiyix2ixiyi11826.86324483.4822028.3540056732228.75484632.542428.87576692.8852629.75676773.562830.0078484073030.36900910.80168202.9441444900.16x168724,y202.947,b7i1xiyi7xy7i1x2i7x24900.16724202.947414472420.2643,aybx202.9470.26432422.648,回归直线方程为y22.6480.2643x.37i1y2i5892,r7i1xiyi7xy7i1x2i7x27i1y2i7y24900.16724202.94741447242589 27202.94720.96.r0.96r0.050.754.有95的把握认为“甲醛浓度与缩醛化度有线性相关关系”,求得的回归直线方程有意义反思与感悟根据已知数据求得回归直线方程后,可以利用相关系数和临界值r0.05比较,进行相关性检验跟踪训练2为了研究3月下旬的平均气温x与4月20日前棉花害虫化蛹高峰日y的关系,某地区观察了xx年至xx年的情况,得到了下面的数据年份xxxxxxxxxxxxx24.429.632.930.328.9y日196110181对变量x,y进行相关性检验;2据气象预测,该地区在xx年3月下旬平均气温为27,试估计xx年4月化蛹高峰日为哪天考点线性相关系数题点线性相关系数的概念及计算解由已知条件可得下表i123456xi24.429.632.928.730.328.9yi19611018x29.13,y7.5,i16x2i5130.92,i16y2i563,i16xiyi1222.61ri16xiyi6xyi16x2i6x2i16y2i6y20.9341.查表知r0.050.811.由|r|r0.05可知,变量y和x存在线性相关关系2b1222.6629.137.55129.1322.23,aybx72.46.所以回归直线方程为y2.23x72.46.当x27时,y2.232772.4612.据此,可估计该地区xx年4月12日为化蛹高峰日.1某商品销售量y件与销售价格x元/件呈负相关,则其回归直线方程可能是A.y10x200B.y10x200C.y10x200D.y10x200考点题点答案A解析由于销售量y与销售价格x成负相关,故排除B,D.又当x10时,A中y100,而C中y300,C不符合题意,故选A.2下表是x和y之间的一组数据,则y关于x的回归直线必过x1234y1357A.点2,3B点1.5,4C点2.5,4D点2.5,5考点回归直线方程题点样本点中心的应用答案C解析回归直线必过样本点中心x,y,即2.5,43对变量y和x进行相关性检验,已知n为数据的对数,r是相关系数,且已知n3,r0.9950;n7,r0.9533;n15,r0.3012;n17,r0.4991.则变量y和x具有线性相关关系的是A和B和C和D和考点线性相关系数题点线性相关系数的应用答案C解析当n3时,r0.050.997,所以|r|r0.05,表明有95的把握认为x与y之间具有线性相关关系;当n15时,r0.050.514,所以|r|r0.05,表明有95的把握认为x与y之间具有线性相关关系,所以和满足题意,故选C.4某产品在某零售摊位的零售价x单位元与每天的销售量y 单位个的统计资料如下表所示x16171819y50344131由上表可得回归直线方程ybxa中的b5,据此模型预测当零售价为14.5元时,每天的销售量为A51个B50个C54个D48个考点线性回归分析题点回归直线方程的应用答案C解析由题意知x17.5,y39,代入回归直线方程得a126.5,126.514.5554,故选C.5已知x,y之间的一组数据如下表x0123y13571分别计算x,y,x1y1x2y2x3y3x4y4,x21x22x23x24;2已知变量x与y线性相关,求出回归直线方程考点回归直线方程题点求回归直线方程解1x012341.5,y135744,x1y1x2y2x3y3x4y40113253734,x21x22x23x240212223214.2b3441.541441.522,aybx421.51,故回归直线方程为y2x1.1对具有线性相关关系的两个变量进行统计分析,可从散点图观察大致呈条状分布,可以求回归直线方程并进行预报2通过求相关系数并和临界值r0.05比较可以判断两个变量是否有线性相关关系,求得的回归直线方程是否有意义.。
高二选修2-3同步导学案:3.1.1_回归分析_1.2_相关系数_1.3_可线性化的回归分析
§1 回归分析 1.1 回归分析 1.2 相关系数 1.3 可线性化的回归分析1.了解回归分析的思想和方法.(重点)2.掌握相关系数的计算和判断线性相关的方法.(重点)3.了解常见的非线性回归模型转化为线性回归模型的方法.(难点)[基础·初探]教材整理1 回归分析阅读教材P 73~P 75,完成下列问题.设变量y 对x 的线性回归方程为y =a +bx ,由最小二乘法知系数的计算公式为:b =l xy l xx=∑i =1ni-xi-y∑i =1ni-x2=∑i =1nx i y i -n xy∑i =1nx 2i -n x 2,a =y -b x .教材整理2 相关系数阅读教材P 76~P 78,完成下列问题. 1.相关系数r 的计算假设两个随机变量的数据分别为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则变量间线性相关系数r =l xy l xx l yy=∑i =1ni-xi-y∑i =1ni-x2∑i =1ni-y2=∑i =1nx i y i -n xy∑i =1nx 2i -nx2∑i =1ny 2i -n y 2.2.相关系数r与线性相关程度的关系 (1)r 的取值范围为[-1,1];(2)|r|值越大,误差Q 越小,变量之间的线性相关程度越高; (3)|r|值越接近0,误差Q 越大,变量之间的线性相关程度越低. 3.相关性的分类(1)当r>0时,两个变量正相关; (2)当r<0时,两个变量负相关; (3)当r =0时,两个变量线性不相关.判断(正确的打“√”,错误的打“×”)(1)两个变量的相关系数r >0,则两个变量正相关.( ) (2)两个变量的相关系数越大,它们的相关程度越强.( ) (3)若两个变量负相关,那么其回归直线的斜率为负.( ) 【答案】 (1)√ (2)× (3)√ 教材整理3 可线性化的回归分析 阅读教材P 79~P 82,完成下列问题. 1.非线性回归分析对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型. 2.非线性回归方程下列数据x ,y 符合哪一种函数模型( )A.y =2+13xB .y =2e xC .y =2e 1xD .y =2+ln x【解析】 分别将x 的值代入解析式判断知满足y =2+ln x. 【答案】 D[质疑·手记]预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流: 疑问1: 解惑: 疑问2: 解惑:[小组合作型](1)对变量i i u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图②.由这两个散点图可以判断( )图311A .变量x 与y 正相关,u 与v 正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关(2)(2016·上饶高二检测)两个变量x,y与其线性相关系数r有下列说法:①若r>0,则x增大时,y也随之相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r =-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上,其中正确的有( ) A.①②B.②③C.①③D.①②③(3)有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和其身体健康情况;④正方形的边长和面积;⑤汽车的重量和百公里耗油量.其中两个变量成正相关的是( ) A.①③B.②④C.②⑤D.④⑤【精彩点拨】可借助于线性相关概念及性质作出判断.【自主解答】(1)由这两个散点图可以判断,变量x与y负相关,u与v正相关,故选C.(2)根据两个变量的相关性与其相关系数r之间的关系知,①③正确,②错误,故选C.(3)其中①③成负相关关系,②⑤成正相关关系,④成函数关系,故选C.【答案】(1)C (2)C (3)C1.线性相关系数是从数值上来判断变量间的线性相关程度,是定量的方法.与散点图相比较,线性相关系数要精细得多,需要注意的是线性相关系数r的绝对值小,只是说明线性相关程度低,但不一定不相关,可能是非线性相关.2.利用相关系数r来检验线性相关显著性水平时,通常与0.75作比较,若r>0.75,则线性相关较为显著,否则为不显著.[再练一题]1.下列两变量中具有相关关系的是( )【导学号:62690052】A.正方体的体积与边长B.人的身高与体重C.匀速行驶车辆的行驶距离与时间D.球的半径与体积【解析】 选项A 中正方体的体积为边长的立方,有固定的函数关系;选项C 中匀速行驶车辆的行驶距离与时间成正比,也是函数关系;选项D 中球的体积是43π与半径的立方相乘,有固定函数关系.只有选项B 中人的身高与体重具有相关关系.【答案】 B)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:(1)(2)气象部门预测下个月的平均气温约为6 ℃,据此估计该商场下个月毛衣的销售量. 【精彩点拨】 (1)可利用公式求解; (2)把月平均气温代入回归方程求解.【自主解答】 (1)由散点图易判断y 与x 具有线性相关关系. x =(17+13+8+2)÷4=10, y =(24+33+40+55)÷4=38,∑4i =1x i y i =17×24+13×33+8×40+2×55=1 267,∑4i =1x 2i =526,b =∑4i =1x i y i -4x y ∑4i =1x 2i -4x2=1 267-4×10×38526-4×102≈-2.01,a =y -b x ≈38-(-2.01)×10=58.1,所以线性回归方程为y =-2.0x +58.1.(2)气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月毛衣的销售量为y =-2.0 x +58.1=-2.0×6+58.1≈46(件).1.回归分析是定义在具有相关关系的两个变量基础上的,因此,在作回归分析时,要先判断这两个变量是否相关,利用散点图可直观地判断两个变量是否相关.2.利用回归直线,我们可以进行预测.若回归直线方程y =a +bx ,则x =x 0处的估计值为y 0=a +bx 0. 3.线性回归方程中的截距a 和斜率b 都是通过样本估计而得到的,存在着误差,这种误差可能导致预报结果的偏差,所以由线性回归方程给出的是一个预报值而非精确值.4.回归直线必过样本点的中心点.[再练一题]2.某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y =bx +a ; (3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力. 【解】 (1)如图:(2) ∑ 4i =1x i y i =6×2+8×3+10×5+12×6=158,x =6+8+10+124=9,y =2+3+5+64=4,∑ 4i =1x 2i =62+82+102+122=344,b =158-4×9×4344-4×92=1420=0.7, a =y -b x =4-0.7×9=-2.3, 故线性回归方程为y =0.7x -2.3.(3)由(2)中线性回归方程得当x =9时,y =0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.[探究共研型]探究1 【提示】 非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:探究2 已知x 和y 之间的一组数据,则下列四个函数中,模拟效果最好的为哪一个?①y =3×2x -1;2③y =4x;④y =x 2.【提示】 观察散点图中样本点的分布规律可判断样本点分布在曲线y =3×2x -1附近.所以模拟效果最好的为①.某地区不同身高的未成年男性的体重平均值如下表:(1)(2)如果一名在校男生身高为168 cm ,预测他的体重约为多少?【精彩点拨】 先由散点图确定相应的拟合模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.【自主解答】 (1)根据表中的数据画出散点图,如下:由图看出,这些点分布在某条指数型函数曲线y =c 1ec 2x的周围,于是令z =ln y ,列表如下:由表中数据可求得z 与x 之间的回归直线方程为z ^=0.693+0.020x ,则有y =e 0.693+0.020x. (2)由(1)知,当x =168时,y =e 0.693+0.020×168≈57.57,所以在校男生身高为168 cm ,预测他的体重约为57.57 kg.两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y =c 1ec 2x,我们可以通过对数变换把指数关系变为线性关系,令z =ln y ,则变换后样本点应该分布在直线z =bx +=ln c 1,b =c 2的周围.[再练一题]3.在一次抽样调查中测得样本的5个样本点,数据如下表:试建立y 【解】 作出变量y 与x 之间的散点图如图所示.由图可知变量y 与x 近似地呈反比例函数关系.设y =k x ,令t =1x,则y =kt.由y 与x 的数据表可得y 与t 的数据表:作出y 与t由图可知y 与t 呈近似的线性相关关系.又t =1.55,y =7.2,∑i =15t i y i =94.25,∑i =15t 2i =21.312 5,b =∑i =15t i y i -5ty ∑i =15t2i -5t 2=94.25-5×1.55×7.221.312 5-5×1.552≈4.134 4,a =y -b t =7.2-4.134 4×1.55≈0.8, ∴y =4.134 4t +0.8.所以y 与x 的回归方程是y =4.134 4x+0.8.[构建·体系]1.下列结论正确的是( )①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A .①②B .①②③C .①②④D .①②③④【解析】 函数关系和相关关系的区别是前者是确定性关系,后者是非确定性关系,故①②正确;回归分析是对具有相关关系的两个变量进行统计分析的一种方法,故③错误,④正确.【答案】 C2.下表是x 和y 之间的一组数据,则y 关于x 的线性回归方程必过点( )A.(2,3) C .(2.5,4)D .(2.5,5)【解析】 线性回归方程必过样本点的中心(x ,y ), 即(2.5,4),故选C. 【答案】 C3.对具有线性相关关系的变量x 和y ,由测得的一组数据求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.【导学号:62690053】【解析】 由题意知x =2,y =3,b =6.5,所以a =y -b x =3-6.5×2=-10,即回归直线的方程为y =-10+6.5x.【答案】 y =-10+6.5x4.部门所属的10个工业企业生产性固定资产价值与工业增加值资料如下表(单位:百万元):【解析】 x =3+3+5+6+6+7+8+9+9+1010=6.6.y =15+17+25+28+30+36+37+42+40+4510=31.5.∴r =∑ 10i =1i-xi-y∑ 10i =1i-x2∑ 10i =1i-y2=0.991 8.【答案】 0.991 85.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =bx +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解】 (1)x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80,∵b =-20,a =y -b x , ∴a =80+20×8.5=250, ∴回归直线方程为y =-20x +250.(2)设工厂获得的利润为L 元,则L =x(-20x +250)-4(-20x +250)=-20⎝⎛⎭⎪⎫x -3342+361.25,∴该产品的单价应定为334元时,工厂获得的利润最大.我还有这些不足:(1) (2)我的课下提升方案: (1) (2)学业分层测评 (建议用时:45分钟)[学业达标]一、选择题1.为了考查两个变量x 和y 之间的线性相关性,甲、乙两名同学各自独立地做了10次试验和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2.已知两个人在试验中发现对变量x 的观测数据的平均数都为s ,对变量y 的观测数据的平均数都为t ,那么下列说法中正确的是( )A .直线l 1和l 2都过点(s ,t)B .直线l 1和l 2相交,但交点不一定是(s ,t)C .直线l 1和l 2必平行D .直线l 1和l 2必重合【解析】 线性回归方程y =bx +a 恒过点(x ,y ),故直线l 1和l 2都过点(s ,t). 【答案】 A2.已知人的年龄x 与人体脂肪含量的百分数y 的回归方程为y =0.577x -0.448,如果某人36岁,那么这个人的脂肪含量( )A .一定是20.3%B .在20.3%附近的可能性比较大C .无任何参考数据D .以上解释都无道理【解析】 将x =36代入回归方程得y =0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.【答案】 B3.关于回归分析,下列说法错误的是( ) A .回归分析是研究两个具有相关关系的变量的方法 B .线性相关系数可以是正的或负的 C .回归模型中一定存在随机误差 D .散点图表明确反映变量间的关系【解析】 用散点图反映两个变量间的关系时,存在误差,故D 错误. 【答案】 D4.某学校开展研究性学习活动,某同学获得一组实验数据如下表:A .y =2x -2B .y =⎝ ⎛⎭⎪⎫12xC .y =log 2xD .y =12(x 2-1)【解析】 代入检验,当x 取相应的值时,所得y 值与已知数据差的平方和最小的便是拟合程度最高的.【答案】 D5.某产品的广告费用x与销售额y的统计数据如下表:万元时销售额为( ) A.63.6万元B.65.5万元C.67.7万元D.72.0万元【解析】样本点的中心是(3.5,42),则a=y-b x=42-9.4×3.5=9.1,所以回归直线方程是y =9.4x+9.1,把x=6代入得y=65.5.【答案】 B二、填空题6.回归分析是处理变量之间________关系的一种数量统计方法.【导学号:62690054】【解析】回归分析是处理变量之间相关关系的一种数量统计方法.【答案】相关7.已知某个样本点中的变量x,y线性相关,相关系数r<0,则在以(x,y)为坐标原点的坐标系下的散点图中,大多数的点都落在第________象限.【解析】∵r<0时b<0,∴大多数点落在第二、四象限.【答案】二、四8.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm.【解析】儿子和父亲的身高可列表如下:设线性回归方程y=a+bx,由表中的三组数据可求得b=1,故a=y-b x=176-173=3,故线性回归方程为y=3+x,将x=182代入得孙子的身高为185 cm.【答案】185三、解答题9.(2016·包头高二检测)关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:如由资料可知y对x(1)线性回归方程:⎝ ⎛⎭⎪⎪⎫a =y -b x -,b =∑i =1nx i y i -n x -y -∑i =1nx 2i-x 2(2)估计使用年限为10年时,维修费用是多少? 【解】 (1)x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+7.05=5,∑i =15x 2i=90,∑i =15x i y i =112.3,b =∑i =15x i y i -5x-y-∑i =15x 2i -5x 2=112.3-5×4×590-5×42=1.23. 于是a =y -bx =5-1.23×4=0.08. 所以线性回归方程为y =1.23x +0.08.(2)当x =10时,y =1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用是12.38万元.10.某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表.【解】 画出散点图如图所示.x =16(26+18+13+10+4-1)≈11.7,y =16(20+24+34+38+50+64)≈38.3,∑i =16xx i y i =26×20+18×24+13×34+10×38+4×50-1×64=1 910,∑i =16xx 2i =262+182+132+102+42+(-1)2=1 286, ∑i =16xy 2i =202+242+342+382+502+642=10 172,由r =∑ hi =1x i y i -n x y ∑ ni =1x 2i-n x 2∑ ni =1y 2i-n y 2,可得r ≈0.97.由于r 的值较大,所以x 与y 具有很强的线性相关关系.[能力提升]1.经统计,用于数学学习的时间(单位:小时)与成绩(单位:分)近似于线性相关关系.对某小组学生每周用于数学的学习时间x 与数学成绩y 进行数据收集如表:100的位置关系是( ) A .a +18b <100 B .a +18b >100 C .a +18b =100D .a +18b 与100的大小无法确定【解析】 x =15(15+16+18+19+22)=18,y =15(102+98+115+115+120)=110,所以样本数据的中心点为(18,110), 所以110=18b +a ,即点(a ,b)满足a +18b =110>100. 【答案】 B2.已知x 与y 之间的几组数据如下表:(1,0)和(2,2)求得的直线方程为y =b′x+a′,则以下结论正确的是( )A .b>b′,a>a′B .b>b′,a<a′C .b<b′,a>a′D .b<b′,a<a′【解析】 由(1,0),(2,2)求b′,a′. b′=2-02-1=2,a′=0-2×1=-2. 求b ,a 时,∑i =16x i y i =0+4+3+12+15+24=58,x =3.5,y =136,∑i =16x 2i =1+4+9+16+25+36=91, ∴b =58-6×3.5×13691-6×3.52=57, a =136-57×3.5=136-52=-13,∴b<b′,a>a′. 【答案】 C3.(2016·江西吉安高二检测)已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且线性回归方程为y =0.95x +2.6,那么表格中的数据m 的值为________.【解析】 x =0+1+3+44=2,y =4=4,把(x -,y -)代入回归方程得11.3+m 4=0.95×2+2.6,解得m =6.7.【答案】 6.74.某商店各个时期的商品流通率y(%)和商品零售额x(万元)资料如下:散点图显示出x 与y 的变动关系为一条递减的曲线.经济理论和实际经验都证明,流通率y 决定于商品的零售额x ,体现着经营规模效益,假定它们之间存在关系式:y =a +bx .试根据上表数据,求出a 与b 的估计值,并估计商品零售额为30万元时的商品流通率.【解】 设u =1x,则y≈a+bu ,得下表数据:进而可得n =10,u ≈0.060 4,y =3.21,∑i =110uu 2i -10u 2≈0.004 557 3, ∑i =110u i y i -10u y ≈0.256 35,b≈0.256 350.004 557 3≈56.25, a =y -b·u ≈-0.187 5,所求的回归方程为y =-0.187 5+56.25x.当x =30时,y =1.687 5,即商品零售额为30万元时,商品流通率为1.687 5%.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(一)导案
1.可线性化的回归分析的步骤 用非线性函数拟合两个变量的相关关系,可通过 先将其转化成线性函数,利用最小二乘法得到线性回归方程,再通过相应的变换得到非线性回归方程。
2.常见非线性函数的变换
①幂函数曲线b ax y =作变换 。
得到线性函数bv c u +=
②指数曲线bx e a y ⋅=作变换 。
得到线性函数bx c u += ③倒指数曲线x
b
ae y =作变换 。
得到线性函数bv c u +=
④对数曲线x b a y ln +=作变换 。
得到线性函数bv a u +=
当两个变量之间呈现出非线性的相关性时,你如何求出它们的回归方程?基本步骤是什么?
(二)讲案、
有关非线性函数的变换
例1:已知幂函数曲线b ax y =作线性变换后得到的回归方程为v u 4.02+=,则=a .=b .
已知曲线类型的非线性回归模型
例2: 在某化学试验中,测得如表所示的6组数据,其中x (min )表示化学反应进行的时间,y (mg )表示未转化物质的量。
(1)设y 与x 之间具有关系x cd y =,试根据测量数据估计c 和d 的值;
(2)估计化学反应进行到10min 时未转化物质的量
(三)练案 min x 1 2 3 4 5 6 mg y 39.8 32.2 25.4 20.3 16.2 13.3
1. 指数函数5+=bx ae y 化为线性函数,应用的变量替换是 ,得到的线性函数是
2.在一次试验中当变量x 取值分别为41,31,21,
1时,变量y 的值依次为2, 3, 4.1,4.9,则y 与x 之间的回归曲线方程为 ( ) A.11+=
x y B. 32+=x
y C.12+=x y D. 1-=x y 3.某矿脉中设有13个相邻样本点,现人为地设定一个原点,测得各样本点与原点的距离x ,与该样本点处某种金属的含量y 的数据如下:
请按x
b a y +
=建立y 对x 的回归方程,并预测当样本点对原点的距离为20时该种金属的含量.
(四)小结与作业
1.会用非线性函数描述两个变量具有非线性相关性的变量的变化关系;
2.能把简单的非线性函数变换成线性函数得到线性方程,再还原成两变量间的相关关系,进行回归分析。
2. 一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表
试建立y
与x 之间的回归方程,并预测当温度为C 037时红铃虫的产卵数。
/y 个。