高中数学 3.1回归分析的基本思想及其初步应用第2课时教案 新人教版选修2-3
高中数学 3.1 回归分析的基本思想及其初步应用学案 新人教A版选修2-3(2021年整理)
2016-2017学年高中数学3.1 回归分析的基本思想及其初步应用学案新人教A版选修2-3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2016-2017学年高中数学3.1 回归分析的基本思想及其初步应用学案新人教A版选修2-3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2016-2017学年高中数学3.1 回归分析的基本思想及其初步应用学案新人教A版选修2-3的全部内容。
3.1 回归分析的基本思想及其初步应用1.通过对典型案例的探究,了解回归分析的基本思想、方法及其初步应用.2.会求回归直线方程,并用回归直线方程进行预报.(重点)3.了解最小二乘法的思想方法,理解回归方程与一般函数的区别与联系.(难点)[基础·初探]教材整理1 回归直线方程阅读教材P80~P82探究上面倒数第一行,完成下列问题.1.回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.2.回归直线方程方程错误!=错误!x+错误!是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(x n,y n)的回归方程,其中错误!,错误!是待定参数,其最小二乘估计分别为:错误!其中错误!=错误!错误!i,错误!=错误!错误!i,(错误!,错误!)称为样本点的中心.1.如图3。
1.1四个散点图中,适合用线性回归模型拟合其中两个变量的是________(填序号).图3。
1.1【解析】由图易知,①③两个图中的样本点在一条直线附近,因此适合用线性回归模型拟合.【答案】①③2.若y与x之间的一组数据为则y对x【解析】由表中数据得x=错误!=2,错误!=错误!=4.因回归直线必过样本中心点(x,错误!),所以y与x的回归直线一定经过的点是(2,4).【答案】(2,4)教材整理2 线性回归分析阅读教材P82探究~P89,完成下列问题.1.线性回归模型(1)表达式错误!(2)基本概念:①a和b为模型的未知参数.②e是y与bx+a之间的误差.通常e为随机变量,称为随机误差.③x称为解释变量,y称为预报变量.2.衡量回归方程的预报精度的方法(1)残差平方和法①错误!称为相应于点(x i,y i)的残差.②残差平方和错误!越小,模型的拟合效果越好.(2)残差图法残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型的拟合精度越高.(3)利用相关指数R2刻画回归效果其计算公式为:R2=1-错误!;其几何意义:R2越接近于1,表示回归的效果越好.3.建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).选修2-3|第三章统计案例(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程).(4)按一定规则(如最小二乘法)估计回归方程中的参数.(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等.判断(正确的打“√”,错误的打“×”)(1)求线性回归方程前可以不进行相关性检验.()(2)在残差图中,纵坐标为残差,横坐标可以选为样本编号.()(3)利用线性回归方程求出的值是准确值.()(4)变量x与y之间的回归直线方程表示x与y之间的真实关系形式.( )(5)随机误差也就是残差.( )【解析】(1)×因为如果两个变量之间不具有线性相关关系,就不用求线性回归方程了,求出的回归直线方程当然也不能很好的反映两变量间的关系.(2)√因为由残差图的方法步骤可知,该说法正确.(3)×因为利用线性回归方程求出的值为估计值,而不是真实值.(4)×因为变量x与y之间的线性回归直线方程仅表示x与y之间近似的线性关系,x 与y之间满足y=bx+a+e,其中e为随机误差.(5)×因为随机误差e是真实值y与bx之间的误差,而残差错误!=y-错误!是随机误差e的估计量.【答案】(1)×(2)√(3)×(4)×(5)×[质疑·手记]预习完成后,请将你的疑问记录,并与“小伙伴们"探讨交流:疑问1:解惑:疑问2:解惑:疑问3:解惑:[小组合作型]求线性回归方程(2016·临沂高二检测)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x3456y 2.534 4.5(1)(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方程错误!=错误!x +错误!;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4。
最新人教版高中数学选修2-3《回归分析的基本思想及其初步应用》示范教案(第2课时)
第二课时教学目标知识与技能从相关指数和残差分析角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤.过程与方法在发现直接求回归直线方程存在缺陷的基础上,引导学生去发现解决问题的新思路——进行回归分析,进而介绍残差分析的方法和利用R2来表示解释变量对于预报变量变化的贡献率.情感、态度与价值观通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,掌握处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识解决实际问题的能力.教学中适当地利用学生的合作与交流,使学生在学习的同时,体会与他人合作的重要性.重点难点教学重点:从残差分析、相关指数角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤;教学难点:了解评价回归效果的两个统计量:相关指数、残差和残差平方和.教学过程引入新课上表是上一节课我们从某大学选取8名女大学生其身高和体重数据组成的数据表,在上一节课中我们通过数据建立了回归直线方程,并根据方程预测了身高为172 cm的女大学生的体重.当时,我们提到根据回归直线方程求得的体重数据,仅是一个估计值,其与真实值之间存在着误差,为了综合分析身高和体重的关系,我们引入了线性回归模型y=bx+a+e 来表示两变量之间的关系,其中e为随机变量,又称随机误差.线性回归模型y=bx+a+e 增加了随机误差项e,因变量y的值由自变量x和随机误差e共同确定.假设随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图中所有的点将完全落在回归直线上.但是,在图中,数据点并没有完全落在回归直线上.这些点散布在回归直线附近,所以一定是随机误差把这些点从回归直线上“推”开了,即自变量x只能解释部分y的变化.同学们考虑一下,随机变量e的均值是多少?方差又是多少?活动设计:学生思考回答问题.学情预测:学生回答E(e)=0,D(e)=σ2>0.教师提问:能否通过D(e)来刻画线性回归模型的拟合程度?学情预测:随机误差e的方差越小,通过回归直线预报真实值y的精度越高.随机误差是引起预报值与真实值y之间的误差的原因之一,其大小取决于随机误差的方差.设计意图:说明研究随机误差e的必要性,通过研究随机误差e可以分析预报值的可信度.提出问题:既然可以用随机变量e的方差来衡量随机误差的大小,即通过方差σ2来刻画预报变量(体重)的变化在多大程度上与随机误差有关,那么如何获得方差σ2呢?学生活动:学生独立思考,小组合作交流讨论.活动结果:可以采用抽样统计的思想,通过随机变量e的样本来估计σ2的大小.设计目的:复习抽样统计思想,以便通过随机变量e 的样本来估计总体. 探究新知提出问题:既然e 表示了除解释变量以外其他各种影响预报值的因素带来的误差,那么如何获得e 的样本来计算σ2呢?学生活动:分组合作讨论交流.学情预测:由函数模型y ^=b ^x +a ^和回归模型y =bx +a +e 可知e =y -y ^,这样根据图表中女大学生的身高求出预报值,再与真实值作差,即可求得e 的一个估计值.教师:由于在计算回归直线方程时,利用公式求得的b ^和a ^为斜率和截距的估计值,它们与真实值a 和b 之间存在误差,因此y ^是估计值,所以e ^=y -y ^也是一个估计值.由上可知,对于样本点(x 1,y 1),(x 2,y 2),…,(x n ,y n )而言,它们的随机误差为e i =y i -bx i -a ,i =1,2,…n ,称其估计值e ^i =y i -y ^i 为相应于点(x i ,y i )的残差.将所有残差的平方加起来,即∑i =1ne ^2i ,这个和称作残差平方和.类比样本方差估计总体方差的思想,可以用σ^2=1n -2∑i =1n e ^ 2i =1n -2∑i =1n(y i -y ^i )2(n>2) 作为σ2的估计量,通常,σ^2越小,预报精度越高.这样,当我们求得回归直线方程后,可以通过残差来判断模型拟合程度的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析.设计目的:通过问题诱思,引入残差概念. 理解新知提出问题:对照女大学生的身高和体重的原始数据,结合求出的回归直线方程,求出相应的残差数据.学生活动:独立完成.样的散点图称作残差图).学生活动:分组合作,共同完成. 活动结果:残差图提出问题:观察上面的残差图,你认为哪几个样本点在采集时可能存在人为的错误?为什么?学生活动:分组讨论. 活动结果:第一个和第六个样本点在采集过程中可能存在错误,因为其他的样本点基本都集中在一个区域内,只有这两个样本点的残差比较大,相对其他样本点来说,分布得较为分散.提出问题:如何从残差图来判断模型的拟合程度? 学生活动:独立思考也可相互讨论.活动结果:因为σ^2越小,预报精度越高,即模型的拟合程度越高,而σ^2越小,e ^的取值越集中,故若残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适,且带状区域的宽度越窄,说明拟合精度越高,回归直线的预报精度越高.教师:在统计学上,人们经常用相关指数R 2来刻画回归的效果,其计算公式是:R 2=1-∑i =1n(y i -y ^i )2∑i =1n(y i -y )2提出问题:分析上面计算相关指数R 2的公式,如何根据R 2来判断模型的拟合效果? 学生活动:独立思考也可相互讨论,教师加以适当的引导提示.活动结果:因为对于确定的样本数据而言,∑i =1n(y i -y )2是一个定值,故R 2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.提出问题:在线性回归模型中,R 2表示解释变量对于预报变量变化的贡献率,R 2越接近1,表示回归的效果越好,即解释变量和预报变量的线性相关性越强,试计算关于女大学生身高与体重问题中的相关指数R 2.学生活动:学生独立计算获得数据. 活动结果:R 2≈0.64.根据R 2≈0.64就可得出“女大学生的身高解释了64%的体重变化”,或者说“女大学生的体重差异有64%是由身高引起的”.由此就不难理解为什么预报体重和真实值之间有差距了.设计目的:结合图象,让学生直观感受残差图在刻画回归模型拟合效果方面的应用,体会残差分析和相关指数的意义.提出问题:根据前面得到的回归方程,能否预测一名美国女大学生的体重?建立回归模型后能否一劳永逸,在若干年后还可以使用,或者适用于多年以前的女大学生体重预测?学生活动:讨论交流总结发言.活动结果:在使用回归方程进行预报时要注意: (1)回归方程只适用于我们所研究的样本的总体; (2)我们建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预报值就是预报变量的精确值.提出问题:结合我们刚学习的概念,现在能否将建立回归模型的步骤补充完整? 学生活动:讨论交流,合作完成.活动结果:一般地,建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程). (4)按一定规则(如最小二乘法)估计回归方程中的参数.(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,或残差呈现不随机的规律性,等等).若存在异常,则检查数据是否有误,或模型是否合适等.设计意图:设计问题,让学生讨论分析,得出使用回归方程进行预报需注意的问题,并让学生完善建立回归模型的步骤.在这个过程中,教师不宜做太多引导,要放手给学生,让学生讨论,充分参与进来.运用新知例1一个车间为了规定工时定额,需确定加工零件所花费的时间,为此进行了10次试(1)建立零件数为解释变量,加工时间为预报变量的回归模型,并计算残差; (2)你认为这个模型能较好地刻画零件数和加工时间的关系吗? 分析:首先根据散点图粗略判断变量是否具有线性相关性,判断是否可以用线性回归模型来拟合数据,然后通过残差e ^1,e ^2,…,e ^n 来判断模型拟合的效果,判断原始数据是否存在可疑数据.解:(1)根据表中数据作出散点图如下:散点图由散点图可知变量之间具有线性相关关系,可以通过求线性回归方程来拟合数据.根据公式可求得加工时间对零件数的线性回归方程为y ^=0.668x +54.96.残差数据如下表:残差图由图可知,残差点分布较均匀,即用上述回归模型拟合数据效果很好,但需注意,由残差图也可以看出,第4个样本点和第5个样本点残差较大,需要确认在采集这两个样本点的过程中是否有人为的错误.点评:由散点图判断两个变量的线性相关关系,误差较大,利用残差图可以较好地评价模型的拟合程度,并能发现样本点中的可疑数据.【变练演编】例2求出y 对x 的回归方程,并说明拟合效果的好坏.思路分析:先根据散点图判断两个变量是否线性相关,若相关,求出回归直线方程,然后通过相关指数的大小来评价拟合效果的好坏.解:作出散点图:从作出的散点图可以看出,这些点在一条直线附近,可用线性回归模型来拟合数据.由数据可得x =18,y =45.4,由计算公式得b ^=-2.35,a ^=y -b ^x =87.7.故y 对x 的回归方程为y ^=-2.35x +87.7,列表:所以∑i =15(y i -y ^i )2=8.3,∑i =15(y i -y )2=229.2.相关指数R 2=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2≈0.946.因为0.964很接近1,所以该模型的拟合效果很好.变式1:若要分析是否在上述样本的采集过程中存在可疑数据,应如何分析? 活动设计:学生分组讨论,回顾课本解答问题. 活动成果:可以画出残差图来进行分析.变式2:既然利用残差图和相关指数都能够评价回归模型的拟合效果,能否总结一下两种方法各自的特点?活动成果:利用残差图可以直观展示拟合的效果,而且还可以发现样本数据中的可疑数据;而相关指数是把对拟合效果的评价转换为数值大小的判断,易于量化处理,并能在数量上表现解释变量对于预报变量变化的贡献率.设计意图:进一步熟悉判断拟合效果的方法以及各自的特点. 【达标检测】1.分析下列残差图,所选用的回归模型效果最好的是()ABC D 2.下列说法正确的是( )①回归直线方程适用于一切样本和总体;②回归直线方程一般都有时间性;③样本的取值范围会影响回归直线方程的适用范围;④根据回归直线方程得到的预测值是预测变量的精确值.A .①③④B .②③C .①②D .③④3.在研究气温和热茶销售杯数的关系时,若求得相关指数R 2≈__________,表明“气温解释了85%的热茶销售杯数变化”或者说“热茶销售杯数差异有85%是由气温引起的”.答案:1.D 2.B 3.0.85.课堂小结学生回顾本节课学习的内容,尝试总结,然后不充分的地方由学生相互补充,最后在老师的引导下,用精炼的语言进行概括:1.判断变量是否线性相关的方法以及各自的特点; 2.在运用回归模型时需注意的事项; 3.建立回归模型的基本步骤. 设计意图:让学生自己小结,这是一个多维整合的过程,是一个高层次的自我认识过程. 补充练习 【基础练习】1.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适.②用相关指数R 2来刻画回归的效果,R 2值越接近于1,说明模型的拟合效果越好.③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.正确的是( )A .①②B .②③C .①③D .①②③2.甲、乙、丙、丁四位同学各自对A ,B 两变量做回归分析,分别得到散点图与残差平方和∑i =1n(y i -y ^i )2如下表115106124103哪位同学的实验结果体现拟合A ,B 两变量关系的模型拟合精度高?( ) A .甲 B .乙 C .丙D .丁 3.关于x 与y 为了对x ,y 两个变量进行统计分析,现有以下两种线性模型:甲:y ^=6.6x +17.5,乙:y ^=7x +17.试比较哪一个模型拟合效果更好.答案或提示:1.D 2.D3.解析:设甲模型的相关指数为R 21,则R 21=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2=1-1551 000=0.845;设乙模型的相关指数为R 22,则可求得R 22=0.82,因为R 21>R 22,所以甲模型的拟合效果更好.【拓展练习】 4.假设某种农作物基本苗数x 与有效穗数y 之间存在相关关系,今测得5组数据如下:(1)以x 为解释变量,y 为预报变量,作出散点图;(2)求y 与x 之间的回归方程,对于基本苗数56.7预报有效穗数. (3)计算各组残差;(4)求R 2,并说明随机误差对有效穗数的影响占百分之几? 解:(1)散点图如图:(2)由图可以看出,样本点呈条状分布,有比较好的线性相关关系,因此可用线性回归方程来建立两个变量之间的关系.设线性回归方程为y ^=b ^x +a ^,由数据可以求得:b ^≈0.291,a ^=y -b ^x =34.67.故所求的线性回归方程为y ^=0.291x +34.67.当x =56.7时,y ^=0.291×56.7+34.67=51.169 7. 估计有效穗数为51.169 7.(3)各组数据的残差分别是e ^1≈0.37,e ^2≈0.72,e ^3≈-0.5,e ^4≈-2.22,e ^5≈1.61. (4)残差平方和:∑i =15(y i -y ^i )2=8.425 8,又∑i =15(y i -y )2=50.18,∴R 2=1-∑i =15(y i -y ^i )2∑i =15 (y i -y )2=1-8.425 850.18≈0.832.即解释变量(农作物基本苗数)对有效穗数的影响约占了83.2%,所以随机误差对有效穗数的影响约占1-83.2%=16.8%.设计说明 本课时从上一节课的案例出发,通过分析随机误差产生的原因,引入随机变量、残差、残差平方和、相关指数的有关概念,从相关指数和残差分析等角度探讨回归模型拟合的效果,并通过案例说明利用所建立的回归模型进行预报时需要注意的问题,然后总结建立回归模型的基本步骤.在教学过程中以问题为引导思考的动机,注重对学生合作意识的培养,通过对案例的分析,培养学生对数据的处理能力,让学生初步了解回归分析思想在实际生活中的运用.备课资料有关总偏差平方和、回归平方和、残差平方和以及相关指数等概念的说明 1.总偏差平方和:SST =∑i =1n(y i -y )2,刻画了预报变量y 的变化剧烈程度.2.回归平方和:SSR =∑i =1n(y ^i -y )2,公式中所有预测值的平均值也等于y ,故1n ∑i =1n y ^ i =1n ∑i =1n (b ^x i +a ^ )=b ^ x +a ^ =b ^ x +y -b ^x =y , 因此回归平方和又可以写成.从而回归平方和刻画了估计量y ^=a ^+b ^x 的变化程度.由于估计量由解释变量x 所决定,所以,回归平方和刻画了预报变量的变化中由解释变量通过线性回归模型引起的那一部分的变化程度.3.残差平方和:SSE =∑i =1n(y i -y ^i )2,刻画了残差变量变化的程度.4.偏差平方和分解:即指公式∑i =1n(y i -y )2=∑i =1n(y ^i -y )2+∑i =1n(y i -y ^i )2,称为平方和分解公式,用文字表示为: 总偏差平方和=回归平方和+残差平方和. 公式证明如下:假设观测数据为(x i ,y i ),i =1,2,…,n ,则∑i =1n(y i -y )2=∑i =1n(y i -y ^i +y ^i -y )2=∑i =1n(y i -y )2+∑i =1n(y i -y ^i )2+2∑i =1n(y ^ i -y )(y i -y ^i ).而∑i =1n(y ^ i -y )(y i -y ^i )=∑i =1n(b ^ x i -b ^ x )(y i -a ^ -b ^x i )=∑i =1nb ^(x i -x )[]y i -a ^ -b ^x -b(x i -x )=b ^∑i =1n(x i -x )[](y i -y )-b ^(x i -x )=b ^⎣⎢⎢⎡⎦⎥⎥⎤∑i =1n (x i-x )(y i -y )-b ^ ∑i =1n (x i -x )2=0, 代入上式即可证得平方和分解公式. 这样,可以把平方和分解公式解释为:预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量引起的变化程度之和.由平方和分解公式得1=∑i =1n(y ^i -y )2∑i =1n(y i -y )2+∑i =1n(y i -y ^i )2∑i =1n(y i -y )2这意味着在线性回归模型中,预报变量的1个单位的变化,需要由解释变量贡献∑i =1n(y ^i -y )2∑i =1n(y i -y )2,由残差变量贡献∑i =1n(y i -y ^i )2∑i =1n(y i -y )2,因此在线性回归模型中,我们说预报变量y的变化中的100×∑i =1n(y ^i -y )2∑i =1n(y i -y )2%是由解释变量x 所引起的,或者说解释变量x 可以解释预报变量y 的100×∑i =1n(y ^i -y )2∑i =1n(y i -y )2%的变化.又∑i =1n(y ^i -y )2∑i =1n(y i -y )2=1-∑i =1n(y i -y ^i )2∑i =1n(y i -y )2=R 2,即R 2=∑i =1n(y ^i -y )2∑i =1n(y i -y )2,这说明“预报变量y 的变化中的百分之100R 2是由解释变量x 所引起的,或者说解释变量x 可以解释预报变量y 的百分之100R 2的变化.因此,R 2越大拟合效果越好,反之越小.(设计者:杨雪峰)。
3.1《回归分析的基本思想及其初步应用》教案2(新人教选修2-3)
3.1《回归分析的基本思想及其初步应用》教案2(新人教选修2-3)3.1 回归剖析的基本思想及其初步应用(二)教课要求 :经过典型事例的研究,进一步认识回归剖析的基本思想、方法及初步应用 教课要点 :认识评论回归成效的三个统计量:总偏差平方和、残差平方和、回归平方和 教课难点 :认识评论回归成效的三个统计量:总偏差平方和、残差平方和、回归平方和 教课过程 :一、复习准备 :1.由例 1 知,预告变量(体重)的值受解说变量(身高)或随机偏差的影响....2.为了刻画预告变量(体重)的变化在多大程度上与解说变量(身高)有关?在多大程度上与随机偏差有关?我们引入了评论回归成效的三个统计量:总偏差平方和、残差平方和、回归平方和 .二、讲解新课:1. 教课 总偏差平方和、残差平方和、回归平方和:ny) 2 .(1)总偏差平方和 :全部单个样本值与样本均值差的平方和,即SST( y ii 1nμ 2残差平方和: 回归值与样本值差的平方和,即SSE( y i.i 1y i )n回归平方和: 相应回归值与样本均值差的平方和,即SSRμy) 2( y i.i1(2)学习要领: ①注意 y iμ、 y 的差别;②预告变量的变化程度能够分解为由解说变量、 y innμn惹起的变化程度与残差变量的变化程度之和,即( y i y) 2( y i2μy) 2;y i )( y ii 1i 1i1③当总偏差平方和相对固准时,残差平方和越小, 则回归平方和越大, 此时模型的拟合成效n ( y iμ 22y i )越好;④对于多个不一样的模型,我们还能够引入有关指数1i 1来刻画回归Rni1( y iy) 2的成效,它表示解说变量对预告变量变化的贡献率 . R 2的值越大,说明残差平方和越小,也就是说模型拟合的成效越好 .2. 教课例题: 例 2 对于 x 与 Y 有以下数据:x 24 56 8 y3040605070为了对 x 、 Y 两个变量进行统计剖析,现有以下两种线性模型:$ 6.5 x 17.5 ,y $ y 7 x 17 ,试比较哪一个模型拟合的成效更好. 剖析: 既可分别求出两种模型下的总偏差平方和、 残差平方和、回归平方和,也可分别求出两种模型下的有关指数,而后再进行比较,进而得出结论.5μ 25μ 2( y i( y i(答案:R 1 1y i )1550.845 , R 2 1y i )180 , 84.5%> 82% ,因此51510.822i 12i1( yy )21000( yy) 21000iii 1i1甲采用的模型拟合成效较好 . )3. 小结: 分清总偏差平方和、残差平方和、回归平方和,初步认识怎样评论两个不一样模型拟合成效的利害 .。
高中新课程数学(新课标人教A版)选修2-3《3.1回归分析的基本思想及其初步应用》教案
3.1回归分析的基本思想及其初步应用(共计4课时) 授课类型:新授课一、教学内容与教学对象分析学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。
二、学习目标1、知识与技能通过本节的学习,了解回归分析的基本思想,会对两个变量进行回归分析,明确建立回归模型的基本步骤,并对具体问题进行回归分析,解决实际应用问题。
2、过程与方法 本节的学习,应该让学生通过实际问题去理解回归分析的必要性,明确回归分析的基本思想,从散点图中点的分布上我们发现直接求回归直线方程存在明显的不足,从中引导学生去发现解决问题的新思路—进行回归分析,进而介绍残差分析的方法和利用R 的平方来表示解释变量对于预报变量变化的贡献率,从中选择较为合理的回归方程,最后是建立回归模型基本步骤。
3、情感、态度与价值观 通过本节课的学习,首先让显示了解回归分析的必要性和回归分析的基本思想,明确回归分析的基本方法和基本步骤,培养我们利用整体的观点和互相联系的观点,来分析问题,进一步加强数学的应用意识,培养学生学好数学、用好数学的信心。
加强与现实生活的联系,以科学的态度评价两个变量的相关系。
教学中适当地增加学生合作与交流的机会,多从实际生活中找出例子,使学生在学习的同时。
体会与他人合作的重要性,理解处理问题的方法与结论的联系,形成实事求是的严谨的治学态度和锲而不舍的求学精神。
培养学生运用所学知识,解决实际问题的能力。
三、教学重点、难点教学重点:熟练掌握回归分析的步骤;各相关指数、建立回归模型的步骤;通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:求回归系数 a , b ;相关指数的计算、残差分析;了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。
高中数学3.1《回归分析基本思想及其初步应用(二)》教案新人教版A选修23
3.1 回归剖析的基本思想及其初步应用(二)一、基本说明1所属模块:高中数学选修 2-32年级:高二年级3 教材第一版单位:人民教育第一版社A4所属的章节:第三章第一节5 学时数:40分钟多媒体教室二、教课方案教课目标:经过典型事例的研究,进一步认识回归剖析的基本思想、方法及初步应用.教课要点:经过研究使学生领会有些非线性模型经过变换能够转变为线性回归模型,认识在解决实质问题的过程中找寻更好的模型的方法 .教课难点:认识常用函数的图象特色,选择不一样的模型建模,并经过比较有关指数对不一样的模型进行比较.教课过程:一、复预引入问题 1:成立回归模型的一般基本步骤是哪五步?问题 2:残差及有关指数R2如何对回归方程拟合程度进行剖析?问题 3:依据例 2 所给的样本数据作散点图,并察看散点图,判断样本数据组( x i , y i ) 拥有线性关系吗?二、讲解新课:例 2、一只红铃虫的产孵数y 和温度 x 有关,现采集了7 组数据列于表3-3 中,温度 x/℃21232527293235产卵数 y/个711212466115325(1)试成立产卵数y 与温度 x 之间的回归方程;并展望温度为28o C 时产卵数量。
(2)你所成立的模型中温度在多大程度上解说了产卵数的变化?设计企图:由散点图,联合线性回归模型的回归剖析的基本步新知识生长点。
(学生描绘步骤,教师演示剖析数据,议论拟合函数模型。
)骤,诱出350300250数200卵产 15010050010203040温度研究 1:剖析散点图,预计样本数据组(x i , y i ) 的回归方程的拟合模型。
1、议论:察看右图中的散点图,发现样本点并无散布在某个带状地区内,即两个变量不呈线性有关关系,所以不可以直接用线性回归模型y=ax+b 来成立两个变量之间的关系 .2、研究非线性回归方程确实定:① 假如散点图中的点散布在一个直线状带形地区,能够选线性回归模型来建模;假如散点图中的点散布在一个曲线状带形地区,就需选择非线性回归模型来建模.y=bx 2+a, 也象某一条指数函数曲线y=C1e C2x ② 依据已有的函数知识,能够发现样本点散布象某一条抛物线(此中 c1 ,c2是待定的参数),故可考虑用以上两个模型来拟合两个变量.③抛物型:将 y=bx 2+a 进行平方变换:令 t=x 2,产卵数 y 和温度 x 之间二次函数模型y=bx2+a 就转变为产卵数 y 和温度的平方 t 之间线性回归模型 y=bt+a温度21232527293235温度的平方 t44152962572984110241225产卵数 y / 个711212466115325产卵数 y/ 个350300250200150100t 500150300450600750900 1050 1200 1350察看互换数据后的散点图能够发现抛物线模型的拟合成效不是很好,由于散点图不可一条直线。
人教版高中数学选修2-3 3.1 回归分析的基本思想及其初步应用教案
小结与练习:
1、回归分析的基本思想是什么?
2、如何进行回归分析。
第一个问题由教师讲解,第二个问题由学生齐答。
1、整理本节课所学习到的知识.
2、体会随机数学的特点.
1、由小结再次明确了回归分析的步骤 以及每一步需要注意的地方。
2、注重数学教学中的思想性,它们是贯穿数学教学过程的“灵魂”.
3、后续问题的提出,给 学生留下思维发展的时空和探索余地,激发学生对知识的进一步渴望.
一、将前面1、2问题改为:
1、两个变量之间有哪几种关系?
2、进行线 性回归分析的一般步骤是什么。
二、学生回答完问题后,教师用计算机演示一遍操作。
1、在学生小组讨论的时候,教师适时参与讨论。
2、教师演示用计算机进行回归分析的方法。
学生小组讨论1、2两个问题。通过小组讨论,使得学困生也能对以前的知识有必要的了解。
例2教学:
提供期中考试400多名考生的成绩数据来进行回归分析,再次让学生体会回归分析的魅力。
提供期中考试4பைடு நூலகம்0多名考生的成绩,简单的部分让学生来操作。并让学生来分析回答。后面的部分教师操作。
认真思考,并感受当数据量很大的时候,残差图的特点。更加直观的理解,当残差点均匀分布在一条水平带状区域上时,模型选 取较合适。
必修三和选修1-2这两本书在教学时间上间隔很远,通过有效的复习让学生为后面新知识的讲授打下良好的基础。
问题呈现:
例1 、统计10名高三女生的身高体重数据,汇总后求出根据身高预报体重的回归方程,并随机调查一名高三女生的身高,然后预报体重。
1、要求学生小组讨论统计方案。并对学生提出的方案做出评价
2、找学生代表上台操作。
人教课标版高中数学选修2-3《回归分析基本思想及其初步应用(第2课时)》教案-新版
3.1 回归分析基本思想及其初步应用第二课时一、教学目标 1.核心素养:通过学习回归分析的基本思想及其初步应用,初步形成基本的数据分析能力. 2.学习目标(1)1.1.2.1 理解相关系数概念(2)1.1.2.2 判断刻画模型拟合效果的方法—相关指数和残差分析 (3)1.1.2.3 能用回归分析的方法对简单的案例进行分析. 3.学习重点判断刻画模型拟合效果的方法—相关系数、相关指数和残差分析 4.学习难点判断刻画模型拟合效果的方法—相关系数、相关指数和残差分析 二、教学设计 (一)课前设计 1.预习任务 任务1阅读教材P 4-P 6,思考在回归分析中,分析残差能够帮助我们解决那些问题?任务2刻画模型拟合效果的方法有哪些?2.预习自测1.下列说法正确的是 ( )A.在统计学中,回归分析是检验两个分类变量是否有关系的一种统计方法B.线性回归方程对应的直线a x b yˆˆˆ+=至少经过其样本数据点1122(,),(,),,(,)n n x y x y x y L 中的一个点C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D.在回归分析中,相关指数2R 为98.0的模型比相关指数2R 为80.0的模型拟合的效果差 【知识点:回归分析】解:C A.回归分析反映两个变量相关关系的数学方法,由建立回归方程来预报变量的情况.错误;B.线性回归方程对应的直线a x b yˆˆˆ+=,过其样本数据平均数点,错误;D.相关指数2R 越大,则相关性越强,模型的拟合效果越好. 错误;C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高. 正确.2.两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下,其中拟合效果最好的模型是( ) A.模型1的相关指数2R 为0.99 B.模型2的相关指数2R 为0.88 C.模型3的相关指数2R 为0.50 D.模型4的相关指数2R 为0.20 【知识点:回归分析】解:A 由相关指数的意义知,2R 越大说明相关性越强,故选A. (二)课堂设计 1.知识回顾⑴对于一组具有线性相关关系的数据1122(,),(,),,(,)n n x y x y x y L ,1211,n n i i x x x x x n n =+++==∑L 121y y y 1y y ,nn i i n n=+++==∑L 则称点),y x (为样本点的中心. (2)线性回归方程:∧∧∧+=a x b y ,其中.1122211()()()n niii ii i nniii i x x y y x y nx yb x x xnx∧====---==--∑∑∑∑,a ∧=x b ∧-y(3)线性回归模型:y =bx +a +e 其中a 和b 为模型的未知参数,e 称为随机误差. 2.问题探究问题探究一 什么是相关系数?相关系数可以用来解释什么?●活动一 理论研究,概念学习—相关系数我们知道,两个变量x 和y 正(负)相关时,它们就有相同(反)的变化趋势,因此可以用回归直线来描述这种关系.与此相关的一个问题:如何描述x 和y 之间种线性关系的强弱?在统计中用相关系数r 来衡量两个变量之间线性关系的强弱.若相应于变量x 的取值i x ,变量y 的观测值为i y (n i ≤≤1),则两个变量的相关系数r 的计算公式为∑∑∑===----=ni ni iini iiy yx x y yx x r 11221)()())((对于相关系数r ,当为正时,表明变量x 和y 正相关,当r 为负时,表明变量x 和y 负相关. 统计学认为,对于变量x,y ,如果[]75.0,1--∈r ,那么负相关很强;如果[]1,75.0∈r ,那么正相关很强;如果(]30.0,75.0--∈r 或[)75.0,3.0∈r ,那么相关性一般;若[]25.0,25.0-∈r ,那么相关性较弱.●活动二 学以致用,相关系数的应用例1 对下列各图中两个变量间的线性相关程度作出分析【知识点:相关系数】详解:图1,r =0.97相关性很强,而且是正相关;图2,r =-0.85相关性很强,而且是负相关 图3,r =0.24,不能用线性回归模型描述两个变量的关系;图4,r =-0.05乎没有什么关系,不能用线性回归模型描述两个变量的关系.点拨:当相关系数r 越接近1时,两个变量的线性相关程度越高,当相关系数r 越接近0时,两个变量的线性相关程度越低.问题探究二 什么是残差、及残差平方和、如何用残差判断拟合效果? ●活动一 残差的定义在线性回归模型中,e 是用bx +a 报真实值y 的随机误差,它是一个不可观测的量,那么应该怎样研究随机误差呢?在实际应用中,我们用回归方程∧∧∧+=a x b y 中的∧y 估计回归模型y =bx +a +e 中的bx +a .由于随机误差e =y -(bx +a ),所以∧∧-=y y e 是e 的估计值.对于样本点1122(,),(,),,(,)n n x y x y x y L 而言,它们的随机误差为,1,2,,i i i e y bx a i n =--=L 其估计值为∧∧∧∧--=-=a x b y y y e i i i i i 1,2,,i n =L 称i e ∧是相对于点),i i y x (的残差. ●活动二 学以致用,残差的应用如何发现数据中的错误,如何衡量模型的拟合效果?通过残差可以发现原始数据中的可疑数据,判断所建立模型的拟合效果.下表是女大学生身高和体重的原始数据以及相应的残差数据.我们可以利用图形来分析残差.作图时纵坐标为残差,横坐标可以选为样本的编号或者解释变量的数值,这样作出的图形称为残差图.下表是以女大学生编号为横坐标的残差图从残差图中可以看到第1个样本点和第6个样本点的残差较大,需要确认是否出现人为的错误.残差所能说明的情况:① 样本点的残差比较大,确认采集数据时是否出现人为的错误或其他原因;②残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区域的宽度越窄,模型拟合精度越高,回归方程的预报精度越高.●活动三 多角度刻画拟合效果从残差图中我们可以大致判断模型的拟合效果,能否定性分析模型的拟合效果呢? 我们可以用2R 是刻画回归效果的量,除了表示回归模型的拟合效果,也表示解释变量和预报变量的线性相关关系(在线性回归模型中).其计算公式是22121ˆ()1()ni i nii y yR y y ==-=--∑∑对于已获取的样本数据,2R 表达式中的()∑=-ni i y y 12为确定的数.因此2R 越大,说明残差平方和()21ˆni i y y=-∑越小,模型的拟合效果越好;2R 越小,说明残差平方和()21ˆni i y y =-∑越大,模型的拟合效果越差.在线性回归模型中,2R 越接近于1,回归的效果越好(因为2R 越接近于1,表示解释变量和预报变量的线性相关性越强).在线性回归模型中,2R 同时也表示解释变量对预报变量变化的贡献率.()()64.0ˆ112122≈---=∑∑==ni ini i i y yy y R ,即解释变量对预报变量变化约贡献了64%,而随机误差贡献了剩余的36%. 问题探究三●活动一 学以致用例2.某运动员训练次数与运动成绩之间的数据关系如下:根据数据分别计算相关系数、残差、相关指数2R ,判断能否用线性回归模型,若能求出回归方程并试预测该运动员训练47次以及55次的成绩,若不能说明理由. 【知识点:线性回归,线性相关关系】详解:(1)作出该运动员训练次数x 与成绩y 之间的散点图,如图1所示,由散点图可知,它们之间具有线性相关关系.(2)列表计算:由上表可求得875.40,25.39==y x ,12656812=∑=i ix ,13731812=∑=i iy ,1318081=∑=ii i yx ,所以88118822211()()8 1.0415.()iii ii i iii i x x y y x y x yb x x xx====---==≈--∑∑∑∑00302.0-≈-=x b y a ,所以回归直线方程为.00302.00415.1^-=x y(3)计算相关系数将上述数据代入0.992704r r ==,查表可知707.005.0=r ,而05.0r r >,故y 与x 之间存在显著的相关关系. (4)残差分析:作残差图如图2,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.计算残差的方差得884113.02=σ,说明预报的精度较高. (5)计算相关指数2R计算相关指数2R =0.9855.说明该运动员的成绩的差异有98.55%是由训练次数引起的. (6)做出预报由上述分析可知,我们可用回归方程.00302.00415.1^-=x y 作为该运动员成绩的预报值.将x =47和x =55分别代入该方程可得y =49和y =57, 故预测运动员训练47次和55次的成绩分别为49和57.点拨:1.解答本类题目应先通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R 2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析. 2.在使用回归方程进行预报时要注意:(1)回归方程只适用于我们所研究的样本的总体; (2)我们所建立的回归方程一般都有时间性; (3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预报值就是预报变量的精确值. 3.课堂总结【知识梳理】(1)在统计中用相关系数r 来衡量两个变量之间线性关系的强弱.若相应于变量x 的取值i x ,变量y 的观测值为i y (n i ≤≤1),则两个变量的相关系数r 的计算公式为∑∑∑===----=ni ni iini iiy yx x y yx x r 11221)()())(((2)数据点和它在回归直线上相应位置的差异是随机误差的效应,称(1,2,3,n)i i e y y i ∧∧=-=L ,为残差.由,y ∧∧∧+=a x b i i 得(1,2,3,,)i i i e y b x a i n ∧∧∧=--=L .【重难点突破】(1)残差图分析:若残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度就越高.若残差点分布在其他形状的区域,则说明所选用的回归模型不是最好的,有改进的空间.(2)2R 越大,说明残差平方和21)y (∑=-ni i y 越小,模型的拟合效果越好;2R 越小,说明残差平方和21)y (∑=-ni i y 越大,模型的拟合效果越差.在线性回归模型中,2R 越接近于1,回归的效果越好(因为2R 越接近于1,表示解释变量和预报变量的线性相关性越强).在线性回归模型中, 2R 同时也表示解释变量对预报变量变化的贡献率. 4.随堂检测1.下列各组变量之间具有线性相关关系的是( ) A.出租车费与行驶的里程 B.学习成绩与学生身高 C.身高与体重 D.铁的体积与质量【知识点:线性回归,线性相关关系】解: C2.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程y ^=b ^x +a ^,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( ) A.b ^>b ′,a ^>a ′B.b ^ >b ′,a ^ <a ′C.b ^<b ′,a ^>a ′ D.b ^ <b ′,a ^<a ′【知识点:线性回归,线性相关关系】解:C b ′=2,a ′=-2,b ^ =57,a ^ =y -b ^ x =136-57×72=-13, ∴b ^ <b ′,a ^>a ′.选C.3.四名同学根据各自的样本数据研究变量y x ,之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且1.63.2-=∧x y ; ②y 与x 负相关且1.537.3--=∧x y ; ③y 与x 正相关且27.3-=∧x y ; ④y 与x 正相关且17.656.4+-=∧x y . 其中一定不正确的结论的序号是( ) A.①② B.②③ C.③④ D.①④【知识点:线性回归,线性相关关系】解:D ①中y 与x 负相关而斜率为正,不正确;④中y 与x 正相关而斜率为负,不正确. 4.如果散点图中的所有的点都在一条斜率不为0的直线上,则残差为_____,相关指数2R =_____. 【知识点:线性回归,线性相关关系】解:0, 1 由题意知,ˆi i y y = ∴相应的残差ˆˆ0i i i ey y =-=. 相关指数22121ˆ()110 1.()niii nii y yR y y ==-=-=-=-∑∑(三)课后作业 基础型 自主突破1.对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是( )相关系数为1r 相关系数为2r相关系数为3r 相关系数为4r A.24310r r r r <<<< B.31240r r r r <<<< C.13240r r r r <<<< D.31420r r r r <<<< 【知识点:相关系数】解:A2. 甲、乙、丙、丁四位同学在建立变量y x ,的回归模型时,分别选择了4中不同的模型,计算可得它们的相关指数2R 分别如下表,其中拟合效果最好的为( )A.甲B.乙C.丙D.丁 答案:A解析:【知识点:相关指数】3.已知变量x 与y 正相关,且由观测数据算得样本平均数x -=3,y -=3.5,则由该观测数据算得的线性回归方程可能是( ) A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5 D.y ^=-0.3x +4.4【知识点:回归方程,相关关系】解:A 因为变量x 和y 正相关,则回归直线的斜率为正,故可以排除选项C 与D.因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A 和B 中的直线方程进行检验,可以排除B ,只有A 可能.4.已知一组观测值1122,),(,),,(,)n n x y x y x y L (之间满足(1,2,,)y bx a e i n =++=L ,若e 恒为0,则2R 为 .【知识点:残差,相关指数】 答案:1.5.下表中给出了5组数据),(i i y x ,从中选出4组使其线性相关性最大,且保留第1组(-5,-3),那么应该去掉第_______组【知识点:残差分析】解: 3能力型 师生共研6.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归方程的回归系数是∧b ,回归截距是∧a ,那么必有( ) A .∧b 与r 的符号相同 B .∧a 与r 的符号相同 C .∧b 与r 的相反D .∧a 与r 的符号相反 【知识点:相关关系】解:.A ∧b 决定正相关还是负相关,与r 的符号相同.7.回归分析中,相关指数2R 的值越大,说明残差平方和( ) A.越小 B.越大C.可能大也可能小D.以上都不对【知识点:相关指数】解: A 由2R 和残差平方和公式易得.8. 若对于变量y 与x 的10组统计数据的回归模型中,相关指数95.02=R ,又知残差平方和为53.120,那么∑=-1012)(i iy y的值为( )A.241.06B.2410.6C.253.08D.2530.8【知识点:相关指数】解: B 由2R 和残差平方和公式易得. 9.已知x ,y 之间的一组数据如下表:对于表中数据,现给出如下拟合直线:①5457+=x y ;②12+=x y ;③52-58x y =;④x y 2=.根据最小二乘法的思想,其中拟合程度最好的直线是________.(填正确序号) 【知识点:样本点中心,回归方程】解:① 直线必过样本点中心(3,5),依次检验即可. 探究型 多维突破(一般为2道题,具体课时可相应灵活调整)10.假定小麦基本苗数x 与成熟期有效穗y 之间存在相关关系,现测得5组数据如下表:(1)以x 为解释变量,y 为预报变量,作出散点图;(2)球y 与x 间的回归方程,对于基本苗数56.7,预报其成熟期的有效穗;(3)求相关指数2R ,并说明残差变量对成熟期有效穗的影响占百分之几. 【知识点:散点图,回归方程,相关指数】 解:(1)略(2)由散点图可知,样本点呈条状分布,有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.可求得线性回归方程为.291.0664.34x y +=∧当x =56.7时,.164.517.56291.0644.34≈⨯+=∧y 即估计其成熟期有效穗为51.164. (3)残差平方和为:,427.8512≈∑=i i e总偏差平方和:,18.50)512≈-∑=i i y y (故,832.018.50427.8-12≈=R 解释变量小麦基本苗数对成熟期有效穗的影响约占83.2%,残差变量的影响约占1-83.2%=16.8%.11.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得数据如下:(1)计算残差及残差和; (2)进行残差分析.【知识点:残差,残差分析,残差图】解:(1) 列出残差表(由已知可知7.91960.54668.0=+=∧y x y ,)如下所以残差平方和=2220.4-0.30.2 1.4+++=L ()()(),残差值如表中第四行的值.(2)残差分析:画出残差图,散点图(略),由散点图可以说明x 与y 有很强的相关性.可以观察到,第4个样本点和第5个样本点的残差比较大,需要纠正数据,重新利用线性回归模型拟合数据;残差图中的残差点比较均匀地落在水平的带状区域中,说明选用的线性回归模型较为合适,带状区域的宽度仅为1.3,比较狭窄,说明模型拟合精度较高. (四)自助餐1.从某大学随机抽取8名女大学生,其身高x (cm )和体重y (kg )的回归方程为712.85-849.0x y =∧,则身高172cm 的女大学生,由回归方程可以得知其体重( ) A.等于60.316kg B.约为60.316kg C.大于60.316kg D.小于60.316kg 【知识点:回归分析】 解:B2.在回归分析中,残差图的纵坐标为( ) A.残差 B.样本编号 C.等高条形图 D.独立性检验 【知识点:残差图】 解: A3.设1122(,)(,),,(,)n n x y x y x y L 是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是( )A.直线l 过点(,)x yB.x 与y 的相关系数为直线l 的斜率C.x 与y 的相关系数在0到1之间D.当n 为偶数时,分布在l 两侧的样本点的个数一定相同 【知识点:回归分析,相关系数】 解:A4.对两个变量x 和y 进行回归分析,得到一组样本数据: 1122(,)(,),,(,)n n x y x y x y L ,则下列说法中不正确的是( )A.由样本数据得到的回归方程ˆˆˆybx a =+必过样本点的中心(,)x y B.残差平方和越小的模型,拟合的效果越好C.用相关指数R 2来刻画回归效果,R 2的值越小,说明模型的拟合效果越好D.若变量y 和x 之间的相关系数r =-0.936 2,则变量y 和x 之间具有线性相关关系 【知识点:回归分析,相关系数】解: C 解析:R 2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好. 5.如图所示的是四个残差图,其中回归模型的拟合效果最好的是( )【知识点:残差图】解:B 残差图中,只有A 、B 是水平带状区域分布,且B 中残差点散点分布集中在更狭窄的范围内所以B 项中回归模型的拟合效果最好.6.变量x 与y 具有线性相关关系,当x 取值16,14,12,8时,通过观测得到y 的值为别为11,9,8.5.若在实际问题中,y 的最大取值是10,则x 的最大取值不能超过( ) A.16 B.17 C.15 D.12【知识点:回归方程】 解:C7.一家工厂对职工进行技能培训,收集数据如下:两变量的回归直线方程为__________,该函数模型的残差平方和为__________,相关指数为__________.【知识点:回归方程,残差,相关指数】 解:. 5.9817.0+=∧x y 34.126 957.0.8.若回归直线方程中的参数0=∧b ,则相关系数为 . 【知识点:相关系数】 解:0.9.关于x 与y 有如下数据为了对x ,y 两个变量进行统计分析,现有以下两种线性模型,甲:5.175.6+=∧x y ,乙:177+=∧x y ,则模型__________拟合效果更好.(填“甲”或“乙”) 【知识点:回归分析,样本点中心】 解:甲.10.关于x 与y 有以下数据:已知x 与y 线性相关,由最小二乘法得ˆb =6.5, (1)求y 关于x 的线性回归方程.(2)现有第二个线性模型:ˆy=7x +17,且相关指数R 2=0.82.若与(1)的线性模型比较,哪一个线性模型拟合效果比较好?请说明理由. 【知识点:回归分析,相关指数】解:(1)依题意设y 关于x 的线性回归方程为ˆˆ6.5yx a =+, 1(24568)=55x =⨯++++,1(3040605070)=505y =⨯++++∵ˆˆ6.5yx a =+经过样本点的中心(,)x y , ∴50=6.5×5+ˆa,∴ˆa =17.5, ∴y 与x 的线性回归方程为ˆy=6.5x +17.5. (2)由(1)的线性模型得ˆi i y y -与i y y -的关系如下表:所以52222221ˆ()(0.5)( 3.5)10( 6.5)0.5155i i i y y=-=-+-++-+=∑, 52222221()(20)(10)100201000ii y y =-=-+-+++=∑,所以52211521ˆ()155110.8451000()iii ii y yR y y ==-=-=-=-∑∑. 由于21R =0.845,R 2=0.82知21R >R 2, 所以(1)的线性模型拟合效果比较好.11.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)有关的统计资料如表所示.(1)求线性回归方程ˆˆˆybx a =+; (2)若相关指数R 2=0.9587,说明其含义; (3)估计使用年限为9年时,维修费用是多少? 【知识点:回归分析,相关指数】 解:(1)由已知数据制成表:由此可得x =4,y =5,121()()1.23()niii nii x x y y b x x ∧==--==-∑∑,ˆˆ0.08ay bx =-= ∴回归直线方程为ˆy=1.23x +0.08. (2)R 2=0.958 7,说明该设备的维修费用有95.87%由使用年限引起的.所以回归模型的拟合效果好.(3)回归直线方程为ˆy =1.23x +0.08,当x =9(年)时,ˆy =1.23×9+0.08=11.15(万元),即估计使用9年时维修费用是11.15万元.。
人教版高中数学选修2-3第三章统计案例3.1回归分析的基本思想及其初步应用教案2
课型:新授课编写时时间:年月日执行时间:年月日
教学目标:
(1)通过实例了解相关系数的概念和性质,感受相关性检验的作用;
(2)能对相关系数进行显著性检验,并解决简单的回归分析问题;
(3)进一步了解回归的基本思想、方法及初步应用.
批注
教学重点:相关系数的性质及其显著性检验的基本思想、操作步骤.
教学难点:相关系数的性质及其显著性检验的基本思想、操作步骤.
教学用具:多媒体
教学方法:进一步了解回归的基本思想、方法及初步应用.
教学过程:
一.问题情境
1.情境:下面是一组数据的散点图,若求出相应的线性回归方程,求出的线性回归方程可以用作预测和估计吗?
2.问题:思考、讨论:求得的线性回归方程是否有实际意义.
这就是上节课提到的问题①,即模型的合理性问题.为了回答这个问题,我们需要对变量 与 的线性相关性进行检验(简称相关性检验).
三.建构数学
1.相关系数的计算公式:
对于 , 随机取到的 对数据 ,样本相关系数 的计算公式为
.
2.相关系数 的性质:
(1) ;
(2) 越接近与1, , 的线性相关程度越强;
(3) 越接近与0, , 的线性相关程度越弱.
二.学生活动
对任意给定的样本数据,由计算公式都可以求出相应的线性回归方程,但求得的线性回归方程未必有实际意义.左图中的散点明显不在一条直线附近,不能进行线性拟合,求得的线性回归方程是没有实际意义的;右图中的散点基本上在一条直线附近,我们可以粗略地估计两个变量间有线性相关关系,但它们线性相关的程度如何,如何较为精确地刻画线性相关关系呢?
六.课外作业:习题3.2第 题.
高中数学选修1-2教案3:1.1 回归分析的基本思想及其初步应用(二) (2)教学设计
回归分析的基本思想及其初步应用【教学目标】:(1)知识与技能:了解回归模型的选择;进一步理解非线性模型通过变换转化为线性回归模型;体会不同模型拟合数据的效果。
(2)过程与方法:从实例出发,求出相应的回归直线方程,从中也找出存在的不足,从而有进行回归分析的必要性,通过学习相关指数,用相关指数来刻画回归的效果,进而归纳出回归分析的一般步骤,并对具体问题进行回归分析,用于解决实际问题。
(3)情感态度与价值观:任何事物都是相对的,但又有一定的规律性,我们只要从实际出发,不断探求事物的内在联系,就会找出其中的规律性,形成解决实际问题的方法和能力。
【教学重点】:1.加深体会有些非线性模型通过变换可以转化为线性回归模型;2.了解在解决问题的过程中寻找更好的模型的方法。
【教学难点】:1.了解常用函数的图像特点,选择不同的模型建模;2.通过比较相关指数对不同的模型进行比较。
教学过程问题导学一、求线性回归方程活动与探究1某工厂1~8月份某种产品的产量与成本的统计数据见下表:以产量为x,成本为y.(1)画出散点图;(2)y与x是否具有线性相关关系?若有,求出其回归方程.迁移与应用1.(2013海南海口模拟)在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的回归直线方程为()A.=x+1 B.=x+2C.=2x+1 D.=x-12.某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x(x取整数)元与日销售量y台之间有如下关系:(1)y与x是否具有线性相关关系?如果具有线性相关关系,求出回归直线方程.(方程的斜率精确到个位)(2)设经营此商品的日销售利润为P元,根据(1)写出P关于x的函数关系式,并预测当销售单价x为多少元时,才能获得最大日销售利润.(1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.(2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.二、线性回归分析活动与探究2某运动员训练次数与运动成绩之间的数据关系如下:(1)作出散点图;(2)求出线性回归方程;(3)作出残差图,并说明模型的拟合效果;(4)计算R2,并说明其含义.迁移与应用1.某产品的广告费用x与销售额y的统计数据如下表:根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为()A.63.6万元B.65.5万元C.67.7万元D.72.0万元2.在一段时间内,某种商品的价格x(元)和需求量y(件)之间的一组数据为:且知x与y具有线性相关关系,求出y对x的回归直线方程,并说明拟合效果的好坏.“相关指数R2、残差图”在回归分析中的作用:(1)相关指数R2是用来刻画回归效果的,由R2=1-可知R2越大,意味着残差平方和越小,也就是说模型的拟合效果就越好.(2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预报精度越高.三、非线性回归分析活动与探究3下表为收集到的一组数据:(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x=40时y的值.迁移与应用1.在彩色显影中,由经验知形成染料光学密度y与析出银的光学密度x由公式y=e b xA(b<0)表示,现测得试验数据如下:则y对x的回归方程是__________.2.在一次抽样调查中测得样本的5个样本点,数值如下表:试建立y与x之间的回归方程.非线性回归问题有时并不给出经验公式,这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决.[答案] 课前·预习导学 【预习导引】1.(1)确定性 非确定性 (2)相关 (3) =1221ni ii n i i x ynx yx nx==--∑∑ -样本点的中心 (4)随机误差 解释变量 预报变量 预习交流1 D2.y i -bx i -a y i -i y i -x i -3.1- 解释变量 预报变量 1预习交流2 提示:散点图可以说明变量间有无线性相关关系,只能粗略地说明两个变量之间关系的密切程度,而相关指数R 2能精确地描述两个变量之间的密切程度.预习交流3 提示:(1)回归方程只适用于所研究的样本的总体. (2)所建立的回归方程一般都有时间性. (3)样本的取值范围会影响回归方程的适用范围.(4)不能期望回归方程得到的预报值就是预报变量的精确值.事实上,它是预报变量的可能取值的平均值.课堂·合作探究 【问题导学】活动与探究1 思路分析:画出散点图,观察图形的形状得x 与y 是否具有线性相关关系.把数值代入回归系数公式求回归方程.解:(1)由表画出散点图,如图所示.(2)从上图可看出,这些点基本上散布在一条直线附近,可以认为x 和y 线性相关关系显著,下面求其回归方程,首先列出下表.=6.85,=157.25.∴=81822188i ii ii x yx yxx ==--∑∑=≈22.17, =-=157.25-22.17×6.85≈5.39,故线性回归方程为=22.17x +5.39. 迁移与应用 1.A [解析]方法一:==,==.故===1,=-=-=1.因此,=x+1,故选A.方法二:也可由回归直线方程一定过点(,),即,代入验证可排除B,C,D.故应选A.2.[解析](1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.设回归直线为=x+,由题知=42.5,=34,则求得==≈-3.=-=34-(-3)×42.5=161.5.∴=-3x+161.5.(2)依题意有P=(-3x+161. 5)(x-30)=-3x2+251.5x-4 845=-32+-4 845.∴当x=≈42时,P有最大值,约为426.即预测销售单价为42元时,能获得最大日销售利润.活动与探究2思路分析:先画出散点图,确定是否具有线性相关关系,求出回归方程,再求出残差,确定模型的拟合的效果和R2的含义.[解析](1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.(2) =39.25,=40.875,=12 656,=13 731,y i=13 180,i∴==≈1.041 5,=-=-0.003 875,∴线性回归方程为=1.041 5x-0.003 875.(3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.(4)计算得相关指数R2≈0.985 5,说明了该运动员的成绩的差异有98.55%是由训练次数引起的.迁移与应用1.B[解析]∵=-=-9.4×=9.1,∴回归方程为=9.4x +9.1.令x =6,得=9.4×6+9.1=65.5(万元). 2.[解析]=×(14+16+18+20+22)=18,=×(12+10+7+5+3)=7.4,521ii x=∑=142+162+182+202+222=1 660,521ii y=∑=122+102+72+52+32=327,i y i =14×12+16×10+18×7+20×5+22×3=620,∴=51522155i ii ii x yx y xx ==--∑∑===-1.15.∴=7.4+1.15×18=28.1,∴回归直线方程为=-1.15x +28.1. 列出残差表为:∴(y i -i )2=0.3, (y i -)2=53.2,R 2=1-≈0.994.故R 2≈0.994说明拟合效果较好.活动与探究3 思路分析:先由数值表作出散点图,然后根据散点的形状模拟出近似函数,进而转化为线性函数,由数值表求出回归函数.[解析](1)作出散点图如图,从散点图可以看出x 与y 不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线21e c x y c =的周围,其中c 1,c 2为待定的参数.(2)对两边取对数把指数关系变为线性关系,令z =ln y ,则有变换后的样本点应分布在直线z =bx +a ,a =ln c 1,b =c 2的周围,这样就可以利用线性回归模型来建立y 与x 之间的非线性回归方程了,数据可以转化为:求得回归直线方程为=0.272x -3.849,∴=e 0.272x -3.849.残差(3)当x =40时,y =e 0.272x -3.849≈1 131.迁移与应用 1.$0.151.73e xy -= [解析]由题给的经验公式y =e b x A ,两边取自然对数,便得ln y =ln A +.与线性回归直线方程相对照,只要取u =,v =ln y ,a =ln A ,就有v =a +bu ,这是v 对u 的线性回归方程.对此我们已经掌握了一套相关性检验,求a 与回归系数b 的方法.题目所给数据经变量置换u =,v =ln y 变成如下表所示的数据:|r |≈0.998>0.75,故v与u之间具有很强的线性相关关系,求回归直线方程是有意义的.由表中数据可得≈-0.15,≈0.55,即=0.55-0.15u.把u与v换回原来的变量x与y,即u=,v=ln y,故ln =0.55-,即=0.150.55e x-=e0.550.15e x-≈0.151.73e x-.这就是y对x的回归曲线方程.2.[解析]画出散点图如图所示.根据散点图可知y与x近似地呈反比例函数关系,设y=,令t=,则y=kt,原数据变为:由置换后的数值表作散点图如下:由散点图可以看出y与t呈近似的线性相关关系.列表如下:所以=1.55,=7.2.所以=≈4.134 4,=-≈0.8.所以=4.134 4t+0.8.所以y与x的回归方程是=+0.8.当堂检测1.(2012湖南高考,理4)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为$y =0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg[答案]D[解析]D选项中,若该大学某女生身高为170 cm,则可断定其体重约为0.85×170-85.71=58.79(kg).故D不正确.3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y对x的线性回归方程为()A.y=x-1 B.y=x+1C .y =88+12xD .y =176[答案]C[解析]法一:由线性回归直线方程过样本中心(176,176),排除A ,B[答案],结合选项可得C 为正确[答案].法二:将表中的五组数值分别代入选项验证,可知y =88+12x最适合.3.在两个变量y 与x 的回归模型中,分别选择了4个不同的模型.通过计算得R 2的值如下,其中拟合效果最好的模型是( )A .模型1的R 2为0.98B .模型2的R 2为0.80C .模型3的R 2为0.50D .模型4的R 2为0.25 [答案]A[解析]R 2越接近于1,则该模型的拟合效果就越好,精度越高.4.若对于变量y 与x 的10组统计数据的回归模型中,R 2=0.95,又知残差平方和为120.53,那么101i =∑(y i -y )2的值为______.[答案]2 410.6[解析]依题意有0.95=1-1021120.53()ii y y =-∑,所以1021()ii yy =-∑=2 410.6.4. 假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)有如下的统计数据.若由此资料可知y 对x 呈线性相关关系,试求: (1)回归直线方程;[解析]由题表中数据列成下表:于是51522215112.35451.2390545i ii ii x y x ybxx ==--⨯⨯===-⨯-∑∑$,$a=y -bx $=5-1.23×4=0.08, 所以回归直线方程为$y=bx $+$a =1.23x +0.08.(2)估计使用年限为10年时,维修费用为多少? [答案]当x =10时,$y=1.23×10+0.08=12.38(万元),估计使用10年时的维修费用为12.38万元. 课堂小结:(学生总结) 板书设计:(略) 教后记:。
高中数学人教A版 选修2-3 3.1.2回归分析的基本思想及其初步应用 教案
3.1回归分析的基本思想及其初步应用(2课时)一、教学目标(一)必备知识:能根据散点分布特点,建立不同的回归模型(二)关键能力:知道有些非线性模型通过变换可以转化为线性回归模型;通过散点图及相关指数比较不同模型的拟合效果.(三)学科素养通过学科教育能给学生终身发展数学运算、数学建模和数据分析的能力。
(四)核心价值:让学生探索、发现数学知识和掌握数学知识的内在规律的过程中不,不断获得成功积累愉快的体验,不断增进学习数学的兴趣,同时还通过探索这一活动培养学生善于和他人合作的精神.二、生情分析:本节课是学生在必修模块《数学3》概率统计知识的基础上,进一步学习用统计方法解决实际问题,主要是通过对典型案例的讨论、解决,让学生初步了解独立性检验的基本思想和操作步骤,认识统计方法在决策中的作用,体验数学的科学价值、应用价值和文化价值.三、过程方法:通过将非线性模型转化为线性回归模型,使学生体会“转化”的思想;让学生经历数据处理的过程,培养他们对数据的直观感觉,体会统计方法的特点,认识统计方法的应用;通过使用转化后的数据,利用计算器求相关指数,使学生体会使用计算器处理数据的方法.四、重点难点:重点:通过探究使学生体会有些非线性模型运用等量变换、对数变换可以转化为线性回归模型;难点:如何启发学生“对变量作适当的变换(等量变换、对数变换)”,变非线性为线性,建立线性回归模型.五、教学用具:黑板、粉笔、多媒体;六、教学课时:1课时七、设计思路:教学模式:本课采用“探究——发现”教学模式.教师的教法:利用多媒体辅助教学,突出活动的组织设计与方法的引导.“抓三线”,即(一)知识技能线(二)过程与方法线(三)能力线.“抓两点”,即一抓学生情感和思维的兴奋点,二抓知识的切入点.学法:突出探究、发现与交流.八、教学过程 (一)创设问题情境我国是世界产棉大国,种植棉花是我国很多地区农民的主要经济来源,在棉花的种植过程中,病虫害的防治是棉农的一项重要任务,如果处置不当就会造成棉花的减产.其中红铃虫就是危害棉花生长的一种常见害虫,在1953年,我国18省曾发生红铃虫大灾害,受灾面积300万公顷,损失皮棉约二十万吨.如图就是红铃虫的有关图片:红铃虫喜高温高湿,适宜各虫态发育的温度为25~32 ℃,相对湿度为80%~100%,低于20 ℃和高于35 ℃卵不能孵化,相对湿度60%以下成虫不产卵.冬季月平均气温低于-4.8 ℃时,红铃虫就不能越冬而被冻死.为采取有效防治方法,有必要研究红铃虫的产卵数和温度之间的关系.现收集了红铃虫的产卵数y 和温度x 之间的7组观测数据列于下表:(1)试建立y 与x 之间的回归方程;并预测温度为28 ℃时产卵的数目. (2)你所建立的模型中温度在多大程度上解释了产卵数的变化? 学生活动:类比前面所学过的建立线性回归模型的步骤,动手实施. 活动结果:(1)画散点图:通过计算器求得线性回归方程:y ^=19.87x -463.73.当x =28 ℃时,y ^=19.87×28-463.73≈93,即温度为28 ℃时,产卵数大约为93. (2)进行回归分析计算得: R 2≈0.746 4,即这个线性回归模型中温度解释了74.64%产卵数的变化.设计目的:通过背景材料,加深学生对问题的理解,并明白“为什么要学”.体会问题产生于生活,并通过问题的解决复习建立回归模型的基本步骤.(二)探究新知提出问题:结合数据可以发现,随着自变量的增加,因变量也随之增加,气温为28 ℃时,估计产卵数应该低于66个,但是从推算的结果来看93个比66个却多了27个,是什么原因造成的呢?学生活动:分组合作讨论交流.学情预测:由于我们所建立的线性回归模型的相关指数约等于0.746 4,即解释变量仅能解释预报变量大约74.64%的变化,所占比例偏小.这样根据我们建立的模型进行预报,会存在较大的误差.我们还可以从残差图上分析一下我们所建立的回归模型的拟合效果:残差数据表:画出残差图根据残差图可以发现,残差点分布的带状区域较宽,并不集中,这表明我们所建立的回归模型拟合效果并不理想.之所以造成预报值偏差太大的原因是所选模型并不理想.实际上根据散点图也可以发现,样本点并没有很好地集中在一条直线附近,故变量之间不会存在很强的线性相关性.设计目的:引导学生对结果进行分析,从而发现存在的问题,激发好奇心、求知欲.同时培养学生对问题的洞悉能力,增强对结果的敏感自检能力.理解新知提出问题:如何选择合适的回归模型进行预测呢?学生活动:学生讨论,教师合理引导学生观察图象特征,联想学过的基本函数.学情预测:方案一:建立二次函数模型y=bx2+a.方案二:建立指数函数模型y=c1ac2x.提出问题:如何求出所建立的回归模型的系数呢?我们不妨尝试解决方案一中的系数.学生活动:分组合作,教师引导学生观察y=bx2+a与y=bx+a的关系.学情预测:通过比较,发现可利用t=x2,将y=bx2+a(二次函数)转化成y=bt+a(一次函数).求出x ,t ,y 间的数据转换表:利用计算器计算出y 和t 的线性回归方程:y ^=0.367t -202.54, 转换回y 和x 的模型:y ^=0.367x 2-202.54.当x =28 ℃时,y ^=0.367×282-202.54≈85,即温度为28 ℃时,产卵数大约为85. 计算相关指数R 2≈0.802,这个回归模型中温度解释了80.2%产卵数的变化. 提出问题:提出问题“如果选用指数模型,是否也能转换成线性模型,如何转化?” 学生活动:独立思考也可相互讨论.教师可启发学生思考“幂指数中的自变量如何转化为自变量的一次幂?”可引导学生回忆对数的运算性质以及指对数关系.学情预测:可利用取对数的方法,即在y =c 1ac 2x 两边取对数,得log a y =c 2x +log a c 1.提出问题:在上面的运算中,由于底数a 不确定,对于x 的值无法求出相应的log a y ,这时可取a =10时的情况,以便利用计算器进行计算,试求出回归模型.学生活动:合作协作,讨论解决. 学情预测:建立数据转换表:根据数据,可求得变量z 关于x 的回归方程:z ^=0.118x -1.665. 转换回y 和x 的模型:y ^=100.118x-1.665.当x =28 ℃时,y ^≈44,即温度为28 ℃时,产卵数大约为44.计算相关指数R 2≈0.985,这个回归模型中温度解释了98.5%产卵数的变化.提出问题:试选择合适的方法,比较方案一和方案二在数据拟合程度上的效果有什么不同? 学生活动:独立思考也可相互讨论,教师加以适当的引导提示. 活动结果:无论从图形上直观观察,还是从数据上分析,指数函数模型都是更好的模型.设计目的:引导学生进行不同模型的比较,体会“虽然任意两个变量的观测数据都可以用线性回归模型来拟合,但不能保证这种模型对数据的拟合效果最好,为更好地刻画两个变量之间的关系,要根据观测数据的特点来选择回归模型”.提出问题:由上面的分析可以看出,回归模型不一定是线性回归模型,对于非线性回归模型,我们的处理方法是什么?学生活动:独立思考,回顾上面的解决过程.学情预测:选用非线性回归模型时,一般思路是转化成线性回归模型,往往要用“等量变换、对数变换”等方法.设计目的:让学生整理建立非线性回归模型的思路.(三)应用巩固例1为了研究某种细菌繁殖个数y与时间x的关系,收集数据如下:试建立y与x之间的回归方程.思路分析:先画出散点图,根据散点图确定回归模型的类型,然后求y与x之间的回归方程.解:根据上表中的数据,作出散点图由图可以看出,样本点分布在某指数函数曲线y=c1ec2x的周围,于是令z=lny,则上表变换后如下:作出散点图从图中可以看出,变换后的样本点分布在某条直线附近,因此可用线性回归模型来拟合. 由表中数据可得,z 与x 之间的线性回归方程为z ^=0.69x +1.112, 则y 与x 之间的回归方程为y ^=e 0.69x+1.112.例2混凝土的抗压强度X 较易测定,其抗弯强度Y 不易测定,已知X 与Y 由关系式Y =AX b 表示,工程中希望由X 估算出Y ,以便应用.现测得一批对应数据如下:试求Y 对X 的回归方程.思路分析:题目中已经给出回归模型为Y =AX b 类型,故只要通过适当的变量置换把非线性回归方程转化为线性回归方程,然后再套用线性回归分析的解题步骤即可.解:对Y =AX b 两边取自然对数得:lnY =blnX +lnA ,做变换y =lnY ,x =lnX ,a =lnA ,则上述数据对应表格如下:根据公式可求得y ^=0.64x +0.017 2,则Y ^=e 0.64lnx +0.017 2=1.02X 0.64.变式1:若X 与Y 的关系由关系式Y ^=β^X b+α^表示,试根据给出的数据求Y 对X 的回归方程.活动设计:学生分组讨论,尝试解决. 活动成果:Y ^=0.086X +13.005.变式2:试选择合适的方法比较上述两种回归模型,相对于给出的数据哪一个的拟合效果更好? 活动成果:计算残差平方和与相关指数,对于模型Y =AX b,残差平方和Q ^(1)=9.819,相关指数R 21=0.930 4;对于模型Y ^=β^X b +α^,残差平方和Q ^(2)=12.306,相关指数R 22=0.908,故模型Y =AX b 的拟合效果较好.设计意图:熟悉判断回归模型拟合效果的方法. (四)达标检测1.相关指数R 2,残差平方和与模型拟合效果之间的关系是( ) A .R 2的值越大,残差的平方和越大,拟合效果越好 B .R 2的值越小,残差的平方和越大,拟合效果越好 C .R 2的值越大,残差的平方和越小,拟合效果越好 D .以上说法都不正确2.如果散点图的所有点都在一条直线上,则残差均为____________________,残差平方和为__________,相关指数为______________.答案:1.C 2.0 0 13.某种书每册的成本费Y 元与印刷册数x(千册)有关,经统计得到数据如下:检验每册书的成本费Y 元与印刷册数的倒数1x 之间是否有线性相关关系,如有,求出Y 对1x 的回归方程.解:把1x 置换为z ,则z =1x,从而z 与Y 的数据为:根据数据可得r≈0.999 8>0.75,故z 与Y 具有很强的线性相关关系. 所以b ^≈8.976,a ^≈1.120,从而y ^=8.976z +1.120.又z =1x ,所以y ^ =8.976x+1.120.(五)、小结1.数学知识:建立回归模型及残差图分析的基本步骤;非线性模型向线性模型的转换方法;不同模型拟合效果的比较方法:相关指数和残差的分析. 2.数学思想:数形结合的思想,化归思想及整体思想. 3.数学方法:数形结合法,转化法,换元法. (六)、作业 1.课时检测九、课后记本课时内容教材中只安排了一道关于“红铃虫”的例题,但是它却代表了一种“回归分析”的类型.如何利用这道例题使学生掌握这类问题的解决方法呢?为此,本课时设计了“引导发现、合作探究”的教学方法.首先展示“红铃虫”的背景资料来激发学生的学习兴趣;鼓励学生用已有知识解决问题,引导学生检查结果从而发现新问题;通过分组合作来对不同方案进行探索;使学生在合作探索的过程中体会“选择模型——将非线性转化成线性”的方法,体会“化未知为已知、用已知探索未知”思想,同时认识不同模型的效果.培养学生观察、类比联想以及分析问题的能力.在教学过程中让学生自主探索、动手实践,养成独立思考、积极探索的习惯.在“选模型”这个环节中,注意引导学生将散点分布和已学函数图象进行比较,从而发现二次函数和指数函数模型.在“转化”这个环节中,通过引导学生观察所选模型,联系已学知识选择“等量变换或对数变换”,从而找到转化的途径.在运算过程中,如求“相关指数”引导学生使用转化后的数据,利用计算器求其相关系数即为相关指数,使学生体会使用计算器处理数据的方法和技能.。
高中数学《3.1.1 回归分析的基本思想及其初步运用》学案 新人教A版选修2
§3.1.1回归分析的基本思想及其初步运用学习目标 :1.了解随机误差、残差、残差图的概念. 2.会通过分析残差判断线性回归模型的拟合效果. 3.掌握建立线性回归模型的步骤. 学习重点:掌握建立线性回归模型的步骤. 学习难点:掌握建立线性回归模型的步骤. 课前预习案 教材助读:阅读教材的内容,思考并完成下列问题: 1.线性回归模型(1)函数关系是一种 关系,而相关关系是一种 关系. (2)回归分析是对具有 关系的两个变量进行统计分析的一种常用方法.(3)对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),回归直线的斜率和截距的最小二乘估计公式分别为b ^= =∑ni =1x i y i -n x y∑ni =1x 2i -n x2,a ^= ,其中 称为样本点的中心.(4)线性回归模型y =bx +a +e ,其中a 和b 是模型的未知参数,e 称为 ,自变量x 称为 ,因变量y 称为 .2.残差的概念对于样本点(x 1,y 1),(x 2,y 2),…,(x n ,y n )而言,它们的随机误差为e i = ,i =1,2,…,n ,其估计值为e ^i = = ,i =1,2,…,n ,e ^i 称为相应于点(x i ,y i )的 .3.刻画回归效果的方式 (1)残差图法作图时 为残差, 可以选为的样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.在残差图中,残差点 地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度 ,说明模型拟合精度越高. (2)残差平方和法残差平方和∑ni =1(y i -y ^i )2,残差平方和 ,模型拟合效果越好. (3)利用R 2刻画回归效果R 2= ;R 2表示 变量对于 变量变化的贡献率.R 2越接近于 ,表示回归的效果越好.课内探究案 一、新课导学: 探究点一 线性回归方程问题1 两个变量之间的关系分几类?问题2:什么叫回归分析?问题3: 对具有线性相关关系的两个变量进行回归分析有哪几个步骤?探究点二 线性回归分析问题1 利用求得的回归方程进行预报,为什么得到的预报值和实际值并不相同?问题2: 给出两个变量的回归方程,怎样判断拟合效果的 好坏?问题3: 如果R2≈0.64,表示什么意义?二、合作探究例1:若从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:170例2:某运动员训练次数与运动成绩之间的数据关系如下:3(3)作出残差图; (4)计算相关指数R2;(5)试预测该运动员训练47次及55次的成绩.三、当堂检测1. 下列各组变量之间具有线性相关关系的是( )A .出租车费与行驶的里程B .学习成绩与学生身高C .身高与体重D .铁的体积与质量2.某班5名学生的数学和物理成绩如表:(2)求物理成绩y 对数学成绩x 的回归方程;(3)一名学生的数学成绩是96,试预测他的物理成绩.四、课后反思课后训练案1. 若劳动生产率x (千元)与月工资y (元)之间的线性回归方程为y ^=50+80x ,则下列判断正确的是( )A .劳动生产率为1 000元时,月工资为130元B .劳动生产率提高1 000元时,月工资平均提高80元C .劳动生产率提高1 000元时,月工资平均提高130元D .月工资为210元时,劳动生产率为2 000元2. 实验测得四组(x ,y )的值是(1,2),(2,3),(3,4),(4,5),则y 对x 的线性回归方程是( )A.y ^=x +1 B.y ^=x +2 C.y ^=2x +1 D.y ^=x -13. 已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是 ( )A.y ^=1.23x +4 B.y ^=1.23x +5 C.y ^=1.23x +0.08 D.y ^=0.08x +1.23。
高中数学 3.1 1回归分析的基本思想及其初步应用教案 新人教A版选修选修2-3
2013年高中数学 3.1 1回归分析的基本思想及其初步应用教案新人教A版选修选修2-3【教学目标】在《数学③(必修)》之后,学生已经学习了两个变量之间的相关关系,包括画散点图,最小二乘法求回归直线方程等内容.在人教A版选修1-2第一章第一节“回归分析的基本思想及其初步应用”这一节中进一步介绍回归分析的基本思想及其初步应用.这部分内容《教师用书》共计4课时,第一课时:介绍线性回归模型的数学表达式,解释随机误差项产生的原因,使学生能正确理解回归方程的预报结果;第二课时:从相关系数、相关指数和残差分析角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤;第三课时:介绍两个变量非线性相关关系;第四课时:回归分析的应用. 本节课是第一课时的内容.1、知识目标认识随机误差;2、能力目标(1)会使用函数计算器求回归方程;(2)能正确理解回归方程的预报结果.3、情感目标通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力.教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性.【教学重点】随机误差e的认识【教学难点】随机误差的来源和对预报变量的影响【教学方法】启发式教学法【教学手段】多媒体辅助教学【教学流程】【教学过程设计】【教学反思】通过本节课的教学实践,我再次体会到什么是由“关注知识”转向“关注学生”,在教学过程中,注意到了由“给出知识”转向“引起活动”,由“完成教学任务”转向“促进学生发展”,课堂上的真正主人应该是学生.一堂好课,师生一定会有共同的、积极的情感体验.本节课的教学中,知识点均是学生通过探索“发现”的,学生充分经历了探索与发现的过程.教学中没有以练习为主,而是定位在知识形成过程的探索,注重数学的思想性,如统计思想、随机观念、函数思想、数形结合的思想方法等,引导学生体验数学中的理性精神,加强数学形式下的思考和推理.几点注明:1、复习引入时教师做示范——提供5组身高与体重的数据,用Excel展示如何画散点图、用最小二乘法求线性回归方程.随机抽样并列表如下:2、计算机做散点图的步骤如下:(1)进入Excel软件操作界面,在A1,B1分别输入“身高”和“体重”,在A,B列输入相应的数据.(2)点击“图表向导”图标,进入“图表类型”对话框,选择“标准类型”中的“XY 散点图”,单击“下一步”.(3)在“图表向导”中的“图表数据源”对话框中,选择“系列”选项,单击“添加”按钮添加系列1,在“X值”栏中输入身高所在数据区域,在“Y值”栏中输入体重所在数据区域,单击“下一步”.(4)进入“图表向导”中的图表选项对话框,对图表的一些属性进行设置.(5)单击“完成”按钮.注:也可以直接使用我们提供的文件来给学生演示,相对节约课堂时间.3、学生使用函数计算器求回归方程的过程如下:(学生还会使用更先进的计算器)4、课堂使用的数据如下高二女生前15组数据列表:高二女生中间15组数据列表:高二女生后15组数据列表:课本P2例题1 女大学生8组数据列表:例1.1.1回归分析的基本思想及其初步应用(第1课时)教案说明教材:人民教育出版社A版选修1-2第2页至第4页授课教师:广东省惠州市第一中学刘健1、设计理念《数学课程标准》明确指出:有效的数学学习活动不能单纯地模仿与记忆,动手实践、自主探索与合作交流,可以促进学生自主、全面、可持续的发展,是学生学习数学的重要方式.为使教学真正做到以学生为本,我对教材P2—P3的知识进行了适当地重组和加工,力求给学生提供研究、探讨的时间与空间,让学生充分经历“做数学”的过程,促使学生在自主中求知,在合作中获取,在探究中发展.2、授课内容的数学本质与教学目标定位回归分析,是一种从事物因果关系出发进行预测的方法.操作中,是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程式),预测今后事物发展的趋势.然而,所建立的回归方程与样本点的分布之间还存在有差异,这一差异就是我们本节课学习的主要内容:随机变量.本课的教学目标为:①知识目标认识随机误差e;②能力目标(1)会使用函数计算器求回归方程;(2)能正确理解回归方程的预报结果.③情感目标通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力.教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性.3、学习本课内容的基础以及应用本课内容安排在《数学3(必修)》之后,学生已经学习了两个变量之间的相关关系,包括画散点图,会利用最小二乘法求回归直线方程等内容.以此为基础,进一步讨论一元线性回归模型,分析产生模型中随机误差项的原因,从而让学生了解线性回归模型与函数模型之间的区别与联系,体会统计思维与确定性思维的区别与联系.通过本节课的学习,为后继课程了解偏差平方和分解思想和相关指数的含义、了解相关指数 R2和模型拟合的效果之间的关系、了解残差图的作用,体会什么是回归分析、回归分的必要性,都起到铺垫作用.在本节课的教学中,学生使用了函数计算器,教师则利用电脑Excel表格完成对数据的整理,需要学生有一定的动手能力.4、学习本课内容时容易了解与容易误解的地方由于学生对必修3中的线性回归知识已经熟悉,会抽取样本、会画散点图、会利用最小二乘法求出线性回归方程,所以本节课学生容易了解:(1)从散点图看出,样本点呈条状分布,体重与身高具有线性相关关系,因此可以用线性回归方程来近似刻画它们之间的关系.(2)可以发现样本点并不完全落在回归方程上,有随机误差存在.(3)容易理解由一条回归方程预测到的身高172cm的女生体重不是都一样,它只是一个平均值.在学习过程中,相对不易理解的地方有:(1)对于随机误差的来源,学生是能够从样本的个体差异上来理解的,但是对于由用线性回归模型近似真实模型所引起的误差,学生理解还是有一定困难的.(2)随机误差对预报变量的影响,学生从感性上很好理解,当然是随机误差越小越好.但是从理性上认识,怎样从数据上刻画出随机误差是否变小了呢?学生还有困难.5、本节课的教法特点以及预期效果分析5.1 改造创新教师通过分析教材和学生认知规律,创造性地使用教材,做到既重视教材,更重视学生.具体说来有以下改造:(1)创设生活情景.利用学生的“体检经验”设置问题,既没有脱离课本例题1的相关内容,又能激发学生对数学的亲切感,引发学生看个究竟的冲动,兴趣盎然地投入学习.(2)充分体现随机观念.课本上仅仅希望利用8组数据就要学生体会到统计的思想和后继课程中回归分析的必要性,实在是为难学生了.在本课教学设计学生操作时强调“增多数据,加强比较”. 帮助学生体会“不同事件(如课本例1女大学生和高二女生)”,则统计结果不同、“同一事件(如都是高二女生),采样不同结果也不同”的基本事实.(3)教师的作用. 在这节课里,教师在学生操作结束后,利用更多数据的操作,形成一个与学生结果的对比,这一操作与展示为学生创造了新的思维增长点,引领学生进入更深层领悟.5.2 问题性本课教学以问题引导学习活动,通过恰时恰点地提出问题,提好问题,给学生提问的示范,使他们领悟发现和提出问题的艺术,引导他们更加主动和有兴趣地学,逐步培养学生的问题意识,孕育创新精神.例如,在“结果的分析”中的问题4、“预测出的体重值都不同,那么它还有参考价值吗?”目的是让学生充分认识随机误差e 的来源和对预报变量的影响,而这一问题的提出,立刻吸引学生细细体会随机观念,同时激发出学生的好奇心,提升深入探求的欲望.5.3 合作、探究的学习方式本节课的合作学习体现在两个方面:除了体现在每个小组内部成员之间,还体现在整堂课的教学结构上.小组成员内部提倡“不同的人作不同的事”,面对不同分组,学生可以自主选择的不同工作,动手带动动脑,遇到小的问题,通过探讨和帮助,能做到“学生的问题由学生自己解决”,促进对某一问题更清晰的认识,还能感受到团结合作的好处与必要.同时,每个小组的劳动成果共同构成课堂教学需要的多条回归方程,组与组之间的合作推动整节课的比较与区分得以实现.5.4教学手段本课积极将数学课程与信息技术进行整合,采用多种技术手段,特点主要体现如下:(1)以PPT 为操作平台,界面活泼,操作简单,能有效支持多种其它技术;(2)教师用Excel图表展示,直观形象,节约时间,帮助学生顺利完成学习内容;(3)学生使用函数计算器动手操作,求出回归方程.本课预期:(1)学生可以很好地复习使用函数计算器求回归方程,虽然在要求学生自己操作前教师有一个示例,但是还是会有一少部分人不会使用,所以在教学前要有一定的思想准备,和必要措施.(2)在分析各个组的预测结果为什么有差异时,由于个体经验不同,对问题的挖掘深度产生不同,这时教师的启发引导可能会十分必要,不能完全由学生漫无目的的“讨论”,使学生活动流于形式.(3)“结果分析”前,由学生展示操作成果,这些结果已经够用来说明问题,教师不要急于参与.在“结果分析”的第4个问题中引入教师利用电脑求出的由45 组数据得到的回归方程,让学生再一次通过比较得到新的思考点——怎样知道自己模拟的回归方程身高变化对体重变化影响有多大呢?这样会使学生自然而然渴望进一步了解相关回归分析的知识,为后继课程做好伏笔.对于体现本节课承上启下的作用,可能更好一些.。
人教版高中选修2-3数学3.1回归分析的基本思想及其初步应用教案(2)
两个变量呈现非线性关系,求回归模型的方法一只红铃虫的产卵数y 和温度x 有关.现收集了7组观测数据列于表中:(I )试建立产卵数y 与温度x 之间的回归方程,并预测温度为28C 0时产卵个数(I I )计算所建立的模型中温度在多大程度上解释了产卵数的变化解:由散点图可知样本点并没有分布在某个带状区域内,因此不呈线性相关关系,就不能直接利用线性 回归方程来建立两变量之间的关系用二次函数221C x C y +=来刻画温度x 与产卵数y 的相关性 目前我们只学过对线性方程拟合效果的相关指数故我们需要将二次函数221C x C y +=转化为a bx y +=形式 令2x t =,则221C x C y +=可化化为a bt y +=;相关列表如下:求得y 对t 的线性回归方程为54.202367.0ˆ-=t y 将2x t =代入54.202367.0ˆ-=t y得: 54.202367.0ˆ2-=x y当28=x 时,8554.20228367.0ˆ2≈-⨯=y()()802.0ˆ17127122=---=∑∑==i i i i y y y y R 因此二次函数模型中温度解释了002.80的产卵数变化用指数函数x C e C y 43=来刻画温度x 与产卵数y 的相关性 若令y z ln =可以将x C e C y 43=转化为a bx z +=形式温度x /C 02123 25 27 293235产卵数y /个 7 11212466 115 325温度x /C 0 21 23 2527 29 32 35 温度的平方t 441 529 625 729 841 1024 1225 产卵数y /个7 11212466 115 325对x C e C y 43=两边取对数343ln ln ln ln 4C x C e C y x C +=+=令y z ln =,b C =4,a C =3ln 则有a bx z +=;相关列表如下:求得z 对x 的线性回归方程为849.3272.0ˆ-=x z将272.04=C ,849.3-3e C =代入x C e C y 43=得:849.3272.0ˆ-=x e y当28=x 时,44ˆ849.328272.0≈=-⨯e y利用计算器求得98.02=R因此二次函数模型中温度解释了0098的产卵数变化综上可得用指数模型拟合效果较好,也就是说刻画产卵数与温度的关系更接近实际情况1.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( ) A .总偏差平方和 B .残差平方和 C .回归平方和 D .相关指数R 22.回归分析中,相关指数R 2的值越大,说明残差平方和( )A .越小B .越大C .可能大也可能小D .以上都不对3.若对于变量y 与x 的10组统计数据的回归模型中,相关指数95.02=R ,又知残差平方和为53.120,那么∑=-1012)(i i y y 的值为( ) (A ) 06.241 (B )6.2410 (C )08.253 (D )8.25304.在一次抽样调查中测得样本的5个样本点,数据如下: (1)画出散点图;(2)通过作出的散点图发现,y 与x 之间的关系可用函数a xby +=拟合,试确定a b ,的值 温度x /C 021232527293235y z ln = 1.946 2.398 3.405 3.178 4.19 4.745 5.784 产卵数y /个 7 11 21 24 66 115 325 x 0.25 0.5 1 2 4 y 16 125 2 1。
高中数学新人教版A版精品教案《3.1 回归分析的基本思想及其初步应用》2
回归分析的基本思想及其初步应用一、知识目标:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用,培养学生分析和解决实际问题的能力学生在学习必修3概率统计内容的基础上,有兴趣进一步理解统计的基本思想。
再加上图形计算器的使用,更增加了学生们学习统计的可操作性。
学生们兴趣高涨。
二、教学重、难点:重点:了解线性回归模型与函数模型的区别;回归模型拟合好坏的刻画——相关指数和残差分析。
难点:残差变量的解释;相关指数和残差分析的思想。
三、教学过程:(一)典例分析例1(线性回归问题)从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。
例2(非线性回归问题)一只红铃虫的产卵数和温度有关,现收集了7组观测数据列于下表中,试建立与之间的回归方程。
(三)知识讲解:1、相关定义随机误差残差相关指数2、建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解析变量,哪个变量是预报变量。
(2)画出确定好的解析变量和预报变量的散点图,观察它们之间的关系(3)由经验确定回归方程的类型(4)按一定规则估计回归方程中的参数(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性,等等),过存在异常,则检查数据是否有误,或模型是否合适等。
(四)练习反馈牛刀小试1.设有一个回归方程为y ^=2-2.5x ,当变量x 增加一个单位时( )A .y 平均增加2.5个单位B .y 平均增加2个单位C .y 平均减少2.5个单位D .y 平均减少2个单位2.在两个变量与的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是A .模型1的相关指数R2为B .模型2的相关指数R2为C .模型3的相关指数R2为D .模型4的相关指数R2为3、某班5名学生的数学和物理成绩如表:错误! A B C D E 数学成绩 88 76 73 66 63 物理成绩78657164611画出散点图;2求物理成绩对数学成绩的回归方程;3一名学生的数学成绩是96,试预测他的物理成绩.4、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:编号 1234 5 6 7 8 9 10 零件数/个 10 2021 0 40 50 60 70 80 90 100 加工时间/分6268758189951021081151221建立回归模型,并残差分析,计算相关指数;2你认为这个模型能较好地刻画零件数和加工时间的关系吗? (五)课后作业为了研究某种细菌随时间变化,繁殖的个数,收集数据如下:天数/天 1 2 3 4 5 6 繁殖个数/个612254995190(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图; (2)试求出预报变量对解释变量的回归方程(答案:所求非线性回归方程为)。
高二数学 3.1回归分析的基本思想及其初步应用第2课时教案 新人教版选修2-3
§3.1 回归分析的基本思想及其初步应用(2)xccz21ln+=,你如何得到这个线性回归模型的参数估计?师:提出问题,引导学生分组讨论,启发学生把原变量的观测数据转化为新变量的数据,然后让学生给出每种线性回归模型的参数估计。
生:以组为单位进行数据变换,求参数的最小二乘估计(可以用计算器)解答过程如下:令1ln ca=,2cb=,即bxaz+=分析x与z之间的关系,通过画散点图(如下图),可知x与z之间是存在着线性回归关系,可以用最小二乘法求出线性回归方程bxaz+=列表计算出各个量编号 1 2 3 4 5 6 7 合计温度x/°C21 23 25 27 29 32 35 192产卵数y/个7 11 21 24 66 115 325 569z=ln y1.9462.3983.0453.1784.194.7455.78425.285x i2441 529 625 729 841 1024 1225 5414x i z i40.9 55.2 76.1 85.8121.5151.8202.4733.7=x27.429 =z 3.612∑==niix125414 ∑==niyiyx1733.71272.043.277541461.343.2777.733ˆ22121=⨯-⨯⨯-=--=∑∑==x nxz x nzxbniiniii843.3ˆˆ-=⋅-=xbza使学生熟悉线性回归模型的参数估计的方法得出红铃虫的产卵数y与温度x的模型843.3272.0ˆ-=x z问题七:我们的目标是建立红铃虫的产卵数y 与温度x 的模型,如何使得到的线性回归模型再变回红铃虫的产卵数y 与温度x 的模型?师:提出问题。
生:进行变换,每组得到红铃虫的产卵数y 与温度x 的模型。
因为y z ln =,所以843.3272.0ˆln -=x y,即843.3272.0ˆ-=x e y 。
四、练习1. 试对下列非线性模型进行适当的变形,使之线性化 ⑴axe y =; ⑵b xay +=解:⑴对axe y =两边取自然对数,即e ax y e y axln ln ln ln =⇒=令y z ln =,则有ax z =⑵令xt 1=,则有b at y += 巩固知识五、小结1. 初步了解用残差平方和如何评价模型拟合效果的好坏; 2. 注意回归方程适用的范围、时间。
高二数学(选修-人教A版)-回归分析的基本思想及其初步应用(2)-教案
4.指标R2:
在统计学中,将回归平方和与总偏差平方和的比值叫做决定系数,用R2表示.
即 .
注:三者的关系为:回归平方和=总偏差平方和-残差平方和.
(1)总偏差平方和:所有单个样本值与样本均值差的平方和,即 .
(2)残差平方和:回归值与样本值差的平方和,即 .
(4)按一定规则(如最小二乘法)估计回归方程中的参数.
(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等),若存在异常,则检查数据是否有误,或模型是否合适等.
通过对例题的讲解,使学生再一次尝试解决具体问题,并巩固所学知识.
判断变量间是否具有相关关系,培养学生的识图能力.
通过残差来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析.
探究1:如何通过残差来分析模型的拟合效果呢?
残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.
探究2:通过残差表或残差图判断模型拟合的效果是直观判断,如何精确判断模型拟合的效果呢?
(1)作年份和人口总数的散点图,根据该图猜想它们之间的关系应该是什么形式;
(2)建立年份为解释变量,人口总数为预报变量的回归模型,并计算残差;
(3)计算R2,你认为这个模型能较好地刻画年份和人口总数之间的关系吗?请说明理由.
解:(1)将解释变量年份作为横轴,预报变量人口总数作为纵轴绘制散点图如下:
根据散点图,可以认为中国人口总数与年份呈现很强的线性相关关系,因此选用线性回归模型建立回归方程.
巩固残差的定义,并熟练残差的求解过程.
从残差分析和指标 的角度探究模型的拟合效果问题,学以致用.
人教版高中选修2-33.1回归分析的基本思想及其初步应用课程设计 (2)
人教版高中选修2-33.1 回归分析的基本思想及其初步应用课程设计一、课程设计背景和目的《人教版高中选修2》是高中阶段的一门重要课程,涉及到较为复杂的数学知识和方法,需要学生们认真学习和掌握。
其中第33章“统计学基础(一)”中的第1节“回归分析的基本思想及其初步应用”是课程内容中比较重要的一部分。
通过本节课程的学习,可以帮助学生掌握回归分析这一重要的统计学方法,建立相关的模型,进行数据预测和分析以及决策制定。
本次课程设计的目的是通过教学手段,让学生掌握回归分析的基本思想,熟悉如何建立回归模型,并能在实际问题中应用回归分析方法解决问题。
在课堂上通过实例演示,引导学生独立思考和合作探究,提高学生的实际分析问题能力,拓宽学生的视野和思维方式。
二、课程设计内容和步骤1.课程设计内容:•回归分析的基本思想•如何进行回归分析•回归分析的应用实例2.课程设计步骤:Step 1:回归分析的基本思想在本节课程中,我们将首先介绍回归分析的基本思想。
通过给出一个实例,让学生能够了解回归分析的实际应用,引导学生思考问题产生的背景和根源。
通过精心设计的问题引导,让学生自主探索回归分析的基本思想,理解回归分析的本质和研究方法。
Step 2:如何进行回归分析通过讲解回归分析的计算步骤及实例演示,让学生掌握如何建立回归模型,如何计算回归系数、残差等。
同时,要求学生能够运用回归模型进行数据分析和预测,并感受回归分析在实际问题解决中的重要作用。
Step 3:回归分析的应用实例通过实际案例演示让学生了解回归分析在社会、企业等领域的实际应用。
并引导学生思考在其它领域中,如何将回归分析方法应用到实际问题中解决。
三、教学方法和手段为了使课程更具标志性和互动性,本次课程设计采用了多种教学方法和手段:•组织以小组为单位的讨论活动,让学生通过探究问题和交流思路,提高团队协作意识和解决问题能力。
•通过多媒体、黑板演示、幻灯片等方式展示引导学生理解和掌握回归分析的基本思想和应用方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§3.1 回归分析的基本思想及其初步应用(2)
【学情分析】:
教学对象是高二理科学生,学生已掌握建立线性回归模型的知识,并能用所学知识解决一些简单的实际问题。
在教学中,要结合实例,让学生了解随机误差产生的原因。
初步了解可以通过求回归模型的相关指数或利用残差分析不同的回归模型的拟合精确度。
在起点高的班级中通过让学生观察、思考与讨论,进一步体会回归分析中的数理计算,及运用相关指数与残差分析来刻画模型拟合效果,初步形成运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。
【教学目标】:
(1)知识与技能:了解求线形回归方程的两个计算公式的推导过程,、回归平方和;了解随机误差产生的原因;了解判断刻画模型拟合效果的方法——相关指数和残差分析;了解非线
性模型通过变换转化为线性回归模型。
(2)过程与方法:本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线方程,从中也找出存在的不足,从而有进行回归分析的必要性,进而学习相关指数,
用相关指数来刻画回归的效果。
(3)情感态度与价值观:从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求知欲,
培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进
取。
【教学重点】:
1.了解判断刻画模型拟合效果的方法——相关指数和残差分析;
2.通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型。
【教学难点】:
1.了解随机误差产生的原因,用残差平方和衡量回归方程的预报精度;
2.了解判断刻画模型拟合效果的方法——相关指数和残差分析。
列表计算出各个量
编号 1 2 3 4 5
温度
/°C
21 23 25 27 29
产卵数y/
个
7 11 21 24 66 115
=ln y 1.94
6
2.39
8
3.04
5
3.17
8
4.19
4.74
x i2441 529 625 729 841 1024
x i z i40.9 55.2 76.1 85.8 121.
5
151.
练习与测试
1. 下面4 个散点图中,不适合用线性回归模型拟合其中两个变量的是( A )
A .
B .
C .
D .
2. 将非线性模型x e y 32=进行适当变形使之线性化。
答案:2ln 32ln ln 3ln +=⇒+=x z e x y
3. 已知回归方程35.0log 21.1ˆ2-=x y
,则样本点P (4,2.71)的残差为________________。
答案:()56.015.271.235.04log 2.171.2ˆˆ2=-=--=-=y y e
4. 已知线性相关的两变量x ,y 的三个样本点A (0,0),B (1,3),C (4,11),若用直线AB 作为其预
测模型,则点C 的残差是________。
答案:x y
AB 3ˆ=,12ˆ=C y ,1ˆ=C e 。
5. 若一组观测值(x 1,y 1)、(x 2,y 2)、…、(x n ,y n )之间满足y i =bx i +a +e i (i =1、2. …n)若e i 恒为0,则R 2
为
答案:1
6. 已知线性相关的两变量x ,y 的三个样本点A (0,0),B (1,3),C (4,11),若用直线AB 作为其预
测模型,则其相关指数=2
R ________。
答案:x y
AB 3ˆ=,7=y ,0ˆ1=y ,3ˆ2=y ,12ˆ3=y 7ˆ1-=-y y
,4ˆ2-=-y y ,5ˆ3=-y y 0ˆ1=e
,0ˆ2=e ,1ˆ3=e 989.090
1
12≈-
=R 7. 现有一个由身高预测体重的回归方程:体重预测值=4(磅/英寸)×身高-130(磅)。
其中体重和身
高分别以磅和英寸为单位,已知1英寸≈2.5 cm ,1磅≈0.45 kg ,则该回归方程应该是______________。
答案:体重预测值=0.72(kg / cm )×身高-58.5(kg )。