最新高中数学选修2-3《回归分析的初步应用--探究非线性回归模型》教案精编版
人教版高中选修2-33.1回归分析的基本思想及其初步应用课程设计 (2)

人教版高中选修2-33.1 回归分析的基本思想及其初步应用课程设计一、课程设计背景和目的《人教版高中选修2》是高中阶段的一门重要课程,涉及到较为复杂的数学知识和方法,需要学生们认真学习和掌握。
其中第33章“统计学基础(一)”中的第1节“回归分析的基本思想及其初步应用”是课程内容中比较重要的一部分。
通过本节课程的学习,可以帮助学生掌握回归分析这一重要的统计学方法,建立相关的模型,进行数据预测和分析以及决策制定。
本次课程设计的目的是通过教学手段,让学生掌握回归分析的基本思想,熟悉如何建立回归模型,并能在实际问题中应用回归分析方法解决问题。
在课堂上通过实例演示,引导学生独立思考和合作探究,提高学生的实际分析问题能力,拓宽学生的视野和思维方式。
二、课程设计内容和步骤1.课程设计内容:•回归分析的基本思想•如何进行回归分析•回归分析的应用实例2.课程设计步骤:Step 1:回归分析的基本思想在本节课程中,我们将首先介绍回归分析的基本思想。
通过给出一个实例,让学生能够了解回归分析的实际应用,引导学生思考问题产生的背景和根源。
通过精心设计的问题引导,让学生自主探索回归分析的基本思想,理解回归分析的本质和研究方法。
Step 2:如何进行回归分析通过讲解回归分析的计算步骤及实例演示,让学生掌握如何建立回归模型,如何计算回归系数、残差等。
同时,要求学生能够运用回归模型进行数据分析和预测,并感受回归分析在实际问题解决中的重要作用。
Step 3:回归分析的应用实例通过实际案例演示让学生了解回归分析在社会、企业等领域的实际应用。
并引导学生思考在其它领域中,如何将回归分析方法应用到实际问题中解决。
三、教学方法和手段为了使课程更具标志性和互动性,本次课程设计采用了多种教学方法和手段:•组织以小组为单位的讨论活动,让学生通过探究问题和交流思路,提高团队协作意识和解决问题能力。
•通过多媒体、黑板演示、幻灯片等方式展示引导学生理解和掌握回归分析的基本思想和应用方法。
高中数学 第三章《回归分析》教案1 新人教A版选修2-3

§3.2 回归分析(1)教学目标(1)通过实例引入线性回归模型,感受产生随机误差的原因;(2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法; (3)能求出简单实际问题的线性回归方程. 教学重点,难点线性回归模型的建立和线性回归系数的最佳估计值的探求方法. 教学过程 一.问题情境1. 情境:对一作直线运动的质点的运动过程观测了8次,得到如下表所示的数据,试估计当x=9时的位置y 的值. 时刻x /s 12 3 4 5 6 7 8 位置观测值y /cm5.54 7.52 10.02 11.73 15.69 16.12 16.98 21.06根据《数学3(必修)》中的有关内容,解决这个问题的方法是: 先作散点图,如下图所示:从散点图中可以看出,样本点呈直线趋势,时间x 与位置观测值y 之间有着较好的线性关系.因此可以用线性回归方程来刻画它们之间的关系.根据线性回归的系数公式,1221()ni i i ni i x y nx y b x n x a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑ 可以得到线性回归方为 3.5361 2.1214y x =+,所以当9x =时,由线性回归方程可以估计其位置值为22.6287y =2.问题:在时刻9x =时,质点的运动位置一定是22.6287cm 吗?二.学生活动思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映x 与y 之间的关系,y 的值不能由x 完全确定,它们之间是统计相关关系,y 的实际值与估计值之间存在着误差. 三.建构数学1.线性回归模型的定义:我们将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型. 说明:(1)产生随机误差的主要原因有:①所用的确定性函数不恰当引起的误差; ②忽略了某些因素的影响; ③存在观测误差.(2)对于线性回归模型,我们应该考虑下面两个问题: ①模型是否合理(这个问题在下一节课解决); ②在模型合理的情况下,如何估计a ,b ? 2.探求线性回归系数的最佳估计值:对于问题②,设有n 对观测数据(,)i i x y (1,2,3,,)i n =,根据线性回归模型,对于每一个i x ,对应的随机误差项()i i i y a bx ε=-+,我们希望总误差越小越好,即要使21nii ε=∑越小越好.所以,只要求出使21(,)()niii Q y x αββα==--∑取得最小值时的α,β值作为a ,b 的估计值,记为a ,b .注:这里的i ε就是拟合直线上的点(),i i x a bx +到点(),i i i P x y 的距离. 用什么方法求a ,b ?回忆《数学3(必修)》“2.4线性回归方程”P71“热茶问题”中求a ,b 的方法:最小二乘法.利用最小二乘法可以得到a ,b 的计算公式为1122211()()()()nni i i ii i n ni ii i x x y y x y nx yb x x xn x a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑,其中11n i i x x n ==∑,11ni i y y n ==∑由此得到的直线y a bx =+就称为这n 对数据的回归直线,此直线方程即为线性回归方程.其中a ,b 分别为a ,b 的估计值,a 称为回归截距,b 称为回归系数,y 称为回归值.在前面质点运动的线性回归方程 3.5361 2.1214y x =+中, 3.5361a =, 2.1214b =. 3. 线性回归方程y a bx =+中a ,b 的意义是:以a 为基数,x 每增加1个单位,y 相应地平均增加b 个单位;4. 化归思想(转化思想)在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式. (1)b y a x =+,令'y y =,1'x x=,则有''y a bx =+. (2)by ax =,令'ln y y =,'ln x x =,'ln a a =,则有'''y a bx =+. (3)bxy ae =,令'ln y y =,'x x =,'ln a a =,则有'''y a bx =+. (4)b x y ae =,令'ln y y =,1'x x=,'ln a a =,则有'''y a bx =+. (5)ln y a b x =+,令'y y =,'ln x x =,则有''y a bx =+.四.数学运用 1.例题:例1.下表给出了我国从1949年至1999年人口数据资料,试根据表中数据估计我国2004年的人口数.年份1949 1954 1959 1964 1969 1974 1979 1984 1989 1994 1999人口数/百万 542 603 672 705 807 909 975 1035 1107 1177 1246解:为了简化数据,先将年份减去1949,并将所得值用x 表示,对应人口数用y 表示,x 0 5 10 15 20 25 30 35 40 45 50 y 542 603 672 705 807 909 975 1035 1107 1177 1246 作出11个点(),x y 构成的散点图,由图可知,这些点在一条直线附近,可以用线性回归模型y a bx ε=++来表示它们之间的关系.根据公式(1)可得14.453,527.591.b a ⎧≈⎪⎨≈⎪⎩ 这里的,a b 分别为,a b 的估 计值,因此线性回归方程 为527.59114.453y x =+由于2004年对应的55x =,代入线性回归方程527.59114.453y x =+可得1322.506y =(百万),即2004年的人口总数估计为13.23亿. 例2. 某地区对本地的企业进行了一次抽样调查,下表是这次抽查中所得到的各企业的人均资本x (万元)与人均产出y (万元)的数据: 人均 资本 x /万元3 4 5.5 6.5 7 8 9 10.5 11.5 14人均 产出 y /万元4.12 4.67 8.68 11.01 13.04 14.43 17.50 25.46 26.66 45.20 (1)设y 与x 之间具有近似关系by ax ≈(,a b 为常数),试根据表中数据估计a 和b 的值;(2)估计企业人均资本为16万元时的人均产出(精确到0.01).分析:根据x ,y 所具有的关系可知,此问题不是线性回归问题,不能直接用线性回归方程处理.但由对数运算的性质可知,只要对by ax ≈的两边取对数,就能将其转化为线性关系.解(1)在by ax ≈的两边取常用对数,可得lg lg lg y a b x ≈+,设lg y z =,lg a A =,lg x X =,则z A bX ≈+.相关数据计算如图327--所示.仿照问题情境可得A ,b 的估计值A ,b 分别为0.2155,1.5677,A b ⎧=-⎪⎨=⎪⎩由lg 0.2155a =-可得0.6088a ≈,即a ,b 的估计值分别为0.6088和1.5677.(2)由(1)知 1.56770.6088y x =.样本数据及回归曲线的图形如图328--(见书本102P页)当16x =时, 1.56770.60881647.01y =⨯≈(万元),故当企业人均资本为16万元时,A BCDEFGHIJ1 人均资本x /万元 345.56.578910.511.52 人均产出y /万元4.12 4.67 8.68 11.01 13.04 14.43 17.5 25.46 26.66 43 lg X x = 0.47712 0.60206 0.74036 0.81291 0.8451 0.90309 0.95424 1.02119 1.0607 1.人均产值约为47.01万元.。
最新人教版高中数学选修2-3《回归分析的基本思想及其初步应用》示范教案(第2课时)

第二课时教学目标知识与技能从相关指数和残差分析角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤.过程与方法在发现直接求回归直线方程存在缺陷的基础上,引导学生去发现解决问题的新思路——进行回归分析,进而介绍残差分析的方法和利用R2来表示解释变量对于预报变量变化的贡献率.情感、态度与价值观通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,掌握处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识解决实际问题的能力.教学中适当地利用学生的合作与交流,使学生在学习的同时,体会与他人合作的重要性.重点难点教学重点:从残差分析、相关指数角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤;教学难点:了解评价回归效果的两个统计量:相关指数、残差和残差平方和.教学过程引入新课上表是上一节课我们从某大学选取8名女大学生其身高和体重数据组成的数据表,在上一节课中我们通过数据建立了回归直线方程,并根据方程预测了身高为172 cm的女大学生的体重.当时,我们提到根据回归直线方程求得的体重数据,仅是一个估计值,其与真实值之间存在着误差,为了综合分析身高和体重的关系,我们引入了线性回归模型y=bx+a+e 来表示两变量之间的关系,其中e为随机变量,又称随机误差.线性回归模型y=bx+a+e 增加了随机误差项e,因变量y的值由自变量x和随机误差e共同确定.假设随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图中所有的点将完全落在回归直线上.但是,在图中,数据点并没有完全落在回归直线上.这些点散布在回归直线附近,所以一定是随机误差把这些点从回归直线上“推”开了,即自变量x只能解释部分y的变化.同学们考虑一下,随机变量e的均值是多少?方差又是多少?活动设计:学生思考回答问题.学情预测:学生回答E(e)=0,D(e)=σ2>0.教师提问:能否通过D(e)来刻画线性回归模型的拟合程度?学情预测:随机误差e的方差越小,通过回归直线预报真实值y的精度越高.随机误差是引起预报值与真实值y之间的误差的原因之一,其大小取决于随机误差的方差.设计意图:说明研究随机误差e的必要性,通过研究随机误差e可以分析预报值的可信度.提出问题:既然可以用随机变量e的方差来衡量随机误差的大小,即通过方差σ2来刻画预报变量(体重)的变化在多大程度上与随机误差有关,那么如何获得方差σ2呢?学生活动:学生独立思考,小组合作交流讨论.活动结果:可以采用抽样统计的思想,通过随机变量e的样本来估计σ2的大小.设计目的:复习抽样统计思想,以便通过随机变量e 的样本来估计总体. 探究新知提出问题:既然e 表示了除解释变量以外其他各种影响预报值的因素带来的误差,那么如何获得e 的样本来计算σ2呢?学生活动:分组合作讨论交流.学情预测:由函数模型y ^=b ^x +a ^和回归模型y =bx +a +e 可知e =y -y ^,这样根据图表中女大学生的身高求出预报值,再与真实值作差,即可求得e 的一个估计值.教师:由于在计算回归直线方程时,利用公式求得的b ^和a ^为斜率和截距的估计值,它们与真实值a 和b 之间存在误差,因此y ^是估计值,所以e ^=y -y ^也是一个估计值.由上可知,对于样本点(x 1,y 1),(x 2,y 2),…,(x n ,y n )而言,它们的随机误差为e i =y i -bx i -a ,i =1,2,…n ,称其估计值e ^i =y i -y ^i 为相应于点(x i ,y i )的残差.将所有残差的平方加起来,即∑i =1ne ^2i ,这个和称作残差平方和.类比样本方差估计总体方差的思想,可以用σ^2=1n -2∑i =1n e ^ 2i =1n -2∑i =1n(y i -y ^i )2(n>2) 作为σ2的估计量,通常,σ^2越小,预报精度越高.这样,当我们求得回归直线方程后,可以通过残差来判断模型拟合程度的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析.设计目的:通过问题诱思,引入残差概念. 理解新知提出问题:对照女大学生的身高和体重的原始数据,结合求出的回归直线方程,求出相应的残差数据.学生活动:独立完成.样的散点图称作残差图).学生活动:分组合作,共同完成. 活动结果:残差图提出问题:观察上面的残差图,你认为哪几个样本点在采集时可能存在人为的错误?为什么?学生活动:分组讨论. 活动结果:第一个和第六个样本点在采集过程中可能存在错误,因为其他的样本点基本都集中在一个区域内,只有这两个样本点的残差比较大,相对其他样本点来说,分布得较为分散.提出问题:如何从残差图来判断模型的拟合程度? 学生活动:独立思考也可相互讨论.活动结果:因为σ^2越小,预报精度越高,即模型的拟合程度越高,而σ^2越小,e ^的取值越集中,故若残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适,且带状区域的宽度越窄,说明拟合精度越高,回归直线的预报精度越高.教师:在统计学上,人们经常用相关指数R 2来刻画回归的效果,其计算公式是:R 2=1-∑i =1n(y i -y ^i )2∑i =1n(y i -y )2提出问题:分析上面计算相关指数R 2的公式,如何根据R 2来判断模型的拟合效果? 学生活动:独立思考也可相互讨论,教师加以适当的引导提示.活动结果:因为对于确定的样本数据而言,∑i =1n(y i -y )2是一个定值,故R 2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.提出问题:在线性回归模型中,R 2表示解释变量对于预报变量变化的贡献率,R 2越接近1,表示回归的效果越好,即解释变量和预报变量的线性相关性越强,试计算关于女大学生身高与体重问题中的相关指数R 2.学生活动:学生独立计算获得数据. 活动结果:R 2≈0.64.根据R 2≈0.64就可得出“女大学生的身高解释了64%的体重变化”,或者说“女大学生的体重差异有64%是由身高引起的”.由此就不难理解为什么预报体重和真实值之间有差距了.设计目的:结合图象,让学生直观感受残差图在刻画回归模型拟合效果方面的应用,体会残差分析和相关指数的意义.提出问题:根据前面得到的回归方程,能否预测一名美国女大学生的体重?建立回归模型后能否一劳永逸,在若干年后还可以使用,或者适用于多年以前的女大学生体重预测?学生活动:讨论交流总结发言.活动结果:在使用回归方程进行预报时要注意: (1)回归方程只适用于我们所研究的样本的总体; (2)我们建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预报值就是预报变量的精确值.提出问题:结合我们刚学习的概念,现在能否将建立回归模型的步骤补充完整? 学生活动:讨论交流,合作完成.活动结果:一般地,建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程). (4)按一定规则(如最小二乘法)估计回归方程中的参数.(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,或残差呈现不随机的规律性,等等).若存在异常,则检查数据是否有误,或模型是否合适等.设计意图:设计问题,让学生讨论分析,得出使用回归方程进行预报需注意的问题,并让学生完善建立回归模型的步骤.在这个过程中,教师不宜做太多引导,要放手给学生,让学生讨论,充分参与进来.运用新知例1一个车间为了规定工时定额,需确定加工零件所花费的时间,为此进行了10次试(1)建立零件数为解释变量,加工时间为预报变量的回归模型,并计算残差; (2)你认为这个模型能较好地刻画零件数和加工时间的关系吗? 分析:首先根据散点图粗略判断变量是否具有线性相关性,判断是否可以用线性回归模型来拟合数据,然后通过残差e ^1,e ^2,…,e ^n 来判断模型拟合的效果,判断原始数据是否存在可疑数据.解:(1)根据表中数据作出散点图如下:散点图由散点图可知变量之间具有线性相关关系,可以通过求线性回归方程来拟合数据.根据公式可求得加工时间对零件数的线性回归方程为y ^=0.668x +54.96.残差数据如下表:残差图由图可知,残差点分布较均匀,即用上述回归模型拟合数据效果很好,但需注意,由残差图也可以看出,第4个样本点和第5个样本点残差较大,需要确认在采集这两个样本点的过程中是否有人为的错误.点评:由散点图判断两个变量的线性相关关系,误差较大,利用残差图可以较好地评价模型的拟合程度,并能发现样本点中的可疑数据.【变练演编】例2求出y 对x 的回归方程,并说明拟合效果的好坏.思路分析:先根据散点图判断两个变量是否线性相关,若相关,求出回归直线方程,然后通过相关指数的大小来评价拟合效果的好坏.解:作出散点图:从作出的散点图可以看出,这些点在一条直线附近,可用线性回归模型来拟合数据.由数据可得x =18,y =45.4,由计算公式得b ^=-2.35,a ^=y -b ^x =87.7.故y 对x 的回归方程为y ^=-2.35x +87.7,列表:所以∑i =15(y i -y ^i )2=8.3,∑i =15(y i -y )2=229.2.相关指数R 2=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2≈0.946.因为0.964很接近1,所以该模型的拟合效果很好.变式1:若要分析是否在上述样本的采集过程中存在可疑数据,应如何分析? 活动设计:学生分组讨论,回顾课本解答问题. 活动成果:可以画出残差图来进行分析.变式2:既然利用残差图和相关指数都能够评价回归模型的拟合效果,能否总结一下两种方法各自的特点?活动成果:利用残差图可以直观展示拟合的效果,而且还可以发现样本数据中的可疑数据;而相关指数是把对拟合效果的评价转换为数值大小的判断,易于量化处理,并能在数量上表现解释变量对于预报变量变化的贡献率.设计意图:进一步熟悉判断拟合效果的方法以及各自的特点. 【达标检测】1.分析下列残差图,所选用的回归模型效果最好的是()ABC D 2.下列说法正确的是( )①回归直线方程适用于一切样本和总体;②回归直线方程一般都有时间性;③样本的取值范围会影响回归直线方程的适用范围;④根据回归直线方程得到的预测值是预测变量的精确值.A .①③④B .②③C .①②D .③④3.在研究气温和热茶销售杯数的关系时,若求得相关指数R 2≈__________,表明“气温解释了85%的热茶销售杯数变化”或者说“热茶销售杯数差异有85%是由气温引起的”.答案:1.D 2.B 3.0.85.课堂小结学生回顾本节课学习的内容,尝试总结,然后不充分的地方由学生相互补充,最后在老师的引导下,用精炼的语言进行概括:1.判断变量是否线性相关的方法以及各自的特点; 2.在运用回归模型时需注意的事项; 3.建立回归模型的基本步骤. 设计意图:让学生自己小结,这是一个多维整合的过程,是一个高层次的自我认识过程. 补充练习 【基础练习】1.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适.②用相关指数R 2来刻画回归的效果,R 2值越接近于1,说明模型的拟合效果越好.③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.正确的是( )A .①②B .②③C .①③D .①②③2.甲、乙、丙、丁四位同学各自对A ,B 两变量做回归分析,分别得到散点图与残差平方和∑i =1n(y i -y ^i )2如下表115106124103哪位同学的实验结果体现拟合A ,B 两变量关系的模型拟合精度高?( ) A .甲 B .乙 C .丙D .丁 3.关于x 与y 为了对x ,y 两个变量进行统计分析,现有以下两种线性模型:甲:y ^=6.6x +17.5,乙:y ^=7x +17.试比较哪一个模型拟合效果更好.答案或提示:1.D 2.D3.解析:设甲模型的相关指数为R 21,则R 21=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2=1-1551 000=0.845;设乙模型的相关指数为R 22,则可求得R 22=0.82,因为R 21>R 22,所以甲模型的拟合效果更好.【拓展练习】 4.假设某种农作物基本苗数x 与有效穗数y 之间存在相关关系,今测得5组数据如下:(1)以x 为解释变量,y 为预报变量,作出散点图;(2)求y 与x 之间的回归方程,对于基本苗数56.7预报有效穗数. (3)计算各组残差;(4)求R 2,并说明随机误差对有效穗数的影响占百分之几? 解:(1)散点图如图:(2)由图可以看出,样本点呈条状分布,有比较好的线性相关关系,因此可用线性回归方程来建立两个变量之间的关系.设线性回归方程为y ^=b ^x +a ^,由数据可以求得:b ^≈0.291,a ^=y -b ^x =34.67.故所求的线性回归方程为y ^=0.291x +34.67.当x =56.7时,y ^=0.291×56.7+34.67=51.169 7. 估计有效穗数为51.169 7.(3)各组数据的残差分别是e ^1≈0.37,e ^2≈0.72,e ^3≈-0.5,e ^4≈-2.22,e ^5≈1.61. (4)残差平方和:∑i =15(y i -y ^i )2=8.425 8,又∑i =15(y i -y )2=50.18,∴R 2=1-∑i =15(y i -y ^i )2∑i =15 (y i -y )2=1-8.425 850.18≈0.832.即解释变量(农作物基本苗数)对有效穗数的影响约占了83.2%,所以随机误差对有效穗数的影响约占1-83.2%=16.8%.设计说明 本课时从上一节课的案例出发,通过分析随机误差产生的原因,引入随机变量、残差、残差平方和、相关指数的有关概念,从相关指数和残差分析等角度探讨回归模型拟合的效果,并通过案例说明利用所建立的回归模型进行预报时需要注意的问题,然后总结建立回归模型的基本步骤.在教学过程中以问题为引导思考的动机,注重对学生合作意识的培养,通过对案例的分析,培养学生对数据的处理能力,让学生初步了解回归分析思想在实际生活中的运用.备课资料有关总偏差平方和、回归平方和、残差平方和以及相关指数等概念的说明 1.总偏差平方和:SST =∑i =1n(y i -y )2,刻画了预报变量y 的变化剧烈程度.2.回归平方和:SSR =∑i =1n(y ^i -y )2,公式中所有预测值的平均值也等于y ,故1n ∑i =1n y ^ i =1n ∑i =1n (b ^x i +a ^ )=b ^ x +a ^ =b ^ x +y -b ^x =y , 因此回归平方和又可以写成.从而回归平方和刻画了估计量y ^=a ^+b ^x 的变化程度.由于估计量由解释变量x 所决定,所以,回归平方和刻画了预报变量的变化中由解释变量通过线性回归模型引起的那一部分的变化程度.3.残差平方和:SSE =∑i =1n(y i -y ^i )2,刻画了残差变量变化的程度.4.偏差平方和分解:即指公式∑i =1n(y i -y )2=∑i =1n(y ^i -y )2+∑i =1n(y i -y ^i )2,称为平方和分解公式,用文字表示为: 总偏差平方和=回归平方和+残差平方和. 公式证明如下:假设观测数据为(x i ,y i ),i =1,2,…,n ,则∑i =1n(y i -y )2=∑i =1n(y i -y ^i +y ^i -y )2=∑i =1n(y i -y )2+∑i =1n(y i -y ^i )2+2∑i =1n(y ^ i -y )(y i -y ^i ).而∑i =1n(y ^ i -y )(y i -y ^i )=∑i =1n(b ^ x i -b ^ x )(y i -a ^ -b ^x i )=∑i =1nb ^(x i -x )[]y i -a ^ -b ^x -b(x i -x )=b ^∑i =1n(x i -x )[](y i -y )-b ^(x i -x )=b ^⎣⎢⎢⎡⎦⎥⎥⎤∑i =1n (x i-x )(y i -y )-b ^ ∑i =1n (x i -x )2=0, 代入上式即可证得平方和分解公式. 这样,可以把平方和分解公式解释为:预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量引起的变化程度之和.由平方和分解公式得1=∑i =1n(y ^i -y )2∑i =1n(y i -y )2+∑i =1n(y i -y ^i )2∑i =1n(y i -y )2这意味着在线性回归模型中,预报变量的1个单位的变化,需要由解释变量贡献∑i =1n(y ^i -y )2∑i =1n(y i -y )2,由残差变量贡献∑i =1n(y i -y ^i )2∑i =1n(y i -y )2,因此在线性回归模型中,我们说预报变量y的变化中的100×∑i =1n(y ^i -y )2∑i =1n(y i -y )2%是由解释变量x 所引起的,或者说解释变量x 可以解释预报变量y 的100×∑i =1n(y ^i -y )2∑i =1n(y i -y )2%的变化.又∑i =1n(y ^i -y )2∑i =1n(y i -y )2=1-∑i =1n(y i -y ^i )2∑i =1n(y i -y )2=R 2,即R 2=∑i =1n(y ^i -y )2∑i =1n(y i -y )2,这说明“预报变量y 的变化中的百分之100R 2是由解释变量x 所引起的,或者说解释变量x 可以解释预报变量y 的百分之100R 2的变化.因此,R 2越大拟合效果越好,反之越小.(设计者:杨雪峰)。
高中数学选修2-3精品教案8:§3.1 回归分析的基本思想及其初步应用教学设计

§3.1 回归分析的基本思想及其初步应用教学目标知识与技能能根据散点分布特点,建立不同的回归模型;知道有些非线性模型通过变换可以转化为线性回归模型;通过散点图及相关指数比较不同模型的拟合效果.过程与方法通过将非线性模型转化为线性回归模型,使学生体会“转化”的思想;让学生经历数据处理的过程,培养他们对数据的直观感觉,体会统计方法的特点,认识统计方法的应用;通过使用转化后的数据,利用计算器求相关指数,使学生体会使用计算器处理数据的方法.情感、态度与价值观通过案例的解决,开阔学生的思路,培养学生的探索精神和转化能力,并通过合作学习,培养学生的团队合作意识.重点难点教学重点:通过探究使学生体会有些非线性模型运用等量变换、对数变换可以转化为线性回归模型;教学难点:如何启发学生“对变量作适当的变换(等量变换、对数变换)”,变非线性为线性,建立线性回归模型.教学过程引入背景材料我国是世界产棉大国,种植棉花是我国很多地区农民的主要经济来源,在棉花的种植过程中,病虫害的防治是棉农的一项重要任务,如果处置不当就会造成棉花的减产.其中红铃虫就是危害棉花生长的一种常见害虫,在1953年,我国18省曾发生红铃虫大灾害,受灾面积300万公顷,损失皮棉约二十万吨.如图就是红铃虫的有关图片:红铃虫喜高温高湿,适宜各虫态发育的温度为25~32 ℃,相对湿度为80%~100%,低于20 ℃和高于35 ℃卵不能孵化,相对湿度60%以下成虫不产卵.冬季月平均气温低于-4.8 ℃时,红铃虫就不能越冬而被冻死.为采取有效防治方法,有必要研究红铃虫的产卵数和温度之间的关系.现收集了红铃虫的产卵数y和温度x之间的7组观测数据列于下表:温度x/℃21 23 25 27 29 32 35产卵数y/个7 11 21 24 66 115 325(1)试建立y与x之间的回归方程;并预测温度为28 ℃时产卵的数目.(2)你所建立的模型中温度在多大程度上解释了产卵数的变化?学生活动:类比前面所学过的建立线性回归模型的步骤,动手实施.活动结果:(1)画散点图:通过计算器求得线性回归方程:y ^=19.87x -463.73.当x =28 ℃时,y ^=19.87×28-463.73≈93,即温度为28 ℃时,产卵数大约为93. (2)进行回归分析计算得: R 2≈0.746 4,即这个线性回归模型中温度解释了74.64%产卵数的变化.设计目的:通过背景材料,加深学生对问题的理解,并明白“为什么要学”.体会问题产生于生活,并通过问题的解决复习建立回归模型的基本步骤.探究新知提出问题:结合数据可以发现,随着自变量的增加,因变量也随之增加,气温为28 ℃时,估计产卵数应该低于66个,但是从推算的结果来看93个比66个却多了27个,是什么原因造成的呢?学生活动:分组合作讨论交流.学情预测:由于我们所建立的线性回归模型的相关指数约等于0.746 4,即解释变量仅能解释预报变量大约74.64%的变化,所占比例偏小.这样根据我们建立的模型进行预报,会存在较大的误差.我们还可以从残差图上分析一下我们所建立的回归模型的拟合效果:残差数据表: x 21 23 25 27 29 32 35 y 7 11 21 24 66 115 325 残差53.4617.72-12.02-48.78-46.5-57.1193.28画出残差图根据残差图可以发现,残差点分布的带状区域较宽,并不集中,这表明我们所建立的回归模型拟合效果并不理想.之所以造成预报值偏差太大的原因是所选模型并不理想.实际上根据散点图也可以发现,样本点并没有很好地集中在一条直线附近,故变量之间不会存在很强的线性相关性.设计目的:引导学生对结果进行分析,从而发现存在的问题,激发好奇心、求知欲.同时培养学生对问题的洞悉能力,增强对结果的敏感自检能力.理解新知提出问题:如何选择合适的回归模型进行预测呢?学生活动:学生讨论,教师合理引导学生观察图象特征,联想学过的基本函数. 学情预测:方案一:建立二次函数模型y =bx 2+a . 方案二:建立指数函数模型y =c 1ac 2x .提出问题:如何求出所建立的回归模型的系数呢?我们不妨尝试解决方案一中的系数. 学生活动:分组合作,教师引导学生观察y =bx 2+a 与y =bx +a 的关系.学情预测:通过比较,发现可利用t =x 2,将y =bx 2+a (二次函数)转化成y =bt +a (一次函数).求出x ,t ,y 间的数据转换表:x 21 23 25 27 29 32 35 t =x 2 441 529 625 729 841 1 024 1 225 y711212466115325利用计算器计算出y 和t 的线性回归方程:y ^=0.367t -202.54,转换回y 和x 的模型:y ^=0.367x 2-202.54.当x =28 ℃时,y ^=0.367×282-202.54≈85,即温度为28 ℃时,产卵数大约为85. 计算相关指数R 2≈0.802,这个回归模型中温度解释了80.2%产卵数的变化. 提出问题:提出问题“如果选用指数模型,是否也能转换成线性模型,如何转化?” 学生活动:独立思考也可相互讨论.教师可启发学生思考“幂指数中的自变量如何转化为自变量的一次幂?”可引导学生回忆对数的运算性质以及指对数关系.学情预测:可利用取对数的方法,即在y =c 1ac 2x 两边取对数,得log a y =c 2x +log a c 1. 提出问题:在上面的运算中,由于底数a 不确定,对于x 的值无法求出相应的log a y ,这时可取a =10时的情况,以便利用计算器进行计算,试求出回归模型.学生活动:合作协作,讨论解决. 学情预测:建立数据转换表:x 21 23 25 27 29 32 35 z =lg y 0.85 1.04 1.32 1.38 1.82 2.06 2.51 y711212466115325根据数据,可求得变量z 关于x 的回归方程:z ^=0.118x -1.665. 转换回y 和x 的模型:y ^=100.118x-1.665.当x =28 ℃时,y ^≈44,即温度为28 ℃时,产卵数大约为44.计算相关指数R 2≈0.985,这个回归模型中温度解释了98.5%产卵数的变化.提出问题:试选择合适的方法,比较方案一和方案二在数据拟合程度上的效果有什么不同?学生活动:独立思考也可相互讨论,教师加以适当的引导提示. 活动结果:相关指数R 2残差平方和残差图方案一0.802 15 448.432方案二0.985 1 450.673无论从图形上直观观察,还是从数据上分析,指数函数模型都是更好的模型.设计目的:引导学生进行不同模型的比较,体会“虽然任意两个变量的观测数据都可以用线性回归模型来拟合,但不能保证这种模型对数据的拟合效果最好,为更好地刻画两个变量之间的关系,要根据观测数据的特点来选择回归模型”.提出问题:由上面的分析可以看出,回归模型不一定是线性回归模型,对于非线性回归模型,我们的处理方法是什么?学生活动:独立思考,回顾上面的解决过程.学情预测:选用非线性回归模型时,一般思路是转化成线性回归模型,往往要用“等量变换、对数变换”等方法.设计目的:让学生整理建立非线性回归模型的思路.运用新知例1为了研究某种细菌繁殖个数y与时间x的关系,收集数据如下:天数x(天) 1 2 3 4 5 6繁殖个数y(个) 6 12 25 49 95 190 试建立y与x之间的回归方程.解:根据上表中的数据,作出散点图由图可以看出,样本点分布在某指数函数曲线y =c 1ec 2x 的周围,于是令z =lny ,则上表变换后如下:x 1 2 3 4 5 6 z1.792.483.223.894.555.25作出散点图从图中可以看出,变换后的样本点分布在某条直线附近,因此可用线性回归模型来拟合. 由表中数据可得,z 与x 之间的线性回归方程为z ^=0.69x +1.112, 则y 与x 之间的回归方程为y ^=e 0.69x +1.112. 变练演编例2混凝土的抗压强度X 较易测定,其抗弯强度Y 不易测定,已知X 与Y 由关系式Y=AX b 表示,工程中希望由X 估算出Y ,以便应用.现测得一批对应数据如下:X 141 152 168 182 195 204 223 254 277 Y23.125.325.929.831.131.832.534.835.2试求Y 对X 的回归方程.解:对Y =AX b 两边取自然对数得:ln Y =b ln X +ln A ,做变换y =ln Y ,x =ln X ,a =ln A ,则上述数据对应表格如下:X 141 152 168 182 195 204 223 254 277 Y 23.1 25.3 25.9 29.8 31.1 31.8 32.5 34.8 35.2 x 4.95 5.02 5.12 5.20 5.27 5.32 5.41 5.54 5.62 y3.143.233.253.393.443.463.483.553.56根据公式可求得y ^=0.64x +0.017 2,则 Y ^=e 0.64ln x+0.017 2=1.02X 0.64.变式1:若X 与Y 的关系由关系式Y ^=β^X b +α^表示,试根据给出的数据求Y 对X 的回归方程.活动设计:学生分组讨论,尝试解决. 活动成果:Y ^=0.086X +13.005.变式2:试选择合适的方法比较上述两种回归模型,相对于给出的数据哪一个的拟合效果更好?活动成果:计算残差平方和与相关指数,对于模型Y =AX b,残差平方和Q ^(1)=9.819,相关指数R 21=0.930 4;对于模型Y ^=β^X b +α^,残差平方和Q ^(2)=12.306,相关指数R 22=0.908,故模型Y =AX b 的拟合效果较好.设计意图:熟悉判断回归模型拟合效果的方法. 达标检测1.变量x ,y 的散点图如图所示,那么x ,y 之间的样本相关系数r 最接近的值为( )A.1B.-0.5C.0 D.0.52.变量x与y之间的回归方程表示()A.x与y之间的函数关系B.x与y之间的不确定性关系C.x与y之间的真实关系形式D.x与y之间的真实关系达到最大限度的吻合3.非线性回归分析的解题思路是__________.【答案】1.C 2.D 3.通过变量置换转化为线性回归分析课堂小结1.数学知识:建立回归模型及残差图分析的基本步骤;非线性模型向线性模型的转换方法;不同模型拟合效果的比较方法:相关指数和残差的分析.2.数学思想:数形结合的思想,化归思想及整体思想.3.数学方法:数形结合法,转化法,换元法.补充练习基础练习1.相关指数R2,残差平方和与模型拟合效果之间的关系是()A.R2的值越大,残差的平方和越大,拟合效果越好B.R2的值越小,残差的平方和越大,拟合效果越好C.R2的值越大,残差的平方和越小,拟合效果越好D .以上说法都不正确2.如果散点图的所有点都在一条直线上,则残差均为____________________,残差平方和为__________,相关指数为______________.【答案】1.C 2.0 0 1 拓展练习3.某种书每册的成本费Y 元与印刷册数x (千册)有关,经统计得到数据如下: x 1 2 3 5 10 20 30 50 100 200 Y10.155.524.082.852.111.621.411.301.211.15检验每册书的成本费Y 元与印刷册数的倒数1x 之间是否有线性相关关系,如有,求出Y对1x的回归方程. 解:把1x 置换为z ,则z =1x ,从而z 与Y 的数据为:z 1 0.5 0.333 0.2 0.1 0.05 0.033 0.02 0.01 0.005 Y10.155.524.082.852.111.621.411.301.211.15根据数据可得r ≈0.999 8>0.75,故z 与Y 具有很强的线性相关关系. 所以b ^≈8.976,a ^≈1.120,从而y ^=8.976z +1.120.又z =1x ,所以y ^=8.976x+1.120.设计说明本课时内容教材中只安排了一道关于“红铃虫”的例题,但是它却代表了一种“回归分析”的类型.如何利用这道例题使学生掌握这类问题的解决方法呢?为此,本课时设计了“引导发现、合作探究”的教学方法.首先展示“红铃虫”的背景资料来激发学生的学习兴趣;鼓励学生用已有知识解决问题,引导学生检查结果从而发现新问题;通过分组合作来对不同方案进行探索;使学生在合作探索的过程中体会“选择模型——将非线性转化成线性”的方法,体会“化未知为已知、用已知探索未知”思想,同时认识不同模型的效果.培养学生观察、类比联想以及分析问题的能力.在教学过程中让学生自主探索、动手实践,养成独立思考、积极探索的习惯.在“选模型”这个环节中,注意引导学生将散点分布和已学函数图象进行比较,从而发现二次函数和指数函数模型.在“转化”这个环节中,通过引导学生观察所选模型,联系已学知识选择“等量变换或对数变换”,从而找到转化的途径.在运算过程中,如求“相关指数”引导人教版高中数学选修2-3教学设计学生使用转化后的数据,利用计算器求其相关系数即为相关指数,使学生体会使用计算器处理数据的方法和技能.11。
3.1《回归分析的基本思想及其初步应用》教案4(新人教选修2-3)

3.1《回归分析的基本思想及其初步应用》教案4(新人教选修2-3)3.1 回归剖析的基本思想及其初步应用(四)教课要求:经过典型事例的研究,进一步认识回归剖析的基本思想、方法及初步应用.教课要点:经过研究使学生领会有些非线性模型经过变换能够转变为线性回归模型,认识在解决实质问题的过程中找寻更好的模型的方法,认识可用残差剖析的方法,比较两种模型的拟合成效 .教课难点:认识常用函数的图象特色,选择不一样的模型建模,并经过比较有关指数对不一样的模型进行比较 .教课过程:一、复习准备:1.发问:在例3中,察看散点图,我们选择用指数函数模型来拟合红铃虫的产卵数y 和温度 x 间的关系,还可用其余函数模型来拟合吗?2.议论:能用二次函数模型y c3 x2c4来拟合上述两个变量间的关系吗?(令t x2,则y c3t c4,此时y与t间的关系如t44152962572984110241225y711212466115325 400下:300察看 y 与t的散点图,能够发现样本点其实不散布在一y200条直线的四周,所以不宜用线性回归方程来拟合它,100y c3 x2c4来拟合y与 x 之间的0即不宜用二次曲线050010001500关系 . )小结:也就是说,我们能够经过察看变换后t的散点图来判断可否用此种模型来拟合. 事实上,除了察看散点图之外,我们也可先求出函数模型,然后利用残差剖析的方法来比较模型的利害.二、讲解新课:1.教课残差剖析:①残差:样本值与回归值的差叫残差,即μμe i y i y i.②残差剖析:经过残差来判断模型拟合的成效,判断原始数据中能否存在可疑数据,这方面的剖析工作称为残差剖析 .③残差图:以残差为横坐标,以样本编号,或身高数据,或体重预计值等为横坐标,作出的图形称为残差图 . 察看残差图,假如残差点比较平均地落在水平的带状地区中,说明采用的模型比较适合,这样的带状地区的宽度越窄,模型拟合精度越高,回归方程的预告精度越高.2.例 3 中的残差剖析:计算两种模型下的残差一般状况下,比较两个模型的残差比较困难(某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的状况则相反),故经过比较两个模型的残差的平方和的大小来判断模型的拟合成效. 残差平方和越小的模型,拟合的成效越好.因为两种模型下的残差平方和分别为 1450.673 和 15448.432,应采用指数函数模型的拟合成效远远优于采用二次函数模型 . (自然,还可用有关指数刻画回归成效)3.小结:残差剖析的步骤、作用三、稳固练习:练习:教材 P13 第 1 题。
高中新课程数学(新课标人教A版)选修2-3《3.1回归分析的基本思想及其初步应用》教案

3.1回归分析的基本思想及其初步应用(共计4课时) 授课类型:新授课一、教学内容与教学对象分析学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。
二、学习目标1、知识与技能通过本节的学习,了解回归分析的基本思想,会对两个变量进行回归分析,明确建立回归模型的基本步骤,并对具体问题进行回归分析,解决实际应用问题。
2、过程与方法 本节的学习,应该让学生通过实际问题去理解回归分析的必要性,明确回归分析的基本思想,从散点图中点的分布上我们发现直接求回归直线方程存在明显的不足,从中引导学生去发现解决问题的新思路—进行回归分析,进而介绍残差分析的方法和利用R 的平方来表示解释变量对于预报变量变化的贡献率,从中选择较为合理的回归方程,最后是建立回归模型基本步骤。
3、情感、态度与价值观 通过本节课的学习,首先让显示了解回归分析的必要性和回归分析的基本思想,明确回归分析的基本方法和基本步骤,培养我们利用整体的观点和互相联系的观点,来分析问题,进一步加强数学的应用意识,培养学生学好数学、用好数学的信心。
加强与现实生活的联系,以科学的态度评价两个变量的相关系。
教学中适当地增加学生合作与交流的机会,多从实际生活中找出例子,使学生在学习的同时。
体会与他人合作的重要性,理解处理问题的方法与结论的联系,形成实事求是的严谨的治学态度和锲而不舍的求学精神。
培养学生运用所学知识,解决实际问题的能力。
三、教学重点、难点教学重点:熟练掌握回归分析的步骤;各相关指数、建立回归模型的步骤;通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:求回归系数 a , b ;相关指数的计算、残差分析;了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。
人教版高中数学选修2-3第三章回归分析的基本思想及其初步应用 同步教案

学生姓名 性别 年级 学科 数学 授课教师上课时间 年 月 日第( )次课 共( )次课课时:2课时教学课题 人教版 选修2-3第三章回归分析的基本思想及其初步应用 同步教案教学目标 知识目标:.能知道用回归分析处理两个变量之间的不确定关系的统计方法.能力目标:会利用散点图分析两个变量是否存在相关关系.会用残差及R 2来刻画线性回归模型的拟合效果情感态度价值观:能记住建立回归模型的方法和步骤;能知道如何利用线性回归模型求非线性回归模型.教学重点与难点 重点:建立变量之间的线性回归方程,能根据散点图初步判断两个变量之间是否具有线性关系. 难点:1、.会求线性回归方程.2、.掌握建立回归模型的步骤,会选择回归模型,特别是非线性回归模型.教学过程(一)线性回归模型知识梳理(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系.(2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(3)对于一组具有线性相关关系的数据()()()n n y x y x y x ,,...,,,,2211,回归直线a x b yˆˆˆ+=的斜率和截距的最小二乘估计公式分别为()()()∑∑∑∑====--=---=ni ini ii n i i ni iix n xy x n yx x x y yx x b1221121ˆ ,x b y aˆˆ-=,其中()y x ,称为样本点的中心. (4)线性回归模型y=bx+a+e,其中e 称为随机误差,a 和b 是模型的未知参数,自变量x 称为解释变量,因变量y 称为预报变量. 例题精讲【题型一、求线性回归方程】【例1】某工厂1—8月份某种产品的产量与成本的统计数据见下表:以产量为x,成本为y . (1)画出散点图;(2)y 与x 是否具有线性相关关系?若有,求出其回归方程.月份 1 2 3 4 5 6 7 8产量(t) 5.6 6.0 6.1 6.4 7.0 7.5 8.0 8.2 成本(万元) 130 136 143 149 157 172 183 188【方法技巧】1、散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.2、求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义巩固训练1.在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y 与x 之间的回归直线方程为( ). A.=x+1 B.=x+2 C.=2x+1 D.=x-12.某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x(x 取整数)元与日销售量y 台之间有如下关系:x 35 40 45 50 y56 41 28 11(1)y 与x 是否具有线性相关关系?如果具有线性相关关系,求出回归直线方程.(方程的斜率精确到个位)(2)设经营此商品的日销售利润为P 元,根据(1)写出P 关于x 的函数关系式,并预测当销售单价x 为多少元时,才能获得最大日销售利润.(二)线性回归分析知识梳理1、.残差的概念对于样本点()()()n n y x y x y x ,,...,,,,2211而言,它们的随机误差为n i a bx y e i i i ,...,2,1,=--=其估计值为i i i i i i e n i a bx y y y eˆ,,...,2,1,ˆˆˆ=--=-=称为相应于点()y x ,的残差. 2、回归模型拟合效果的刻画类别残差图法残差平方和法R 2法特点残差点比较均匀地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的宽度越窄,说明模型拟合精度越高残差平方和()21ˆ∑=-ni iiyy 越小,模型的拟合效果越好()()∑∑==---=ni iini iiy y yy R 12122ˆ1表示解释变量对于预报变量变化的贡献率,2R 2越接近于1,表示回归的效果越好3、建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等). (3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程x+). (4)按一定规则(如最小二乘法)估计回归方程中的参数.(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等例题精讲【题型一、线性回归分析】【例1】、某运动员训练次数与运动成绩之间的数据关系如下: (1)作出散点图; (2)求出线性回归方程; (3)作出残差图,并说明模型的拟合效果;(4)计算R 2,并说明其含义.【方法技巧】“相关指数R2、残差图”在回归分析中的作用:(1)相关指数R2是用来刻画回归效果的,由R2=1-可知R2越大,意味着残差平方和越小,也就是说模型的拟合 效果就越好.(2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分布在水平带状区域中,带状区域的宽 度越窄,说明模型拟合精度越高, 回归方程预报精度越高.巩固训练1、某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x/万元 4235销售额y/万元49 26 39 54根据上表可得回归方程x+中的为9.4,据此模型预报广告费用为6万元时销售额为( ). A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元2、在一段时间内,某种商品的价格x(元)和需求量y(件)之间的一组数据为:x(元) 14 16 18 20 22 y(件)1210 753且知x 与y 具有线性相关关系,求出y 对x 的回归直线方程,并说明拟合效果的好坏.课后作业次数(x) 30 33 35 37 39 44 46 50 成绩(y) 30 34 37 39 42 46 4851【基础巩固】1.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是().A.l1和l2有交点(s,t)B.l1与l2相交,但交点不一定是(s,t)C.l1与l2必定平行D.l1与l2必定重合2.下列四个命题中正确的是().①在线性回归模型中,e是bx+a预报真实值y的随机误差,它是一个观测的量;②残差平方和越小的模型,拟合的效果越好;③用R2来刻画回归方程,R2越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,若带状区域宽度越窄,说明拟合精度越高,回归方程的预报精度越高.A.①③B.②④C.①④D.②③3.(2014湖北高考)根据如下样本数据:x 3 4 5 6 7 8y 4.0 2.5 -0.5 0.5 -2.0 -3.0得到的回归方程为=bx+a,则().A.a>0,b>0B.a>0,b<0C.a<0,b>0D.a<0,b<04..若某地财政收入x与支出y满足线性回归方程y=bx+a+e(单位:亿元),其中b=0.8,a=2,|e|≤0.5.如果今年该地区财政收入10亿元,年支出预计不会超过().A.10亿B.9亿C.10.5亿D.9.5亿5.某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元) 4 2 3 5销售额y(万元) 49 26 39 54根据上表可得回归方程x+中的为9.4,据此模型预报广告费用为6万元时销售额为().A.63.6万元B.65.5万元C.67.7万元D.72.0万元6.在研究身高和体重的关系时,求得R2≈,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”,所以身高对体重的效应比随机误差的效应大得多.【能力提升】7.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:h)与当天投篮命中率y之间的关系:时间x 1 2 3 4 5命中率y 0.4 0.5 0.6 0.6 0.4小李这5天平均投篮命中率为,用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为.8.已知y与x之间具有很强的线性相关关系,现观测得到(x,y)的四组观测值并制作了下边的对照表,由表中数据粗略地得到线性回归直线方程为x+60,其中的值没有写上.当x不小于-5时,预测y最大为.x 18 13 10 -1y 24 34 38 649.恩格尔系数=×100%.在我国,据恩格尔系数判定生活发展阶段的标准为:贫困:>60%,温饱:50%~60%,小康:40%~50%,富裕:<40%.据国家统计局统计显示,随着中国经济的不断发展,城镇居民家庭恩格尔系数不断下降,居民消费已从温饱型向享受型、发展型转变.如下表:恩格尔57.5 54.2 53.8 50.0 48.8 44.7 39.4 37.7 37.1系数y(%)年份x 1978 1990 1992 1994 1996 1998 2000 2002 2003求:(1)根据年份预报恩格尔系数的线性回归方程;(2)预报2013年的恩格尔系数;(3)求R2;(4)作出残差图.。
非线性回归分析(教案)

非线性回归分析(教案)第一章:非线性回归分析简介1.1 非线性回归的定义与意义1.2 非线性回归与线性回归的比较1.3 非线性回归分析的应用领域1.4 本章小结第二章:非线性回归模型建立2.1 非线性回归模型的形式2.2 非线性回归模型的建立方法2.3 非线性回归模型的参数估计2.4 模型检验与优化2.5 本章小结第三章:非线性回归分析软件介绍3.1 非线性回归分析软件的选择3.2 非线性回归分析软件的操作步骤3.3 非线性回归分析软件的应用案例3.4 本章小结第四章:非线性回归在实际问题中的应用4.1 非线性回归在生物医学领域的应用4.2 非线性回归在经济学领域的应用4.3 非线性回归在环境科学领域的应用4.4 本章小结第五章:非线性回归分析的扩展与改进5.1 非线性回归模型的扩展5.2 非线性回归分析方法的改进5.3 非线性回归分析的发展趋势5.4 本章小结第六章:非线性回归模型的选择与评估6.1 模型选择的原则与方法6.2 模型评估指标6.3 模型选择的实际案例6.4 本章小结第七章:非线性回归分析的编程实现7.1 非线性回归分析的编程基础7.2 常见非线性回归模型的编程实现7.3 非线性回归分析的编程实践7.4 本章小结第八章:非线性回归分析在数据挖掘中的应用8.1 数据挖掘与非线性回归分析8.2 非线性回归分析在数据挖掘中的案例分析8.3 非线性回归分析在数据挖掘中的挑战与应对8.4 本章小结第九章:非线性回归分析在多变量分析中的应用9.1 多变量分析与非线性回归分析9.2 非线性回归分析在多变量数据分析中的方法与应用9.3 非线性回归分析在多变量分析中的案例研究9.4 本章小结第十章:非线性回归分析的未来展望10.1 非线性回归分析的发展趋势10.2 非线性回归分析在科学研究中的潜在应用10.3 非线性回归分析的教育与培训10.4 本章小结重点和难点解析一、非线性回归的定义与意义:理解非线性回归的基本概念,掌握非线性回归与线性回归的本质区别,以及非线性回归在实际问题中的应用场景。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020年高中数学选修2-3《回归分析的初步应用--探究非线性回归模型》教案精编
版
回归分析的初步应用(教案)
——探究非线性回归模型
佛山市第三中学张云雁
一、教材分析
1. 教材的地位与作用:
“回归分析的初步应用”是人民教育出版社A版《数学选修2-3》统计案例一章的内容,是《必修3》“线性回归分析”的延伸。
根据高中课程标准,这里准备安排4个课时,本次说课的内容为第3课时。
虽然线性回归分析具有广泛的应用,但是大量实际问题的两个变量不一定都呈线性相关关系,所以有必要探究如何建立非线性回归模型,进行更有效的数据处理。
2. 教学重点、难点:
教学重点:探究用线性回归模型研究非线性回归模型。
教学难点:如何选择不同的模型建模,以及如何将非线性回归模型转化为线性回归模型。
二、学情分析
教学对象是高二的学生,通过前面的学习,具有一定的线性回归分析、相关指数和残差分析的知识,这为探究非线性模型奠定了良好的基础,但由于学生较少接触数学建模的思想,思路不够开阔,为模型间的转化带来了一定的困难。
三、教学目标
知识与技能目标:能根据散点图的特点选择回归模型,通过函数变换,借助线性回归模型研究非线性回归模型。
过程与方法目标:经历非线性回归模型的探索过程,掌握建立非线性模型的基本步骤,体会统计方法的特点。
情感、态度与价值观:以探究问题为中心,感受研究非线性回归模型的必要意义,体验数学的文化内涵,形成学习数学的积极态度。
四、教学方法
1. 教法分析
主要采用“引导发现,合作探究”的教学方法,通过组织学生观察、分析、计算、交流、归纳,让学生在探究学习的过程中经历知识形成的全过程。
利用多媒体辅助教学,优化了教学过程,大大提高了课堂教学效率。
2.学法分析
重点指导学生通过观察思考、类比联想,形成“自主探究、合作交流”的学习形式,培养学生从“学会知识”到“会学知识”。
五、教学过程
(一)知识回顾
首先以07年广东的一道高考题引入新课:
下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据:
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程ˆy bx a
=+;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
师:回忆并叙述建立线性回归模型的基本步骤?
生:选取变量、画散点图、选择模型、估计参数、分析与预测。
[设计意图]:为建立非线性回归模型作准备。
(二)创设情境
为了激发学生的学习兴趣,先让学生观看一段有关棉铃虫的视频。
★【播放视频】★ 生:观看视频。
师:根据背景介绍,指出棉铃虫的繁殖受温度的影响。
为有效防治虫害,科学家收集到以下一组数据, 那么科学家得到这些数据后,是怎样处理的呢?下面我们来做一次探索,进而提出问题。
(三)提出问题
一只棉铃虫的产卵数y 和温度x 有关,科学家收集了以下7组观测数据:
试建立y 与x 之间的回归方程;并预测温度为31C ο时棉铃虫的产卵数目。
[设计意图]:使学生感受到数学并不只是一些抽象的文字和符号,它来源于生活,又应(四)解决问题
师:利用信息技术画出散点图,
并提出问题——适合建立线性回归模型么?
并利用多媒体进行演示散点与直线的拟合情况。
生:经过观察,不难看出样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,所以利用线性回归方程建模无法真实反映两个变量之间的内在关系。
师:那么可以用什么函数来拟合呢?引导学生再次观察散点图,并和学过的函数图像进行比较,鼓励学生继续探索。
[设计意图]:通过观察、类比、联想、知识的迁移和应用等方式,培养学生的观察能力和分析能力,使学生体会知识之间的有机联系。
生:可能会给出各种各样的猜想,比如二次函数、指数型函数甚至幂函数。
师:课堂上主要引导学生探究二次函数和指数函数模型的建立过程,而对于其他的方案,留给学生课后继续探索。
师:两个变量是线性关系时可以利用公式估计出两个参数,当模型不是线性回归模型时,如何估计模型中的参数呢?
生:经过思考发现,如果能将非线性模型转化为线性模型,问题就可以得到解决。
师:经过怎样的变换可以实现转化呢?
在这里学生遇到了难点,通过几个问题的设置,分散难度,以突破难点。
方案1:二次函数模型 2ˆy
ax bx c =++ 师:是否可以将2
ˆy
ax bx c =++简化为c ax y +=2^
呢?引导学生分析一次项对函数图像的影响。
生:发现一次项只是影响函数的对称性,并不影响函数图像的形状,因此可将方程简化为c ax y +=2^。
师:通过什么变换可以将c ax y +=2
^
转化为c at y +=^
呢?
生:通过比较两个表达式,发现可以利用平方变换2x t =实现转化,得到
2ˆˆy
ax bx c y at c =++→=+,(2x t =) 方案2:指数函数模型 x c a c y 21^
=
师:在实现方案1中模型转化的基础上,提出方案2。
指出为了方便计算,通常取以10或以e 为底,课堂上选取以e 为底,进而提出选用不同的底会对结果产生影响么?留给学生课后思考验证。
师:如何将x
c e c y 21^
=转化为a bx y +=^
?引导学生回忆对数的运算性质以及指对数的关
系。
生:找到利用对数变换^ln y z =可以实现转化,得到a bx z a
c y x
c +=→=21^
,(^
ln y z =,
1ln c a =,2c b =)
[设计意图]:在此过程中,学生再次体会“转化”的思想。
经过变换后,这两个模型都转化为线性回归模型。
师:如何估计这两个线性回归模型的参数呢?引导学生分组讨论,启发学生把原变量的观测数据转化为新变量的数据。
由于计算量较大,把学生分成两组,分别完成两个模型的数据转化,以节约时间。
生:经过计算,得到新的数据和散点图,进而估计参数,得到两个模型的线性回归方程。
方案1:二次函数模型 2x t =
线性回归方程:54.202367.0^
-=t y 方案2:指数函数模型
^
ln y z =
线性回归方程:843.3272.0-=x z
师:在此基础上,引导学生将它们还原为^
y 与x 的两个非线性模型。
生:将两个线性回归模型还原为非线性回归模型,并进行预测。
方案1:二次函数模型 2x t =
非线性回归方程:54.202367.02^
-=x y 当C x ︒
=31时,150^
≈y 方案2:指数函数模型 ^
ln y z = 非线性回归方程:843.3272.0^
-=x e y 当C x ︒=31时,98^
≈y
[设计意图]: 通过两个方案的探索,使学生体会,可以先通过观察散点图,选择合适的模型;知道有些非线性模型可以利用函数变换转化为线性回归模型来估计参数,从而突破难点,同时培养学生的观察能力和探索创新精神。
生:经过观察,发现两者预测结果差距很大。
师:哪个模型能更好的刻画产卵数y 和温度x 之间的关系呢?
生:经过思考和讨论,提出可以用残差平方和或相关指数进行不同模型的比较,进而利用信息技术得出结果。
残差平方和越小或相关指数越大,则说明模型的拟合效果越好。
生:经过比较,发现指数函数模型拟合效果更好。
师:利用相关指数不仅可以比较几个模型的拟合效果,而且对于只有一个模型时,也可以利用相关指数判断模型的好坏。
[设计意图]: 通过引导学生进行不同模型的比较,让学生体会统计方法的特点:建立模型没有现成的答案可循,要根据观测数据的特点来选择回归模型。
得到回归模型并不是最终的目的,如果建立的回归模型有效,我们就可以用它进行预测。
模型的拟合效果越好,用来
进行预测的准确度就会越高。
鼓励学生在数学建模的过程中,不断探索,寻求更好的拟合效果。
(五)梳理反思
归纳总结建立非线性回归模型的基本步骤:
(1)选模:做出散点图,根据图像特点选择合适的模型;
(2)转化:利用函数变换将非线性模型转化为线性回归模型;
(3)求参:估计线性回归模型的参数;
(4)还原:将函数变换带回线性回归方程,还原为非线性模型;
(5)分析:利用相关指数等分析模型的好坏。
(六)布置作业
1、(巩固型、个人独立完成) P105-3
2、(延伸型、小组讨论完成)试建立其他的回归模型,并和方案1、2的拟合效果进行比较。
六、设计说明
1. 板书设计
二次函数模型指数函数模型
…… ……
…… ……
拟合效果比较
(残差平方和) 15448.432 1450.673
(相关指数) 0.802 0.985
平方变换、对数变换等
非线性回归模型线性回归模型
还原
2. 在本节课的教学过程中,我始终坚持学生的主体地位,采用“引导发现,合作探究”的教学方法,培养学生“自主探究,合作交流”的数学学习方式。
师生共同体验探索的快乐,感受交流的喜悦。