(完整版)回归分析的基本思想及其初步应用第1课时优秀教学设计

合集下载

3.1.1回归分析的基本思想及其初步应用教案

3.1.1回归分析的基本思想及其初步应用教案

3. 1.1回归分析的基本思想及其初步应用【教学目标】1.了解回归分析的基本思想方法及其简单应用. 2.会解释解释变量和预报变量的关系. 【教学重难点】教学重点:回归分析的应用. 教学难点:a 、b 公式的推到. 【教学过程】一、设置情境,引入课题引入:对于一组具有线性相关关系的数据112233(,),(,),(,),,(,).n n x y x y x y x y 其回归直线方程的截距和斜率的最小二乘法估计公式分别为:11n i i x x n ==∑ 11ni i y y n ==∑ (,)x y 称为样本点的中心。

如何推到着两个计算公式? 二、引导探究,推出公式从已经学过的知识,截距a 和斜率b 分别是使21(,)()niii Q y x αββα==--∑取最小值时,αβ的值,由于212212211(,)[((]{[(2[([(][(]}[(2[([(](ni i i ni i i i i nni i i i i i Q y x y x y x y x y x y x y x y x y x y x y x y x y x y x n y x αββββαβββββαβαβββββαβα=====-----=---+-----+--=---+-----+--∑∑∑∑)+))])])))])]))因为 所以2212222111222221122111[([(]()2()()()(()()[()()](()[]()()()ni i i nn nii i i i i i nni i i i ni i i i nni i i i i i Q y x y x n y x x x x x y y y y n y x x x y y x x y y n y x x x y y x x x x αββββαβββαβαβ==========---+--=----+-+------=--+---+---∑∑∑∑∑∑∑∑∑(,))])))1n=∑在上式中,后两项和,αβ无关,而前两项为非负数,因此要使Q 取得最小值,当且仅当前两项的值均为0.,既有通过上式推导,可以训练学生的计算能力,观察分析能力,能够很好训练学生数学能力,必须在老师引导下让学生自己推出。

1.1.2回归分析的基本思想及其初步应用 教案

1.1.2回归分析的基本思想及其初步应用 教案

第 1 页 1.1.2 回归分析的根本思想及其初步应用教学要求:通过典型案例的探究 ,进一步了解回归分析的根本思想、方法及初步应用. 教学重点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学难点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学过程:一、复习准备:1.由例1知 ,预报变量〔体重〕的值受解释变量〔身高〕或随机误差的影响.2.为了刻画预报变量〔体重〕的变化在多大程度上与解释变量〔身高〕有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 二、讲授新课:1. 教学总偏差平方和、残差平方和、回归平方和:〔1〕总偏差平方和:所有单个样本值与样本均值差的平方和 ,即21()n i i SST y y ==-∑.残差平方和:回归值与样本值差的平方和 ,即21()ni i i SSE y y ==-∑.回归平方和:相应回归值与样本均值差的平方和 ,即21()ni i SSR y y ==-∑.〔2〕学习要领:①注意i y 、i y 、y 的区别;②预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和 ,即222111()()()n n ni i i i i i i y y y y y y ===-=-+-∑∑∑;③当总偏差平方和相对固定时 ,残差平方和越小 ,那么回归平方和越大 ,此时模型的拟合效果越好;④对于多个不同的模型 ,我们还可以引入相关指数22121()1()n i i i ni i y y R y y ==-=--∑∑来刻画回归的效果 ,它表示解释变量对预报变量变化的奉献率. 2R 的值越大 ,说明残差平方和越小 ,也就是说模型拟合的效果越好.2. 教学例题:例2 关于x 与Y 有如下数据:x 2 4 5 6 8 y 30 40 60 5070为了对x 、Y 两个变量进行统计分析 ,现有以下两种线性模型:6.517.5y x =+ ,717y x =+ ,试比拟哪一个模型拟合的效果更好.分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和 ,也可分别求出两种模型下的相关指数 ,然后再进行比拟 ,从而得出结论.。

3.1回归分析的基本思想及其初步应用教学设计

3.1回归分析的基本思想及其初步应用教学设计

3.1回归分析的基本思想及其初步应用(第1课时)一、教学内容与教学对象分析学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。

二、学习目标1、知识与技能通过本节的学习,了解回归分析的基本思想,会对两个变量进行回归分析,明确建立回归模型的基本步骤,并对具体问题进行回归分析,解决实际应用问题。

2、过程与方法本节的学习,应该让学生通过实际问题去理解回归分析的必要性,明确回归分析的基本思想,从散点图中点的分布上我们发现直接求回归直线方程存在明显的不足,从中引导学生去发现解决问题的新思路—进行回归分析,进而介绍残差分析的方法和利用R 的平方来表示解释变量对于预报变量变化的贡献率,从中选择较为合理的回归方程,最后是建立回归模型基本步骤。

3、情感、态度与价值观通过本节课的学习,首先通过实际问题了解回归分析的必要性和回归分析的基本思想,明确回归分析的基本方法和基本步骤,培养我们利用整体的观点和互相联系的观点,来分析问题,进一步加强数学的应用意识,培养学生学好数学、用好数学的信心。

加强与现实生活的联系,以科学的态度评价两个变量的相关系。

培养学生运用所学知识,解决实际问题的能力。

三、教学重点、难点教学重点:熟练掌握回归分析的步骤;各相关指数、建立回归模型的步骤。

教学难点:求回归系数a ,b ;相关指数的计算、残差分析。

四、教学策略:教学方法:诱思探究教学法学习方法:自主探究、观察发现、合作交流、归纳总结。

教学手段:多媒体辅助教学五、教学过程:(一)、复习引入:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。

对于一组具有线性相关关系的数据:(11,x y ),(22,x y ),…,(,n n x y ),我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:121()()()niii nii x x y y bx x ==--=-∑∑ (1)ay bx =- (2)其中1111,n ni i i i x x y y ====∑∑,(,x y )成为样本点的中心.回归分析的基本步骤:(1)画出两个变量的散点图.(2)求回归直线方程.(3)用回归直线方程进行预报.下面我们通过案例,进一步学习回归分析的基本思想及其应用.举例:例1.从某大学中随机选取8名女大学生,其身高和体重数据如表编号12345678身高/cm 165165157170175165155170体重/kg4857505464614359求根据女大学生的身高预报体重的回归方程,并预报一名身高为172cm 的女大学生的体重.解:由于问题中要求根据身高预报体重,因此选取身高为自变量x ,体重为因变量y .作散点图(图3.1一1)从图3.1一1中可以看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用线性回归方程来近似刻画它们之间的关系.根据探究中的公式(1)和(2),可以得到ˆˆ0.849,85.712ba ==-.于是得到回归方程084985.712y x =-.因此,对于身高172cm 的女大学生,由回归方程可以预报其体重为084917285.71260.316y =⨯-=(kg ).ˆ0.849b=是斜率的估计值,说明身高x 每增加1个单位时,体重y 就增加0.849位,这表明体重与身高具有正的线性相关关系.如何描述它们之间线性相关关系的强弱?在必修3中,我们介绍了用相关系数;来衡量两个变量之间线性相关关系的方法.本相关系数的具体计算公式为()()niix x y y r --=∑当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r 的绝对值越接近1,表明两个变量的线性相关性越强;r 的绝对值接近于0时,表明两个变量之间几乎不存在线性相关关系.通常,当r 的绝对值大于0.75时认为两个变量有很强的线性相关关系.在本例中,可以计算出r =0.798.这表明体重与身高有很强的线性相关关系,从而也表明我们建立的回归模型是有意义的.显然,身高172cm 的女大学生的体重不一定是60.316kg ,但一般可以认为她的体重接近于60.316kg .图3.1一2中的样本点和回归直线的相互位置说明了这一点.由于所有的样本点不共线,而只是散布在某一条直线的附近,所以身高和体重的关系可用下面的线性回归模型来表示:y bx a e =++,(3)这里a 和b 为模型的未知参数,e 是y 与ˆy bx a =+之间的误差.通常e 为随机变量,称为随机误差,它的均值E (e )=0,方差D (e )=2()D e σ=>0.这样线性回归模型的完整表达式为:2,()0,().y bx a e E e D e σ=++⎧⎨==⎩(4)在线性回归模型(4)中,随机误差e 的方差越小,通过回归直线ˆybx a =+(5)预报真实值y 的精度越高.随机误差是引起预报值 y 与真实值y 之间的误差的原因之一,大小取决于随机误差的方差.另一方面,由于公式(1)和(2)中 a和b 为截距和斜率的估计值,它们与真实值a 和b 之间也存在误差,这种误差是引起预报值 y 与真实值y 之间误差的另一个原因.思考:产生随机误差项e 的原因是什么?一个人的体重值除了受身高的影响外,还受许多其他因素的影响。

高中数学新人教版A版精品教案《3.1 回归分析的基本思想及其初步应用》

高中数学新人教版A版精品教案《3.1 回归分析的基本思想及其初步应用》

《回归分析的基本思想及其初步应用(1)》教案
教学过程【设计意图】对残差从计算的角度有直观的认识,也为后面的知识学习做好准备
【教师引导】画残差图
【学生小组讨论】通过残差图得到残差的作用
1、直观地看出数据是否有误;
2、分布均匀在水平的带状区域,说明模型较为合适;
3、带状区域越窄,模型越合适,模型拟合程度越高,预报精度越高。

【教师引导】我们已经从图形的角度,利用残差图直观地来判断一个模型的拟合程度,数形结合是高中数学一个非常重要的思想方法,下面将从“数”的角度精
确地来表述模型的拟合程度。

相关系数
()
()()




=
=
=
=
-
-
=
-
-
-
=
n
i
i
n
i
i
n
i
i
n
i
i
i
y
y
e
y
y
y
y
R
1
2
1
2
1
2
1
2
2
ˆ
1
ˆ
1
分析:1、R²越大,模型的拟合效果越好;R²越小,模型的拟合效果越差
2、R²越接近于1,表示回归的效果越好
165 160 175 155 170
体重/g 58 52 62 43 60
残差
i
eˆ 3。

《3.1.2回归分析的基本思想及其初步应用》教学案

《3.1.2回归分析的基本思想及其初步应用》教学案

《3.1.2回归分析的基本思想及其初步应用》教学案【教学目标】1. 了解相关系数r ;2. 了解随机误差;3. 会简单应用残差分析【教学重难点】教学重点:相关系数和随机误差教学难点:残差分析应用.【教学过程】一、设置情境,引入课题上节例题中,身高172cm 女大学生,体重一定是60kg 吗?如果不是,其原因是什么?二、引导探究,发现问题,解决问题1 $0.84985.712y x =-对于0.849b=$是斜率的估计值,说明身高x 每增加1个单位,体重就 ,表明体重与身高具有 的线性相关关系. 2 如何描述线性相关关系的强弱?()()ni ix x y y r --=∑ (1)r >0表明两个变量正相关;(2)r <0表明两个变量负相关;(3)r 的绝对值越接近1,表明相关性越强,r 的绝对值越接近0,表明相关性越弱.(4)当r 的绝对值大于0.75认为两个变量具有很强的相关性关系.3 身高172cm 的女大学生显然不一定体重是60.316kg ,但一般可以认为她的体重接近于60.316kg .①样本点与回归直线的关系②所有的样本点不共线,而是散布在某一条直线的附近,该直线表示身高与体重的关系的线性回归模型表示y bx a ε=++e 是y 与$y bx a =+的误差,e 为随机变量,e 称为随机误差.③E (e )=0,D (e )= 2σ>0.④D (e )越小,预报真实值y 的精度越高.⑤随机误差是引起预报值$y 与真实值y 之间的误差之一.⑥$,a b $为截距和斜率的估计值,与a ,b 的真实值之间存在误差,这种误差也引起$y 与真实值y 之间的误差之一.4 思考产生随机误差项e 的原因是什么?5 探究在线性回归模型中,e 是用$y 预报真实值y 的误差,它是一个不可观测的量,那么应该怎样研究随机误差?如何衡量预报的精度?①2()D e σ=来衡量随机误差的大小.②µi i i e y y =- ③µµ$i i i i i e y y y bx a =-=--$ ④µ$22111(,)(2)22n i e Q a b n n n σ===>--∑$$ ⑤$(,)Q a b $称为残差平方和,µ2σ越小,预报精度越高. 6 思考当样本容量为1或2时,残差平方和是多少?用这样的样本建立的线性回归方程的预报误差为0吗?7 残差分析①判断原始数据中是否存在可疑数据;②残差图 ③相关指数µ22121()1()n i i i n ii y y R y y ==-=--∑∑ ④R 2越大,残差平方和越小,拟合效果越好;R 2越接近1,表明回归的效果越好. 8 建立回归模型的基本步骤:①确定研究对象,明确哪个变量时解释变量,哪个变量时预报变量.②画出确定好的解释变量和预报变量得散点图,观察它们之间的关系;③由经验确定回归方程的类型;④按一定规则估计回归方程中的参数;⑤得出结果后分析残差图是否异常.三、典型例题例1 下表是某年美国旧轿车价格的调查资料,今以x 表示轿车的使用年数,y 表示响应的年均价格,求y 关于x 的回归方程减,但不在一条直线附近,但据此认为y 与x 之间具有线性回归关系是不科学的,要根据图的形状进行合理转化,转化成线性关系的变量间的关系.解:作出散点图如下图可以发现,各点并不是基本处于一条直线附近,因此,y 与x 之间应是非线性相关关系.与已学函数图像比较,用$µµbx a y e +=来刻画题中模型更为合理,令$ln z y =$,则$z bx a =+$$, 题中数据变成如下表所示:拟合,由表中数据可得0.996,0.75r r ≈->,认为x 与z 之间具有线性相关关系,由表中数据的$0.298,8.165,b a ≈-≈$所以0.2988.165z x =-+$,最后回代$ln z y =$,即$0.2988.165x y e -+=四、当堂练习:1 两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合效果最好的模型是( )A 模型1的20.98R =B 模型2的20.80R =C 模型3的20.50R =D 模型4的20.25R =答案 A五、课堂小结1 相关系数r 和相关指数R 22 残差分析y。

回归分析的基本思想及其初步应用(第1课时)教案

回归分析的基本思想及其初步应用(第1课时)教案

1.1回归分析的基本思想及其初步应用(第1课时)教案教材:人民教育出版社A版选修1-2第2页到第4页【教学目标】在《数学③(必修)》之后,学生已经学习了两个变量之间的相关关系,包括画散点图,最小二乘法求回归直线方程等内容.在人教A版选修1-2第一章第一节“回归分析的基本思想及其初步应用”这一节中进一步介绍回归分析的基本思想及其初步应用.这部分内容《教师用书》共计4课时,第一课时:介绍线性回归模型的数学表达式,解释随机误差项产生的原因,使学生能正确理解回归方程的预报结果;第二课时:从相关系数、相关指数和残差分析角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤;第三课时:介绍两个变量非线性相关关系;第四课时:回归分析的应用. 本节课是第一课时的内容.1、知识目标认识随机误差;2、能力目标(1)会使用函数计算器求回归方程;(2)能正确理解回归方程的预报结果.3、情感目标通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力.教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性.【教学重点】随机误差e的认识【教学难点】随机误差的来源和对预报变量的影响【教学方法】启发式教学法【教学手段】多媒体辅助教学【教学流程】【教学过程设计】【教学反思】通过本节课的教学实践,我再次体会到什么是由“关注知识”转向“关注学生”,在教学过程中,注意到了由“给出知识”转向“引起活动”,由“完成教学任务”转向“促进学生发展”,课堂上的真正主人应该是学生.一堂好课,师生一定会有共同的、积极的情感体验.本节课的教学中,知识点均是学生通过探索“发现”的,学生充分经历了探索与发现的过程.教学中没有以练习为主,而是定位在知识形成过程的探索,注重数学的思想性,如统计思想、随机观念、函数思想、数形结合的思想方法等,引导学生体验数学中的理性精神,加强数学形式下的思考和推理.几点注明:1、复习引入时教师做示范——提供5组身高与体重的数据,用Excel展示如何画散点图、用最小二乘法求线性回归方程.随机抽样并列表如下:2、计算机做散点图的步骤如下:(1)进入Excel软件操作界面,在A1,B1分别输入“身高”和“体重”,在A,B 列输入相应的数据.(2)点击“图表向导”图标,进入“图表类型”对话框,选择“标准类型”中的“XY散点图”,单击“下一步”.(3)在“图表向导”中的“图表数据源”对话框中,选择“系列”选项,单击“添加”按钮添加系列1,在“X值”栏中输入身高所在数据区域,在“Y值”栏中输入体重所在数据区域,单击“下一步”.(4)进入“图表向导”中的图表选项对话框,对图表的一些属性进行设置. (5)单击“完成”按钮.注:也可以直接使用我们提供的文件来给学生演示,相对节约课堂时间.3、学生使用函数计算器求回归方程的过程如下:(学生还会使用更先进的计算器) 4、课堂使用的数据如下高二女生前15组数据列表:MODE SHIFT CLR =1 13 , DT 165 49 ,DT17565, DT 165 58 , DT 157 51 , DT 170 53 SHIFT CLR SHIFT CLR 2 ==1 (进入回归计算模式)(清除统计存储器)(输入五组数据)所以回归方程为 yˆ0.673x-56.79 (计算参数a) (计算参数b)高二女生中间15组数据列表:高二女生后15组数据列表:课本P2例题1 女大学生8组数据列表:例1.。

回归分析的基本思想及其初步应用优秀教学设计

回归分析的基本思想及其初步应用优秀教学设计

回归分析的基本思想及其初步应用一、教学目标:1.明确两个变量具有相关关系的意义;2.知道回归分析的意义;3.知道回归直线、回归直线方程、线性回归分析的意义;4.掌握对两个变量进行线性回归的方法和步骤,并能借助科学计算器确定实际问题中两个变量间的回归直线方程;5.培养学生形成运用数据进行推断的能力;6.让学生体会从特殊到一般的辩证思想方法.二、教学重点:了解线性回归的基本思想和方法;教学难点:线性回归的基本思想方法和计算.三、教学用具:幻灯机或多媒体四、教学过程:1.引入新课S 先引入函数关系再引入相关关系间由正方形面积S与其边长x之间的函数关系2x (确定关系)引入一块农田的水稻产量与施肥量之间的关系(非确定关系),从而引入新授内容.2.(板书)相关关系与回归分析(1)相关关系进一步分析水稻产量与施肥量的关系,得出相关关系的概念.(板书)自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.相关关系与函数关系的异同点:相同点:均是指两个变量的关系.不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.引导学生列举现实生活中相关关系的例子.(2)回归分析(板书)对具有相关关系的两个变量进行统计分析的方法叫回归分析.通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性.(3)散点图首先用小黑板或幻灯给出施化肥量对水稻产量影响的试验数据:施化肥量x15202530354045水稻产量y330345365405445450455再同时给出各对数据在平面直角坐标系中表示的点.(板书)表示具有相关关系的两个变量的一组数据的图形,叫做散点图. 散点图形象地反映了各对数据的密切程度. 3.回归直线方程(1)求回归直线方程的思想方法先引导学生观察散点图的特征,发现各点大致分布在一条直线的附近.并问学生,类似图中的直线可画几条?显见,可画出不止一条类似的直线.那么,其中的哪一条直线最能代表变量x 与y 之间的关系呢?引导学生分析,最能代表变量x 与y 之间关系的直线的特征:即n 个偏差的平方和最小,其过程简要分析如下:设所求的直线方程为,其中a 、b 是待定系数.a bx y +=∧则 .于是得到各个偏差),,2,1.(n i a bx y i i =+=∧.),,2,1).((n i a bx y y y i i i i =+-=-∧显见,偏差的符号有正有负,若将它们相加会造成相互抵消,所以它们的和不∧-i i y y 能代表几个点与相应直线在整体上的接近程度,故采用n 个偏差的平方和2222211)()()(a bx y a bx y a bx y Q n n --++--+--= 表示n 个点与相应直线在整体上的接近程度.记 (向学生说明的意义).∑=--=ni i ia bx yQ 12)(∑=ni 1上述式子展开后,是一个关于a 、b 的二次多项式,应用配方法,可求出使Q 为最小值时的a 、b 的值(课前布置学生看阅读材料).即⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====..)())((2121121x b y a xn xxyn yx x x y y x x b ni ini ii n i i ni i i其中.∑∑====ni i n i i y n y x n x 111,1在此基础上,给出回归直线方程、回归直线、线性回归分析的概念.最后,向学生指出,对回归直线方程只要求会运用它进行具体计算a 、b ,求出回归直线方程即可.不要求掌握回归直线方程的推导过程.(2)回归直线方程的求法让学生用计算器对前面列表中的数据进行具体计算,列成以下表格i1234567ix 15202530354045i y 330345365405445450455ii y x 4950690091251215015575180002047587175,1132725,700071712712===∑∑∑===i i i i i i iy x y x提问:列表计算的优点是什么?故可得到,2573075.43.399,75.430770003.399307871752≈⨯-=≈⨯-⨯⨯-=a b 从而得回归直线方程是.25775.4+=∧x y 最后请一位学生画出回归直线,并求出时,y 的估计值.35=x 例 一个工厂在某年里每月产品的总成线y (万元)与该月产量x (万件)之间有如下一组对应数据:x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07y 2.252.372.402.552.642.752.923.033.143.263.363.50(1)画出散点图;(2)求月总成本y 与月总产量x 之间的回归直线方程.讲解上述例题时,(1)可由学生完成;对于(2),可引导学生列表,按的顺序计算,最后得到∑∑∑===→→→→→→→12112121212i i i i ii ii i i i y x y x y x y x y x .974.0,215.1≈≈a b 即所求的回归直线方程为.974.0215.1+=∧x y 若条件允许,可借助几何画板向学生演示本题,即画出散点图,并求出回归直线方程.讲解上述例题后,要求学生完成下面问题:在某种产品表面进行腐蚀线试验,得到腐蚀深度y 与腐蚀时间t 之间对应的一组数据:时间t (s )5101520304050607090120深度y (m )μ610101316171923252946(1)画出散点图;(2)试求腐蚀深度y 对时间t 的回归直线方程.略解:(1)散点图.呈直线形.(2)经计算可得∑∑∑========11111121112.13910,5442,36750,45.19,36.46i i i i ii iy t y t y t .3.036.46113675045.1936.4611139101111221112111≈⨯-⨯⨯-=⨯-⨯-=∑∑==tt tyyt b i i i ii .542.536.463.045.19≈⨯-=-=t b y a 故所求的回归直线方程为.542.53.0+=∧t y 让学生做课后练习题.4.课堂小结本节课要求准确理解相关关系的概念,并在此基础上,了解回归分析与散点图的含义,了解回归直线方程推导的思路,会利用a 、b 的公式求出回归直线方程,利用回归直线方程去估值.六、布置作业:教科书第1题.。

(完整版)回归分析的基本思想及其初步应用第1课时优秀教学设计

(完整版)回归分析的基本思想及其初步应用第1课时优秀教学设计

3.1 回归分析的基本思想及其初步【课题】: 3.1.1 回归分析的基本思想及其初步【学情分析】:教学对象是高二理科学生,学生已经初步学会用最小二乘法建立线性回归模型的知识,并能用所学知识解决一些简单的实际问题。

回归分析是数理统计中的重要内容,在教学中,要结合实例进行相关性检验,理解只有两个变量相关性显著时,回归方程才具有实际意义。

在起点低的班级中注重让学生参与实践,结合画图表的方法整理数据,鼓励学生通过收集数据,经历数据处理的过程,从而认识统计方法的特点,达到学习的目的。

【教学目标】:(1)知识与技能:回忆线性回归模型与函数模型的差异,理解用最小二乘法求回归模型的步骤,了解判断两变量间的线性相关关系的强度——相关系数。

(2)过程与方法:本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线方程。

(3 )情感态度与价值观:从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求知欲,培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进取。

【教学重点】:1. 了解线性回归模型与函数模型的差异;2. 了解两变量间的线性相关关系的强度——相关系数。

【教学难点】:1. 了解两变量间的线性相关关系的强度——相关系数;2. 了解线性回归模型与一次函数模型的差异。

【课前准备】:课件x1 其中 x =1 ni1 1 x i , y =n i1 这两个计算公式吗? ^b =(x i x)(y i y) i1ny i .( x , 从已经学过的知识我们知道,截距 α, β)=i由于 Q (α, β)x i(yx)] i 1(y x)(yx i(yi1 n( y - β x -注意到 x i(yi1i1y ii1(x i x)2 1y ) 称为样本点的中心。

你能推导出 学生动手画散 点图,老师用 EXCEL 的作图工作演示, 并引导学生找出两 个变量之间的关 系。

^^a 和斜率b 分别是使 n(y i x i 1x i (y 2[yix) ]n+2ix)](yx i(yx i2 ) 取最小值时α,β的值。

回归分析的基本思想及其初步应用优秀教学设计

回归分析的基本思想及其初步应用优秀教学设计

由上述计算可得到
并向学生指出: r 1,且 r 越接近于 1,相关程度越大; r 越接近于 0,相关程度
越小.
根据上述结论,引导学生提出如下问题:
当 r 与 1 接近到什么程度时表明 y 与 x 之间具有线性相关关系?
为解决上述问题,一般采取以下方法: 3.(板书)线性相关关系检验方法 (1)说明线性相关关系检验方法的思想及前提. (2)检验的具体方法. ①根据公式计算相关系数 r 的值;
②在附表中查出与显著性水平 0.05 和自由度 n 2 相应的相关系数临界值 r0.05 ;
③检验所得结果:若 r r0.05 ,则 y 与 x 之间线性相关关系不显著;若 r r0.05 ,则 y
与 x 之间存在线性相关关系.
(3)具体例子:计算本节水稻产量与施化肥量中有关数据进行相关性检验,并指出检
n
(xi x)( yi y)
r
i 1
n
n
(xi x)2 ( yi y)2
i 1
n1
n
xi yi nxy

r
ቤተ መጻሕፍቲ ባይዱi 1
n
(
xi2 nx 2 )( n
yi2

2
ny )
i 1
n1
叫做变量 y 与 x 之间的样本相关系数(简称相关系数),用它来衡量它们之间的线性相关程
度.
由学生计算本节前面水稻产量与施化肥量的相关系数,即
7
xi yi 7xy
r
i 1
(
7
xi2

2
7x
)(
7
(
yi2

7
2
y

(教案)1.1回归分析的基本思想及其初步应用

(教案)1.1回归分析的基本思想及其初步应用

1。

1回归分析的基本思想及其初步应用授课教师:王宏郭懿教学重点:(1)通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤;了解线性回归模型与函数模型的区别;(2)尝试做散点图,求回归直线方程;(3)能用所学的知识对实际问题进行回归分析,体会回归分析的实际价值与基本思想;了解判断刻画回归模型拟合好坏的方法――相关指数和残差分析.教学难点:(1)求回归直线方程,会用所学的知识对实际问题进行回归分析.(2)掌握回归分析的实际价值与基本思想。

(3)能运用自己所学的知识对具体案例进行检验与说明。

(4)残差变量的解释;(5)偏差平方和分解的思想;教学内容:一、基础知识梳理1.回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。

求回归直线方程的一般步骤:作出散点图(由样本点是否呈条状分布来判断两个量是否具有线性相关关系),若存在线性相关关系→②求回归系数→③写出回归直线方程,并利用回归直线方程进行预测说明。

2.回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法。

建立回归模型的基本步骤是:①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;②画好确定好的解释变量和预报变量的散点图,观察它们之间的关系(线性关系)。

③由经验确定回归方程的类型.④按一定规则估计回归方程中的参数(最小二乘法);⑤得出结论后在分析残差图是否异常,若存在异常,则检验数据是否有误,后模型是否合适等.3.利用统计方法解决实际问题的基本步骤:(1)提出问题;(2)收集数据;(3)分析整理数据;(4)进行预测或决策.4.残差变量的主要来源:(1)用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型到底是什么)所引起的误差。

可能存在非线性的函数能够更好地描述与之间的关系,但是现在却用线性函数来表述这种关系,结果就会产生误差。

这种由于模型近似所引起的误差包含在中。

2019年回归分析的基本思想及其初步应用(第1课时)教案精品教育.doc

2019年回归分析的基本思想及其初步应用(第1课时)教案精品教育.doc

1.1回归分析的基本思想及其初步应用(第1课时)教案教材:人民教育出版社A版选修1-2第2页到第4页授课教师:广东省惠州市第一中学刘健【教学目标】在《数学③(必修)》之后,学生已经学习了两个变量之间的相关关系,包括画散点图,最小二乘法求回归直线方程等内容.在人教A版选修1-2第一章第一节“回归分析的基本思想及其初步应用”这一节中进一步介绍回归分析的基本思想及其初步应用.这部分内容《教师用书》共计4课时,第一课时:介绍线性回归模型的数学表达式,解释随机误差项产生的原因,使学生能正确理解回归方程的预报结果;第二课时:从相关系数、相关指数和残差分析角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤;第三课时:介绍两个变量非线性相关关系;第四课时:回归分析的应用. 本节课是第一课时的内容.1、知识目标认识随机误差;2、能力目标(1)会使用函数计算器求回归方程;(2)能正确理解回归方程的预报结果.3、情感目标通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力.教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性.【教学重点】随机误差e的认识【教学难点】随机误差的来源和对预报变量的影响【教学方法】启发式教学法【教学手段】多媒体辅助教学【教学流程】【教学过程设计】【教学反思】通过本节课的教学实践,我再次体会到什么是由“关注知识”转向“关注学生”,在教学过程中,注意到了由“给出知识”转向“引起活动”,由“完成教学任务”转向“促进学生发展”,课堂上的真正主人应该是学生.一堂好课,师生一定会有共同的、积极的情感体验.本节课的教学中,知识点均是学生通过探索“发现”的,学生充分经历了探索与发现的过程.教学中没有以练习为主,而是定位在知识形成过程的探索,注重数学的思想性,如统计思想、随机观念、函数思想、数形结合的思想方法等,引导学生体验数学中的理性精神,加强数学形式下的思考和推理.几点注明:1、复习引入时教师做示范——提供5组身高与体重的数据,用Excel展示如何画散点图、用最小二乘法求线性回归方程.随机抽样并列表如下:2、计算机做散点图的步骤如下:(1)进入Excel软件操作界面,在A1,B1分别输入“身高”和“体重”,在A,B 列输入相应的数据.(2)点击“图表向导”图标,进入“图表类型”对话框,选择“标准类型”中的“XY散点图”,单击“下一步”.(3)在“图表向导”中的“图表数据源”对话框中,选择“系列”选项,单击“添加”按钮添加系列1,在“X值”栏中输入身高所在数据区域,在“Y值”栏中输入体重所在数据区域,单击“下一步”.(4)进入“图表向导”中的图表选项对话框,对图表的一些属性进行设置. (5)单击“完成”按钮.注:也可以直接使用我们提供的文件来给学生演示,相对节约课堂时间.3、学生使用函数计算器求回归方程的过程如下:(学生还会使用更先进的计算器) 4、课堂使用的数据如下高二女生前15组数据列表:MODE SHIFT CLR =1 13 , DT 165 49 ,DT17565, DT 165 58 , DT 157 51 , DT 170 53 SHIFT CLR SHIFT CLR 2 ==1 (进入回归计算模式)(清除统计存储器)(输入五组数据)所以回归方程为 yˆ0.673x-56.79 (计算参数a) (计算参数b)高二女生中间15组数据列表:高二女生后15组数据列表:课本P2例题1 女大学生8组数据列表:例1.。

1.1_回归分析的基本思想及其初步应用_教案(人教A版选修1-2)

1.1_回归分析的基本思想及其初步应用_教案(人教A版选修1-2)

统计案例明菜缶方A F 车读疵灵法”(教师用书独具)析,明确解决回归模型的基本步骤,并对具体问题进行回归分析以解决实际应用 问题.了解最小二乘法的推导,解释残差变量的含义,了解偏差平方和分解的思器求线性回归直线方程参数及相关系数的方法.2.过程与方法通过收集数据作散点图,分析散点图,求回归直线方程,分析回归效果,利 用方程进行预报.3.情感、态度与价值观培养学生利用整体的观点和互相联系的观点来分析问题, 的应用意识,培养学生学好数学、用好数学的信心,加强与现实生活的联系,以 科学的态度评价两个变量的相互关系.•重点难点重点:回归分析的基本方法、随机误差 e 的认识、残差图的概念、用残差及R 2来刻画线性回归模型的拟合效果.难点:回归分析的基本方法、残差概念的理解及拟合效果的判定、非线性回新课标数学选修1— 2•三维目标1 .知识与技能通过典型案例的探究, 了解回归分析的基本思想,会对两个变量进行回归分 1. 1回归分析的基本思想及其初步应用想,了解判断刻画模型拟合效果的方法相关指数和残差分析.掌握利用计算进一步加强数学归向线性回归的转化.教学时要以残差分析为重点,突出残差表和 R 2的计算,通过举例说明相关关系与确定性关系的区别,说明回归分析的必要性及其方法.借助例题使学生掌 握作散点图、求回归直线方程的方法,通过作残差图、计算 R 2让学生掌握拟合效果的判断方法.对于非线性回归问题重点在如何转换,引导学生分析总结转化 方法和技巧,从而化解难点.(教师用书独具)•教学建议本节课建议教师采取探究式教学,把“关注知识”转向“关注学生”, 在教 学过程中,把“给出知识”的过程转变为“引起活动, 把“完成教学任务”转向“促进学生发展”, 在知识形成过程的探索,例题的解答也要由学生探讨、教师点拨,共同完成.要 注重数学的思想性,如统计思想、随机观念、函数思想、数形结合的思想方法等, 引导学生体验数学中的理性精神,加强数学形式下的思考和推理能力.•教学流程创设问题情境,引出问题,弓I 导学生探讨,从而引出回归分析、 型、刻画回归效果的有关概念及解决方法.利用填一填的形式,习本节基础知识,并反馈了解,对理解有困难的概念加以讲解.习基础知识的基础上分析回答例题1的问题,并总结规律方法,完成变式训练. 引导学生分析例题2,根据图中的数据计算系数,求出回归方程,列出残差表, 求出R 2并判断拟合效果,完成变式训练.敖歩方案设th授方珞沫程细隣冋F 數祺"让学生探究知识的过程”,让学生成为课堂上的真正主人.在 教学中,知识点可由学生通过探索“发现”, 让学生充分经历探索与发现的过程, 并引导学生积极解决探索过程中发现的问题.教学中不要以练习为主,而是定位线性回归模 使学生自主学 引导学生在学完成当堂双基达标,巩固所学知识及应用方法,并进行反馈矫正. 归纳整理,进行课堂小结,整体认识本节所学知识,强调重点内容和规律方法.老师启发引导,完成例题3,并要求学生借鉴例题3的解法完成变式训练. 引 导学生分析例题3,让学生作出散点图,观察相关性,引出问题,即如何使问题 转化为相关关系并用线性回归分析二者关系.1•会用散点图分析两个变量是否存在相关关系.(重点)2.会求回归方程,掌握建立回归模型的步骤,会选择回归模型.(重点、难点)【问题导思】台机器由于使用时间较长,生产的零件有一些会有缺陷.按不同转速生产出有缺陷的零件的统计数据如下:1.在平面直角坐标系中作出散点图.【提示】yIQS'0 » 10 12 14 16 R2.从散点图中判断x 和y 之间是否具有相关关系?【提示】 有.3.若转速为10转/秒,能否预测机器每小时生产缺陷的零件件数?【提示】 可以.根据散点图作出一条直线,求出直线方程后可预测.通过课标解读(1) 回归直线方程:y= bx+a,其中:n _ ___Z (X i- 7 则—丁)八八___ 八____ _ 1 nb= , a= y —b x , x = -S x i,n一 2 n iTZ (X i—x)1 = 1—1J y二n p i.(2) 变量样本点中心:(X , y ),回归直线过样本点的中心.(3)线性回归模型:y= bx+a+e,其中e称为随机误差,a和b是模型的未知参数,自变量x 称为解释变量,因变量y称为预报变量.ny 2Z (y i —yi )1=1 R 2= 1— ,R 2表示解释变量对预报变量变化的贡献率,n— —2 三(y i — y )i = 1R 2越接近于1,表示回归的效果越好卜例n 有下列说法:①线性回归分析就是由样本点去寻找一条直线, 使之贴近这些样本点的数学 方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系 表示;③通过回归方程y =bx +a ,可以估计和观测变量的取值和变化趋势;④因 为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检 验.其中正确命题的个数是()C . 3①反映的正是最小二乘法思想, 故正确.②反映的是画散点 ③解释的是回归方程y = bx +a 的作用,故也正确.④是不正 确的,在求回归方程之前必须进行相关性检验,以体现两变量的关系.【答案】 CI 规律方法I1.解答例1中④时,必须明确具有线性相关关系的两个变量间才能求得一个线性回归方程,否则求得的方程无实际意义.因此必须先进行线性相关性判断,相关指 数R 2靜宅互动探究硕冠:幸 3讳主互动 A "知能"IlS :^【思路探究】可借助于线性相关概念及性质逐一作出判断.【自主解答】 图的作用,也正确.后求线性回归方程.2.回归分析的过程:(1) 随机抽取样本,确定数据,形成样本点;(2) 由样本点形成散点图,判断是否具有线性相关关系; (3) 由最小二乘法确定线性回归方程; (4)由回归方程观察变量的取值及变化趋势.» 亜貳 illl 11关于变量y 与x 之间的回归直线方程叙述正确的是()表示y 与x 之间的一种确定性关系表示y 与x 之间的相关关系 表示y 与x 之间的最真实的关系回归直线方程能最大可能地反映 y 与x 之间的真实关系,故选项D 正确.【答案】►例0已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:求y 关于x 的回归直线方程,并说明回归模型拟合效果的好坏. 【思路探究】回归模型拟合效果的好坏可以通过计算 R 2来判断,其值越大,说明模型的拟合效果越好.—1【自主解答】 x = 5(14 + 16+18+20 + 22)= 18, y = 5(12 + 10+7+5+ 3)= 7.4,B .C .D . 表示y 与x 之间真实关系的一种效果最好的拟合【解析】5Z x i 2— 142+ 162+ 182 + 202 + 222 — 1 660,i — 15Z x i y i = 14X 12+ 16X 10+ 18X 7 + 20X 5 + 22X 3 = 620,丄15 _ _S x i y i — 5 X yAi — 1620— 5X 18X 7.4 所以b —V 2 口一2 Z x i — 5 Xi — 1Aa = 7.4 + 1.15X 18 = 28.1,21 660- 5X 18所以所求回归直线方程是Ay =— 1.15X + 28.1列出残差表: 5所以送i — 1TA 2Z (y i —yi )i — 12R — 1— ----------- ~ 0.994,5 —送(y i - y )2i — 1所以回归模型的拟合效果很好.I 规律方法IA A1.回归直线方程能定量地之间的变化趋势,其中b 表示X 变化一个单位时,y 的平均变化量.利用回归直A5A -- 2(y i — y i ) — 0.3,送(y i — y) — 53.2,i = 1线可以对问题进行预测,由一个变量的变化去推测另一个变量的变化.2. 线性回归分析中:(1) 残差平方和越小,预报精确度越高.(2) 相关指数R 2取值越大,说明模型的拟合效果越好.卜娈貳illl 11某运动员训练次数与运动成绩之间的数据关系如下:⑴作出散点图;(2) 求出线性回归方程;(3) 作出残差图,并说明模型的拟合效果;⑷计算R 2,并说明其含义.【解】 ⑴作出该运动员训练次数(X )与成绩(y)之间的散点图,如图所示.— — 8 2(2) 可求得 X = 39.25, y = 40.875,艺x i = 12 656,i — 18 8Z y i 2= 13 731, S X i y i = 13 180, i = 1i = 18 _ _Z X i y i — 8 X yi — 1------------- 〜1.041 5,88 _ _送(X i — X l y i — y )i — 1Ab — -------------------------8 —艺(X i - X 2i — 1Y6050 40 30 20 ]020 40P 2 C一2Z X i —8 Xi — 1A ---- A ----a—y —b X ——0.003 875,A•••线性回归方程为y—1.041 5X— 0.003 875.(3) 作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.(4) 相关指数R9 10—0.985 5.说明了该运动员的成绩的差异有98.55%的可能性是由训练次数引起的.卜例「下表为收集到的一组数据:(1)作出X与y的散点图,并猜测与之间的关系;9 建立X与y的关系,预报回归模型并计算残差;10 利用所得模型,预报x= 40时y的值.【思路探究】(1)画出散点图或进行相关性检验,确定两变量X、y是否线性相关.由散点图得X、y之间的回归模型.(2)进行拟合,预报回归模型,求回归方程.【自主解答】⑴作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y= C1ec2x的周围,其中C1、C2为待定的参数.r350ion250200J501005020 23 34 26 2S 30 取34 36 *(2)对两边取对数把指数关系变为线性关系,令z= In y,则有变换后的样本点应分布在直线z= bx+ a, a= In c i, b= C2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:x21232527293235z 1.946 2.398 3.045 3.178 4.190 4.745 5.784A求得回归直线方程为z= 0.272x—3.849,Z0.272X —3.849••y= e —残差如下表:y i711212466115325z6.44311.10119.12532.95056.770128.381290.325y iz e0.557—0.101 1.875—8.9509.23—13.38134.675 z rr-u 0.272x— 3.849 . zcz⑶当x=40 时,y= e " 1 131.I规律方法I两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y = C1ec2X,我们可以通过对数变换把指数关系变为线性关系,令z= In y,则变换后样本点应该分布在直线z =bx+ a(a= In c i, b = C2)的周围.卜亜貳illl 11根据表中数据,建立与之间的回归方程.【解】由表中测得的数据可以作出散点图,如图.150 .50 . *° 5 10 15 h观察散点图中样本点的分布规律,可以判断样本点分布在某一条曲线附近,表示该曲线的函数模型是Q= m h n(m, n是正的常数).两边取常用对数, 则Ig Q= Ig m+ n Ig h.令y= Ig Q, x= Ig h,那么y= nx+ Ig m,即为线性函数模型y= bx+ a的形式(其中b= n, a= Ig m).由下面的数据表,用最小二乘法可求得b~2.509 7, a = —0.707 7,所以于是所求得的回归方程为Q = 0.196 h'没有理解相关指数R2的意义而致误卜典例关于x与y有如下数据:为了对X、y两个变量进行统计分析,现有以下两种线性模型:甲模型y= 6.5x+ 17.5,乙模型y= 7x+17,试比较哪一个模型拟合的效果更好.V y 2送(y i —yi)i _ 1c _ 155【错解】'•R1 _ 1 —_ 1 —彳CM_ 0.845.5 I 000——2送(y i—y )i _ 1V y 2Z (y i —yi)i_ 12 - ____________________ 180R2_ 1 — - _ 1—1 000_ O.82.P — 2Z (y i—y )i _ 1又••84.5%>82%,二乙选用的模型拟合的效果更好.【错因分析】没有理解R2的意义是致错的根源,用相关指数R2来比较模型的拟合效果,R2越大,模型的拟合效果越好,并不是R2越小拟合效果更好.V y 2 乞(y i—yi)i = 1【防范措施】R2= 1 —--------------- ,R2越大,残差平方和越小,从而回归n —艺(y i- y fi_ 1模型的拟合效果越好.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率,R 2越接近1表示回归的效果越好(因为R 2越接近1,表示解释变量 和预报变量的线性相关性越强).从根本上理解R 2的意义和作用,就可防止此类 错误的出现.Vy 2艺(y i — yi )i =19155R 1= 1—= 1 — 1 000= O.845,P —2 S (y i — y )i - 1(y i - y i )2J 1805= 1-1 000= 0.82,P — 2无(y i — y )i = 184. 5%>82%,所以甲模型拟合效果更好.1.在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据•然后,可以通过残差e i , e 2,-【正解】R 2= 1-e n来判断模型拟合的效果,判断原始数据中是否存在可疑数据. 这方面的分析工作称为残差分析.2.我们还可以用相关指数R2来反映回归的效果,其计算公式是:R2= 1-认-y i)nP — 2送(y i—y )i =1显然,R2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率.1 .已知x和y之间的一组数据则y与x的线性回归方程y=bx+ a必过点(A • (2,2)3 B. (3, 0)C. (1,2)3 D.(2, 4)【解析】匚=和 + 1 + 2 + 3) = 3, 7 = 4(1 + 3+ 5+ 7) = 4,二回归方^=bx+a必过点(2,4).【答案】D2. (2013青岛高二检测)在下列各组量中:①正方体的体积与棱长; ②一块农田的水稻产量与施肥量;③人的身高与年龄;④家庭的支出与收入; ⑤某户家庭的用电量与电价.其中量与量之间的关系是相关关系的是()A .①②B .②④C .③④)D .②③④【解析】①是函数关系V= a3;⑤电价是统一规定的,与用电量有一定的关系,但这种关系是确定的关系.②③④中的两个量之间的关系都是相关关系,因为水稻的产量与施肥量在一定范围内是正比、反比或其他关系,并不确定;人的身高一开始随着年龄的增加而增大,之后则不变化或降低,在身高增大时,也不是均匀增大的;家庭的支出与收入有一定的关系,在一开始,会随着收入的增加而支出也增加,而当收入增大到一定的值后,家庭支出趋向于一个常数值,也不是确定关系.【答案】D3. 下列命题正确的有①在线性回归模型中,e是bx+ a预报真实值y的随机误差,它是一个可观测的量;②残差平方和越小的模型,拟合的效果越好;③用R4 5来刻画回归方程,R2越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,若带状区域宽度越窄,说明拟合精度越高,回归方程的预报精度越高.【解析】对于①随机误差e是一个不可观测的量,③R2越趋于1,拟合效果越好,故①③错误.对于②残差平方和越小,拟合效果越好,同理当残差点比较均匀地落在水平的带状区域时,拟合效果越好,故②④正确.【答案】②④4. 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:4 请画出上表数据的散点图;5 请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;(3) 已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测技改后生产100吨甲产品比技改前少消耗多少吨标准煤.(参考数值:3X 2.5 + 4X 3+ 5X 4+ 6X 4.5= 66.5)【解】(1)如下图.5 4324(2) S x i y i = 3X 2.5 + 4X 3+ 5X 4+ 6X 4.5= 66.5,i - 1— 3+4+5+ 6 — 2.5 + 3+4 + 4.5X = 4= 4.5, y = A= 3.5,4Z x 2= 32 + 42+52+ 62 = 86.i — 1y66.5— 4X 4.5X 3.5 66.5 — 63---------- ;—— — 0.7,b —86 —81 y — y —a — y —b X — 3.5— 0.7X 4.5— 0.35,因此,所求的线性回归方程为y = 0.7X + 0.35.(3)根据回归方程预测,现在生产 100吨产品消耗的标准煤的数量为 0.7X 100+ 0.35 = 70.35(吨),故耗能减少了 90 — 70.35 = 佃.65(吨标准).、选择题1 .在画两个变量的散点图时,下面叙述正确的是 ( )A .预报变量在x 轴上,解释变量在y 轴上286— 4X 4.52 課方知能检测,爭■卜-期自r 半呷;眞-农朋"B .解释变量在X 轴上,预报变量在y 轴上C .可以选择两个变量中任意一个变量在 X 轴上D .可以选择两个变量中任意一个变量在 y 轴上 【解析】 结合线性回归模型y = bx +a + e 可知,解释变量在x 轴上,预报 变量在y 轴上,故选B. 【答案】 B 2. (2013泰安高二检测)在回归分析中,相关指数R 2的值越大,说明残差平 方和()A •越大B .越小C .可能大也可能小D .以上均错nz i = 1【解析】 ••R 2= 1 — ----------- ,二当R 2越大时,V一 2壬(y i — y )i _ 1A 2(y— yi ) nA 2Z (y i —y i )2越小,即残差平方和越小.i —1【答案】 B 3•设变量y 对X 的线性回归方程为 “2 — 2.5X ,则变量x 每增加一个单位时, y 平均( )A .增加2.5个单位B .增加2个单位C .减少2.5个单位D .减少2个单位 【解析】 回归直线的斜率b = — 2.5,表示X 每增加一个单位,y 平均减少 2.5个单位. 【答案】 C4. (2012湖南高考)设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(X , y i )(i = 1,2,…,n ),用最小二乘法建立【答案】 二、填空题6. 在研究身高和体重的关系时,求得相关指数 R 2-“身高解释了 64%的体重变化,而随机误差贡献了剩余的 36%”,所以身高对体重的效应比随机误差的效应大得多.的回归方程为y = 0.85X -85.71,贝U 下列结论中不正确 的是()A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(X , y ) C. 若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg D. 若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg 【解析】 由于线性回归方程中X 的系数为0.85,因此y 与X 具有正的线性 相关关系,故A 正确.又线性回归方程必过样本中心点(X , y ),因此B 正确.由 线性回归方程中系数的意义知,X 每增加1 cm ,其体重约增加0.85 kg ,故C 正确.当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,而不是具体值, 因此D 不正确. 【答案】 D 5.在判断两个变量y 与X 是否相关时,选择了 4个不同的模型,它们的相 关指数R 2分别为:模型1的相关指数R 2为0.98,模型2的相关指数R 2为0.80, 模型3的相关指数R 2为0.50,模型4的相关指数R 2为0.25.其中拟合效果最好的 A .模型1 B .模型2 C .模型3D .模型4【解析】相关指数R 2能够刻画用回归模型拟合数据的效果,相关指数R 2的值越接近于 1,说明回归模型拟合数据的效果越好.,可以叙述为Vy 2 送(y i — yi )i = 1结合相关指数的计算公式 R 2= 1 — 可知,当R 2= 0.64V一 2艺(y i — y )i _ 17. 调查了某地若干户家庭的年收入 x (单位:万元)和年饮食支出y (单位:万 元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y = 0.254X + 0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加 _____________ 元.rA A【解析】 以 X + 1 代 X ,得y = 0.254(x + 1)+ 0.321,与y = 0.254x + 0.321 相 减可得,年饮食支出平均增加 0.254万元.【答案】 0.254&已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是【解析】 由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),A可得 y — 5= 1.23(x — 4),A即 y = 1.23x + 0.08. 【答案】 y _ 1.23x + 0.08 三、解答题9•某省2013年的阅卷现场有一位质检老师随机抽取 5名学生的总成绩和数学成绩(单位:分)如下表所示:(1) 作出散点图;【解析】时,身高解释了64%的体重变化.【答案】 0.64(2) 对x与y作回归分析;(3) 求数学成绩y对总成绩x的回归直线方程;(4) 如果一个学生的总成绩为500分,试预测这个学生的数学成绩. 【解】(1)散点图如图所示:珥-帥70 -60 -504030 -20 -10%恥0 3H0 4(W 420 440 4肿—2 012 —339 2 2(2) X = ~5~,y—5 ,刀i= 1xi—819 794,5 5刀尸1y2= 23 167,刀i=1x i y i = 137 760.•T =错误!错误!)=错误!〜0.989.因此可以认为y与x有很强的线性相关关系.5 ——y刀尸严一5 x y(3) ----------------------------- 回归系数b=—5 = 0.132 452,刀=1x i —5 xA ----------- A ------------a= y —bx = 14.501 315.AT回归方程为丫= 0.132 452( + 14.501 315.⑷当x= 500时,y〜81.即当一个学生的总成绩为500分时,他的数学成绩约为81分.10. (2012福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:__ ________(1) 求回归直线方程y= bx+a,其中b= —20,a= y —b x ;(2)预计在今后的销售中,销量与单价仍然服从⑴中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入—成本)—1【解】⑴由于x = 6(8 + 8.2 + 8.4 + 8.6 + 8.8 + 9) = 8.5, y = 6(90+84+83+80+75 + 68) = 80,又b= —20,--------- --------- ■ , A所以a= y —b x = 80+ 20x 8.5 = 250,从而回归直线方程为y= —20x+ 250.(2)设工厂获得的利润为L元,依题意得L = x(- 20x + 250) —4(-20x+ 250)2=—20x2+ 330x—1 0002=—20(x—8.25) + 361.25.当且仅当x= 8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.11.在关于人的脂肪含量(百分比)和年龄的关系的研究中,研究人员获得了一组数据如下表:作出散点图,并判断与是否线性相关.若线性相关,求线性回归方程;R 2~ 0.941,表明年龄解释了 94.1%的脂肪含量变化.⑶当x = 37时,y = 0.576X 37 — 0.448~ 20.9,故37岁时人的脂肪含量约为 20.9%.(教师用书独具)(2) 求相关指数R 2,并说明其含义; (3) 给出37岁时人的脂肪含量的预测值.【解】(1)散点图如图所示.由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关 系.脂肪含朮丿IJ5 I 马 O 20 40 6080A A A设线性回归方程为y = bx + a ,AA则由计算器算得b ~0.576, a ~ = — 0.448, 所以线性回归方程为y = 0.576X — 0.448.⑵残差平方和:14 Z i = 1y 2 14 y 2e i = 2 (y i — y i ) e 37.78.i =1总偏差平方和:14£ (y i — y)丄12宀R 2=〜 R— ' 644.990.941.敖呻备限资源昼拓啟 W 捕施畝阳;0视曹”为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:⑴作出散点图并求回归方程;2(2)求出R ; (3)进行残差分析.【思路探究】(1)由表作出散点图,求出系数值,即可写出回归方程.(2) 列出残差表,计算R 2,由R 2的值判断拟合效果.⑶由⑵中残差表中数值,进行回归分析. 【自主解答】 (1)散点图如图.x = 6(5+ 10+15+20+25+ 30)= 17.5,y = 11(7.25+ 8.12+ 8.95+ 9.90+ 10.9+ 11.8)〜9.487,6Z x i y i = 1 076.2.i - 1A计算得,b ~0.183, a ~6.285,A所求线性回归方程为y = 6.285+ 0.183X.-4 20 8 4 2u TJ ]6Z x i 2= 2 275, i _ 1⑵列表如下:所以 Z (y — y i )2-0.013 18, Z (y — V)2= 14.678 4.i _ 1i _ 1m, 0.013 18 c ccc所以,R = 1 —14.678 4^0.999 1,归模型;由表中数据可以看出残差点比较均匀地落在不超过 0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高, 由以上分析可知,弹簧长度 与拉力成线性关系.I 规律方法I建立回归模型的基本步骤:(1)确定解释变量和预报变量;(2)画散点图,观察是否存在线性相关关系; (3)确定回归方程的类型,女口 y = bx + a ; (4)按最小二乘法估计回归方程中的参数;(5) 得结果后分析残差图是否异常,若存在异常,则检查数据是否有误,或模型是否合适.假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有关的统计 资料如下表所示.回归模型的拟合效果较好.(3)由残差表中的数值可以看出第 3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误, 如果有的话,需要纠正数据,重新建立回A A A 一 A A(1) 线性回归方程y = bx +a 的回归系数a 、b ;(2) 求相关指数R 2;(3) 估计使用年限为10年时,维修费用是多少?【解】 ⑴由已知数据制成下表.由此可得x = 4, y = 5,5——送(X i — x j(yi — y )i = 1Ab = ------------------- = 1.23,5—Z (X i - x 2i _ 1A ---- A ----a = y —b x = 5 — 1.23X 4= 0.08, A•'讨=1.23x + 0.08.5A 2送(y i —y i)i = 12(2)R = 1— ------------5_艺(y i - y 2i = 1=1—1578"0.958 7.A A(3)回归直线方程为 y = 1.23x + 0.08,当 x = 10(年)时,y = 1.23X 10 + 0.08=若由资料知y 对呈线性相关关系.试求<:12.38(万元),即估计使用10年时维修费用是12.38万元.少年智则国智,少年富则国富,少年强则国强,少年独立则国独立,少年自由则国自由,少年进步则国进步,少年胜于欧洲,则国胜于欧洲,少年雄于地球,则国雄于地球。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.1 回归分析的基本思想及其初步
【课题】:3.1.1 回归分析的基本思想及其初步
【学情分析】:
教学对象是高二理科学生,学生已经初步学会用最小二乘法建立线性回归模型的知识,并能用所学知识解决一些简单的实际问题。

回归分析是数理统计中的重要内容,在教学中,要结合实例进行相关性检验,理解只有两个变量相关性显著时,回归方程才具有实际意义。

在起点低的班级中注重让学生参与实践,结合画图表的方法整理数据,鼓励学生通过收集数据,经历数据处理的过程,从而认识统计方法的特点,达到学习的目的。

【教学目标】:
(1)知识与技能:回忆线性回归模型与函数模型的差异,理解用最小二乘法求回归模型的步骤,了解判断两变量间的线性相关关系的强度——相关系数。

(2)过程与方法:本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线方程。

(3)情感态度与价值观:从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求知欲,
培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进
取。

【教学重点】:
1.了解线性回归模型与函数模型的差异;
2.了解两变量间的线性相关关系的强度——相关系数。

【教学难点】:
1.了解两变量间的线性相关关系的强度——相关系数;
2.了解线性回归模型与一次函数模型的差异。

【课前准备】:课件
②列表求出相关的量,并求出线性回归方程
代入公式有848.025.16582187745
.5425.165872315ˆ2
2
1
21
≈⨯-⨯⨯-=--=∑∑==x n x
y
x n y
x b
n
i i
n
i i
i
712.8525.165849.05.54ˆ-=⨯-=-=x b y a
所以回归方程为712.85849.0ˆˆˆ-=+=x x b a y
③利用回归方程预报身高172cm 的女大学生的体重约为多少?
当172=x 时,()kg y
316.60712.85172849.0ˆ=-⨯= 引导学生复习总结求线性回归方程的步骤:
第一步:作散点图—→第二步:求回归方程—→第三步:代值计算
三、探究新知
问题四:身高为172cm 的女大学生的体重一定是60.316kg 吗? (不一定,但一般可以认为她的体重在60.316kg 左右.)
师:提出问题,引导学生比较函数模型与线性回归模型的不同,并引出相关系数的作用。

生:思考、讨论、解释
解释线性回归模型与一次函数的不同 从散点图可观察出,女大学生的体重y 和身高x 之间的关系并不能用一次函数y bx a =+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm 的3名女大学生的体重分别为48kg 、57kg 和61kg ,如果能用一次函数来描述体重与身高的关系,那么身高为165cm 的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e (即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型
引导学生了解线性回归模型与一次函数的不同
40
45505560
6570150
155160165170175180
练习与测试
1. 设有一个回归方程为x y
5.22ˆ-=,则变量x 增加一个单位时,则( C ) A .y 平均增加5.2个单位 B .y 平均增加
2个单位 C .y 平均减少5.2个单位 D .y 平均减少2个单位 2. 在画两个变量的散点图时,下面哪个叙述是正确的( B )
A .预报变量在x 轴上,解释变量在y 轴上
B .解释变量在x 轴上,预报变量在y 轴上
C .可以选择两个变量中任意一个变量在x 轴上
D .可以选择两个变量中任意一个变量在y 轴上 3. 已知x 与y
则y 与x 的线性回归方程为a x b y
ˆˆ+=必过( D ) A .(2,2)点 B .(1.5,0)点 C .(1,2)点 D .(1.5,4)点
4. 已知两个相关变量x 与y 具有线性相关关系,当x 取值1,2,3,4时,通过观测得到y 的值分别为
1.2,4.9,8.1,1
2.8,这组样本点的中心是( D )
A .(2,4.9)
B .(3,8.1)
C .(2.5,7)
D .(2.5,6.75)
5. 一位母亲记录了儿子3—9岁的身高,数据(略),由此建立的身高与年龄的回归模型为y=7.19x+73.93,
用这个模型预测这个孩子10岁时的身高,则正确的叙述是( C )
A .身高一定是145.83cm
B .身高在145.83cm 以上
C .身高在145.83cm 左右
D .身高在145.83cm 以下
6. 在一次实验中,测得(x ,y )的四组值分别是A (1,2)、B (2,3)、C (3,4)D (4,5),则y 与x
之间的回归直线方程为( A )
A .1ˆ+=x y
B .2ˆ+=x y
C .12ˆ+=x y
D . 1ˆ-=x y 7. 有下列关系:⑴人的年龄与其拥有的财富之间的关系;⑵曲线上的点与该点的坐标之间的关系;⑶苹
果的产量与气候之间的关系;⑷森林中的同一树木,其横截面直径与高度之间的关系;⑸学生与其学号之间的关系。

其中有相关关系的是__________。

答案: ⑴⑶⑷
8. 许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时,收集了美国50个州的成年人受过9年或更少教育的百分比(x )和收入低于官方规定的贫困线的人数占本州人数的百分比(y )
的数据,建立的回归直线方程如下:6.48.0+=x y 。

斜率的估计等于8.0说明__________________,成年人受过9年或更少教育的百分比(x )和收入低于官方规定的贫困线的人数占本州人数的百分比(y )之间的相关系数__________________(填充“大于0“或”小于0“)。

答案: ⑴⑶⑷
9. 若施化肥量x 与小麦产量y 之间的回归直线方程为x y 4250ˆ+=,当施化肥量为50kg 时,预计小麦产量为__________。

解析:当50=x 时,450450250ˆ=⨯+=y 。

答案:kg 450。

10.
(1(2)求腐蚀深度y 对腐蚀时间t 的回归直线方程. 解:(1)散点图为
51010
152020303040405050
6070
90
120y t
(2)经计算可得
.13910,
5442,
36750,
45.19,36.4611
1
11
1
211
1
2=====∑∑∑===i i
i i i
i i
y
t y
t
y t
b =
2
2
11
1
2
11
1
36
.46113675045
.1936.4611139101111⨯-⨯⨯-=
-⋅⨯-∑
∑==t
t y
t y
t i i i i
i
≈0.3, a =y -b t =19.45-0.3×46.36≈5.542. 故所求的线性回归方程为^
y =0.3t +5.542.。

相关文档
最新文档