高中数学第2章统计2.4线性回归方程(2)教案苏教版必修3
2019-2020年高中数学 2.4线性回归方程第2课时教案 苏教版必修3
2019-2020年高中数学 2.4线性回归方程第2课时教案 苏教版必修3【学习导航】学习要求1.进一步了解非确定性关系中两个变量的统计方法;2.进一步掌握回归直线方程的求解方法. 【课堂互动】自学评价1.相关关系: 当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系 .2.回归分析: 对具有相关关系的两个变量进行统计分析的方法 .3. 求线性回归方程的步骤:(1)x y (2)x y x y (3)i i i i 计算平均数、,计算与的积,求,计算,,∑∑∑x y i i 22(4)将上述有关结果代入公式,求,写出回归直线方程.【精典范例】例1一个工厂在某年里每月产品的总成本y (万元)与该月产量x (万件)之间由如下一组数据:【解】1)画出散点图:x2)设回归直线方程,利用⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑==xb y a x x y x y x b i i i i i 121221211212,计算a ,b ,得b ≈1.215, a=≈0.974, ∴回归直线方程为:例2((1)画出上表的散点图;(2)求出回归直线度且画出图形.【解】(1)图略(2)1(45424648423558403950)44.5010x =+++++++++= 1(6.53 6.309.527.50 6.99 5.909.49 6.20 6.558.72)10y =+++++++++= 设回归直线方程为,则10110221100.17510i ii i i x y x y b xx ==-==-∑∑,=所以所求回归直线的方程为追踪训练(1)画出数据的散点图;(2)用最小二乘法估计求线性回归方程,并在散点图中加上回归直线.【解】(1)散点图(略)网](2)55115,545,109,116,23.2,i i i i n x x y y =======∑∑ 5521160952,12952i i i i i xx y ====∑∑ 25129525451160.1962,23.20.1962109 1.8166560952545b a ⨯-⨯=≈=-⨯≈⨯- 所以,线性回归方程为.2、一个工厂在某年里每月产品的总成本y(单位:万元)与月产量x( 单位:万件)之间有如下一组数据:(2)求出月总成本与月产量x 之间的线性回归方程。
2019-2020年高中数学 2.4《线性回归方程》学案 苏教版必修3
2019-2020年高中数学 2.4《线性回归方程》学案 苏教版必修3【目标引领】1.学习目标:了解非确定性关系中两个变量的统计方法;掌握散点图的画法及在统计中的作用,掌握 回归直线方程的求解方法。
2.学法指导:①求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实标意义.否则,求出的回归直线方程毫无意义.因此,对一组数据作线性回归分析时,应先看其散点图是否成线性.②求回归直线方程,关键在于正确地求出系数a 、b ,由于求a 、b 的计算量较大,计算时仔细谨慎、分层进行,避免因计算产生失误.③回归直线方程在现实生活与生产中有广泛的应用.应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序”变为“有序”,并对情况进行估测、补充.因此,学过回归直线方程以后,应增强学生应用回归直线方程解决相关实际问题的意识.【教师在线】1.解析视屏:1.相关关系的概念在实际问题中,变量之间的常见关系有两类:一类是确定性函数关系,变量之间的关系可以用函数表示。
例如正方形的面积S 与其边长之间的函数关系(确定关系);一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达。
例如一块农田的水稻产量与施肥量的关系(非确定关系)相关关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。
相关关系与函数关系的异同点:相同点:均是指两个变量的关系。
不同点:函数关系是一种确定关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系。
2.求回归直线方程的思想方法观察散点图的特征,发现各点大致分布在一条直线的附近,思考:类似图中的直线可画几条?引导学生分析,最能代表变量x 与y 之间关系的直线的特征:即n 个偏差的平方和最小,其过程简要分析如下:设所求的直线方程为,其中a 、b 是待定系数。
高中数学 2.4 线性回归方程课件 苏教版必修3
的特征. 解析: 由图可知①是一次函数关系,不是相关关系;
②中的所有点在一条直线附近波动,是线性相关的; 栏
目
③中的点杂乱无章,没有什么关系,是不相关的;④
链 接
中的所有点在某条曲线附近波动,是非线性相关的,
即两个变量(biànliàng)具有相关关系的是②④.
答案: ②④
第二十页,共39页。
典例 剖析
规律总结: 散点图直观地描述了两个变量之间有没
有相关关系,由散点图判断相关关系有两种情况,若
栏
所有的点看上去都在一条直线附近波动,则两个变量
目 链
是线性相关的;若所有的点看上去都在某条曲线 接
(qūxiàn)附近波动,则两个变量是非线性相关的,这
两种情况都说明两个变量间具有相关关系.
第二十一页,共39页。
栏 目 链 接
xiǎo),这种关系称为________. 负相关
3.线性回归方程是________________,其中b=
_n____________,a=_______y_^.=bx+a
iΣ=1xiyi-nx y
y-bx
iΣ=n1xi2-nx2
第六页,共39页。
自主 学习
4.线性回归方程 (jiāodiǎn)________.,
第三十一页,共39页。
典例
剖 析 题型四 用回归直线估计总体
例3高二(2)班学生(xué sheng)每周用于数学学习的
时间x(单位:h)与数学成绩y(单位:分)之间有如下数据:
栏
目
x
2 4
1 5
2 3
1 9
1 6
1 1
2 0
1 6
1 7
1 3
高中数学 2.4线性回归方程第2课时教案 苏教版必修3
线性回归方程第2课时【学习导航】学习要求1.进一步了解非确定性关系中两个变量的统计方法;2.进一步掌握回归直线方程的求解方法.【课堂互动】自学评价1.相关关系: 当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系 .2.回归分析: 对具有相关关系的两个变量进行统计分析的方法 .3. 求线性回归方程的步骤:(1)x y (2)x y x y (3)i i i i 计算平均数、,计算与的积,求,计算,,∑∑∑x y i i 22(4)将上述有关结果代入公式,求,b a ,写出回归直线方程.【精典范例】例1一个工厂在某年里每月产品的总成本y (万元)与该月产量x (万件)之间由如下一组数据:(1)画出散点图;(2)求月总成本y 与月产量x 之间的回归直线方程.1)画出散点图:x2)设回归直线方程a bx y+=ˆ, 利用⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑==xb y a x x y x y x b i i i i i 121221211212,计算a ,b ,得b ≈1.215, a=x b y -≈0.974,∴回归直线方程为:974.0215.1ˆ+=x y例2 已知10只狗的血球体积及红血球数的测量值如下:x ((1)画出上表的散点图;(2)求出回归直线度且画出图形. 【解】(1)图略 (2)1(45424648423558403950)44.5010x =+++++++++= 1(6.53 6.309.527.50 6.99 5.909.49 6.20 6.558.72)10y =+++++++++=7.37 设回归直线方程为 y bx a =+,则10110221100.17510i ii ii x y x yb xx==-==-∑∑,a y bx =-=0.418-所以所求回归直线的方程为 0.1750.148y x =-追踪训练(1)画出数据的散点图;(2)用最小二乘法估计求线性回归方程,并在散点图中加上回归直线. 【解】(1)散点图(略)网](2)55115,545,109,116,23.2,ii i i n xx y y =======∑∑5521160952,12952ii i i i xx y ====∑∑25129525451160.1962,23.20.1962109 1.8166560952545b a ⨯-⨯=≈=-⨯≈⨯-所以,线性回归方程为0.1962 1.8166y x =+.2、一个工厂在某年里每月产品的总成本y(单位:万元)与月产量x( 单位:万件)之间有如下一(2) 求出月总成本yˆ与月产量x 之间的线性回归方程。
高中数学第二章统计2.4线性回归方程学案苏教版必修3
2.4 线性回归方程1.理解线性回归的基本思想和方法,体会变量之间的相关关系.(难点)2.会画出数据的散点图,并会通过散点图判断这组数据是否具有线性关系.(重点) 3.会求数据的线性回归方程,并根据线性回归方程做出合理的判断.(重点、难点)[基础·初探]教材整理1 变量间的关系阅读教材P 74的内容,并完成下面的问题.1.变量间的关系关系.确定性函数表示,是一种函数函数关系:变量之间的关系可以用(1)来表达.函数,但不能完全用一定的联系相关关系:变量之间有(2)2.散点图横坐的取值作为x 是否有相关关系,常将y 与x 统计数表中,为了更清楚地看出从一个,这样的图形…),1,2,3=i )(i y ,i x (,在直角坐标系中描点纵坐标的相应取值作为y ,将标叫做散点图.判断正误:(1)相关关系是一种不确定关系,而函数关系是一种确定关系.( )(2)商品的销售收入与广告支出经费是函数关系.( )(3)散点图越集中,则相关关系越强.( )【解析】 (1)√.由函数关系及相关关系的定义知正确.(2)×.是相关关系,而不是确定关系,故错误.(3)×.只有当散点图呈规律性分布时才具有相关关系.故错误.【答案】 (1)√ (2)× (3)×教材整理2 线性回归方程阅读教材P 75~P 76“例1”上边的内容,并完成下列问题.1.线性相关关系拟合a +bx =y ^,我们用直线一条直线的附近如果散点图中点的分布从整体上看大致在叫做线性相关关系.相关关系近似表示的a +bx =y ^散点图中的这些点,像这样能用直线 2.线性回归方程设有n 对观察数据如下:=y ^时,就称最小值取得2)a -n bx -n y (+…+2)a -2bx -2y (+2)a -1bx -1y(=Q 使b ,a 当bx +a 为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线.3.用回归直线进行数据拟合的一般步骤附近;一条直线是否在散点作出散点图,判断(1)(2)如果散点在一条直线附近,用公式⎩⎪⎨⎪⎧b =∑i =1nxiyi -∑i =1nx∑i =1nyn ∑i =1n x2i -∑i =1n xa =y --b x-或求出a ,b ,并写出线性回归方程.填空:(1)有一个线性回归方程为y ^=2-1.5x ,则变量x 增加一个单位时,y 平均________1.5个单位.(填“增加”或“减少”)【解析】 ∵b =-1.5,∴x 每增加一个单位时y 减少1.5个单位.【答案】 减少(2)过(3,10),(7,20),(11,24)三点的回归直线方程是________.【解析】 代入系数公式得b =1.75,a =5.75.代入直线方程.求得y ^=5.75+1.75x .。
高中数学第2章统计2.4线性回归方程知识导引学案苏教版必修3
2.4 线性回归方程案例探究在学校里,教师对学生经常这样说:“如果你数学成绩好,那么你物理学习就不会有什么大问题.〞按照这种说法,似乎学生物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?分析:凭我们学习经历可知,物理成绩确实与数学成绩有一定关系,但除此以外,还存在其他影响物理成绩因素.例如,是否喜欢物理,用在物理学习上时间等等.在实际问题中,变量之间常见关系有如下两类:一类是确定性函数关系,变量之间关系可以用函数表示.例如,圆面积S与半径r之间就是确定性函数关系,可以用函数S=πr2表示.一类是相关关系,变量之间有一定联系,但不能完全用函数来表达.例如,人体重与身高有关.一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间关系.自学导引1.在实际问题中,变量之间常见关系有两类:一类是确定性关系,另一类是相关关系.2.自变量取值一定时,因变量取值带有一定随机性两个变量之间关系叫做相关关系.3.请你说出确定性关系与相关关系一样点与不同点.答案:一样点:均是指两个变量关系.不同点:相关关系是一种非确定关系.确定性关系是自变量与函数值之间关系,可以用一个函数表示.这种关系是两个非随机变量关系;而相关关系是非随机变量与随机变量关系.这种关系不能用一个确定函数来表示.4.你是否还能举出一些现实生活中存在相关关系问题?答案:例如,商品销售收入与广告支出经费之间关系;粮食产量与施肥量之间关系;人体脂肪含量与年龄之间关系,等等.5.将n个数据点〔x i,y i〕〔i=1,2,…,n〕描在平面直角坐标系中,以表示具有相关关系两个变量一组数据图形叫做散点图.6.〔1〕当两个变量成正相关时,散点图有什么特点?〔2〕当两个变量成负相关时,散点图又有什么特点?答案:〔1〕散点图中点散布在从左下角到右上角区域.〔2〕散点图中点散布在从左上角到右下角区域.7.对于散点图可以作出如下判断:〔1〕当所有样本点都落在某一函数曲线上,变量之间具有函数关系;〔2〕当所有样本点都落在某一函数曲线附近,变量之间具有相关关系;〔3〕当所有样本点都落在某一直线附近,变量之间具有线性相关关系.8.回归直线是怎样定义?答案:如果散点图中点分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.疑难剖析【例1】下表是某地年降雨量与年平均气温统计数据,判断两变量有相关关系吗?求回归直线方程有意义吗?年平均气温〔℃〕748542507813574701432年降雨量〔mm〕思路分析:用回归直线进展拟合两变量关系一般步骤为:〔1〕作出散点图,判断散点是否在一条直线附近;〔2〕如果散点在一条直线附近,以公式求出a, b,并写出线性回归方程.解:以x轴为年平均气温,y轴为年降雨量可得相应散点图:因为图中各点并不在一条直线附近,所以两者不具有线性相关关系,没有必要用回归直线进展拟合,用公式求得回归方程也是没有意义.思维启示:要判断两个变量是否具有线性相关关系,可先作出散点图,再观察散点是否在一条直线附近,如果是,那么二者具有线性相关关系;否那么,二者不具有线性相关关系.思维陷阱:解此题第〔2〕小问时不要盲目地去求回归方程.观察两相关变量得如下数据:x-1-2-3-4-553421y-9-7-5-3-115379求两变量间回归方程.错解:求线性回归直线方程步骤: 第一步:列表x i ,y i ,x i y i ; 第二步:计算x ,y ,,,; 第三步:代入公式计算b, a 值; 第四步:写出回归直线方程.列表:计算得:x =0, y =0 =110, =310, =110∴b=1010110010110)(101021012101=*-*-=--∑∑==x xyx yx i ii iia=y -b x =0-1*0=0故所求回归直线方程为yˆ=x. 正解:作两个变量散点图〔图略〕,从散点图中看出,点不在某条直线附近,分散得很开.因此,变量x 与y 不具有线性相关关系,也就不存在线性回归方程.【例2】 某班学生每周用于数学学习时间x 〔单位:h 〕与数学成绩y 〔单位:分〕之间有如下数据:某同学每周用于数学学习时间为18小时,试预测该生数学成绩. 思路分析:首先应该利用表中数据通过计算去判断数学学习时间x 与数学成绩y 是否具有线性相关关系.假设有,那么可求出回归方程;然后在方程中令x=18,可求出该生数学成绩.解:因为学习时间与学习成绩之间具有线性相关关系.利用科学计算器计算到如下表所示数据:于是可得b=53.34.1544.545)(101021012101≈=--∑∑==x xyx yx i ii iia=y -b x当x=18时,yˆ=3.53×18+13.5=77.04≈77 故该同学预计可得77分左右.思维启示:两个有线性相关关系变量间关系可以用线性回归方程来表示,而对总体预测可依据回归直线方程进展.【例3】一般说,一个人身高越高,他手就越大.为了调查这一问题,对10名高三男生身高与右手一揸长测量得如下数据:〔单位:cm〕〔1〕依据上述数据制作散点图,发现两者有何相关关系吗?〔2〕如果近似成线性关系,求线性回归方程.〔3〕如果一个学生身高185 cm,估计他右手一揸长.思路分析:首先作出散点图;利用散点图去判断两变量是否具有线性关系;假设具有线性关系,再利用公式求出方程;最后利用方程去解答第三小问.解:〔1〕散点图如下:可见,身高与右手一揸长之间总体趋势成一条直线,即他们线性相关.〔2〕设线性回归方程为yˆ=bx+a由上述数据计算可得x=174.8, y=305 730, =37 986∴b==303.08.174107303057.218.17410986372≈⨯-⨯⨯- a=y -b x∴方程为yˆ=0.303x-31.264. 〔3〕当x=185时, yˆ=24.79. 思维启示:先作出散点图,假设两变量具有线性关系,再利用公式求出方程. 拓展迁移【拓展点1】 如果你想作一个反对抽烟电视公益广告播放次数与看电视中学生戒烟率数据散点图,作为x 轴变量为__________. 答案:播放次数【拓展点2】 有时候,一些东西吃起来口味越好,对我们身体越有害,下表给出了不同类型某种食品数据.第一列表示此种食品所含热量百分比,第二列数据表示由一些美食家以百分制给出对此种食品口味评价.〔1〕求出回归直线方程;〔2〕关于两个变量之间关系,得出结论是什么?答案:〔1〕 yˆ 〔2〕由回归方程知道,食品所含热量越大,口味记录越好,反之亦然.【拓展点3】 某医院用光电比色计检验尿汞时,得尿汞含量〔毫克/升〕与消光系数如下表:〔1〕作出散点图;〔2〕如果y 与x 之间具有线性相关关系,求回归方程; 〔3〕估计尿汞含量为9毫克/升时消光系数. 答案:〔1〕散点图略.yˆ=bx+A . 计算可得回归方程为yˆ=36.95x-11.3.〔3〕当x=9时,yˆ=36.95×9-11.3=321.25≈321。
高中数学 2.4 线性回归方程学案 苏教版必修3
2.4 线性回归方程1.变量间的两种关系在实际问题中,变量之间的常见关系有如下两类:一类是确定性函数关系,变量之间的关系可以用函数表示;一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达.预习交流1相关关系与函数关系有何区别与联系?提示:相同点:两者均是指两个变量的关系;不同点:①函数关系是一种确定的关系;相关关系是一种非确定的关系;②函数关系是一种因果关系,而相关关系不一定是因果关系.2.散点图为了刻画两个变量之间的相关关系,常用横坐标x 表示一个变量,纵坐标y 表示另一个变量,建立平面直角坐标系,将两个变量所表示的点在坐标系内标出,这样的图称为散点图.预习交流2散点图有什么作用?提示:可以用来判断两个变量是否相关. 3.线性回归方程(1)最小平方法:离差的平方和Q (a ,b )是直线y ^=bx +a 与各散点在垂直方向(纵轴方向)上的距离的平方和,可以用来衡量直线y ^=bx +a 与图中各个点的接近程度.所以,设法取a ,b 的值,使Q (a ,b )达到最小值.这种方法叫做最小平方法,又称“最小二乘法”.其中y ^读作“y 估计”.(2)线性相关关系的概念:能用直线方程y ^=bx +a 近似表示的相关关系叫做线性相关关系.(3)当a ,b 使Q =(y 1-bx 122n n a )2取得最小值时,就称方程y ^=bx +a 为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线.(4)线性回归系数公式:线性回归方程y ^=bx +a 中的系数a ,b 可用下面的公式计算.⎩⎪⎨⎪⎧b =∑i =1nx i y i-n x y ∑i =1nx 2i -n x 2=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2,a =y -b x .预习交流3线性回归方程y ^=bx +a 是否一定经过一个定点?提示:由a =y -b x 代入线性回归方程,得y ^=bx +y -b x ,整理得(y ^-y )=b (x -x ).因此,线性回归方程一定经过定点(x ,y ).预习交流4(1)以下两变量之间具有相关关系的是__________. ①正方形的面积与边长 ②人的身高与年龄③匀速行驶车辆的行驶路程与时间 ④人的身高与视力(2)散点图的作用是__________. ①查找个体个数②比较个体数据大小关系 ③探究个体分类④粗略判断变量是否具有相关关系(3)若施化肥量x (千克/亩)与水稻产量y (千克/亩)的回归方程为y ^=5x +250,当施化肥量为80千克/亩时,预计水稻产量为__________.提示:(1)② (2)④ (3)650千克/亩一、线性相关关系的判断某公司利润(1)(2)判断y 与x 是否具有线性相关关系.思路分析:本题中涉及两个变量:利润与销售总额,以销售总额为自变量,考察利润的变化趋势,从而作出判断.解:(1)散点图如下,(2)由图知,所有数据点接近直线排列,因此,认为y 与x 有线性相关关系.1.在下列各变量之间的关系中:①凸n 边形(n ≥3)的边数与内角度数之和;②烧香拜佛的次数与考试成绩;③某校高一学生的身高与体重;④一块农田的玉米产量与施肥量.其中具有相关关系的是__________. 答案:③④解析:①是函数关系,②没有相关关系,③④均具有相关关系,故填③④. 2.下列各图中所示两个变量之间具有线性相关关系的是__________.答案:②解析:由散点图易知②中变量具有线性相关关系.解:(1)画出散点图如图.(2)由图知,两变量间存在相关关系.(1)两个变量x 和y 相关关系的确定方法:①散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断; ②表格、关系式法:结合表格或关系式进行判断; ③经验法:借助积累的经验进行分析判断.(2)判断两个变量x 和y 之间是否具有线性相关关系,常用的简便方法就是绘制散点图.如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.二、求线性回归方程求出y 关于x 的回归方程.思路分析:先画出散点图,判断它们是否具有相关关系,再根据题目中提供的数据先计算出x ,y ,∑i =1nx 2i ,∑i =1nx i y i ,代入公式求a ,b 的值即可.解:散点图如图所示.设所求回归方程为:y =bx +a ,则由上表可得b =∑i =15x i y i -5x y∑i =15x 2i -5x 2=112.3-5×4×590-5×42=12.310=1.23, a =y -b x =5-1.23×4=0.08.∴回归方程为y ^=1.23x +0.08.1答案:y ^=0.56x +997.4解析:利用公式b =∑i =15x i y i -5x y∑i =15x 2i -5x 2=0.56,a =y -b x =997.4,故回归直线的方程为y ^=0.56x +997.4.2解:x =706=353,y =2306=1153, x 21+x 22+…+x 26=1+16+100+169+324+676=1 286,x 1y 1+x 2y 2+…+x 6y 6=-20+96+340+13×38+18×50+26×64=3 474.b =x 1y 1+x 2y 2+…+x 6y 6-6x y x 21+x 22+…+x 26-6x2=3 474-6×353×11531 286-6×⎝ ⎛⎭⎪⎫3532≈1.68,a =y -b x ≈18.73.即所求得的线性回归方程为y ^=1.68x +18.73. (1)用公式求回归方程的一般步骤是:①列表x i ,y i ,x i y i ;②计算x ,y ,∑i =1nx 2i ,∑i =1nx i y i ;③代入公式计算b ,a 的值; ④写出回归方程.(2)求回归方程时应注意的问题: ①知道x 与y 呈线性相关关系,无需进行相关性检验;否则,应首先进行相关性检验.如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的;②用公式计算a ,b 的值时,要先算出b ,然后才能算出a ;③使用计算器能大大简化手工的计算,迅速得出正确的结果,但输入数据时要细心,不能出任何差错;不同计算器的按键方式可能不同,可参考计算器的使用说明书进行相关计算.三、线性回归方程的应用(1)(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?解:(1)散点图如下:(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大.图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.1.经调查知,某品牌汽车的销售量y (辆)与广告费用x (万元)之间的线性回归方程为y ^=250+4x .当广告费用为30万元时,预测汽车销售量为__________辆.答案:370解析:当x =30时,y ^=250+4×30=370.2根据上表可得回归方程y =bx +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为__________.答案:65.5万元解析:∵a =y -b x =49+26+39+544-9.4×4+2+3+54=9.1,∴回归方程为y ^=9.4x +9.1.令x =6,得y ^=9.4×6+9.1=65.5(万元).3.(2012福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟(1)求回归直线方程y =bx +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(Ⅰ)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)由于x =16(x 1+x 2+x 3+x 4+x 5+x 6)=8.5,y =16(y 1+y 2+y 3+y 4+y 5+y 6)=80,所以a =y -b x =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得 L =x (-20x +250)-4(-20x +250)=-20x 2+330x -1 000=-20⎝⎛⎭⎪⎫x -3342+361.25,当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.(1)回归分析是数理统计中最常见的统计方法之一,它研究的是一个变量与另一个变量的相关关系.应用线性回归方程解实际问题时,一般是先借助于散点图,直观地看出两个变量之间是否具有相关关系,再利用最小平方法思想建立线性回归方程,从而定量地描述两个变量的关系.回归系数a ,b 刻画了两个变量之间的变化趋势.利用回归直线方程,可以对实际问题进行预测.由一个变量的变化推测另一个变量的变化,从而为决策者提供依据.(2)关于回归分析的几个问题:①回归分析是寻找相关关系中非确定性关系的某种确定性; ②对于相关关系细节的分析,我们可以通过作统计图表来使我们对两个变量之间的关系有一个直观的印象和判断.当然还可以通过另一种图——散点图来分析两个变量间的关系.1.给出x ,y则根据数据可以判断x 和有关系”)答案:确定关系解析:由表中数据可以得到x ,y 之间是一种函数关系:y =2x +1.所以x 和y 是一种确定的关系,也即函数关系.2.下列关系中是相关关系的是__________. ①学生的学习态度和学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. 答案:①②解析:根据相关性的定义可知①②为相关关系,③④不具有相关关系. 3.下列分别是3对变量的散点图,则具有相关关系的是__________.答案:①③解析:由散点图知①③中的点大致分布在一条直线附近.4.(2012湖南高考改编)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系.根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的个数是__________.①y 与x 具有正的线性相关关系;②回归直线过样本点的中心(x ,y );③若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ; ④若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg. 答案:①解析:④中,若该大学某女生身高为170 cm ,则可断定其体重约为:0.85×170-85.71=58.79 kg.故④不正确.5.以下是在某地搜集到的不同楼盘新房屋的销售价格y (单位:万元)和房屋面积x (单位:m 2)(1)(2)判断新房屋的销售价格和房屋面积之间是否具有相关关系.如果有相关关系,是正相关还是负相关?解:(1)数据对应的散点图如图所示.(2)通过以上数据对应的散点图可以判断,新房屋的销售价格和房屋的面积之间具有线性相关关系,且是正相关.。
苏教版高中数学必修三第二章-统计2.4ppt课件
1.函数关系:变量之间的关系可以用 函数 表示,是一 种 确定性函数 关系. 2.相关关系:变量之间有 一定的联系 用 函数 来表达. ,但不能完全
散点图与线性回归方程
【问题导思】 在研究两个变量的相关关系时通常采用哪些方法?
【提示】 散点图与线性回归方程.
1.散点图 从一个统计数表中,为了更清楚地看出 x 与 y 是否有相 关关系,常将 x 的取值作为 横坐标 ,将 y 的相应取值作 为 纵坐标 ,在直角坐标系中描点(x ,y )(i=1,2,3,„),这
求线性回归方程
一个车间为了规定工时定额,需要确定加工零 件所花费的时间, 为此进行了 10 次实验, 测得的数据如下表.
零件数x(个) 10 20 30 40 50 60 70 10 加工时间y( 62 68 75 81 89 95 2 分)
80 10 8
90 11 5
10 0 12 2
(1)y 与 x 是否具有线性相关关系? (2)如果 y 与 x 具有线性相关关系,求: ①y 关于 x 的线性回归方程; ②x 关于 y 的线性回归方程.
§2.4 线性回归方程
教师用书独具演示
●三维目标 1.知识与技能 通过收集现实问题中两个有关联变量的数据认识变量间 的相关关系.
2.过程与方法 认识现实生活中变量间除了存在确定的关系外,仍存在 大量的非确定性的相关关系,并利用散点图直观体会这种相 关关系. 3.情感态度与价值观 知道可用线性回归方程近似地表示两个具有相关关系的 改变量之间的关系.
x 10 15 17 20 25 28 32 y 1 1.3 1.8 2 2.6 2.7 3.3
(1)画出散点图; (2)判断 y 与 x 是否具有线性相关关系.
高中数学 第二章 统计 2.4 线性回归方程(2)教案 苏教版必修3(2021年最新整理)
高中数学第二章统计2.4 线性回归方程(2)教案苏教版必修3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第二章统计2.4 线性回归方程(2)教案苏教版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第二章统计2.4 线性回归方程(2)教案苏教版必修3的全部内容。
2.4 线性回归方程(2)教学目标:1.了解非确定性关系中两个变量的统计方法;2.掌握散点图的画法及在统计中的作用;3.掌握回归直线方程的求解方法.教学重点:线性回归方程的求解.教学难点:回归直线方程在现实生活与生产中的应用.教学方法:引导发现、合作探究.教学过程:一、复习练习1.已知回归方程ˆ0.50.81y x=-,则x=25时,y的估计值为2.三点()3,10,(7,20),(11,24)的线性回归方程是( D ) A.ˆ 5.75 1.75=+y x=-B.ˆ 1.75 5.75y xC.ˆ 1.75 5.75=+y x=- D.ˆ 5.75 1.75y x3.我们考虑两个表示变量x与y之间的关系的模型,δ为误差项,模型如下:模型1:64y x e=++.y x=+;模型2:64(1)如果3,1x e==,分别求两个模型中y的值;(2)分别说明以上两个模型是确定性模型还是随机模型.解:(1)模型1:6464318y x =+=+⨯=;模型2:64643119y x e =++=+⨯+=(2)模型1中相同的x 值一定得到相同的y 值,所以是确定性模型;模型2中相同的x 值,因δ的不同,所得y 值不一定相同,且δ为误差项是随机的,所以模型2是随机性模型.二、数学运用1.例题讲解.例1 一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,测得数据如下:请判断y 与x 是否具有线性相关关系,如果y 与x 具有线性相关关系,求线性回归方程.解:在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:1010102211155,91.7,38500,87777,55950i i i i i i i x y x y x y ========∑∑∑ ∴ 1011022211055950105591.70.66838500105510i ii i i x y x y b xx ==--⨯⨯==≈-⨯-∑∑ 91.70.6685554.96a y bx =-=-⨯≈,因此,所求线性回归方程为0.66854.96y bx a x =+=+.例2 已知10只狗的血球体积及红血球数的测量值如下:x (血球体积,ml ),y (红血球数,百万)(1)画出上表的散点图;(2)求出回归直线方程且画出图形.解:(1)x(2)1(45424648423558403950)44.5010x =+++++++++=, 1(6.53 6.309.527.50 6.99 5.909.49 6.20 6.558.72)10y =+++++++++=7.37, 设回归直线方程为y bx a =+,则10110221100.17510i ii i i x y x y b xx ==-==-∑∑,a y bx =-0.418-,所以所求回归直线的方程为0.1750.148y x =-图形:x说明:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数,a b 的计算公式,算出,a b .由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误,求线性回归方程的步骤:计算平均数,x y ;计算i x 与i y 的积,求i i x y ∑;计算2i x ∑;将结果代入公式求b ;用a y bx =-求a ;写出回归直线方程.2.巩固深化,反馈矫正.(1)下面是南京市与哈尔滨2001年12个月的月平均气温(单位:︒C )试分析这两个城市的月平均气温是否具有相关关系,若有,求出线性回归方程;若没有,说明理由.(2)已知关于某设备的使用年限x 与所支出的维修费用y (万元),有如下统计资料:设y 对x 程线性相关关系.试求:①线性回归方程ˆy bx a =+的回归系数,a b ;②估计使用年限为10年时,维修费用多少?三、归纳整理,整体认识求线性回归方程的步骤:1. 计算平均数 x y , ;2. 计算x i 与y i 的积,求i i x y ∑;3. 计算∑x i 2,y i 2;4.将上述有关结果代入公式,求b,a,写出回归直线方程.。
高中数学 第2章 统计 2.4 线性回归方程教材梳理导学案 苏教版必修3
2.4 线性回归方程庖丁巧解牛知识·巧学一、相关关系变量之间的常见关系:一类是确定性函数关系,变量之间的关系可以用函数表示.如正方形的边长l与面积S 之间就是确定性函数关系,可以用函数S=l2表示;一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达.如人的体重y与身高x有关.一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系.在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常重要的作用.变量之间的相关关系带有不确定性,这需要通过收集大量的数据,对数据进行统计分析,发现规律,才能作出科学的判断.辨析比较函数关系与相关关系的区别与联系相同点:两者均是指两个变量间的关系;不同点:①函数关系是一种确定性关系,自变量的任一取值,因变量都有唯一确定的值与之对应;相关关系是非确定性关系,因变量的取值具有一定的随机性;②函数关系是因果关系,而相关关系不一定是因果关系,也可能是伴随关系;③相关关系的分析方向及方法,由于相关关系的不确定性,在寻找变量间相关性的过程中,统计发挥着重要的作用,而函数关系则可以通过函数的性质来进行研究.二、线性回归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析. 通俗地讲,回归分析就是寻找相关关系中非确定性关系的某种确定性.1.散点图我们把表示具有相关关系的两个变量x、y的一组数据(x n,y n)(n=1,2,3,…)对应的一些点(即样本点)画在坐标系内,得到的图形叫做散点图.如:某地农业技术指导站的技术员,经过在7块并排大小相同的试验田上进行施化肥量对水观察表中数据,大体上随着施化肥量的增加,水稻的产量也在增加.只是表中两者之间的关系表现得不是很确切,需要对数据进行分析.为此我们可以作统计图表,以便对两者有一个直观的印象和判断.除上述的统计图表外,我们还可以用另一种统计图——散点图来分析. 以x轴表示施肥量,y轴表示水稻产量,可得散点图如图2-4-1:图2-4-1从散点图可以看出两变量的确存在一定关系,大体上随着施化肥量的增加,水稻的产量也在增加.可见散点图能直观形象地反映各对数据的密切程度. 注意:如果关于两个变量统计数据的散点图呈现如图2-4-2的形状,则这两个变量之间不具有相关关系.如学生的身高与学生的数学成绩就没有相关关系.图2-4-2可见利用散点图可以判断变量之间有无相关关系.所以在研究两个变量之间是否存在某种关系时,必须从散点图入手.学法一得 画出散点图,可以作出如下判断: ①如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即说明变量之间具有函数关系.②如果所有的样本点都落在某一函数曲线附近,则说明变量之间具有相关关系. ③如果所有的样本点都落在某一直线附近,则变量之间具有线性相关关系. 2.最小二乘法设有一直线方程yˆ=bx+a , Q(a,b)是直线yˆ=bx+a 与各散点在垂直方向(纵轴方向)上的距离的平方和,设法取a,b 的值,使Q(a,b)达到最小值.这种方法叫做最小平方法(又称最小二乘法).其中点Q=(y 1-bx 1-a)2+(y 2-bx 2-a)2+…+(y n -bx n -a)2取得最小值时,就称yˆ=bx+a 为这n 对数据的线性回归方程,该方程所表示的直线称为回归直线.上述式子展开后,是一个关于a 或b 的二次函数,应用配方法,可求出使Q 为最小值时的a 、b 的值,即⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑∑∑∑=====.,)())((2112111x b y a x x n y x y x n b ni i n i i ni i n i i n i i i (*) 其中x =∑=n i i x n 11,∑==ni i y n y 11.求线性回归方程的步骤:计算平均数x ,y ;计算x i 与y i 的积,求∑x i y i ;计算∑x i 2;将结果代入公式求a ;用b=y -a x 求b ;写出回归方程.深化升华 求相关变量的回归直线的意义:回归直线方程在现实生活与生产中有广泛的应用.应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序”变为“有序”,并对情况进行估测、补充.因此,学过回归直线方程以后,应能积极应用回归直线方程解决一些相关的实际问题,去进一步体会回归直线的应用价值. 三、相关系数与相关性检验进行回归分析,通常先进行相关性检验.若能确定两个变量具有线性相关性,则再去求其线性回归方程,否则所求方程毫无意义.给定(x i ,y i )(i=1,2,3,…,n ),只要x 1,x 2,x 3,…,x n 不全相等,就能求出一条回归直线,可它有无意义就是一个大问题.由于根据散点图看数据点是否大致在一直线附近主观性太强,为此可以利用样本相关系数量化的检验法. 样本相关系数:r=∑∑∑===----ni ni i ini i iy y x xy y x x11221)()())((叫做变量y 与x 之间的样本相关系数(简称相关系数),用它来衡量它们之间的线性相关程度.|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小.统计学认为,相关变量的相关系数r∈[-1,-0.75]时,两变量负相关很强; r∈[0.75,1]时,两变量正相关很强;r∈(-0.75,-0.3]或[0.3,0.75)时,两变量相关性一般; r∈[-0.25,0.25]时,两变量相关很弱.学法一得 在实际操作中常常利用计算器计算出相关系数和线性回归方程. 典题·热题知识点一 线性相关关系例1 下列两个变量之间的关系哪个不是函数关系( )A.角度和它的余弦值B.正方形边长和面积C.正n 边形的边数和它的内角和D.人的年龄和身高思路分析:函数关系是一种确定的关系,而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系. 答案:D方法归纳 判断相关关系与函数关系要看两个相关变量是否有确定的关系式. 知识点二 求出回归直线例2 一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,请判断y 与x 是否具有线性相关关系,如果y 与x 具有线性相关关系,求线性回归方程. 思路分析:根据求线性回归的方法与步骤.解:在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:x =55,y =91.7,∑=1012i i x =38 500,∑=1012i i y =87 777,∑=101i i i y x =55 950,∴b=2210121015510385007.915510559501010⨯-⨯⨯-=--∑∑==xx yx yx i i i ii≈0.668. a=y -b x =91.7-0.668×55≈54.96,因此,所求线性回归方程为yˆ=bx+a=0.668x+54.96. 巧解提示 先根据散点图判断两个变量是否具有相关关系,然后计算出各项的值代入公式.(1)用统计方法判断尿汞含量x 与消光系数y 是否相关. (2)求出回归直线方程.(3)能预测尿汞含量为5 mg/L 时的消光系数吗?思路分析:据题意需作回归分析,先画出其散点图,看其是否呈直线形.再借助现代技术手段,求出回归直线方程.根据题意,对实际问题进行预测.解:(1)画出其散点图(如图2-4-3),观察散点图,可以发现5个样本点都落在一条直线附近,所以变量x 、y 属于线性相关.图2-4-3(2)由于尿汞含量x 与消光系数y 线性相关,所以可以利用公式求出回归方程的系数.再利用计算器可求得回归方程yˆ=36.95x-11.3. (3)当x=5时,yˆ=36.95×5-11.3≈173.可知尿汞含量为5 mg/L 时的消光系数约为173. 方法归纳 求线性回归方程的步骤: (1)计算平均数x 、y ;(2)计算x i 与y i 的积,求∑x i y i ;(3)计算∑x i 2,∑y i 2;(4)将上述有关结果代入公式,求b 、a ,写出回归直线方程. 问题·探究 思想方法探究问题 用最小二乘法估计得到的直线与用两点式求出的直线方程一致吗?探究过程:事实上设两点(x 1,y 1),(x 2,y 2),设所求回归直线方程是y=bx+a.Q=[y 1-(a+bx 1)]2+[y 2-(a+bx 2)]2,由使Q 取得最小值的a 、b 的求值公式⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====xb y a x n x y x n y x x x y y x x b ni ini i i n i n i i i ,)())((2121121, 得b=22122211212212211211)2()2()2)(2()2)(2(x x x x x x y y y x x x y y y x x x +-++-+-+-++-+-1212212221121221214)(4)(2222x x y y x x x x y y x x y y x x --=-+--∙-+-∙-=a=1221211212212122x x y x x y x x y y x x y y --=--∙+-+ 即回归直线方程为y=1221211212x x y x x y x x y y --+--.而由(x 1,y 1),(x 2,y 2)两点确定的直线方程为121121x x x x y y y y --=--,变形为y=1221211212x x y x x y x x x y y --+--. 探究结论:用最小二乘法估计得到的直线与用两点式求出的直线方程是一致的.。
高中数学第2章统计2.4线性回归方程(2)教案苏教版必修3(new)
2。
4 线性回归方程第2课时导入新课在上一节课中问题1:将汽油以均匀的速度注入桶里,注入的时间t与注入的油量y如下表:从表里数据得出油量y与时间t之间的函数关系式为y=2x(x≥0).并且在直角坐标系里很容易作出它们的图象,我们知道各点在同一条直线上。
再看下面的问题(即上一节课的练习2):某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表:请大家动手作出热茶销售量与气温的坐标图,说说它的特点,能得到什么规律?分析:该图中所有点不像第一个问题中函数关系的图象对应的点在同一条直线上,但是分布也是很有规律,它们散布在从左上角到右下角的区域,因此,可以得到规律是随着气温的增加,热茶卖出的杯数在减少。
但究竟以什么样的方式在减少呢?这就是今天要继续学习的内容——线性回归方程.推进新课新知探究以横坐标x表示气温,纵坐标y表示热茶销量,建立平面直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内标出,得到上图,今后我们称这样的图为散点图。
1。
散点图(scatterplot):表示具有相关关系的两个变量的一组数据的图形叫做散点图。
散点图形象地反映了各对数据的密切程度。
粗略地看,散点分布具有一定的规律。
在本图中这些点散布的位置也是值得注意的,它们散布在从左上角到右下角的区域,对于这种相关关系,我们称它为负相关.如果点散布在从左下角到右上角的区域.对于这种相关关系,我们称它为正相关.请学生举例:两个变量之间是正相关的关系.例如:某小卖部卖的冷饮销售量与气温之间的关系.再看上节课的练习 1.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:如果作出散点图如右图,它是散布在从左下角到右上角的区域,也是正相关的关系.回到解热茶销售量与气温之间的关系的散点图来,从图中可以得到规律是随着气温的增加,热饮的销售量在减少,究竟以什么样的方式减少呢?分析:分布情况是在从左上角到右下角的区域的某条直线附近摆动。
高中数学第2章统计2-4线性回归方程教学案苏教版必修3
高中数学第2章统计2-4线性回归方程教学案苏教版必修3(1)函数关系:变量之间的关系可以用函数表示,是一种确定性关系.(2)相关关系:变量之间有一定的联系,但不能完全用函数来表达.[点睛]函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系,如试验田的施肥量x与水稻的产量y.当自变量x每取一确定值时,因变量y的取值带有一定的随机性,即还受其他环境因素的影响.2.散点图(1)概念:将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,用来表示两个变量的一组数据的图形叫做散点图.(2)作法:建立平面直角坐标系,用横坐标表示一个变量,用纵坐标表示另一个变量,将给出的数据所表示的点在坐标系内描出,即可得到散点图.[点睛]对于散点图要注意以下几点.①若所有的样本点都落在某一函数曲线上,则变量间具有函数关系.②若所有的样本点都落在某一函数曲线附近,则变量间就具有相关关系.③若散点图中的点的分布没有什么规律,则这两变量之间不具有相关关系,它们之间是相互独立的.3.线性相关关系能用直线=bx+a近似表示的相关关系叫线性相关关系.4.线性回归方程(1)概念:设有n对观察数据如下:当a,b使Q=a)2+…+(yn-bxn -a)2取得最小值时,就称方程=bx+a为拟合这n对数据的线性回归方程,该方程所表示的直线称为回归直线.(2)用回归直线进行数据拟合的一般步骤①作出散点图,判断散点是否在一条直线附近.②如果散点在一条直线附近,用公式求出a,b,并写出线性回归方程.1.下列各组变量是相关关系的是________.(1)电压U与电流I;(2)圆面积S与半径R;(3)粮食产量与施肥量;。
2017-2018学年高中数学苏教版3教学案:第2章2.4线性回归方程含解析
错误!预习课本P74~75,思考并完成以下问题1.变量间有哪些常见关系?2.什么叫散点图?怎样作出散点图?3.什么叫线性回归方程?错误!1.变量间的常见关系(1)函数关系:变量之间的关系可以用函数表示,是一种确定性关系.(2)相关关系:变量之间有一定的联系,但不能完全用函数来表达.[点睛]函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系,如试验田的施肥量x与水稻的产量y.当自变量x每取一确定值时,因变量y的取值带有一定的随机性,即还受其他环境因素的影响.2。
散点图(1)概念:将样本中n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中,用来表示两个变量的一组数据的图形叫做散点图.(2)作法:建立平面直角坐标系,用横坐标表示一个变量,用纵坐标表示另一个变量,将给出的数据所表示的点在坐标系内描出,即可得到散点图.[点睛]对于散点图要注意以下几点.①若所有的样本点都落在某一函数曲线上,则变量间具有函数关系.②若所有的样本点都落在某一函数曲线附近,则变量间就具有相关关系.③若散点图中的点的分布没有什么规律,则这两变量之间不具有相关关系,它们之间是相互独立的.3.线性相关关系能用直线错误!=bx+a近似表示的相关关系叫线性相关关系.4.线性回归方程(1)概念:设有n对观察数据如下:当a,b使Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(y n-bx n-a)2取得最小值时,就称方程错误!=bx+a为拟合这n对数据的线性回归方程,该方程所表示的直线称为回归直线.(2)用回归直线进行数据拟合的一般步骤①作出散点图,判断散点是否在一条直线附近.②如果散点在一条直线附近,用公式错误!求出a,b,并写出线性回归方程.错误!1.下列各组变量是相关关系的是________.(1)电压U与电流I;(2)圆面积S与半径R;(3)粮食产量与施肥量;(4)广告费支出与商品销售额.解析:(1)(2)中两个变量间是函数关系,(3)(5)中两个变量之间有关系,但不能用函数表达,是相关关系.答案:(3)(4)2.5名学生的化学和生物成绩如下表所示:学生A 学生B学生C学生D学生E化学成绩(分)8075706560生物成绩(分)7065686462判断化学和生物成绩之间是否具有相关关系________(填“具有”“不具有").答案:具有[典例]在下列各个量与量的关系中:①正方体的表面积与棱长之间的关系;②某同学的数学成绩和物理成绩之间的关系;③家庭的收入与支出之间的关系;④某户家庭用电量与水费之间的关系.其中是相关关系的为________________.相关关系的概念[解析]①正方体的表面积与棱长之间的关系是确定的函数关系;④某户家庭用电量与水费之间无任何关系.②③中,都是非确定的关系,但自变量取值一定时,因变量的取值带有一定的随机性.[答案] ②③判断两个变量是否具有相关关系,主要有两种方法:一是根据相关关系的定义进行判断,看这两个变量是否具有不确定性.二是利用散点图,看散点图中的点是否都落在某一函数曲线附近.[活学活用]关于人体的脂肪含量(百分比)与年龄关系的研究中,得到如下一组数据:年龄2327394145495053脂肪9。
江苏省常州市西夏墅中学高中数学 2.4 线性回归方程(2)教案 苏教版必修3
江苏省常州市西夏墅中学高中数学 2.4 线性回归方程(2)教案 苏教版必修3教学目标:1.了解非确定性关系中两个变量的统计方法; 2.掌握散点图的画法及在统计中的作用; 3.掌握回归直线方程的求解方法.教学方法:引导发现、合作探究.教学过程: 一、复习练习1.已知回归方程ˆ0.50.81yx =-,则x =25时,y 的估计值为 2.三点()3,10,(7,20),(11,24)的线性回归方程是 ( D )A . ˆ 5.75 1.75yx =- B . ˆ 1.75 5.75y x =+ C . ˆ 1.75 5.75yx =- D . ˆ 5.75 1.75y x =+ 3.我们考虑两个表示变量x 与y 之间的关系的模型,δ为误差项,模型如下: 模型1:64y x =+;模型2:64y x e =++.(1)如果3,1x e ==,分别求两个模型中y 的值; (2)分别说明以上两个模型是确定性模型还是随机模型. 解:(1)模型1:6464318y x =+=+⨯=;模型2:64643119y x e =++=+⨯+=(2)模型1中相同的x 值一定得到相同的y 值,所以是确定性模型;模型2中相同的x 值,因δ的不同,所得y 值不一定相同,且δ为误差项是随机的,所以模型2是随机性模型.二、数学运用 1.例题讲解.例1 一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,测得数据如下:请判断y 与x 是否具有线性相关关系,如果y 与x 具有线性相关关系,求线性 回归方程.解:在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有 线性相关关系.由测得的数据表可知:1010102211155,91.7,38500,87777,55950i i i i i i i x y x y x y ========∑∑∑∴ 1011022211055950105591.70.66838500105510i ii ii x y x yb xx==--⨯⨯==≈-⨯-∑∑91.70.6685554.96a y bx =-=-⨯≈,因此,所求线性回归方程为0.66854.96y bx a x =+=+.例2 已知10只狗的血球体积及红血球数的测量值如下:x (血球体积,ml ),y (红血球数,百万)(1)画出上表的散点图;(2)求出回归直线方程且画出图形. 解:(1)(2)1(45424648423558403950)44.5010x =+++++++++=, 1(6.53 6.309.527.50 6.99 5.909.49 6.20 6.558.72)10y =+++++++++=7.37, 设回归直线方程为y bx a =+,则10110221100.17510i ii ii x y x yb xx==-==-∑∑,a y bx =-0.418-,所以所求回归直线的方程为0.1750.148y x =-图形:说明:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数,a b 的计算公式,算出,a b .由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误,求线性回归方程的步骤:计算平均数,x y ;计算i x 与i y 的积,求i i x y ∑;计算2i x ∑;将结果代入公式求b ;用a y bx =-求a ;写出回归直线方程.2.巩固深化,反馈矫正.(1)下面是南京市与哈尔滨2001年12个月的月平均气温(单位:︒C )试分析这两个城市的月平均气温是否具有相关关系,若有,求出线性回归方程;若没有,说明理由.(2)已知关于某设备的使用年限x 与所支出的维修费用y (万元),有如下统计资料:设y 对x 程线性相关关系.试求:①线性回归方程ˆybx a =+的回归系数,a b ; ②估计使用年限为10年时,维修费用多少?三、归纳整理,整体认识 求线性回归方程的步骤: 1. 计算平均数 x y , ; 2. 计算x i 与y i 的积,求i i x y ∑; 3. 计算∑x i 2,y i 2;4. 将上述有关结果代入公式,求b ,a ,写出回归直线方程.。
2.4《线性回归方程》教案(苏教版必修3)
2.4线性回归方程(1)教学目标(1)通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;(2)在两个变量具有线性相关关系时,会在散点较长中作出线性直线,会用线性回归方程进行预测;(3)知道最小二乘法的含义,知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程,了解(线性)相关系数的定义.教学重点散点图的画法,回归直线方程的求解方法.教学难点回归直线方程的求解方法.教学过程一、问题情境1.情境:客观事物是相互联系的过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系学是“因”,物理是“果”,或者反过来说事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度所以说,函数关系存在着一种确定性关系但还存在着另一种非确定性关系——相关关系2.问题:某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的气温/0C 26 18 13 10 4 1-杯数20 24 34 38 50 64-C,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?如果某天的气温是5二、学生活动为了了解热茶销量与气温的大致关系,我们以横坐标x表示气温,纵坐标y表示热茶销量,建立直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内标出,得到下图,今后我们称这样的图为散点图(scatterplot).从右图可以看出.这些点散布在一条直线的附近,故可用一个线性函数近似地表示热茶销量与气温之间的关系.选择怎样的直线近似地表示热茶销量与气温之间的关系?我们有多种思考方案:(1)选择能反映直线变化的两个点,例如取(4,50),(18,24)这两点的直线;(2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同;(3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距;………………怎样的直线最好呢?三、建构数学1.最小平方法:=+的直线拟合散点图中的点,应使得该直线与散点图中的点最接近。
2021_2022学年高中数学第2章统计2.4线性回归方程讲义苏教版必修3
2.4 线性回归方程学 习 目 标核 心 素 养1.了解两个变量之间的相关关系并与函数关系比拟. 2.会作散点图,并利用散点图判断两个变量之间是否具有线性相关关系.3.能根据给出的线性回归方程系数公式建立线性回归方程,并能由回归方程对总体进展预测、估计.(重点、难点)通过对已有数量的分析、运算培养学生数据分析、数学运算的核心素养.1.变量之间的两类常见关系在实际问题中,变量之间的常见关系有如下两类:一类是确定性函数关系,变量之间的关系可以用函数表示.另一类是相关关系,变量之间有一定的联系,但不能完全用函数表示.2.相关关系的分类相关关系分线性相关和非线性相关两种. 3.线性回归方程系数公式能用直线方程y ^=bx +a 近似表示的相关关系叫做线性相关关系,该方程叫线性回归方程.给出一组数据(x 1,y 1),(x 2,y 2),…, (x n ,y n ),线性回归方程中的系数a ,b 满足⎩⎪⎨⎪⎧b =n ∑i =1n x i y i -⎝ ⎛⎭⎪⎪⎫∑i =1n x i ⎝ ⎛⎭⎪⎪⎫∑i =1n y i n ∑i =1nx 2i -⎝ ⎛⎭⎪⎪⎫∑i =1n x i2,a =y -b x .上式还可以表示为⎩⎪⎨⎪⎧b =∑i =1nx i y i-n x -y -∑i =1n x 2i -n x 2=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2,a =y -b x .1.有以下关系:①人的年龄与其拥有的财富之间的关系; ②曲线上点与该点的坐标之间的关系; ③苹果的产量与气候之间的关系;④森林中的同一树木,其横截面直径与高度之间的关系; ⑤学生与其学号之间的关系. 其中具有相关关系的是________. ①③④ [②⑤为确定关系不是相关关系.]2.下面四个散点图中点的分布状态,直观上判断两个变量之间具有线性相关关系的是________.③ [散点图①中的点无规律的分布,范围很广,说明两个变量之间的相关程度很小;②中所有的点都在同一条直线上,是函数关系;③中点的分布在一条带状区域上,即点分布在一条直线的附近,是线性相关关系;④中的点也分布在一条带状区域内,但不是线性的,而是一条曲线附近,所以不是线性相关关系,故填③.]3.工人工资y (元)依劳动生产率x (千元)变化的线性回归方程为y ^=50+80x ,以下判断正确的选项是________.①劳动生产率为1 000元时,工资为130元; ②劳动生产率提高1 000元时,工资提高80元; ③劳动生产率提高1 000元时,工资提高130元; ④当月工资为250元时,劳动生产率为2 000元.② [回归直线斜率为80,所以x 每增加1,y ^增加80,即劳动生产率提高1 000元时,工资提高80元.]4.下表是广告费用与销售额之间的一组数据:广告费用(千元) 1 4 6 10 14 销售额(千元)1944405253销售额y (千元)与广告费用x (千元)之间有线性相关关系,回归方程为y x +a (a 为常数),现要使销售额到达6万元,估计广告费用约为________千元.15 [x =7,y =41.6,那么a=y x=41.6-2.3×7=25.5.当y=6万元=60千元时,x+25.5,解得x=15(千元).]变量间相关关系的判断【例1】在以下两个变量的关系中,具有相关关系的是________.①正方形边长与面积之间的关系;②作文水平与课外阅读量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故发生率之间的关系.②④[两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄到达一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系.]1.函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.准确理解变量间的相关关系是解答此题的关键.要准确区分两个变量间的相关关系和函数关系,事实上,现实生活中相关关系是处处存在的,从某种意义上讲,函数关系可以看作一种理想的关系模型,而相关关系是一种普遍的关系.两者区别的关键点是“确定性〞还是“不确定性〞.1.以下两个变量中具有相关关系的是________(填写相应的序号).①正方体的棱长和体积;②单产为常数时,土地面积和总产量;③日照时间与水稻的亩产量.③[正方体的棱长x和体积V存在着函数关系V=x3;单产为常数a公斤/亩,土地面积x(亩)和总产量y(公斤)之间也存在着函数关系y=ax.日照时间长,那么水稻的亩产量高,这只是相关关系,应选③.]2.以下命题:①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进展研究.其中正确的命题为________.③④⑤[两个变量不一定是相关关系,也可能是确定性关系,故①错误;圆的周长与该圆的半径具有函数关系,故②错误;③④⑤都正确.]散点图的画法及应用【例2】现有5个同学的数学和物理成绩如下表:学生A B C D E学科数学8075706560物理7066686462 利用散点图判断它们是否具有线性相关关系?如果有线性相关关系,是正相关还是负相关?思路点拨:此题涉及两个变量(数学成绩与物理成绩),以x轴表示数学成绩、y轴表示物理成绩,可得相应的散点图,再观察散点图得出结论.[解] 把数学成绩作为横坐标,把相应的物理成绩作为纵坐标,在平面直角坐标系中描点(x i,y i)(i=1,2,…,5).从图中可以直观地看出数学成绩和物理成绩具有线性相关关系,且当数学成绩减小时,物理成绩也由大变小,即它们正相关.1.判断两个变量x和y之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果图上发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.如果变量的对应点分布没有规律,我们就可以认为这两个变量不具有相关关系.2.正相关、负相关线性相关关系又分为正相关和负相关.正相关是指两个变量具有一样的变化趋势,即从整体上来看,一个变量会随另一个变量变大而变大.从散点图上看,因变量随自变量的增大而增大,图中的点分布在左下角到右上角的区域.负相关是指两个变量具有相反的变化趋势,即从整体上来看,一个变量会随另一个变量变大而变小.从散点图上看,因变量随自变量的增大而减小,图中的点分布在左上角到右下角的区域.提醒:画散点图时应注意合理选择单位长度,防止图形过大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.3.如图是两个变量统计数据的散点图,判断两个变量之间是否具有相关关系?思路点拨:观察图中点的分布情况作出判断.从散点图上看,点的分布散乱无规律,故不具有相关关系.[解] 不具有相关关系,因为散点散乱地分布在坐标平面内,不呈线形.4.有个男孩的年龄与身高的统计数据如下:年龄(岁)12345 6身高(cm)788798108115120 思路点拨:描点(1,78),(2,87),(3,98),(4,108),(5,115),(6,120).观察点的分布,作出判断.[解] 作出散点图如图:由图可见,具有线性相关关系,且是正相关.线性回归方程的求法及应用【例3】 某产品的广告支出x (单位:万元)与销售收入y (单位:万元)之间有下表所对应的数据.广告支出x /万元 1 2 3 4 销售收入y /万元12284256(1)画出表中数据的散点图;(2)求出y 对x 的回归直线方程y ^=bx +a ,并解释b 的意义; (3)假设广告费为9万元,那么销售收入约为多少万元? 思路点拨:画散点图→列表处理数据→计算x ,y ,n ∑i =14x 2i ,∑i =14x i y i →计算b →计算a →线性回归方程→销售收入[解] (1)散点图如图.(2)观察散点图可知各点大致分布在一条直线附近,列出以下表格,以便计算回归系数a ,B .序号 xyx 2y 2xy1 1 12 1 144 12 2 2 28 4 784 56 334291 7641264 4 56 16 3 136 224 ∑10138305 828418于是x =52,y =692,∑i =14x 2i =30,∑i =14y 2i =5 828,∑i =14x i y i =418,代入公式得,b =∑i =14x i y i -4xy∑i =14x 2i -4x 2=418-4×52×69230-4×⎝ ⎛⎭⎪⎫522=735,a =y -b x =692-735×52=-2.故y 对x 的回归直线方程为y ^=735x -2,其中回归系数b =735,它的意义是:广告支出每增加1万元,销售收入y 平均增加735万元.(3)当x =9万元时,y ^=735×9-2=129.4(万元),即假设广告费为9万元,那么销售收入约为129.4万元.1.求样本数据的线性回归方程,可按以下步骤进展: 第一步,计算平均数x ,y ;第二步,求和∑i =1nx i y i ,∑i =1nx 2i ;第三步,计算b =∑i =1n (x i -x )(y i -y)∑i =1n(x i -x)2=∑i =1nx i y i -n xy∑i =1nx 2i -n x 2,a =y -b x ;第四步,写出线性回归方程y ^=bx +A .2.对于任意一组样本数据,利用上述公式都可以求得“回归方程〞,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程〞是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程.提醒:(1)对一组数据进展线性回归分析时,应先画出其散点图,判断变量之间是否线性相关,再由系数a ,b 的计算公式,计算出a ,b ,由于计算量较大,在计算时应借助计算器,仔细计算,以防出现错误.(2)为了方便,常制表对应算出x i y i ,x 2i ,以便于求和.(3)研究变量间的相关关系,求得回归直线方程能帮助我们发现事物开展的一些规律,估计、预测某些数据,为我们的判断和决策提供依据.5.如图是我国2021年至2021年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1-7分别对应年份2021-2021.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数准确到0.01),预测2021年我国生活垃圾无害化处理量.参考数据:∑ 7i =1y i =9.32,∑7i =1t i y i =40.17,∑ 7i =1(y i -y )2=0.55,7≈2.646.参考公式:相关系数r =∑ni =1 (t i -t )(y i -y )∑ ni =1 (t i -t )2∑ ni =1(y i -y )2,回归方程y ^=a +bt 中斜率和截距的最小二乘估计公式分别为b =∑ ni =1 (t i -t )(y i -y )∑ ni =1(t i -t )2,a =y --b t . 思路点拨:(1)利用相关系数的大小――→确定y 与t 的线性相关程度 (2)求出回归方程→利用方程进展估计[解] (1)由折线图中的数据和附注中的参考数据得 t =4,∑ 7i =1 (t i -t )2=28,∑ 7i =1(y i -y )2=0.55,∑ 7i =1(t i -t )(y i -y )=∑ 7i =1t i y i -t ∑ 7i =1y i =40.17-4×9.32=2.89,∴r ≈,0.55×2×2.646)≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当大,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =,7)≈1.331及(1)得b =∑ 7i =1(t i -t )(y i -y )∑ 7i =1 (t i -t )2=,28)≈0.103. a =y -b t ≈1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^t .将2021年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82. 所以预测2021年我国生活垃圾无害化处理量约为1.82亿吨.1.本节课的重点是会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系,能根据给出的线性回归方程系数公式建立线性回归方程.难点是了解相关关系、线性相关、回归直线的概念.2.本节课要掌握以下几类问题 (1)准确区分相关关系与函数关系.(2)会利用散点图判断两个变量间的相关关系. (3)掌握用线性回归方程估计总体的一般步骤.1.在如下图的四个散点图中,两个变量具有相关性的是( )A .①②B .①④C .②③D .②④D [由图可知①中变量间是一次函数关系,不是相关关系;②中的所有点在一条直线附近波动,是线性相关的;③中的点杂乱无章,没有什么关系;④中的所有点在某条曲线附近波动,是非线性相关的.故两个变量具有相关性的是②④.]2.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得线性回归方程,分别得到以下四个结论:①y 与x 负相关且y ^x -6.423; ②y 与x 负相关且y ^x +5.648; ③y 与x 正相关且y ^x +8.493; ④y 与x 正相关且y ^x -4.578.其中一定不正确的结论的序号有( ) A .①③ B .①④ C .②③D .②④B [由正、负相关性的定义知①④一定不正确.]3.某工厂生产某种产品的产量x (吨)与相应的生产能耗y (吨标准煤)有如下几组样本数据:的斜率为0.7,那么这组样本数据的线性回归方程是________.y ^x +0.35 [∵x =3+4+5+64=4.5,y =,4)=3.5, ∴a =y -b x =3.5-0.7×4.5=0.35. ∴线性回归方程为y ^x +0.35.]4.2021年元旦前夕,某市统计局统计了该市2021年10户家庭的年收入和年饮食支出的统计资料如下表:(2)假设某家庭年收入为9万元,预测其年饮食支出.(参考数据:∑i =110x i y i =117.7,∑i =110x 2i =406)思路点拨:按照求线性回归方程的一般步骤,求出线性回归方程,再根据回归方程作出预测.[解] (1)依题意可计算得:x =6,y =1.83,x 2=36,.下载后可自行编辑修改,页脚下载后可删除。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.4 线性回归方程第2课时导入新课在上一节课中问题1:将汽油以均匀的速度注入桶里,注入的时间t与注入的油量y如下表:从表里数据得出油量y与时间t之间的函数关系式为y=2x(x≥0).并且在直角坐标系里很容易作出它们的图象,我们知道各点在同一条直线上.再看下面的问题(即上一节课的练习2):某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表:请大家动手作出热茶销售量与气温的坐标图,说说它的特点,能得到什么规律?分析:该图中所有点不像第一个问题中函数关系的图象对应的点在同一条直线上,但是分布也是很有规律,它们散布在从左上角到右下角的区域,因此,可以得到规律是随着气温的增加,热茶卖出的杯数在减少.但究竟以什么样的方式在减少呢?这就是今天要继续学习的内容——线性回归方程.推进新课新知探究以横坐标x表示气温,纵坐标y表示热茶销量,建立平面直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内标出,得到上图,今后我们称这样的图为散点图.1.散点图(scatterplot):表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度.粗略地看,散点分布具有一定的规律.在本图中这些点散布的位置也是值得注意的,它们散布在从左上角到右下角的区域,对于这种相关关系,我们称它为负相关.如果点散布在从左下角到右上角的区域.对于这种相关关系,我们称它为正相关.请学生举例:两个变量之间是正相关的关系.例如:某小卖部卖的冷饮销售量与气温之间的关系.再看上节课的练习 1.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:如果作出散点图如右图,它是散布在从左下角到右上角的区域,也是正相关的关系.回到解热茶销售量与气温之间的关系的散点图来,从图中可以得到规律是随着气温的增加,热饮的销售量在减少,究竟以什么样的方式减少呢?分析:分布情况是在从左上角到右下角的区域的某条直线附近摆动.能画出这条直线吗?请大家一起想一想,该怎么办,才能作出这条直线呢?请大家设计方案,可以互相讨论.方案1:采用测量的方法:先画一条直线,测量出各点到它的距离,然后移动直线,达到一个使距离之和最小的位置,测量出此时直线的斜率和截距,就得到回归方程.分析:这个想法很好,但是操作起来有一定难度,因为我们画符合条件的直线不能直接画出.还有什么新的办法能解决这个问题?方案2:在图中选取两点画直线,使得直线两侧的点的个数基本相同.分析:画直线时使得直线两侧的点的个数基本相同的直线能画无数多条,这样符合条件的直线就不唯一了,再仔细考虑一下,我们究竟应当怎样作出.方案 3:在散点图中多取几组点,确定几条直线的方程,分别求出各条直线的斜率和截距,将这两个平均数作为回归直线方程的斜率和截距.分析:如果有6个散点,按照方案3的办法,将要作15条直线,这样计算15条直线的斜率和截距分别求出的计算量是一个很大的工程,由此可见,该方案不具有可行性,那么怎样才能作出 “从整体上看各点与此直线距离最小”的直线呢?用方程y ˆ=bx+a 的直线拟合散点图中的点,应使得该直线与散点图中的点最接近,那么,怎样衡量yˆ=bx+a 与图中的点最接近程度呢? 我们将表中给出的自变量x 的六个值代入直线方程,得到相应的六个yˆ的值: 26b+a,18b+a,13b+a,10b+a,4b+a,-b+a.这六个数值与表中相应的六个yˆ的实际值应该越接近越好.所以,我们用类似于估计总体平均数时的思想,考虑离差平方和Q(a,b)=(26b+a-20)2+(18b+a-24)2+(13b+a-34)2+(10b+a-38)2+(4b+a-50)2+(-b+a-64)2=1 286b 2+6a 2+140ab-3 280b-460a+10 172.Q(a,b)是直线yˆ=bx+a 与各个散点在垂直方向(纵轴方向)上的距离的平方和,可以用来衡量直线yˆ=bx+a 与图中6个点的接近程度,所以,设法取a ,b 的值,使Q(a,b)达到最小值.先把a 看作是常数,那么Q 是关于b 的二次函数.用配方法可得,当b=-128623820140⨯-a 时,Q 取得最小值.同理,把b 看作是常数,那么Q 是关于a 的二次函数.用配方法可得,当a=-12460140-b 时,Q 取得最小值. 因此,当b=-128623820140⨯-a ,a=-12460140-b 时, Q 取得最小值,由此解得b≈-1.647 7,a≈57.556 8.所以所求的直线方程为yˆ=-1.647 7x+57.556 8.像这样能用直线方程yˆ=bx+a 近似表示的相关关系叫做线性相关关系. 人们经过长期的实践与研究,已经得出了从数量关系的角度来计算回归直线方程的斜率与截距的一般公式为: ⎪⎪⎪⎩⎪⎪⎪⎨⎧-=---=∑∑==xb y a x x y y x x b n i i n i i i 11)())((, 从而得到回归直线方程为y ˆ=bx+a. 下面我们一起来探究一下这个公式. 设已经得到具有线性相关关系的变量的一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),设所求的回归直线方程为yˆ=bx+a ,其中a ,b 是待定的系数,当变量x 取x 1,x 2,…,x n 时,可以得到i yˆ=bx i +a(i=1,2,…,n).它与实际收集到的y i 之间的偏差是y i -i yˆ=y i -(bx i +a)(i=1,2,3,4,…,n).这样用这n 个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的.但是,由于y i -i yˆ=y i -(bx i +a)(i=1,2,3,4,…,n)的值可正可负,可以相互抵消,而且若取其绝对值,考虑用∑=n i 1=|y i -Y i |来代替,但是,由于它含有绝对值运算不太方便,因此我们可以模仿方差的计算方法取其偏差的平方最小值. 表示n 个点与相应直线在整体上的接近程度.即Q=(y 1-bx 1-a)2+(y 2-bx 2-a)2+…+(y n -bx n -a)2来刻画n 个点与回归直线在整体上的偏差.这样,问题,就归结为:当a ,b 取什么值时,Q 的取值最小,即总体偏差最小?上述式子展开后,是一个关于a 、b 的二次三项式,应用配方法,可求出使Q 为最小值时的a 、b 的值.即Q=na 2+∑=n i 1=1x i 2b 2+∑=n i 1=1y i 2-2∑=n i 1=1bx i y i +2∑=n i 1=1abx i -2∑=n i 1=1ay i . (*)上述式子展开后,是一个关于a 、b 的二次三项式,我们可以把(*)式看成以a 为变量的二次三项式,应用配方法可得,当 (1)时,Q 取得最大值;因为(1)式中还含有变量a ,我们无法求出b 的数值,那么我们如何求出斜率b 与截距a 的一般公式为: 从而得到回归直线方程为yˆ=bx+a 呢? 我们还可以把(*)式看成以b 为变量的二次三项式,应用配方法可得,当a= (2) 时,Q 取得最大值.观察(1)、(2)两个式子,因为(1)、(2)两个式子中都是含有a 、b 的二元一次方程,我们可以由(1)(2)解得:从而得到相应的直线叫做回归直线yˆ=bx+a,对两个变量所进行的上述统计分析叫做回归分析.这种求出斜率b与截距a的方法叫做最小平方法(method of least square)(又称最小二乘法).说明:一元线性回归分析也是研究两个变量的线性相关性,但比相关分析的应用更为广泛,它不仅可以说明两个变量是否一起变化,还可以计算出预测方程以预计这两个变量是如何一起变化的.预测方程的形式为:yˆ=bx+a ,通常叫作回归方程.y 叫做因变量,x 叫做自变量,其中a 是常数项,b 叫一元回归系数.1.对回归直线方程只要求会运用它进行具体计算a、b,求出回归直线方程即可.不要求掌握回归直线方程的推导过程.2.求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.因此,对一组数据作线性回归分析时,应先看其散点图是否成线性.3.求回归直线方程,关键在于正确地求出系数a、b,由于求a、b的计算量较大,计算时仔细谨慎、分层进行,避免因计算产生失误.4.回归直线方程在现实生活与生产中有广泛的应用.应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序”变为“有序”,并对情况进行估测、补充.因此,学过回归直线方程以后,应增强学生应用回归直线方程解决相关实际问题的意识.应用示例例1 在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:根据上述数据,人体脂肪含量和年龄之间有怎样的关系?分析:上节课已给出此问题,并作了回答但没有说明理由,这次补充完整.解:观察表中的数据,大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加.为了确定这一关系的细节,我们需要进行数据分析.我们假设人的年龄影响体内脂肪含量,于是,按照习惯,以x轴表示年龄,以y轴表示脂肪含量,得到相应的散点图.从散点图我们可以看出,年龄越大,体内脂肪含量越高,图中点的趋势表明两个变量之间确实存在一定的关系,这个图支持了我们从数据表中得出的结论.经计算可得到回归直线的回归方程为yˆ=0.577x-0.448. 点评:使前后产生较强的联系性,使学生意识到学数学等于师生在共同编导连续剧,每节课都应参与,不然会掉队.例 2 下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否具有线性相关关系,如果具有线性相关关系,求出线性回归方程;如果不具有线性相关关系,请说明理由.分析:一般地,用回归直线进行拟合的一般步骤为:(1)作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,用公式求出a,b.解:在直角坐标系中作出所给数据的散点图,并写出线性回归方程.从散点图我们可以直观判断散点在某条直线附近,这说明两个变量是相关关系.计算相应的数据之和为:∑=n i i x1=95+110+112+120+129+135+150+180=1 031, ∑=n i i x1=6.2+7.5+7.7+8.5+8.7+9.8+10.2+13=71.6, ∑=n i i x12=137 835, ∑=n i i x1x i y i =9 611.7,代入公式(*)计算得b≈0.077 4,a=-1.024 1,所以,所求的线性回归方程为yˆ=0.774x-1.024 1.点评:要知道:在并不具有相关关系的情况下,对应的线性回归方程虽然也可以求出,但它并无实际意义,同时也要注意,在散点图中显示线性相关的一组数据不一定具有相关关系.这部分内容会在选修1-2中再次有所体现.例3 一般地,(x,y)的n组观察数据:若它的回归直线方程为yˆ=a+bx,则直线yˆ=a+bx恒过的定点是什么?分析:如果没有前面的推导背景,此题有点困难,但由于黑板上的板书还在,所以有学生能发现结论.解:由线性回归方程的推导,可知方程的系数a,b满足条件:,a=y-b x.由此不难发现,点(x,y)的坐标满足直线yˆ=a+bx的方程.所以,由点与直线的位置关系可得点(x,y)在直线yˆ=a+bx上,即直线yˆ=a+bx恒过点(x,y).这里x=, y=.点评:刚推导过线性回归方程,所以此题比较适合趁热打铁,可提前做例1;此结论在以后的解题中经常出现,因此可以让学生记忆.例4 工人工资(元)以劳动生产率(千元)变化的回归方程yˆ=50+80x,下列判断正确的是()A.劳动生产率为1 000元时,工资为130元B.劳动生产率提高1 000元时,工资大约提高80元C.劳动生产率提高1 000元时,工资提高大约130元D.当月工资250元时,劳动生产率为2 000元分析:满足回归方程是指:工人工资(元)以劳动生产率(千元)之间具有相关关系,但不是确定的函数关系,所以选项A用的肯定语气是错的,其他的选项通过函数关系式的代入发现,只有选项B是正确的.答案:B点评:体会回归方程的应用.知能训练1.线性回归方程yˆ=kx+a所表示的直线使得()A.散点图中的点到直线的距离之和最小B.散点图中的点到直线的距离的平方和最小C.散点图中的点与直线相同横坐标处对应的纵坐标的距离之和最小D.散点图中的点与直线相同横坐标处对应的纵坐标的距离的平方和最小2.如果有一组成对数据,求出回归直线的方程是y=2.0x+10,那么()A.这条回归直线总是有意义的B.这条回归直线总是可以用来预测y值C.在散点图中的点都在这条直线附近时,这条回归直线才有意义D.x=10时,y的预测值为20,说明在x=10时,y的值一定等于20解答:1.D 2.C课堂小结(让学生进行小结,谈谈体会,帮助他们回顾反思、归纳概括.)1. 变量间相关关系的散点图以及正相关和负相关;2. 如何利用“最小二乘法”思想求直线的回归方程;3. 学会用回归思想考察现实生活中变量之间的相关关系.作业课本习题2.4 1、2、3.设计感想通过对气温和热饮销量的关系散点图的分析,引入描述两个变量之间关系的线性回归方程(模型),使学生通过探索用多种方法确定线性回归直线,学会类比寻求新的突破方法,体会最小二乘法的思想,掌握计算回归方程的斜率与截距的方法,求出回归直线方程.通过典型的求解,强化回归思想的建立,理解回归直线与观测数据的关系. 通过引导学生感受生活中实际问题转化为数学问题,学会类比寻求新的突破方法,体会最小二乘法的思想,培养学生的创新精神,不断收取信息,学会用统计知识对实际问题进行数学分析.本节课在理解最小二乘法的时候所用时间较多,在推导线性回归方程时,计算量特别大,所以费时也较多,建议分一点内容到上一节课协调一下.习题详解习题2.41.(1)散点图如下:(2)线性回归方程为yˆ=5.2x+24.2.(1)散点图如下:(2)根据散点图,这些点在一条直线的附近,x与y具有线性相关关系,线性回归方程为yˆ=0.305 21x+9.990 32.3.(1)散点图如下:(2)x与y之间的线性回归方程为yˆ=14.090 91x-13.227 27.4.略.。