人教A版 选修1-2 1.1 回归分析的基本思想及其初步应用 教案
人教A版 选修1-2 1.1 回归分析的基本思想及其初步应用(一) 教案
[核心必知]1.预习教材,问题导入根据以下提纲,预习教材P2~P8的内容,回答下列问题.(1)在数学《必修3》中,我们利用回归分析的方法对两个具有线性相关关系的变量进行了研究,其步骤是什么?所求出的线性回归方程是什么?提示:步骤为:画出两个变量的散点图,求回归直线方程,并用回归直线方程进行预报.线性回归方程为^y=^b x+^a.(2)所有的两个相关变量都可以求回归方程吗?提示:不一定.2.归纳总结,核心必记(1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(2)回归直线方程方程^y=^b x+^a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(x n,y n)的回归方程,其中^a,^b是待定参数,其最小二乘估计分别为:,x其中-x=n1x n i,-y=n1y n i,(-x,-y)称为样本点的中心.(3)线性回归模型线性回归模型用y=bx+a+e来表示,其中a和b为模型的未知参数,e称为随机误差.(4)刻画回归效果的方式(1)通过教材P2中的例1计算出的回归方程^y=0.849x-85.712可以预报身高为172 cm的女大学生的体重为60.316 kg.请问,身高为172 cm的女大学生的体重一定是60.316 kg吗?为什么?提示:不一定.从散点图可以看出,样本点散布在一条直线的附近,而不是在一条直线上,所以不能用一次函数y=bx+a表示.(2)下列说法正确的有哪些?①在线性回归模型中,e是bx+a预报真实值y的随机误差,它是一个可观测的量;②残差平方和越小的模型,拟合的效果越好;③用R2来刻画回归效果,R2越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.提示:e是一个不可观测的量,故①不正确;R2越小,残差平方和越大,即模型的拟合效果越差,故③不正确;②④是正确的.[课前反思](1)回归分析的定义是什么?如何求回归直线方程?(2)线性回归模型是什么?(3)残差、残差图的定义是什么?如何作残差图?(4)残差平方和和相关指数R2的定义是什么?它们与回归效果有什么关系?[思考] 求线性回归方程的步骤是什么?名师指津:(1)列表表示x i,y i,x i y i,x i2;(2)计算,,x n i2,x n i y i;(3)代入公式计算^a,^b的值;(4)写出线性回归方程.讲一讲1.(链接教材P2-例1)某种产品的广告费用支出x与销售额y(单位:百万元)之间有如下的对应数据:x/百万元24568y/百万元3040605070(1)(2)求线性回归方程;(3)试预测广告费用支出为10百万元时的销售额. [尝试解答] (1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算:所以,=525=5,=5=50,x i =145, x 5i y i =1 380. 于是可得^b=22=145-5×521 380-5×5×50=6.5,^a=-y-^b-x=50-6.5×5=17.5.所以所求的线性回归方程为^y=6.5x +17.5.(3)根据(2)中求得的线性回归方程,当广告费用支出为10百万元时, ^y=6.5×10+17.5=82.5(百万元),即广告费用支出为10百万元时,销售额大约为82.5百万元.(1)求线性回归方程前必须判断两个变量是否线性相关,如果两个变量本身不具备相关关系,或者它们之间的相关关系不显著,那么即使求出回归方程也是毫无意义的.(2)写出回归直线方程^y=^bx +^a,并用回归直线方程进行预测说明:当x 取x 0时,由线性回归方程可得^y0的值,从而可进行相应的判断.练一练1.某班5名学生的数学和物理成绩如下表:学生A B C D E学科成绩数学成绩(x)8876736663物理成绩(y)7865716461(1)(2)求物理成绩y对数学成绩x的回归直线方程;(3)一名学生的数学成绩是96,试预测他的物理成绩.解:(1)如图所示.(2)因为=51×(88+76+73+66+63)=73.2,=51×(78+65+71+64+61)=67.8,x5i y i=88×78+76×65+73×71+66×64+63×61=25 054,x5i2=882+762+732+662+632=27 174.25 054-5×73.2×67.8所以^b=22=27 174-5×73.22≈0.625,^a=-^b-x≈67.8-0.625×73.2=22.05.故y对x的回归直线方程是^y=0.625x+22.05.(3)x=96,则^y=0.625×96+22.05≈82,即可以预测他的物理成绩是82.[思考] 如何用残差图、残差平方和、相关指数R2分析拟合效果?名师指津:残差图的带状区域的宽度越窄,模型拟合精度越高;残差平方和越小,模型拟合效果越好;R2越接近于1,模型拟合效果越好.讲一讲2.假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:x 15.025.830.036.644.4y 39.442.942.943.149.2(1)以x(2)求y与x之间的回归方程,对于基本苗数56.7预报有效穗;(3)计算各组残差,并计算残差平方和;(4)求R2,并说明残差变量对有效穗的影响占百分之几?[尝试解答] (1)散点图如下.(2)由(1)中散点图看出,样本点大致分布在一条直线的附近,有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.设回归方程为^y=^b x+^a.=30.36,=43.5,x5i2=5 101.56,y5i2=9 511.43.-x-y=1 320.66,2=921.729 6,x5i y i=6 746.76.则^b=22≈0.29,^a=-^b≈34.70.故所求的回归直线方程为^y=0.29x+34.70.当x =56.7时,^y=0.29×56.7+34.70=51.143. 估计成熟期有效穗为51.143.(3)由于^yi =^bx i +^a,可以算得^ei =y i -^yi 分别为^e1=0.35,^e2=0.718,^e3=-0.5,^e4=-2.214,^e5=1.624,残差平方和: 5^e i 2≈8.43.(4) 5(y i -)2=50.18, 故R 2=1-50.188.43≈0.832.所以解释变量小麦基本苗数对总效应约贡献了83.2%,残差变量贡献了约1-83.2%=16.8%.(1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差^e1,^e2,…,^en 来判断模型拟合的效果.(2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合度越高,回归方程预报精确度越高.练一练2.某运动员训练次数与运动成绩之间的数据关系如下:次数(x ) 30 33 35 37 39 44 46 50 成绩(y )3034373942464851(1)作出散点图; (2)求出线性回归方程;(3)作出残差图,并说明模型的拟合效果; (4)计算R 2,并说明其含义.解:(1)作出该运动员训练次数x 与成绩y 之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.(2)∵=39.25,=40.875,x8i2=12 656,y8i2=13 731,x8i y i=13 180,∴^b=8=22≈1.041 5,^a=-^b≈-0.003 875,∴线性回归方程为^y=1.041 5x-0.003 875.(3)残差分析计算得^e1≈-1.24,^e2≈-0.366,^e3≈0.551,^e4≈0.468,^e5≈1.385,^e6≈0.178,^e7≈0.095,^e8≈-1.071.作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.(4)计算相关指数R2计算相关指数R2≈0.985 5,说明了该运动员成绩的差异有98.55%是由训练次数引起的.讲一讲3.(链接教材P6-例2)某地区六年来轻工业产品利润总额y与年次x的试验数据如下表所示:a,b均为正数,求y关于x的回归方程.[思路点拨] 解答此题可根据散点图选择恰当的拟合函数,而本题已经给出,只需将其转化为线性函数,利用最小二乘法求得回归直线方程,再将其还原为非线性回归方程即可.[尝试解答] 对y=ab x e0两边取自然对数,得ln y=ln ae0+x ln b,令z=ln y,则z与x的数据如下表:由z=ln 0ln b≈0.047 7,ln ae0=2.378,即^z=2.378+0.047 7x,故^y=10.8×1.05x.非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:练一练3.某电容器充电后,电压达到100 V,然后开始放电,由经验知道,此后电压U 随时间t变化的规律用公式U=A e bt(b<0)表示,现测得时间t(s)时的电压U(V)如下表:t/s012345678910U/V10075554030201510105 5线性回归分析问题).解:对U=A e bt两边取对数得ln U=ln A+bt,令y=ln U,a=ln A,x=t,则y=a+bx,y与x的数据如下表:x 012345678910y 4.6 4.3 4.0 3.7 3.4 3.0 2.7 2.3 2.3 1.6 1.6如图所示,从图中可以看出,y与x具有较好的线性相关关系,由表中数据求得=5,≈3.045,由公式计算得^b≈-0.313,^a=-^b-x=4.61,所以y对x的线性回归方程为^y=-0.313x+4.61.所以ln ^U=-0.313t+4.61,即^U=e-0.313t+4.61=e-0.313t·e4.61,因此电压U对时间t的回归方程为^U=e-0.313t·e4.61.————————————[课堂归纳·感悟提升]————————1.本节课的重点是线性回归方程的求法及线性回归分析,难点是残差分析和非线性回归分析问题.2.本节课要重点掌握的规律方法(1)线性回归分析,见讲1;(2)残差分析,见讲2;(3)非线性回归分析,见讲3.。
2018-2019学年人教A版 选修1-2 回归分析的基本思想及其初步应用(一) 教案
一、复习准备:
1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?
2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据作散点图求回归直线方程利用方程进行预报.
二、讲授新课:
1. 教学例题:
①例1从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:
1 2 3 4 5 6 7 8
编
号
165 165 157 170 175 165 155 170 身高
/cm
体重 48 57 50 54 64 61 43 59
/kg
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重.
(分析思路教师演示学生整理)
第一步:作散点图
第二步:求回归方程
第三步:代值计算
②提问:身高为172cm的女大学生的体重一定是60.316kg吗?
不一定,但一般可以认为她的体重在60.316kg左右.
③解释线性回归模型与一次函数的不同
一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.
2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.
3、小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.
板
书
教学
反思。
高中数学《回归分析的基本思想及其初步应用》教案2 新人教A版选修1-2
回归分析的基本思想及其初步应用(第三课时)(第四课时)一、目标:1、使学生会根据观测数据的特点来选择回归模型2、使学生通过探究体会到有些非线性模型通过变换可以转化为线性回归模型。
3、初步体会不同模型拟合数据的效果。
二、教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。
三、教学基本流程:回忆建立模型的基本步骤①例2 问题背景分析画散点图。
②观察散点图,分析解释变量与预报变量更可能是什么函数关系。
③学生讨论后建立自己的模型④引导学生探究如果不是线性回归模型如何估计参数。
能否利用回归模型通过探究体会有些不是线性的模型通过变换可以转化为线性模型⑤对数据进行变换后,对数据(新)建立线性模型⑥转化为原来的变量模型,并通过计算相关指数比较几个不同模型的拟合效果⑦总结建模的思想。
鼓励学生大胆创新。
⑧布置课后作业:习题1.1 1、附例2的解答过程:解:依题意,把温度作为解释变量x ,产卵个数y作为预报变量 , 作散点图,由观察知两个变量不呈线性相关关系。
但样本点分布在某一条指数函数 y=c1e c2 x周围.令 z=lny , a=lnc1 , b=c2则 z=bx+a此时可用线性回归来拟合 z=0.272x-3.843因此红铃虫的产卵数对温度的非线性回归方程为Y=e0.272x-3.8431、1回归分析的基本思想及其初步应用(习题课)(第五课时)目标:通过习题巩固所学知识过程:1、复习有关知识2、典型例题:例1:某班5名学生的数学和化学成绩如下表所示,对x与y进行回归分析,并预报某学生数学成绩为75分时,他的化学成绩。
A B C D E数学x 88 76 73 66 63 化学y 78 65 71 64 61解略。
例2:某医院用光电比色计检验尿汞时,得尿汞含量 (mg/l) 与消光系数的结果如下:(1)求回归方程。
17学年高中数学专题1.1回归分析的基本思想及其初步应用(第2课时)教案新人教A版选修1-2
17学年高中数学专题1.1回归分析的基本思想及其初步应用(第2课时)教案新人教A版选修1-2D残差平方和、回归平方和;了解偏差平方和分解的思想;了解判断刻画模型拟合效果的方法——相关指数和残差分析;了解非线性模型通过变换转化为线性回归模型。
(2)过程与方法:本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线方程,从中也找出存在的不足,从而有进行回归分析的必要性,进而学习相关指数,用相关指数来刻画回归的效果。
(3)情感态度与价值观:从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求知欲,培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进取。
【教学重点】:1、了解判断刻画模型拟合效果的方法——相关指数和残差分析;2、通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型。
【教学难点】:1、解释残差变量的含义;2、了解偏差平方和分解的思想。
【课前准备】:课件【教学过程设计】:线上相应的位置的差异()i iyyˆ-是随机误差的效应,称i i iyy eˆˆ-=为残差,()∑=-ni i iyy12ˆ为残差平方和;学生动手计算出例1中的残差(如下表)与残差平方和。
编号 1 2 3 4 5 6 7 8 身高/cm165 165 157 170 175 165 155 170 体重/kg48 57 50 54 64 61 43 59y i 54.373 54.373 47.581 58.618 62.863 54.373 45.883 58.618 e i -6.373 2.627 2.419 -4.618 1.137 6.627 -2.883 0.382 ()361.128ˆ12=-∑=ni iiy y 发,抽象为数学问题中的线性回归问题,从而指导实际问题的解决。
⑶回归平方和:解释变量和随机误差的总效应(总偏差平方和),即总的偏差平方和=回归平方和+残差平方和,所以回归平方和=总的偏差平方和-残差平方和学生动手计算出例1中的回归平方和。
人教版高中数学选修(1-2)-1.1《回归分析基本思想及其初步应用(第2课时)》教学设计
1.1.1 回归分析基本思想及其初步应用第二课时(谷杨华)一、教学目标 1.核心素养:通过学习回归分析的基本思想及其初步应用,初步形成基本的数据分析能力. 2.学习目标(1)1.1.2.1 理解相关系数概念(2)1.1.2.2 判断刻画模型拟合效果的方法—相关指数和残差分析 (3)1.1.2.3 能用回归分析的方法对简单的案例进行分析. 3.学习重点判断刻画模型拟合效果的方法—相关系数、相关指数和残差分析 4.学习难点判断刻画模型拟合效果的方法—相关系数、相关指数和残差分析 二、教学设计 (一)课前设计 1.预习任务 任务1阅读教材P 4-P 6,思考在回归分析中,分析残差能够帮助我们解决那些问题?任务2刻画模型拟合效果的方法有哪些?2.预习自测1.下列说法正确的是 ( )A.在统计学中,回归分析是检验两个分类变量是否有关系的一种统计方法B.线性回归方程对应的直线a x b yˆˆˆ+=至少经过其样本数据点1122(,),(,),,(,)n n x y x y x y L 中的一个点C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D.在回归分析中,相关指数2R 为98.0的模型比相关指数2R 为80.0的模型拟合的效果差 【知识点:回归分析】解:C A.回归分析反映两个变量相关关系的数学方法,由建立回归方程来预报变量的情况.错误;B.线性回归方程对应的直线a x b yˆˆˆ+=,过其样本数据平均数点,错误;D.相关指数2R 越大,则相关性越强,模型的拟合效果越好. 错误;C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高. 正确.2.两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下,其中拟合效果最好的模型是( ) A.模型1的相关指数2R 为0.99 B.模型2的相关指数2R 为0.88 C.模型3的相关指数2R 为0.50 D.模型4的相关指数2R 为0.20 【知识点:回归分析】解:A 由相关指数的意义知,2R 越大说明相关性越强,故选A. (二)课堂设计 1.知识回顾⑴对于一组具有线性相关关系的数据1122(,),(,),,(,)n n x y x y x y L ,1211,n n i i x x x x x n n =+++==∑L 121y y y 1y y ,nn i i n n=+++==∑L 则称点),y x (为样本点的中心. (2)线性回归方程:∧∧∧+=a x b y ,其中.1122211()()()n niii ii i nniii i x x y y x y nx yb x x xnx∧====---==--∑∑∑∑,a ∧=x b ∧-y(3)线性回归模型:y =bx +a +e 其中a 和b 为模型的未知参数,e 称为随机误差. 2.问题探究问题探究一 什么是相关系数?相关系数可以用来解释什么?●活动一 理论研究,概念学习—相关系数我们知道,两个变量x 和y 正(负)相关时,它们就有相同(反)的变化趋势,因此可以用回归直线来描述这种关系.与此相关的一个问题:如何描述x 和y 之间种线性关系的强弱?在统计中用相关系数r 来衡量两个变量之间线性关系的强弱.若相应于变量x 的取值i x ,变量y 的观测值为i y (n i ≤≤1),则两个变量的相关系数r 的计算公式为∑∑∑===----=ni ni iini iiy yx x y yx x r 11221)()())((对于相关系数r ,当为正时,表明变量x 和y 正相关,当r 为负时,表明变量x 和y 负相关. 统计学认为,对于变量x,y ,如果[]75.0,1--∈r ,那么负相关很强;如果[]1,75.0∈r ,那么正。
新人教A版(选修1-2)1.1《回归分析的基本思想及其初步应用》word教案
1.1回归分析的基本思想及其初步应用(一)教学任务分析:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法——相关系数.教学难点:解释随机误差的含义及相关系数大小对两个变量相关关系的影响.教学过程: 一.引入问:身高和体重有什么样的关系?吸烟与患肺癌有关系吗?答:函数关系是一种确定性关系,而相关关系是一种非确定性关系。
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:(1)收集数据;(2)作散点图;(3)求回归直线方程;(4)利用方程进行预报 二.例题与练习求根据女大学生的身高预报体重的回归方程,并预报一名身高为172 cm 的女大 学生的体重.练习:学案p2-P6:的最好估计,计算公式和就是未知参数和b a b a ∧∧∑∑==∧---=ni i ni i ix x y y x xb 121)())((∑∑==--=n i i ni ii xn x yx n yx 1221x b y a ∧∧-=:样本相关系数计算公式∑∑∑===----=n i ni i i ni i iy y x x y y x xr 11221)()())((∑∑∑===---=n i ni i i ni ii y n y x n x yx n yx 112221)()(:回归相关指数计算公式∑∑==∧---=n i ini i iy yy yR 12122)()(1作业:习案1、2.。
人教A版高中数学选修1-2《一章 统计案例 1.1 回归分析的基本思想及其初步应用》优质课教案_11
回归分析的基本思想及其初步应用预习课本P2~8,思考并完成以下问题 1.什么是回归分析?2.什么是线性回归模型?3.求线性回归方程的步骤是什么?[新知初探]1.回归分析 (1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. (2)回归方程的相关计算对于两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ).设其回归直线方程为y ^=b ^x +a ^,其中a ^,b ^是待定参数,由最小二乘法得b ^=∑i =1n (x i -x )(y i -y )∑i =1n(x i -x )2=∑i =1nx i y i -nx y∑i =1nx 2i -n x2,a ^=y -b ^x . (3)线性回归模型线性回归模型⎩⎨⎧y =bx +a +e ,E (e )=0,D (e )=σ2,其中a ,b 为模型的未知参数,通常e为随机变量,称为随机误差.x 称为解释变量,y 称为预报变量.[点睛] 对线性回归模型的三点说明(1)非确定性关系:线性回归模型y =bx +a +e 与确定性函数y =a +bx 相比,它表示y 与x 之间是统计相关关系(非确定性关系),其中的随机误差e 提供了选择模型的准则以及在模型合理的情况下探求最佳估计值a ,b 的工具.(2)线性回归方程y ^=b ^x +a ^中a ^,b ^的意义是:以a ^为基数,x 每增加1个单位,y 相应地平均增加b ^个单位.2.线性回归分析(1)残差:对于样本点(x i ,y i )(i =1,2,…,n )的随机误差的估计值 e ^i =y i -y ^i 称为相应于点(x i ,y i )的残差,∑i =1n(y i -y ^i )2称为残差平方和.(2)残差图:利用图形来分析残差特性,作图时纵坐标为残差, 横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.(3)R 2=1-∑i =1n(y i -y ^i )2∑i =1n (y i -y )2越接近1,表示回归的效果越好.[小试身手]1.判断下列命题是否正确.(正确的打“√”,错误的打“×”) (1)残差平方和越小, 线性回归方程的拟合效果越好.( )(2)在画两个变量的散点图时, 预报变量在x 轴上,解释变量在y 轴上.( ) (3)R 2越小, 线性回归方程的拟合效果越好.( ) 答案:(1)√ (2)× (3)×2.从散点图上看,点散布在从左下角到右上角的区域内, 两个变量的这种相关关系称为________.答案:正相关3.在残差分析中, 残差图的纵坐标为________. 答案:残差4.如果发现散点图中所有的样本点都在一条直线上, 则残差平方和等于________, 解释变量和预报变量之间的相关系数等于________.答案:0 1或-1[典例] 表数据(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程 y ^=b ^x +a ^;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力. [解] (1)散点图如图:(2)∑i =1nx i y i =6×2+8×3+10×5+12×6=158,x =6+8+10+124=9,y =2+3+5+64=4,∑i =1nx 2i =62+82+102+122=344.b ^=158-4×9×4344-4×92=1420=0.7,a ^=y -b ^x =4-0.7×9=-2.3, 故线性回归方程为y ^=0.7x -2.3.(3)由(2)中线性回归方程知,当x =9时,y ^=0.7×9-2.3=4,故预测记忆力为9的同学的判断力约为4.求线性回归方程的三个步骤(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系.(2)求回归系数:若存在线性相关关系,则求回归系数.(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明.[活学活用]某工厂1~8月份某种产品的产量与成本的统计数据见下表:月份12345678产量(吨)5.66.06.16.47.07.58.08.2成本(万元)130136143149157172183188(1)画出散点图;(2)y与x是否具有线性相关关系?若有,求出其回归方程.解:(1)由表画出散点图,如图所示.(2)从上图可看出,这些点基本上散布在一条直线附近,可以认为x和y线性相关关系显著,下面求其回归方程,首先列出下表.x i y i x2i x i y i15.613031.36728.026.013636.00816.036.114337.21872.346.414940.96953.657.015749.00 1 099.067.517256.25 1 290.078.018364.00 1 464.0计算得x =6.85,y =157.25.∴b ^=∑i =18x i y i -8xy∑i =18x 2i -8x2=8 764.5-8×6.85×157.25382.02-8×6.852≈22.17,a ^=y -b ^x =157.25-22.17×6.85≈5.39, 故线性回归方程为y ^=22.17x +5.39.1.在一段时间内,某种商品的价格x 元和需求量y件之间的一组数据为:求出y 对x 解:x =15(14+16+18+20+22)=18,y =15(12+10+7+5+3)=7.4.∑i =15x 2i =142+162+182+202+222=1 660, ∑i =15x i y i =14×12+16×10+18×7+20×5+22×3=620,可得回归系数b ^=∑i =15x i y i -5xy∑i =15x 2i -5x2=620-5×18×7.41 660-5×182=-1.15.所以a ^=7.4+1.15×18=28.1所以回归直线方程:y ^=-1.15x +28.1. 列出残差表:则∑i =15(y i -y ^i )2=0.3,∑i =15(y i -y )2=53.2.。
人教A版高中数学选修回归分析的基本思想及其初步应用教案
凡事豫(预)则立,不豫(预)则废。
1、1回归分析的基本思想及其初步应用。
(第1课时)教学目标:通过典型案例,掌握回归分析的基本步骤。
教学重点:熟练掌握回归分析的步骤。
教学难点:求回归系数 a , b教学方法:讲练。
教学过程:一、复习引入:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
二、新课:1、回归分析的基本步骤:(1) 画出两个变量的散点图。
(2) 求回归直线方程。
(3) 用回归直线方程进行预报。
2、举例:例1、题(略) 用小黑板给出。
解:(1) 作散点图,由于问题是根据身高预报体重,因此要求身高与体重的回归直线方程,取身高为自变量x 。
体重为因变量 y ,作散点图(如图)(2)列表求 ,ˆ0.849ˆ85.712x yba ≈≈-回归直线方程 y=0.849x-85.712对于身高172cm 女大学生,由回归方程可以预报体重为y=0.849*172-85.712=60.316(kg) 预测身高为172cm 的女大学生的体重为约60。
316kg问题:身高为172cm 的女大学生的体重一定是60。
316kg 吗?(留下一节课学习) 例2:(提示后做练习、作业)研究某灌溉渠道水的流速y 与水深x 之间的关系,测得一组数据如下:水深xm1.40 1.50 1.60 1.70 1.80 1.902.00 2.10 流速ym/s1.70 1.79 1.88 1.952.03 2.10 2.16 2.21(1)求y 对x 的回归直线方程;(2)预测水深为1。
95m 时水的流速是多少?解:(略)三、小结四、作业: 例2、 预习。
人教版高中数学选修(1-2)-1.1《回归分析的基本思想及其初步应用》教学教案
1.1回归分析的基本思想及其初步应用学习目标:(1)通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤;了解线性回归模型与函数模型的区别;(2)尝试做散点图,求回归直线方程;(3)能用所学的知识对实际问题进行回归分析,体会回归分析的实际价值与基本思想;了解判断刻画回归模型拟合好坏的方法――相关指数和残差分析。
学习重难点:(1)求回归直线方程,会用所学的知识对实际问题进行回归分析.(2)掌握回归分析的实际价值与基本思想.(3)能运用自己所学的知识对具体案例进行检验与说明.(4)残差变量的解释;(5)偏差平方和分解的思想;学习内容:一、基础知识梳理1.回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。
求回归直线方程的一般步骤:作出散点图(由样本点是否呈条状分布来判断两个量是否具有线性相关关系),若存在线性相关关系→②求回归系数→③写出回归直线方程,并利用回归直线方程进行预测说明.2.回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法。
建立回归模型的基本步骤是:①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;②画好确定好的解释变量和预报变量的散点图,观察它们之间的关系(线性关系)③由经验确定回归方程的类型.④按一定规则估计回归方程中的参数(最小二乘法);⑤得出结论后在分析残差图是否异常,若存在异常,则检验数据是否有误,后模型是否合适等.3.利用统计方法解决实际问题的基本步骤:(1)提出问题;(2)收集数据;(3)分析整理数据;(4)进行预测或决策。
4.残差变量e的主要来源:(1)用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型到底是什么)所引起的误差。
可能存在非线性的函数能够更好地描述y与x之间的关系,但是现在却用线性函数来表述这种关系,结果就会产生误差。
这种由于模型近似所引起的误差包含在e中。
人教A版高中数学选修1-2《一章 统计案例 1.1 回归分析的基本思想及其初步应用》优质课教案_28
3.1回归分析的基本思想及其初步应用的教学设计(1)
一、教学任务分析
通过例1的教学,使学生进一步了解与线性回归模型有关的一些统计思想,1、引入残差变量的必要性,2、残差分析和相关指数R2的作用,3、对于模型预报结果的正确认识。
二、教学重点与难点
重点:1、了解回归模型与函数模型的区别2、了解任何模型只能近似描述实际问题
3、模型拟合效果的分析工具:残差分析和指标R2.
难点: 1.残差变量的解释与分析,2、相关指数R2的理解
三、教学基本流程
四、教学情境设计。
人教版高中选修1—2数学1.1回归分析的基本思想及其初步应用教案(5)
1、1回归分析的基本思想及其初步应用教学目标:通过典型案例,掌握回归分析的基本步骤。
教学重点:熟练掌握回归分析的步骤。
教学难点:求回归系数 a , b 教学方法:讲练。
教学过程:一、复习引入:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
二、新课:1、回归分析的基本步骤:(1) 画出两个变量的散点图。
(2) 求回归直线方程。
(3) 用回归直线方程进行预报。
2、举例:例1、题(略) 用小黑板给出。
解:(1) 作散点图,由于问题是根据身高预报体重,因此要求身高与体重的回归直线方程,取身高为自变量x 。
体重为因变量 y ,作散点图(如图) (2)列表求,ˆ0.849ˆ85.712x yba≈≈-回归直线方程 y=0.849x-85.712对于身高172cm 女大学生,由回归方程可以预报体重为y=0.849*172-85.712=60.316(kg) 预测身高为172cm 的女大学生的体重为约60。
316kg问题:身高为172cm 的女大学生的体重一定是60。
316kg 吗?(留下一节课学习) 例2:(提示后做练习、作业)研究某灌溉渠道水的流速y 与水深x 之间的关系,测得一组数据如下:水深xm 1.40 1.50 1.60 1.70 1.80 1.90 2.00 2.10 流速ym/s 1.70 1.79 1.88 1.95 2.03 2.10 2.16 2.21(1)求y 对x 的回归直线方程;(2)预测水深为1。
95m 时水的流速是多少? 解:(略)三、小结四、作业: 例2、 预习。
1-1回归分析的基本思想及其初步应用(第二课时)教学目标:1、会建立回归模型,进而学习相关指数(相关系数r 、总偏差平方和、随机误差的效应即残差、残差平方和、回归平方和、相关指数R 2、残差分析) 2、会求上述的相关指数:3、从实际问题发现已有知识不足,激发好奇心、求知欲。
培养勇于求知的良好个性品质。
人教A版高中数学选修回归分析的基本思想及其初步应用教案
1、1回归分析的基本思想及其初步应用。
(第1课时)教学目标:通过典型案例,掌握回归分析的基本步骤。
教学重点:熟练掌握回归分析的步骤。
教学难点:求回归系数 a , b教学方法:讲练。
教学过程:一、复习引入:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
二、新课:1、回归分析的基本步骤:(1) 画出两个变量的散点图。
(2) 求回归直线方程。
(3) 用回归直线方程进行预报。
2、举例:例1、题(略) 用小黑板给出。
解:(1) 作散点图,由于问题是根据身高预报体重,因此要求身高与体重的回归直线方程,取身高为自变量x 。
体重为因变量 y ,作散点图(如图)(2)列表求 ,ˆ0.849ˆ85.712x yba ≈≈-回归直线方程 y=0.849x-85.712对于身高172cm 女大学生,由回归方程可以预报体重为y=0.849*172-85.712=60.316(kg) 预测身高为172cm 的女大学生的体重为约60。
316kg问题:身高为172cm 的女大学生的体重一定是60。
316kg 吗?(留下一节课学习) 例2:(提示后做练习、作业)研究某灌溉渠道水的流速y 与水深x 之间的关系,测得一组数据如下:水深xm1.40 1.50 1.60 1.70 1.80 1.902.00 2.10 流速ym/s1.70 1.79 1.88 1.952.03 2.10 2.16 2.21(1)求y 对x 的回归直线方程;(2)预测水深为1。
95m 时水的流速是多少?解:(略)三、小结四、作业: 例2、 预习。
高中数学选修1-2教案:1.1回归分析的基本思想及其初步应用(共4课时)
第一章统计案例1。
1回归分析的基本思想及其初步应用(一)教学目标:(1).知识与技能:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用(2)。
过程与方法:了解回归分析的基本思想、方法及初步应用(3).情感,态度与价值观:充分利用图形的直观性,简捷巧妙的解题教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析。
教学难点:解释残差变量的含义,了解偏差平方和分解的思想.教学方法:讲解法,引导法教学过程:一、复习准备:1。
提问:“名师出高徒"这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2。
复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报。
二、讲授新课:1。
教学例题:①例1从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:编12345678号身高/cm165 165 157 170 175 165 155 170 体重/kg48 57 50 54 64 61 43 59 求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm 的女大学生的体重. (分析思路→教师演示→学生整理)第一步:作散点图 第二步:求回归方程 第三步:代值计算② 提问:身高为172cm 的女大学生的体重一定是60.316kg 吗? 不一定,但一般可以认为她的体重在60。
316kg 左右.③ 解释线性回归模型与一次函数的不同 事实上,观察上述散点图,我们可以发现女大学生的体重y 和身高x 之间的关系并不能用一次函数y bx a =+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系)。
在数据表中身高为165cm 的3名女大学生的体重分别为48kg 、57kg 和61kg ,如果能用一次函数来描述体重与身高的关系,那么身高为165cm 的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e (即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e =++,其中残差变量e 中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等010203040506070150155160165170175180身高/cm体重/k g于0时,线性回归模型就变成一次函数模型。
高中数学《1.1回归分析的基本思想及其初步应用》教案 新人教A版选修1-2
第一章 统计案例1.1回归分析的基本思想及其初步应用(一) 教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析.教学难点:解释残差变量的含义,了解偏差平方和分解的思想.教学过程:一、复习准备:1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报.二、讲授新课:1. 教学例题:的体重. (分析思路→教师演示→学生整理)第一步:作散点图第二步:求回归方程第三步:代值计算 ② 提问:身高为172cm 的女大学生的体重一定是60.316kg 吗?不一定,但一般可以认为她的体重在60.316kg 左右.③ 解释线性回归模型与一次函数的不同事实上,观察上述散点图,我们可以发现女大学生的体重y 和身高x 之间的关系并不能用一次函数y bx a =+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm 的3名女大学生的体重分别为48kg 、57kg 和61kg ,如果能用一次函数来描述体重与身高的关系,那么身高为165cm 的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e (即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e =++,其中残差变量e 中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.3. 小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.第二课时。
【新新学案系列】高中数学选修1-2《1.1 回归分析的基本思想及其初步应用》学案(人教A版,pdf版,含答案)
新新学案
高中数学选修 人教实验 版
跟踪练习 已知 # 与% 之间的一组数据如下表 !
# %
1 " " $ # + $ 0
议一议 从散点图观察 & 如果样本点分布在一条直线上 & 那 么这两个变量之间就是一种确定性关系 , 即一次函数关系 & 我第 一 章
统计案例
学 习
札记
学 习目标
回归分析的基本思想及其初步应用
非确定性关系 问题 如何研究两个变量之间的相关关系 + 想一想 由于相关关 系 的 不 确 定 性 & 我们必须采用统计 分析的方法 & 即回归分析的方法来研究 提升总结 , 相关关系 当自变量取值一定 时 & 因 变 量 取 值 带 有 一 定 随 机 性& 这 两个变量之间的关系叫相关关系 例如人的体重与身高的 关 系就是相关关系 , 两个变量具有相关关系和两个变量具有函数关系 的 异同 相关关系与函数关系不同 & 因为函数关系是一种确定 性 关系 & 而相关关系是一种非确定性关系 它包括两种情况 ! 一 是两个变量中 & 一个 变 量 为 可 控 制 变 量 & 另一个变量为随机 变量 " 二是两个变量 均 为 随 机 变 量 而函数关系可以看成是 另 一 方 面& 函数关系是一种因 两个非随机变量之 间 的 关 系 果关系 & 而相关关系不一定是因果关系 & 也可以是伴随关系 例 在下列各量与量的关系中是相关关系的为, 正方体的体积与棱长间的关系 " 一块农田的水稻 产 量与 施 肥 量 之 间 的 关 系 " 人 的 身 高 与 年 龄 之 间 的 关 系" 家庭的支出与收入之间的关系 " 某户家庭用电量与电 费 之间的关系 跟踪练习 下列各项中的两 个 变 量 中 具 有 相 关 关 系 的 是, 长方体的体积与高 人的寿命与营养 正方形的边长与面积 匀速行驶的车辆的行驶距离与时间 探究二 线性回归模型 问题 如何 直 观 地 刻 画 两 个 变 量 之 间 是 否 具 有 线 性 相关关系 + 想一想 在$ 数学 % 中我们 研 究 了 两 个 变 量 之 间 的 线 性 相关关系 要直观地 * 形象地刻画两个变量之间的线性相关 关系 & 可以通过作散点图的方法得到 & 只要在散点图中 & 样本 点呈条状分布 , 即样本 点 大 致 分 布 在 一 条 直 线 的 附 近 就可 以判定两个变量具有线性相关关系 问题 如何定量地刻画两个变量之间的线性相关关系+
人教A版选修1-2 第三课时 1.1回归分析的基本思想及其初步应用(三)教案
第三课时 1.1回归分析的基本思想及其初步应用(三)教学目标:1知识与技能:由“散点图”选择适当的数据模型,以拟合两个相关变量。
虽然任何两个变量的观测数据都可以用线性回归模型来拟合,但不能保证这种拟合模型对数据的拟合效果最好。
为更好地刻画两个变量之间的关系,要根据观测数据的特点来选择回归模型。
2过程与方法:通过探究使学生认识到:有些 线性模型非线性模型转换,即借助于线性回归模型研究呈非线性关系的两个变量之间的关系:归模型来拟合数据作变换,在利用线性回区域分布在一个曲线状带形 合数据;3情感态度价值观:初步体会不同模型拟合数据的效果。
计算不同模型的相关指数,通过比较相关指数的大小来比较不 同模型的拟合效果。
(这只是模型比较的一种方法,还有其他方法。
)教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法.教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较. 教学过程: 一、复习准备:1. 给出例3:一只红铃虫的产卵数和温度有关,现收集了7组观测数据列于下表中,试建立与之间的回归方程.2. 讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系. 二、讲授新课:1. 探究非线性回归方程的确定:① 如果散点图中的点分布在一个直线状带形区域,可以选线性回归模型来建模;如果散点图中的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模.y x y x② 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y =的周围(其中是待定的参数),故可用指数函数模型来拟合这两个变量.③ 在上式两边取对数,得,再令,则,而与间的关系如下: 观察与的散点图,可以发现变换后样本点④ 利用计算器算得,与间的线性回归方程为,因此红铃虫的产卵数对温度的非线性回归方程为. ⑤ 利用回归方程探究非线性回归问题,可按“作散点图建模确定方程”这三个步骤进行.其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题. 2. 小结:用回归方程探究非线性回归问题的方法、步骤. 三、巩固练习:为了研究某种细菌随时间x 变化,繁殖的个数,收集数据如下:(1(2)试求出预报变量对解释变量的回归方程.(答案:所求非线性回归方程为.) 四、教学反思:2C 1e x C 12,c c 21ln ln y c x c =+ln z y =21ln z c x c =+z x z x 3.843,0.272a b =-=z x 0.272 3.843z x =-$$0.272 3.843x y e -=→→0.69 1.112ˆy=e x +。
1.1_回归分析的基本思想及其初步应用_教案(人教A版选修1-2)
统计案例明菜缶方A F 车读疵灵法”(教师用书独具)析,明确解决回归模型的基本步骤,并对具体问题进行回归分析以解决实际应用 问题.了解最小二乘法的推导,解释残差变量的含义,了解偏差平方和分解的思器求线性回归直线方程参数及相关系数的方法.2.过程与方法通过收集数据作散点图,分析散点图,求回归直线方程,分析回归效果,利 用方程进行预报.3.情感、态度与价值观培养学生利用整体的观点和互相联系的观点来分析问题, 的应用意识,培养学生学好数学、用好数学的信心,加强与现实生活的联系,以 科学的态度评价两个变量的相互关系.•重点难点重点:回归分析的基本方法、随机误差 e 的认识、残差图的概念、用残差及R 2来刻画线性回归模型的拟合效果.难点:回归分析的基本方法、残差概念的理解及拟合效果的判定、非线性回新课标数学选修1— 2•三维目标1 .知识与技能通过典型案例的探究, 了解回归分析的基本思想,会对两个变量进行回归分 1. 1回归分析的基本思想及其初步应用想,了解判断刻画模型拟合效果的方法相关指数和残差分析.掌握利用计算进一步加强数学归向线性回归的转化.教学时要以残差分析为重点,突出残差表和 R 2的计算,通过举例说明相关关系与确定性关系的区别,说明回归分析的必要性及其方法.借助例题使学生掌 握作散点图、求回归直线方程的方法,通过作残差图、计算 R 2让学生掌握拟合效果的判断方法.对于非线性回归问题重点在如何转换,引导学生分析总结转化 方法和技巧,从而化解难点.(教师用书独具)•教学建议本节课建议教师采取探究式教学,把“关注知识”转向“关注学生”, 在教 学过程中,把“给出知识”的过程转变为“引起活动, 把“完成教学任务”转向“促进学生发展”, 在知识形成过程的探索,例题的解答也要由学生探讨、教师点拨,共同完成.要 注重数学的思想性,如统计思想、随机观念、函数思想、数形结合的思想方法等, 引导学生体验数学中的理性精神,加强数学形式下的思考和推理能力.•教学流程创设问题情境,引出问题,弓I 导学生探讨,从而引出回归分析、 型、刻画回归效果的有关概念及解决方法.利用填一填的形式,习本节基础知识,并反馈了解,对理解有困难的概念加以讲解.习基础知识的基础上分析回答例题1的问题,并总结规律方法,完成变式训练. 引导学生分析例题2,根据图中的数据计算系数,求出回归方程,列出残差表, 求出R 2并判断拟合效果,完成变式训练.敖歩方案设th授方珞沫程细隣冋F 數祺"让学生探究知识的过程”,让学生成为课堂上的真正主人.在 教学中,知识点可由学生通过探索“发现”, 让学生充分经历探索与发现的过程, 并引导学生积极解决探索过程中发现的问题.教学中不要以练习为主,而是定位线性回归模 使学生自主学 引导学生在学完成当堂双基达标,巩固所学知识及应用方法,并进行反馈矫正. 归纳整理,进行课堂小结,整体认识本节所学知识,强调重点内容和规律方法.老师启发引导,完成例题3,并要求学生借鉴例题3的解法完成变式训练. 引 导学生分析例题3,让学生作出散点图,观察相关性,引出问题,即如何使问题 转化为相关关系并用线性回归分析二者关系.1•会用散点图分析两个变量是否存在相关关系.(重点)2.会求回归方程,掌握建立回归模型的步骤,会选择回归模型.(重点、难点)【问题导思】台机器由于使用时间较长,生产的零件有一些会有缺陷.按不同转速生产出有缺陷的零件的统计数据如下:1.在平面直角坐标系中作出散点图.【提示】yIQS'0 » 10 12 14 16 R2.从散点图中判断x 和y 之间是否具有相关关系?【提示】 有.3.若转速为10转/秒,能否预测机器每小时生产缺陷的零件件数?【提示】 可以.根据散点图作出一条直线,求出直线方程后可预测.通过课标解读(1) 回归直线方程:y= bx+a,其中:n _ ___Z (X i- 7 则—丁)八八___ 八____ _ 1 nb= , a= y —b x , x = -S x i,n一 2 n iTZ (X i—x)1 = 1—1J y二n p i.(2) 变量样本点中心:(X , y ),回归直线过样本点的中心.(3)线性回归模型:y= bx+a+e,其中e称为随机误差,a和b是模型的未知参数,自变量x 称为解释变量,因变量y称为预报变量.ny 2Z (y i —yi )1=1 R 2= 1— ,R 2表示解释变量对预报变量变化的贡献率,n— —2 三(y i — y )i = 1R 2越接近于1,表示回归的效果越好卜例n 有下列说法:①线性回归分析就是由样本点去寻找一条直线, 使之贴近这些样本点的数学 方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系 表示;③通过回归方程y =bx +a ,可以估计和观测变量的取值和变化趋势;④因 为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检 验.其中正确命题的个数是()C . 3①反映的正是最小二乘法思想, 故正确.②反映的是画散点 ③解释的是回归方程y = bx +a 的作用,故也正确.④是不正 确的,在求回归方程之前必须进行相关性检验,以体现两变量的关系.【答案】 CI 规律方法I1.解答例1中④时,必须明确具有线性相关关系的两个变量间才能求得一个线性回归方程,否则求得的方程无实际意义.因此必须先进行线性相关性判断,相关指 数R 2靜宅互动探究硕冠:幸 3讳主互动 A "知能"IlS :^【思路探究】可借助于线性相关概念及性质逐一作出判断.【自主解答】 图的作用,也正确.后求线性回归方程.2.回归分析的过程:(1) 随机抽取样本,确定数据,形成样本点;(2) 由样本点形成散点图,判断是否具有线性相关关系; (3) 由最小二乘法确定线性回归方程; (4)由回归方程观察变量的取值及变化趋势.» 亜貳 illl 11关于变量y 与x 之间的回归直线方程叙述正确的是()表示y 与x 之间的一种确定性关系表示y 与x 之间的相关关系 表示y 与x 之间的最真实的关系回归直线方程能最大可能地反映 y 与x 之间的真实关系,故选项D 正确.【答案】►例0已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:求y 关于x 的回归直线方程,并说明回归模型拟合效果的好坏. 【思路探究】回归模型拟合效果的好坏可以通过计算 R 2来判断,其值越大,说明模型的拟合效果越好.—1【自主解答】 x = 5(14 + 16+18+20 + 22)= 18, y = 5(12 + 10+7+5+ 3)= 7.4,B .C .D . 表示y 与x 之间真实关系的一种效果最好的拟合【解析】5Z x i 2— 142+ 162+ 182 + 202 + 222 — 1 660,i — 15Z x i y i = 14X 12+ 16X 10+ 18X 7 + 20X 5 + 22X 3 = 620,丄15 _ _S x i y i — 5 X yAi — 1620— 5X 18X 7.4 所以b —V 2 口一2 Z x i — 5 Xi — 1Aa = 7.4 + 1.15X 18 = 28.1,21 660- 5X 18所以所求回归直线方程是Ay =— 1.15X + 28.1列出残差表: 5所以送i — 1TA 2Z (y i —yi )i — 12R — 1— ----------- ~ 0.994,5 —送(y i - y )2i — 1所以回归模型的拟合效果很好.I 规律方法IA A1.回归直线方程能定量地之间的变化趋势,其中b 表示X 变化一个单位时,y 的平均变化量.利用回归直A5A -- 2(y i — y i ) — 0.3,送(y i — y) — 53.2,i = 1线可以对问题进行预测,由一个变量的变化去推测另一个变量的变化.2. 线性回归分析中:(1) 残差平方和越小,预报精确度越高.(2) 相关指数R 2取值越大,说明模型的拟合效果越好.卜娈貳illl 11某运动员训练次数与运动成绩之间的数据关系如下:⑴作出散点图;(2) 求出线性回归方程;(3) 作出残差图,并说明模型的拟合效果;⑷计算R 2,并说明其含义.【解】 ⑴作出该运动员训练次数(X )与成绩(y)之间的散点图,如图所示.— — 8 2(2) 可求得 X = 39.25, y = 40.875,艺x i = 12 656,i — 18 8Z y i 2= 13 731, S X i y i = 13 180, i = 1i = 18 _ _Z X i y i — 8 X yi — 1------------- 〜1.041 5,88 _ _送(X i — X l y i — y )i — 1Ab — -------------------------8 —艺(X i - X 2i — 1Y6050 40 30 20 ]020 40P 2 C一2Z X i —8 Xi — 1A ---- A ----a—y —b X ——0.003 875,A•••线性回归方程为y—1.041 5X— 0.003 875.(3) 作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.(4) 相关指数R9 10—0.985 5.说明了该运动员的成绩的差异有98.55%的可能性是由训练次数引起的.卜例「下表为收集到的一组数据:(1)作出X与y的散点图,并猜测与之间的关系;9 建立X与y的关系,预报回归模型并计算残差;10 利用所得模型,预报x= 40时y的值.【思路探究】(1)画出散点图或进行相关性检验,确定两变量X、y是否线性相关.由散点图得X、y之间的回归模型.(2)进行拟合,预报回归模型,求回归方程.【自主解答】⑴作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y= C1ec2x的周围,其中C1、C2为待定的参数.r350ion250200J501005020 23 34 26 2S 30 取34 36 *(2)对两边取对数把指数关系变为线性关系,令z= In y,则有变换后的样本点应分布在直线z= bx+ a, a= In c i, b= C2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:x21232527293235z 1.946 2.398 3.045 3.178 4.190 4.745 5.784A求得回归直线方程为z= 0.272x—3.849,Z0.272X —3.849••y= e —残差如下表:y i711212466115325z6.44311.10119.12532.95056.770128.381290.325y iz e0.557—0.101 1.875—8.9509.23—13.38134.675 z rr-u 0.272x— 3.849 . zcz⑶当x=40 时,y= e " 1 131.I规律方法I两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y = C1ec2X,我们可以通过对数变换把指数关系变为线性关系,令z= In y,则变换后样本点应该分布在直线z =bx+ a(a= In c i, b = C2)的周围.卜亜貳illl 11根据表中数据,建立与之间的回归方程.【解】由表中测得的数据可以作出散点图,如图.150 .50 . *° 5 10 15 h观察散点图中样本点的分布规律,可以判断样本点分布在某一条曲线附近,表示该曲线的函数模型是Q= m h n(m, n是正的常数).两边取常用对数, 则Ig Q= Ig m+ n Ig h.令y= Ig Q, x= Ig h,那么y= nx+ Ig m,即为线性函数模型y= bx+ a的形式(其中b= n, a= Ig m).由下面的数据表,用最小二乘法可求得b~2.509 7, a = —0.707 7,所以于是所求得的回归方程为Q = 0.196 h'没有理解相关指数R2的意义而致误卜典例关于x与y有如下数据:为了对X、y两个变量进行统计分析,现有以下两种线性模型:甲模型y= 6.5x+ 17.5,乙模型y= 7x+17,试比较哪一个模型拟合的效果更好.V y 2送(y i —yi)i _ 1c _ 155【错解】'•R1 _ 1 —_ 1 —彳CM_ 0.845.5 I 000——2送(y i—y )i _ 1V y 2Z (y i —yi)i_ 12 - ____________________ 180R2_ 1 — - _ 1—1 000_ O.82.P — 2Z (y i—y )i _ 1又••84.5%>82%,二乙选用的模型拟合的效果更好.【错因分析】没有理解R2的意义是致错的根源,用相关指数R2来比较模型的拟合效果,R2越大,模型的拟合效果越好,并不是R2越小拟合效果更好.V y 2 乞(y i—yi)i = 1【防范措施】R2= 1 —--------------- ,R2越大,残差平方和越小,从而回归n —艺(y i- y fi_ 1模型的拟合效果越好.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率,R 2越接近1表示回归的效果越好(因为R 2越接近1,表示解释变量 和预报变量的线性相关性越强).从根本上理解R 2的意义和作用,就可防止此类 错误的出现.Vy 2艺(y i — yi )i =19155R 1= 1—= 1 — 1 000= O.845,P —2 S (y i — y )i - 1(y i - y i )2J 1805= 1-1 000= 0.82,P — 2无(y i — y )i = 184. 5%>82%,所以甲模型拟合效果更好.1.在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据•然后,可以通过残差e i , e 2,-【正解】R 2= 1-e n来判断模型拟合的效果,判断原始数据中是否存在可疑数据. 这方面的分析工作称为残差分析.2.我们还可以用相关指数R2来反映回归的效果,其计算公式是:R2= 1-认-y i)nP — 2送(y i—y )i =1显然,R2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率.1 .已知x和y之间的一组数据则y与x的线性回归方程y=bx+ a必过点(A • (2,2)3 B. (3, 0)C. (1,2)3 D.(2, 4)【解析】匚=和 + 1 + 2 + 3) = 3, 7 = 4(1 + 3+ 5+ 7) = 4,二回归方^=bx+a必过点(2,4).【答案】D2. (2013青岛高二检测)在下列各组量中:①正方体的体积与棱长; ②一块农田的水稻产量与施肥量;③人的身高与年龄;④家庭的支出与收入; ⑤某户家庭的用电量与电价.其中量与量之间的关系是相关关系的是()A .①②B .②④C .③④)D .②③④【解析】①是函数关系V= a3;⑤电价是统一规定的,与用电量有一定的关系,但这种关系是确定的关系.②③④中的两个量之间的关系都是相关关系,因为水稻的产量与施肥量在一定范围内是正比、反比或其他关系,并不确定;人的身高一开始随着年龄的增加而增大,之后则不变化或降低,在身高增大时,也不是均匀增大的;家庭的支出与收入有一定的关系,在一开始,会随着收入的增加而支出也增加,而当收入增大到一定的值后,家庭支出趋向于一个常数值,也不是确定关系.【答案】D3. 下列命题正确的有①在线性回归模型中,e是bx+ a预报真实值y的随机误差,它是一个可观测的量;②残差平方和越小的模型,拟合的效果越好;③用R4 5来刻画回归方程,R2越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,若带状区域宽度越窄,说明拟合精度越高,回归方程的预报精度越高.【解析】对于①随机误差e是一个不可观测的量,③R2越趋于1,拟合效果越好,故①③错误.对于②残差平方和越小,拟合效果越好,同理当残差点比较均匀地落在水平的带状区域时,拟合效果越好,故②④正确.【答案】②④4. 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:4 请画出上表数据的散点图;5 请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;(3) 已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测技改后生产100吨甲产品比技改前少消耗多少吨标准煤.(参考数值:3X 2.5 + 4X 3+ 5X 4+ 6X 4.5= 66.5)【解】(1)如下图.5 4324(2) S x i y i = 3X 2.5 + 4X 3+ 5X 4+ 6X 4.5= 66.5,i - 1— 3+4+5+ 6 — 2.5 + 3+4 + 4.5X = 4= 4.5, y = A= 3.5,4Z x 2= 32 + 42+52+ 62 = 86.i — 1y66.5— 4X 4.5X 3.5 66.5 — 63---------- ;—— — 0.7,b —86 —81 y — y —a — y —b X — 3.5— 0.7X 4.5— 0.35,因此,所求的线性回归方程为y = 0.7X + 0.35.(3)根据回归方程预测,现在生产 100吨产品消耗的标准煤的数量为 0.7X 100+ 0.35 = 70.35(吨),故耗能减少了 90 — 70.35 = 佃.65(吨标准).、选择题1 .在画两个变量的散点图时,下面叙述正确的是 ( )A .预报变量在x 轴上,解释变量在y 轴上286— 4X 4.52 課方知能检测,爭■卜-期自r 半呷;眞-农朋"B .解释变量在X 轴上,预报变量在y 轴上C .可以选择两个变量中任意一个变量在 X 轴上D .可以选择两个变量中任意一个变量在 y 轴上 【解析】 结合线性回归模型y = bx +a + e 可知,解释变量在x 轴上,预报 变量在y 轴上,故选B. 【答案】 B 2. (2013泰安高二检测)在回归分析中,相关指数R 2的值越大,说明残差平 方和()A •越大B .越小C .可能大也可能小D .以上均错nz i = 1【解析】 ••R 2= 1 — ----------- ,二当R 2越大时,V一 2壬(y i — y )i _ 1A 2(y— yi ) nA 2Z (y i —y i )2越小,即残差平方和越小.i —1【答案】 B 3•设变量y 对X 的线性回归方程为 “2 — 2.5X ,则变量x 每增加一个单位时, y 平均( )A .增加2.5个单位B .增加2个单位C .减少2.5个单位D .减少2个单位 【解析】 回归直线的斜率b = — 2.5,表示X 每增加一个单位,y 平均减少 2.5个单位. 【答案】 C4. (2012湖南高考)设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(X , y i )(i = 1,2,…,n ),用最小二乘法建立【答案】 二、填空题6. 在研究身高和体重的关系时,求得相关指数 R 2-“身高解释了 64%的体重变化,而随机误差贡献了剩余的 36%”,所以身高对体重的效应比随机误差的效应大得多.的回归方程为y = 0.85X -85.71,贝U 下列结论中不正确 的是()A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(X , y ) C. 若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg D. 若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg 【解析】 由于线性回归方程中X 的系数为0.85,因此y 与X 具有正的线性 相关关系,故A 正确.又线性回归方程必过样本中心点(X , y ),因此B 正确.由 线性回归方程中系数的意义知,X 每增加1 cm ,其体重约增加0.85 kg ,故C 正确.当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,而不是具体值, 因此D 不正确. 【答案】 D 5.在判断两个变量y 与X 是否相关时,选择了 4个不同的模型,它们的相 关指数R 2分别为:模型1的相关指数R 2为0.98,模型2的相关指数R 2为0.80, 模型3的相关指数R 2为0.50,模型4的相关指数R 2为0.25.其中拟合效果最好的 A .模型1 B .模型2 C .模型3D .模型4【解析】相关指数R 2能够刻画用回归模型拟合数据的效果,相关指数R 2的值越接近于 1,说明回归模型拟合数据的效果越好.,可以叙述为Vy 2 送(y i — yi )i = 1结合相关指数的计算公式 R 2= 1 — 可知,当R 2= 0.64V一 2艺(y i — y )i _ 17. 调查了某地若干户家庭的年收入 x (单位:万元)和年饮食支出y (单位:万 元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y = 0.254X + 0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加 _____________ 元.rA A【解析】 以 X + 1 代 X ,得y = 0.254(x + 1)+ 0.321,与y = 0.254x + 0.321 相 减可得,年饮食支出平均增加 0.254万元.【答案】 0.254&已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是【解析】 由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),A可得 y — 5= 1.23(x — 4),A即 y = 1.23x + 0.08. 【答案】 y _ 1.23x + 0.08 三、解答题9•某省2013年的阅卷现场有一位质检老师随机抽取 5名学生的总成绩和数学成绩(单位:分)如下表所示:(1) 作出散点图;【解析】时,身高解释了64%的体重变化.【答案】 0.64(2) 对x与y作回归分析;(3) 求数学成绩y对总成绩x的回归直线方程;(4) 如果一个学生的总成绩为500分,试预测这个学生的数学成绩. 【解】(1)散点图如图所示:珥-帥70 -60 -504030 -20 -10%恥0 3H0 4(W 420 440 4肿—2 012 —339 2 2(2) X = ~5~,y—5 ,刀i= 1xi—819 794,5 5刀尸1y2= 23 167,刀i=1x i y i = 137 760.•T =错误!错误!)=错误!〜0.989.因此可以认为y与x有很强的线性相关关系.5 ——y刀尸严一5 x y(3) ----------------------------- 回归系数b=—5 = 0.132 452,刀=1x i —5 xA ----------- A ------------a= y —bx = 14.501 315.AT回归方程为丫= 0.132 452( + 14.501 315.⑷当x= 500时,y〜81.即当一个学生的总成绩为500分时,他的数学成绩约为81分.10. (2012福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:__ ________(1) 求回归直线方程y= bx+a,其中b= —20,a= y —b x ;(2)预计在今后的销售中,销量与单价仍然服从⑴中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入—成本)—1【解】⑴由于x = 6(8 + 8.2 + 8.4 + 8.6 + 8.8 + 9) = 8.5, y = 6(90+84+83+80+75 + 68) = 80,又b= —20,--------- --------- ■ , A所以a= y —b x = 80+ 20x 8.5 = 250,从而回归直线方程为y= —20x+ 250.(2)设工厂获得的利润为L元,依题意得L = x(- 20x + 250) —4(-20x+ 250)2=—20x2+ 330x—1 0002=—20(x—8.25) + 361.25.当且仅当x= 8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.11.在关于人的脂肪含量(百分比)和年龄的关系的研究中,研究人员获得了一组数据如下表:作出散点图,并判断与是否线性相关.若线性相关,求线性回归方程;R 2~ 0.941,表明年龄解释了 94.1%的脂肪含量变化.⑶当x = 37时,y = 0.576X 37 — 0.448~ 20.9,故37岁时人的脂肪含量约为 20.9%.(教师用书独具)(2) 求相关指数R 2,并说明其含义; (3) 给出37岁时人的脂肪含量的预测值.【解】(1)散点图如图所示.由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关 系.脂肪含朮丿IJ5 I 马 O 20 40 6080A A A设线性回归方程为y = bx + a ,AA则由计算器算得b ~0.576, a ~ = — 0.448, 所以线性回归方程为y = 0.576X — 0.448.⑵残差平方和:14 Z i = 1y 2 14 y 2e i = 2 (y i — y i ) e 37.78.i =1总偏差平方和:14£ (y i — y)丄12宀R 2=〜 R— ' 644.990.941.敖呻备限资源昼拓啟 W 捕施畝阳;0视曹”为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:⑴作出散点图并求回归方程;2(2)求出R ; (3)进行残差分析.【思路探究】(1)由表作出散点图,求出系数值,即可写出回归方程.(2) 列出残差表,计算R 2,由R 2的值判断拟合效果.⑶由⑵中残差表中数值,进行回归分析. 【自主解答】 (1)散点图如图.x = 6(5+ 10+15+20+25+ 30)= 17.5,y = 11(7.25+ 8.12+ 8.95+ 9.90+ 10.9+ 11.8)〜9.487,6Z x i y i = 1 076.2.i - 1A计算得,b ~0.183, a ~6.285,A所求线性回归方程为y = 6.285+ 0.183X.-4 20 8 4 2u TJ ]6Z x i 2= 2 275, i _ 1⑵列表如下:所以 Z (y — y i )2-0.013 18, Z (y — V)2= 14.678 4.i _ 1i _ 1m, 0.013 18 c ccc所以,R = 1 —14.678 4^0.999 1,归模型;由表中数据可以看出残差点比较均匀地落在不超过 0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高, 由以上分析可知,弹簧长度 与拉力成线性关系.I 规律方法I建立回归模型的基本步骤:(1)确定解释变量和预报变量;(2)画散点图,观察是否存在线性相关关系; (3)确定回归方程的类型,女口 y = bx + a ; (4)按最小二乘法估计回归方程中的参数;(5) 得结果后分析残差图是否异常,若存在异常,则检查数据是否有误,或模型是否合适.假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有关的统计 资料如下表所示.回归模型的拟合效果较好.(3)由残差表中的数值可以看出第 3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误, 如果有的话,需要纠正数据,重新建立回A A A 一 A A(1) 线性回归方程y = bx +a 的回归系数a 、b ;(2) 求相关指数R 2;(3) 估计使用年限为10年时,维修费用是多少?【解】 ⑴由已知数据制成下表.由此可得x = 4, y = 5,5——送(X i — x j(yi — y )i = 1Ab = ------------------- = 1.23,5—Z (X i - x 2i _ 1A ---- A ----a = y —b x = 5 — 1.23X 4= 0.08, A•'讨=1.23x + 0.08.5A 2送(y i —y i)i = 12(2)R = 1— ------------5_艺(y i - y 2i = 1=1—1578"0.958 7.A A(3)回归直线方程为 y = 1.23x + 0.08,当 x = 10(年)时,y = 1.23X 10 + 0.08=若由资料知y 对呈线性相关关系.试求<:12.38(万元),即估计使用10年时维修费用是12.38万元.少年智则国智,少年富则国富,少年强则国强,少年独立则国独立,少年自由则国自由,少年进步则国进步,少年胜于欧洲,则国胜于欧洲,少年雄于地球,则国雄于地球。
人教A版选修1-2教案:1.1回归分析的基本思想及其初步应用(3)(含部分答案)
§1.1 回归分析的基本思想及其初步(三)【学情分析】:教学对象是高二文科学生,学生已经学会建立回归模型的基本步骤,并有检验回归方程的拟合精确度的方法,并能解决一些实际问题。
两个变量不呈线性关系,不能直接利用线性回归方程建立两个变量的关系,通过探究使学生体会对回归模型的选择,非线性模型可以通过变换转化为线性回归模型,让学生直观的观察、思考,借助于线性回归模型研究呈非线性关系的两个变量之间的关系,并通过回归分析体会不同模型拟合数据的效果。
【教学目标】:(1)知识与技能:了解回归模型的选择;进一步理解非线性模型通过变换转化为线性回归模型;体会不同模型拟合数据的效果。
(2)过程与方法:从实例出发,求出相应的回归直线方程,从中也找出存在的不足,从而有进行回归分析的必要性,通过学习相关指数,用相关指数来刻画回归的效果,进而归纳出回归分析的一般步骤,并对具体问题进行回归分析,用于解决实际问题。
(3)情感态度与价值观:任何事物都是相对的,但又有一定的规律性,我们只要从实际出发,不断探求事物的内在联系,就会找出其中的规律性,形成解决实际问题的方法和能力。
【教学重点】:1、加深体会有些非线性模型通过变换可以转化为线性回归模型;2、了解在解决问题的过程中寻找更好的模型的方法。
【教学难点】:1、了解常用函数的图像特点,选择不同的模型建模;2、通过比较相关指数对不同的模型进行比较。
【课前准备】:课件i yi i i y y e ˆˆ-=()22ˆˆy y e -=从相关指数的计算结果来看,指数函数模型的2R 比二次函数模型的2R 更接近于1,所以指数函数模型的回归效果好。
再从残差图看:从图中可看出指数函数模型的残差点比较均匀地落在水平的带状域中,所以指数函数模型拟合精度较二次函数模型的高。
通过学生自己动手计算感受,归纳判断模型拟合效果的方法: ⑴可以通过变换后的散点图观察两个新变量之间是否存在线性回归方程;⑵通过残差分析比较两种模型的拟合效果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.1 回归分析的基本思想及其初步应用学习目标:1.了解随机误差、残差、残差图的概念.(重点)2.会通过分析残差判断线性回归模型的拟合效果.(重点)3.了解常见的非线性回归模型转化为线性回归模型的方法.(难点)[自 主 预 习·探 新 知]1.回归分析的相关概念 (1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. (2)回归直线方程方程^y=^bx +^a是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中^a,^b是待定参数,其最小二乘估计分别为:,b其中=n 1x n i ,=n 1y ni ,(,)称为样本点的中心. (3)线性回归模型样本点散布在某一条直线的附近,而不是在一条直线上,所以不能用一次函数y =bx +a 来描述它们之间的关系,而是用线性回归模型y =bx +a +e 来表示,其中a 和b 为模型的未知参数,e 称为随机误差,自变量x 称为解释变量,因变量y 称为预报变量.思考:在线性回归模型y =bx +a +e 中,e 产生的原因主要有哪几种? [提示]随机误差产生的原因主要有以下几种: (1)所用的确定性函数不恰当引起的误差; (2)忽略了某些因素的影响; (3)存在观测误差.2.残差的概念对于样本点(x 1,y 1),(x 2,y 2),…,(x n ,y n )而言,它们的随机误差为e i =y i -bx i -a ,i =1,2,…,n ,其估计值为^e i =y i -^y i =y i -^b x i -^a,i =1,2,…,n ,^ei 称为相应于点(x i ,y i )的残差.3.刻画回归效果的方式1.思考辨析(1)相关指数R 2越小,线性回归方程的拟合效果越好. ( )(2)在线性回归模型中,e 是bx +a 预报真实值y 的随机误差,它是一个可观测的量.( )(3)线性回归方程^y=^bx +^a必过样本点的中心(,). ( ) [答案] (1)× (2)× (3)√2.甲、乙、丙、丁四位同学在建立变量x ,y 的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R 2分别如下表:A .甲B .乙C .丙D .丁A [相关指数R 2越大,表示回归模型的拟合效果越好.]3.甲、乙、丙、丁4位同学各自对A 、B 两变量做回归分析,分别得到散点图与残差平方和 n(y i -^yi )2如表所示:关系的模型拟合精度高.丁 [根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R 2表达式中 n(y i -)2为确定的数,则残差平方和越小,R 2越大),由回归分析建立的线性回归模型的拟合效果就越好,由试验结果知丁要好些.]4.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系.根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为^y=0.85x -85.71,则下列结论中正确的是________(填序号).(1)y 与x 具有正的线性相关关系; (2)回归直线过样本点的中心(,);(3)若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ;(4)若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg. (1)(2)(3) [回归方程中x 的系数为0.85>0,因此y 与x 具有正的线性相关关系,(1)正确;由回归方程系数的意义可知回归直线过样本点的中心(,),(2)正确; 依据回归方程中^b的含义可知,x 每变化1个单位,^y相应变化约0.85个单位,(3)正确;用回归方程对总体进行估计不能得到肯定结论,故(4)不正确.][合 作 探 究·攻 重 难]求线性回归方程数据:x 6 8 10 12 (2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程^y =^b x +^a ;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.[解] (1)如图:(2)x ni y i =6×2+8×3+10×5+12×6=158,=46+8+10+12=9,=42+3+5+6=4,x n i 2=62+82+102+122=344, ^b =344-4×92158-4×9×4=2014=0.7, ^a =-^b=4-0.7×9=-2.3,故线性回归方程为^y=0.7x -2.3.(3)由(2)中线性回归方程当x =9时,^y=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.[规律方法] 求线性回归方程的基本步骤: 1列出散点图,从直观上分析数据间是否存在线性相关关系. 2计算:3代入公式求出^y=^bx +^a中参数^b,^a的值. 4写出线性回归方程并对实际问题作出估计.提醒:只有在散点图大致呈线性时,求出的回归方程才有实际意义,否则求出的回归方程毫无意义.1.某种产品的广告费用支出x 与销售额y (单元:百万元)之间有如下的对应数据:x /百万元 2 4 5 6 8 y /百万元 3040605070(2)求线性回归方程;(3)试预测广告费用支出为10百万元时的销售额. [解] (1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算:所以,=5=5,=5=50,x i =145,x 5i y i =1 380.于是可得^b =22=145-5×521 380-5×5×50=6.5, ^a =-^b=50-6.5×5=17.5.所以所求的线性回归方程为^y=6.5x +17.5.(3)根据(2)中求得的线性回归方程,当广告费用支出为10百万元时,^y=6.5×10+17.5=82.5(百万元),即广告费用支出为10百万元时,销售额大约为82.5百万元.线性回归分析量的6个物体进行测量,数据如下表所示:x 5 10 15 20 25 30(2)求出R 2; (3)进行残差分析. [解] (1)散点图如图.=61(5+10+15+20+25+30)=17.5,=61(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,x 6i 2=2 275,x 6i y i =1 076.2, 计算得,^b≈0.183,^a≈6.285, 所求回归直线方程为^y=0.183x +6.285. (2)列表如下:所以 (y i -^i )2≈0.013 18, (y i -)2=14.678 4.所以,R 2=1-14.678 40.013 18≈0.999 1,回归模型的拟合效果较好.(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系.2.关于x 与y 有如下数据:有如下的两个线性模型:(1)^=6.5x +17.5;(2)^=7x +17.试比较哪一个拟合效果更好.[解] 由(1)可得y i -^yi 与y i -的关系如下表:∴ (y i -^i )2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155,(y i -)2=(-20)2+(-10)2+102+02+202=1 000.∴R 12=1-5=1-1 000155=0.845.由(2)可得y i -^yi 与y i -的关系如下表:∴ (y i -^i )2=(-1)2+(-5)2+82+(-9)2+(-3)2=180, (y i -)2=(-20)2+(-10)2+102+02+202=1 000. ∴R 22=1-5=1-1 000180=0.82,由于R 12=0.845,R 22=0.82,0.845>0.82,∴R 12>R 22. ∴(1)的拟合效果好于(2)的拟合效果.非线性回归分析1.已知x 和y 之间的一组数据,则下列四个函数中,模拟效果最好的为哪一个?2③y =4x;④y =x 2.提示:观察散点图中样本点的分布规律可判断样本点分布在曲线y =3×2x-1附近.所以模拟效果最好的为①. 2.如何将上题函数变换为线性函数?提示:将y =3×2x -1两边取自然对数得ln y =ln 3+(x -1)ln 2.令x ′=x ,y ′=ln y ,则原方程变为y ′=ln 3+x ′ln 2-ln 2=ln 23+x ′ln 2.这样y ′与x ′成线性函数关系.为了研究某种细菌随时间x 变化,繁殖的个数,收集数据如下: 天数x /天 1 2 3 4 5 6(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图,根据散点图判断:y =a +bx 与y =c 1e c 2x 哪一个作为繁殖的个数y 关于时间x 变化的回归方程类型为最佳?(给出判断即可,不必说明理由)其中z i =ln y i ;=6z i .(2)根据(1)的判断最佳结果及表中的数据,建立y 关于x 的回归方程.参考公式:^b =n ,^a =-^b.思路探究:(1)根据收集数据,可得数据的散点图;(2)由散点图看出样本点分布在一条指数型曲线y =c e bx (c >0)的周围,则ln y =bx +ln c .变换后的样本点分布在一条直线附近,因此可以用线性回归方程来拟合,即可求出y 对x 的回归方程.[解] (1)作出散点图,如图1所示.图1 图2由散点图看出样本点分布在一条指数函数y =c 1e c 2x 的周围,于是选择y =c 1e c 2x .(2)令z =ln y ,则z =bx +a .z 1.79 2.48 3.22 3.89 4.55 5.25相应的散点图如图2.从图2可以看出,变换后的样本点分布在一条直线附近,因此可以用线性回归方程来拟合.由^b=6≈0.69,^a =-^b=1.115,得z =0.69x +1.115; 则有^y=e 0.69x +1.115.母题探究:1.(变结论)在本例条件不变的情况下,试估计第7天细菌繁殖个数.[解] ∵^y=e 0.69x +1.115, ∴当x =7时,^y≈382(个)即第7天细菌繁殖个数约为382个. 2.(变结论)计算相关指数. [解] 残差计算如下表: 天数 1 2 3 4 5 6 残差0.080.12-0.83-0.821.061.52即解释变量“天数”对预报变量“繁殖细菌个数”解释了99.98%. [规律方法] 解决非线性回归问题的方法及步骤 1确定变量:确定解释变量为x ,预报变量为y ; 2画散点图:通过观察散点图并与学过的函数幂、指数、对数函数、二次函数作比较,选取拟合效果好的函数模型;5写出非线性回归方程.1.下表是x和y之间的一组数据,则y关于x的线性回归方程必过点( )x 123 4y 1357C.(2.5,4) D.(2.5,5)C [线性回归方程必过样本点的中心(,),即(2.5,4),故选C.]2.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是( )A BC DA[用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.] 3.若一组观测值(x1,y1),(x2,y2),…,(x n,y n)之间满足y i=bx i+a+e i(i =1,2,…,n),且e i恒为0,则R2为________.1 [∵e i恒为0,∴样本点(x1,y1),(x2,y2),…,(x n,y n)均落在直线y=bx +a 上,∴变量x ,y 成函数关系,即R 2=1.]4.已知回归方程^y=2x +1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和等于________.0.03 [(4.9-5)2+(7.1-7)2+(9.1-9)2=0.03.] 5.已知x ,y 之间的一组数据如下表:(1)分别计算:、、x 1y 1+x 2y 2+x 3y 3+x 4y 4、x 1+x 2+x 3+x 4;(2)已知变量x 与y 线性相关,求出回归方程.[解] (1)=40+1+2+3=1.5,=41+3+5+7=4,x 1y 1+x 2y 2+x 3y 3+x 4y 4=0×1+1×3+2×5+3×7=34,x 12+x 22+x 32+x 42=02+12+22+32=14. (2)^b =14-4×1.5234-4×1.5×4=2, ^a =-^b=4-2×1.5=1, 故^y=2x +1.。