《1.2回归分析》教学案3
1.1.2回归分析的基本思想及其初步应用 教案
第 1 页 1.1.2 回归分析的根本思想及其初步应用教学要求:通过典型案例的探究 ,进一步了解回归分析的根本思想、方法及初步应用. 教学重点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学难点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学过程:一、复习准备:1.由例1知 ,预报变量〔体重〕的值受解释变量〔身高〕或随机误差的影响.2.为了刻画预报变量〔体重〕的变化在多大程度上与解释变量〔身高〕有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 二、讲授新课:1. 教学总偏差平方和、残差平方和、回归平方和:〔1〕总偏差平方和:所有单个样本值与样本均值差的平方和 ,即21()n i i SST y y ==-∑.残差平方和:回归值与样本值差的平方和 ,即21()ni i i SSE y y ==-∑.回归平方和:相应回归值与样本均值差的平方和 ,即21()ni i SSR y y ==-∑.〔2〕学习要领:①注意i y 、i y 、y 的区别;②预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和 ,即222111()()()n n ni i i i i i i y y y y y y ===-=-+-∑∑∑;③当总偏差平方和相对固定时 ,残差平方和越小 ,那么回归平方和越大 ,此时模型的拟合效果越好;④对于多个不同的模型 ,我们还可以引入相关指数22121()1()n i i i ni i y y R y y ==-=--∑∑来刻画回归的效果 ,它表示解释变量对预报变量变化的奉献率. 2R 的值越大 ,说明残差平方和越小 ,也就是说模型拟合的效果越好.2. 教学例题:例2 关于x 与Y 有如下数据:x 2 4 5 6 8 y 30 40 60 5070为了对x 、Y 两个变量进行统计分析 ,现有以下两种线性模型:6.517.5y x =+ ,717y x =+ ,试比拟哪一个模型拟合的效果更好.分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和 ,也可分别求出两种模型下的相关指数 ,然后再进行比拟 ,从而得出结论.。
高中数学(1.2回归分析的基本思想及其初步应用)学案 新人教B版选修1 2 学案
1.2 回归分析的基本思想及其初步应用知★识★梳★理 1.线性回归模型(1)函数关系是一种关系,而相关关系是一种关系.(2)回归分析是对具有关系的两个变量进行统计分析的一种常用方法.(3)对于一组具有线性相关关系的数据),(11y x ,),(22y x ,…,),(n n y x ,回归直线的斜率和截距的最小二乘估计公式分别为=bˆ,=a ˆ,称为样本点的中心. (4)线性回归模型e a bx y ++=,其中a 和b 为模型的未知参数,e 称为,在统计中,自变量x 称为,因变量y 称为. 2.残差的概念对于样本点),(,),,(),,(2211n n y x y x y x ⋅⋅⋅而言,它们的随机误差为i e =,i =1,2,…,n ,其估计值为=i eˆ=,i =1,2,…,,n i e ˆ称为相应于点),(i i y x 的残差.★★★基础达标★★★1.下列两个变量之间的关系是相关关系的是( ).A .速度一定时,位移与时间B .单位面积的产量为常数时,土地面积与总产量C .身高与体重D .电压一定时,电流与电阻2.[2014·某某卷] 已知变量x 与y 正相关,且由观测数据算得样本平均数5.3,3==y x ,则由该观测数据算得的线性回归方程可能是( )A .3.24.0ˆ+=x yB .4.22ˆ-=x yC .5.92ˆ+-=x yD .4.43.0ˆ+-=x y),(,),,(),,(2211n n y x y x y x ⋅⋅⋅是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是 ( ).A .直线l 过点),(y xB .x 和y 的相关系数为直线l 的斜率C .x 和y 的相关系数在0到1之间D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同4.在一组样本数据),(,),,(),,(2211n n y x y x y x ⋅⋅⋅ (21,,2x x n ≥,…,n x 不全相等)的散点图中,若所有样本点),,2,1)(,(n i y x i i ⋅⋅⋅=都在直线121+=x y 上,则这组样本数据的样本相关系数为 ( ).A .-1B .0C .21D .1 5.[2014·某某一模] 设某大学的女生体重)(kg y 与身高)(cm x 具有线性相关关系,根据一组样本数据),,2,1)(,(n i y x i i ⋅⋅⋅=,用最小二乘法建立的线性回归方程为71.8585.0ˆ-=x y,给出下列结论:①y 与x 具有正的线性相关关系;②回归直线过样本点的中心),(y x ;③若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ; ④若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg. 其中,正确结论的序号是______________.6.(2014·某某重点中学联考)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程9.5467.0ˆ+=x y. 零件数x (个) 10 203040 50 加工时间y (min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为________.7.(2014·某某模拟)为了均衡教育资源,加大对偏远地区的教育投入,调查了某地若干户家庭的年收入x (单位:万元)和年教育支出y (单位:万元),调查显示年收入x 与年教育支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:2.015.0ˆ+=x y.由回归直线方程可知,家庭年收入每增加1万元,年教育支出平均增加________万元.8.四名同学根据各自的样本数据研究变量,x y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且 2.347 6.423y x =-; ②y 与x 负相关且 3.476 5.648y x =-+; ③y 与x 正相关且 5.4378.493y x =+; ④y 与x 正相关且 4.326 4.578y x =--. 其中一定不正确...的结论的序号是.9.(2012·某某)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价(1)求回归直线方程a bx y+=ˆ,其中x b y a b -=-=,20; (2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)10.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入i x (单位:千元)与月储蓄i y (单位:千元)的数据资料,算得10180ii x==∑,10120i i y ==∑,101184i i i x y ==∑,1021720i i x ==∑.(Ⅰ)求家庭的月储蓄y 对月收入x 的线性回归方程a x b yˆˆˆ+=; (Ⅱ)判断变量x 与y 之间是正相关还是负相关;(Ⅲ)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程a x b yˆˆˆ+=中,∑∑==--=n i i ni ii xn x yx n yx b 1221ˆ,x b y aˆˆ-=,★★★能力提升★★★11.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为93.7319.7+=∧x y ,用这个模型预测这孩子10岁时的身高,则正确的叙述是( )A 、身高一定是B 、身高在以上C 、身高在以下D 、身高在左右12.若施肥量x (kg )之间的回归直线方程为x y4250ˆ+=,当施肥量为50kg 时,预计小麦产量为.13.若一组观测值),(,),,(),,(2211n n y x y x y x ⋅⋅⋅之间满足i i i e a bx y ++=),,2,1(n i ⋅⋅⋅=,且i e 恒为0,则2R 为.14.关于x 与y 有以下数据:已知x 与y 线性相关,由最小二乘法得5.6=b, (1)求y 关于x 的线性回归方程.(2)现有第二个线性模型:177ˆ+=x y,且相关指数82.02=R ,若与(1)的线性模型比较,哪一个线性模型拟合效果比较好?请说明理由.1.1 回归分析的基本思想及其初步应用答案 知★识★梳★理1.(1)确定性;非确定性(2)相关(3)∑∑==---ni ini iix x y yx x 121)())((x by ˆ-),(y x (4)随机误差 解释变量 预报变量2.a bx y i i --i i y y ˆ-a x b y ii ˆˆ-- 3.∑∑==---ni in i i i y yy y 1212)()ˆ(1 1★★★基础达标★★★1.C 解析:A 、B 、D 中两个变量间的关系都是确定的,所以是函数关系;C 中的两个变量间是相关关系,对于身高一样的人,体重仍可以不同,故选C.2.A 解析:因为变量x 与y 正相关,则在线性回归方程中,x 的系数应大于零,排除B ,D ;将5.3,3==y x 分别代入A ,B 中的方程只有A 满足,故选A.3.A 解析:由样本的中心(y x ,)落在回归直线上可知A 正确;x 和y 的相关系数表示为x 与y 之间的线性相关程度,不表示直线l 的斜率,故B 错;x 和y 的相关系数应在-1到1之间,故C 错;分布在回归直线两侧的样本点的个数并不绝对平均,即无论样本点个数是奇数还是偶数,故D 错.4.D 解析:所有点均在直线上,则样本相关系数最大即为1,故选D. 5.①②③6.68 解析:由已知可计算求出30=x ,而回归直线方程必过点),(y x ,则759.543067.0=+⨯=y ,设模糊数字为a ,则75589817562=++++a ,计算得68=a . 7.0.15 解析:回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增加0.15万元.8.①④ 解析:y 与x 正相关,回归直线,直线斜率大于0,y 与x 负相关,回归直线系数小于0. 9.解析:(1)由于5.8)(61654321=+++++=x x x x x x x ,80)(61654321=+++++=y y y y y y y ,所以2505.82080=⨯+=-=x b y a ,从而回归直线方程为25020ˆ+-=x y. (2)设工厂获得的利润为L 元,依题意得)25020(4)25020(+--+-=x x x L25.361)433(2010003302022+--=-+-=x x x . 当且仅当25.8=x 时,L 取得最大值. 故当单价定为8.25元时,工厂可获得最大利润.10.解析:(I )由题意知10=n ,8108011===∑=n i i x n x ,∑====n i i y n y 1210201, 808107202212=⨯-=-∑=x n xni i, 2428101841=⨯⨯-=-∑=y x n y x ni i .由此作3.08024==b ,4.083.02-=⨯-=-=x b y a , 故所求回归方程为4.03.0-=x y .(II )由于变量y 的值随x 的值增加而增加03.0>=b ,故x 与y 之间是正相关. (III )将7=x 代入回归方程可以预测该家庭的月储蓄为7.14.073.0=-⨯=y . ★★★能力提升★★★11.D 解析:10=x 时,83.145=y ,它是一个估测值,故选D.12.450kg 解析:250ˆ=y+4×50=450.13.1 解析:i i yy ˆ=故101)()ˆ(112122=-=---=∑∑==n i ini i iy yyyR . 14.解析:(1)依题意设y 关于x 的线性回归方程为a x yˆ5.6ˆ+=, 5)86542(51=++++=x , 50)7050604030(51=++++=y ,∵a x yˆ5.6ˆ+=经过样本点的中心),(y x ,∴a ˆ55.650+⨯=,∴5.17ˆ=a , ∴y 与x 的线性回归方程为5.175.6ˆ+=x y. (2)由(1)的线性模型得y y ˆ-与y y -的关系如下表: 所以∑==+-++-+-=-12222221555.0)5.6(10)5.3()5.0()ˆ(i i iyy. ∑==+++-+-=-51222222100020010)10()20()(i iy y.所以.845.010001551)()ˆ(151251221=-=---=∑∑==i ii i iy yyyR 由于845.021=R ,82.02=R 知221R R >,所以(1)的线性模型拟合效果比较好.。
苏教版选修(1-2)1.2《回归分析》word学案
1.2回归分析BCA案主备人:史玉亮审核人:吴秉政使用时间:2012.2.6 学习目标:1.通过对典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用。
2.结合具体的实际问题,了解非线性回归问题的解决思路。
3.通过回归分析的学习,提高对现代计算技术与统计方法的应用意识。
B案一、基础整合1.召与回归系数b?的计算方法b?= _______________________ ,a?= ________________________ 。
2.样本相关系数(1)对于变量x与y随机抽取到的n对数据(x1,y1),(x2,y2),……,(x n,y n),检验统计量是样本相关系数r= ______________________________________________(2)_____________________________________________________________ r具有以下性质:r w 1,并且r越接近1,线性相关程度___________________________________ ;r越接近0,线性相关程度_______________________ 。
(3)检验的步骤如下:①作统计假设:x与y不具有_____________________ 关系。
②根据 __________ 与______________ 在附表中查出r的一个临界值r0.05。
③根据 ____________________ 计算公式算出r的值。
④作统计推断。
如果r| > “a,表明有____________ 的把握认为x与y之间具有线性相关关系;如果|r w r o.05,我们没有理由拒绝__________ 。
这时寻找回归直线方程是毫无意义的。
二、预习检测1.下列两变量具有相关关系的是( )A.正方体的体积与棱长B.匀速行驶的车辆的行驶距离与时间C.人的身高与体重D.人的身高与视力2.下列两变量是线性相关的是( )A.如果变量X与Y之间存在着线性相关关系,则我们根据试验数据得到的点(X i, yj(i =1,2,3,...,n)将散布在某一条直线附近B.如果两个变量X与Y之间不存在线性关系,那么根据试验数据不能写出一个线性方程C.设x、y是具有线性相关关系的两个变量,且回归直线方程是(•召,则b?叫回归系数D.为使求出的回归直线方程有意义,可用统计假设检验的方法判断变量X与Y之间是否存在线性相关关系4.在一次试验中,测得(x, y)的四组值分别是A(1,2), B(2,3),C(3,4), D(4,5),则y 与x之间的回归直线方程为()A. y?=x1B. ?=x 2C. ? = 2x1D. y? = x-1C案合作探究1.回归直线方程的适用范围是什么?2.建立回归直线方程的一般步骤是什么?3.由回归直线方程得到的变量的值是真实值吗?例某工厂月份某种产品的产量与成本的统计数据见下表。
《回归分析》教学大纲
回归分析RegressionAna1ysis一、课程基本信息课程编号:111093适用专业:统计学专业课程性质:专业必修开课单位:数学与数据科学学院学时:48(理论学时40;实验学时8)学分:3考核方式:考试(平时成绩占30%+考试成绩70%)中文简介:回归分析是应用统计学中一个重要的分支,在自然科学、管理科学和社会经济等领域应用十分广泛。
《回归分析》课程是统计学专业的学科专业必修课是学生掌握统计学的基本思想、理论和方法的主要课程,是培养学生熟练应用计算机软件处理统计数据的能力的基础课程。
通过本课程的学习,使学生掌握应用统计的一些基本理论与方法,初步掌握利用回归分析解决实际问题的能力。
二、教学目的与要求本课程的主要目的是学生在学习后,能够系统掌握回归分析的理论与方法,并在此基础上,掌握回归分析应用的艺术技巧,并利用其分析认识实际问题。
本课程注重回归分析的基本理论与方法,同时通过案例教学与实际应用来剖析回归分析的理论与方法所蕴含的统计思想及其应用艺术。
教学中在回归分析理论与方法的基础上结合社会、经济、自然学科学领域的研究实例,把回归分析方法与实际应用结合起来,注重定性分析与定量分析的紧密结合,强调每种方法的优缺点和实际运用中应注意的问题,研究与实践中应用回归分析的经验和体会融入其中,使学生充分体会到回归分析的应用艺术,并提高解决问题的能力。
通过本课程的学习,在理论教学过程中,可以结合国内外回归分析相关学者的研究经历和成果,传播科学研究所需要的实事求是、脚踏实地的精神,培养学生的科学素养。
在实践教学中,利用案例分析、软件仿真等方式培养学生的实践能力和创新思维,激发学生主动研究新问题和设计新方法的兴趣,让学生在实践中深刻体会科学研究的乐趣,也可以鼓励有突出能力的学生通过创新创业或成果转化为社会发展贡献年轻的力量。
三、教学方法与手段1.教学方法:课堂讲授中要重点对基本概念、基本方法和解题思路的讲解;采用启发式教学,培养学生思考问题、分析问题和解决问题的能力;引导和鼓励学生通过实践和自学获取知识,培养学生的自学能力和创新能力。
《回归分析课程教案》课件
《回归分析课程教案》课件第一章:引言1.1 课程目标让学生了解回归分析的基本概念和应用领域。
让学生掌握回归分析的基本原理和方法。
培养学生应用回归分析解决实际问题的能力。
1.2 教学内容回归分析的定义和分类回归分析的应用领域回归分析的基本原理和方法1.3 教学方法讲授法:讲解回归分析的基本概念和原理。
案例分析法:分析实际案例,让学生了解回归分析的应用。
1.4 教学资源课件:介绍回归分析的基本概念和原理。
案例:提供实际案例,让学生进行分析。
1.5 教学评估课堂讨论:学生参与课堂讨论,回答问题。
第二章:一元线性回归分析2.1 教学目标让学生了解一元线性回归分析的基本概念和原理。
让学生掌握一元线性回归模型的建立和估计方法。
培养学生应用一元线性回归分析解决实际问题的能力。
2.2 教学内容一元线性回归分析的定义和特点一元线性回归模型的建立和估计方法一元线性回归模型的检验和预测2.3 教学方法讲授法:讲解一元线性回归分析的基本概念和原理。
数据分析法:分析实际数据,让学生了解一元线性回归模型的建立和估计方法。
2.4 教学资源课件:介绍一元线性回归分析的基本概念和原理。
数据分析软件:用于一元线性回归模型的建立和估计。
2.5 教学评估课堂练习:学生进行课堂练习,应用一元线性回归分析解决实际问题。
第三章:多元线性回归分析3.1 教学目标让学生了解多元线性回归分析的基本概念和原理。
让学生掌握多元线性回归模型的建立和估计方法。
培养学生应用多元线性回归分析解决实际问题的能力。
3.2 教学内容多元线性回归分析的定义和特点多元线性回归模型的建立和估计方法多元线性回归模型的检验和预测3.3 教学方法讲授法:讲解多元线性回归分析的基本概念和原理。
数据分析法:分析实际数据,让学生了解多元线性回归模型的建立和估计方法。
3.4 教学资源课件:介绍多元线性回归分析的基本概念和原理。
数据分析软件:用于多元线性回归模型的建立和估计。
3.5 教学评估课堂练习:学生进行课堂练习,应用多元线性回归分析解决实际问题。
《1.2回归分析》导学案2.doc
《1.2回归分析》导学案学习目标1.了解回归分析的基本思想和方法2.培养学生观察分析计算的能力学习重难点学习重点:回归方程y = bx +a学习难点:£、方公式的推到学习过程一、预习内容:1.对于一组具有线性相关关系的数据31, 乂 ),(工2, W,(羽,% ),…,3",义)•其回归直线方程的截距和斜率的最小二乘法估计公式:a='方=2- x= ,V =3.样本点的中心4.§ = 0.849x-85.712对于b = 0.849是斜率的估计值,说明身高x每增加1个单位,体重就,表明体重与身高具有的线性相关关系.5.如何描述线性相关关系的强弱?'守支("舟V 1=1 1=1(1)r〉0表明两个变量正相关;(2)广〈0表明两个变量负相关;(3)r的绝对值越接近1,表明相关性越强,7■的绝对值越接近0,表明相关性越弱;(4)当7■的绝对值大于0. 75认为两个变量具有很强的相关性关系.二、思考1、如何使Q(a,8)值最小,通过观察分析式子进行试探推导^(x,.-x)(v;.-V)_ _结论”=------ =——a=y-/3xi=l2、如何描述线性相关关系的强弱?i=l、但光-寸支(力-yfV i=l i=l三、典型例题分析:(l)y与x的回归直线方程为§ = 0.733"0.6948(2)当水深为1.95m时,可以预测水的流速约为2. 12mA四、当堂练习1 •对两个变量y和x进行回归分析,得到一组样本数据:31,>1),32,力),(>3,,3),,“,3",乂)・则下列说法不正确的是( )A.由样本数据得到的回归方程y^bx + a必过样本中心(x,y)&残差平方和越小的模型,拟合的效果越好C.用相关指数来刻画回归效果,R2越小,说明模型的拟合效果越好D.若变量y与x之间的相关系数r = -0.9362 ,则变量y与x之间具有线性相关关系2.已知某地每单位面积菜地年平均使用氮肥量X信与每单位面积蔬菜年平均产量W之间161125 —15x10-__1515每单位面积蔬菜的年平均产量.(已知X = 1O1,/1O.11,〉>: =161,=16076.8)i=li=l解:设所求的回归直线方程为§ = Zw + 0,则15 ____16°76・8「15X 101X 10.11 =。
人教新课标版数学高一-学案 1.2 回归分析
1.2 回归分析1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.1.什么叫回归分析?答 回归分析是对具有相关关系的两个变量进行统计分析的一种方法. 2.回归分析中,利用回归直线方程求出的函数值一定是真实值吗?答 不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食、是否喜欢运动等.1.回归直线方程在回归直线方程y ^=a ^+b ^x 中,b ^=i =1n (x i -x )(y i -y )i =1n (x i -x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .其中x =1n ∑i =1n x i ,y =1n ∑i =1ny i ,(x ,y )称为样本点的中心,回归直线过样本点的中心. 2.相关系数对于变量x 与y 随机抽到的n 对数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),检测统计量是样本相关系数r =i =1n (x i -x )(y i -y )i =1n (x i -x )2i =1n (y i -y )2=∑i =1nx i y i -n x y(∑i =1nx 2i -n x 2)(∑i =1ny2i -n y 2)相关系数r 的取值范围是[-1,1],|r |越接近1,变量之间的线性相关程度越高,|r |越接近0,线性相关程度越弱,当|r |>r 0.05时,有95%的把握认为两个变量之间有线性相关关系. 3.非线性回归分析回归曲线方程也可以线性化(1)将幂函数型函数y =ax n (a 为常数,a ,x ,y 均取正值)化为线性函数:将y =ax n 两边取常用对数,则有lg y =n lg x +lg a ,令μ=lg y ,v =lg x ,b =lg a ,代入上式得μ=n v +b (其中n 、b 是常数),其图象是一条直线.(2)将指数型函数y =ca x (a >0,c >0,a ,c 为常数)化为线性函数;将y =ca x 两边取常用对数,则有lg y =x lg a +lg c ,令μ=lg y ,b =lg c ,d =lg a ,代入上式得μ=dx +b (d ,b 是常数),它的图象是一条直线.要点一 求回归直线方程例1 某班5名学生的数学和物理成绩如下表:(1)画出散点图;(2)求物理成绩y 对数学成绩x 的回归直线方程; (3)一名学生的数学成绩是96,试预测他的物理成绩. 解 (1)散点图如图.(2)x =15×(88+76+73+66+63)=73.2,y =15×(78+65+71+64+61)=67.8.∑i =15x i y i =88×78+76×65+73×71+66×64+63×61=25054.∑i =15x 2i =882+762+732+662+632=27174.所以b ^=∑i =15x i y i -5x y∑i =15x 2i -5x2=25054-5×73.2×67.827174-5×73.22≈0.625.a ^=y -b ^x ≈67.8-0.625×73.2=22.05. 所以y 对x 的回归直线方程是y ^=0.625x +22.05. (3)x =96,则y ^=0.625×96+22.05≈82, 即可以预测他的物理成绩是82.规律方法 (1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析. (2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.跟踪演练1 某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:(1)请画出上表数据的散点图((2)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归直线方程y ^=b ^x +a ^; (3)试根据求出的回归直线方程,预测记忆力为9的同学的判断力.解 (1)如图:(2)∑ni =1x i y i =6×2+8×3+10×5+12×6=158, x =6+8+10+124=9,y =2+3+5+64=4,∑ni =1x 2i =62+82+102+122=344, b ^=158-4×9×4344-4×92=1420=0.7,a ^=y -b ^x =4-0.7×9=-2.3, 故回归直线方程为y ^=0.7x -2.3.(3)由②中回归直线方程当x =9时,y ^=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.要点二 相关性检验例2 下面的数据是从年龄在40到60岁的男子中随机抽出的6个样本,分别测定了心脏的功能水平y (满分100)以及每天花在看电视上的平均时间x (小时).(1)(2)求心脏的功能水平y 与每天花在看电视上的平均时间x 的回归直线方程,并讨论方程是否有意义;(3)估计平均每天看电视3小时的男子的心脏的功能水平. 解 n =6,x =16(4.4+4.6+…+4.6)≈3.7167,y =16(52+53+…+65)≈64.1667,∑i =16x 2i -6(x )2=(4.42+4.62+…+4.62)-6×3.71672≈19.7668,∑i =16y 2i -6(y )2=(522+532+…+652)-6×64.16672≈964.8077,∑i =16x i y i -6x y =(4.4×52+4.6×53+…+4.6×65)-6×3.7167×64.1667≈-124.6302.(1)心脏的功能水平y 与每天花在看电视上的平均时间x 之间的相关系数r =∑i =16x i y i -6x y(∑i =16x 2i -6(x )2)(∑i =16y 2i -6(y )2)≈-124.630219.7668×964.8077≈-0.9025.(2)b ^=∑i =16x i y i -6x y∑i =16x 2i -6(x )2≈-124.630219.7668≈-6.3050,a ^=y -b ^x ≈64.1667+6.3050×3.7167≈87.6005,所以心脏的功能水平y 与每天花在看电视上的平均时间x 的回归直线方程为y ^=-6.3050x +87.6005.查表n -2=4,r 0.05=0.811,因为|r |≈0.9025>0.811,所以有95%以上的把握认为y 与x 之间有线性关系,这个方程是有意义的.(3)将x =3代入回归直线方程y ^=-6.3050x +87.6005可得y ^≈69(分).因此估计平均每天看电视3小时的男子的心脏的功能水平为69分.规律方法 解决这一类问题时,首先应对问题进行必要的相关性检验,如果不作相关性检验,我们仍然可以求出x 与y 的回归直线方程,但不知道这时的回归直线方程是否有意义,也就不知道能否反映变量x 与y 之间的变化规律,只有在x 与y 之间具有相关关系时,求得的回归直线方程才有意义.跟踪演练2 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y 来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x (g/L)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.(2)求回归直线方程;(3)求相关系数r ,并进行相关性检验. 解 (1)(2)列表:x =1687=24,y =202.947,b ^=∑i =17x i y i -7x y∑i =17x 2i -7(x )2=4900.16-7×24×202.9474144-7×242=0.2643,a ^=y -b ^x =202.947-0.2643×24≈22.648,∴回归直线方程为y ^=22.648+0.2643x . (3)∑i =17y 2i =5892,r =∑i =17x i y i -7x y(∑i =17x 2i -7(x )2)(∑i =17y 2i -7(y )2)=4900.16-7×24×202.947(4144-7×242)×(5892-7×(202.947)2)=0.96.计算得r =0.96>r 0.05=0.754.说明甲醛浓度与缩醛化度两个变量之间有较强的线性相关关系. 要点三 非线性回归模型例3 某地区不同身高的未成年男性的体重平均值如下表:解 根据上表中数据画出散点图如图所示.由图看出,样本点分布在某条指数型函数曲线y =c 12e c x的周围,于是令z =ln y .由计算器计算可得下表,由表中数据可得z 与x 之间的回归直线方程: z ^=0.693+0.020x ,则有y ^=e 0.693+0.020x .规律方法 根据已有的函数知识,可以发现样本分布在某一条指数型函数曲线y =c 12e c x的周围,其中c 1和c 2是待定参数;可以通过对x 进行对数变换,转化为线性相关关系. 跟踪演练3 某种书每册的成本费Y (元)与印刷册数x (千册)有关,经统计得到数据如下:检验每册书的成本费Y 与印刷册数的倒数1x之间是否具有线性相关关系?若有,求出Y 对x的回归方程;若无,说明理由.解 设μ=1x ,则Y 与μ的数据关系如下表所示:0.05=0.632.从而有95%的把握认为这两个变量具有线性相关关系,从而求Y 与μ的回归直线方程有意义.又b ^=Σ10i =1μi y i -10μy Σ10i =1μ2i -10μ2=15.20878-10×0.2248×3.141.413014-10×0.22482≈8.98, a ^=y -b ^μ=3.14-8.98×0.2248=1.12,所以y 关于μ的回归直线方程为y ^=1.12+8.98μ,Y 与x 的回归方程为y ^=1.12+8.98x.1.下列各组变量之间具有线性相关关系的是( ) A.出租车费与行驶的里程 B.学习成绩与学生身高 C.身高与体重 D.铁的体积与质量 答案 C2.若劳动生产率x (千元)与月工资y (元)之间的回归直线方程为y ^=50+80x ,则下列判断正确的是( )A.劳动生产率为1000元时,月工资为130元B.劳动生产率提高1000元时,月工资平均提高80元C.劳动生产率提高1000元时,月工资平均提高130元D.月工资为210元时,劳动生产率为2000元 答案 B3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归直线方程可能是( ) A.y ^=-10x +200 B.y ^=10x +200 C.y ^=-10x -200D.y ^=10x -200答案 A解析 由于销售量y 与销售价格x 成负相关,故排除B.D.又当x =10时,A 中y =100,而C 中y =-300,C 不符合实际情况,故选A.4.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:(1)求年推销金额y (2)若第6名推销员的工作年限为11年,试估计他的年推销金额. 解 (1)设所求的回归直线方程为y ^=b ^x +a ^,则b ^=i =15(x i -x )(y i -y )i =15(x i -x )2=1020=0.5, a ^=y -b ^x =0.4.所以年推销金额y 关于工作年限x 的回归直线方程为y ^=0.5x +0.4. (2)当x =11时,y ^=0.5x +0.4=0.5×11+0.4=5.9(万元). 所以可以估计第6名推销员的年推销金额为5.9万元.回归分析的基本思路:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);(3)由经验确定回归方程的类型(如果呈线性关系,则选用回归直线方程y ^=b ^x +a ^); (4)按一定规则估计回归方程中的参数.。
数学1.2《回归分析》教案(新人教B版选修1-2)
1.2回归分析教学目标:通过对典型案例的探究,了解回归的基本思想、方法及其初步应用。
教学重点:通过对典型案例的探究,了解回归的基本思想、方法及其初步应用。
教学过程一、变量的相关关系中最为简单的是线性相关关系,设随机变量与变量之间存在线性相关关系,则由试验数据得到的点(,)将散布在某一直线周围,因此,可以认为关于的回归函数的类型为线性函数,即,下面用最小二乘法估计参数、b,设服从正态分布,分别求对、b的偏导数,并令它们等于零,得方程组解得其中,且为观测值的样本方差.线性方程称为关于的线性回归方程,称为回归系数,对应的直线称为回归直线.顺便指出,将来还需用到,其中为观测值的样本方差.二、现在讨论线性相关的显著性检验中最简便、最常用的一种方法,即相关系数的显著性检验法.我们早在前面的学习中知道,变量与的相关系数是表示与之间线性相关关系的一个数字特征,因此,要检验随机变量与变量之间的线性相关关系是否显著,自然想到考察相关系数的大小,若相关系数的绝对值很小,则表明与之间的线性相关关系不显著,或者它们之间根本不存在线性相关关系;当且仅当相关系数的绝对值接近1时,才表明与之间的线性相关关系显著,这时求关于的线性回归方程才有意义.在相关系数未知的情况下,可用样本相关系数r作为相关系数的估计值,参照相关系数的定义,并用样本均值与样本方差分别作为数学期望与方差的估计值,定义与的样本相关系数如下:因此,根据试验数据(,),得到的值后可进一步算出样本相关系数r的值. 若使用的是具有线性回归计算功能的电子计算器时,把所有试验数据(,)逐对存入计算器中,则可直接算出r的值.由于样本相关系数r是相关系数的估计值,所以,r的绝对值越接近1,与之间的线性相关关系越显著. 当r>0时,称与正相关;当r<0时,称与负相关. 而当r的绝对值接近0时,则可认为与之间不存在线性相关关系.三、例1.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得数据如下(单位:kg)1x2)检验相关系数r 的显著性水平:r=∑∑∑===---7171222271)7)(7(7i i i i i ii y y x x yx yx =)3.39971132725)(3077000(3.3993078717522⨯-⨯-⨯⨯-≈0.9733,在“相关系数检验的临界值表”查出与显著性水平0.05及自由度7-2=5相应的相关数临界值r 0 05=0.754<0.9733,这说明水稻产量与施化肥量之间存在线性相关关系.3)设回归直线方程a bx y +=ˆ,利用⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑==xb y a x x y x y x b i i i i i 71227177计算a ,b , 得b=75.430770005.399307871752≈⨯-⨯⨯- a=399.3-4.75×30≈257,则回归直线方程25775.4ˆ+=x yx例2.一个工厂在某年里每月产品的总成本y (万元)与该月产量x (万件)之间由如下一组数据:归直线方程.x2)r=∑∑∑===---1211212222121)12)(12(12i i i i i ii y y x x yx yx=18.534.1754.243120.997891-⨯⨯=在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关数临界值r 0 05=0.576<0.997891, 这说明每月产品的总成本y (万元)与该月产量x (万件)之间存在线性相关关系.3)设回归直线方程a bx y+=ˆ, 利用⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑==xb y a x x y x y x b i i i i i 121221211212,计算a ,b ,得b ≈1.215, a=x b y -≈0.974,∴回归直线方程为:974.0215.1ˆ+=x y课堂小节:本节课学习了回归的基本思想、方法及其初步应用 课堂练习:略课后作业:第7页习题A:1,2,3,4,5。
人教版高中数学高二选修1-2第一章《回归分析的基本思想及其初步应用》教案3
第三课时1.1回归分析的基本思想及其初步应用(三)教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法.教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较. 教学过程:一、复习准备:1. 给出例3:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间的回归方程./y 个 (学生描述步骤,教师演示)2. 讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系. 二、讲授新课:1. 探究非线性回归方程的确定:① 如果散点图中的点分布在一个直线状带形区域,可以选线性回归模型来建模;如果散点图中的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模.② 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y =2C 1e x C 的周围(其中12,c c 是待定的参数),故可用指数函数模型来拟合这两个变量.③ 在上式两边取对数,得21ln ln y c x c =+,再令ln z y =,则21ln z c x c =+,而z 与x 间的观察z 与x 的散点图,可以发现变换后样本点分布在一条直线的附近,因此可以用线性回归方程来拟合.④ 利用计算器算得 3.843,0.272a b =-=,z 与x 间的线性回归方程为0.272 3.843z x =-,因此红铃虫的产卵数对温度的非线性回归方程为0.272 3.843x y e-=.⑤ 利用回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行.其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题.2. 小结:用回归方程探究非线性回归问题的方法、步骤. 三、巩固练习:(1ˆy=e x .)(2)试求出预报变量对解释变量的回归方程.(答案:所求非线性回归方程为0.69 1.112。
教学设计3:1.2回归分析
回归分析的基本思想及其初步应用【教学目标】:(1)知识与技能:了解求线形回归方程的两个计算公式的推导过程,、回归平方和;了解随机误差产生的原因;了解判断刻画模型拟合效果的方法——相关指数和残差分析;了解非线性模型通过变换转化为线性回归模型。
(2)过程与方法:本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线方程,从中也找出存在的不足,从而有进行回归分析的必要性,进而学习相关指数,用相关指数来刻画回归的效果。
(3)情感态度与价值观:从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求知欲,培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进取。
【教学重点】:1.了解判断刻画模型拟合效果的方法——相关指数和残差分析;2.通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型。
【教学难点】:1.了解随机误差产生的原因,用残差平方和衡量回归方程的预报精度;2.了解判断刻画模型拟合效果的方法——相关指数和残差分析。
【教学过程设计】:器)解答过程如下:令1ln c a =,2c b =,即bx a z +=分析x 与z 之间的关系,通过画散点图(如下图),可知x 与z 之间是存在着线性回归关系,可以用最小二乘法求出线性回归方程bx a z +=列表计算出各个量 编号 1 2 3 4 5 6 7 合计 温度x /°C 212325 27 29 32 35 192 产卵数y /个 711 21 24 66 115 325 569 z =ln y1.9462.3983.045 3.1784.190 4.7455.78425.285 x i 2 441529625729841 1024 1225 5414 x i z i40.9 55.2 76.1 85.8121.5151.8202.4733.7=x 27.429 =z 3.612∑==ni i x 125414∑==ni y i y x 1733.71272.043.277541461.343.2777.733ˆ22121=⨯-⨯⨯-=--=∑∑==x n xzx n zx bni ini ii843.3ˆˆ-=⋅-=x b z a843.3272.0ˆ-=x z问题七:我们的目标是建立红铃虫的产卵数y 与温度x 的模型,如何使得到的线性回归模型再变回红铃虫的产卵数y 与温度x 的模型?师:提出问题。
探究式导学案6:1.2回归分析
回归分析的基本思想及其初步应用【学习目标】1. 通过对典型案例的探究进一步了解回归分析的基本思想,方法及初步应用2. 体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法.【自主学习】1.回忆建立回归模型的基本步骤?2.观察图1-1.5中的散点图,红铃虫的产卵数y 与温度x 具有线性关系吗?除线性关系外,还学过哪些常见的函数关系?3. 能否把模型x c e c y 21=经过变换转化为另外两个变量的线性关系?4.例2的两个模型,哪个能更好地刻画红铃虫的产卵数y 与温度x 的关系?为什么?【自主检测】1.已知回归直线方程0.500.81y x =-,则当25x =时,y 的估计值为________2. 线性回归方程y bx a =+必经过点_____________3. 对于变量y 与x 的n 组统计数据进行拟合的回归模型中,若21()n i i yy =-∑=100,相关指数2R 为0.7,则其残差平方和为_______【典型例题】例 一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间的回归方程.C /y 个【课堂检测】1. 下列结论正确的是( )①函数关系是一种确定性关系; ②相关关系是一种非确定性关系③回归分析是对具有函数关系的两个变量进行统计分析的一种方法④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
A. ①②B. ①②③C. ①②④D. ①②③④2.下列说法正确的有( )①回归方程适用于一切样本和总体。
②回归方程一般都有时间性。
③样本取值的范围会影响回归方程的适用范围。
④回归方程得到的预报值是预报变量的精确值。
A .① ②B . ①③④C .①②③D . ②③3.某考察团对全国10个大城市职工人均工资x 与居民消费y 进行统计调查,y 与x 具有相关关系,回归方程为:0.66 1.562y x =+,若某城市居民人均消费7.675,估计该城市消费额占人均工资收入的百分比约为:( )A. 66﹪B.72.3﹪C.67.3﹪D.83﹪4. 2R 越接近1,则模型的拟合效果越___________.【总结提升】1. 非线性回归模型可以转化为线性回归模型;2.模型只能用来近似产生样本数据的真实模型;建模追求的目标是建立效果最好的(在已知模型的范围内)或更好(比已知的模型)模型.。
《3.1.2回归分析的基本思想及其初步应用》教学案
《3.1.2回归分析的基本思想及其初步应用》教学案【教学目标】1. 了解相关系数r ;2. 了解随机误差;3. 会简单应用残差分析【教学重难点】教学重点:相关系数和随机误差教学难点:残差分析应用.【教学过程】一、设置情境,引入课题上节例题中,身高172cm 女大学生,体重一定是60kg 吗?如果不是,其原因是什么?二、引导探究,发现问题,解决问题1 $0.84985.712y x =-对于0.849b=$是斜率的估计值,说明身高x 每增加1个单位,体重就 ,表明体重与身高具有 的线性相关关系. 2 如何描述线性相关关系的强弱?()()ni ix x y y r --=∑ (1)r >0表明两个变量正相关;(2)r <0表明两个变量负相关;(3)r 的绝对值越接近1,表明相关性越强,r 的绝对值越接近0,表明相关性越弱.(4)当r 的绝对值大于0.75认为两个变量具有很强的相关性关系.3 身高172cm 的女大学生显然不一定体重是60.316kg ,但一般可以认为她的体重接近于60.316kg .①样本点与回归直线的关系②所有的样本点不共线,而是散布在某一条直线的附近,该直线表示身高与体重的关系的线性回归模型表示y bx a ε=++e 是y 与$y bx a =+的误差,e 为随机变量,e 称为随机误差.③E (e )=0,D (e )= 2σ>0.④D (e )越小,预报真实值y 的精度越高.⑤随机误差是引起预报值$y 与真实值y 之间的误差之一.⑥$,a b $为截距和斜率的估计值,与a ,b 的真实值之间存在误差,这种误差也引起$y 与真实值y 之间的误差之一.4 思考产生随机误差项e 的原因是什么?5 探究在线性回归模型中,e 是用$y 预报真实值y 的误差,它是一个不可观测的量,那么应该怎样研究随机误差?如何衡量预报的精度?①2()D e σ=来衡量随机误差的大小.②µi i i e y y =- ③µµ$i i i i i e y y y bx a =-=--$ ④µ$22111(,)(2)22n i e Q a b n n n σ===>--∑$$ ⑤$(,)Q a b $称为残差平方和,µ2σ越小,预报精度越高. 6 思考当样本容量为1或2时,残差平方和是多少?用这样的样本建立的线性回归方程的预报误差为0吗?7 残差分析①判断原始数据中是否存在可疑数据;②残差图 ③相关指数µ22121()1()n i i i n ii y y R y y ==-=--∑∑ ④R 2越大,残差平方和越小,拟合效果越好;R 2越接近1,表明回归的效果越好. 8 建立回归模型的基本步骤:①确定研究对象,明确哪个变量时解释变量,哪个变量时预报变量.②画出确定好的解释变量和预报变量得散点图,观察它们之间的关系;③由经验确定回归方程的类型;④按一定规则估计回归方程中的参数;⑤得出结果后分析残差图是否异常.三、典型例题例1 下表是某年美国旧轿车价格的调查资料,今以x 表示轿车的使用年数,y 表示响应的年均价格,求y 关于x 的回归方程减,但不在一条直线附近,但据此认为y 与x 之间具有线性回归关系是不科学的,要根据图的形状进行合理转化,转化成线性关系的变量间的关系.解:作出散点图如下图可以发现,各点并不是基本处于一条直线附近,因此,y 与x 之间应是非线性相关关系.与已学函数图像比较,用$µµbx a y e +=来刻画题中模型更为合理,令$ln z y =$,则$z bx a =+$$, 题中数据变成如下表所示:拟合,由表中数据可得0.996,0.75r r ≈->,认为x 与z 之间具有线性相关关系,由表中数据的$0.298,8.165,b a ≈-≈$所以0.2988.165z x =-+$,最后回代$ln z y =$,即$0.2988.165x y e -+=四、当堂练习:1 两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合效果最好的模型是( )A 模型1的20.98R =B 模型2的20.80R =C 模型3的20.50R =D 模型4的20.25R =答案 A五、课堂小结1 相关系数r 和相关指数R 22 残差分析y。
教学设计5:1.2回归分析
师:我提供5组身高与体重的数据,请同学们画散点图,并用函数计算器求线性回归Байду номын сангаас程.
编号
1
2
3
4
5
身高/cm
165
165
157
170
175
体重/kg
49
58
51
53
65
学生做完后教师用Excel展示散点图和所求回归方程.
(函数计算器的使用方法见后附说明)
【教学重点】随机误差e的认识
【教学难点】随机误差的来源和对预报变量的影响
【教学方法】启发式教学法
【教学手段】多媒体辅助教学
【教学流程】
【教学过程设计】
教学过程
双边活动
设计说明
备注
教师活动
学生活动
创设情境:
2007年5月,中共中央国务院关于加强青少年体育、增强青少年体质的意见指出城市超重和肥胖青少年的比例明显增加.“身高标准体重”该指标对于学生形成正确的身体形态观具有非常直观的教育作用.
(5)单击“完成”按钮.
注:也可以直接使用我们提供的文件来给学生演示,相对节约课堂时间.
3、学生使用函数计算器求回归方程的过程如下:
(学生还会使用更先进的计算器)
4、课堂使用的数据如下
编号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
身高/cm
165
153
157
170
152
153
157
168
154
162
高中数学选修1-2教案3:1.1 回归分析的基本思想及其初步应用(二) (2)教学设计
回归分析的基本思想及其初步应用【教学目标】:(1)知识与技能:了解回归模型的选择;进一步理解非线性模型通过变换转化为线性回归模型;体会不同模型拟合数据的效果。
(2)过程与方法:从实例出发,求出相应的回归直线方程,从中也找出存在的不足,从而有进行回归分析的必要性,通过学习相关指数,用相关指数来刻画回归的效果,进而归纳出回归分析的一般步骤,并对具体问题进行回归分析,用于解决实际问题。
(3)情感态度与价值观:任何事物都是相对的,但又有一定的规律性,我们只要从实际出发,不断探求事物的内在联系,就会找出其中的规律性,形成解决实际问题的方法和能力。
【教学重点】:1.加深体会有些非线性模型通过变换可以转化为线性回归模型;2.了解在解决问题的过程中寻找更好的模型的方法。
【教学难点】:1.了解常用函数的图像特点,选择不同的模型建模;2.通过比较相关指数对不同的模型进行比较。
教学过程问题导学一、求线性回归方程活动与探究1某工厂1~8月份某种产品的产量与成本的统计数据见下表:以产量为x,成本为y.(1)画出散点图;(2)y与x是否具有线性相关关系?若有,求出其回归方程.迁移与应用1.(2013海南海口模拟)在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的回归直线方程为()A.=x+1 B.=x+2C.=2x+1 D.=x-12.某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x(x取整数)元与日销售量y台之间有如下关系:(1)y与x是否具有线性相关关系?如果具有线性相关关系,求出回归直线方程.(方程的斜率精确到个位)(2)设经营此商品的日销售利润为P元,根据(1)写出P关于x的函数关系式,并预测当销售单价x为多少元时,才能获得最大日销售利润.(1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.(2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.二、线性回归分析活动与探究2某运动员训练次数与运动成绩之间的数据关系如下:(1)作出散点图;(2)求出线性回归方程;(3)作出残差图,并说明模型的拟合效果;(4)计算R2,并说明其含义.迁移与应用1.某产品的广告费用x与销售额y的统计数据如下表:根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为()A.63.6万元B.65.5万元C.67.7万元D.72.0万元2.在一段时间内,某种商品的价格x(元)和需求量y(件)之间的一组数据为:且知x与y具有线性相关关系,求出y对x的回归直线方程,并说明拟合效果的好坏.“相关指数R2、残差图”在回归分析中的作用:(1)相关指数R2是用来刻画回归效果的,由R2=1-可知R2越大,意味着残差平方和越小,也就是说模型的拟合效果就越好.(2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预报精度越高.三、非线性回归分析活动与探究3下表为收集到的一组数据:(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x=40时y的值.迁移与应用1.在彩色显影中,由经验知形成染料光学密度y与析出银的光学密度x由公式y=e b xA(b<0)表示,现测得试验数据如下:则y对x的回归方程是__________.2.在一次抽样调查中测得样本的5个样本点,数值如下表:试建立y与x之间的回归方程.非线性回归问题有时并不给出经验公式,这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决.[答案] 课前·预习导学 【预习导引】1.(1)确定性 非确定性 (2)相关 (3) =1221ni ii n i i x ynx yx nx==--∑∑ -样本点的中心 (4)随机误差 解释变量 预报变量 预习交流1 D2.y i -bx i -a y i -i y i -x i -3.1- 解释变量 预报变量 1预习交流2 提示:散点图可以说明变量间有无线性相关关系,只能粗略地说明两个变量之间关系的密切程度,而相关指数R 2能精确地描述两个变量之间的密切程度.预习交流3 提示:(1)回归方程只适用于所研究的样本的总体. (2)所建立的回归方程一般都有时间性. (3)样本的取值范围会影响回归方程的适用范围.(4)不能期望回归方程得到的预报值就是预报变量的精确值.事实上,它是预报变量的可能取值的平均值.课堂·合作探究 【问题导学】活动与探究1 思路分析:画出散点图,观察图形的形状得x 与y 是否具有线性相关关系.把数值代入回归系数公式求回归方程.解:(1)由表画出散点图,如图所示.(2)从上图可看出,这些点基本上散布在一条直线附近,可以认为x 和y 线性相关关系显著,下面求其回归方程,首先列出下表.=6.85,=157.25.∴=81822188i ii ii x yx yxx ==--∑∑=≈22.17, =-=157.25-22.17×6.85≈5.39,故线性回归方程为=22.17x +5.39. 迁移与应用 1.A [解析]方法一:==,==.故===1,=-=-=1.因此,=x+1,故选A.方法二:也可由回归直线方程一定过点(,),即,代入验证可排除B,C,D.故应选A.2.[解析](1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.设回归直线为=x+,由题知=42.5,=34,则求得==≈-3.=-=34-(-3)×42.5=161.5.∴=-3x+161.5.(2)依题意有P=(-3x+161. 5)(x-30)=-3x2+251.5x-4 845=-32+-4 845.∴当x=≈42时,P有最大值,约为426.即预测销售单价为42元时,能获得最大日销售利润.活动与探究2思路分析:先画出散点图,确定是否具有线性相关关系,求出回归方程,再求出残差,确定模型的拟合的效果和R2的含义.[解析](1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.(2) =39.25,=40.875,=12 656,=13 731,y i=13 180,i∴==≈1.041 5,=-=-0.003 875,∴线性回归方程为=1.041 5x-0.003 875.(3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.(4)计算得相关指数R2≈0.985 5,说明了该运动员的成绩的差异有98.55%是由训练次数引起的.迁移与应用1.B[解析]∵=-=-9.4×=9.1,∴回归方程为=9.4x +9.1.令x =6,得=9.4×6+9.1=65.5(万元). 2.[解析]=×(14+16+18+20+22)=18,=×(12+10+7+5+3)=7.4,521ii x=∑=142+162+182+202+222=1 660,521ii y=∑=122+102+72+52+32=327,i y i =14×12+16×10+18×7+20×5+22×3=620,∴=51522155i ii ii x yx y xx ==--∑∑===-1.15.∴=7.4+1.15×18=28.1,∴回归直线方程为=-1.15x +28.1. 列出残差表为:∴(y i -i )2=0.3, (y i -)2=53.2,R 2=1-≈0.994.故R 2≈0.994说明拟合效果较好.活动与探究3 思路分析:先由数值表作出散点图,然后根据散点的形状模拟出近似函数,进而转化为线性函数,由数值表求出回归函数.[解析](1)作出散点图如图,从散点图可以看出x 与y 不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线21e c x y c =的周围,其中c 1,c 2为待定的参数.(2)对两边取对数把指数关系变为线性关系,令z =ln y ,则有变换后的样本点应分布在直线z =bx +a ,a =ln c 1,b =c 2的周围,这样就可以利用线性回归模型来建立y 与x 之间的非线性回归方程了,数据可以转化为:求得回归直线方程为=0.272x -3.849,∴=e 0.272x -3.849.残差(3)当x =40时,y =e 0.272x -3.849≈1 131.迁移与应用 1.$0.151.73e xy -= [解析]由题给的经验公式y =e b x A ,两边取自然对数,便得ln y =ln A +.与线性回归直线方程相对照,只要取u =,v =ln y ,a =ln A ,就有v =a +bu ,这是v 对u 的线性回归方程.对此我们已经掌握了一套相关性检验,求a 与回归系数b 的方法.题目所给数据经变量置换u =,v =ln y 变成如下表所示的数据:|r |≈0.998>0.75,故v与u之间具有很强的线性相关关系,求回归直线方程是有意义的.由表中数据可得≈-0.15,≈0.55,即=0.55-0.15u.把u与v换回原来的变量x与y,即u=,v=ln y,故ln =0.55-,即=0.150.55e x-=e0.550.15e x-≈0.151.73e x-.这就是y对x的回归曲线方程.2.[解析]画出散点图如图所示.根据散点图可知y与x近似地呈反比例函数关系,设y=,令t=,则y=kt,原数据变为:由置换后的数值表作散点图如下:由散点图可以看出y与t呈近似的线性相关关系.列表如下:所以=1.55,=7.2.所以=≈4.134 4,=-≈0.8.所以=4.134 4t+0.8.所以y与x的回归方程是=+0.8.当堂检测1.(2012湖南高考,理4)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为$y =0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg[答案]D[解析]D选项中,若该大学某女生身高为170 cm,则可断定其体重约为0.85×170-85.71=58.79(kg).故D不正确.3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y对x的线性回归方程为()A.y=x-1 B.y=x+1C .y =88+12xD .y =176[答案]C[解析]法一:由线性回归直线方程过样本中心(176,176),排除A ,B[答案],结合选项可得C 为正确[答案].法二:将表中的五组数值分别代入选项验证,可知y =88+12x最适合.3.在两个变量y 与x 的回归模型中,分别选择了4个不同的模型.通过计算得R 2的值如下,其中拟合效果最好的模型是( )A .模型1的R 2为0.98B .模型2的R 2为0.80C .模型3的R 2为0.50D .模型4的R 2为0.25 [答案]A[解析]R 2越接近于1,则该模型的拟合效果就越好,精度越高.4.若对于变量y 与x 的10组统计数据的回归模型中,R 2=0.95,又知残差平方和为120.53,那么101i =∑(y i -y )2的值为______.[答案]2 410.6[解析]依题意有0.95=1-1021120.53()ii y y =-∑,所以1021()ii yy =-∑=2 410.6.4. 假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)有如下的统计数据.若由此资料可知y 对x 呈线性相关关系,试求: (1)回归直线方程;[解析]由题表中数据列成下表:于是51522215112.35451.2390545i ii ii x y x ybxx ==--⨯⨯===-⨯-∑∑$,$a=y -bx $=5-1.23×4=0.08, 所以回归直线方程为$y=bx $+$a =1.23x +0.08.(2)估计使用年限为10年时,维修费用为多少? [答案]当x =10时,$y=1.23×10+0.08=12.38(万元),估计使用10年时的维修费用为12.38万元. 课堂小结:(学生总结) 板书设计:(略) 教后记:。
1、2回归分析的基本思想及其初步应用
1、2回归分析的基本思想及其初步应用。
(第1课时)教学目标:通过典型案例,掌握回归分析的基本步骤。
教学重点:熟练掌握回归分析的步骤。
教学难点:求回归系数 a , b教学方法:讲练。
教学过程:一、复习引入:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
二、新课:1、回归分析的基本步骤:(1) 画出两个变量的散点图。
(2) 求回归直线方程。
(3) 用回归直线方程进行预报。
2、举例:例1、题(略) 。
解:(1) 作散点图,由于问题是根据身高预报体重,因此要求身高与体重的回归直线方程,取身高为自变量x 。
体重为因变量 y ,作散点图(如图)(2)列表求 ,ˆ0.849ˆ85.712x yba≈≈-回归直线方程 y=0.849x-85.712对于身高172cm 女大学生,由回归方程可以预报体重为y=0.849*172-85.712=60.316(kg) 预测身高为172cm 的女大学生的体重为约60。
316kg问题:身高为172cm 的女大学生的体重一定是60。
316kg 吗?(留下一节课学习) 例2:(提示后做练习、作业)研究某灌溉渠道水的流速y 与水深x 之间的关系,测得一组数据如下:水深xm1.40 1.50 1.60 1.70 1.80 1.902.00 2.10 流速1.70 1.79 1.88 1.952.03 2.10 2.16 2.21ym/s(1)求y对x的回归直线方程;(2)预测水深为1。
95m 时水的流速是多少?解:(略)三、小结四、作业:例2、预习。
第一章统计案例1-2回归分析的基本思想及其初步应用(第二课时)教学目标:1、会建立回归模型,进而学习相关指数(相关系数r 、总偏差平方和、随机误差的效应即残差、残差平方和、回归平方和、相关指数R2、残差分析)2、会求上述的相关指数:3、从实际问题发现已有知识不足,激发好奇心、求知欲。
培养勇于求知的良好个性品质。
教学重点;各相关指数、建立回归模型的步骤。
高中数学新人教版B版精品教案《人教版B高中数学选修1-2 1.2 回归分析》
1.2.3《回归分析》(教学设计)一、教材分析教材的地位和作用:回归分析是高中阶段较难的一个内容,它属于统计学部分。
在教学中,抓住统计学的基本思想“用样本数据估计总体的数据”,让学生知道统计学知识的这个共性;展现概率统计学的应用功能——“分析统计出来的数据为决策提供依据”;让学生体会学以致用。
在《数学③(必修)》之后,学生已经学习了两个变量之间的相关关系,包括画散点图,版选修1-2第一章第二节进一步通过具体案例介绍回归分析的基本思想及其初步应用从线性相关性检验探索数据是否符合线性相关关系,引入非线性相关关系,正确选择回归模型,以及建立回归模型的基本步骤。
教学目标根据大纲要求,考虑到学生的接受能力和课容量,确定了本次课的教学目标:知识和技能:知道最小二乘法的思想,利用散点图分析两个变量是否存在相关关系,利用合适的回归模型求回归方程.会用相关系数r,进行线性相关性检验过程与方法:经历数据处理全过程,培养对数据的直观感觉,体会统计方法的应用。
通过一次函数模型和线性回归模型的比较,使学生体会函数思想。
情感、态度与价值观:通过案例分析,了解回归分析的实际应用,感受数学“源于生活,用于生活”,提高学习兴趣二、教学重点和难点1、根据《课程标准》,我将本节课的教学重点确立为:重点:1、了解回归模型与函数模型的区别2、了解任何模型只能近似描述实际问题难点:会用相关系数r,进行线性相关性检验2 教学重、难点的突破方法本节课主要采用“问题探究法”引导课堂内容层层推进,力求每个问题与前后知识都紧密联系、承上启下,确保整节课内容主干清晰、逻辑严密。
每个问题都有完整的“发现问题分析问题解决问题”过程。
而且在问题探究的过程中,采用归纳类比法,比如由“线性回归方程”提出“非线性回归方程”,以及“在什么情形是选择非线性回归模型分析两变量关系?”问题的提出都是“举一反三”。
切实提高学生自主探究问题和归纳推理能力,让学生在能力提高之余体会到成功的喜悦感和成就感,从而增强数学学习兴趣。
高中数学选修1-2《回归分析的基本思想及其初步应用》教案
高中数学选修1-2《回归分析的基本思想及其初步应用》教案教学目标:1.了解回归分析的基本概念和方法,学会使用回归分析方法对一些实际问题作出预测和分析。
2.能够正确理解和使用回归分析的基本统计量,包括相关系数、判定系数和残差等。
3.能够理解和描述回归分析的假设条件和前提条件,掌握回归分析的模型建立过程,并能正确应用到实际问题中。
教学重点:1.回归分析的基本概念和方法。
2.回归分析的统计量及其含义。
3.回归分析的模型建立过程。
教学难点:1.应用回归分析方法对实际问题进行预测和分析。
2.掌握回归分析模型的建立方法。
教学方法:1.讲授法2.实例分析法3.互动式教学法教学内容:第一节回归分析的基本概念和方法1.回归分析的概念和意义。
2.回归分析的基本模型和方程式。
3.单变量和多变量回归分析的区别和应用。
4.回归分析的基本假设条件和前提条件。
第二节回归分析的统计量及其含义1.相关系数的概念和计算方法。
2.判定系数的定义和计算方法。
3.残差的概念和含义。
4.其他相关统计量的应用。
第三节回归分析的模型建立过程1.数据的收集和清理。
2.变量的筛选和筛选标准。
3.模型的构建和检验。
4.模型的应用和预测。
教学方式:1.讲授。
通过讲解回归分析的概念、方法、统计量和模型建立过程等内容,让学生了解回归分析的基本概念和方法,为后续的案例分析打下基础。
2.案例分析。
通过实例分析法,将回归分析的理论知识与实际问题相结合,并引导学生从实际问题中理解和掌握回归分析的方法和应用。
3.互动式教学。
引导学生在互动交流中,理解和掌握回归分析的基本概念和方法,加深对回归分析的理解和认识。
教学评估:教师根据学生在课堂上的表现和课下的练习情况,对学生进行综合评价。
主要考核内容包括:学生对回归分析的概念和方法的理解程度、学生对回归分析应用的掌握情况、学生对回归分析的模型建立和检验能力、学生的综合分析和判断能力等。
据此评价学生的成绩,并作出相应的教学反思和改进。
高中数学回归分析的基本思想及其初步应用教案3 新人教A版选修1-2
第一课时 1.1回归分析的基本思想及其初步应用(一)(共4课时)教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析.教学难点:解释残差变量的含义,了解偏差平方和分解的思想. 教学过程: 一、复习准备:1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报. 二、讲授新课: 1. 教学例题:① 例1 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:生的体重. (分析思路→教师演示→学生整理)第一步:作散点图第二步:求回归方程第三步:代值计算②提问:身高为172cm的女大学生的体重一定是60.316kg吗?不一定,但一般可以认为她的体重在60.316kg左右.③解释线性回归模型与一次函数的不同事实上,观察上述散点图,我们可以发现女大学生的体重y和身高x之间的关系并不能用一=+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身次函数y bx a高和体重的关系). 在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61kg,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e=++,其(即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e中残差变量e中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.3. 小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《1.2回归分析》教学案
教学要求:
通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.
教学重点:
了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和
残差分析.
教学难点:
解释残差变量的含义,了解偏差平方和分解的思想.
教学过程:
一、复习准备:
1.提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学
生吗?这两者之间是否有关?
2.复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系.回归分析是对
具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→
求回归直线方程→利用方程进行预报.
二、讲授新课:
1.教学例题:
①例1从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:
学生的体重.(分析思路→教师演示→学生整理)
第一步:作散点图
第二步:求回归方程
第三步:代值计算
②提问:身高为172cm的女大学生的体重一定是60.316kg吗?
不一定,但一般可以认为她的体重在60.316kg左右.
③解释线性回归模型与一次函数的不同
事实上,观察上述散点图,我们可以发现女大学生的体重y和身高x之间的关系并不能=+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画用一次函数y bx a
身高和体重的关系).在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61k
g,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3名女在学生的体重应相同.这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e(即残差变
=++,其中残差变量e中量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e
包含体重不能由身高的线性函数解释的所有部分.当残差变量恒等于0时,线性回归模型就变成一次函数模型.因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.
2.相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.
3.小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.。