河北省二十冶综合学校高考数学总复习 回归分析的基本思想及其初步应用学案
高中数学《回归分析的基本思想及其初步应用》教案2 新人教A版选修1-2
回归分析的基本思想及其初步应用(第三课时)(第四课时)一、目标:1、使学生会根据观测数据的特点来选择回归模型2、使学生通过探究体会到有些非线性模型通过变换可以转化为线性回归模型。
3、初步体会不同模型拟合数据的效果。
二、教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。
三、教学基本流程:回忆建立模型的基本步骤①例2 问题背景分析画散点图。
②观察散点图,分析解释变量与预报变量更可能是什么函数关系。
③学生讨论后建立自己的模型④引导学生探究如果不是线性回归模型如何估计参数。
能否利用回归模型通过探究体会有些不是线性的模型通过变换可以转化为线性模型⑤对数据进行变换后,对数据(新)建立线性模型⑥转化为原来的变量模型,并通过计算相关指数比较几个不同模型的拟合效果⑦总结建模的思想。
鼓励学生大胆创新。
⑧布置课后作业:习题1.1 1、附例2的解答过程:解:依题意,把温度作为解释变量x ,产卵个数y作为预报变量 , 作散点图,由观察知两个变量不呈线性相关关系。
但样本点分布在某一条指数函数 y=c1e c2 x周围.令 z=lny , a=lnc1 , b=c2则 z=bx+a此时可用线性回归来拟合 z=0.272x-3.843因此红铃虫的产卵数对温度的非线性回归方程为Y=e0.272x-3.8431、1回归分析的基本思想及其初步应用(习题课)(第五课时)目标:通过习题巩固所学知识过程:1、复习有关知识2、典型例题:例1:某班5名学生的数学和化学成绩如下表所示,对x与y进行回归分析,并预报某学生数学成绩为75分时,他的化学成绩。
A B C D E数学x 88 76 73 66 63 化学y 78 65 71 64 61解略。
例2:某医院用光电比色计检验尿汞时,得尿汞含量 (mg/l) 与消光系数的结果如下:(1)求回归方程。
数学《回归分析的基本思想及其初步应用》教案(新人教A版2)高二(最新编写)
y)2
。
( 2)学习要领: ①注意 yi 、 μyi 、 y 的区别;②预报变量的变化程度可以分解为由解释变量引
起的变化程度与残差变量的变化程度之和,即
n
n
n
(yi y)2
( yi μyi )2
( μyi y)2 ;③当总偏
i1
i1
i1
差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;④
(B) y 平均增加 2 个单位
(C) y 平均减少 2.5 个单位
(D) y 平均减少 2 个单位
3.已知 x 与 y 之间的一组数据:
x
0
1
2
3
y
1
3
5
7
则 y 与 x 的线性回归方程为 y=bx+a 必过(
)
(A) (2,2)点 (B) (1.5,0)点 (C)(1,2)点 (D) (1.5,4)点平方和、回归平方和:
( 1)总偏差平方和 :所有单个样本值与样本均值差的平方和,即 SST
n
残差平方和: 回归值与样本值差的平方和,即 SSE ( yi μyi ) 2
i1
。
n
( yi
i1
y) 2
。
回归平方和: 相应回归值与样本均值差的平方和,即
SSR
n
(μyi
1. 提问:“名师出高徒” 这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?
这两者之间是否有关?
2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系。回归分析是对具有
相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据
作散点图 求回归
高中数学_回归分析的基本思想及其初步应用教学设计学情分析教材分析课后反思
教学设计一、教学目标【知识与技能】了解线性回归模型与函数模型的区别;正确理解回归方程的预报结果;能从残差分析和相关指数2R的角度分析回归模型的拟合效果。
【过程与方法】在对典型案例探究过程中,学会借助计算机中的Excel软件处理数据及作图,充分经历“做数学”的过程。
【情感、态度与价值观】通过对典型案例的探究,进一步体会回归分析的基本思想,了解回归分析的实际应用,感受数学“源于生活,用于生活”,提高学习兴趣。
经历数据处理的全过程,培养对数据的直观感觉,养成科学严谨、认真仔细的学习态度,同时也不断增强应用现代化技术手段处理数据的能力。
二、教学重、难点【重点】了解回归模型和函数模型的区别;了解模型拟合效果的分析工具——残差分析和相关指数2R。
【难点】解释、分析残差变量;理解2R的含义.三、教学过程(一)知识链接1、两个变量间的关系分为:__________、__________、_________.2、如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的_________,那么这两个变量之间的关系叫做相关关系.3、回归分析的步骤:①_______________②_______________③______________4、求回归直线方程:____________________(其中ˆˆ,ab 是待定参数) 由最小二乘法公式得:5、回归直线方程恒过点__________________.【设计意图】课前通过智慧课堂平台给学生分享一个微视频,并要求结合微视频完成学案上的知识链接。
课上,学生对照课件自主订正。
目的是通过有效的复习回顾,为本节课的学习打下坚实的基础。
(二) 情境引入1、观看一段新闻报道——广东省紫金县多人感染丙肝事件.2、从高二9、10班的所有女生中随机选取8名,其身高和体重数据如下表:160cm 的女生的体重.1122211()()ˆ,()ˆ_________________________n ni i i i i i n ni i i i x x y y x y nx y b x x x nx a ====⎧---⎪==⎪⎨--⎪⎪=⎩∑∑∑∑【设计意图】短视频的链接是为了引入课题,同时也能有效的激发学生的好奇心和求知欲,调动学生的学习热情。
高中数学_回归分析的基本思想及其初步应用教学设计学情分析教材分析课后反思
设计思路:1、首先让学生明确本节课的学习目标,重点与难点。
2、通过复习必修三回归直线方程的知识,引出本节内容——回归分析的基本思想及其初步应用。
3、通过问题引导,在学生充分讨论、思考下给出结论,加深对回归分析的基本思想的理解,并能将其应用到实际问题中。
教学设计 :教学目标:(1)能求出简单实际问题的线性回归方程(2) 通过实例引入线性回归模型,感受产生随机误差的原因(3)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法(4)让学生经历数据处理,回归分析的过程,培养学生对数据的直观感和统计方法处理问题的基本思想教学重难点:(1)残差变量的解释(2) 回归分析的基本思想、方法及其应用. 情感、态度与价值观:通过案例分析,了解回归分析的实际应用,感受数学“源于生活,用于生活” ,提高学习兴趣一、复习:双基再现1.下列选项中,两个变量具有相关关系的是( )A .人的身高与体重B .匀速行驶车辆的行驶路程与时间C .正方形的面积与周长D .人的身高与视力源学科网]2.由一组样本数据11(,)x y ,22(,)x y ,,(,)n n x y 得到回归直线方程ˆybx a =+,那么下列说法中不正确的是( )A .直线ˆybx a =+必经过点(,)x y B .直线ˆy bx a =+至少经过点11(,)x y ,22(,)x y ,,(,)n n x y 中的一个点C .直线ˆybx a =+的斜率为1221ni ii nii x y nx yXnx ==-⋅-∑∑ D .直线ˆybx a =+的纵截距为y bx - 3. 某种产品的广告费支出x 与销售额y(单位:百万元)之间有如下对应数据:x 2 4 5 6 8 y3040605070(1)画出散点图; (2)求回归直线方程;(3)试预测广告费支出为10百万元时,销售额多大? (4)思考 当广告费为5百万元时的残差是多少?二、新授1、概念 回归分析2(1(2)如果体重与身高具有相关关系,求根据女大学生的身高预报体重的回归方程,回答问题1、身高x 每增加一个单位时,体重y 如何变化? 2、预报身高为172cm 的女大学生的体重.思考探究一:身高为身高为172cm 的女大学生的体重一定是60.316kg 吗?思考探究二:线性回归模型,随机误差e 及其产生原因1.在线性回归模型y bx a e =++中,a b 和为模型的未知参数,e y 是与y bx a =+之间的误差,通常e为随机变量,称为_______.它的均值E(e)=0,方差2()0D e σ=>.2.线性回归模型的完整表达形式为2()0,()y bx a eE e D e σ=++⎧⎨==⎩.在此模型中,随机误差e 的方差2σ越小,通过回归直线y bx a =+预报真实值y的精度越高.3.随机误差e4.预报值与真实值存在误差的原因思考探究三:怎样研究随机误差e ?对于样本点1122(,),(,),,(,)n n x y x y x y 而言,相应于它们的随机误差为残差为求当广告费为5百万元时的残差是多少?思考探究四:残差分析及判断模型拟合效果作出双基3的残差数据和残差图 思考探究五:相关指数2R用相关指数2R 来刻画回归的效果,其计算公式是:=1--.显然2R 取值越大,意味着残差平方和_______,也就是说模型的拟合效果________.六:用身高预报体重时注意问题七:建立回归模型的基本步骤:三、小结回归分析基本思想及其初步应用基本思想回归分析实际应用相关性方法分析残差平方四、当堂检测1、在利用线性回归模型进行预报时,有以下四种说法: ①样本数据是来自那个总体,预报时也仅适用于这个总体; ②线性回归模型具有时效性;③建立模型时自变量的取值范围决定了预报时模型的适用范围,通常不能超出太多; ④在回归模型中,因变量的值不能由自变量的值完全确定. 其中说法正确的有 . 2、关于回归方程下列说法正确的是( ) A 、回归方程适用于一切总体B 、我们建立的回归方程都能很好地估计预报变量可能的取值C 、样本取值的范围会影响回归方程的适用范围D 、回归方程得到的预报值就是预报变量的精确值3、在一次试验中,测得(x ,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y 与x 之间的线性回归方程为 ( )A 、ˆy=x+l B 、ˆy =x+2 C 、ˆy =2x+l D 、ˆy =x -l 4.已知x 、y 的取值如下表所示从散点图分析,y 与x 线性相关,且0.15y x a =+,则a =( ) 5、对于2R ,下列说法正确的是( ) A 、2R 的值越小,模型拟合效果越好B 、2R 的取值可以任意大,且2R 取值越大拟合效果越好C 、2R 的取值越接近1,模型拟合效果越好D 、以上答案都不对 6、相关指数2R 、残差平方和与模型拟合效果之间的关系是( )A 、 2R 的值越大,残差平方和越小,拟合效果越好B 、2R 的值越小,残差平方和越大,拟合效果越好C 、 2R 的值越大,残差平方和越大,拟合效果越好D 、以上说法都不正确x 0 1 3 4 y5.24.34.85.7回归优劣分析相关指数分析7、给出下列结论:在回归分析中可用①可用相关指数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好;②可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;③可用相关系数r的值判断模型的拟合效果,r越大,模型的拟合效果越好;④可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.五、作业布置1、调查本班10名同学最近一次测试中的数学和物理成绩,做出散点图,求出回归方程,并进行回归分析2、同步3.1,第一课时3、预习课本P86-89学情分析:回归分析的部分内容在《数学3(必修)》中已出现过,比如画散点图、最小二乘法估计的基本思想和计算公式、建立回归方程并进行预报等。
《3.1回归分析的基本思想及其初步应用》教学案
《3.1回归分析的基本思想及其初步应用》教学案一、学习目标1、了解回归分析的基本思想、方法及初步应用2、了解两个具有相关关系的变量进行统计分析的步骤3、了解判断刻画模型拟合效果的方法-—相关指数和残差分析二、知识回顾1.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤: 收集数据→作散点图→求回归直线方程→利用方程进行预报.2.求回归直线方程的步骤:第一步:列数据表,第二步:计算;最小二乘法的公式:1122211()()()n niiiii i nniii i x y nx y x x y y b xn x x x ====⋅-⋅--==-⋅-∑∑∑∑,a y bx =-第三步:写出回归方程(()111,,nni i i i x x y y x y n ====∑∑;为样本中心) 三、例题解析例1、某种产品的广告费用支出x 万元与销售额y 万元之间有如下的对应数据:(1)销售收入y 的值.解:(1)作散点图 (2)求回归直线方程=x =y∑=ii yx∑=2i x例题小结:1.最小二乘法求回归方程和进行预报的步骤:第一步:作______;第二步:求_______;第三步:代值预报2.思考:线性回归模型与一次函数相同吗?事实上,销售额和广告费用支出之间的关系并不能用一次函数来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画支出和销售额的关系).这就说明销售额不仅受广告费用支出的影响还受其他因素的影响,我们把这种影响的结果e (即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e =++,其中残差变量e 中包含销售额不能由广告支出的线性函数解释的所有部分.其中:解释变量为:x 预报变量为:ˆy随机误差为:e 特别地:当残差变量恒等于0时,线性回归模型就变成一次函数模型. 四、知识构建1.残差:ˆˆi i i e=y -y ;残差点比较均匀地落在水平带状区域中,说明选用的模型比较合适,带状区域的宽度越窄说明拟合的精度越_____,回归方程的预报精度越_____.2.总体偏差平方和:()2y -∑ni 1y; 残差平方和:()2ˆi y -∑ni 1y3.回归效果的相关指数:()()2121ˆ1ni i niy yy y -=--∑∑2RR 2越大,意味()2ˆi y-∑ni 1残差平方和y 越______,即拟合效果越______;R 2越小,残差平方和越______,即拟合的效果越________.练习:如果散点图的所有的样本点都落在一条斜率非0实数的直线上,则解释变量和预报变量是________关系,R 2=___________五、知识应用例、关于x与y有如下数据:为了对、y两个变量进行统计分析,现有以下两种线性模型: 6.517.5=+,y x717=+,试比较哪一个模型拟合的效果更好.y x。
回归分析的基本思想及其初步应用 说课稿 教案 教学设计
回归分析的基本思想及其初步应用整体设计教材分析1.教材的地位和作用高中新课程中增加了有关统计学初步的内容,先后出现在必修3和选修12(文科)、选修23(理科)中.《数学3(必修)》中的“统计”一章,给出了运用统计的方法解决问题的思路.“线性回归分析”是其介绍的一种分析、整理数据的方法.在这一部分中,学习了如何画散点图、利用最小二乘法的思想、利用计算器求回归直线方程、利用回归直线方程进行预报等内容.然而在大量的实际问题中,两个变量不一定都呈线性相关关系,它们可能呈指数关系或对数关系等非线性关系,本节就是在学习了如何建立线性回归模型的基础上,探索如何建立非线性关系的回归模型.通过本节的学习,使学生了解回归分析的必要性和回归分析的基本思想,明确回归分析的基本方法和基本步骤,学会以科学的态度评价两个变量的相互关系,培养学生运用所学内容解决实际问题的能力.2.课时划分《回归分析的基本思想及其初步应用》的教学分四个课时完成.第一课时:介绍线性回归模型的数学表达式,解释随机误差项产生的原因,使学生能正确理解回归方程的预报结果;第二课时:从相关系数、相关指数和残差分析角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤;第三课时:介绍两个变量非线性相关关系;第四课时:回归分析的应用.第一课时教学目标知识与技能通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.过程与方法让学生经历数据处理的过程,培养他们对数据的直观感觉,体会统计方法的特点,认识统计方法的应用;通过使用转化后的数据,利用计算器求相关指数,使学生体会使用计算器处理数据的方法.情感、态度与价值观从实际问题中发现已有知识的不足,激发好奇心、求知欲;通过寻求有效的数据处理方法,开阔学生的思路,培养学生的探索精神和转化能力;通过案例的分析,使学生了解回归分析在生活实际中的应用,增强数学“取之生活,用于生活”的意识,提高学习兴趣.重点难点教学重点:理解回归分析的基本思想,掌握求回归直线方程的步骤以及对随机误差e 的认识.教学难点:掌握利用回归分析的基本思想处理实际问题的方法,理解随机误差的来源和对预报变量的影响.教学过程引入新课“名师出高徒”这句谚语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?活动设计:学生独立思考回答问题.学情预测:学生可能会说“有名气的老师不一定能教出厉害的学生”.教师提问:为什么?学情预测:两者之间有一定的关系,但不是必然关系,即名师也不一定出高徒,二者之间是相关关系.设计意图:复习两个变量之间的关系,为线性分析做好铺垫.提出问题:我们知道函数关系是一种确定性关系,而相关关系是一种非确定性关系.上面所提的“名师”与“高徒”之间的关系就是相关关系.那么,在一般情况下,人的身高与体重之间是什么关系?试设计一个方案,来分析某大学女大学生的身高与体重之间的关系,并以此为依据来预报身高172 cm 的女大学生的体重.学生活动:学生独立思考,小组合作交流讨论.活动结果:可以采用统计的方法解决这一问题,先采用随机抽样的方法,从在校女大学生中抽取样本,记录其身高和体重,然后通过所得数据建立线性回归模型,并根据所得模型来预报身高为172 cm 女生的体重.其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报.设计目的:合理设计问题,使学生进一步掌握用统计方法解决问题的基本步骤:提出问题、收集数据、分析整理数据、进行预测或决策.探究新知的女大学生的体重.学生活动:分组合作探究,查阅课本中的计算公式. 活动结果:1.画散点图选取身高为自变量x ,体重为因变量y ,画出散点图形象展示两个变量之间的关系,并判断二者是否具有线性关系.由散点图可以发现,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用线性回归直线近似刻画它们之间的关系.2.建立回归方程由计算器可得a ^=-85.712,b ^=0.849. 于是得到回归方程为y ^=0.849x -85.712. 3.预报和决策当x =172时,y ^=0.849×172-85.712=60.316(kg). 即一名身高为172 cm 的女大学生的体重预报值为60.316 kg.设计目的:进一步熟悉线性回归分析的具体步骤.提高学生的数据处理能力,并让学生在应用中进一步掌握公式的应用.理解新知提出问题:散点图可以直观地判断两个变量是否具有线性相关性,那么还有什么方法可以描述线性相关性的强弱?学生活动:独立思考或相互讨论.活动结果:还可以通过必修3中的相关系数r来衡量两个变量之间的线性相关关系的强弱.提出问题:如何根据相关系数r描述线性相关性的强弱?相关系数的计算公式是什么?学生活动:独立思考或相互讨论,查阅课本.活动结果:其具体计算公式是r=∑i=1n(x i-x)(y i-y)∑i=1n(x i-x)2∑j=1n(y j-y)2当r>0时,表示两个变量正相关;当r<0时,表示两个变量负相关.r的绝对值越接近1,表明两个变量的线性相关性越强,r的绝对值越接近0,表明两个变量之间几乎不存在线性相关关系.通常,当|r|>0.75时,认为两个变量有很强的线性相关关系.提出问题:在本例中,身高和体重的线性相关系数是多少?我们建立的线性回归方程是否有实际意义?学生活动:独立计算,求解相关系数.活动结果:利用计算器可求得r=0.798,这表明体重与身高有很强的线性相关关系,从而表明我们建立的回归模型是有意义的.设计目的:复习判断变量线性相关的方法,进一步熟悉线性相关系数的计算公式.提出问题:身高为172 cm的女大学生的体重一定是60.316 kg吗?学生活动:独立思考也可相互讨论.学情预测:不一定,但一般可以认为她的体重在60.316 kg左右.提出问题:为什么根据得到的一次函数求出的结论不一定是实际值?产生误差的原因是什么?学生活动:独立思考也可相互讨论,教师加以适当的引导提示.活动结果:观察上述散点图,我们可以发现女大学生的体重y和身高x之间的关系并不能用一次函数y=bx+a来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系).在数据表中身高为165 cm的3名女大学生的体重分别为48 kg、57 kg 和61 kg,如果能用一次函数来描述体重与身高的关系,那么身高为165 cm的3名女大学生的体重应相同.这就说明体重不仅受身高的影响还受其他因素的影响,如生理因素、饮食锻炼、测量工具等其他因素.为了更准确地刻画身高和体重的关系,可用下列线性回归模型来表示:y=bx+a+e.我们把自变量x称作解释变量,因变量y称作预报变量,e称为随机误差.提出问题:函数模型y=bx+a与线性回归模型y=bx+a+e有什么关系?学生活动:独立思考也可相互讨论,教师加以适当的引导提示.活动结果:线性回归模型:y=bx+a+e当理想化时,即所有人的遗传因素都一样、所有人的生活方式都一样、所有测量都没有误差等等,此时e=0,线性回归模型就变成函数模型了.因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.设计目的:突破本节课的难点,充分认识随机误差e 的来源和对预报变量的影响. 运用新知例1)有如下统计数据:若由此资料可知y 对x 呈线性相关关系,试求: (1)回归直线方程;(2)估计使用年限为10年时,维修费用为多少?分析:正确理解计算b ^,a ^的公式和准确的计算,是求线性回归方程的关键. 解:(1)由上表中的数据列成下表故x =4,y=5,∑i =15x 2i =90,∑i =15x i y i =112.3,于是b ^=∑i =15x i y i -5x y∑i =15x 2i -5x2=112.3-5×4×590-5×42=1.23,a ^=y -b ^x =5-1.23×4=0.08,∴回归直线方程为y ^=b ^x +a ^=1.23x+0.08.(2)当x =10时,y ^=1.23×10+0.08=12.38(万元),估计当使用10年时的维修费用为12.38万元.点评:由于本节课题目计算量大,公式较多,所以在求解时易出现公式乱用,数据出错等问题,对这一点,同学们在解题时尤为需要注意.【变练演编】例2其中x 为高一数学成绩,y 为高二数学成绩. (1)y 与x 是否具有线性相关关系;(2)如果y 与x 具有线性相关关系,求线性回归方程.思路分析:先根据数据计算相关系数,然后根据相关系数的大小,判断两个变量是否线性相关.解:(1)由已知表格中的数据,利用计算器进行计算得x =71,y=72.3,∑i =110x i y i =51 467,∑i =110x 2i =50 520,∑i =110y 2i =52 541,r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑j =1n(y j -y )2≈0.785 3>0.75,故两个变量有很强的线性相关关系.(2)y 与x 具有线性相关关系,可设线性回归方程为y ^=a ^+b ^x ,则b ^=∑i =110(x i -x )(y i -y )∑i =110(x i -x )2≈1.22,a ^=y -b ^x =72.3-1.22×71=-14.32, 所以y 关于x 的线性回归方程为y ^=1.22x -14.32.点评:本题通过计算相关系数,将两个变量相关性的判断转化为数据大小的比较.变式:在确定上题中y 与x 的线性相关关系中,是否还有别的方法?若有,请加以说明. 活动设计:学生分组讨论,回顾课本解答问题. 活动成果:还可以通过画散点图的方法来判断两个变量是否具有相关性.如选取x 的值作为自变量,y 的值作为因变量,画出散点图.由图可知两个变量有线性相关性,求其回归直线方程是有实际意义的. 设计意图:进一步熟悉判断变量线性相关的各种方法. 【达标检测】1.对于回归分析,下列说法错误的是( )A .在回归分析中,两个变量的关系若是非确定关系,那么其中一个变量不能由另一个变量唯一确定B .回归系数可以是正的,也可以是负的C .回归分析中,如果r 2=1或r =±1,说明变量x 与变量y 之间完全线性相关D .相关样本系数r ∈(-1,1)2.下列各组变量之间具有线性相关关系的是( )A .出租车费与行使的里程B .学习成绩与学生身高C .身高与体重D .铁的体积与质量3.若劳动生产率x(千元)与月工资y(元)之间的回归直线方程为y ^=50+80x ,则下列判断正确的是( )A .劳动生产率为1 000元时,月工资为130元B .劳动生产率提高1 000元时,月工资平均提高80元C .劳动生产率提高1 000元时,月工资平均提高130元D .月工资为210元时,劳动生产率为2 000元 答案:1.D 2.C 3.B 课堂小结(给学生1~2分钟的时间默写本节的主要基础知识、方法、例题、题目类型、解题规律等;然后用精炼的、准确的语言概括本节的知识脉络、思想方法、解题规律)1.知识收获:进一步学习回归分析的基本思想以及求回归直线方程的步骤,正确认识随机误差e 的产生原因、了解线性回归模型与函数的不同之处.2.方法收获:线性回归方程的求法、用样本估计总体的统计思想.3.思维收获:体会模型诊断的思想,提高利用回归方法解决实际问题的能力,培养探索和创新的精神.设计意图:让学生自己小结,这是一个多维整合的过程,是一个高层次的自我认识过程.。
高中数学选修1-2教案4:1.1 回归分析的基本思想及其初步应用(一)教学设计
回归分析的基本思想及其初步应用
【教学目标】
1、知识与技能目标
认识随机误差;
2、过程与方法目标
(1)会使用函数计算器求回归方程;
(2)能正确理解回归方程的预报结果.
3、情感、态度、价值观
通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力.教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性.
【教学重点】随机误差e的认识
【教学难点】随机误差的来源和对预报变量的影响
【教学方法】启发式教学法
【教学手段】多媒体辅助教学
【教学过程设计】。
高中数学_回归分析的基本思想及其初步应用教学设计学情分析教材分析课后反思
《回归分析的基本思想及其初步应用》教学设计《回归分析的基本思想及其初步应用》学情分析一、学生情况分析本班级为高二理科学生,共有48名。
因为学生发展的不平衡,学生的对数学中的回归分析的理解能力差异很大。
随着社会的进步、科技的发展,很多学生在计算时爱运用计算器进行计算,忽略了手动计算能力。
因此,学生在统计分析中计算方面上还存在较大的问题,计算速度慢、准确率不高的现状比较普遍。
当然,我相信只在要教学过程中,多让学生动手,培养学生独立运算,这一问题还是能很好解决的。
学生在必修三中已掌握建立线性回归模型的知识,学会用最小二乘法建立线性回归模型的知识,并能用所学知识解决一些简单的实际问题。
但本节中的随机误差及残差的意义对学生来说仍是一个难点,在教学中,放慢节奏,结合实例,让学生观察、思考与讨论,从而了解随机误差产生的原因及残差出现的意义。
二、学生课前准备1、复习必修三回关于回归分析的相关内容,并预习《3.1回归分析的基本思想及其初步应用》。
2、学生在课前测量自己的脚印(赤脚)长度,以备上课时使用。
三、课程分析本节课中,最小二乘法公式、残差的意义及计算方法、相关指数R2的计算公式,都是难以记忆。
大多教师在授课时,忽略了对公式本身的体悟,只是单纯让学生去死记硬背,机械学习,导致学生运用公式却不知其味,做完题仍觉枯燥无味,过段时间全然忘却,究其原因,是因为学生没有理解公式的本质。
在此方面,我结合例1的回归直线分析,让学生真正理解公式的意义及记忆技巧,从而达到学生记住公式、会用公式的目的。
在数学教学中,“授之以鱼”永远不如“授之以渔”,只有引导学生理解公式的意义,在计算过程中发现技巧,才能让学生在学习的过程中体会到学习数学的乐趣,获得成就感。
同时,由于学生的能力有一定的差距,所以,对不同的学生亦有不同的要求。
对于理解能力和分析能力相对较弱的同学,要求可以适当降低,只要求他们能够理解残差意义,对照公式,能借助科学工具计算即可;对于理解能力和分析能力较好的同学,不仅让学生掌握回归分析中的公式及运算,更重要的是让他们在解决实际问题中寻找更好的模型的方法,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神。
高中数学选修1-2《回归分析基本思想及其初步应用》教案
高中数学选修1-2《回归分析基本思想及其初步应用》教案Teaching plan of 1-2 "basic idea of regression analysis and its p reliminary application" as an elective course in high school mat hematics高中数学选修1-2《回归分析基本思想及其初步应用》教案前言:数学是研究数量、结构、变化、空间以及信息等概念的一门学科,从某种角度看属于形式科学的一种,在人类历史发展和社会生活中,数学发挥着不可替代的作用,是学习和研究现代科学技术必不可少的基本工具。
本教案根据数学课程标准的要求和教学对象的特点,将教学诸要素有序安排,确定合适的教学方案的设想和计划、并以启迪发展学生智力为根本目的。
便于学习和使用,本文档下载后内容可按需编辑修改及打印。
教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.教学重点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.教学难点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.教学过程:一、复习准备:1.由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响.2.为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.二、讲授新课:1.教学总偏差平方和、残差平方和、回归平方和:(1)总偏差平方和:所有单个样本值与样本均值差的平方和,即 .残差平方和:回归值与样本值差的平方和,即 .回归平方和:相应回归值与样本均值差的平方和,即 .(2)学习要领:①注意、、的区别;②预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和,即 ;③当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;④对于多个不同的模型,我们还可以引入相关指数来刻画回归的效果,它表示解释变量对预报变量变化的贡献率. 的值越大,说明残差平方和越小,也就是说模型拟合的效果越好.2.教学例题:例2 关于与有如下数据:2 4 5 6 830 40 60 50 70为了对、两个变量进行统计分析,现有以下两种线性模型:,,试比较哪一个模型拟合的效果更好.分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论.-------- Designed By JinTai College ---------。
高中数学选修1-2《回归分析的基本思想及其初步应用》教案
高中数学选修1-2《回归分析的基本思想及其初步应用》教案教学目标:1.了解回归分析的基本概念和方法,学会使用回归分析方法对一些实际问题作出预测和分析。
2.能够正确理解和使用回归分析的基本统计量,包括相关系数、判定系数和残差等。
3.能够理解和描述回归分析的假设条件和前提条件,掌握回归分析的模型建立过程,并能正确应用到实际问题中。
教学重点:1.回归分析的基本概念和方法。
2.回归分析的统计量及其含义。
3.回归分析的模型建立过程。
教学难点:1.应用回归分析方法对实际问题进行预测和分析。
2.掌握回归分析模型的建立方法。
教学方法:1.讲授法2.实例分析法3.互动式教学法教学内容:第一节回归分析的基本概念和方法1.回归分析的概念和意义。
2.回归分析的基本模型和方程式。
3.单变量和多变量回归分析的区别和应用。
4.回归分析的基本假设条件和前提条件。
第二节回归分析的统计量及其含义1.相关系数的概念和计算方法。
2.判定系数的定义和计算方法。
3.残差的概念和含义。
4.其他相关统计量的应用。
第三节回归分析的模型建立过程1.数据的收集和清理。
2.变量的筛选和筛选标准。
3.模型的构建和检验。
4.模型的应用和预测。
教学方式:1.讲授。
通过讲解回归分析的概念、方法、统计量和模型建立过程等内容,让学生了解回归分析的基本概念和方法,为后续的案例分析打下基础。
2.案例分析。
通过实例分析法,将回归分析的理论知识与实际问题相结合,并引导学生从实际问题中理解和掌握回归分析的方法和应用。
3.互动式教学。
引导学生在互动交流中,理解和掌握回归分析的基本概念和方法,加深对回归分析的理解和认识。
教学评估:教师根据学生在课堂上的表现和课下的练习情况,对学生进行综合评价。
主要考核内容包括:学生对回归分析的概念和方法的理解程度、学生对回归分析应用的掌握情况、学生对回归分析的模型建立和检验能力、学生的综合分析和判断能力等。
据此评价学生的成绩,并作出相应的教学反思和改进。
回归分析的基本思想及其初步应用 精品教案
回归分析的基本思想及其初步应用
【教学目标】
1.知识目标
认识随机误差;认识残差。
2.能力目标
(1)会使用电脑画散点图、求回归直线方程;
(2)能正确理解回归方程的预报结果。
3.情感目标
通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神。
培养学生运用所学知识,解决实际问题的能力。
教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性。
【教学重点】
回归分析的基本方法、随机误差e的认识、残差
【教学难点】
回归分析的基本方法
【教学方法】
启发式教学法。
回归分析的基本思想及其初步应用优秀教学设计
回归分析的基本思想及其初步应用一、教学目标:1.明确两个变量具有相关关系的意义;2.知道回归分析的意义;3.知道回归直线、回归直线方程、线性回归分析的意义;4.掌握对两个变量进行线性回归的方法和步骤,并能借助科学计算器确定实际问题中两个变量间的回归直线方程;5.培养学生形成运用数据进行推断的能力;6.让学生体会从特殊到一般的辩证思想方法.二、教学重点:了解线性回归的基本思想和方法;教学难点:线性回归的基本思想方法和计算.三、教学用具:幻灯机或多媒体四、教学过程:1.引入新课S 先引入函数关系再引入相关关系间由正方形面积S与其边长x之间的函数关系2x (确定关系)引入一块农田的水稻产量与施肥量之间的关系(非确定关系),从而引入新授内容.2.(板书)相关关系与回归分析(1)相关关系进一步分析水稻产量与施肥量的关系,得出相关关系的概念.(板书)自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.相关关系与函数关系的异同点:相同点:均是指两个变量的关系.不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.引导学生列举现实生活中相关关系的例子.(2)回归分析(板书)对具有相关关系的两个变量进行统计分析的方法叫回归分析.通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性.(3)散点图首先用小黑板或幻灯给出施化肥量对水稻产量影响的试验数据:施化肥量x15202530354045水稻产量y330345365405445450455再同时给出各对数据在平面直角坐标系中表示的点.(板书)表示具有相关关系的两个变量的一组数据的图形,叫做散点图. 散点图形象地反映了各对数据的密切程度. 3.回归直线方程(1)求回归直线方程的思想方法先引导学生观察散点图的特征,发现各点大致分布在一条直线的附近.并问学生,类似图中的直线可画几条?显见,可画出不止一条类似的直线.那么,其中的哪一条直线最能代表变量x 与y 之间的关系呢?引导学生分析,最能代表变量x 与y 之间关系的直线的特征:即n 个偏差的平方和最小,其过程简要分析如下:设所求的直线方程为,其中a 、b 是待定系数.a bx y +=∧则 .于是得到各个偏差),,2,1.(n i a bx y i i =+=∧.),,2,1).((n i a bx y y y i i i i =+-=-∧显见,偏差的符号有正有负,若将它们相加会造成相互抵消,所以它们的和不∧-i i y y 能代表几个点与相应直线在整体上的接近程度,故采用n 个偏差的平方和2222211)()()(a bx y a bx y a bx y Q n n --++--+--= 表示n 个点与相应直线在整体上的接近程度.记 (向学生说明的意义).∑=--=ni i ia bx yQ 12)(∑=ni 1上述式子展开后,是一个关于a 、b 的二次多项式,应用配方法,可求出使Q 为最小值时的a 、b 的值(课前布置学生看阅读材料).即⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====..)())((2121121x b y a xn xxyn yx x x y y x x b ni ini ii n i i ni i i其中.∑∑====ni i n i i y n y x n x 111,1在此基础上,给出回归直线方程、回归直线、线性回归分析的概念.最后,向学生指出,对回归直线方程只要求会运用它进行具体计算a 、b ,求出回归直线方程即可.不要求掌握回归直线方程的推导过程.(2)回归直线方程的求法让学生用计算器对前面列表中的数据进行具体计算,列成以下表格i1234567ix 15202530354045i y 330345365405445450455ii y x 4950690091251215015575180002047587175,1132725,700071712712===∑∑∑===i i i i i i iy x y x提问:列表计算的优点是什么?故可得到,2573075.43.399,75.430770003.399307871752≈⨯-=≈⨯-⨯⨯-=a b 从而得回归直线方程是.25775.4+=∧x y 最后请一位学生画出回归直线,并求出时,y 的估计值.35=x 例 一个工厂在某年里每月产品的总成线y (万元)与该月产量x (万件)之间有如下一组对应数据:x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07y 2.252.372.402.552.642.752.923.033.143.263.363.50(1)画出散点图;(2)求月总成本y 与月总产量x 之间的回归直线方程.讲解上述例题时,(1)可由学生完成;对于(2),可引导学生列表,按的顺序计算,最后得到∑∑∑===→→→→→→→12112121212i i i i ii ii i i i y x y x y x y x y x .974.0,215.1≈≈a b 即所求的回归直线方程为.974.0215.1+=∧x y 若条件允许,可借助几何画板向学生演示本题,即画出散点图,并求出回归直线方程.讲解上述例题后,要求学生完成下面问题:在某种产品表面进行腐蚀线试验,得到腐蚀深度y 与腐蚀时间t 之间对应的一组数据:时间t (s )5101520304050607090120深度y (m )μ610101316171923252946(1)画出散点图;(2)试求腐蚀深度y 对时间t 的回归直线方程.略解:(1)散点图.呈直线形.(2)经计算可得∑∑∑========11111121112.13910,5442,36750,45.19,36.46i i i i ii iy t y t y t .3.036.46113675045.1936.4611139101111221112111≈⨯-⨯⨯-=⨯-⨯-=∑∑==tt tyyt b i i i ii .542.536.463.045.19≈⨯-=-=t b y a 故所求的回归直线方程为.542.53.0+=∧t y 让学生做课后练习题.4.课堂小结本节课要求准确理解相关关系的概念,并在此基础上,了解回归分析与散点图的含义,了解回归直线方程推导的思路,会利用a 、b 的公式求出回归直线方程,利用回归直线方程去估值.六、布置作业:教科书第1题.。
河北省二十冶综合学校高考数学总复习 独立性检验的基本思想及其初步应用学案
河北省二十冶综合学校高中分校高考数学总复习 独立性检验的基本思想及其初步应用学案【学法指导】:认真自学,激情讨论,愉快收获。
●为必背知识【学习目标】:通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的实施步骤与必要性.【学习重点】:理解独立性检验的基本思想及实施步骤.【学习难点】:了解独立性检验的基本思想、了解随机变量2K 的含义. 【教学过程】:一:回顾预习案●1、y 与x 之间的线性回归方程ax b y ˆ+=必定过__________点. ●2、2R 越 ,残差平方和越 ,模型的拟合效果越好,2R 越 ,残差平方和越 ,模型的拟合效果越差,2R 表示________对于________变化的贡献率,2R 越接近于 ,表示回归的效果越好。
请你快速阅读课本10-13页,独立完成下列问题。
3、分类变量: 。
4、(1)列联表: 。
(2)列联表的等高条形图的画法。
5、独立性检验的基本思想:一般地,假设有两个分类变量X 和Y ,它们的可能取值分别为{12,x x }和{12,y y }, 其样本频数列联表(称为2×2列联表)为:(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值0k(2)计算随机变量2K 的观测值))()()(()(2d b c a d c b a bc ad n k ++++-=,其中d c b a n +++= (3)如果0k k ≥,就推断“在犯错误的概率不超过α的前提下认为X 与Y 有关系”;否则,就认为“在犯错误的概率不超过α的前提下不能推断X 与Y 有关系”或者认为“没有足够证据支持结论X 与Y 有关系”。
二 讨论展示案 合作探究,展示点评例1、课本15页练习。
例2、课本16页第2题。
例3、课本19页A组第3题。
高中数学《回归分析的基本思想及其初步应用》导学案
知识点线性回归模型(1)函数关系是一种□01确定性关系,而相关关系是一种□02非确定性关系. (2)回归分析是对具有□03相关关系的两个变量进行统计分析的一种常用方法.(3)对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计公式分别为b ^=□04∑ni =1 (x i -x -)(y i -y -)∑ni =1 (x i -x -)2=∑ni =1x i y i -n x -y -∑n i =1x 2i -n x -2,a ^ =□05y --b ^ x -,其中□06(x -,y -)称为样本点的中心.(4)线性回归模型y =bx +a +e ,其中a 和b 是模型的未知参数,e 称为□07随机误差,自变量x 称为□08解释变量,因变量y 称为□09预报变量. 知识点线性回归分析1.残差平方和法(1)e ^i =□01y i -y ^i =□02y i -b ^x i -a ^(i =1,2,…,n )称为相应于点(x i ,y i )的□03残差.(2)残差平方和□04∑ni =1 (y i -y ^i )2越小,模型拟合效果越好. 2.残差图法残差点□05比较均匀地落在水平的带状区域内,说明选用的模型比较合适,其中这样的带状区域宽度□06越窄,说明模型的精确度越高.3.利用相关指数R 2刻画回归效果 其计算公式为:R 2=1-□07∑n i =1 (y i -y ^i )2∑ni =1(y i -y -)2.其几何意义:□08R 越接近于1,表示回归效果越好.1.建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量. (2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性相关关系等).(3)由经验确定回归方程的类型(如观察到数据呈线性相关关系,则选用线性回归方程y ^=b ^x +a ^).(4)按一定规则估计回归方程中的参数(如最小二乘法).(5)得出结果后分析残差图是否有异常,若存在异常,则检查数据是否有误或模型是否合适等.2.线性回归模型中随机误差的主要来源(1)用线性回归模型作为真实模型的近似所引起的误差.可能存在非线性的函数能够更好地描述y 与x 之间的关系,但是现在却用线性函数来表述这种关系,结果会产生误差.(2)忽略了某些因素的影响.影响变量y 的因素不仅有变量x ,可能还包括其他许多因素,例如,在描述身高和体重关系的模型中,体重不仅受身高的影响,还会受遗传基因、饮食习惯、生长环境等其他因素的影响.(3)观测误差.由于测量工具等原因,导致y 的观测值产生误差. 3.残差分析的结果(1)残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.(2)若是有个别样本点的残差比较大,需要确认在采集这些样本点的过程中是否有人为的错误.如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因.4.对R 2的理解(1)预报变量的变化与解释变量和随机误差的关系预报变量的变化程度可以分解为解释变量引起的变化程度与残差变量的变化程度之和,其中这个变化与解释变量和随机误差(即残差平方和)有关的程度是由相关指数R 2的值决定的.在线性回归模型中,R 2表示解释变量对预报变量变化的贡献率.R 2越接近于1,表示解释变量和预报变量的线性相关性越强;反之,R 2越小,说明随机误差对预报变量的效应越大.(2)R 2与r 的关系①相关系数可较好地反映变量的相关性及正相关或负相关,而R 2反映了回归模型拟合数据的效果;②R 2是相关系数的平方,其变化范围为[0,1],而相关系数的变化范围为[-1,1];③当相关系数|r |接近于1时说明两变量的相关性较强,当|r |接近于0时说明两变量的相关性较弱,而当R 2接近于1时,说明线性回归方程的拟合效果较好.1.判一判(正确的打“√”,错误的打“×”)(1)残差平方和越小,线性回归方程的拟合效果越好.( )(2)在画两个变量的散点图时,预报变量在x 轴上,解释变量在y 轴上.( ) (3)R 2越接近于1,线性回归方程的拟合效果越好.( ) 答案 (1)√ (2)× (3)√ 2.做一做(1)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为________.(2)在残差分析中,残差图的纵坐标为________.(3)如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于________,解释变量和预报变量之间的相关系数等于________.答案 (1)正相关 (2)残差 (3)0 1或-1解析 (1)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关.(2)由残差图的定义知道,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.(3)设样本点为(x i ,y i ),i =1,2,3,…,n ,回归直线为y ^=b ^x +a ^;若散点图中所有的样本点都在一条直线上,则此直线方程就是回归直线方程.所以有y i =y ^i ;残差平方和∑ni =1(y i -y ^i )2=0;解释变量和预报变量之间的相关系数R 满足R 2=1-∑ni =1(y i -y ^i )2∑n i =1(y i -y -)2=1,所以R =±1.探究1 求线性回归方程例1 某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据x 6 8 10 12 y2356(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.(相关公式:b ^ =∑ni =1x i y i -n x -y -∑n i =1x 2i -n x -2,a ^ =y --b ^ x -)[解] (1)如图:(2)∑4i =1x i y i=6×2+8×3+10×5+12×6=158,x -=6+8+10+124=9,y -=2+3+5+64=4,∑4i =1x 2i =62+82+102+122=344, b ^ =158-4×9×4344-4×92=1420=0.7,a ^=y --b ^x -=4-0.7×9=-2.3,故线性回归方程为y ^=0.7x -2.3.(3)由(2)中线性回归方程当x =9时,y ^=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.拓展提升求线性回归方程的步骤(1)列出散点图.从直观上分析数据间是否存在线性相关关系. (2)计算x -,y -,∑n i =1x 2i ,∑n i =1y 2i ,∑n i =1x i y i. (3)代入公式求出y ^=b ^x +a ^中参数b ^,a ^ 的值. (4)写出回归方程并对实际问题作出估计.[跟踪训练1] 某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:(1)(2)求出y关于x的线性回归方程,y^=b^x+a^,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?注:b^=∑i=1nx i y i-n x-y-∑i=1nx2i-n x-2,a^=y--b^x-.解(1)散点图如图.(2)由表中数据得∑i=14x i y i=52.5,x-=3.5,y-=3.5,∑i=14x2i=54,所以b ^=∑i =1nx i y i -n x -y -∑i =1nx 2i -n x -2=0.7.所以a ^ =y --b ^x -=1.05.所以y ^=0.7x +1.05. 回归直线如图中所示.(3)将x =10代入回归直线方程,得y ^=0.7×10+1.05=8.05(小时), 所以预测加工10个零件大约需要8.05小时. 探究2 线性回归分析例2 已知某种商品的价格x (元)与需求量y (件)之间的关系有如下一组数据:求y 对x [解] x -=15(14+16+18+20+22)=18, y -=15(12+10+7+5+3)=7.4,∑5i =1x 2i =142+162+182+202+222=1660, ∑5i =1x i y i =14×12+16×10+18×7+20×5+22×3=620,所以,b ^=∑5i =1x i y i -5x -y -∑5i =1x 2i -5x -2=620-5×18×7.41660-5×182=-1.15, a ^=y --b ^x -=7.4+1.15×18=28.1, 所以所求回归直线方程是y ^=-1.15x +28.1. 列出残差表:y i -y ^i 0 0.3 -0.4 -0.1 0.2 y i -y -4.62.6-0.4-2.4-4.4所以,∑5i =1 (y i -y ^i )2=0.3,∑5i =1 (y i -y -)2=53.2, R 2=1-∑5i =1 (y i -y ^i )2∑5i =1(y i -y -)2≈0.994,所以回归模型的拟合效果很好. 拓展提升这类题目的数据运算繁琐,通常采用分步计算的方法,由R 2可以看出回归模型的拟合效果,也可以计算相关系数r ,看两个变量的相关关系是否很强.[跟踪训练2] 为研究重量x (单位:克)对弹簧长度y (单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:x 5 10 15 20 25 30 y7.258.128.959.9010.911.8(2)求出R 2; (3)进行残差分析. 解 (1)散点图如图x -=16(5+10+15+20+25+30)=17.5,y -=16(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,∑i =16x 2i =2275,∑i =16x i y i =1076.2计算得,b ^≈0.183,a ^≈6.285, 所求线性回归方程为y ^=0.183x +6.285. (2)列表如下:所以∑i =16 (y i -y ^i )2≈0.01318,∑i =16(y i -y -)2=14.6784.所以,R 2=1-0.0131814.6784≈0.9991, 回归模型的拟合效果较好.(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与重量成线性关系.探究3非线性回归分析例3 为了研究某种细菌随时间x 变化繁殖的个数,收集数据如下:(2)描述解释变量与预报变量之间的关系; (3)计算残差、相关指数R 2.[解] (1)由表中数据作散点图如图所示.(2)由散点图看出样本点分布在一条指数函数y =c 1e c 2x 的图象的周围,其中c 1和c 2是待定系数.于是令z =ln y ,则z =bx +a (a =ln c 1,b =c 2),因此变换后的样本点应该分布在直线z =bx +a 的周围,因此可以用线性回归模型来拟合z 与x 的关系,则变换后的样本数据如下表:x 1 2 3 4 5 6 z1.792.483.223.894.555.25由表中数据得到线性回归方程z =0.69x +1.115. 因此细菌繁殖个数关于时间的回归方程为 y ^=e 0.69x +1.115. (3)列出残差表: 编号i 1 2 3 4 5 6 y ^i 6.08 12.12 24.17 48.18 96.06 191.52 y i 6 12 25 49 95 190 e ^i -0.08-0.120.830.82-1.06-1.52∑6i =1e ^2i =∑6i =1(y i -y ^i )2=4.8161,∑6i =1(y i -y -i )2=24630.1, R 2=1-4.816124630.1≈0.9998.故解释变量天数对预报变量繁殖个数解释了99.98%,说明该回归模型拟合效果非常好.拓展提升非线性回归方程的求法(1)根据原始数据(x ,y )作出散点图; (2)根据散点图,选择恰当的拟合函数;(3)作恰当的变换,将其转化成线性函数,求线性回归方程; (4)在(3)的基础上通过相应的变换,即可得非线性回归方程.[跟踪训练3] 某电容器充电后,电压达到100 V ,然后开始放电,由经验知道,此后电压U 随时间t 变化的规律用公式U =A e bt (b <0)表示,现测得时间t (s)时的电压U (V)如下表:试求:电压U 对时间t 的回归方程.(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)解 对U =A e bt 两边取对数得ln U =ln A +bt ,令y =ln U ,a =ln A ,x =t ,则y =a +bx ,y 与x 的数据如下表:根据表中数据画出散点图,如图所示,从图中可以看出,y 与x 具有较好的线性相关关系,由表中数据求得x -=5,y -≈3.045,由公式计算得b ^≈-0.313,a ^=y --b ^x -=4.61, 所以y 对x 的线性回归方程为y ^=-0.313x +4.61.所以ln U ^=-0.313t +4.61,即U ^=e -0.313t +4.61,因此电压U 对时间t 的回归方程为U ^=e -0.313t +4.61.1.关于回归分析,下列说法错误的是( ) A .回归分析是研究两个具有相关关系的变量的方法 B .散点图中,解释变量在x 轴,预报变量在y 轴 C .回归模型中一定存在随机误差 D .散点图能明确反映变量间的关系 答案 D解析 用散点图反映两个变量间的关系时,存在误差.2.甲、乙、丙、丁四位同学在建立变量x ,y 的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R 2分别如下表:A .甲B .乙C .丙D .丁答案 A解析 相关指数R 2越大,表示回归模型的拟合效果越好.3.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系.根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x -,y -)C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案 D解析 A ,B ,C 均正确,是回归方程的性质,D 项是错误的,线性回归方程只能预测学生的体重.选项D 应改为“若该大学生某女生身高为170 cm ,则估计其体重大约为58.79 kg ”.4.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得线性回归方程y =bx +a 中b =-2,预测当气温为-4 ℃时,用电量的度数约为________.答案 68解析 x -=10,y -=40,回归方程过点(x -,y -),∴40=-2×10+a.∴a=60.∴y^=-2x+60.令x=-4,∴y^=(-2)×(-4)+60=68.5.假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:x 15.025.830.036.644.4y 39.442.942.943.149.2(1)以x(2)求y与x之间的回归方程,对于基本苗数56.7预报有效穗;(3)计算各组残差,并计算残差平方和;(4)求相关指数R2,并说明残差变量对有效穗的影响占百分之几?解(1)散点图如下:(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用回归方程刻画它们之间的关系.设回归方程为y^=b^x+a^,x-=30.36,y-=43.5,∑i=15x2i=5101.56,∑i=15y2i=9511.43.x-y-=1320.66,y-2=1892.25,x-2=921.7296,∑i=15x i y i=6746.76.由b^=∑i=15x i y i-5x-y-∑i=15x2i-5x-2≈0.29,a^=y--b^x-=43.5-0.29×30.36≈34.70.故所求的线性回归方程为y^=34.70+0.29x.当x=56.7时,y^=34.70+0.29×56.7=51.143.估计成熟期有效穗为51.143.(3)由于y=bx+a+e,可以算得e^i=y i-y^i分别为e^1=0.35,e^2=0.718,e^3=-0.5,e^4=-2.214,e^5=1.624,残差平方和:∑i=15e^2i≈8.43.(4)∑i=15(y i-y-)2=50.18,所以R2=1-8.4350.18≈0.832.所以解释变量小麦基本苗数对有效穗约贡献了83.2%.残差变量贡献了约1-83.2%=16.8%.A级:基础巩固练一、选择题1.由一组样本数据(x1,y1),(x2,y2),…,(x n,y n)得到的回归直线方程为y^=b^x+a^,那么下面说法不正确的是()A.直线y^=b^x+a^必经过点(x-,y-)B.直线y^=b^x+a^至少经过点(x1,y1),(x2,y2),…,(x n,y n)中的一个点C.直线y^=b^x+a^的斜率为∑ni=1x i y i-n x-y-∑ni=1x2i-n x-2D .直线y ^=b ^ x +a ^ 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的残差平方和∑ni =1[y i -(b ^x i +a ^)]2是该坐标平面上所有直线与这些点残差平方和中最小的直线答案 B解析 回归直线体现了大多数数据点的排列趋势,并不一定经过其中的点. 2.如图所示是四个残差图,其中回归模型的拟合效果最好的是( )答案 B解析 选项A 与B 中的残差图都是水平带状分布,并且选项B 的残差图散点分布集中,在更狭窄的范围内,所以B 中回归模型的拟合效果最好,选B.3.变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则( )A .r 2<r 1<0B .0<r 2<r 1C .r 2<0<r 1D .r 2=r 1答案 C解析 对于变量X 与Y 而言,Y 随X 的增大而增大,故变量Y 与X 正相关,即r 1>0;对于变量U 与V 而言,V 随U 的增大而减小,故变量V 与U 负相关,即r 2<0.故r 2<0<r 1.4.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )A .x 和y 的相关系数为直线l 的斜率B .x 和y 的相关系数在0到1之间C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同D .直线l 过点(x -,y -) 答案 D解析 因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近于1,两个变量的线性相关程度越强,所以A ,B 错误.C 中n 为偶数时,分布在l 两侧的样本点的个数可以不相同,所以C 错误.根据回归直线一定经过样本中心点可知D 正确.所以选D.5.已知x 与y 之间的几组数据如下表:x 1 2 3 4 5 6 y21334假设根据上表数据所得线性回归直线方程为y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y ′=b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′ D.b ^<b ′,a ^<a ′ 答案 C解析 过(1,0)和(2,2)的直线方程为y ′=2x -2, 画出六点的散点图,回归直线的大概位置如图所示.显然,b ′>b ^,a ^>a ′,故选C. 二、填空题6.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.答案 0.254解析 年饮食支出平均增加0.254×1=0.254(万元).7.某商场为了了解某品牌羽绒服的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的销售量与当月平均气温,数据如下表:月平均气温x (℃) 17 13 8 2 月销售量y (件)24334055由表中数据算出线性回归方程y ^=b ^x +a ^中的b ^≈-2.气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月该品牌羽绒服的销售量的件数约为________.答案 46解析 由表格得(x -,y -)为(10,38),又(x -,y -)在回归直线y ^=b ^ x +a ^上,且b ^≈-2,∴38=-2×10+a ^,a ^=58,所以y ^=-2x +58, 当x =6时,y ^=-2×6+58=46.8.在研究气温和热茶销售杯数的关系时,若求得相关指数R 2≈0.85,则表明气温解释了________的热茶销售杯数变化,而随机误差贡献了剩余的________,所以气温对热茶销售杯数的效应比随机误差的效应大得多.答案85%15%解析由相关指数R2的意义可知,R2≈0.85表明气温解释了85%,而随机误差贡献了剩余的15%.三、解答题9.在一次抽样检查中,抽得5个样本点,数据如下表:x 0.250.512 4y 161252 1试建立y解作出散点图,如图所示,由散点图可以看出,图象近似反比例函数在第,由已知数据,可得变换后的样本数据:一象限的部分,因此,令u=1xu 4210.50.25y 161252 1作出散点图,如图所示,可以看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程拟合.计算得u -=1.55,y -=7.2,∑5i =1u i y i =94.25,∑5i =1u 2i =21.3125, 则b ^=∑5i =1u i y i -5u -y -∑5i =1u 2i -5u -2≈4.13,a ^=y --b ^u -≈0.8.从而得到y 关于u 的回归方程为y ^=4.13u +0.8,则y 关于x 的回归方程为y ^=4.13x +0.8.B 级:能力提升练10.二手车经销商小王对其所经营的A 型号二手汽车的使用年数x 与销售价格y (单位:万元/辆)进行整理,得到如下数据:使用年数x 2 3 4 5 6 7 售价y 20 12 8 6.4 4.4 3 z =ln y 3.002.482.081.861.481.10z 关于x 的折线图,如图所示:(1)由折线图可以看出,可以用线性回归模型拟合z 与x 的关系,请用相关系数加以说明;(2)求y 关于x 的回归方程,并预测某辆A 型号二手车当使用年数为9年时售价约为多少.(b ^,a ^小数点后保留两位有效数字)参考公式:b ^=∑i =1n(x i -x -)(y i -y -)∑i =1n(x i -x -)2=∑i =1nx i y i -n x -y -∑i =1nx 2i -n x -2,a ^=y --b ^x -,r =∑i =1n(x i -x -)(y i -y -)∑i =1n(x i -x -)2∑i =1n(y i -y -)2 .参考数据:∑i =16x i y i =187.4,∑i =16x i z i =47.64,∑i =16x 2i =139,∑i =16(x i -x -)2=4.18, ∑i =16(y i -y -)2=13.96, ∑i =16(z i -z -)2=1.53,ln 1.46≈0.38. 解 (1)由题意,知x -=16×(2+3+4+5+6+7)=4.5,z -=16×(3+2.48+2.08+1.86+1.48+1.10)=2,又∑i =16x i z i =47.64,∑i =16(x i -x -)2=4.18, ∑i =16(z i -z -)2=1.53, ∴r =47.64-6×4.5×24.18×1.53=-6.366.3954≈-0.99,∴z 与x 的相关系数大约为-0.99,说明z 与x 的线性相关程度很高. (2)b ^=47.64-6×4.5×2139-6×4.52=-6.3617.5≈-0.36, ∴a ^ =z --b ^x -=2+0.36×4.5=3.62,∴z 与x 的线性回归方程是z ^=-0.36x +3.62,又z =ln y ,∴y 关于x 的回归方程是y ^=e -0.36x +3.62.令x =9,得y ^=e -0.36×9+3.62=e 0.38, ∵ln 1.46≈0.38,∴y ^=1.46,即预测某辆A 型号二手车当使用年数为9年时售价约为1.46万元.。
高中数学 回归分析的基本思想及其初步应用教案 新人教A版必修4-新人教A版高二必修4数学教案
回归分析的基本思想及其初步应用教学目标(1)通过实例引入线性回归模型,感受产生随机误差的原因;(2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法; (3)能求出简单实际问题的线性回归方程. 教学重点,难点线性回归模型的建立和线性回归系数的最佳估计值的探求方法. 教学过程 一.问题情境1. 情境:对一作直线运动的质点的运动过程观测了8次,得到如下表所示的数据,试估根据《数学(必修)》中的有关内容,解决这个问题的方法是: 先作散点图,如下图所示:从散点图中可以看出,样本点呈直线趋势,时间x 与位置观测值y 之间有着较好的线性关系.因此可以用线性回归方程来刻画它们之间的关系.根据线性回归的系数公式,1221()ni i i n i i x y nx y b x n x a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑双基再现1.★下列现象属于相关关系的是( ) A .家庭收入越多,消费也越多 B .圆的半径越大,圆的面积越大C .气体体积随温度升高而膨胀,随压力加大而减小D .在价格不变的条件下,商品销售量越大销售额也越大2.★★在画两个变量的散点图时,下面叙述正确的是( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上 3.★★★由一组样本数据11(,)x y ,22(,)x y ,,(,)n n x y 得到回归直线方程ˆy bx a =+,那么下列说法中不正确的是( ) A .直线ˆybx a =+必经过点(,)x y B .直线ˆybx a =+至少经过点11(,)x y ,22(,)x y,,(,)n n x y 中的一个点C .直线ˆybx a =+的斜率为1221ni ii nii x y nx yXnx ==-⋅-∑∑D .直线ˆybx a =+的纵截距为y bx - 4.★作一个两个变量散点图的主要目的是5.★★同一资料,如果将x 作为自变量,y 作为因变量,得回归系数b ;将y 作为自变量,x 因变量,得回归系数b ',则相关系数r 与,b b '的关系是6.★★★在利用线性回归模型进行预报时,有以下四种说法: ①样本数据是来自那个总体,预报时也仅适用于这个总体; ②线性回归模型具有时效性;③建立模型时自变量的取值范围决定了预报时模型的适用范围,通常不能超出太多; ④在回归模型中,因变量的值不能由自变量的值完全确定. 其中说法正确的有 . (只填你认为正确说法的序号) 变式活学3岁到9岁的身高,数据如下:y=73.93+7.19x,她用这个模型预测儿子10岁时的身高,则下列叙述正确的是()A.她儿子10岁时的身高一定145.83cmB.她儿子10岁时的身高在145.83cm以上C.她儿子10岁时的身高在145.83cm左右D.她儿子10岁时的身高在145.83cm以下8.★★★★(教材1.1例1变式)从某大学中随机选取8名女大学,其身高与体重的数据如(2)如果体重与身高具有相关关系,求回归直线方程,并预测身高为172cm的女大学生的体重.。
高中数学《回归分析的基本思想及初步应用》导学案
第一章统计案例第一节回归分析的基本思想及初步应用(第1课时)一、学习目标1. 1.会对两个变量的相关关系进行分析、判断.2.了解回归分析的基本思想,会对两个变量的具体问题进行回归分析和残差分析,通过求解相关指数判断回归模型的拟合程度.3.掌握用最小二乘法建立回归模型的基本步骤和方法.【重点、难点】最小二乘法建立回归模型的基本步骤和方法;判断刻画模型拟合效果的方法-—相关指数和残差分析.二、学习过程问题1:散点图当研究两个变量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.问题2:相关关系与线性回归相关关系:对于两个,当自变量取值一定时,因变量的取值带有一定的两个之间的关系称为相关关系.相关关系分为相关和相关.函数关系中的两个变量间是一种关系,相关关系是一种关系.线性回归:对具有的两个变量进行的一种常用方法.问题3:残差与残差分析1.残差:样本值与回归值的差叫残差,即.2.残差分析:通过残差来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析.3.残差图:以残差为纵坐标,以样本编号,或身高数据,或体重估计值等为横坐标,作出的图形称为残差图.观察残差图,如果残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,模型拟合精度越高,回归方程的预报精度越高.问题4:相关指数我们用相关指数R2=1-来刻画回归的效果,它表示解释变量对预报变量变化的贡献率.R2的值越大,说明残差平方和越小,即模型拟合的效果越好;R 2的值越小,说明残差平方和越大,即模型拟合的效果越差.R 2越接近于1,表示回归的效果越好,在实际应用中,应该尽量选择R 2大的回归模型.【典型例题】 例1、有下列关系:①人的年龄与他(她)拥有的财富之间的关系; ②已知曲线上点的纵坐标与横坐标之间的关系; ③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系; ⑤圆的周长与面积之间的关系.其中有相关关系的是 .(填写你认为正确的序号)例2、某个体服装店经营某种服装,一周内获纯利润y (元)与该周每天销售这种服装的件数x 之间的一组数据如下:x 3 4 5 6 7 8 9 y66697381899091已知280612=∑=i ix,45309612=∑=i i y ,348761=∑=i i i y x(1)求x ,y ;(2)判断纯利润y 与每天销售件数x 之间是否线性相关,如果线性相关,求出回归直线方程. (3)求相关指数R 2.【变式拓展】1、四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y=2.347x-6.423; ②y 与x 负相关且y=-3.476x+5.648; ③y 与x 正相关且y=5.437x+8.493;④y 与x 正相关且y=-4.326x-4.578. 其中一定不正确的结论的序号是( ).A.①②B.②③C.③④D.①④2、某企业想通过做广告来提高自己的知名度,经预测可知本企业产品的广告费x (单位:百万元)与销售额y (单位:百万元)之间有如下对应数据:x 2 4 5 6 8 y3040605070(1)画出散点图; (2)求回归直线方程;(3)据此估计广告费用为10销售收入y 的值。
高中数学 专题1.1 回归分析的基本思想及其初步应用(第2课时)教案 2数学教案
回归分析的基本思想及其初步应用(第二课时)【学情分析】:学生已掌握建立线性回归模型的知识,并能用所学知识解决一些简单的实际问题。
在教学中,要结合实例让学生了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和。
初步了解可以通过求回归模型的相关指数或利用残差分析不同的回归模型的拟合精确度。
在起点低的班级中注重让学生参与实践,鼓励学生通过收集数据,经历数据处理的过程,从而进一步体会回归分析中的数理计算,初步形成运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。
让学生直观的观察、思考,借助于线性回归模型研究呈非线性关系的两个变量之间的关系。
【教学目标】:(1)知识与技能:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和;了解偏差平方和分解的思想;了解判断刻画模型拟合效果的方法——相关指数和残差分析;了解非线性模型通过变换转化为线性回归模型。
(2)过程与方法:本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线方程,从中也找出存在的不足,从而有进行回归分析的必要性,进而学习相关指数,用相关指数来刻画回归的效果。
(3)情感态度与价值观:从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求知欲,培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进取。
【教学重点】:1、了解判断刻画模型拟合效果的方法——相关指数和残差分析;2、通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型。
【教学难点】:1、解释残差变量的含义;2、了解偏差平方和分解的思想。
【课前准备】:课件【教学过程设计】:化为新变量的数据,然后让学生给出每种线性回归模型的参数估计。
生:以组为单位进行数据变换,求参数的最小二乘估计(可以用计算器)解答过程如下:令1ln c a =,2c b =,即bx a z +=分析x 与z 之间的关系,通过画散点图(如下图),可知x 与z 之间是存在着线性回归关系,可以用最小二乘法求出线性回归方程bx a z +=列表计算出各个量 编号 1234567合计温度x /°C21232527293235192产卵数y /个711212466115325569z =ln y1.9462.3983.045 3.1784.1904.7455.78425.285x i 2 441 529625729841 1024 1225 5414 x i z i40.9 55.2 76.1 85.8121.5151.8202.4733.7=x 27.429 =z 3.612变量的非线性关系经过变换后转化为另外两个变量的线性关系的方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
河北省二十冶综合学校高中分校高考数学总复习 回归分析的基本思想及其初步应
用学案
【学习目标】:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.
【学习重点】:利用散点图直观认识两个变量之间的线性关系,求线性回归直线方程。
【学习难点】:求线性回归直线方程。
【教学过程】:一:回顾预习案
1、线性回归方程a x b y ˆ+= ,其中1
221ˆn i i
i n i i x y nx y b x
nx ==-=-∑∑,x b y a
ˆˆ-= ●2、y 与x 之间的线性回归方程a
x b y ˆ+= 必定过(x ,y )点 3,练习(1)已知某车间加工零件的个数x 与所花费时间y (h )之间的线性回归方程为y ^=0.01x +0.5,则加工
600个零件大约需要__________h 。
A .6.5
B .5.5
C .3.5
D .0.5
(2)工人月工资y (元)依劳动生产率x (千元)变化的回归方程y ^
=50+80x ,下列判断正确的是( )A .劳动生产率为1000元时,工资为130元;
B .劳动生产率提高1000元时,则工资提高80元;
C .劳动生产率提高1000元,则工资提高130元;
D .当月工资为210元时,劳动生产率为2000元.
(3)某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )
A.y ^=-10x +200
B.y ^=10x +200
C.y ^=-10x -200
D.y ^=10x -200
(4)已知x 与y 之间的一组数据:
则y 与x 的线性回归方程y =b ^x +a ^必过( )
A .(2,2)点
B .(1.5,0)点
C .(1,2)点
D .(1.5,4)点
(5)在一次实验中,测得(),x y 的四组值分别是()1,2A ,()2,3B ,()3,4C ,()4,5D ,则y 与x 之间的回归直线方程为( )
A . 1y x =+
B . 2y x =+
C . 21y x =+
D . 1y x =-
(6)已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是
A .423.1+=x y
B .523.1+=x y
C .08.023.1+=x y
D .23.108.0+=x y
(7)、某种产品的广告费支出x 和销售额y (单位:百万元)之间有如下一组数据;
(2)求出线性回归方程;
(3)预测若想要得到9千万的销售额,需投入广告费多少?
4,新知学习:研究课本第2页的例1,回答下列问题:
(1)________称为样本点的中心,b 是回归直线的_____的估计值。
(2)线性回归方程为:712.85849.0-=x y 说明身高x 每增加1个单位,体重y 就增加_____个单位。
(3)女大学生的体重y 和身高x 之间的关系并不能用一次函数y bx a =+来严格刻画,可以用下面的线性回归模型y bx a e =++来表示 ,其中a 和b 为模型的未知参数,e 称为________ (4)自变量x 称为________,变量y 称为________。
(5)残差: ,残差平方和________。
●(6)我们用2
R 来刻画回归的效果: 2R 越 ,残差平方和越 ,模型的拟合效果越好,
2R 越 ,残差平方和越 ,模型的拟合效果越差,
2R 表示________对于________变化的贡献率,2R 越接近于 ,表示回归的效果越好。
当节练习:(1)散点图在回归分析过程中的作用是( )
A .查找个体个数
B .比较个体数据大小关系
C .探究个体分类
D .粗略判断变量是否线性相关
(4)在两个变量y 与x 的回归模型中,分别选择了四个不同的模型,它们的相关指数2
R 如下,其中拟合效果最好的为( )(A )模型①的相关指数为976.0 (B )模型②的相关指数为776.0 (C )模型③的相关指数为076.0 (D )模型④的相关指数为351.0。