3-1.1回归分析的基本思想及其初步应用(第3课时)
3.1回归分析的基本思想及其初步应用
1.1回归分析的基本思想 及其初步应用
2 [普通高中课程数学选修2-3] 3.1 回归分析的基本思想及其初步应用
1.正方形边长x与面积S之间的关系: 正方形边长x
确定关系
x2 面积S
2.一块农田的水稻产量与施肥量之间的关系:
625 21
y
729 24
841 1024 1225 66 115 325
y
散点并不集中在一条直线的附近,因此用线 性回归模型拟合他们的效果不是最好的。
21[普通高中课程数学选修2-3] 3.1 回归分析的基本思想及其初步应用
ˆ bx 2 a ˆ 设为y ˆ
t x2
ˆ ˆ ˆ y bt a
ˆ 残差平方和 ( yi yi ) 2 越小, R 2越接近1,回归效果越好.
i 1 n
15[普通高中课程数学选修2-3] 3.1 回归分析的基本思想及其初步应用
注意
用身高预报体重时,需要注意下列问题:
1、回归方程只适用于我们所研究的样本的总体;
2、我们所建立的回归方程一般都有时间性;
3、样本采集的范围会影响回归方程的适用范围;
模拟效果较好,回归方程预报精度较高.
24[普通高中课程数学选修2-3] 3.1 回归分析的基本思想及其初步应用
小
实际问题 y = f(x) 抽样
结
样本分析 y = f(x)
回归模型 y = f(x)
身高172cm女大学生体重 ˆ y = 0.849×172 - 85.712 = 60.316(kg)
12[普通高中课程数学选修2-3] 3.1 回归分析的基本思想及其初步应用
回归分析的基本思想及其应用(三)
第42课时 回归分析基本思想及其初步应用( 三)学习目标:1、掌握线性回归模型与线性回归方程的关系及其参数、变量的意义;2、了解将非线性回归问题转化为线性回归问题的方法; 教学重点;非线性回归问题转化为线性回归问题的方法 教学难点:非线性回归问题转化为线性回归问题 教学工具:Powerpoint 、Excel 教学过程:(一) 复习引入1、(1))(∧∧+-=-=a x b y y y e i i i i i (i =1,2,……,n )称为相应于点(x i ,y i )的残差(residual ),它是随机误差e i =y i -(bx i +a ) (i =1,2,……,n )的估计值. (2)回归模型拟合效果评价①残差分析法:残差点比较均均地落在水平的带状区域中,说明选用的模型比较适合. 这样的带状区域越窄,说明模型的拟合精度越高,回归方程的预报精度越高.②相关指数法:定义相关指数∑∑==∧---=ni i ni i i y y y y R 12122)()(1, 其表示解释变量对预报变量变化的贡献率,R 2越接近1,表示回归效果越好.(二) 推进新课例1为了研究某种细菌随时间x (天)变化繁殖的个数,收集数据如右:(1)用天数作解释变量,繁殖个数为预报变量,作出这些数据的散点图; (2)描述解释变量与预报变量之间的关系,试建立y 关于x 回归方程. 解:根据收集的数据作出散点图.在散点图中,样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,不能直接利用线性回归模型来刻画两个变量之间的关系.根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线xc ec y 21=的周围,其中21c c 和是待定参数.或者也可以认为样本点集中某二次曲线423c xc y +=的附近,其中43c c 和是待定参数.(方案一)若用xc ec y21=模型拟合,则令abx z c b c a y z+====时,21,ln ,ln 为线性直线的附近,因此可以且线性回归方程来拟合.由上表中的数据,用计算器或Excel 得到线性回归方程为:116.16902.0+=∧x z ,因此细菌繁殖个数关于天数的非线性回归方程为:116.16902.0+∧=x ey(方案二)若用423c xc y+=模型拟合,令2xt=,则43c t c y+=为线性回归模型,下面是布在一条直线的周围,因此不宜用线性回归方程来拟合它,即不宜用二次函数423c xc y +=来拟合y 和x 之间的关系.当然对于上表中的数据用计算器或Excel 也可以得到“线性回归”方程为:46.14096.5-='∧t y ,因此细菌繁殖个数关于天数的另一个非线性回归方程为:46.14096.52-='∧xy思考:怎样评价以上两个模型的拟合效果?其中∧e =116.16902.0+∧-=-x ey y y,)46.14096.5(2--='-='∧∧xy y y e从表中的残差∧e 、∧'e 可以看出,指数函数模型的|∧e |显然要比二次函数模型的|∧'e |小,因此指数函数模型拟合效果比二次函数模型的拟合效果好. 方法二:相关指数法下面给出两个回归模型的相关指数22,R R '计算由上面的残差分析法易知:54.6)(261612=-=∑∑=∧=∧i i i i i y y e ,73.1403)(261612='-='∑∑=∧=∧i i i i i y y e又因83.24642)(261=-∑=i i y y , 所以2R=9997.083.2464254.61=-,2R '=94304.083.2464273.14031=-显然22R R '>,因此指数函数模型拟合效果比二次函数模型的拟合效果好.知识形成:1、两个非线性相关回归模型确定 (1)画散点图;(2)观察图并根据经验判断适合何种模型; (3)恰当变换,转化成线性回归模型;(4)检验模型的拟合效果.(根据相关指数R 2越大,模型拟合精度越高来优选.)(三)典例分析1、对于下列非线性回归模型相应的回归方程,请做适当的变换,使成为线性回归方程;(1)y =cx 2+d ,令t =x 2,可得dct y+=∧;(2),c xk y +=令xt 1=,可得ckt y+=∧;(3),ln d x c y +=令x t ln =,可得dct y+=∧;(4))0(>=c ceydx,令ytln =,可得cdx tln +=∧;2、已知两个变量的非线性回归方程为xy22.1⨯=∧,则样本点(1,4)的残差为 1.6 .3、已知样本点(1,2.25)、(2,1.85)、(3,1.64)、(4,1.46)满足的回归模型,c xk y+=则通过变换变成线性回归模型后新的样本点的中心为( D )A (0.50,1.72)B (0.50,1.74)C (0.54,1.76)D (0.52,1.80) 4、如果用指数函数模型xc ec y 21=拟合原始模型,设yzln =,且(z x ,)为(165.25,3.99),则回归方程为( C )A 712.85849.0-=x e y B712.85849.0--=x ey C3295.10161.0+=x ey D3295.10161.0+-=x ey5、已知两相关变量 x ,y 的三组观测值如下表: 根据经验知y 对x 的回归模型为abxy+=2,试求出该回归方程.解:令t =x 2,则y 与t 的回归方程为y =bt +a . 相关数据为:则30431=∑=i i i y t ,338,667.7,667.8612===∑=i it y t所以有929.033261231≈-⨯-=∑∑==∧tt yt y t b i ii i ixb y a ∧∧-==-0.385,所以y 与t 的回归方程为385.0929.0-='∧t y ,由t =x 2得y 与x 的回归方程为385.0929.02-='∧x y(四)巩固练习P 导航66页T 1-4 (五)课时小结1非线性回归模型求解及拟合效果检验;2常见非线性回归模型变换为线性回归模型 (六)作业P 教材90页,T 2。
回归分析的基本思想及初步应用
回归分析的基本思想及初步应用回归分析是一种用于研究变量之间关系的统计方法。
其基本思想是通过建立一个数学模型来描述自变量(独立变量)和因变量(依赖变量)之间的关系,并根据已有数据对模型进行拟合和估计,以了解两个变量之间的关系程度。
回归分析最早是由英国统计学家弗朗西斯·高尔顿在19世纪中叶提出的。
他注意到,人口增长与时间之间似乎存在其中一种关系,于是使用统计方法将时间作为自变量,人口数量作为因变量,建立了一个数学模型。
这个数学模型称为“回归方程”,后来成为了回归分析的基础。
在建模阶段,我们首先要确定自变量和因变量,并根据问题目标和已有数据选取适当的变量。
然后,我们需要选择一个适当的回归模型来描述自变量和因变量之间的关系。
常见的回归模型包括线性回归模型、多项式回归模型、指数回归模型等。
模型的选择通常基于对自变量和因变量之间关系的推测和理论的支持。
同时,还需要根据数据特点和拟合效果选择回归模型的阶数和形式。
在推断阶段,我们需要对模型进行估计和检验。
首先,我们使用已有数据对回归模型进行拟合,根据最小二乘法估计出回归系数的值,并计算出模型预测的因变量值。
然后,通过各种统计方法对模型的拟合程度进行评估。
常用的评估指标有残差分析、R平方和调整R平方等。
此外,还可以进行t检验和F检验来检验回归系数和模型整体的显著性。
这些检验能够帮助我们判断回归模型是否能够很好地描述自变量和因变量之间的关系,并对未来值进行预测和推断。
回归分析的应用非常广泛。
它在社会科学、经济学、医学、生态学等领域都有着重要的应用。
在经济学中,回归分析可以用于预测和解释宏观经济变量之间的关系,如GDP与就业率之间的关系。
在医学中,回归分析可以用于研究因素对疾病发生的影响,如吸烟与肺癌之间的关系。
此外,回归分析还可以用于分析市场需求、产品定价、销售预测等问题,为决策提供科学依据。
总而言之,回归分析是一种用于研究变量关系的重要统计方法。
通过建立数学模型,估计和检验回归系数,可以帮助我们了解变量之间的关系程度,并利用这种关系进行预测和推断。
回归分析的基本思想及其初步应用
t检验用于检验单个自变量对因变量的影响是否显著。如果t检验的P值小于显著性水平,则认为该自变 量对因变量的影响是显著的。
回归系数的解释
偏效应
回归系数表示在其他自变量保持不变 的情况下,某一自变量变化一个单位 时因变量的平均变化量。它反映了自 变量对因变量的偏效应。
标准化回归系数
为了消除自变量量纲的影响,可以对 回归系数进行标准化处理。标准化回 归系数表示自变量和因变量的标准化 值之间的相关系数,具有可比性。
03
回归分析的初步应用
一元线性回归分析
01
建立一元线性回归模型
通过收集样本数据,以自变量 和因变量的线性关系为基础, 建立一元线性回归模型。
02
参数估计
利用最小二乘法等估计方法, 对模型中的参数进行估计,得 到回归方程的系数。
03
假设检验
对回归方程进行显著性检验, 判断自变量和因变量之间是否 存在显著的线性关系。
通过调整模型参数或引入新的 变量等方式优化模型,提高模 型的拟合精度和预测能力。
逐步回归分析
1 引入变量
从所有自变量中逐步引入对因变量有显著影响的变量, 建立初始回归模型。
2 检验与调整
从所有自变量中逐步引入对因变量有显著影响的变量, 建立初始回归模型。
3 逐步筛选
从所有自变量中逐步引入对因变量有显著影响的变量, 建立初始回归模型。
立
详细阐述了线性回归模型的构建 过程,包括模型的假设、参数的 估计和模型的检验等步骤。
回归分析的初步应
用
通过实例演示了回归分析在解决 实际问题中的应用,包括预测、 解释变量关系和控制变量等方面 的应用。
对未来学习的建议与展望
深入学习回归分析的理论知识
3.1.1回归分析的基本思想及其初步应用 (教学用)
2
此项为0,Q有最小值. xi x yi y n 2 i 1 yi y . n 2 i 1 x x i i 1 后两项与α,β无关
n
2
在上式中, 后两项和 , 无关, 而前两项为非负 数,因此要使Q取最小值,当且仅当前两项的值 均为0,即有
n
2
yi xi y x 2 yi xi y x
2 i 1
n
i 1
y x y x
yi xi y x
价格x
需求量Y
14
12
16
10
18
7
20
5
22
3
求出Y对的回归直线方程,并说明拟合效果的好坏. 列出残差表为
x x y y
i 1 i i
n
x x
i 1 i
n
, y x .
2
这正是我们所要推导的公式.
相关系数
1.计算公式
r=
(x
i=1 n i=1
n
i
- x)(y i - y)
n
2 2 (x x) (y y) i i i=1
i 1
n
n n y x yi xi n y x i 1 i 1
y x ny n x n y x 0,
所以Q , yi xi y x n y x
r>0正相关;r<0负相关.通常,
1-1-3回归分析的基本思想及初步应用
3.1.3回归分析的基本思想及其初步应用编辑:梁显振 校对:孙宜俊学习目标:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法.教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较.教学过程:一、知识链接:1. 给出例3:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间的回归方程.发现样本点并没有分布在某个 带状区域内,即两个变量不呈线 性相关关系,所以不能直接用线 性回归方程来建立两个变量之间 的关系.二、新课探究:1). 探究非线性回归方程的确定:① 如果散点图中的点分布在一个直线状带形区域,可以来建模;如果散点图中的点分布在一个 形区域,就需选择非线性回归模型来建模.② 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y =2C 1e x C 的周围(其中12,c c 是待定的参数),故可用 来拟合这两个变量.③ 在上式两边取对数,得21ln ln y c x c =+,再令ln z y =,则21ln z c x c =+,分布在一条直线的附近,因此可以用线性回归方程来拟合.④ 利用计算器算得 3.843,0.272a b =-=,z 与x 间的线性回归方程为0.272 3.843zx =- ,因此红铃虫的产卵数对温度的非线性回归方程为 0.272 3.843x y e -=.⑤ 利用回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行. 其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题. 2)命题规律:1、通过观察散点图,发现两个变量之间的关系可以用某个函数来拟合。
2、通过适当变形,将拟合的非线性函数转化成相应的线性方程。
3、求出线性回归方程中的参数,再转化为原函数式。
3.1回归分析的基本思想及其初步应用
(3)由经验确定回归方程的类型(如我们观察到数据呈 线性关系,则选用线性回归方程). ( 4)按 一 定 规 则 ( 如 最 小 二 乘 法 )估 计 回 归 方 程 中 的 参 数 .
(5)得出结果后分析残差图是否有异常(如个别数据对 应残差过大,残差呈现不随机的规律性等),若存在异常, 则检查数据是否有误,或模型是否合适等.
对于一组具有线性相关关系的数据
x1, y1 ,x2, y2 ,,xn , yn ,
我们知道其回归直线y = bx + a的斜率和截距 的最小二乘估计分别为
n
xi x yi y
bˆ i1 n
,
1
aˆ y bˆx,
2
xi x 2
i 1
这正是我们所要推导的公式.
下面我们通过案例 ,进一步学习回归分析的基本 思想及其应用.
例1 从某大学中随机选取8名女大学生,其身高和体 重数据如表 3-1所示.
表 3-1 编号 1 2 3 4 5 6 7 8
身 高 / cm 165 165 157 170 175 165 155 170 体 重 /kg 48 57 50 54 64 61 43 59
4.不能期望回归方程得到的预报值就是预报变量的 精 确 值.事 实 上, 它 是 预 报 变 量 的 可 能 取 值 的 平 均 值. 一 般 地 ,建 立 回 归 模 型 的 基 本 步 骤 为 :
( 1)确 定 研 究 对 象 ,明 确 哪 个 变 量 是 解 释 变 量 ,哪 个 变 量是预报变量. ( 2)画 出 解 释 变 量 和 预 报 变 量 的 散 点 图 ,观 察 它 们 之 间
第三章 统计案例
1.1回归分析的基本思想及其初步应用
2 (y y ) i 为确定的数. i1 n
因此R2越大,意味着残差平方和
2 (y y ) i i 1
n
越小,即模型的拟合效果越好;反之,越差.
用身高预报体重时,需要注意以下问题
从某大学中随机选取8名女大学生,其身 高和体重数据如下表所示: 编 号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59 求根据一名女大学生的身高预报她的体重 的回归方程,并预报一名身高为172cm的女大 学生的体重.
ˆ = 3.5 - 0.7 4.5 = 0.35 ˆ = Y - bX a
故线性回归方程为y=0.7x+0.35. (3)根据回归方程的预测,现在生产100吨产品 消耗的标准煤的数量为0.7×100+0.35=70.35.
课堂练习
1.选择
(1)下列说法中正确的有:( C ) ①若r>0,则x增大时,y也相应增大; ②若r<0,则x增大时,y也相应增大; ③若r=1或r=-1,则x与y的关系完全对应(由 函数关系),在散点图上各个点均在一条直线上 A. ① ② B. ② ③ C. ① ③ D. ① ② ③
解析:
若r>0,表示两个相关变量正相关,x增大
时,y也相应增大,故①正确. r<0,表示两个变
量负相关,x增大时,y也相应减小,故②错误.
|r|越接近1,表示两个变量相关性越高,|r|=1表 示两个变量有确定的关系(即函数关系),故 ③正确.
3-1.1回归分析的基本思想及其初步应用(第3课时)-zyw
1.1回归分析的基本思想及其初步应用(第三课时)课型:新授 执笔:张一为 时间:2007-3-3学号:__________ 姓名:_____________教学目标:1.由“散点图”选择适当的数据模型,以拟合两个相关变量。
虽然任何两个变量的观测数据都可以用线性回归模型来拟合,但不能保证这种拟合模型对数据的拟合效果最好。
为更好地刻画两个变量之间的关系,要根据观测数据的特点来选择回归模型。
2.通过探究使学生认识到:有些 线性模型非线性模型转换−−→− ,即借助于线性回归模型研究呈非线性关系的两个变量之间的关系:⎩⎨⎧⇒⇒归模型来拟合数据作变换,在利用线性回区域分布在一个曲线状带形合数据;选用线性回归模型来拟区域分布在一个直线状带形散点图 ①如模型为:12ln 1212lnc x c z lnc x c lny e c y z y x c +=−−−−→−+=−−−→−==转换:令取自然对数②如模型为:212212c t c y c x c y t x +=−−−−→−+==转换:令3.初步体会不同模型拟合数据的效果。
计算不同模型的相关指数,通过比较相关指数的大小来比较不同模型的拟合效果。
(这只是模型比较的一种方法,还有其他方法。
)教学重点:体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:了解常用函数的图像特点,选择不同的模型建模,并通过比较相关指数(如“残差平方和”)对不同的模型进行比较优劣。
教学过程:1.回忆:建立模型的基本步骤;2.新课: (例2)①背景分析,画散点图;②观察散点图,分析解释变量与预报变量更可能是什么函数关系;③建立数学模型;④转换:将非线性模型通过变换转化成线性模型;⑤对数据进行变换后,对新数据建立线性模型,求出回归方程;⑥再转换:转化为原来变量的模型(方程),并计算相关指数(“残差平方和”或R 2),比较两个不同模型的拟合效果。
3.1回归分析的基本思想及其初步应用
第三章、统计案例3.1回归分析的基本思想及其初步应用(共计4课时) 授课类型:新授课一、教学内容与教学对象分析学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。
二、学习目标1、知识与技能通过本节的学习,了解回归分析的基本思想,会对两个变量进行回归分析,明确建立回归模型的基本步骤,并对具体问题进行回归分析,解决实际应用问题。
2、过程与方法 本节的学习,应该让学生通过实际问题去理解回归分析的必要性,明确回归分析的基本思想,从散点图中点的分布上我们发现直接求回归直线方程存在明显的不足,从中引导学生去发现解决问题的新思路—进行回归分析,进而介绍残差分析的方法和利用R 的平方来表示解释变量对于预报变量变化的贡献率,从中选择较为合理的回归方程,最后是建立回归模型基本步骤。
3、情感、态度与价值观 通过本节课的学习,首先让显示了解回归分析的必要性和回归分析的基本思想,明确回归分析的基本方法和基本步骤,培养我们利用整体的观点和互相联系的观点,来分析问题,进一步加强数学的应用意识,培养学生学好数学、用好数学的信心。
加强与现实生活的联系,以科学的态度评价两个变量的相关系。
教学中适当地增加学生合作与交流的机会,多从实际生活中找出例子,使学生在学习的同时。
体会与他人合作的重要性,理解处理问题的方法与结论的联系,形成实事求是的严谨的治学态度和锲而不舍的求学精神。
培养学生运用所学知识,解决实际问题的能力。
三、教学重点、难点教学重点:熟练掌握回归分析的步骤;各相关指数、建立回归模型的步骤;通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:求回归系数 a , b ;相关指数的计算、残差分析;了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。
1.1回归分析的基本思想及其初步应用第3课时
§1.1 回归分析的基本思想及其初步(三)【学情分析】:教学对象是高二文科学生,学生已经学会建立回归模型的基本步骤,并有检验回归方程的拟合精确度的方法,并能解决一些实际问题。
两个变量不呈线性关系,不能直接利用线性回归方程建立两个变量的关系,通过探究使学生体会对回归模型的选择,非线性模型可以通过变换转化为线性回归模型,让学生直观的观察、思考,借助于线性回归模型研究呈非线性关系的两个变量之间的关系,并通过回归分析体会不同模型拟合数据的效果。
【教学目标】:(1)知识与技能:了解回归模型的选择;进一步理解非线性模型通过变换转化为线性回归模型;体会不同模型拟合数据的效果。
(2)过程与方法:从实例出发,求出相应的回归直线方程,从中也找出存在的不足,从而有进行回归分析的必要性,通过学习相关指数,用相关指数来刻画回归的效果,进而归纳出回归分析的一般步骤,并对具体问题进行回归分析,用于解决实际问题。
(3)情感态度与价值观:任何事物都是相对的,但又有一定的规律性,我们只要从实际出发,不断探求事物的内在联系,就会找出其中的规律性,形成解决实际问题的方法和能力。
【教学重点】:1、加深体会有些非线性模型通过变换可以转化为线性回归模型;2、了解在解决问题的过程中寻找更好的模型的方法。
【教学难点】:1、了解常用函数的图像特点,选择不同的模型建模;2、通过比较相关指数对不同的模型进行比较。
【课前准备】:课件【教学过程设计】:i yˆi i i y y e ˆˆ-=()22ˆˆy y e -=()()98.0ˆ112122=---=∑∑==niiniiiyyyyR二次函数模型的相关指数从相关指数的计算结果来看,指数函数模型的2R比二次函数模型的2R更接近于1,所以指数函数模型的回归效果好。
再从残差图看:从图中可看出指数函数模型的残差点比较均匀地落在水平的带状域中,所以指数函数模型拟合精度较二次函数模型的高。
通过学生自己动手计算感受,归纳判断模型拟合效果的方法:⑴可以通过变换后的散点图观察两个新变量之间是否存在线性回归方程;⑵通过残差分析比较两种模型的拟合效果。
回归分析的基本思想及其初步应用(用三课时)
对于一组具有线性相关关系的数据 (x1,y1),(x2,y2),...,(xn,yn),
其回归直线方程为 yˆ bˆx aˆ 此直线叫做回归直线。
其回归方程的截距和斜率的最小二乘估计公式分别为: 最
n
n
y bˆ
i1
(xi
n
x)(yi (xi x)2
y)
xi
i1
n
xi2
nxy
i
,
2
nx
吗?如果不是,你能解析一下原因吗?
答:身高为172cm的女大学生的体重不一定是60.316kg,但一般可以认 为她的体重接近于60.316kg或在60.316kg 左右。即,用这个回归方程不 能给出每个身高为172cm的女大学生的体重的预测值,只能给出她们平 均体重的值。
从散点图看到,样本点散布在某一条直线的附近,而不是在一条直线上, 所以不能用一次函数y=bx+a描述它们关系。
注意:1)残差分析步骤:
1)计算每组数据的残差,即样本值减预测值 (yi y i )
2)画残差图。纵残差图的制作:
坐标纵轴为残差变量,横轴可以有不同的选择. 横轴为编号:可以考察残差与编号次序之间的关系,常用于调查
数据错误. 横轴为解释变量:可以考察残差与解释变量的关系,常用于研究
2)函数关系中的两个变量间是一种确定性关系 相关关系是一种非确定性关系 函数关系是一种理想的关系模型 相关关系在现实生活中大量存在,是更一般的情况
如:人的身高与年龄;产品的成本与生产数量 商品的销售额与广告费;家庭的支出与收入。等等
一.回顾复习
问题1:正方形的面积y与正方形的边长x之间
的函数关系是 y = x2
i=1
=
i=1 n
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.1回归分析的基本思想及其初步应用(第三课时)
学习目标:1.由“散点图”选择适当的数据模型,以拟合两个相关变量。
虽然任何两个变量的观测数据都可以用线性回归模型来拟合,但不能保证这种拟合模型对数据的拟合效果最好。
为更好地刻画两个变量之间的关系,要根据观测数据的特点来选择回归模型。
2.通过探究使学生认识到:有些 线性模型非线性模型转换
−−→
− ,即借助于线性回归模型研究呈非线性关系的两个变量之间的关系: ⎩⎨⎧⇒⇒归模型来拟合数据作变换,在利用线性回区域分布在一个曲线状带形
合数据;选用线性回归模型来拟区域分布在一个直线状带形散点图 ①如模型为:12ln 1212lnc x c z lnc x c lny e c y z y x c +=−−−−→−+=−−−→−==转换:令取自然对数
②如模型为:212212
c t c y c x c y t x +=−−−−→−+==转换:令 3.初步体会不同模型拟合数据的效果。
计算不同模型的相关指数,通过比较相关指数的大小来比较不同模型的拟合效果。
(这只是模型比较的一种方法,还有其他方法。
)
学习重点:体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
学习难点:了解常用函数的图像特点,选择不同的模型建模,并通过比较相关指数(如“残差平方和”)对不同的模型进行比较优劣。
学习过程:
一.复习回顾:1、请写出建立回归模型的基本步骤为:
1)____________________________________________________
2)____________________________________________________
3)____________________________________________________
4)____________________________________________________
5)____________________________________________________
2.在线性回归模型中,以下哪些量的变化表示回归的效果越好( )
A )总偏差平方和越小
B )残差平方和越小
C )回归平方和越大
D )相关指数R 2越大
二、例题学习:
例2.(课本P86)一只线铃虫的产卵数y 和温度x
有关,现收集了7组观测数据列于表中,试建立y
与x 之间的回归方程。
1)画出散点图
2)两个变量呈线性关系吗?不是的话,请说
出它的图象与哪个函数的图象相似。
答:_______________________
3)可设y=
4)如何把指数关系变为线性关系,可令
z= ,则 ______________________
5)列表 x 21 23 25 27 29 32 35
z
x 21 23 25 27 29 32 35 y 7 11 21 24 66 115 325
6)画散点图
7)求回归方程:z=
8)非线性回归方程为
y=
想想: 如果用二次曲线来拟合应如何设计,请
按上面的步骤写出来.
7911131517192123252729313335
三、小结
1)、通过本节课你掌握了什么?
2)、如何通过变换把非线性模型转化为线性回归模型
四、课后练习:
1.在进行回归分析时,预报变量的变化由()决定
A)解释变量 B)残差变量 C)解释变量与残差变量 D)都不是
2.函数关系与相关关系的区别是
3.在线性回归模型中,以下哪些量的变化表示回归的效果越好()
A)总偏差平方和越小 B)残差平方和越小 C)回归平方和越大 D)相关指数R2越大
4.如果在散点图中所有的样本点都在一条直线上,那么解释变量和预报变量之间的相关系数是() A)
—1 B)0 C)1 D)2
5.总体偏差平方和为287,残差平方和120,那么解释变量对总效应约贡献了
6.当样本点并没有分布在某个带状区域内,而是分布在某一条指数函数曲线周围,我们通过对数变换把指数关系变为线性关系,可令,令到变换后的样本点分布在某条直线的周围。
*
7.为了探讨高一男生跳高成绩与下肢爆发力的关系,随机测得12名学生的立定跳远和跳高成绩见下表:(单位:m)
立定跳远(x) 2.08 2.30 2.12 1.95 2.10 2.35 2.15 2.25 1.80 2.06 2.04 2.26
跳高(y) 1.20 1.28 1.15 1.08 1.22 1.30 1.16 1.24 1.06 1.12 1.10 1.26 (1).用跳远作为解释变量,跳高作为预报变量,作出这些数据的散点图。
(2).请根据散点图简单描述这些学生的立定跳远和跳高成绩之间的关系。
(3).计算回归方程。
(4).假定某个高一男生的立定成绩为2.20m ,请预报他的跳高成绩。
预报值一定是他的跳高成绩吗?
为什么?。