回归模型的建立与分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

x
1
2
3
4
5
6
Z 1.79 2.48 3.22 3.89 4.55 5.25
由计数器算得 Zˆ =0.69X 1.112 则有 yˆ=e0.69x1.112
(3) yˆ
6.06 12.09 24.09 48.04 95.77 190.9
y
6
12 25
49
95
190
n
n
n
n
eˆi2 ( yi yˆi )2 3.1643, ( yi y)2 yi2 ny2 25553.3.
6
6
x2i =2 275,xiyi=1 076.2
i=1
i=1
计算得,^b≈0.183,^a≈6.285, 所求回归直线方程为^y =0.183x+6.285. (2)列表如下: yi-^yi 0.05 0.005 -0.08 -0.045 0.04 0.025 yi--y -2.24 -1.37 -0.54 0.41 1.41 2.31
【例2】 下表为收集到的一组数据:
x 21 23 25 27 29 32 35 y 7 11 21 24 66 115 325
(1)作出x与y的散点图,并猜测x与y之间的关系; (2)建立x与y的关系,预报回归模型并计算残差; (3)利用所得模型,预报x=40时y的值. 审题指导 (1)画出散点图或进行相关性检验,确定两变 量x、y是否线性相关.由散点图得x、y之间的回归模型. (2)进行拟合,预报回归模型,求回归方程.
n

yi--y 2
i=1
_预__报__变量变化的贡献率,R2 越接近于 1,表 示回归的效果越好
引导探究
【例1】 为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影 响,对不同重量的6个物体进行测量,数据如下表所示:
x5
10 15 20 25 30
y 7.25 8.12 8.95 9.90 10.9 11.8
(1)作出散点图并求线性回归方程; (2)求出R2; (3)进行残差分析. [思路探索] 作残差分析时,一般从以下几个方面予以说 明:(1)散点图;(2)相关指数;(3)残差图中的异常点和样 本点的带状分布区域的宽窄.
[自主解答] (1)散点图如图
-x =16(5+10+15+20+25+30)=17.5, -y =16(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,
3.刻画回归效果的方式
数据点和它在回归直线上相应位置的差异(yi-y^i)是随
残差
机误差.称e^i=yi-y^i 为残差,e^i 称为相应于点(xi,yi)的
n
残差. (yi-y^i)2 称为残差平方和
i=1
残差 图
利用图形来分析残差特性,作图时纵坐标为__残__差_, 横坐标可以选为_样__本__编__号__,或_身__高__数__据__,或 _体__重__估__计__值__等,这样作出的图形称为残差图
x 21 23 25 27 29 32 35 z 1.946 2.398 3.045 3.178 4.190 4.745 5.784
求得回归直线方程为^z =0.272x-3.849,
∴^y =e0.272x-3.849.
(8 分)
残差
yi
7
11
21
24
66
115 325
^yi 6.443 11.101 19.125 32.950 56.770 128.381 290.325
y/个
3
4
25 49
56
95 190
(1)用天数作解释变量,繁殖个数作预报变量,作出这些
数据的散点图; (2) 描述解释变量与预报变量
繁殖个数
之间的关系;
(3) 计算残差、相关指数R2.
解:(1)散点图如右所示
天数
的周(围2,)于由是散令点Z图=l看n出y,样则本点分布在一条指数函数Cy=1eC2x
i=1
i 1
Leabharlann Baidu
i 1
i=1
R2 1 3.1643 0.9999. 25553.3
即解释变量天数对预报变量繁殖细菌得个数解释了99.99%.
强化补清
完成教材全解相关内容
目标升华:
一般地,建立回归模型的基本步骤为:
(1)确定研究对象,明确哪个变量是解释变量,哪个变量 是预报变量。
(2)画出确定好的解释变量和预报变量的散点图,观察它 们之间的关系(如是否存在线性关系等)。
(3)由经验确定回归方程的类型(如我们观察到数据呈线 性关系,则选用线性回归方程y=bx+a).
独立自学
1.回归分析 回归分析是对具有_相__关__关__系__的两个变量进行统计分析的一 种常用方法.
2.线性回归模型 (1)由散点图易发现,样本点散布在某一条直线附近,而不 是一条直线上,不能用一次函数y=bx+a描述它们之间的 关系,因此用线性回归模型y=bx+a+e来表示,其中a、b 为未知参数,e为_随__机__误__差__ .
^ei 0.557 -0.101 1.875 -8.950 9.23 -13.381 34.675
(3)当x=40时,y=e0.272x-3.849≈1 131.
(10分) (12分)
小结 解决非线性回归问题的方法及步骤 (1)确定变量:确定解释变量为x,预报变量为y; (2)画散点图:通过观察散点图并与学过的函数(幂、指数、 对数函数、二次函数)作比较,选取拟合效果好的函数模型; (3)变量置换:通过变量置换把非线性问题转化为线性回归问 题; (4)分析拟合效果:通过计算相关指数等来判断拟合效果; (5)写出非线性回归方程.
[规范解答] (1)作出散点图如下图,从散点图可以看出x与y
不具有线性相关关系,根据已有知识可以发现样本点分布
在某一条指数函数曲线y=c1ec2x的周围,其中c1、c2为待
定的参数.
(4分)
(2)对两边取对数把指数关系变为线性关系,令z=ln y,则 有变换后的样本点应分布在直线z=bx+a,(a=ln c1,b= c2)的周围,这样就可以利用线性回归模型来建立y与x之间 的非线性回归方程了,数据可以转化为:
6
所以
6
(yi-^yi)2≈0.013 18,
(yi--y )2=14.678 4.
i=1
i=1
所以,R2=1-01.40.61378148≈0.999 1, 回归模型的拟合效果较好.
(3)由残差表中的数值可以看出第3个样本点的残差比较大, 需要确认在采集这个数据的时候是否有人为的错误,如果 有的话,需要纠正数据,重新建立回归模型;由表中数据 可以看出残差点比较均匀地落在不超过0.15的狭窄的水平 带状区域中,说明选用的线性回归模型的精度较高,由以 上分析可知,弹簧长度与拉力成线性关系. 规律方法 当资料点较少时,也可以利用残差表进行残差 分析,注意计算数据要认真细心,残差分析要全面.
(4)按一定规则估计回归方程中的参数(如最小二乘法)。
(5)得出结果后分析残差图是否有异常(个别数据对应 残差过大,或残差呈现不随机的规律性,等等),过存在 异常,则检查数据是否有误,或模型是否合适等。
为了研究某种当细菌堂随诊时学间x变化,繁殖的个数,收
集数据如下:
天数x/ 1 2

繁殖个数 6 12
课题导入
前面我们已经初步学习了线性回归分析这节课我们继 续来对回归模型的建立和分析做一些探讨
本节课我们将介绍相关知识
目标引领
了解随机误差、残差、残差分析的概念; 会用残差分析判断线性回归模型的拟合效
果; 掌握建立回归模型的步骤; 通过对典型案例的探究,了解回归分析的
基本思想方法和初步应用.
残差 图法
残差点比较均匀地落在水平的带状区域内,说明选 用的模型比较适合,这样的带状区域的宽度越窄, 说明模型拟合精度越高
残差平 方和
n
残差平方和为__i=_1__(y_i_-__^y_)2,残差平方和_越__小__,
模型拟合效果越好
相关指 数R2
n
yi-^yi2
i=1
R2 = 1 -
,R2 表示_解__释__变量对
相关文档
最新文档