高中数学 第一章 统计案例 1.1 回归分析 残差分析的相关概念辨析及应用素材 北师大版选修1-2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
残差分析的相关概念辨析及应用
在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差^
^2^1,,,n e e e 来判断模型拟合的效果,判断原始数据中是否存在可疑数据.这方面的分析工作称为残差分析.残差分析一般有两种方法:(1)作残差图;(2)利用相关指数R 2来刻画回归效果.
.,,2,1,^^^^n i a x b y y y e i i i i i ^
i e 称为相应于点(x i ,y i )的残差.类比
样本方差估计总体方差的思想,可以用)2)(,(2121^^
1
^2^2
n b a Q n e n n i i 作
为σ2
的估计量,其中^a 和^b 由公式x b y a ^^ ,
n
i i
n
i i i
x x
y y x x
b 1
2
1
^
)()
)((给出,Q(^
a ,
^
b )称为残差平方和.可以用^
2
衡量回归方程的预报精度.通常,^
2 越小,预报
精度越高.
例1.设变量x,y 具有线性相关关系,试验采集了5组数据,下列几个点对应数据的采集可能有错误的是( )
A 点A B.点
B C.点
C D.点E
思路与技巧 由散点图判断出,点A,B,C,D,F 呈线性分布,E 点远离这个区域,说明点E 数据有问题. 解答D
评析 可以用Excel 画散点图,样本的散点图可以形象的展示两个变量的关系,画散点图的目的是用来确定回归模型的形式,若散点图呈条状分布,则x 与y 有较好的线性相关关系,散点图除了条状分布,还有其他形状的分布.
例2.为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6根弹簧进行测量,得如下数据:
(1)画出散点图.
(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的回归直线方程.
(3)求出残差,进行残差分析.
思路与技巧可以用Excel画散点图,由散点图发现x与y是否呈线性分布,由此判断x与y之间是否有较好的线性相关关系,若有,求出线性回归方程,再画出残差图,进行残差分析.
解答 (1)由Excel表格画散点图如图
(2)设yˆ=bx+a是线性回归直线方程,
以重量为横坐标,以残差为纵坐标画残差图如图
由残差图看出,这些样本点的残差对应点均匀地落在水平带状区域内,宽度越窄,说明模型拟合精度越高,回归方程预报精度越高.
评析回归模型中,残差变量不能被直接观测到,必须通过模型拟合后计算得到.画残差散点图的目的就是直观观测残差图,发现观测数据中可能出现的错误及所用模型是否恰当,若样本点残差较大,需确认这个点在采集过程中是否存在错误,若有,需重新采集数据,重新利用数据拟合.若采集数据没有错误,就另找原因.若残差点比较均匀地落在水平带状区域内,说明选用模型较合适,带状区域宽度越窄,模型拟合精度越高,回归方程预报精度越高.
同学们学习残差时应明确以下几点:(1)误差e受许多条件的影响,也受所选用的线性模型的影响,因此线性模型往往只是一种近似的模型.(2)作残差图有时不够精确,也难于认定拟合程度的好坏,因而多数情况下,选用计算相关指数R2来说明拟合效果.(3)可以对某组数据采用几种不同的回归方程进行分析,也可以比较几个R2的值,选择R2大的模型作为这组数据的回归模型.(4)回归方程只适用于我们所研究的样本的总体;建立的回归方程一般都有时间性;样本取值的范围会影响回归方程的适用范围,一般不能超过这个范围,否则没有实用价值;不能期望回归方程得到的预报值就是预报变量的精确值,它是预报变量的可能取值的平均值。
练习:
为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6根弹簧进行测量,数据如下表:
(1)画出散点图.
(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的回归直线方程.
(3)对x.y两个变量进行相关性检验.
(4)残差平方和是多少?
解:(1)如下图所示.
从散点图看,这是一个属于线性回归模型的问题.
由于r与1非常接近,说明y与x之间存在线性相关关系.
=0.013179,即残差平方和是0.013179.