残差分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5
0
0
20
40
存在高杠杆率观测值的散点图
x 60
19
13
异常值 (OUTLIER)
1. 如果某一个点与其他点所呈现的趋势不相吻合, 这个点就有可能是异常点,或称为野点
■ 如果异常值是一个错误的数据,比如记录错误造成的, 应该修正该数据,以便改善回归的效果
■ 如果是由于模型的假定不合理,使得标准化残差偏大, 应该考虑采用其他形式的模型,比如非线性模型
不良贷款对贷款余额回归的残差图
7
残差
X Variable 1 Residual Plot
5
0
0
2
4
6
8
-5
X Variable 1
火灾损失数据的残差图
8
标准化残差(standardized residual)
ZREi
ei
ˆ
标准化残差使残差具有可比性,ZREi 3 的相应观测值即判定为异常值,但没有解
计算公式为
1
hii n
(xi x )2 (xi x )2
表h示ii ,其
3. 如果一个观测值的杠杆率 识别为有高杠杆率的点
hii就可6以n将该观测值
4. 一个有高杠杆率的观测值未必是一个有影响的观测 值,它可能对回归直线的斜率没有什么影响
18
高杠杆率点 (图示)
y
25
20
高杠杆率点
15
10
■ 如果完全是由于随机因素而造成的异常值,则应该保 留该数据
2. 在处理异常值时,若一个异常值是一个有效的观 测值,不应轻易地将其从数据集中予以剔除
14
异常值 (识别)
1. 异常值也可以通过标准化残差来识别 2. 如果某一个观测值所对应的标准化残差较
大,就可以识别为异常值 3. 一般情况下,当一个观测值所对应的标准
16
有影响的观测值(图示)
y
12
10
不存在影响
8
值的趋势
6
4
存在影响值的趋势
2
有影响的观
测值
0
0
10
20
30
x 40
存在一个有影响观测值的散点图
17
杠杆率点 (LEVERAGE POINT)
1. 如果自变量存在一个极端值,该观测值则称为高杠 杆率点(high leverage point)
2. 在一元回归中,第i个观测值的杠杆率用
残差分析
1 用残差证实模型的假定 2 用残差检测异常值和有影响的观测值
1
残差 (RESIDUAL)
1. 因变量的观测值与根据估计的回归方程求 出的预测值之差,用e表示
ei yi yˆi
2. 反映了用估计的回归方程去预测而引起的 误差
3. 确定有关误差项的假定是否成立 4. 检测有影响的观测值
用残差图诊断回归效果与样本数据的质量,检查模型是否 满足基本假定,以便对模型作进一步的修改
决方差不等的问题。ˆ 是回归标准差。
9
学生化残差
◆ 残差除以它的标准差后得到的数值。计算公
式为
zei
ei sei
yi yˆi sei
s ■ e是i 第i个残差的标准差,其计算公式为
Sei ˆ
1 hii ˆ
1
1 n
( xi x )2 (xi x )2
10
学生化残差图
◆ 用以直观地判断误差项服从正态分布这 一假定是否成立
化残差小于-3或大于+3时,就可以将其 视为异常值
15
有影响的观测值
1. 如果某一个或某一些观测值对回归的结果 有强烈的影响,那么该观测值或这些观 测值就是有影响的观测值
2. 一个有影响的观测值可能是
■ 一个异常值,即有一个值远远偏离了散点 图中的趋势线
■ 对应一个远离自变量平均值的观测值 ■ 或者是这二者组合而形成的观测值,
2
用残差证实模型的假定
3
残差图 (RESIDUAL PLOT)
1. 表示残差的图形
■ 关于x的残差图 ■ 关于y的残差图 ■ 标准化残差图
2. 用于判断误差的假定是否成立 3. 检测有影响的观测值
4
残差图 (形态及判别)
5
6
残差图 (例题分析)
残差
8
6
4
2
0
0
100
200
300
400
-2
-4 贷款余额(x )
■ 若假定成立,学生化残差的分布也应服从 正态分布
■ 在学生化残差图中,大约有95.45%的学生 化残差在-2到+2之间
11
学生化残差图 (例题分析)
学生化残差
4 3 2 1 0 -1 0 -2
100
200
300
400
不良贷款对贷款余额回归的 学生化残差图
贷款余额
12
用残差检测异常值和 有影响的观测值