回归自相关性处理办法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一.异方差产生的背景
例 1.使用横截面资料研究储蓄函数
yi 0 1 xi i , i 1,2,..., n
其中 yi :第 i 个家庭的储蓄额;
x i :第 i 个家庭的可支配收入;
i :影响储蓄额 yi 的除了 x i 之外的其他因
素,如利率,家庭人口,文化背景等。
2
(2)自相关性
自相关是指随机扰动项相邻期之间存在 相关关系,即不满足 1 , 2 ,..., n 不相关或相 互独立的假设。因此,自相关可表示为:
Cov( i , j ) 0,当i j时(i, j 1,2,..., n)
§1 异方差产生的背景和原因
一.异方差产生的背景 二.异方差带来的问题
2 i 赋予较大的权数,使
一元加权最小二乘法的离差平方和为
Q ( 0 , 1 ) i ( y i E ( y i )) 2
i 1 n
i ( yi 0 1 xi ) ( i i ) 2
2
n
n
其中 i 为给定的第 i 个观测值的权数。加权最 小 二 乘 估 计 就 是 寻 找 参 数 0、1 的 估 计 值
Analysis of Variance: Regression Residuals DF 1 29 Sum of Squares Mean 6.6548981 6.6548981 .4554477 .0157051 Square F 423.74135 Signif F .0000
------------------ Variables in the Equation ------------------
1.遗漏重要变量 2.经济变量的滞后性(经济惯性) 3.采用错误的回归形式 4.蛛网现象,可能带来序列的自相关性 5.因为数据加工整理而导致误差项之间出 现自相关性。
1.遗漏重要变量
例.设某种商品的需求量的模型为:
yi 0 1 xi1 2 xi 2 3 xi 3 i 其中 y :商品需求量; x1 :消费者的可支配收入; x 2 :商品价格; x 3 :替代商品的价格。
违背基本假设的情况
在回归分析的基本假设中, M 条件是 G 非常重要的,即
E ( i ) 0, i 1,2,..., n 2 ,当i j时 Var( i , j ) 0,当i j时i, j 1,2,..., n
但在建立实际问题的回归模型时,经常存在与 此假设相违背的结论。
Variable
B
SE B
Beta
T
Sig T
居民收入x(万元) .087931 (Constant) -719.123136
.004272 .967443 78.316025
20.585 .0000 -9.182 .0000
Log-likelihood Function = -209.316127
i ( xi x w ) 2
三 寻找最优权函数
在前例关于“某地区居民总收入与储蓄额” 的回归拟合中,我们用了二种不同的方法均检 验出存在明显的异方差,现用加权最小二乘法 来减弱异方差的影响。 选择
1 i m xi
用 SPSS 软件选择适当的 m。
Source variable.. 居民收入x(万元) Log-likelihood Log-likelihood Log-likelihood Log-likelihood Log-likelihood Log-likelihood Log-likelihood Log-likelihood Log-likelihood Function Function Function Function Function Function Function Function Function = = = = = = = = = -224.258830 -221.515008 -218.832193 -216.252339 -213.856272 -211.773375 -210.185972 -209.316127 -209.379714 POWER value = POWER value = POWER value = POWER value = POWER value = POWER value = POWER value = POWER value = POWER value = -2.000 -1.500 -1.000 -.500 .000 .500 1.000 1.500 2.000
Mode l 1
Su m of Sq uares Re gression 18440 108 Re sidual 17782 03 To tal 20218 311
df
Mean Square 1 18440 108.04 29 61317 .336 30
F 300.7 32
Si g. .000 a
a. Predictors: (Co nstant), 居民收入x(万元) b. De pendent Variable : 储蓄y(万元)
ei
0
xi 或 yi
方差随横轴上的量增加而减小,像一个 向左的话筒(递减异方差)。
ei
0
xi 或 y i
双弓图,二头大,中间大(复杂异方 差)。
ei
0
xi 或 y i
例4.3 某地区的居民收入与储蓄 额的回归模型
本例选取了某地区1958年-1988年城镇居 民总收入与年末储蓄总额的样本数据, 其中: x:城镇居民总收入(万元) y:年末储蓄总额(万元)
Mode l Summ ary Mode l 1 R R Square .955 a .912 Ad justed R Square .909 St d. Error of the E stim ate 247.6 23
a. Predictors: (Co nstant), 居民收入x(万元)
b ANOVA
t -5.485 17.34 2
Si g. .000 .000
a. De pendent V ariable: 储蓄y(万元)
400.0
Unstandardized Residual
200.0
0.0
-200.0
-400.0
居 收 x( 元 民 入 万 ) 可明显发现 ei 随 x 增大而增大
10000
ˆ ˆ 权数相同,它们在决定参数 0、1 的过程中所起的作
用相同。 在异方差的情况下,平方和中每一项的地位不同,
i 大的项,在平方和中作用就大, i 小的项,在平
2 2
方和中作用就小。
加权最小二乘法的思想:
在每一
2 i 中加入适当的权数
i , 以调整
2 i 赋予较
各项在平方和中的作用,对较大的 小的权数,对较小的 异方差变为同方差。
The Value of POWER Maximizing Log-likelihood Function = 1.500
Source variable..
居民收入x(万元)
POWER value = 1.500
Dependent variable.. 储蓄y(万元)
Listwise Deletion of Missing Data Multiple R R Square Adjusted R Square Standard Error .96744 .93595 .93374 .12532
回归方程
ˆ y 648 .124 0.085 x
ˆ y 719 .12 0.0879 x
1 x1.5
自相关性问题及其处理Biblioteka Baidu
自相关是指随机误差项序列 1 , 2 ,..., n 相邻 期之间存在相关关系,即各期随机误差不是独立 的。自相关主要表现在时间序列中。
(一)自相关产生的背景和原因
序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
储蓄 y(万元) 264 105 90 131 122 107 406 503 431 588 898 950 779 819 1222 1702
居民收入 x(万元) 8777 9210 9954 10508 10979 11912 12747 13499 14269 15522 16730 17663 18575 19635 21163 22880
i 1
i 1
ˆ ˆ 0、1 ,使离差平方和达到最小。
y 令 y
i i
i
x , x
i i
i
分别为因变量
和自变量的加权平均,则
ˆ ˆ 0 y x 1 ;
ˆ 1
(x
i 1 i n i 1
n
i
x w )( y i y )
20000
30000
40000
二.一元加权最小二乘估计
当所研究的问题存在异方差时, 不能再用最小二乘法进行参数估计, 必须寻求适当的补救办法,对原来的 模型进行变换,使变换后的模型满足 同方差的假设。加权最小二乘法是一 种最常用的消除异方差性的方法。
在同方差的情况下,每一
2
i
的地位是相同的,即
(1)异方差性
同方差是指随着样本观察点 x i 的变化,随机扰动 项 i 的方差保持不变,为一常数,即
Var( i ) 2 , i 1,2,..., n
异方差是指随机项 i 随着样本观察点 x i 的变化 而变化,即
Var( i ) i 2 f ( xi ), i 1,2,..., n
ˆ (1)以拟和值 y i 为横坐标;
(2)以自变量 x 的观测值 x i 为横坐标; (3)以观测时间或序号为横坐标。
常见的残差图有以下几种:
当回归模型满足所有假设时,残差图上 几个点的散布应是随机的,无任何规律。 x
ei
ei
x
0
xi 或 yi
当横轴上的量增加时,方差也随之增大,像 一个向右的话筒(递增异方差)。
ei
0
xi 或 yi
例 2.在研究城镇居民的收入与消费支出的 关系时,也有与例 1 类似的性质,一般低收 入家庭消费的差异性较小,而高收入的家庭 消费的差异较大,高档消费面如房子、汽车 等选择的余地很大,因而导致消费模型的随 机项 i 具有不同的方差。
一.异方差的检验
(一)残差图分析
残差图以残差 e i 为纵坐标,以其它适宜的变量 为横坐标画散点图,常见的横坐标有三种选择:
在模型中 i 无自相关。
如果在模型中去掉 x 3 ,模型变为
序号 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
储蓄 y(万元) 1578 1654 1400 1829 2200 2017 2105 1600 2250 2420 2570 1720 1900 2100 2300
居民收入 x(万元) 24127 25604 26500 27670 28300 27430 29560 28150 32100 32500 35250 33500 36000 36200 38200
在储蓄行为中,高收入家庭由于收入较高,基本 消费支出后剩余较多,在消费方式的选择上有更大的 余地,因而储蓄的差异较大,即方差较大。 在低收入家庭中除了必要的支出之外剩余较少, 为了某种目的参加储蓄, 储蓄较有规律, 差异性较小, 即方差较小。
因此对于储蓄函数,随机项 i 的方差随着收入 X 的 增加而增加,具有明显的异方差性。
600.00000
400.00000
Unstandardized Residual
200.00000
0.00000
-200.00000
-400.00000
-600.00000
二种方法比较:
最小二乘法 普通 加权
i
1
R2
0.912 0.936
F值 300.732 423.741
标准误差 247.623 0.12532
a Coefficients
Mode l 1
(Constant ) 居民收入x(万元)
Un standa rdize d Co efficients B St d. Error -648.1 24 118.1 63 .085 .005
St andardized Co efficients Be ta .955