回归模型的其他函数形式

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


2 2
RSS2 /(n2 - k )
该统计量服从自由度为 (n1 - k ) 和 (n2 - k ) 的F分布。在给定的显著性水平a 之下,若
3
此统计量F的值大于临界值 Fa ( n1 - k, n2 - k ) ,则可认为有异方差的存在。
4 戈里瑟(Glejser)检验
用 残 差 绝 对 值 ei 对 每 个 解 释 变 量 建 立 各 种 回 归 模 型 , 如 ei = a1 + a2 X i + vi ,
定变换的权数。一般我们先采用戈里瑟检验方法确定 ei 与 X i 之间的关系。
①.如 ei 与 X i 之间为线性关系,则可认为
( ) s
2 i
=
E
u
2 i
=s 2Xi
这时,选择 1 为权数,即对模型(6.11)两边同时乘以 1 ,将异方差模型变为同方差模
Xi
Xi
型。即将模型Yi = b1 + b2 X i + ui 变为:
Yi = Xi
b1 Xi
+ b2
Xi +
ui Xi
4
②.如 ei 与X i 之间为线性关系,则可认为
s
2 i
=
E
(u
2 i
)
=s
2
X
2 i
这时,选择 1 为权数,可将模型变换为如下模型: Xi
Yi Xi
=
b1 Xi
+ b2
+
ui Xi
二、序列相关
(一) 序列相关的概念 在进行回归分析时,我们总假定其随机误差项是不相关的,即
式中,斜率系数 b2 的含义为:解释变量 X 绝对量改变一个单位时,被解释变量 Y 的相对改
变量。即
b2
=
Y的相对改变量 X的绝对改变量
=
DY / Y DX
2.对数到线性模型
Yt = b1 + b 2 LnX t + ut
我们称上式为对数到线性模型。模型中斜率系数 b2 的含义为解释变量 X 相对量改变 1 个单
位时,被解释变量 Y 的绝对变化量。
b2
=
Y 的绝对变化量 X 的相对变化量
=
ΔY ΔX / X
1
DY = b2 × DX / X
(5.66)
当 DX / X =0.01=1%时, DY = 0.01b2 ,即当解释变量 X 增加 1%时,被解释变量 Y 增加
的绝对量为 0.01 b 2 。 (三)倒数模型
参数的置信区间和利用回归模型进行预测的结果会存在较大的误差。5. 如果不加处理地运 用普通最小二乘法估计参数模型,回归参数的置信区间核利用回归模型进行预测的结果会存 在较大的误差。
(四)、序列相关的检验
1.图示检验法 2.自相关系数法
误差序列 u1, u2 ,×× ×, ut 的自相关系数定义为
n
å utut -1
不能判定是否有自相关
误差项 u1, u2 ,×× ×, un 间无自相关
不能判定是否有自相关
6
4- d L ≤DW≤4
误差项 u1, u2 ,×× ×, un 间存在负相关
DW 检验缺点和局限性: 1.DW 检验有两个不能确定的区域。2.DW 统计量的上、下界表要求 n≥15。3.检
验不适应随机误差项具有高阶序列相关的检验。 4.只适用于有常数项的回归模型并且解释变量中不能含滞后的被解释变量。
Var(ui ) ¹ Var(u j ) ,当 i ¹ j 时
在线性模型的基本假定中, ui 关于方差不变的假定不成立,其他假定不变的情形称为
异方差性。
(二)异方差产生的后果
模型中存在异方差时,普通最小二乘估计存在以下问题: 1.参数估计量虽是无偏的,但不是最小方差线性无偏估计。 2.参数的显著性检验失效。 3.回归方程的应用效果极不理想,或者说模型的预测失效。
差项的一阶自回归形式为 ut = rut-1 + vt
为了检验序列的相关性,构造的原假设是 H 0 : r = 0
为了检验上述假设,构造 DW 统计量首先要求出回归估计式的残差 et ,定义 DW 统计
量为:
n
å (et - et-1 )2
DW = t=2 n å et2 t =1
其中, et = Yt - Yˆt , t = 1, 2,× ××, n 。当 n 较大时
)
=
1
s
2 i
Var(ui )
=
1
s
2 i
×
s
2 i
= 1 ,通过加权变换使误差项变成同方差了。
通过加权变换使原模型中的异方差误差项转换为同方差误差项,使加权变换后的模型 满足最小二乘法的假定,从而使用普通最小二乘法估计参数,这种方法称为加权最小二乘法。
2.
s
2 i
未知时
如果
s
2 i
是未知的,一般情况下,我们可根据误差与解释变量或被解释变量的关系来确
也可能引起序列相关。4.实际问题研究中出现的蛛网现象(Cobweb Phenomenon)。5.对 原始数据加工整理。
(三)、序列相关性带来的后果
1.参数的估计量不再具有最小方差线性无偏性。 2.均方误差 MSE 可能严重低估误差项的方差。
3.常用的F检验和 t 检验失效。4.当存在序列相关时, bˆ 仍然是 b 的无偏估计量。回归
和平均总成本曲线均为 U 形曲线,我们必须用二次曲线去描述它。
Y = b0 + b1X + b2 X 2 + u
上式称为二次函数或二次多项式。对于更加复杂的总产量曲线和总成本曲线,可使用三次多
项式去描述。
Y = b0 + b1X + b2 X 2 + b3 X 3 + u
上式称为三次函数或三次多项式。
(四)异方差性的修正办法。
1.
s
2 i
已知时
如果每个观察值的误差项方差
s
2 i
是 已 知 的 , 使 用 1/si
为权数,对模型
Yi = b1 + b2 Xi + ui , i = 1,2,×× ×, n 。作如下变换:
Yi si
= b1 si
+ b2
Xi si
+ ui si
由于Var( ui si
五、多元回归模型的设定偏误
(一)正确的多元回归模型 (二)回归模型中包含了无关解释变量
(三)回归模型中遗漏了重要解释变量
1.如
(四)回归模型的函数形式设定偏误
2
第四部分 违背经典假定的回归模型
一、异方差性 (一)异方差性的概念 在回归模型中,随机误差项 u1 , u2 ,…, un 不具有相同的方差,即
5
n
å et et-1
rˆ = t=2
n
n
å å et2
e2 t -1
t=2
t =2
rˆ 作为自相关系数 r 的估计值与样本量有关,需要做统计显著性检验才能确定自相关
性的存在,通常采用下面介绍的 DW 检验代替对 rˆ 的检验。
3.DW 检验 DW 检验是 J.Durbin(杜宾)和 G.S.Watson(沃特森)于 1951 年提出的一种适用于小样本的 检验方法。DW 检验只能用于检验随机误差项具有一阶自回归形式的序列相关问题,随机误
关,即
ut = ut-1 + vt
其中,vt 为经典误差项。则应满足应用普通最小二乘法的经典假定,用普通最小二乘法估计
差分模型,得到的参数估计量即为原模型参数的无偏、有效的估计量。
三、多重共线性 (一)多重共线性的概念
在多元线性回归模型中,解释变量 X 1 , X 2 , L , X k 之间存在完全或近似的线性关系。
(三)多重共线性的检验
1. 方差扩大因子法
1
1
-
R
2 j
度量了由于 X
j
与其它解释变量之间的线性关联程度对估计量 bˆ j
的方差的影
响。称其为方差扩大因子,定义为
VIF j
=1
1
-
R
2 j
也可以用 k 个解释变量所对应的方差扩大因子的平均数来度量多重共线性。当
n1
n2
å å 差平方和分别为 RSS1 = e12i 和 RSS2 = e22i ,从而可计算出各段模型的随机误差项的方
i =1
i =1
差估计量分别为 sˆ12
=
RSS1 n1 - k
和 sˆ 22
=
RSS 2 n2 - k
,由此可构造出检验统计量为
F = sˆ12 = RSS1 /(n1 - k)
r=
t =2
n
n
å å ut2
u2 t -1
t =2
t=2
自相关系数 r 的取值范围是[–1,1],当 r 接近于 1 时,表明误差序列存在正相关,当 r
接近于–1时,表明误差序列存在负相关。在实际应用中,误差序列 u1, u2 ,×× ×, un 的真实值是
未知的,需要用其估计值 et 代替,得自相关系数的估计值为
当解释变量以倒数ห้องสมุดไป่ตู้式出现时的模型称为倒数模型或双曲线模型。
Yt
= b1 + b2
1 Xt
+ ut
式中,Y 对 X 是非线性,但对参数 b1 ,b2 而言是线性,Y 对
1 X
也是线性的。此模型的特点
为当 X 值趋向于无穷大时, b 2
1 X
趋向于 0,Y 趋向于 b1 。
(四)多项式模型
多项式模型在研究成本和生产函数的经济计量分析中有较大的应用价值。边际成本曲线
(三)异方差性的检验
1 残差图分析法 2 等级相关系数法
å rs
=1-
6 n(n2 -1)
n i=1
di2
其中, n 为样本容量, di 为对应于 X i 和 ei 的等级的差数。
多元的情况下,需对每一个解释变量做等级相关系数检验。只有当每个解释变量检验都 不存在异方差时模型中才不存在异方差。否则,模型中存在异方差。
四、回归模型的其他函数形式
(一)对数线性模型
Yi
=
b X e b2 ui 1i
对数线性模型的优点在于:斜率系数 b2 度量了 Y 对 X 的弹性,也就是当解释变量 X 变
化 1%时,Y 变化的百分比。
由于在线性回归模型中, b 2 是一个常数,因此,对数线性模型假定 Y 与 X 之间的弹
性系数 b 2 在整个研究范围内保持不变,所以称为不变弹性模型。 (二)半对数模型
n
n
n
n
å et et-1
å å å et2 ≈
e2 t -1

et2
, rˆ
»
t=2 n
。 DW » 2(1 - rˆ ) 由上述讨论可知 DW 的取值范
t=2
t=2
t =1
å et2
t =1
围为
0≤DW≤4
根据样本容量 n 和解释变量的数目 k' (不包括常数项),查 DW 分布表,得临界值 d L 和
3 戈德菲尔德-匡特检验(样本分段比检验) 首先将样本按某个解释变量的大小顺序排列,并将样本从中间截成两段;然后各段分别 用普通最小二乘法拟合回归模型。令第一段为高方差段,第二段为低方差段,并记两段的样
本容量分别为 n1 和 n2 ,模型参数个数为 k ,两段样本回归残差分别为 e1i 和 e2i ,则两段的残
称解释变量 X1, X 2 ,× ××, X k 之间存在完全或近似多重共性线。也称为复共线性。
(二)多重共线性的后果
一般情况下,完全多重共线性的情况比较少见,在这里我们不作过多讨论。下面我们只 讨论模型中存在严重多重共线性情形的后果。
1. 多重共线性不改变参数估计量的无偏性。 2. 多重共线性使参数的最小二乘估计的方差很大,即估计值的精度很低。 3. t 检验和 F 检验失效。
dU , 然 后 依 下 列 准 则 考 察 计 算 得 到 的 DW 值 , 以 决 定 模 型 的 自 相 关 状 态 .
DW 检验决策规则
0≤DW≤ d L d L <DW≤ dU dU <DW<4- dU 4- dU ≤DW<4- d L
误差项 u1, u2 ,×× ×, un 间存在正相关
1.线性到对数模型
LnYt = b1 + b 2t + ut
式中,Yt=要研究的经济现象,t=时间变量。 t 时间变量的使用,主要是研究被解释变量在时间上的变动规律。 式中,被解释变量为对数形式,解释变量为线性形式,称为线性到对数的半对数模型。
通用形式为
LnYt = b1 + b 2 X t + ut
Cov(ui , u j ) = 0, i ¹ j
上式表示不同时点的误差项之间不相关。如果一个回归模型不满足上式,即
Cov(ui , u j ) ¹ 0 ,则我们称随机误差项之间存在着序列相关现象,也称为自相关。
(二) 序列相关产生原因 1.遗漏了重要的解释变量。2.经济变量的滞后性。3.回归函数形式的设定错误
ei
= a1 + a2
1 Xi
+ vi , ei
= a1 + a2
X i + vi 等等,并检验回归系数a2 是否为0。设原假
设为 H 0 : a 2 = 0 ,备择假设为 H1 : a 2 ¹ 0 ,应用 t 检验判断,如果a 2 ¹ 0 ,则有异方差。
这种方法不仅能检验出模型中存在的异方差,而且把异方差的表现形式找出来便于后面改进 时使用。
(五)、补救措施
1.一阶差分法 一阶差分法是将原模型
变换为
Yt = b1 + b2 X 2t + ×× × + bk X kt + ut
DYt = b2DX 2t + ×× × + bk DX kt + ut - ut-1
( ) 其中,DYt = Yt - Yt-1 ,DX it = X it - X i, t-1 i = 2, 3, L , k ,原模型存在完全一阶正自相
相关文档
最新文档