计量经济学第五讲

合集下载

计量经济学第五讲---模型函数形式

计量经济学第五讲---模型函数形式

Prob. 0.0000 0.0000 5.468946 0.086294 -9.94267 -9.84926 81786.04 0.000000
ˆ 5.317 0.0098t ln Y t
斜率0.0098表示,平均而言, se (0.000608 )(0.0000343 ) Y的年增长率为0.98%。
每提高1个百分点,平均而言,数学S.A.T分数将增加0.13 个百分点。根据定义,如果弹性的绝对值小于1,则称缺 乏弹性。因此,在该例中,数学S.A.T分数是缺乏弹性的。 另外,r2=0.9, 表明logX解释了变量logY的90%的变 动。
13
第5章
经济学的弹性:

以价格弹性为例: 价格弹性的准确定义是需求量变动的百分比除以价格变动的百分 比。 价格变动一个百分点,引起需求量变动超过一个百分点,则该物 品就富有价格需求弹性;需求变动量不到一个百分点,则缺乏价 格需求弹性;需求变动量等于一个百分点,则该物品拥有单位需 求价格弹性。
S.D. dependent var
Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
20.51101
2.260832 2.354245 23141.80 0.000000
S.E. of regression Sum squared resid Log likelihood
2642.152 134.6207
Mean dependent var S.D. dependent var
S.E. of regression
Sum squared resid Log likelihood Durbin-Watson stat

金融计量经济第五讲虚拟变量模型和Probit、Logit模型

金融计量经济第五讲虚拟变量模型和Probit、Logit模型
精品课件
原始模型:
YX (5.8)
• 其中Y为观测值取1和0的虚拟被解释变量,X为 解释变量。
• 模型的样本形式: yi Xii
(5.9)
• 因为E(i)0
,E所(y以i)Xi
• 令: p i P ( y i 1 ) 1 p i P ( y i 0 )
• 于是有: E ( y i) 1 P ( y i 1 ) 0 P ( y i 0 ) p i
其它季度
1, 三季度
D3
0,
其它季度
• 小心“虚拟变量陷阱”!
精品课件
三、虚拟变量的应用
• 1、在常数项引入虚拟变量,改变截距。
y i0D 1 x 1 i kx k iu i (5.1)
• 对上式作OLS,得到参数估计值和回归模型:
y ˆiˆ0ˆD ˆ1 x 1 i ˆkx ki(5.2)
金融计量经济第五讲
虚拟变量模型和Probit、Logit模 型
精品课件
第一节 虚拟变量的一般应用
一、虚拟变量及其作用 1.定义:取值为0和1的人工变量,表示非量化
(定性)因素对模型的影响,一般用符号D表 示。例如:政策因素、地区因素、心理因素、 季节因素等。 2.作用: ⑴描述和测量定性因素的影响; ⑵正确反映经济变量之间的相互关系,提高模型 的精度; ⑶便于处理异常数据。
yˆt ˆ ˆxt yˆt ˆ ˆxt ˆ2 yˆt ˆ ˆxt ˆ3 yˆt ˆ ˆxt ˆ4
精品课件
一季度 二季度 三季度 四季度
例题:美国制造业的利润—销售额行为
• 模型:利 t 1 润 2 D 2 t 3 D 3 t 4 D 4 t ( 销 ) t u t售
0.503543 0.500354 1.13E+03 1.99E+09 -13241.74 1.648066

金融计量经济第五讲虚拟变量模型和Probit、Logit模型

金融计量经济第五讲虚拟变量模型和Probit、Logit模型

第二节 虚拟被解释变量模型
• 问题1:对于商业银行,企业贷款可能出现违约,也就是说一家企 业贷款后有违约和不违约两种可能,如何甄别?(李萌,2005)
• 问题2:证券投资者在特定时期内的投资选择是买或不买,如何确 定这样的选择?(王冀宁等,2003)
• 问题3:上市公司出现经营问题,可能成为ST、PT,是什么原因导 致这样的结果?
6563.76 1597.98
16.904 16.9416 157.922
0
应用例题2:股息税削减对股价的影响
• 背景资料—2005年6月14日,财政部、税务总局发文,规定对个人投资者从
上市公司取得的股息红利所得,暂减按50%计入个应纳税所得额(红利税从 20%降为10%)。
• 利用事件分析法分析该政策对股价有无显著影响,即政策出台前后股票有无 异常收益。时间窗口为发布日及前后各二天。
E( yi ) P( yi 1) X i
• 但因为
i
1 X
Xi i
当yi 1,其概率为X i 当yi 0,其概率为1 X i
• 模型具有明显的异方差性,故而用模型(5.8)直接进行参数估计 是不合适的。
• 另外,由于要求
E( yi ) P( yi 1) Xi 1

难以达到。
Di 0, 其它季度的数据
, i 2,3,4
• •
原 则模 引型 入若 虚为 拟变量后的y模t 型为:
xt
ut
yt xt 2 D2t 3 D3t 4 D4t ut (5.6)
• 回归模型可视为:
yˆt ˆ ˆxt
一季度
yˆt ˆ ˆxt ˆ2 二季度
yˆt ˆ ˆxt ˆ3 三季度
二、虚拟变量的设置原则

计量经济学第五讲---模型函数形式

计量经济学第五讲---模型函数形式
t (8739 .399)(285.9826 ) p (0.0000 ) (0.0000 ) r 2 0.999658
32
第5章
33
第5章
34
第5章

35
第5章
Dependent Variable: Y Method: Least Squares Sample: 1970 1999 Included observations: 30 Variable Coefficient Std. Error t-Statistic Prob.
Akaike info criterion
Schwarz criterion F-statistic Prob(F-statistic)
6.816985
6.915724 8080.449 0.000000
44
第5章
45
第5章
半对数模型总结
1、对数—线性模型(增长率模型)
2、线性—对数模型
LOG(Z)
R-squared
Adjusted R-squared
0.845997
0.995080 0.994501
0.093352
9.062488
0.0000
12.22605 0.381497
-4.155221 -4.005861
Mean dependent var S.D. dependent var
每提高1个百分点,平均而言,数学S.A.T分数将增加0.13 个百分点。根据定义,如果弹性的绝对值小于1,则称缺 乏弹性。因此,在该例中,数学S.A.T分数是缺乏弹性的。 另外,r2=0.9, 表明logX解释了变量logY的90%的变 动。
13
第5章

计量经济学讲义第五讲(共十讲)

计量经济学讲义第五讲(共十讲)

第五讲 自相关高斯-马尔科夫假定五是:(,)0,i j i j C ovariance i j εεεεδ==≠如果该假定不成立,那么称模型的误差项是序列相关的。

由于序列相关主要针对于时间序列数据,因此,下面把i 改写为t ,样本容量N 改写为T 。

笔记:1、如果基于横截面数据的回归模型其误差项是相关的,则称为空间自相关。

但是要记住,除非观察顺序具有某种逻辑或者经济上的意义,否则,在横截面数据回归中,观察顺序是可以随意的,因此,也许在某种观测顺序下误差项呈现出一种模式的自相关但在另一种观测顺序下又呈现出另外一种模式的自相关。

然而,当我们处理时间序列时,观测服从时间上的一种自然顺序。

2、在经济变量时间序列回归模型中,误差项经常被称之为冲击(Shock )。

对经济系统的冲击经常具有持续性,从而这为误差项序列相关提供了现实依据。

一、 自相关的后果在证明高斯-马尔科夫定理时,我们仅仅在证明OLS 估计量的方差最小(在所有线性无偏估计量中)时用到了序列无关假定,而在证明线性、无偏性并没有用到该假定,因此违背无自相关性假定并不影响线性、无偏性,只影响方差最小性质。

在证明方差最小时,我们分了两步,其中第一步是计算OLS 估计量的方差。

对模型:t 01t t y x ββε=++有:12ˆ12222()()()()(())()()[()]t t t t t t t t tx x Variance x x x x Variance x x Variance x x x x βεδβεε-=+---==--∑∑∑∑∑∑在假定五:0,0t t j j εεδ+=≠下,有:122ˆ222()[()]ttt x x x x βεδδ-=-∑∑如果假定五不成立,那么正确的方差表达式应该是:12ˆ1221122()2()()[()]t t t jT T tt t t j t j t x x x x x x x x βεεεδδδ+--+==-+--=-∑∑∑∑所以, OLS 法下通常的系数估计量方差的表示是错误的。

计量经济学课件第5章

计量经济学课件第5章
第5章 假设检验
回归分析是通过样本所估计的参数来代替总体的 真实参数,或者说是用样本回归线代替总体回归线。
尽管从统计性质上已知,如果有足够多的重复抽 样,参数的估计值的期望(均值)就等于其总体的 参数真值,但在一次抽样中,估计值不一定就等于 该真值。
那么,在一次抽样中,参数的估计值与真值的差 异有多大,是否显著,这就需要进一步进行统计检 验。
单侧检验与双侧检验:P67。
5
只有将非预期结果作为原假设,才能控制拒绝原 假设事实上为真但偶然被拒绝的概率,即控制拒绝 原假设犯错误的概率。但反之不真,即在原假设为 假时,无法确切地知道将其错误地接受为真的概率。
即拒绝原假设,我们知道犯错误的概率,但接受 原假设,不知道犯错误的概率,所以最好说不拒绝 而不是接受。
由样本推断总体,可能会犯错误, 第一类错误:原假设H0符合实际情况,检验结果 将它否定了,称为弃真错误。 第二类错误:原假设H0不符合实际情况,检验结果 无法否定它。称为取伪错误。 例:P68,图5-1,图5-2。
8
5.1.3 假设检验的判定规则
判定规则:在检验一个假设时,首先计算样本统计量, 将样本统计值与预先选定的临界值比较,根据比较 结果决定是否拒绝原假设.即临界值将估计值的取 值范围分为两个区域,接受域和拒绝域,来决定是否 拒绝还是接受.
产生不正确推断时所面对的两类错误。
4
5.1.1 古典原假设和备选假设
原假设或者零假设(null hypothesis),待检验的 假设,用符号H0表示, 代表研究者的非预期取值. 例如,你预期参数是正值,则建立虚拟假设为:
H0: <=0 备选假设,对研究者预期取值的表述,用符号HA表示,
接上例,备选假设为: HA : >0

第五讲 多值、排序与计数模型 高级计量经济学及Stata应用课件

第五讲 多值、排序与计数模型 高级计量经济学及Stata应用课件
• 解释变量:是否白人(white),受教育年限(ed), 工龄(exper)。
• 这些解释变量都只依赖于个体,而不依赖于方案 ,故应使用多项logit或多项probit回归。
2020/7/27
陈强 计量及Stata应用 (c) 2014
20
数据特征
• use nomocc2.dta, clear • sum
• 解释变量xij,既随个体i而变,也随方案j而变。
• 系数 β 表明,xij对随机效用Uij的作用不依赖于方 案j。比如,乘车时间依个体与方案而变,但乘车 时间太长所带来的负效用是一致的。
2020/7/27
陈强 计量及Stata应用 (c) 2014
9
条件Logit (续)
• 根据与多项Logit类似的推导,
2020/7/27
陈强 计量及Stata应用 (c) 2014
18
混合logit的Stata命令
• asclogit y x1 x2 x3,case(varname) alternatives(varname) casevars(varname) base(#) or
• “asclogit”表示“alternative-specific conditional logit”
• 如果假设 i1, ,iJ 服从J维正态分布,可
得“多项probit”(multinomial probit)模型
• 但多项Probit的计算涉及高维积分,不易计 算,较少使用。
2020/7/27
陈强 计量及Stata应用 (c) 2014
7
随方案而变的解释变量
• 多项Logit仅考虑不随方案而变的解释变量(比如, 个体收入),但有些解释变量既随个体,也随方案 而变。比如,在选择交通工具时,乘车时间既因 个体而异,也因交通工具而异。

计量经济学第5章PPT学习教案

计量经济学第5章PPT学习教案
j也被称为偏回归系数,表示在其他解释变
量保持不变的情况下,Xj每变化1个单位时,Y 的均值E(Y)的变化;
或者说j给出了Xj的单位变化对Y均值的“直
接”或“净”(不含其他变量)影响。
第1页/共49页
2
总体回归模型n个随机方程的矩阵表达式为 Y Xβ μ
其中
1 X 11
X
1
X 12
1 X 1n
所以,
ˆ ~ N(, 2(X X )1)
第24页/共49页
以cii表示矩阵(X’X)-1 主对角线上的第i个元素,于是参数估 计量的 方差为 : 其中,2为随机误差项的总体 方差, 由于总 体未知 ,故方 差也不 可知。 因此, 在实际 计算时 ,用它 的估计 量代替:
ˆi ~ N (i , 2cii )
2Q
ˆˆ
2X X是一个正定矩阵
ˆ (X X ) XY 1
是使方程最小化的解。
第13页/共49页
14
知识点:正定矩阵
对于任意的非零向量c,令
a cX Xc

a cXXc vv
vi2
除非v中的每一个元素为0, 否则a为正的。但是,若v为0, 则
v Xc 0
这与X中的向量线性无关的假设是矛盾的,故X满秩,则必
n
第7页/共49页
8
回忆:由线性代数可知
如果一个矩阵没有逆矩阵,则被称 为奇异矩阵,如果有则为非奇异矩 阵(non-singular)
对于n阶方阵A,A是非奇异矩阵的 证明: 充要条件是A的行列式不等于0
当r且an仅k(当X X矩)阵 满ran秩k时(X,) 其k行1列式不 X X为(k等+1于)(零k+1)阶方阵,所以,X X为非奇异矩阵,可逆.

05:第五讲 模型设定和虚拟变量专题

05:第五讲 模型设定和虚拟变量专题
logc1xj logc1 log xj
5
Beta 系数
标准化系数,只有标准化后才有大小比较的价 值
其基本原理是y,x均是去均值并除以各自的标 准差
则回归系数表示,x一个标准化变化对y一个标 准化变化的影响效应
6
7
Beta 系数
zy bˆ1z1 bˆ2 z2 ... bˆk zk error 其中,zy 表示 y的z-得分, z1 表示x1 的 z 得分,以此类推。而对于
在该例中,y的预测值为
yˆ exp ˆ 2 2 exp lnˆ y
bk xk
E y | x 0 exp b0 b1x1 bk xk yˆ ˆ0 exp logˆ y
27
当因变量为log y时对y的预测:
(1)从logy对x1 ,x2 , ,xk的回归中得到拟合值logˆyi .
28
例6.7 对CEO薪水的预测
对样本中的每一个观测都求出mˆ exp lsalˆary ;
将salary对mˆ 进行回归(没有常数项)得ˆ0 1.117。
lsalˆary 4.504 0.163 log 5000 0.109 log 10000 0.0117 10 7.013 salˆary 1.117 exp 7.013 1240.967或1240967美元。
25
通过增加回归变量来减少方差的误差
在回归中增加一个新的自变量会加剧多重共线 性问题;另一方面,从误差项中取出一些因素 作为解释变量可以减少误差方差。
应该将那些影响y而又与所有我们关心的自变 量都无关的自变量包括进来。
26
§ 5 对数模型中对y 的预测

计量经济学课件-第五章

计量经济学课件-第五章

• 阿尔蒙(Almon)多项式法 主要思想:针对有限滞后期模型,通过阿尔蒙变换, 定义新变量,以减少解释变量个数,然后用OLS法估计 参数。 主要步骤: 第一步,阿尔蒙变换
Yt a b0 X t b1 X t 1 bp X t p Ut
假定系数服从以下多项式分布
bj a0 a1 j ar j r j 1,2, p
• (3)加法和乘法引入
wagei b0 b1Di b2 b3 Di X i Ui
E wagei b0 b2 X i E wagei b0 b1 b2 b3 X i
比较男性员工平均的起薪和工龄加薪是 否都显著高于女性员工
想知道在1978年前后消费行为是否有显著变化。 回顾邹氏断点检验,也可以用虚拟变量进行处 理,引入虚拟变量如下:
1 Dt 0
1978年以后 1978年以前
• 整个样本期间的模型可以写成:
Yt b0 b1Dt b2 b3 Dt X t Ut
• 它包含对于两个子样本的回归
Yt 1 b0 X t 1 b0 2 X t 2 b0 3 X t 3 U t 1 3
1 3
Yt b0 X t Yt 1 U t U t 1
4
估计模型(4)即可
• 模型(4)估计中应注意的问题 随机解释变量问题 序列相关问题
Yt a b0 X t b1 X t 1 b2 X t 2 bp X t p Ut
p有限,为有限分布滞后;无限,为无限分布滞后 为短期(short-run)或即期乘数(impact multiplier),表 示本期X变化一单位对Y平均值的影响程度。

第五讲 动态面板数据模型

第五讲  动态面板数据模型
ˆ α
1 IV
=
∑∑ y ( y
i =1 t = 2 N i ,t − 2 i =1 t = 3 N T
i =1 t = 2 N T
∑∑ y ( y
i ,t − 2
N
T
i ,t
− y i ,t −1 ) − y i ,t − 2 )
(5.3)
i ,t −1
ˆ α
2 IV
=
∑∑ ( y
T
i ,t − 2
⎧⎡ 1 ⎪ min ⎨⎢ α ⎪⎣ N ⎩
⎤ ⎡1 Z ( Δyi − αΔyi ,−1 ) ⎥ WN ⎢ ∑ i =1 ⎦ ⎣N
N ' i
'
⎤⎪ ⎬ ∑ Z ( Δy − α Δ y ) ⎥ ⎦
N i =1 ' i i i ,−1
⎫ ⎪ ⎭
(5.6)
估计自回归系数,其中,WN 是渐近正定权重 l × l 矩阵。 对(5.6)式关于 α 求导,解 α 得到自回归系数的 GMM 估计
(
)
( yi ,t −1 − yi ,t −2 ) 相 关 , 但 是 与 ( u
it
− ui ,t −1 ) 无 关 。 因 此 , y i ,t − 2 和
( yi ,t −2 − yi ,t −3 ) 均 为
( yi ,t −1 − yi ,t −2 ) 的工具变量。于是,模型(5.2)中参数的工具变量估计分别是
面板数据计量分析
白仲林
ˆ IV 和 α ˆ IV 就是 α 的一致估计。 的工具变量估计 α
1 2
广义矩估计的一般形式 设 X 是 p×1 的随机向量,f 是 l×1 的向量值函数,θ 是 k×1 的参数向量,并且 k ≤ l,Θ 是参数空间,即,θ∈Θ, E[f(X,θ)] = 0 是 X 的矩方程。 对于 X 的 N 个观测值 { X 1 , " ,

经济学计量经济学第五章PPT课件

经济学计量经济学第五章PPT课件

• 当a>0、0<b<1时,y 随着t 的增加而趋向于0
• 描述以几何极数递增或递减的现象
• 序列的观察值按指数规律变化
• 序列的逐期观察值按一定的增长率增长或衰减
• 参数估计方法 • 采用对数变换法将模型化为线性进行估计
29
第29页/共45页
修正指数型增长曲线模型
• 一般形式
y L ab •

~yi ˆ0 yi f xi , ˆ0 zi ˆ0 ˆ0
• 易平~y求方i 出和ˆ其式0参最数小zi 的ˆ0普 通ˆ最小二i 乘估计值

ˆ
,该估计值使得残差
2
ˆ1
n
S ˆ1
~yi ˆ0 zi ˆ0 ˆ1 2
i 1
17
第17页/共45页
Gauss-Newton迭代法(续2)
• 类别 • 多项式增长曲线模型 • 简单指数型增长曲线模型 • 修正指数型增长曲线模型 • Logistic增长曲线模型 • Gompertz增长曲线模型
27
第27页/共45页
多项式增长曲线模型
• 一般数学形式

y• t
yt:a第0t

的a1某t
个经a济2t指2

;t :时a间k t
k
• a0,a1,…,ak:模型参数
• 至此完成非线性模型的OLS估计
18
第18页/共45页
Gauss-Newton迭代法(续3)
• 步骤
• 给出参数估计值 近似值
的初值 ,将
ˆ
在 处展开泰勒级数,取一阶
ˆ0
f xi , ˆ
ˆ0
• 计算

的样本观z测i 值ˆ0

第五讲 自相关

第五讲 自相关

第五讲、自相关1、自相关的概念:古典线性回归中假设扰动项u i中不存在自相关,即E(u i u j)=0, i≠j这表明任一观察值的扰动项不受其他观察值的扰动项的影响。

但是如果存在E(u i u j) ≠0, i≠j表明存在自相关问题。

自相关通常与时间序列数据有关,但截面数据中也可能产生自相关的问题(空间相关),例如,某一家庭消费支出的增加可能影响不愿比别人逊色的另一家庭消费支出的影响。

图a-d表明扰动项u存在可辨别的模式(可能存在自相关),而图e则表明不存在系统模式(可能不存在自相关)。

2、导致自相关的因素:(1)在涉及时间序列数据的回归方程中,大多数经济时间序列数据的一个显著特征是“惯性”或“延迟性”。

如GDP、就业、货币供给等时间序列都呈现周期性,连续的观察值之间很可能存在相互依赖或是相关的。

(2)模型设定错误:应该包括在模型中的重要变量未包括进模型(过低设定)或模型选择了错误的函数形式,这时残差会呈现出系统模式。

(3)蛛网现象:即解释变量是时间滞后变量,即具有时间滞后效应。

如农产品供给模型中价格对供给的影响存在蛛网现象(滞后效应)。

这种情况下的扰动项不是随机的。

(4)数据加工:在实证研究中,通常原数据是要经过加工的。

例如季度数据的时间序列回归中,数据通常是由月度数据按季相加再平均得到,而这种“平滑”过程的本身可能导致扰动项的系统模式,从而产生自相关。

3、自相关的后果:(1)虽然最小二乘估计仍然是线性和无偏的,但不是有效的,即最小二乘估计量(OLS)不是最优线性无偏估计量(BLUE)。

(2)OLS估计量的方差是有偏的,计算OLS估计量的方差或标准差的公式可能严重低估真实的方差或标准差,从而导致常用的t检验和F检验是不可靠的。

(3)通常计算的R2也是不可靠的。

4、自相关的诊断自相关的诊断存在异方差诊断中的类似问题,即ui是无法观察的,而且也不知道其产生机制:我们通过OLS估计,仅仅得到的是ei,通过对ei的讨论来“了解”自相关是否存在。

第五讲 异方差和自相关.

第五讲 异方差和自相关.

2。利用广义最小二乘法(GLS)
广义最小二乘法是对原模型加权,使之变成一个新 的不存在异方差性的模型,然后采用普通最小二乘 法估计其参数。 其含义为 Var(b) =σ2 (X'X)-1(X'Σ X) (X'X)-1 通过加权使得Σ =I 因此,GLS和WLS要求Σ 已知。
加权最小二乘法(WLS):
4-DL
4
经验上DW值1.8---2.2之间接受原假设, 不存在一阶自相关。 DW值接近于0或者接近于4,拒绝原假 设,存在一阶自相关。
4。Q检验和Bartlett检验 reg D.rs LD.r20 predict e2,res wntestq e2 wntestq e2,lag(2) wntestb e2
r 20t 1 r 20t 1 r 20t 2
rst rst rst 1
回归方程为: use ukrates,clear tsset month reg D.rs LD.r20
自相关的检验
1。图形法:自相关系数和偏自相关系数 predict e1,res ac e1 pac e1 corrgram e1,lag(10)
3。DW检验:只能检验一阶自相关的序列相 关形式,并且要求解释变量严格外生。
根据样本个数和自由度查表得到DL和DU,并 且构造不同的区域。
reg D.rs LD.r20 dwstat
Reject H0
Uncertainty
Accept H0
Uncertainty
Reject H0
0
DL
DU
4-DU
0 . 0
2 1
0
2 2
. 0
0 0 ... . 2 ... n .. ...

完整的计量经济学 计量经济学第五章 线性回归的PPT课件

完整的计量经济学 计量经济学第五章  线性回归的PPT课件
被忽略的因素对被解释变量的影响,会从 误差项中表现出来,导致误差不再是纯粹 的随的变量关系为
X 若采用变量关系 E () ( 0 0 ) ( 1 1 )X 1 0 (2 2 )X 2 3 X 3
Y 0 1 X 1 2 X 2
Y Y

D 1i
0,当 i是男性时 1,当 i是女性时
38
对于截面数据计量分析的例子
对于截面数据计量分析中,观测对象特征差异导致的规律 性扰动,也可以利用虚拟变量加以处理。
如观测对象的性别是一个影响因素,解决的办法就是在模 型中引进虚拟变量,即
D1,D2,D3和D4,
这个虚拟变量就能解决由于观测对象的性别因素所导 致的误差项均值非0问题。
非线性变量关系的残差序列图
e
i
8
(三)问题的处理和非线性回归
1、模型修正和变换 恢复模型的合理非线性形式 然后再变换成线性模型
9
泰勒级数展开法
2、泰勒级数展开法 假设一个非线性的变量关系为:
Y f X 1 , ,X K ;1 P
在 处对 B 0b 1,0 ,b P 0 β1, ,P 作泰勒级数展开:
第五章 线性回归的定式偏差
1
标题添加
点击此处输入相 关文本内容
标题添加
点击此处输入相 关文本内容
总体概述
点击此处输入 相关文本内容
点击此处输入 相关文本内容
2
线性回归的定式偏差
本章讨论变量关系非线性、存在异常值、 规律性扰动和解释变量缺落等导致的线性 回归模型前两条假设不成立的定式偏差, 包括它们对线性回归分析的影响、判断和 处理的方法等。
1 0 2 0
1 1 X 2 1 X
1 2

第五讲 自相关性

第五讲  自相关性

第5章 自相关性5.1 自相关性及其产生的原因5.1.1 什么是自相关性对于模型:t kt k t t t u x b x b x b b y +++++= 22110 (5.1.1)如果随机误差项的各期值之间存在着相关关系,即协方差0)())())(((),cov(≠=--=s t s s t t s t u u E u E u u E u E u u (s t ≠,k s t ,2,1,=)这时,称随机误差项之间存在自相关性或序列相关(Autocorrelation or serial correlation)。

随机误差项的自相关性可以有多种形式,其中最常见的类型是随机误差项之间存在一阶自相关性或一阶序列相关:0)(),cov(11≠=--t t t t u u E u u ,或者:)(1-=t t u f u 。

一阶自相关性可以表示为t t t v u u +⋅=-1ρ (5.1.2)其中ρ是t u 与1-t u 的一阶自相关系数,t v 是满足回归模型基本假定的随机误差项。

因为在大样本情况下,根据OLS 原理,ρ的OLS 估计式为:∑∑--=211ˆt t tuuu ρ(0)(=t u E )而t u 和1-t u 之间的相关系数r 为:∑∑∑--=2121t tt t uu u u r ≈ρˆ211=∑∑--t t tuu u (在大样本情况下,∑∑-≈212t t u u ) 因此,可以认为ρ是t u 与1-t u 的一阶自相关系数。

1≤ρ,1=ρ表示完全正自相关,t t t v u u +=-1;10〈〈ρ表示正自相关;0=ρ表示不存在自相关,t t v u =;01〈〈-ρ表示负自相关;1-=ρ表示完全负自相关,t t t v u u +-=-1。

自相关性的一般形式可以表示成:),,,(21p t t t t u u u f u ---= ,或者:t p t p t t t v u u u u ++++=---ρρρ 2211 (5.1.3)称之为p 阶自回归形式,或模型存在p 阶自相关。

计量经济学重点笔记第五讲

计量经济学重点笔记第五讲

第五讲 自相关高斯-马尔科夫假定五是:(,)0,i j Cov i j εε=≠如果该假定不成立,那么称模型的误差项是序列相关的。

由于序列相关主要针对于时间序列数据,因此我们把脚标i 改写为t ,把样本容量N 改写为T 。

笔记:1、如果基于横截面数据的回归模型其误差项是相关的,则称为空间自相关。

但是要记住,除非观察顺序具有某种逻辑或者经济上的意义,否则,在横截面数据回归中,观察顺序是可以随意的,因此,也许在某种观测顺序下误差项呈现出一种模式的自相关但在另一种观测顺序下又呈现出另外一种模式的自相关。

然而,当我们处理时间序列时,观测服从时间上的一种自然顺序。

2、在时间序列模型中,误差项经常被称之为冲击(Shock)。

对经济系统的冲击经常具有持续性,从而这为误差项序列相关提供了现实依据。

一、 自相关的后果与仅仅违背同方差假定一样,仅仅违背序列无关假定并不影响OLS 估计量所具有的线性、无偏性、一致性等性质。

在误差项序列相关的情况下,OLS 估计法并没有利用这个信息,故OLS 估计量不是最有效的。

我们下面来推导在误差项序列相关情况下OLS 估计量的方差表达。

假定真实模型是:t 01t t y x ββε=++则12ˆ12222()()()()(())()()[()]t t t t t t t t tx x Var x x x x Var x x Var x x x x βεδβεε-=+---==--∑∑∑∑∑∑ 在假定五:0,0t t jj εεδ+=≠下,有:122ˆ222()[()]tt t x x x x βεδδ-=-∑∑但如果假定五不成立,那么正确的方差表达式应该是:12ˆ1221122()2()()[()]t t t j T T tt t t j t j t x x x x x x x x βεεεδδδ+--+==-+--=-∑∑∑∑所以, OLS 法下通常的系数估计量方差的表示是错误的,一般来说它小于真实的方差。

计量经济学第五讲

计量经济学第五讲

第三章 回归模型的扩展利用回归分析的估计、检验理论可以建立一个较好的因果关系模型,但是数理统计方法主要适用于研究可控的自然现象,对于无法通过人为控制进行“实验”的社会经济现象,其适用性就受到一定限制。

因此,对于传统的回归分析方法,人们在理论、方法和应用上都有了许多发展。

本章主要讨论三个方面的“扩展”内容:(1)古典回归模型基本假定不成立时所产生的问题;(2)如何反映定性因素的影响;(3)如何反映滞后因素的影响,将静态模型转化成动态模型。

第一节 异方差性古典回归模型包含了若干基本假定,在这些基本假定成立的前提下,应用最小二乘法可以得到无偏、有效的参数估计量,而且可以构造F 检验、t 检验、系数的标准误差等统计量来评价模型的优劣。

但是许多经济现象并不一定都能满足这些假定,这必然会影响回归分析的估计和检验结果。

在古典回归模型的若干假定中间,是不容易成立的是同方差假定、非自相关假定和无多重共线性假定。

因此,在本章的前三节中我们将着重分析这三个假定,并且对每一个假定都依次讨论以下问题: (1)假定的含义及其违反的原因;(2)假定违反时将会产生什么不利影响; (3)如何检验假定是否成立; (4)假定违反时的处理方法。

一、异方差性及其产生的原因 对于线性回归模型i ki k i i i x b x b x b b y ε+++++= 22110同方差假定为:n i D i ,,2,1)(2==σε即对于不同的样本点,随机误差项的离散程度是相同的;如果出现:n i D i i ,,2,1)(2 =≠=常数σε则称模型出现了异方差性(Heteroskedasticity )例如,利用横截面资料建立居民储蓄函数时,对于低收入家庭,其满足基本消费支出之后的剩余收入已经不多,所以各个家庭之间的储蓄存款不会有太大差异;但对于高由入家庭,因受储蓄心理、消费习惯、家庭成员构成等因素的影响,各个家庭之间的储蓄存款可能会有很大差异,即随机误差项的方差会明显地大于低收入家庭。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三章 回归模型的扩展利用回归分析的估计、检验理论可以建立一个较好的因果关系模型,但是数理统计方法主要适用于研究可控的自然现象,对于无法通过人为控制进行“实验”的社会经济现象,其适用性就受到一定限制。

因此,对于传统的回归分析方法,人们在理论、方法和应用上都有了许多发展。

本章主要讨论三个方面的“扩展”内容:(1)古典回归模型基本假定不成立时所产生的问题;(2)如何反映定性因素的影响;(3)如何反映滞后因素的影响,将静态模型转化成动态模型。

第一节 异方差性古典回归模型包含了若干基本假定,在这些基本假定成立的前提下,应用最小二乘法可以得到无偏、有效的参数估计量,而且可以构造F 检验、t 检验、系数的标准误差等统计量来评价模型的优劣。

但是许多经济现象并不一定都能满足这些假定,这必然会影响回归分析的估计和检验结果。

在古典回归模型的若干假定中间,是不容易成立的是同方差假定、非自相关假定和无多重共线性假定。

因此,在本章的前三节中我们将着重分析这三个假定,并且对每一个假定都依次讨论以下问题: (1)假定的含义及其违反的原因;(2)假定违反时将会产生什么不利影响; (3)如何检验假定是否成立; (4)假定违反时的处理方法。

一、异方差性及其产生的原因 对于线性回归模型i ki k i i i x b x b x b b y ε+++++= 22110同方差假定为:n i D i ,,2,1)(2==σε即对于不同的样本点,随机误差项的离散程度是相同的;如果出现:n i D i i ,,2,1)(2 =≠=常数σε则称模型出现了异方差性(Heteroskedasticity )例如,利用横截面资料建立居民储蓄函数时,对于低收入家庭,其满足基本消费支出之后的剩余收入已经不多,所以各个家庭之间的储蓄存款不会有太大差异;但对于高由入家庭,因受储蓄心理、消费习惯、家庭成员构成等因素的影响,各个家庭之间的储蓄存款可能会有很大差异,即随机误差项的方差会明显地大于低收入家庭。

又如,以总产值作为解释变量建立企业的成本函数时,由于管理水平、生产技术条件等因素的影响,使得同一生产规模的企业有不同的生产成本;但生产规模较小的企业,其生产成本的差异不会很大,而生产规模较大的企业则可能会产生较大的差异,即随机误差项的方差有增大的趋势。

模型产生异方差性主要有以下原因:(1) 模型中遗漏了影响逐渐增大的因素。

例如,储蓄函数中的证券投资、利息、消费者行为等因素;成本函数中的管理水平、生产技术条件和规模效益等因素;消费函数中的家庭财产、消费心理等因素。

(2) 模型函数形式的误差。

如将指数曲线模型误设成了线性模型,则误差有增大的趋势。

(3) 随机因素的影响,如政策变动、自然灾害、金融危机等。

因此,经济分析中经常会遇到异方差性的问题。

而且经验表明,利用横截面数据建立模型时,由于在不同样本点上(解释变量之外)其他因素影响的差异较大,所以比时间序列资料更容易产生异方差性。

二、异方差性的影响模型一旦出现异方差性,将会产生以下不利影响: (一) 最小二乘估计不再是有效估计因为在高斯——马尔可夫定理的证明过程中曾利用了同方差假定,随机误差项为异方差时,OLS 估计仍然是无偏估计,但不再具有最小方差的特性,即存在其他的参数估计方法,其估计误差将小于OLS 估计的误差。

(二) 无法正确估计系数的标准误差以一元线性回归模型为例,在高斯——马尔可夫定理的证明过程中曾经得:∑∑∑∑∑-====+=22222)(/()()()()ˆ(x x )k )(D k k D k b D b D i i i i ii i i σσεεε在同方差情况下在非自相关情况下其中:∑--=2)(/)(x x x x k i i i 。

这样,如果再以2σ的无偏估计量∑-=)2/(ˆ22n e i σ估计2σ,就可以得到b ˆ的标准误差为:xxiS x x bS 222ˆ)(ˆ)ˆ(σσ=-=∑但是,在异方差的情况下,2i σ是一些不同的数,只有估计出每一个2i σ之后才能得到系数的标准误差,这在只有一组样本观察值的情况下是无法做到的。

而且,如果设:),,2,1,0(ˆ22n i i i i =>=λσλσ则在异方差情况下,系数的标准误差为:∑∑∑∑-∙=∙-===xxi i xxi xx i ii i i S x x S S x x k k b S 222222222)(ˆˆ)(ˆ)ˆ(λσσλσλσ因此,如果仍然用xx S /ˆ2σ计算系数的标准误差,将会产生估计偏差;偏差的大小取决于第二个因子值的大小,当其大于1时,则会过低估计系数的误差;反之,则做出院过高的估计。

(三) t 检验的可靠性降低因为在异方差情况下,无法正确估计系数的标准误差)ˆ(bS ,这直接影响到t 统计量值的正确确定。

因为:)ˆ(ˆb S bt =所以用t 检验来判断解释变量影响的显著性将失去意义。

(四) 增大模型的预测误差异方差性的存在一方面使模型夫去了良好的统计性质,另一方面由于随机误差项的方差与模型的预测区间密切相关())ˆ(ˆ),ˆ(ˆ(2/2/b S t b b S t b αα+-,在2iσ逐渐增大的情况下,模型的预测误差也随着增大。

上述分析表明,实际经济总是中经常会出现异方差性,这将直接影响回归模型的估计、检验和应用。

因此,在建立计量经济模型的过程中,应该检验模型是否存在异方差性;如果不存在异方差性(当然要求其他假定也同时成立),则可以用回归分析方法建立模型;否则,应该采用其他的参数估计方法建立模型。

三、异方差性的检验为了检验模型是否存在异方差性,需要事先了解随机误差项取值的概率分布情况。

但是随机误差项的变化是由模型之外其他因素的综合影响来决定,其取值情况是无法观测的。

实际研究中,一般是通过对残差分布情况的分析来推测随机误差项的分布特征,因为残差项i e 描述的也是解释变量之外其他因素的综合影响,可以将其作为随机误差项i ε的估计量。

例1 我国制造工业利润函数。

表3-1列出了1998年我国主要制造工业销售收入与销售利润的统计资料。

现以表3-1数据资料为例,介绍检验异方差性的一些常用方法 (一) 图示检验法1、 相关图分析“方差”即为随机变量取值的离散程度。

由于被解释变量y 与误差项ε的方差相同,因此通过观察y 与x 的相关图,可以分析y 的离散程度与解释变量之间是否存在着相关关系;如果随着x 值的增加,y 的离散程度呈现逐渐增大(或减小)的趋势,则表明模型存在着递增(或递减型)的异方差性。

建立回归模型时,为了判断模型的函数形式,一般要观察被解释变量与解释变量的相关图,此时也可以大致判断模型是否存在异方差性。

图3-1(P72)为销售利润与销售收入的相关图,从图中可以明显看出,随着销售收入的增加,销售利润的平均水平不断提高,但其离散程度同时也在逐步扩大,即呈现出递增型的异方差性。

2、 残差分布图分析建立回归模型之后,在方程窗口中点击Resids 按钮可以得到模型的残差分布图,如果残差分布的离散程度有明显扩大的趋势,则表明存在着异方差性。

注意观察之前需要先将数据关于解释变量排序,命令格式为:SORT X图示检验法只能粗略地判断模型是否存在异方差性,当异方差性不太明显时,还需要采用一些较为精确的检验方法。

(二) 戈德菲尔德——匡特(Goldfeld —Quandt )检验戈德菲尔德检验,简称G —Q 检验,它的原理可以用图3-2直观表示。

图3-2 G —Q 检验原理图为了检验异方差性,将样本按解释变量排序后分成两部分,再利用样本1和样本2分别建立回归模型,并求出各自的残差平方和RSS 1和RSS 2。

如果误差项的离散程度相同(即为同方差的),则RSS 1和RSS 2的值应该大致相同;若两者之间存在显著差异,则表明存在异方差性。

检验过程中为了“夸大”残差的差异性,一般先在样本中部去掉C 个数据(通常取C=n/4),再利用F 统计量判断差异的显著性:12R S S R S S F =~)13()12,12(-------k c n k c n F其中,一般取RSS 1>RSS 2。

K 为参数的个数,对于给定的显著水平α,若αF F>,则表明存在异方差性;反之,则不存在异方差性。

例如,例1中样本数据个数n=28,C=n/4=7,为了使两个子样本的容量相同,从中间去掉8个数据(即取C=8)。

因此,利用EViews 进行G —Q 的具体步骤为: SORT X 将样本数据关于X 排序 SMPL 1 10 确定子样本1LS Y C X 求出RSS1=2579.59 SMPL 19 28 确定子样本2LS Y C X 求出RSS2=63769.67 =63769.67/2579.59 计算出F=24.72 取05.0=α时,查F 分布表得44.3)1110,1110(05.0=----F ,而44.372.2405.0=>=F F ,所以存在(递增的)异方差性。

从检验过程可以看出,G —Q 检验适用于检验样本容量较大、异方差性呈递增或递减的情况,而且检验结果与数据剔除个数C 的选取有关。

(三) 怀特(White )检验White 检验是通过建立辅助回归模型的方式来判断异方差性。

不妨设回归模型为二元线性回归模型:i i i i x b x b b y ε+++=22110则White 检验的具体步骤为:(1) 估计回归模型,并计算残差的平方2i e 。

(2) 估计辅助回归模型:i i i i i i i i v x x a x a x a x a x a a e ++++++=215224213221102即将残差平方关于所有解释变量的一次项、二次项和交叉乘积项进行回归(其中,i v 是满足古典回归模型假定的误差项),实际上还可以引进解释变量的高次项,但这样会使样本的自由度在幅度下降,所以一般只引入二次项;而且在样本容量较小、解释变量个数相对较多的情况下,为了保证自由度,在辅助回归模型中可以省去交叉乘积项。

(3) 计算辅助回归模型的判定系数2R ,可以证明,在同方差的假设下(即假设0:543210=====a a a a a H ),渐近地有:2nR ~)23()(2-q χ其中,自由度q 为辅助回归模型中的自变量个数(此时q=5)。

(4) 对于给定的显著水平α,若)(22q nRαχ>,则拒绝原假设0H ,即认为)0(≠i a i 中至少有一个显著地不等于0,模型存在异方差性;反之,则认为不存在异方差性。

利用EViews 软件可以直接进行White 检验。

例如,对例1的我国制造工业利润函数,White 检验的具体步骤为:(1)建立回归模型: LS Y C X (2)检验异方差性:在方程窗口中依次点击View\Residual Test\White Heteroskedasticity此时可以选择在辅助回归模型中是否包含交叉乘积项(Crossterms ),本例为一元回归模型,辅助回归模型中只有x 和x 2两项,不存在交叉乘积项。

相关文档
最新文档