Eviews 线性回归教程
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算公式如下:
AIC 2l T 2k T
其中l 是对数似然值
T ˆˆ l (1 log( 2 π) log( uu / T )) 2
我们进行模型选择时,AIC值越小越好。例如,可以通过选 择最小AIC值来确定一个滞后分布的长度。
(9). Schwarz准则 Schwarz准则是AIC准则的替代方法:
2
这里 u 是残差。而且系数估计值的标准差是这个矩阵对角线元 ˆ 素的平方根。可以通过选择View/Covariance Matrix项来察看整
wenku.baidu.com
个协方差矩阵。
(3) t-统计量 t统计量是由系数估计值和标准差之间的比率来计算的,它 是用来检验系数为零的假设的。 (4) 概率(P值) 结果的最后一项是在误差项为正态分布或系数估计值为渐 近正态分布的假设下, 指出 t 统计量与实际观测值一致的概率。 这个概率称为边际显著性水平或 P 值。给定一个 P 值,可 以一眼就看出是拒绝还是接受实际系数为零的双边假设。例如, 如果显著水平为5% ,P 值小于0.05就可以拒绝系数为零的原假 设。
标准差(Standard Deviation) 标准差衡量序列的离散程度。 计算公式如下
ˆ s
1 N N 1 i 1
yi y
2
N 是样本中观测值的个数, y 是样本均值。
偏度(Skewness) 衡量序列分布围绕其均值的非对称
性。计算公式如下
1 S N
i 1
N
yi y ˆ
4
意义同S中 ,正态分布的 K 值为3。如果 K 值大于3,
分布的凸起程度大于 正态分布;如果K值小于3,序列分布相 对于正态分布是平坦的。
Jarque-Bera 检验 检验序列是否服从正态分布。统计
量计算公式如下
N k JB 6
2 1 2 S 4 K 3
2 方程统计量
(1) R2 统计量 R2 统计量衡量在样本内预测因变量值的回归是否成功。R2 是自变量所解释的因变量的方差。如果回归完全符合,统计值 会等于1。如果结果不比因变量的均值好,统计值会等于0。R2 可能会由于一些原因成为负值。例如,回归没有截距或常数,
或回归包含系数约束,或估计方法采用二阶段最小二乘法或
3 估计选项
EViews提供很多估计选项。这些选项允许进行以下操 作:对估计方程加权,计算异方差性,控制估计算法的各 种特征。
(四)
方程输出
在方程说明对话框中单击OK钮后,EViews显示估计结果:
根据矩阵的概念, 标准的回归可以写为:
y Xβ u
其中: y 是因变量观测值的 T 维向量,X 是解释变量观测值的 T k 维矩阵,T 是观测值个数,k 是解释变量个数, 是 k 维 系数向量,u 是 T 维扰动项向量。
归变量是完全共线的。在完全共线的情况下,回归变
量矩阵X不是列满秩的,不能计算OLS估计值。
第一讲
Eviews基础与线性回归
主要内容架构
一、数据的导入与基本统计量 二、线性回归(一元和多元)
三、回归检验
一、数据的导入与基本统计量
EViews提供序列的各种统计图、统计方法及过程。
当用前述的方法向工作文件中读入数据后,就可以对 这些数据进行统计分析和图表分析。 EViews可以计算一个序列的各种统计量并可用表、 图等形式将其表现出来。视图包括最简单的曲线图,一直
程,并选择估计方法。
(二) 在EViews中对方程进行说明
当创建一个方程对象时,会出现如下对话框:
在这个对话框中需要说明三件事:方程说明,估计方法,估 计使用的样本。在最上面的编辑框中,可以说明方程:因变量 (左边)和自变量(右边)以及函数形式。 有两种说明方程的基本方法:列表法和公式法。列表法简单 但是只能用于不严格的线性说明;公式法更为一般,可用于说明 非线性模型或带有参数约束的模型。
SC 2l T k log T T
(10). F统计量和边际显著性水平 F统计量检验回归中所有的系数是否为零(除了常数或截距)。 对于普通最小二乘模型,F统计量由下式计算:
R 2 k 1 F 1 R 2 T k
在原假设为误差正态分布下,统计量服从 F(k – 1 , T – k) 分布。
(2) 标准差 (Std.Error) 标准差项报告了系数估计的标准差。标准差衡量了系数估 计的统计可信性----标准差越大,估计中的统计干扰越大。 估计系数的协方差矩阵是由以下公式计算得到的:
var( ) s 2 ( X X ) 1
其中
ˆˆ s uu /(T k ) ˆ u y Xb
同直方图一起显示的还有一些标准的描述统计量。这些 统计量都是由样本中的观测值计算出来的。
均值 (mean) 即序列的平均值,用序列数据的总和除以数
据的个数。
中位数 (median) 即从小到大排列的序列的中间值。是对 序列分布中心的一个粗略估计。
最大最小值 (max and min) 序列中的最大最小值。
1 系数结果
(1). 回归系数 (Coefficient) 系数框描述了系数 的估计值。最小二乘估计的系数 b 是 由以下的公式计算得到的
X ) 1 X y b (X
如果使用列表法说明方程,系数会列在变量栏中相应的自 变量名下;如果是使用公式法来说明方程,EViews会列出实际 系数 c(1), c(2), c(3) 等等。 对于所考虑的简单线性模型,系数是在其他变量保持不变 的情况下自变量对因变量的边际收益。系数 c 是回归中的常数 或者截距---它是当其他所有自变量都为零时预测的基本水平。 其他系数可以理解为假设所有其它变量都不变,相应的自变量 和因变量之间的斜率关系。
(三)
1 估计方法
在EViews中估计方程
说明方程后,现在需要选择估计方法。单击Method:进入对
话框,会看到下拉菜单中的估计方法列表:
标准的单方程回归用最小二乘估计。其他的方法在以后的 章节中介绍。采用OLS,TSLS,GMM,和ARCH方法估计的 方程可以用一个公式说明。非线性方程不允许使用binary, ordered,censored,count模型,或带有ARMA项的方程。
F统计量下的P值,即Prob(F-statistic), 是F检验的边际显 著性水平。如果P值小于所检验的边际显著水平,比如说 0.05,则拒绝所有系数都为零的原假设。注意F检验是一个
联合检验,即使所有的t统计量都是不显著的,F统计量也可
能是高度显著的。
(五) 虚拟变量的应用
工资差别
为了解工作妇女是否受到了歧视,可以用美国统计局的“当前人口调查” 中的截面数据研究男女工资有没有差别。这项多元回归分析研究所用到的变 量有: W — 雇员的工资(美元/小时) 1;若雇员为妇女 SEX =
到核密度估计。
打开工作文件,双击一个序列名,即进入序列的对话 框。单击“view”可看到菜单分为四个区,第一部分为序列 显示形式,第二和第三部分提供数据统计方法,第四部分是 转换选项和标签。
描述统计量
以直方图显示序列的频率分布。直方图将序列的长度按 等间距划分,显示观测值落入每一个区间的个数。
3
s ( N 1) / N 是变量方差的有偏估计。如果序列的分布
是对称的,S值为0;正的S值意味着序列分布有长的右拖尾,负
的S值意味着序列分布有长的左拖尾。
峰度(Kurtosis) 度量序列分布的凸起或平坦程度,
计算公式如下
1 K N
i 1
N
yi y ˆ
些技术和模型都建立在本章介绍的基本思想的基础之上。
(一) 创建方程对象
EViews中的单方程回归估计是用方程对象来完成 的。为了创建一个方程对象: 从主菜单选择Object/New
Object/Equation 或 Quick/Estimation Equation …,或
者在命令窗口中输入关键词equation。 在随后出现的方程说明对话框中说明要建立的方
自变量,总能得到R2 为1。
2 R2 调整后的记为 R,消除R2 中对模型没有解释力的新增变
量。计算方法如下:
R 2 1 1 R2
T T 1 k
R 2从不会大于R2 ,随着增加变量会减小,而且对于很不
适合的模型还可能是负值。
(3) 回归标准差 (S.E. of regression)
回归标准差是在残差的方差的估计值基础之上的一个总结。 计算方法如下:
ˆˆ s uu /(T k )
(4)残差平方和 残差平方和可以用于很多统计计算中,为了方便,现在将
它单独列出:
ˆ u ( yt X t b) 2 uˆ
t 1
T
(5) 对数似然函数值 EViews可以作出根据系数的估计值得到的对数似然函数 值(假设误差为正态分布)。似然比检验可通过观察方程严 格形式和不严格形式的对数似然值之间的差异来进行。
S为偏度,K为峰度,k是序列估计式中参数的个数。
在正态分布的原假设下,J-B统计量是自由度为2的 2 分 布。 J-B统计量下显示的概率值(P值)是J-B统计量超出原 假设下的观测值的概率。如果该值很小,则拒绝原假设。当 然,在不同的显著性水平下的拒绝域是不一样的。
二、基本回归模型
单方程回归是最丰富多彩和广泛使用的统计技术之一。
ARCH方法。 EViews计算R2 的公式为:
ˆˆ uu , R 1 ( y y )( y y )
2
ˆ u y Xb
其中,ˆ 是残差,y 是因变量的均值。 u
(2) R2 调整 使用R2 作为衡量工具存在的一个问题,即在增加新的自变
R2 量时R2 不会减少。在极端的情况下,如果把样本观测值都作为
2 估计样本 可以说明估计中要使用的样本。EViews会用当前工作文档样 本来填充对话框。 如果估计中使用的任何一个序列的数据丢失了,EViews会 临时调整观测值的估计样本以排除掉这些观测值。EViews通过 在样本结果中报告实际样本来通知样本已经被调整了。
在方程结果的顶部, EViews报告样本已经得到了调整。从 1978年2002年期间的25个观测值中, EViews使用了24个观测值。
0;其他
ED — 受教育的年数 AGE — 雇员的年龄 1;若雇员不是西班牙裔也不是白人 NONWH = 0;其他 1;若雇员是西班牙裔
HISP =
0;其他
(六) 估计中存在的问题
如果自变量具有高度共线性,EViews 在计算回归 估计时会遇到困难。在这种情况下,EViews会产生一 个显示错误信息对话框 “奇异矩阵”。出现这个错 误信息后,应该检查回归变量是否是共线的。如果一 个回归变量可以写作其他回归变量的线性组合,则回
验”中,我们讨论Q统计量和 LM检验,这些都是比DW统计
量更为一般的序列相关检验方法。
(7). 因变量均值和标准差(S.D) y 的均值和标准差由下面标准公式算出:
y yi T
i 1
T
sy
y
T t 1
i
y
2
T 1
(8). AIC准则(Akaike Information Criterion)
本章介绍EViews中基本回归技术的使用,说明并估计一个
回归模型,进行简单的特征分析并在深入的分析中使用估 计结果。随后的章节讨论了检验和预测,以及更高级,专 业的技术,如加权最小二乘法、二阶段最小二乘法(TSLS)、 非线性最小二乘法、ARIMA/ARIMAX模型、GMM(广
义矩估计)、GARCH模型和定性的有限因变量模型。这
对数似然计算如下:
T ˆˆ l (1 log( 2 π) log( uu / T )) 2
(6) Durbin-Watson 统计量
D-W 统计量衡量残差的序列相关性,计算方法如下:
T T
ˆt ut 1 ) 2 DW (u ˆ
t 2
ˆt2 u
t 1
作为一个规则,如果DW值小于2,证明存在正序列相关。 在例1的结果中,DW值很小,表明残差中存在序列相关。关 于Durbin-Watson统计量和残差序列相关更详细的内容参见 “序列相关理论”。 对于序列相关还有更好的检验方法。在 “序列相关的检