第三讲 基本回归模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ˆ u ˆ u R 1 ( y y )( y y )
2
ˆ y Xb u
ˆ 是残差, y 是因变量的均值。 其中, u
调整R2计算公式为:
T 1 R 1 1 R T k
2
2
15
6. 回归标准差 (S.E. of regression)
ˆ u ˆ /(T k ) s u
11
例如,利用文件“3-1”数据,建立线性消费函
数 cst=c0+c1inct+ut ( cs 是城镇居民消费; inc 是可
支配收入)。
方程中 c0 代表自发消费,表示收入等于零时 即收入每增加1元,消费将增加 c1 元。
的消费水平;而 c1 代表了边际消费倾向, 0<c1<1 , 从分析结果可以看出边际消费倾向是 0.514 。也
ln( GDP _ Pt ) c0 c1 t t u t
其中:GDPPt 表示剔出价格因素的实际GDPt 。方程中时间趋势变量的系数估 计值是0.0815,说明我国实际GDP(支出法)年平均增长率为8.15%。F值或 R2表明模型拟合效果很好,D.W.显示模型存在(正的)自相关。
27
在编辑框列出方程中要使用的变量列表。例如,
c和收入inc对消费cs作回归。在方程说明对话框上
部输入:
cs
c
inc
其中c说明在回归中包括常数项,内部序列c不出现 在工作文档中,除了说明方程外不能使用它。 在上例中,常数存储于c(1),inc的系数存储于 c(2),即回归方程形式为:
cs = c(1)+c(2)*inc。
是y的平均增长率。宏观经济模型表达式中常有时间趋 势,在研究经济长期增长或确定性趋势成分时,常常将 产出取对数,然后用时间t作解释变量建立回归方程。
26
例如,根据文件“3.4”提供的数据,建立半对数线性方程,估计我国实际 GDP(支出法,样本区间:1978~2002年)的长期平均增长率。模型形式为
三、 双曲函数模型
形如下式的模型称为双曲函数模型
1 Yt b1 b2 ( ) ut Xt
这是一个变量之间是非线性的模型,因为Xt 是 以倒数的形式进入模型的,但这个模型却是参数线 性模型,因为模型中参数之间是线性的。这个模型 的显著特征是随着Xt 的无限增大,(1/Xt )接近于 零。
从主菜单中选择 Matrix-Vector-Coef ,为系数向量输入
名 字 , 选 择 OK , 在 New Matrix 对 话 框 中 , 选 择
Coefficient Vector 并说明向量的行数,带有系数向
量图标的对象会列在工作文档目录中. 再在方程说明中使用这个系数向量。例如,假设创造 了系数向量 a 和b,各有一行。则可以用新的系数向量 代替 c : log(cs)=a(1)+ b (1)* log(cs(-1))
2
创建方程对象对话框如下图:
对话框分三部 分: 说明方程,先 列因变量再列 自变量,或者 直接输入函数 形式 估计方法 估计使用的样 本
3
二、方程说明
有两种说明方程的基本方法: 列表法:只能用于线性方程的说明; 公式法:可用于非线性模型或带有参数约 束模型的说明。
4
1、列表法 利用文件“3-1”数据,建立线性消费函数,用常数
20
ARMA Structure用于对ARMA模型的进行结构分析
Gradients and Derivatives... 描述目标函数的
梯度和回归函数的导数计算的信息。
Covariance Matrix以表的形式显示系数估计值的
协方差矩阵。
Coefficient
Diagnostics,
Diagnostics,
Residual
and Stability Diagnostics ,在后面的
“方程的诊断检验”中再作说明。
21
二、方程过程
Specify/Estimate... 编辑方程说明、改变估计方法、估计 样本。 Forecast ... 用估计方程的预测。 Made Residual Series... 以序列形式保存回归中的残差。 Make Regressor Group 创建包含方程中使用的所有变量的 未命名组(常数除外)。 Made Gradient Group 创建包含目标函数关于模型的系数 的斜率的组。 Make Derivative Group 创建包含回归函数关于其系数的导 数的组。 Make Modle 创建一个与被估计方程有关的未命名模型。 Update Coefs from Equation 把方程系数的估计值放在系 数向量中。
8
三、 方程 的估计方法
在创建方程对象对话框的Method框下拉框中,会 看到估计方法列表:
标准的单方程回归用最小二乘估计(LS)。其他还 和ARCH(自回归条件异方差)等方法。
9
有TSLS(两阶段最小二乘法)、GMM(广义矩估计法),
第二节 方程的结果输出
在方程说明对话框中单击OK后,显示估计结果如下图:
明方程。许多估计方法允许使用公式来说明方程。
EViews中的公式是一个包括回归变量和系数的 数学表达式。要用公式说明一个方程,只需在对话 框中变量列表处输入表达式即可。EViews会在方程 中添加一个随机附加扰动项并用最小二乘法估计模 型中的参数。
7
用公式法说明方程可以使用不同的系数向量。方法为: 首先要创建一个新的系数向量: 选择Object/New Object…
22
第四节
线性回归方程的衍生方程
非线性回归方程:下面模型都是参数线性
模型,但是变量却不一定是线性的:
(1)双对数线性模型(不变弹性模型)
(2)半对数模型
(3)双曲函数模型 。。。 含虚拟变量的方程
23
一、双对数线性方程
双对数线性模型估计得到的参数本身就是该变量的 弹性。例如,利用“ 3-1” 数据建立我国居民消费的收 入弹性方程: log(cst) = 0.18 + 0.917log(inct) t =(1.01) (45.72) R2 = 0.989 D.W. = 0.447
i 1
16
10. 因变量标准差(S.D)
sy
y
T t 1
i
y
2
T 1
11. AIC准则(赤池信息准则Akaike Information Criterion)
AIC 2l T 2 k T
其中:l 是对数似然值 AIC值越小越好 。 12. Schwarz准则 (施瓦茨准则):越小越好
SC 2l T k log T T
17
13. Hannan-Quinn Criterion (HQC)
一种模型选择标准 ,相对于贝叶斯信息标准 (Bayesian information criterion = BIC)标准的 另外一种标准。
14. Durbin-Watson 统计量
即 1978 年 -2002 年 中 国 城 镇 居 民 可 支 配 收 入 的
51.4%用来消费。
12
2. 标准差 (Std.Error)
标准差项报告了系数估计的标准差。标准差衡
量了系数估计的统计可信性----标准差越大,估计 中的统计干扰越大。
3. t-统计量
t统计量是由系数估计值和标准差之间的比率来 计算的,它是用来检验系数为零的假设的。
28
利用美国1955~1984年的数据(见文件“3-5”),根据菲利普斯曲线,即通货 膨胀率 t 和失业率 Ut 的反向关系,建立双曲函数:
ˆ t 0 .08 0 .2 (1 / U t )
估计结果表明,菲利普斯曲线所描述的 t 和Ut 的反向关系并不存在。之 所以出现这样的背离,主要是因为20世纪70年代出现石油危机,从而引发了 “滞胀”,通货膨胀伴随着高失业率。如果考虑到通货膨胀预期的影响,则 29 可以在模型中引入代表通货膨胀预期的变量,比如用通货膨胀前期值来代表。
7.残差平方和(Sum squared resid)
T
ˆ u ˆ ( yt X t b ) u
t 1
2
8. 对数似然函数值:其数值越大,意味着模型精确
T ˆ u ˆ / T )) l (1 log( 2 π) log( u 2 T 9.Mean dependent var:因变量均值 y y T i
第三讲 基本回归模型
经济计量研究始于经济学中的理论假设,在实 际研究中,经常需要根据经济理论设定的一组变量 间关系进行实证研究。基本回归模型的建模、检验 和预测是最广泛使用的统计技术之一,也是其他更 高级、专业技术(如ARIMA/ARIMAX模型、GMM)的 基础。
1
第一节 回归方程的建立
一、创建方程对象 EViews中的单方程回归估计是用创建方程 对象来完成的。创建一个方程对象有以下几种 方法: 从主菜单选择Object/New Object/Equation Quick/Estimate Equation … 在命令窗口中输入关键词equation,回车。 在随后出现的方程说明对话框中说明要建立的 方程,并选择估计方法。
Байду номын сангаас在变量列表中包括自动序列:
如:“log(cs) c log(cs(-1)) log((inc+inc(-1))/2) ” 相当于建立回归方程:
log(cs)=c(1)+c(2)*log(cs(-1))+c(3)*log((inc+inc(-1))/2)
6
2、公式法
当列表方法满足不了要求时,可以用公式来说
对数方程又称增长模型,通常我们用这类估计许 多变量的增长率。如果x取“时间”t,即按时间顺序依 次取值为1,2,…,T,变量t 的系数1 度量了ln(y)随 时间向前推进产生的变化。如果1为正,则有随时间 向上增长的趋势;如果1为负,则有随时间向下的趋 势,因此t可称为趋势变量,而且
d ln( y ) d y / d t β1 dt y
5
以下均为常见的说明方程的方法:
变量包括滞后序列:
如“cs c cs(-1) inc” 相当于建立回归方程:cs=c(1)+c(2)*cs(-1)+c(3)*inc。
滞后项使用关键词 to :
如:“cs c cs(-1 to -4) inc” 相当于建立 cs 关于常数 c 、 cs(-1) 、 cs(-2) 、 cs(3)、cs(-4) 和inc的回归方程。
其中cst 是城镇居民消费,inct 是居民消费可支配收入。
24
方程中消费的收入弹性为0.917,说明我国城镇居 民收入每增加1%,将使得城镇居民消费增加0.917%。
25
二、 半对数模型 线性模型与对数线性模型的混合就是半对数模型 或
ye
0 1 x u
ln( y ) 0 1 x u
2 ˆ ˆ DW (u t u t 1 ) t 2 T 2 ˆ ut t 1 T
18
第三节 方程操作
一、方程视图
Representation:以三种形式显示方程:EViews命令 形式、带系数符号的方程和有系数估计值的方程。
19
Estimation Output显示方程结果。 Actual, Fitted, Residual Table 以表的形式显示因 变量的实际值和拟合值及残差。 Actual, Fitted, Residual Graph 以图的形式来显示 这些值。
具体包括以下指标:
10
1、回归系数 (Coefficient)
如果使用列表法说明方程,系数会列在变量栏中 相应的自变量名下;如果是使用公式法来说明方程, EViews会列出实际系数 c(1), c(2), c(3) 等等。 对于所考虑的简单线性模型,系数是在其他变量 保持不变的情况下自变量对因变量的边际收益。系数 c 是回归中的常数或者截距---它是当其他所有自变量 都为零时预测的基本水平。其他系数可以理解为假设 所有其它变量都不变,相应的自变量和因变量之间的 斜率关系。
13
4. 概率(P值)
这个概率称为边际显著性水平或 P 值。如果 显著水平为5% ,P 值小于0.05就拒绝系数为零的 原假设。对于上例结果,系数 inc 的零假设在1% 的显著水平下被拒绝。
14
5、R2与调整R2
R2 是衡量因变量方差能被自变量解释程度的指标。 如果回归完全符合,统计值会等于1。R2 的公式为:
2
ˆ y Xb u
ˆ 是残差, y 是因变量的均值。 其中, u
调整R2计算公式为:
T 1 R 1 1 R T k
2
2
15
6. 回归标准差 (S.E. of regression)
ˆ u ˆ /(T k ) s u
11
例如,利用文件“3-1”数据,建立线性消费函
数 cst=c0+c1inct+ut ( cs 是城镇居民消费; inc 是可
支配收入)。
方程中 c0 代表自发消费,表示收入等于零时 即收入每增加1元,消费将增加 c1 元。
的消费水平;而 c1 代表了边际消费倾向, 0<c1<1 , 从分析结果可以看出边际消费倾向是 0.514 。也
ln( GDP _ Pt ) c0 c1 t t u t
其中:GDPPt 表示剔出价格因素的实际GDPt 。方程中时间趋势变量的系数估 计值是0.0815,说明我国实际GDP(支出法)年平均增长率为8.15%。F值或 R2表明模型拟合效果很好,D.W.显示模型存在(正的)自相关。
27
在编辑框列出方程中要使用的变量列表。例如,
c和收入inc对消费cs作回归。在方程说明对话框上
部输入:
cs
c
inc
其中c说明在回归中包括常数项,内部序列c不出现 在工作文档中,除了说明方程外不能使用它。 在上例中,常数存储于c(1),inc的系数存储于 c(2),即回归方程形式为:
cs = c(1)+c(2)*inc。
是y的平均增长率。宏观经济模型表达式中常有时间趋 势,在研究经济长期增长或确定性趋势成分时,常常将 产出取对数,然后用时间t作解释变量建立回归方程。
26
例如,根据文件“3.4”提供的数据,建立半对数线性方程,估计我国实际 GDP(支出法,样本区间:1978~2002年)的长期平均增长率。模型形式为
三、 双曲函数模型
形如下式的模型称为双曲函数模型
1 Yt b1 b2 ( ) ut Xt
这是一个变量之间是非线性的模型,因为Xt 是 以倒数的形式进入模型的,但这个模型却是参数线 性模型,因为模型中参数之间是线性的。这个模型 的显著特征是随着Xt 的无限增大,(1/Xt )接近于 零。
从主菜单中选择 Matrix-Vector-Coef ,为系数向量输入
名 字 , 选 择 OK , 在 New Matrix 对 话 框 中 , 选 择
Coefficient Vector 并说明向量的行数,带有系数向
量图标的对象会列在工作文档目录中. 再在方程说明中使用这个系数向量。例如,假设创造 了系数向量 a 和b,各有一行。则可以用新的系数向量 代替 c : log(cs)=a(1)+ b (1)* log(cs(-1))
2
创建方程对象对话框如下图:
对话框分三部 分: 说明方程,先 列因变量再列 自变量,或者 直接输入函数 形式 估计方法 估计使用的样 本
3
二、方程说明
有两种说明方程的基本方法: 列表法:只能用于线性方程的说明; 公式法:可用于非线性模型或带有参数约 束模型的说明。
4
1、列表法 利用文件“3-1”数据,建立线性消费函数,用常数
20
ARMA Structure用于对ARMA模型的进行结构分析
Gradients and Derivatives... 描述目标函数的
梯度和回归函数的导数计算的信息。
Covariance Matrix以表的形式显示系数估计值的
协方差矩阵。
Coefficient
Diagnostics,
Diagnostics,
Residual
and Stability Diagnostics ,在后面的
“方程的诊断检验”中再作说明。
21
二、方程过程
Specify/Estimate... 编辑方程说明、改变估计方法、估计 样本。 Forecast ... 用估计方程的预测。 Made Residual Series... 以序列形式保存回归中的残差。 Make Regressor Group 创建包含方程中使用的所有变量的 未命名组(常数除外)。 Made Gradient Group 创建包含目标函数关于模型的系数 的斜率的组。 Make Derivative Group 创建包含回归函数关于其系数的导 数的组。 Make Modle 创建一个与被估计方程有关的未命名模型。 Update Coefs from Equation 把方程系数的估计值放在系 数向量中。
8
三、 方程 的估计方法
在创建方程对象对话框的Method框下拉框中,会 看到估计方法列表:
标准的单方程回归用最小二乘估计(LS)。其他还 和ARCH(自回归条件异方差)等方法。
9
有TSLS(两阶段最小二乘法)、GMM(广义矩估计法),
第二节 方程的结果输出
在方程说明对话框中单击OK后,显示估计结果如下图:
明方程。许多估计方法允许使用公式来说明方程。
EViews中的公式是一个包括回归变量和系数的 数学表达式。要用公式说明一个方程,只需在对话 框中变量列表处输入表达式即可。EViews会在方程 中添加一个随机附加扰动项并用最小二乘法估计模 型中的参数。
7
用公式法说明方程可以使用不同的系数向量。方法为: 首先要创建一个新的系数向量: 选择Object/New Object…
22
第四节
线性回归方程的衍生方程
非线性回归方程:下面模型都是参数线性
模型,但是变量却不一定是线性的:
(1)双对数线性模型(不变弹性模型)
(2)半对数模型
(3)双曲函数模型 。。。 含虚拟变量的方程
23
一、双对数线性方程
双对数线性模型估计得到的参数本身就是该变量的 弹性。例如,利用“ 3-1” 数据建立我国居民消费的收 入弹性方程: log(cst) = 0.18 + 0.917log(inct) t =(1.01) (45.72) R2 = 0.989 D.W. = 0.447
i 1
16
10. 因变量标准差(S.D)
sy
y
T t 1
i
y
2
T 1
11. AIC准则(赤池信息准则Akaike Information Criterion)
AIC 2l T 2 k T
其中:l 是对数似然值 AIC值越小越好 。 12. Schwarz准则 (施瓦茨准则):越小越好
SC 2l T k log T T
17
13. Hannan-Quinn Criterion (HQC)
一种模型选择标准 ,相对于贝叶斯信息标准 (Bayesian information criterion = BIC)标准的 另外一种标准。
14. Durbin-Watson 统计量
即 1978 年 -2002 年 中 国 城 镇 居 民 可 支 配 收 入 的
51.4%用来消费。
12
2. 标准差 (Std.Error)
标准差项报告了系数估计的标准差。标准差衡
量了系数估计的统计可信性----标准差越大,估计 中的统计干扰越大。
3. t-统计量
t统计量是由系数估计值和标准差之间的比率来 计算的,它是用来检验系数为零的假设的。
28
利用美国1955~1984年的数据(见文件“3-5”),根据菲利普斯曲线,即通货 膨胀率 t 和失业率 Ut 的反向关系,建立双曲函数:
ˆ t 0 .08 0 .2 (1 / U t )
估计结果表明,菲利普斯曲线所描述的 t 和Ut 的反向关系并不存在。之 所以出现这样的背离,主要是因为20世纪70年代出现石油危机,从而引发了 “滞胀”,通货膨胀伴随着高失业率。如果考虑到通货膨胀预期的影响,则 29 可以在模型中引入代表通货膨胀预期的变量,比如用通货膨胀前期值来代表。
7.残差平方和(Sum squared resid)
T
ˆ u ˆ ( yt X t b ) u
t 1
2
8. 对数似然函数值:其数值越大,意味着模型精确
T ˆ u ˆ / T )) l (1 log( 2 π) log( u 2 T 9.Mean dependent var:因变量均值 y y T i
第三讲 基本回归模型
经济计量研究始于经济学中的理论假设,在实 际研究中,经常需要根据经济理论设定的一组变量 间关系进行实证研究。基本回归模型的建模、检验 和预测是最广泛使用的统计技术之一,也是其他更 高级、专业技术(如ARIMA/ARIMAX模型、GMM)的 基础。
1
第一节 回归方程的建立
一、创建方程对象 EViews中的单方程回归估计是用创建方程 对象来完成的。创建一个方程对象有以下几种 方法: 从主菜单选择Object/New Object/Equation Quick/Estimate Equation … 在命令窗口中输入关键词equation,回车。 在随后出现的方程说明对话框中说明要建立的 方程,并选择估计方法。
Байду номын сангаас在变量列表中包括自动序列:
如:“log(cs) c log(cs(-1)) log((inc+inc(-1))/2) ” 相当于建立回归方程:
log(cs)=c(1)+c(2)*log(cs(-1))+c(3)*log((inc+inc(-1))/2)
6
2、公式法
当列表方法满足不了要求时,可以用公式来说
对数方程又称增长模型,通常我们用这类估计许 多变量的增长率。如果x取“时间”t,即按时间顺序依 次取值为1,2,…,T,变量t 的系数1 度量了ln(y)随 时间向前推进产生的变化。如果1为正,则有随时间 向上增长的趋势;如果1为负,则有随时间向下的趋 势,因此t可称为趋势变量,而且
d ln( y ) d y / d t β1 dt y
5
以下均为常见的说明方程的方法:
变量包括滞后序列:
如“cs c cs(-1) inc” 相当于建立回归方程:cs=c(1)+c(2)*cs(-1)+c(3)*inc。
滞后项使用关键词 to :
如:“cs c cs(-1 to -4) inc” 相当于建立 cs 关于常数 c 、 cs(-1) 、 cs(-2) 、 cs(3)、cs(-4) 和inc的回归方程。
其中cst 是城镇居民消费,inct 是居民消费可支配收入。
24
方程中消费的收入弹性为0.917,说明我国城镇居 民收入每增加1%,将使得城镇居民消费增加0.917%。
25
二、 半对数模型 线性模型与对数线性模型的混合就是半对数模型 或
ye
0 1 x u
ln( y ) 0 1 x u
2 ˆ ˆ DW (u t u t 1 ) t 2 T 2 ˆ ut t 1 T
18
第三节 方程操作
一、方程视图
Representation:以三种形式显示方程:EViews命令 形式、带系数符号的方程和有系数估计值的方程。
19
Estimation Output显示方程结果。 Actual, Fitted, Residual Table 以表的形式显示因 变量的实际值和拟合值及残差。 Actual, Fitted, Residual Graph 以图的形式来显示 这些值。
具体包括以下指标:
10
1、回归系数 (Coefficient)
如果使用列表法说明方程,系数会列在变量栏中 相应的自变量名下;如果是使用公式法来说明方程, EViews会列出实际系数 c(1), c(2), c(3) 等等。 对于所考虑的简单线性模型,系数是在其他变量 保持不变的情况下自变量对因变量的边际收益。系数 c 是回归中的常数或者截距---它是当其他所有自变量 都为零时预测的基本水平。其他系数可以理解为假设 所有其它变量都不变,相应的自变量和因变量之间的 斜率关系。
13
4. 概率(P值)
这个概率称为边际显著性水平或 P 值。如果 显著水平为5% ,P 值小于0.05就拒绝系数为零的 原假设。对于上例结果,系数 inc 的零假设在1% 的显著水平下被拒绝。
14
5、R2与调整R2
R2 是衡量因变量方差能被自变量解释程度的指标。 如果回归完全符合,统计值会等于1。R2 的公式为: