第八章 回归方程的函数形式
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章回归方程的函数形式
回忆参数线性模型和变量线性模型(见5.4)。我们所关注的是参数线性模型,而并不要求变量Y与X一定是线性的。
在参数线性回归模型的限制下,回归模型的形式也有多种。
我们将特别讨论下面几种形式的回归模型:
(1) 对数线性模型(不变弹性模型)
(2) 半对数模型。
(3) 双曲函数模型。
(4) 多项式回归模型。
上述模型的都是参数线性模型,但变量却不一定是线性的。
8.1 三变量线性回归模型
以糖炒栗子需求为例,现在考虑如下需求函数:
Y =
2
B
i
AX( 8 - 1 )
此处变量Xi是非线性的。但可将式( 8 - 1 )做恒等变换表示成另一种形式:
lnYi= lnA+B2lnXi ( 8 - 2 )
其中,ln表示自然对数,即以e为底的对数;令
B1= lnA ( 8 - 3 )
可以将式( 8 - 2 )写为:
lnYi = B1 + B2lnXi ( 8 - 4 )
加入随机误差项,可将模型( 8 - 4 )写为:
lnYi = B1+B2lnXi+ui ( 8 - 5 )
( 8 - 5 )是一个线性模型,因为参数B1和B2是以线性形式进入模型的;形如式( 8 - 5 )的模型称为双对数模型或对数-线性( log-linear )模型。
一个非线性模型可以通过适当的变换转变为线性(参数之间)模型的:
令Yi* = lnYi ,
Xi* = lnXi
则( 8 - 5 )可写为:
Yi* = B1 + B2 Xi* + ui ( 8 - 6 )
这与前面讨论的模型相似:它不仅是参数线性的,而且变形后的变量Y*与X*之间也是线性的。
如果模型( 8 - 6 )满足古典线性回归模型的基本假定,则很容易用普通最小二乘法来估计它,得到的估计量是最优线性无偏估计量。
双对数模型(对数线性模型)的应用非常广泛,原因在于它有一个特性:
斜率B2度量了Y对X的弹性。如果Y代表了商品的需求量,X代表了单位价格, Y代表
Y 的一个小的变动,∆X 代表X 的一个小的变动(∆Y /∆X 是dY/dX 的近似),E 是需求的价格弹性,定义弹性E 为: E= Y100/Y X100 / X
= Y X Y
X
=斜率×Y X ( 8 - 7 )
对于变形的模型(8 - 6) B2= Y ln Y X ln X
*=*
Y/Y Y X/ X Y
X X == 可得B2是Y 对X 的弹性。因为
ln Y ln Y 1ln Y d Y dY Y Y Y
≈=≈
所以对数形式的改变量就是相对改变量:
图8 - 1 a 描绘了函数式( 8 - 1 ),图8 - 2 b 是对式( 8 - 1 )做对数变形后的图形。图8 - 1 b 中的直线的斜率就是价格弹性的估计值(-B2)。
由于回归线是一条直线(Y和X都采取对数形式),所以它的斜率(-B2)为一常数;又由于斜率等于其弹性:所以弹性为一常数—它与X的取值无关。
由于这个特殊的性质,双对数模型(对数线性模型)又称为不变弹性模型。
例8.1 对炒栗子的需求
回顾炒栗子一例的散点图,不难发现需求量和价格之间是近似线性关系的,因为并非所有的样本点都恰好落在直线上。如果用对数线性模型拟合表8-1给出的数据,情况又会怎样?
OLS回归结果如下:
ln Yi = 3.9617 - 0.2272lnXi
se = (0.0416) (0.0250) ( 8 - 8 )
t = (95.233) -(9.0880)
r 2 = 0.9116
可知价格弹性约为-0.23,表明价格提高1个百分点,平均而言需求量将下降0.23个百分点。
截距值3.96表示了lnX为零时,lnY的平均值,没有什么具体的经济含义。
r2=0.9166,表示logX解释了变量logY91%的变动。
对数线性模型的假设检验
线性模型与对数线性模型的假设检验并没有什么不同。在随机误差项服从正态分布(均
值为0,方差为
2
δ)的假定下,每一个估计的回归系数均服从正态分布。
如果用
2
δ的无偏估计量2S代替,则每一个估计的回归系数服从自由度为(n-k)的t
分布,其中k为包括截距在内的参数的个数。在双变量模型中,k为2,在三变量模型中,k 为3,等等。
根据式( 8 - 8 )的回归结果,很容易检验每一个估计的参数在5%的显著水平下,都显著不为零,t值分别为9.08(b2),95.26(b1),均超过了t临界值2.306 (自由度为8,双边检验)。
8.3 多元对数线性回归模型
双变量对数线性回归模型很容易推广到模型中解释变量不止一个的情形。例如,可将三变量对数模型表示如下:
lnYi= B1+ B2lnX2i+ B3lnX3i+ ui ( 8 - 9 )
偏斜率系数B2、B3又称为偏弹性系数。
B2是Y对X2的弹性(X3保持不变),即在X3为常量时,X2每变动1%,Y变化的百分比。由于此时X3为常量,所以称此弹性为偏弹性。类似地,B3是Y对X3的(偏)弹性(X2保持不变)。
简而言之,在多元对数线性模型中,每一个偏斜率系数度量了在其他变量保持不变的条件下,应变量对某一解释变量的偏弹性。
例8.2 柯布-道格拉斯生产函数
模型( 8 - 9)是著名的柯布-道格拉斯生产函数(Cobb-Douglas production function)(C-D函数, Y=B1X2B2X3B3)。令Y表示产出,X2表示劳动投入,X3表示资本投入,式( 8 -9 )反映了产出与劳动力、资本投入之间的关系。
表8 - 2给出1955~1974年间墨西哥的产出Y,用国内生产总值GDP度量,劳动投入X2,以及资本投入X3的数据。
得到如下回归结果1:
lnYt = -1.6524 + 0.3397 lnX2t + 0.8640 lnX3t
se= (0.6062) (0.1857) (0.09343) (8-10)
t = (-2.73) (1.83) (9.06)
p= (0.014) (0.085) ( 0.000 )
R2 = 0.994