计量经济学实验四、五
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计量经济学实验四、五
实验四序列相关的检验与修正
实验目的
1、理解序列相关的含义后果、
2、学会序列相关的检验与消除方法
实验内容
利用下表资料,试建立我国城乡居民储蓄存款模型,并检验模型的自相关性。
表3 我国城乡居民储蓄存款与GDP 统计资料(1978年=100)
一、模型的估计
0、准备工作。
建立工作文件,并输入数据。
1、相关图分析SCAT X Y
相关图表明,GDP 指数与居民储蓄存款二者的曲线相关关系较为明显。
现将函数初步设定为线性、双对数等不同形式,进而加以比较分析。
2、估计模型,利用LS 命令分别建立以下模型⑴线性模型: LS Y
C X
x y 5075.9284.14984?+-=
=t (-6.706) (13.862)
2R =0.9100 F =192.145 S.E =5030.809
⑵双对数模型:GENR LNY=LOG(Y) GENR LNX=LOG(X) LS LNY
C LNX
x y
ln 9588.20753.8?ln +-= =t (-31.604) (64.189)
2R =0.9954 F =4120.223 S.E =0.1221
3、选择模型
比较以上模型,可见各模型回归系数的符号及数值较为合理。
各解释变量及常数项都通过了t 检验,模型都较为显著。
比较各模型的残差分布表。
线性模型的残差在较长时期内呈连续递减趋势而后又转为连续递增趋势,残差先呈连续递增趋势而后又转为连续递减趋势,因此,可以初步判断这种函数形式设置是不当的。
而且,这个模型的拟合优度也较双对数模型低,所以又可舍弃线性模型。
双对数模型具有很高的拟合优度,因而初步选定回归模型为双对数回归模型。
二、模型自相关的检验
1.图示法
其一,残差序列e t 的变动趋势图。
菜单:Quick→Graph→line ,在对话框中输入resid ;或者用命令操作,直接在命令行输入:line X 。
其二,作 e t-1和 e t 之间的散点图。
菜单:Quick→Graph→Scatter ,在对话框中输入resid(-1) resid ;或者用命令操作,直接在命令行输入:scat resid(-1) resid 。
2.DW 检验
因为n =21,k =1,取显著性水平α=0.05时,查表得L d =1.22,U d =1.42,而0<0.7062=DW<="">
3.LM(BG)检验
在方程窗口中点击View/Residual Test/Series Correlation LM Test ,并选择滞后期为2,则会得到如图4-1所示的信息。
图4-1 双对数模型的BG 检验
图中,2nR =11.31531,临界概率P=0.0034,因此辅助回归模型是显著的,即存在自相关性。
又因为1-t e ,2-t e 的回归系数均显著地不为0,说明双对数模型存在一阶和二阶自相关性。
三、自相关的修正(1)自相关系数ρ的估计主要的方法有:
A. 根据ρ和DW 统计量之间的近似关系,取ρ的估计为:1-DW/2
B. 直接取ρ=1
C. 采用杜宾两步法估计。
LS Y C Y(-1) X X(-1),Y(-1)的系数估计即为ρ的估计
D. 科克伦-奥科特迭代法。
首先产生残差序列,命名为e ,然后e 对其滞后1阶
回归(无常数项),LS e e(-1),e(-1) 的系数估计作为ρ的估计(2)加入AR 项
在LS 命令中加上AR(1)和AR(2),使用迭代估计法估计模型。
键入命令: LS LNY C LNX AR (1) AR (2) 则估计结果如图4-2所示。
图4-2 加入AR 项的双对数模型估计结果
图4-2表明,调整后模型的DW =1.6445,n =19,k =1,取显著性水平α=0.05时,查表得L d =1.18,U d =1.40,而U d <1.6445=DW<4-U d ,说明模型不存在一阶自相关性;再BG 检验(图4-3),也表明不存在高阶自相关性,因此,中国城乡居民储蓄存款的双对数模型为:
x y
ln 9193.28445.7?ln +-= =t (-25.263) (52.683)
2R =0.9982 F =2709.985 S.E =0.0744 DW =1.6445
图4-3
习题
1.下表给出了美国1960-1995年36年间个人实际可支配收入X 和个人实际消费支出Y的数据。
美国个人实际可支配收入和个人实际消费支出单位:100亿美元
注:资料来源于Economic Report of the President ,数据为1992年价格。
要求:(1)用普通最小二乘法估计收入—消费模型;
t t u X Y ++=221ββ
(2)检验收入—消费模型的自相关状况(5%显著水平);
(3)用适当的方法消除模型中存在的问题。
2.下表是北京市连续19年城镇居民家庭人均收入与人均支出的数据。
要求:(1)建立居民收入—消费函数;(2)检验模型中存在的
问题,并采取适当的补救措施预以处理;
(3)对模型结果进行经济解释。
实验五多重共线性的检验和修正
实验目的
1、理解多重共线性的含义与后果、
2、学会序多重共线性的修正
实验内容
1、例表4是1978-1997年我国钢材产量(万吨)、生铁产量(万吨)、发电量(亿千瓦时)、固定资产投资(亿元)、国内生产总值(亿元)、铁路运输量(万吨)的统计资料。
2、多重共线性的检验
(1)综合统计检验法
若在OLS法下:R2与F值较大,但t检验值较小,则可能存在多重共线性。
(2)简单相关系数检验
利用相关系数可以分析解释变量之间的两两相关情况。
在Eviews 软件中可以直接计算相关系数矩阵。
本例中,在Eviews软件命令窗口中键入:COR X1 X2 X3 X4 X5 或在包含所有解释变量的数组窗口中点击View\Correlations,其结果如图1所示。
由相关系数矩阵可以看出,解释变量之间的相关系数均为0.93以上,即解释变量之间是高度相关的。
图5-1
(3)判定系数检验法
当解释变量多余两个且变量之间呈现出较复杂的相关关系时,可以通过建立辅助回归模型来检验多重共线性。
本例中,在Eviews软件命令窗口中键入:
LS X1 C X2 X3 X4 X5
LS X2 C X1 X3 X4 X5
LS X3 C X1 X2 X4 X5
LS X4 C X1 X2 X3 X5
LS X5 C X1 X2 X3 X4
得到相应的回归结果,分析每个方程对应的F值和T值,来检验这些变量间是否相关以及相关联程度。
对应的回归结果如下图所示。
图5-2
图5-3
图5-4
图5-5
图5-6
上述每个回归方程的F 检验值都非常显著,方程回归系数的T 检验值表明:X1与X5、X2与X3、X3与X5、X4与X 、X5与X1、X3、X4的T 检验值较小,这些变量之间可能不相关或相关程度较小。
3、多重共线性的克服——逐步回归(一)建立基本的一元线性回归方程
(1)被解释变量对每一个解释变量进行初始回归,选取拟合优度最高的首先进入方程;根据经济理论分析和回归结果,可知钢材产量和生铁产量关联度最大,所以建立基本的一元回归方程:
1Y X αβε=++
(2)然后把其余解释变量逐步引入模型,根据拟合优度选出最优方程。
所以,建立的多元回归模型为:Y = -287.68669 + 0.4159*X1 + 0.4872*X2
习题
CPI 。
资料来源:《中国统计年鉴》,中国统计出版社2000年、2004年。
请考虑下列模型:i t t t u CPI GDP Y ++=ln ln ln 321βββ+ (1)利用表中数据估计此模型的参数。
(2)你认为数据中有多重共线性吗?
(3)进行以下回归:
i
t t i t t i t t v CPI C C GDP v CPI B B Y v GDP A A Y 321221121ln ln ln ln ln ln ++=+=+=++
根据这些回归你能对数据中多重共线性的性质说些什么?
(4)假设数据有多重共线性,但3
2??ββ和在5%水平上个别地显著,并且总的F 检验也是显著的。
对这样的情形,我们是否应考虑共线性的问题?
2. 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、
人民生活水平提高、能源转换技术等因素。
为此,收集了中国能源消费总量Y (万吨标准煤)、
国内生产总值(亿元)X1(代表经济发展水平)、国民总收入(亿元)X2(代表收入水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费(千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2002年期间的统计数据,具体如下:
资料来源:《中国统计年鉴》2004、2000年版,中国统计出版社。
要求:
(1)建立对数线性多元回归模型
(2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么?
(3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。