实验一 一元线性回归
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验一一元线性回归
实验目的:掌握一元线性回归的估计与应用,熟悉EViews的基本操作。
实验要求:应用教材P61第12题做一元线性回归分析并做预测。
实验原理:普通最小二乘法。
预备知识:参数估计的普通最小二乘法、t检验、拟合优度检验、回归预测和区间预测。
实验内容:
P61.12.下表是中国2007年各地区税收Y和国内生产总值GDP的统计资料。
(1)作出散点图,建立税收随国内生产总值GDP变化的一元线性回归方程,并解释斜率的经济意义;
(2)对所建立的回归方程进行检验;
(3)若2008年某地区国内生产总值为8500亿元,求该地区税收收入的预测值及预测区间。
实验步骤
1.建立工作文件并录入数据:
(1)启动Eviews5.0程序。
(2)点击主界面菜单File\New\Workfile,然后在弹出的Workfile Create对话框左侧Workfile structure type栏中选择Unstructured/Undated选项,在右侧Data Range 中填入样本个数31,如图1.1.1所示。
图1.1.1 图1.1.2
(3)录入数据,在主界面命令栏键入data Y GDP,回车。
在Group表格相应的位置录入Y与GDP的数据,则出现图1.1.2画面。
2.数据的描述性统计和图形统计:
以上建立的序列GDP和Y之后,可对其做描述统计和统计以把握该数据的一些统计属性。
⑴描述属性:
双击打开对象group1的表格形式,点View/Descriptive Stats\Common Sample,得描述统计结果,如图2.1.1所示,其中:Mean为均值,Std.Dev为标准差。
图2.1.1
⑵图形统计:
双击序列GDP,点击表格左边View/Graph,可得图2.2.1。
同样可查看序列Y的线形图。
而需要把两个序列放在一个图形中来查看两者的相互关系,用线图或散点图则可以。
在命令栏键入:scat GDP Y,然后回车,就可以得到用散点图来查看GDP和
Y 的关系。
如图2.2.2所示。
图2.2.1 图2.2.2
3.设定模型,用最小二乘法估计参数:
设定模型为12i i i Y X u ββ=++。
在主界面命令栏输入ls Y c GDP ,回车。
可得最小二乘估计的回归结果,如图2.3.1所示。
图2.3.1
由图2.3.1所示的数据结果,可得到回归分析模型为: 10.629630.071047i i Y X =-+
(0.123500)- (9.591245) 2
0.760315R =, 9199198F =, ..1.5705
D W = 其中,括号内的数为相应的t 检验值。
2R 是可决系数,F 与..D W 是有关的两个检验统计量。
4.模型检验:
⑴经济意义检验。
斜率2
ˆ0.071047β=为边际可支国内生产总值GDP ,表明2007年,中国内地各省区的GDP 每增加1亿元时,税收平均增加0.071047亿元。
(2)t 检验和拟合优度检验。
在显著性水平下,自由度为31-2=29的t 分布的临界值0.025(29) 2.05t =。
因此,从参数的t 检验值看,斜率项显然不为零,但不
拒绝截距项为零的假设。
另外,拟合优度20.760315R =表明,税收的76%的变化也以由GDP 的变化来解释,因此拟合情况较好。
在Eqution 界面点击菜单命令View/Actual,Fitted,Residual/Actual,Fitted.Residual Graph 可得到图2.4.1,可直观看到实际观测站和拟合值非常接近。
图2.4.1
5.应用:回归预测:
⑴被解释变量Y 的个别值和平均值的点预测:
由第二章第五节知道,个别值和平均值点预测的预测公式均为12ˆˆF F Y X ββ=+
内插预测:
在Equation 框中,点击“Forecast ”,在Forecast name 框中可以为所预测的预测值序列命名,计算机默认为yf ,如图2.5.1,点击“OK ”,得到样本期内被解释变量的预测值序列nm (也称拟合值序列)的图形形式(图2.5.2)。
同时在Workfile 中出现一个新序列对象yf 。
图2.,5.1 图2.5.2
外推预测:
①录入2008年某地区国内生产总值GDP为8500亿元的数据。
双击Workfile菜单下的Range所在行,出现将Workfile structured对话框,讲右侧Observation旁边的数值改为32,然后点击OK,即可用将Workfile 的Range以及Sample的Range改为32,如图2.5.3所示;
双击打开GDP序列表格形式,将编辑状态切换为“可编辑”,在GDP序列中补充输入GDP=8500(如图2.5.4所示)。
图2.5.3 图2.5.4
②进行预测
在Equation框中,点击“Forecast”,弹出一对话框,在其中为预测的序列命名,如yf2。
点击OK即可用得到预测结果的图形形式(如图2.5.5所示)
图2.5.5
点击Workfile中新出现的序列yf2,可以看到预测值为593.2667(图2.5.6)(注意:因为没有对默认预测区间1-32做改变,这时候得到的是所有内插预测与外插预测的值,若将区间改为32 32,则只会得到外推预测结果)。
图2.5.6
③结果查看
按住Ctrl键,同时选中y、yf、resid,点击右键,在右键菜单中选Open/as Group可打开实际值、预测值、残差序列,在view菜单选择Grap/Line,画折线图(如图2.5.7所示)。
图2.5.7
⑵区间预测原理:
当2007年中国某省区GDP 为8500亿元时,预测的税收为
()ˆ10.630.0718500593.2667Y
=-+⨯=亿元 被解释变量Y 的个别区间预测公式为:
/ˆˆf
Y t ασ⋅
被解释变量Y 的均值区间预测公式为:
/2ˆˆf
Y t ασ⋅ 。
具体地说,ˆf Y 可以在前面点预测序列2593.2667yf =中找到;/2=2.045t α可以查t 分布表得到;样本数n=31为已知;f GDP GDP -中的=8500f G D P 为已知,
8891.126GDP =,2
55957878.6i gdp =∑可以在序列GDP 的描述统计中找到,22
()=391.126=152979.5
f GDP GDP --();
22760310
i
e
RSS ==∑,从而
22
2760310ˆ95183.11
3111
i
e
n k σ
==
=----∑
(3)区间预测的Eviews 操作: ①个别的置信区间的计算: 在命令栏输入:
scalar yfu=593.2667+2.045*@sqrt(95183.1*(1+1/31+152979.5/55957878.6)) scalar yfl=593.2667-2.045*@sqrt(95183.1*(1+1/31+152979.5/55957878.6)) 其中,yfu 为个别值的置信上界,yfl 为个别值的置信下界。
得到:
yfu=1235.12876632 yfl=-48.5953663235
所以,95%的置信度下预测的2008年某省区税收如个值的置信区间为:
(-48.5953663235,1235.12876632)
②均值的置信区间的计算:
在命令栏输入:
scalar eyfu=593.2667+2.045*@sqrt(95183.1*(1/31+152979.5/55957878.6)) scalar eyfl=593.2667-2.045*@sqrt(95183.1*(1/31+152979.5/55957878.6))
其中,eyfu为均值的置信上界,eyfl为均值的置信下界。
得到:
eyfu=711.287072849
eyfl=475.246327151
于是在95%的置信度下,预测省区的2008年的税收收入均值的置信区间为:(475.246327151,711.287072849)。