Eviews实验课讲义_3一元多元线性回归-上机课
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三课一元及多元线性回归模型
一元线性回归模型
一、做两个变量的散点图,从而看两个变量是否具有线性关系。
案例数据:1985-2002年我国人均钢产量与人均GDP的时间序列数据(数据3_1_1)。
操作方法:通过序列组的形式右键单击打开后,在group窗口下view——graph---scatter,通过对散点图结果的观察,判断是否适合做回归方程,结果显示,数据表现出明显的线性关系,适合做线性回归分析。
同样的操作可以检验其它案例数据(3_1_2和3_1_3)的特征:
案例数据2、3、4、5:10个家庭人均收入与消费支出的横截面数据;1978-2000年中国人均消费模型;1978年-2008年北京市城镇居民年家庭收入和年消费性支出数据(case1_1的数据); 1970年-1980年美国的咖啡平均真实零售价格(每磅美元)与消费量(每人每日杯数)(其中,零售价格是已经经过物价调整的)
二、通过建立方程对象的方式来估计一个方程,并保存我们建立的方程对象。
Workfile窗口下建立新的对象---equation对象并命名,在equation estimation 窗口下的specification 选项卡下的equation specification对话框中设置因变量、自变量及常数项,在estimation settings对话框中
1978-2000年中国人均消费模型结果:
注意:建模途径:command: quick\estimation equation回车,或object\equation object,设置。
命令行形式:(1)列表法:consp c gdpp 或(2)公式法:consp=c(1)+c(2)*gdpp
三、方程估计结果的解释、评价及模型检验(拟合优度评价,估计参数和方程的显著性检验)
消费方程中,C为自发性消费,x(gdpp)的系数为经济参数,关注其意义;通过拟合优度、调整后的拟合优度、t统计量后的精确显著性水平p(相伴概率);f统计量的p来判断对原假设接受与否
四、在回归估计结果中显示方程的三种形式(即估计命令,回归方程的一般表达式,带有系数估计值的表达式)
Estimation Command:
LS GDPP STEELP C
Estimation Equation:
GDPP = C(1)*STEELP + C(2)
Substituted Coefficients:
GDPP = *STEELP - 3394.
五、如何查看因变量的实际值、拟合值和回归方程的残差(包括表的形式和图的形式)
通过方程窗口下的view去实现实际值、拟合值和回归方程的残差;单独显示残差及标准化后的残差;
六、如何用我们建立的方程进行预测,可以进行样本内预测,也可以进行样本外预测。
对于案例数据1978年-2008年北京市城镇居民年家庭收入和年消费性支出数据,进行样本内与外的预测。
通过equation窗口中的forecast直接进行样本内预测:查看图及workfile中的yf序列;
在sample或range中改变样本区间或文件区间(需补充观察值)后进行样本外预测。
对案例数据1970年-1980年美国的咖啡平均真实零售价格(每磅美元)与消费量(每人每日杯数)散点图观察后,显示负相关的直线关系,操作过程同上。
实验作业——一元线性回归建模。
附录:练习数据
为了研究某市城镇每年鲜蛋的需求量,首先考察消费者年人均可支配收入对年人均鲜蛋需求量的影响。由经济理论知,当人均可支配收入提高时,鲜蛋需求量也相应增加。但是,鲜蛋需求量除受消费者可支配收入影响外,还要受到其自身价格、人们的消费习惯及其他一些随机因素的影响。为了表示鲜蛋需求量与消费者可支配收入之间非确定的依赖关系,我们将影响鲜蛋需求量的其他因素归并到随机变量u中,建立这两个变量之间的数学模型。表中给出Y为某市城镇居民人均鲜蛋需求量(公斤),X为年人均可支配收入(元,1980年不变价),通过抽样,得到1988-1998年的样本观测值。
练习数据:10个家庭收入与消费支出的界面数据。
多元线性回归模型
一、做以因变量为横轴,多个自变量为纵轴的散点图,简单观察该因变量与多个自变量之间的关系。
案例数据:中国粮食生产函数。根据理论和经验分析,影响粮食生产(Y)的主要因素有农业化肥施用量(X1)、粮食播种面积(X2)、成灾面积(X3)、农业机械总动力(X4)和农业劳动力(X5),其中成灾面积的符号为负,其余均应为正。下表给出了1983——2000中国粮食生产的相关数据,拟建立中国粮食生产函数。
Wokfile窗口下建立graph对象,注意在序列对话框中首先输入y,再依次输入x1到x5,首先生成系统默认的折线图,通过option改成散点图,观察得到的图形结果,分析可知需要分轴显示或标准化处理,处理前后图形结果如下;
目的是为了查看哪些变量之间线性相关性比较强,也就是
相关系数比较大。(同时也是为了和散点图及回归方程相互验证。)
建立组对象group1,打开后利用view---group member 添加x1----x5所有的序列,选择yes 保持改变,再打开组对象,发现所添加序列已经存在;查看其相关系数矩阵;结果如下;
三、以建立方程对象的方式来建立多元线性回归模型。
建立方程对象,命名为equation1,输入变量列表(变量过多可提前复制,粘贴即可),确定完成模型建立,结果如下;
Coefficient Std. Error t-Statistic Prob.
C
X1
X2
X3
X4
X5
R-squared Mean dependent var
Adjusted R-squared. dependent var
. of regression Akaike info criterion
Sum squared resid5685056.Schwarz criterion
Log likelihood Hannan-Quinn criter.
F-statistic Durbin-Watson stat
Prob(F-statistic)
四、对模型结果的解释和评价。本案例中有明显的多重共线性的现象,
从计算结果看,R2较大并接近于1,而且F=>=,故认为粮食生产量与上述所有解释变量间总体线性相关显著。
但是,同时,X4 、X5 前参数未通过t检验,而且符号的经济意义也不合理,故认为解释变量间存在多重共线性。结果说明模型存在共线性,与相关系数矩阵得到了相互验证。即通过观察可见,F统计量概率为0,说明方程显著;
部分t的prob大于5%,说明解释变量间存在共线性;
五、我们选取逐步引入法选择变量,同时克服多重共线性。
方法有两种:一个是手动逐个加入自变量;二是采取逐步回归的办法来让计算机自动加入。
1.首先是手动逐步引入,过程如下:
(1)分别做粮食生产量对各个解释变量的回归,得
A.Y对X1回归结果:
Variable Coefficie
nt Std. Error t-Statistic Prob.
C
X1
R-squared Mean dependent