Eviews实验课讲义_3一元多元线性回归-上机课

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三课一元及多元线性回归模型

一元线性回归模型

一、做两个变量的散点图,从而看两个变量是否具有线性关系。

案例数据:1985-2002年我国人均钢产量与人均GDP的时间序列数据(数据3_1_1)。

操作方法:通过序列组的形式右键单击打开后,在group窗口下view——graph---scatter,通过对散点图结果的观察,判断是否适合做回归方程,结果显示,数据表现出明显的线性关系,适合做线性回归分析。

同样的操作可以检验其它案例数据(3_1_2和3_1_3)的特征:

案例数据2、3、4、5:10个家庭人均收入与消费支出的横截面数据;1978-2000年中国人均消费模型;1978年-2008年北京市城镇居民年家庭收入和年消费性支出数据(case1_1的数据); 1970年-1980年美国的咖啡平均真实零售价格(每磅美元)与消费量(每人每日杯数)(其中,零售价格是已经经过物价调整的)

二、通过建立方程对象的方式来估计一个方程,并保存我们建立的方程对象。

Workfile窗口下建立新的对象---equation对象并命名,在equation estimation 窗口下的specification 选项卡下的equation specification对话框中设置因变量、自变量及常数项,在estimation settings对话框中

1978-2000年中国人均消费模型结果:

注意:建模途径:command: quick\estimation equation回车,或object\equation object,设置。

命令行形式:(1)列表法:consp c gdpp 或(2)公式法:consp=c(1)+c(2)*gdpp

三、方程估计结果的解释、评价及模型检验(拟合优度评价,估计参数和方程的显著性检验)

消费方程中,C为自发性消费,x(gdpp)的系数为经济参数,关注其意义;通过拟合优度、调整后的拟合优度、t统计量后的精确显著性水平p(相伴概率);f统计量的p来判断对原假设接受与否

四、在回归估计结果中显示方程的三种形式(即估计命令,回归方程的一般表达式,带有系数估计值的表达式)

Estimation Command:

LS GDPP STEELP C

Estimation Equation:

GDPP = C(1)*STEELP + C(2)

Substituted Coefficients:

GDPP = *STEELP - 3394.

五、如何查看因变量的实际值、拟合值和回归方程的残差(包括表的形式和图的形式)

通过方程窗口下的view去实现实际值、拟合值和回归方程的残差;单独显示残差及标准化后的残差;

六、如何用我们建立的方程进行预测,可以进行样本内预测,也可以进行样本外预测。

对于案例数据1978年-2008年北京市城镇居民年家庭收入和年消费性支出数据,进行样本内与外的预测。

通过equation窗口中的forecast直接进行样本内预测:查看图及workfile中的yf序列;

在sample或range中改变样本区间或文件区间(需补充观察值)后进行样本外预测。

对案例数据1970年-1980年美国的咖啡平均真实零售价格(每磅美元)与消费量(每人每日杯数)散点图观察后,显示负相关的直线关系,操作过程同上。

实验作业——一元线性回归建模。

附录:练习数据

为了研究某市城镇每年鲜蛋的需求量,首先考察消费者年人均可支配收入对年人均鲜蛋需求量的影响。由经济理论知,当人均可支配收入提高时,鲜蛋需求量也相应增加。但是,鲜蛋需求量除受消费者可支配收入影响外,还要受到其自身价格、人们的消费习惯及其他一些随机因素的影响。为了表示鲜蛋需求量与消费者可支配收入之间非确定的依赖关系,我们将影响鲜蛋需求量的其他因素归并到随机变量u中,建立这两个变量之间的数学模型。表中给出Y为某市城镇居民人均鲜蛋需求量(公斤),X为年人均可支配收入(元,1980年不变价),通过抽样,得到1988-1998年的样本观测值。

练习数据:10个家庭收入与消费支出的界面数据。

多元线性回归模型

一、做以因变量为横轴,多个自变量为纵轴的散点图,简单观察该因变量与多个自变量之间的关系。

案例数据:中国粮食生产函数。根据理论和经验分析,影响粮食生产(Y)的主要因素有农业化肥施用量(X1)、粮食播种面积(X2)、成灾面积(X3)、农业机械总动力(X4)和农业劳动力(X5),其中成灾面积的符号为负,其余均应为正。下表给出了1983——2000中国粮食生产的相关数据,拟建立中国粮食生产函数。

Wokfile窗口下建立graph对象,注意在序列对话框中首先输入y,再依次输入x1到x5,首先生成系统默认的折线图,通过option改成散点图,观察得到的图形结果,分析可知需要分轴显示或标准化处理,处理前后图形结果如下;

目的是为了查看哪些变量之间线性相关性比较强,也就是

相关系数比较大。(同时也是为了和散点图及回归方程相互验证。)

建立组对象group1,打开后利用view---group member 添加x1----x5所有的序列,选择yes 保持改变,再打开组对象,发现所添加序列已经存在;查看其相关系数矩阵;结果如下;

三、以建立方程对象的方式来建立多元线性回归模型。

建立方程对象,命名为equation1,输入变量列表(变量过多可提前复制,粘贴即可),确定完成模型建立,结果如下;

Coefficient Std. Error t-Statistic Prob.

C

X1

X2

X3

X4

X5

R-squared Mean dependent var

Adjusted R-squared. dependent var

. of regression Akaike info criterion

Sum squared resid5685056.Schwarz criterion

Log likelihood Hannan-Quinn criter.

F-statistic Durbin-Watson stat

Prob(F-statistic)

四、对模型结果的解释和评价。本案例中有明显的多重共线性的现象,

从计算结果看,R2较大并接近于1,而且F=>=,故认为粮食生产量与上述所有解释变量间总体线性相关显著。

但是,同时,X4 、X5 前参数未通过t检验,而且符号的经济意义也不合理,故认为解释变量间存在多重共线性。结果说明模型存在共线性,与相关系数矩阵得到了相互验证。即通过观察可见,F统计量概率为0,说明方程显著;

部分t的prob大于5%,说明解释变量间存在共线性;

五、我们选取逐步引入法选择变量,同时克服多重共线性。

方法有两种:一个是手动逐个加入自变量;二是采取逐步回归的办法来让计算机自动加入。

1.首先是手动逐步引入,过程如下:

(1)分别做粮食生产量对各个解释变量的回归,得

A.Y对X1回归结果:

Variable Coefficie

nt Std. Error t-Statistic Prob.

C

X1

R-squared Mean dependent

相关文档
最新文档