Eviews实验课讲义_3一元多元线性回归_上机课

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第三课一元及多元线性回归模型

3.1一元线性回归模型

一、做两个变量的散点图，从而看两个变量是否具有线性关系。

案例数据：1985-2002年我国人均钢产量与人均GDP的时间序列数据（数据3_1_1）。

操作方法：通过序列组的形式右键单击打开后，在group窗口下view——graph---scatter，通过对散点图结

同样的操作可以检验其它案例数据（3_1_2和3_1_3）的特征：

案例数据2、3、4、5：10个家庭人均收入与消费支出的横截面数据；1978-2000年中国人均消费模型；1978年-2008年市城镇居民年家庭收入和年消费性支出数据（case1_1的数据）； 1970年-1980年美国的咖啡平均真实零售价格（每磅美元）与消费量（每人每日杯数）（其中，零售价格是已经经过物价调整的）

二、通过建立方程对象的方式来估计一个方程，并保存我们建立的方程对象。

Workfile窗口下建立新的对象---equation对象并命名，在equation estimation 窗口下的specification 选项卡下的equation specification对话框中设置因变量、自变量及常数项，在estimation settings对话框中

注意：建模途径：command: quick\estimation equation回车，或object\equation object,设置。

命令行形式：（1）列表法：consp c gdpp 或（2）公式法：consp=c(1)+c(2)*gdpp

三、方程估计结果的解释、评价及模型检验（拟合优度评价，估计参数和方程的显著性检验）

消费方程中，C为自发性消费，x（gdpp）的系数为经济参数，关注其意义；通过拟合优度、调整后的拟合优度、t统计量后的精确显著性水平p（相伴概率）；f统计量的p来判断对原假设接受与否

四、在回归估计结果中显示方程的三种形式（即估计命令，回归方程的一般表达式，带有系数估计值的表达式）

Estimation Command:

LS GDPP STEELP C

Estimation Equation:

GDPP = C(1)*STEELP + C(2)

Substituted Coefficients:

GDPP = 93.6876362857*STEELP - 3394.97191614

五、如何查看因变量的实际值、拟合值和回归方程的残差（包括表的形式和图的形式）

通过方程窗口下的view去实现实际值、拟合值和回归方程的残差；单独显示残差及标准化后的

对于案例数据1978年-2008年市城镇居民年家庭收入和年消费性支出数据，进行样本与外的预测。

通过equation窗口中的forecast直接进行样本预测：查看图及workfile中的yf序列；

在sample或range中改变样本区间或文件区间（需补充观察值）后进行样本外预测。

对案例数据1970年-1980年美国的咖啡平均真实零售价格（每磅美元）与消费量（每人每日杯数）散点图观察后，显示负相关的直线关系，操作过程同上。

实验作业——一元线性回归建模。

附录：练习数据3.1

为了研究某市城镇每年鲜蛋的需求量，首先考察消费者年人均可支配收入对年人均鲜蛋需求量的影响。由经济理论知，当人均可支配收入提高时，鲜蛋需求量也相应增加。但是，鲜蛋需求量除受消费者可支配收入影响外，还要受到其自身价格、人们的消费习惯及其他一些随机因素的影响。为了表示鲜蛋需求量与消费者可支配收入之间非确定的依赖关系，我们将影响鲜蛋需求量的其他因素归并到随机变量u中，建立这两个变量之间的数学模型。表中给出Y为某市城镇居民人均鲜蛋需求量（公斤），X为年人均可支配收入（元，

练习数据3.2：10个家庭收入与消费支出的界面数据。

3.2多元线性回归模型

一、做以因变量为横轴，多个自变量为纵轴的散点图，简单观察该因变量与多个自变量之间的关系。

案例数据：中国粮食生产函数。根据理论和经验分析，影响粮食生产（Y）的主要因素有农业化肥施用量（X1）、粮食播种面积（X2）、成灾面积（X3）、农业机械总动力（X4）和农业劳动力（X5），其中成灾面积的符号为负，其余均应为正。下表给出了1983——2000中国粮食生产的相关数据，拟建立中国粮食生产函数。

Wokfile窗口下建立graph对象，注意在序列对话框中首先输入y，再依次输入x1到x5,首先生成系统默认的折线图，通过option改成散点图，观察得到的图形结果，分析可知需要分轴显示或标准化处理，处理前后图形结

目的是为了查看哪些变量之间线性相关性比较强，也就是相关系数比较大。（同时也是为了和散点图及回归方程相互验证。）

建立组对象group1，打开后利用view---group member添加x1----x5所有的序列，选择yes保持改变，再打开组对象，发现所添加序列已经存在；查看其相关系数矩阵；结果如下；

三、以建立方程对象的方式来建立多元线性回归模型。

建立方程对象，命名为equation1，输入变量列表（变量过多可提前复制，粘贴即可），确定完成模型建立，结果如下；

Coefficient Std. Error t-Statistic Prob.

C -12815.75 14078.90 -0.910280 0.3806

X1 6.212562 0.740881 8.385373 0.0000

X2 0.421380 0.126925 3.319919 0.0061

X3 -0.166260 0.059229 -2.807065 0.0158

X4 -0.097770 0.067647 -1.445299 0.1740

X5 -0.028425 0.202357 -0.140471 0.8906

R-squared 0.982798 Mean dependent var 44127.11

Adjusted R-squared 0.975630 S.D. dependent var 4409.100

S.E. of regression 688.2984 Akaike info criterion 16.16752

Sum squared resid 5685056. Schwarz criterion 16.46431

Log likelihood -139.5077 Hannan-Quinn criter. 16.20845

F-statistic 137.1164 Durbin-Watson stat 1.810512

Prob(F-statistic) 0.000000

四、对模型结果的解释和评价。本案例中有明显的多重共线性的现象，

从计算结果看，R2较大并接近于1，而且F=137.11>F0.05=3.11，故认为粮食生产量与上述所有解释变量间总体线性相关显著。但是，同时，X4 、X5 前参数未通过t检验，而且符号的经济意义也不合理，故认为解释变量间存在多重共线性。结果说明模型存在共线性，与相关系数矩阵得到了相互验证。即通过观察可见，F统计量概率为0，说明方程显著；部分t的prob大于5%，说明解释变量间存在共线性；