一元线性回归模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计量经济学课程实验

实验2 一元回归模型

【实验目的】

掌握一元线性、非线性回归模型的建模方法

【实验内容】

建立我国税收预测模型

【实验步骤】

【例1】建立我国税收预测模型。表1列出了我国1985-1998年间税收收入Y和国内生产总值(GDP)x的时间序列数据,请利用统计软件Eviews建立一元线性回归模型。

一、建立工作文件

⒈菜单方式

在录入和分析数据之前,应先创建一个工作文件(Workfile)。启动Eviews软件之后,在主菜单上依次点击File\New\Workfile(菜单选择方式如图1所示),将弹出一个对话框(如图2所示)。用户可以选择数据的时间频率(Frequency)、起始期和终止期。

图1 Eviews菜单方式创建工作文件示意图

图2 工作文件定义对话框

本例中选择时间频率为Annual(年度数据),在起始栏和终止栏分别输入相应的日期85和98。然后点击OK,在Eviews软件的主显示窗口将显示相应的工作文件窗口(如图3所示)。

图3 Eviews工作文件窗口

一个新建的工作文件窗口内只有2个对象(Object),分别为c(系数向量)和resid(残

差)。它们当前的取值分别是0和NA(空值)。可以通过鼠标左键双击对象名打开该对象查看其数据,也可以用相同的方法查看工作文件窗口中其它对象的数值。

⒉命令方式

还可以用输入命令的方式建立工作文件。在Eviews软件的命令窗口中直接键入CREATE命令,其格式为:

CREATE 时间频率类型起始期终止期

本例应为:CREATE A 85 98

二、输入数据

在Eviews软件的命令窗口中键入数据输入/编辑命令:

DA TA Y X

此时将显示一个数组窗口(如图4所示),即可以输入每个变量的数值

图4 Eviews数组窗口

三、图形分析

借助图形分析可以直观地观察经济变量的变动规律和相关关系,以便合理地确定模型的数学形式。

⒈趋势图分析

命令格式:PLOT 变量1 变量2 ……变量K

作用:⑴分析经济变量的发展变化趋势

⑵观察是否存在异常值

本例为:PLOT Y X

⒉相关图分析

命令格式:SCAT 变量1 变量2

作用:⑴观察变量之间的相关程度

⑵观察变量之间的相关类型,即为线性相关还是曲线相关,曲线相关时大致是哪种类型的曲线

说明:⑴SCAT命令中,第一个变量为横轴变量,一般取为解释变量;第二个变量为纵轴变量,一般取为被解释变量

⑵SCAT命令每次只能显示两个变量之间的相关图,若模型中含有多个解释变量,可以逐个进行分析

⑶通过改变图形的类型,可以将趋势图转变为相关图

本例为:SCA T Y X

图5 税收与GDP 趋势图

图5、图6分别是我国税收与GDP 时间序列趋势图和相关图分析结果。两变量趋势图分析结果显示,我国税收收入与GDP 二者存在差距逐渐增大的增长趋势。相关图分析显示,我国税收收入增长与GDP 密切相关,二者为非线性的曲线相关关系。

图6 税收与GDP 相关图

三、估计线性回归模型

在数组窗口中点击Proc\Make Equation ,如果不需要重新确定方程中的变量或调整样本区间,可以直接点击OK 进行估计。也可以在Eviews 主窗口中点击Quick\Estimate Equation ,在弹出的方程设定框(图7)内输入模型:

Y C X 或 X C C Y *+=)2()1(

图7 方程设定对话框

还可以通过在Eviews 命令窗口中键入LS 命令来估计模型,其命令格式为:

LS 被解释变量 C 解释变量

系统将弹出一个窗口来显示有关估计结果(如图8所示)。因此,我国税收模型的估计式为:

x y

0946.054.987ˆ+= 这个估计结果表明,GDP 每增长1亿元,我国税收收入将增加0.09646亿元。

图8 我国税收预测模型的输出结果

dependent variable:y 被解释变量y method:least squares date time sample included observation variable 变量

coefficient 参数 系数代表模型中自变量及因变量的关系:yi=-26312+38.62xi ,回归系数的正负要符合理论和实际。截距项的回归系数无论是否通过t 检验都没有实际的经济意义。

std.error 回归系数的标准误差 值越大,回归系数的估计值越不可靠,这可以通过t 值的计算公式可知

t-statistic t 检验值-该值越接近零, 系数在统计意义上越接近零。T 值等于回归系数/回

归系数的标准误差,t值的正负与回归系数的正负一致,回归系数的标准误差越大,t值越小,回归系数的估计值越不可靠,越接近于0.

prob.p值为理论t值超越样本t值的概率,应该联系显著性水平a相比,a表示原假设成立的前提下,理论t值超过样本t值的概率,当p值

r-squared决定系数代表模型对数据的解释度, 实质就是(y冒-y均)与(y-y均)的一致程度。范围由(0至1),基本来说,越接近1模型的解释度越强. (Adjusted R square)调整后的决定系数在多元线性回归模型时有用, 由于在多元模型的时候, 决定系数会随变量增大而增大, Adjusted R square就是为了对模型的解释度进行调整(不一定会随变量增大而增大).

adjusted r-squared 经自由度修正后的可决系数,从计算公式可知调整后的可决系数小于可决系数,并且可决系数可能为负,此时说明模型极不可靠。

s.e.of regression回归残差的标准误差。残差的经自由度修正后的标准差,ols的实质就是使得均方差最小化,而均方差与此的区别就是没有经过自由度修正。

sum squared resid 残差平方和

log likelihood 对数似然估计函数值。首先,理解极大似然估计法。极大似然估计法虽然没有ols运用广泛,但它是一个具有更强理论性质的点估计法。极大似然估计的出发点是已知被观察现象的分布,但不知道其参数。极大似然法用得到观测值(样本)最高概率(离散分布以概率聚集函数表示,连续分布以概率密度函数标志。因为要是的样本点中所有样本点都出现,假定抽样是随机的则各个样本点的是独立同分布的,所以最后总的概率表现为概率聚集函数或者概率密度函数的连乘形式,称之为似然函数。要取最大概率,即将似然函数的处理过程都会对似然函数进行对数化处理,这样最后得到的极大似然函数就称之为对数似然函数)的那些参数的值来估计该分布的参数,从而提供一种用于估计刻画一个分布的一组参数的方法。

其次,理解对数似然估计函数值。对数似然估计函数值一般取负值,实际值(不是绝对值)越大越好。第一,基本推理。对于似然函数,如果是离散分布,最后得到的数值直接就是概率,取值区间为0-1,对数化之后的值就是负值;如果是连续变量,因为概率密度函数的取值区间并不局限于0-1,所以最后得到的似然函数值不是概率而只是概率密度函数值,这样对树化之后的正负就不确定了。

durbin-watson stat dw检验值:dw统计量用于检验序列的自相关,公式就是测度残差序列与残差的滞后一期序列之间的差异大小,经过推导可以得出dw值与两者相关系数的等式关系,因而很容易判断。Dw值的取值区间为0-4,当dw值很小时(小于1)表明序列可能存在正自相关;当dw值很大时(大于3)表明序列可能存在负自相关;当值在2附近时(1.5-2.5之间)表明序列无自相关;其余的取值区间表明无法确定是否存在自相关。

mean dependent var 被解释变量的样本均值

s.d.dependent var 被解释变量的样本标准误差

akaike info criterion 赤池信息准则aic和sc在时间序列分析过程中的滞后阶数确定过程中非常重要,一般是越小越好。Aic较小意味着滞后阶数较为合适。

schwarz criterion 施瓦茨信息准则,与aic没有任何本质区别,只是加入样本容量的对数值以修正损失自由度的代价。

f-statistict检定统计量的推广,主要计算同时多个系数等于0的机率, H0: 所有βi=0(i不包含截距系数) ;f统计量考量的是所有解释变量整体的显著性,所以f检验通过并不代表每个解释变量的t值都通过检验。当然,对于一元线性回归,t检验与f检验是等价的。

相关文档
最新文档