计量经济学实验报告(多元线性回归 自相关 )
计量经济学实验报告(三)
2012 — 2013 第 1 学期计量经济学实验报告实验(三):计量经济检验与修正实验学号:0101702 姓名:宋蕾专业: 财务管理选课班级:A(2实验日期: 2 0 11.112实验地点:南区综合楼经济管理与创业模拟实验中心实验室实验名称:计量经济检验与修正实验【实验目标、要求】使学生掌握用Eviews做1.异方差性检验和修正方法;2.自相关性检验和修正方法;3.【实验内容】实验内容以课后练习:以114页第6题、130页应用题第2题为例进行操作【实验步骤】一、第114页第6题(一)创建工作文件在主菜单上依次单击File T New^Workfile ,选择数据类型和起止日期。
时间序列提供起止日期(年、季度、月度、周、日),非时间序列提供最大观察个数。
本题中在workfile structure type 中选Unstructured/Undated, 在Data range Observation 中填 2 8。
单击OK后屏幕出现Workfile工作框,如图所示。
(二)输入和编辑数据在命令窗口直接输入:Data Y X . 屏幕出现数据编辑框,如下图所示。
点击上图中对话框的"Edit +/-",将数据进行输入,如下图所示。
数据输入完毕,单击工作文件窗口工具条的存入磁盘。
(三)0 LS估计参数利用2008年中国部分省市城镇居民家庭平均全年可支配收入(的相关数据表,作散点图。
Eviews命令:scat X Y ; 如图所示X)与消费性支出(Y)Save或单击菜单兰的File宀Save将数据可看出2 0 0 8年中国部分省市城镇居民家庭平均全年可支配收入 (X)与消费性支出(Y)的关系近似直线关系可建立线性回归模型。
在主菜单命令行键入:“LS Y C X ”,然后回车。
即可直接出现如下图所示的计算结果Depe ndent Variable: Y Method: Least Squares Date: 12/12/12 Time: 20:15 Sample: 1 28In cluded observati ons: 28VariableCoefficie ntStd. Errort-StatisticProb.C 735.1080 477.1123 1.540744 0.1355 X0.6662220.03055821.802130.0000R-squared0.948138Mean depe ndent var 10780.65 Adjusted R-squared 0.946144 S.D. dependent var 2823.752 S.E. of regressi on 655.3079 Akaike info criteri on 15.87684 Sum squared resid 11165139 Schwarz criteri on 15.97199 Log likelihood -220.2757 F-statistic 475.3327 Durb in -Watson stat1.778976Prob(F-statistic)0.000000(477. 1123) (0 . 030558) 点击 store to DB,将估计式以“ eq01 ”为名保存。
计量经济学实验报告
一、实验目的及要求:1、目的利用EVIEWS 实验软件,使学生在实验过程中全面了解和熟悉计量经济学的基本概念,熟悉一元线性回归模型估计的基本程序和基本方法。
2、内容及要求(1) 熟悉EVIEWS实验软件的基本操作程序和方法; (2) 掌握一元线性回归模型基本概念,了解其估计和检验原理 (3) 提交实验报告二、仪器用具:三、实验结果与数据处理:1下面是利用1970-1980年美国数据得到的回归结果。
其中Y 表示美国咖啡消费(杯/日.人),X 表示平均零售价格(美元/磅)。
注:262.2)9(2/=αt ,228.2)10(2/=αt6628.006.42)()1216.0(4795.06911.2ˆ2===-=R t se X Y tt)(值1. 写空白处的数值。
12. 对模型中的参数进行显著性检验。
3. 解释斜率系数1β的含义,并给出其95%的置信区间。
解:(1)1308.221216.06911.2)(00===ββse t0114.006.424795.0)(11-=-==tse ββ(2)用t 检验法分别对模型中的参数0β1β进行显著性水平检验: 在5%的显著性水平下,模型的自由度为11-2=9,且262.2)9(025.0=t 由于262.21308.220>=βt ,故该模型的截距项在统计上是显著的; 同理 262.206.421>=βt ,即斜率系数在统计上也是显著的。
(3)斜率系数4795.01-=β,小于0,在其他条件不变的情况下,咖啡的平均零售价格每增加一个单位,美国咖啡的日消费将平均减少0.4795个单位,说明咖啡的消费量与其平均零售价格呈负相关关系。
1β的95%的置信区间为:]4537.0,5053.0[)]ˆ(ˆ),ˆ(ˆ[12/112/1--+-即ββββααse t se t2美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》(The Wall Street Journal Almanac 1999)上。
计量经济学实验报告
上海海关学院
实验报告
实验课程名称 __ 计量经济学_ _
指导教师姓名 __ 高军______
学生姓名__王圣___
学生专业班级__税收1401 __
填写日期__2017.6.10
四、模型设定
为分析建筑业企业利润总额(Y)和建筑业总产值(X)的关系,作如下散点图:
Y i=2.368138+0.034980X i (9.049371) (0.001754)
检验
F=;查表可得
绝原假设,此即表明模型存在异方差。
表.用权数w2的结果
(3) w3=1/x^0.5
经估计检验发现用权数w2的效果最好。
可以看出,运用加权最小二乘法消除了异方检验均显著,F检验也显著,即估计结果为
表示国内生产总值。
三、检验自相关
该回归方程可决系数较高,回归系数显著。
dL=1.316,dU=1.469, DW<dL,
,说明在
4.利用EViews软件作如图残差图
LM=TR²=27×0.517409=13.970043,其中p 值为0.0009,表明存在自相关。
自相关问题的处理
由最终模型可知,中国进口需求总额每增加1亿元,平均说来国内生产总值
20。
计量经济学实验报告(多元线性回归 自相关 )
计量经济学实验报告(多元线性回归自相关 )1. 背景计量经济学是一门关于经济现象的定量分析方法研究的学科。
它的发展使得我们可以对经济现象进行更加准确的分析和预测,并对社会发展提供有利的政策建议。
本文通过对多元线性回归模型和自相关模型的实验研究,来讨论模型的建立与评价。
2. 多元线性回归模型在多元线性回归模型中,我们可以通过各个自变量对因变量进行预测和解释。
例如,我们可以通过考虑家庭收入、年龄和教育程度等自变量,来预测某个家庭的消费水平。
多元线性回归模型的一般形式为:$y_i=\beta_0+\beta_1 x_{i1}+\beta_2 x_{i2}+...+\beta_k x_{ik}+\epsilon_i$在建立模型之前,我们需要对因变量和自变量进行观测和测算。
例如,我们可以通过调查一定数量的家庭,获得他们的收入、年龄、教育程度和消费水平等数据。
接下来,我们可以通过多元线性回归模型,对家庭消费水平进行预测和解释。
在实际的研究中,我们需要对多元线性回归模型进行评价。
其中一个重要的评价指标是 $R^2$ 值,它表示自变量对因变量的解释程度。
$R^2$ 值越高,说明多元线性回归模型的拟合程度越好。
3. 自相关模型在多元线性回归模型中,我们假设各个误差项之间相互独立,即不存在自相关性。
但实际上,各个误差项之间可能会互相影响,产生自相关性。
例如,在一个气温预测模型中,过去的温度对当前的温度有所影响,说明当前的误差项和过去的误差项之间存在相关性。
我们可以通过自相关函数来研究误差项之间的相关性。
自相关函数表示当前误差项和过去 $l$ 期的误差项之间的相关性。
其中,$l$ 称为阶数。
自相关函数的一般形式为:$\rho_l={\frac{\sum_{t=l+1}^{T}(y_t-\bar{y})(y_{t-l}-\bar{y})}{\sum_{t=1}^{T}(y_t-\bar{y})^2}}$在自相关模型中,我们通过对误差项进行差分或滞后变量,来消除误差项之间的自相关性。
计量经济学实验报告(范例)
在“Objects”菜单中点击“New Objects”,在“New Objects”对话框中选“Group”,并在“Name for Objects”上定义文件名,点击“OK”出现数据编辑窗口。
1.学会OLS方法的估计过程
2.掌握了模型的估计和检验方法
3.深入了解了消费函数的计量结果,扩大了思路。
一、研究目的和意义
我们研究的对象是各地区居民消费的差异。居民消费可分为城市居民消费和农村居民消费,由于各地区的城市与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城市居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。所以模型的被解释变量Y选定为“城市居民每人每年的平均消费支出”。
若要将工作文件存盘,点击窗口上方“Save”,在“SaveAs”对话框中给定路径和文件名,再点击“ok”,文件即被保存。
2、输入数据
在数据编辑窗口中,首先按上行键“↑”,这时对应的“obs”字样的空格会自动上跳,在对应列的第二个“obs”有边框的空格键入变量名,如“Y”,再按下行键“↓”,对因变量名下的列出现“NA”字样,即可依顺序输入响应的数据。其他变量的数据也可用类似方法输入。
Annual (年度) Weekly (周数据)
Quartrly (季度) Daily (5 day week ) (每周5天日数据)
Semi Annual (半年) Daily (7 day week ) (每周7天日数据)
计量经济学实验报告完整版范文
评语
教师
评语
成绩
辽宁工程技术大学上机实验报告
实验名称
计量经济学多元线性回归模型
院系
工商管理
专业
金融
班级
09-2
姓名
于佳琦
学号
日期
6.15
实验
目的
简述本次实验目的:熟悉多元线性回归模型中的解释变量的引入
掌握对计算机过的统计分析和经济分析
实验
பைடு நூலகம்准备
你为本次实验做了哪些准备:了解多元线性回归模型参数的OLS估计,统计检验,点预测以及区间估计,非线性回归的参数估计,受约束回归检验
实验
进度
本次共有3个练习,完成3个。
实验
总结
日
本次实验的收获、体会、经验、问题和教训:在简单线性回归的基础上引入了多元线性回归模型,操作也较之前更加复杂,最大的障碍在于多重共线性模型数据更多,输入时容易出错,而且软件非汉化版本,很多时候不了解数据的含义,操作也不是很熟练,一般思路是,先用OLS方法进行估计,建立模型,然后进行对模型的检验,理论相对简单,可是检验过程十分复杂,如果不用例题做实验,单纯找数据进行分析,总会有遗忘的影响因素,而导致结果的偏差,所以在选择分析对象的影响因素时考虑周全尤为重要。
实验
进度
本次共有1个练习,完成1个。
实验
总结
日
本次实验的收获、体会、经验、问题和教训:初步投身于计量经济学,通过利用Eviews软件将所学到的计量知识进行实践,让我加深了对理论的理解和掌握,直观而充分地体会到老师课堂讲授内容的精华之所在。在实验过程中我们提高了手动操作软件、数量化分析与解决问题的能力,还可以培养我在处理实验经济问题的严谨的科学的态度,并且避免了课堂知识与实际应用的脱节。虽然在实验过程中出现了很多错误,但这些经验却锤炼了我们发现问题的眼光,丰富了我们分析问题的思路。通过这次实验让我受益匪浅。
多元线性回归模型计量经济学
多重共线性诊断
通过计算自变量之间的相关系 数、条件指数等方法诊断是否
存在多重共线性问题。
异方差性检验
通过计算异方差性统计量、图 形化方法等检验误差项是否存
在异方差性。
03
多元线性回归模型的应用
经济数据的收集与整理
原始数据收集
通过调查、统计、实验等方式获取原始数据,确保数据的真实性 和准确性。
数据清洗和整理
在实际应用中,多元线性回归模型可能无法处理 非线性关系和复杂的数据结构,需要进一步探索 其他模型和方法。
随着大数据和人工智能技术的发展,多元线性回 归模型的应用场景将更加广泛和复杂,需要进一 步探索如何利用新技术提高模型的预测能力和解 释能力。
07
参考文献
参考文献
期刊论文
学术期刊是学术研究的重要载体, 提供了大量关于多元线性回归模 型计量经济学的最新研究成果。
学位论文
学位论文是学术研究的重要组成 部分,特别是硕士和博士论文, 对多元线性回归模型计量经济学 进行了深入的研究和探讨会议论文集中反映了多元线性回 归模型计量经济学领域的最新进 展和研究成果。
THANKS
感谢观看
模型定义
多元线性回归模型是一种用于描 述因变量与一个或多个自变量之 间线性关系的统计模型。
假设条件
假设误差项独立同分布,且误差项 的均值为0,方差恒定;自变量与 误差项不相关;自变量之间不存在 完全的多重共线性。
模型参数估计
最小二乘法
01
通过最小化残差平方和来估计模型参数,是一种常用的参数估
计方法。
05
案例分析
案例选择与数据来源
案例选择
选择房地产市场作为案例,研究房价 与影响房价的因素之间的关系。
计量经济学实验指导总结
obs 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
图 22
从图 22 中可以看出残差在 0 的上下摆动, 可以对其进行正态性检验。 点击―resid‖ 序列,选择―View‖―Descriptive Statistics‖,―Histogram and State‖得到图 23,通过 正态性检验。
图 23 作业:利用中国统计年鉴 2011,建立我国税收收入、国内生产总值、财政支出、 商品零售价格指数的回归模型。
图 18
图 19
图 20
图 21 5.结果分析。从图 20 可以看出,回归方程为 LNY = 0.6078151931*LNL + 0.371887487*LNK + 1.171524819,并且通过了 F 检验和 t 检验,并且可决系数 为 0.9424,调整后的可决系数为 0.9377,表明建立的回归方程的统计性质是是 比较好的。点击命令栏中的 ―Resids‖得到图 21,可以看出实际值和拟合值是非 常的接近的。
图 13
图 14
图 15 4.生成新的序列。 有时为了研究的需要要在原有序列的基础上进行处理生产 新的序列。比如我们需要对序列―y‖―l‖―k‖取对数的步骤如下:在命令栏中点击 ―Genr‖得到如图 15 的对话框, 在空白部分输入―lny=log (y) ‖表示新建的序列 lny 是由原有序列 y 取对数得到的。点击―ok‖后,lny 序列被保存。相同的方法可建 立新序列 lnl 与 lnk,如图 17。
图 16
图 17 4.多元回归分析。利用序列―lny‖―lnl‖―lnk‖进行多元回归分析的方法有两种。按 住 control 键,依次选中三个序列,右键选择―open‖―as Equation‖如图 18 得到图 19。或者在窗口上方的命令栏中点击选择 ―Quick‖―Estimate Equation‖ 如图 19 得到图 20。在图 20 中输入 lny、lnc、lnl、lnk,中间用空格键隔开,点击―确定‖ 得到最终的回归分析结果,如图 21。
计量经济学EViews自相关检验及修正实验报告
自相关问题的检验与修正【实验目的与要求】熟练使用EViews软件进行计量分析,理解自相关的检验和估计的基本方法【实验准备】1.自相关的基本概念:若Cov(u i,u j)=E(u i uj)=0(i≠j)不成立,即线性回归模型扰动项的方差—协方差矩阵的非主对角线元素不全为零,则称为扰动项自相关,或序列相关(serial correlation)2.自相关的后果:(1)在扰动项自相关的情况下,尽管OLS估计量仍为无偏估计量,但不再具有最小方差的性质,即不是BLUE。
(2)OLS估计量的标准误差不再是真实标准误差的无偏估计量,使得在自相关的情况下,无法再信赖回归参数的置信区间或假设检验的结果。
3.检验自相关的基本方法:残差检验、D.W检验、Q检验4.自相关的修正方法:广义差分法。
【实验内容】1.利用实验数据建立实际有效汇率REER对名义有效汇率NEER的一元回归模型,根据残差检验、D.W 检验、Q检验判别是否存在自相关。
2.利用实验数据,建立中国出口EX对中国进口IM的一元回归模型,根据残差检验、D.W检验、Q 检验判别是否存在自相关。
3.如果检验结果为存在自相关,根据残差检验和D.W检验估计一阶自相关系数。
4.根据估计出的一阶自相关系数,利用广义差分法估计模型。
5.对利用广义差分法估计得到的模型,根据残差检验、D.W检验、Q检验判别是否存在自相关。
6.对实际有效汇率REER对名义有效汇率NEER和中国出口EX对中国进口IM的一元回归模型,根据残差检验和Q检验判别是否存在高阶自相关。
7.如果检验结果为存在高阶自相关,根据残差检验估计高阶自相关系数。
8.根据估计出的高阶自相关系数,利用广义差分法估计模型。
9.对利用广义差分法估计得到的模型,根据残差检验和Q检验判别是否存在高阶自相关。
10.对在同样数据基础上得到的不同模型进行比较分析。
以下实验数据为1980-2003年人民币名义有效汇率(NEER)和实际有效汇率(REER)的数据(来源于国际货币基金组织出版的国际金融统计(IFS))和1982-2002年中国出口(EX)和进口(IM)(单位:亿美元)的数据(来源于中国商务部网站)。
计量经济学(2012B)(第二章多元线性回归)详解
2 2i
n
n
2 i
i ( yi ˆ1x1i ˆ2 x2i )
i 1
i 1
n
i yi
n
(
y
ˆ x
ˆ x
) y
i1
i
1 1i
2 2i
i
i 1
n
y 2
(ˆ
n
x
y
ˆ
n
x
y )
i1
i
1 i1 1i i
2 i1 2 i i
TSS ESS
2.5 单个回归参数的置信区间 与显著性检验
一、置信区间
H (4)
的拒绝域为:
0
F F (2, n 3)
(5) 推断:若
F F (2, n 3)
,则拒绝 H , 0
认为回归参数整体显著;
H 若 F F (2, n 3)
,则接受
,
0
认为回归参数整体上不显著。
回归结果的综合表示
yˆi 0.0905 0.426x1i 0.0084x2i
Sˆj : 或 t:
模型的估计效果. (5) 拟合优度与F 检验中的 F 统计量的关系是什么?这两个
量在评价二元线性回归模型的估计效果上有何区别? (6) 试比较一元线性回归与二元线性回归的回归误差,哪
个拟合的效果更好?
应用:
(1)预测当累计饲料投入为 20磅时,鸡的平均
重量是多少? yˆ 5.2415 f
(磅)
(2)对于二元线性回归方程,求饲料投入的边际生产率?
(0.1527) (0.0439)
(0.5928) (9.6989)
(0.0027) (3.1550)
R2 0.9855, R2 0.9831 , F 408.9551
计量经济学实验二 多元线性回归分析 完成版
练习题1. 在一项对某社区家庭对某种消费品的消费需求调查中,得到下表所示的资料。
序号对某商品的消费支出Y商品单价1X 家庭月收入2X 1591.923.5676202654.524.4491203623.632.07106704647.032.46111605674.031.15119006644.434.14129207680.035.30143408724.038.70159609757.139.631800010706.846.6819300请用Eviews 软件对该社区家庭对该商品的消费需求支出作二元线性回归分析。
解: (1)估计回归方程的参数及随机干扰项的方差,计算及。
2ˆσ2R 2R 222116.847ˆ302.411103iee e n k n k σ'====-----∑20.90220.8743R R ==(2)对方程进行检验,对参数进行检验,并构造参数的置信区间。
F t 95%该社区家庭对该商品的消费需求支出方程为:22ˆ626.50939.790610.02862(15,612)( 3.062)(4.902)0.90220.8743yX X t R R =-+=-==F 检验:22/0.9022/232.29(1)/(1)(10.9022)/7R k F R n k ===----给定显著性水平时,查F 检验分布表,得到临界值,0.05α=0.05(2,7) 4.74F =由于,故模型的线性关系在95%的置信度下是显著成立的。
0.05(2,7)F F >t 检验:两变量的t 值都大于临界值,即:,故模型中引入的两个变0.025||(7) 2.365t t >=量在95%的水平下影响显著,都通过了变量的显著性检验。
参数的置信区间:在的置信度下的置信区间为:1α-ˆjB ˆˆ22ˆˆ(,)jjj j B BB t S B t S αα-⨯+⨯从EViews 中得到:1212ˆˆˆˆ9.7906,0.02863.1978,0.0058B B B B S S =-==-=0.025(7) 2.365t =故的置信区间为:(-17.2934,-2.2878),(-12,ββ0.10857,0.041717)。
计量经济学 实验3 多元回归模型
目录目录 (1)一、建立多元线性回归模型 (3)(一) 建立包括时间变量的三元线性回归模型; (3)1. 建立工作文件:CREATE A 78 94 (3)2. 输入统计资料:DATA Y L K (3)3. 生成时间变量t:GENR T=@TREND(77) (3)4. 建立回归模型:LS Y C T L K (3)(二) 建立剔除时间变量的二元线性回归模型; (4)(三) 建立非线性回归模型——C-D生产函数。
(5)二、比较、选择最佳模型 (8)(一) 回归系数的符号及数值是否合理; (8)(二) 模型的更改是否提高了拟合优度; (8)(三) 模型中各个解释变量是否显著; (8)(四) 残差分布情况 (8)实验三多元回归模型【实验目的】掌握建立多元回归模型和比较、筛选模型的方法。
【实验内容】建立我国国有独立核算工业企业生产函数。
根据生产函数理论,生产函数的基本形式为:()ε,tY=。
其中,L、K分别为生产过程中投入的劳动与资金,fL,K,时间变量t反映技术进步的影响。
表3-1列出了我国1978-1994年期间国有独立核算工业企业的有关统计资料;其中产出Y为工业总产值(可比价),L、K分别为年末职工人数和固定资产净值(可比价)。
资料来源:根据《中国统计年鉴-1995》和《中国工业经济年鉴-1995》计算整理【实验步骤】一、 建立多元线性回归模型(一) 建立包括时间变量的三元线性回归模型;在命令窗口依次键入以下命令即可:1. 建立工作文件: CREATE A 78 942. 输入统计资料: DATA Y L K3. 生成时间变量t : GENR T=@TREND(77)4. 建立回归模型: LS Y C T L K则生产函数的估计结果及有关信息如图3-1所示。
图3-1 我国国有独立核算工业企业生产函数的估计结果 因此,我国国有独立工业企业的生产函数为:K L t y 7764.06667.06789.7732.675ˆ+++-= (模型1)t =(-0.252) (0.672) (0.781) (7.433)9958.02=R 9948.02=R 551.1018=F 模型的计算结果表明,我国国有独立核算工业企业的劳动力边际产出为0.6667,资金的边际产出为0.7764,技术进步的影响使工业总产值平均每年递增77.68亿元。
计量经济学分析案例报告
《计量经济学》实验报告实验课题:各章节案列分析姓名:茆汉成班级:会计学12-2班学号: **********指导老师:***报告日期: 2015.06.18目录第二章简单线性回归模型案例 (1)1 问题引入 (1)2 模型设定 (1)3 估计参数 (3)4 模型检验 (3)第三章多元线性回归模型案例 (5)1 问题引入 (5)2 模型设定 (5)3 估计参数 (6)4 模型检验 (6)第四章多重线性案例 (8)1 问题引入 (8)2 模型设定 (8)3 参数估计 (8)4 对多重共线性的处理 (9)第五章异方差性案例 (11)1 问题引入 (11)2 模型设定 (11)3 参数估计 (11)4 异方差检验 (12)5 异方差性的修正 (14)第六章自相关案例 (15)1 问题引入 (15)2 模型设定 (15)3 用OLS估计 (15)4 自相关其他检验 (16)5 消除自相关 (17)第七章分布滞后模型与自回归模型案例 (19)7.2案例1 (19)1 问题引入 (19)2 模型设定 (19)3 参数估计 (19)7.3案例2 (21)1 问题引入 (21)2 模型设定 (21)3、回归分析 (21)4 模型检验 (23)第八章虚拟变量回归案例 (24)1 问题引入 (24)2 模型设定 (24)3 参数估计 (26)4 模型检验 (27)第二章简单线性回归模型案例1、问题引入居民消费在社会经济的持续发展中有着重要的作用。
适度的居民消费规模和合理的消费模型是人民生活水平的具体体现,有利于经济持续健康的增长。
随着社会信息化程度和居民的收入水平的提高,计算机的运用越来越普及,作为居民耐用消费品重要代表的计算机已经为众多的城镇居民家庭所拥有。
研究中国各地区城镇居民计算机拥有量与居民收入水平的数量关系。
影响居民计算机拥有量的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入水平。
从理论上说居民收入水平越高,居民计算机拥有量越多。
多元线性回归模型实验报告 计量经济学
多元线性回归模型实验报告计量经济学多元线性回归模型是一种比较常见的经济学建模方法,其可用于对多个自变量和一个因变量之间的关系进行分析和预测。
在本次实验中,我们将使用一个包含多个自变量的数据集,对其进行多元线性回归分析,并对分析结果进行解释。
数据集介绍本次实验使用的数据集来自于UCI Machine Learning Repository,数据集包含有关汽车试验的多个自变量和一个连续因变量。
数据集中包含了204条记录,其中每条记录包含了一辆汽车的14个属性,分别是:MPG(燃油效率),气缸数(Cylinders)、排量(Displacement)、马力(Horsepower)、重量(Weight)、加速度(Acceleration)、模型年(Model Year)、产地(Origin)等。
模型建立在进行多元线性回归分析之前,我们首先需要对数据进行预处理。
为了确保数据的可用性,我们需要先检查数据是否存在缺失值和异常值。
如果有,需要进行相应的处理,以确保因变量和自变量之间的关系受到了正确地分析。
在对数据进行预处理之后,我们可以使用Python中的statsmodels包来对数据进行多元线性回归分析。
具体建模过程如下:```import statsmodels.api as sm# 准备自变量和因变量数据X = data[['Cylinders', 'Displacement', 'Horsepower', 'Weight', 'Acceleration', 'Model Year', 'Origin']]y = data['MPG']# 添加常数项X = sm.add_constant(X)# 拟合线性回归模型model = sm.OLS(y, X).fit()# 输出模型摘要print(model.summary())```在上述代码中,我们首先通过data[['Cylinders', 'Displacement', 'Horsepower', 'Weight', 'Acceleration', 'Model Year', 'Origin']]选择了所有自变量列,用于进行多元线性回归分析;然后,我们又通过`sm.add_constant(X)`,向自变量数据中添加了一列全为1的常数项,用于对截距进行建模;最后,我们使用`sm.OLS(y, X).fit()`来拟合线性回归模型,并使用`model.summary()`输出模型摘要。
计量经济学实验报告
武汉轻工大学经济与管理学院实验报告> ¹éÄ£Ðͺ¯ÊýÐÎʽ°¸Àý£¨ÃÀ¹úÈË¿Ú£©.dta", clear . use "C:\Documents and Settings\Administrator\×ÀÃæ\¼ÆÁ¿¾¼ÃѧÉÏ»ú°¸Àýdta Îļþ\»Ø. clear. g lny=ln(y)clear_cons 1506.244 188.0096 8.01 0.000 1080.937 1931.552income .0589824 .0061174 9.64 0.000 .0451439 .072821sex -228.9868 107.0582 -2.14 0.061 -471.1694 13.19576food Coef. Std. Err. t P>|t| [95% Conf. Interval]Total 4018118.25 11 365283.477 Root MSE = 178.77Adj R-squared = 0.9125Residual 287626.106 9 31958.4562 R-squared = 0.9284Model 3730492.14 2 1865246.07 Prob > F = 0.0000F( 2, 9) = 58.36Source SS df MS Number of obs = 12. reg food sex income . g incomesex=incomereg food sex income sexincome 实验表明:差别截距与差别斜率都不是显著的。
计量经济学多元线性回归
调整过的R2(The Adjusted R-squared)
因此, R2增加并不意味着加入新的变量一定 会提高模型拟合度。
调整过的R2是R2一个修正版本,当加入新的 解释变量,调整过的R2不一定增加。
R 21(SS /n (R (k 1 ) )1n(k 1 )SSR
SS /n (T 1 )
定义:
y i y 2 to su to a s m flqS ua S总 rT es平
y ˆi y 2exp slu o as m ifq nu e Sd a Sr解 E es释 u ˆi2 ressiu d os m u fq au S l a SrR 残 es 差平
SST= SSE + SSR
3
重新定义变量
为什么我们想这样做? 数据测度单位变换经常被用于减少被估参数小数
点后的零的个数,这样结果更好看一些。 既然这样做主要为了好看,我们希望本质的东西
不改变。
4
重新定义变量:一个例子
以下模型反映了婴儿出生体重与孕妇吸烟量和家 庭收入之间的关系:
(1) b w g h t ˆ 0 ˆ 1 c ig s ˆ 2 fa m in c
explog考虑如果我们想知道时的百分比变化我们不能只报告因为所以22含二次式的模型u的模型我们不能单独将b解释为关于xy变化的度量我们需要将b如果感兴趣的是给定x的初始值和变动预测y的变化那么可以直接使用1
课堂提纲
重新定义变量的影响
估计系数 R 平方 t 统计量
函数形式
对数函数形式 含二次式的模型 含交叉项的模型
24
wage
7.37
3.73
24.4
exper
25
对含二次式模型的进一步讨论
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验报告课程名称计量经济学实验项目名称多元线性回归自相关异方差多重共线性班级与班级代码 08国际商务1班实验室名称(或课室)实验楼910 专业国际商务任课教师刘照德学号: 043姓名:张柳文实验日期: 2011 年 06 月 23日广东商学院教务处制姓名张柳文实验报告成绩评语:指导教师(签名)年月日说明:指导教师评分后,实验报告交院(系)办公室保存。
计量经济学实验报告实验项目:多元线性回归、自相关、异方差、多重共线性实验目的:掌握多元线性回归模型、自相关模型、异方差模型、多重共线性模型的估计和检验方法和处理方法实验要求:选择方程进行多元线性回归;熟悉图形法检验和掌握D-W 检验,理解广义差分法变换和掌握迭代法;掌握Park或Glejser检验,理解同方差性变换;实验原理:普通最小二乘法图形检验法 D-W检验广义差分变换加权最小二乘法 Park检验等实验步骤:首先:选择数据为了研究影响中国税收收入增长的主要原因,选择国内生产总值(GDP)、财政支出(ED)、商品零售价格指数(RPI)做为解释变量,对税收收入(Y)做多元线性回归。
从《中国统计年鉴》2011中收集1978—2009年各项影响因素的数据。
如下表所示:中国税收收入及相关数据实验一:多元线性回归1、将数据导入后,分别对三个解释变量与被解释变量做散点图,选择两个变量作为group打开,在数据表“group”中点击view/graph/scatter/simple scatter,出现数据的散点图,分别如下图所示:从散点图看,变量间不一定呈现线性关系,可以试着作线性回归。
2、进行因果关系检验在“workfile”中按住“ctrl”键,点击所要选择的变量,作为组打开后,在“View”下拉列表中选择“Grange Causality”,滞后期为2,得出如下结果:Pairwise Granger Causality TestsDate: 06/23/11 Time: 16:14Sample: 1978 2009Lags: 2Null Hypothesis:Obs F-Statistic ProbabilityED does not Granger Cause Y30Y does not Granger Cause EDPairwise Granger Causality TestsDate: 06/23/11 Time: 16:15Sample: 1978 2009Lags: 2Null Hypothesis:Obs F-Statistic ProbabilityGDP does not Granger Cause Y30Y does not Granger Cause GDPPairwise Granger Causality TestsDate: 06/23/11 Time: 16:19Sample: 1978 2009Lags: 2Null Hypothesis:Obs F-Statistic ProbabilityRPI does not Granger Cause Y30Y does not Granger Cause RPI从因果关系检验看,ED明显影响财政收入Y,其他两个因素影响不显著。
3、做多元线性回归选中变量作为组打开,在下拉列表“Proc”中选择“MakeEquation”按“确定”,得到多元回归模型:根据图中数据,模型估计的结果为:53.36408ED 0.616282GDP 0.046340RPI 39706.56Y -*+*+*=()t=996573.0R 2= 996206.0R 2=- F= df=27模型估计结果说明,在假定其他变量不变的情况下,当年RPI 每增长1%,平均来说税收收入会增长亿元;当年GDP 每增长1亿元,平均来说税收收入会增长亿元;当年财政支出每增长1亿元,平均来说税收收入会增长亿元。
可决系数996573.0R 2=,修正后的可决系数996206.0R 2=-,说明模型的样本的拟合很好。
F 检验的数值很大,可以判定,在给定显著性水平α=的情况下,拒绝原假设。
说明回归方程显著,既“国内生产总值”、“财政支出”、“商品零售价格指数”等变量联合起来确实对“税收收入”有显著影响。
从t 检验的值可以看出,GDP 、ED 均对税收收入有显著影响,但是RPI 指数的t 检验值为,不通过检验。
实验二:自相关1、根据前面的数据把GDP 作为解释变量,税收收入作为被解释变量进行一元回归。
结果如下:Dependent Variable: Y Method: Least Squares Date: 06/23/11 Time: 19:01 Sample: 1978 2009Included observations: 32Variable Coefficient Std. Error t-Statistic Prob.GDP CR-squaredMean dependent varAdjusted R-squared. dependent var. of regressionAkaike info criterionSum squared resid+08Schwarz criterion Log likelihood F-statisticDurbin-Watson statProb(F-statistic )把回归分析结果报告出来如下:21.71552GDP169682.0Y-*=()()t=0.984406R2= SE= DW=0.115021 F=从报告可以一目了然地看出,D-W值近似为0,存在自相关。
2、用图形检验法检查是否存在自相关做残差趋势图:在进行一元回归的界面上,点击“resid”,生成残差趋势图:在“workfile”窗口找到“show”,点击在弹出的“show”对话框中输入“resid(-1) resid”,单击“OK”点击“view/graph/scatter/simple scatter”,生成残差散点图:从以上残差趋势图和残差散点图可以看出,方程存在正自相关。
3、回归自相关的处理在Y对GDP远回归中添入AR(1)项,如图:点击“确定”,回归结果如下:此时D-W值由原来的提高到,还没有消除自相关,继续处理,再加入AR(2)项,结果如下:Dependent Variable: YMethod: Least SquaresDate: 06/23/11 Time: 20:01Sample (adjusted): 1980 2009Included observations: 30 after adjustmentsConvergence achieved after 9 iterationsVariable Coefficient Std. Error t-Statistic Prob.GDPC AR(1) AR(2)R-squaredMean dependent varAdjusted R-squared. dependent var . of regression Akaike infocriterionSum squared resid 8204036. Schwarz criterionLog likelihoodF-statisticDurbin-Watson statProb(F-statistic)Inverted AR Roots.90.51此时D-W 检验值达到,消除了自相关。
没有消除和消除了自相关的回归方程分别为:21.71552GDP 169682.0Y -*=))(,)((462035.02A R 4114221.11A R 37.04664GDP 188524.0Y -==+-*=实验三、异方差1、图形检验法首先,Y 对GDP 回归的残差趋势图在前面自相关的实验中已经出现为:接着,用SORT 命令对变量进行排序:然后,进行残差散点图,在“show ”窗口输入指令“gdp resid^2”,点击“OK ”,按照路径“view/graph/scatter/simple scatter ”,生成残差散点图如下:从残差散点图上可以直观地看出,方程不存在异方差。
2、Park 检验对Y 与GDP 回归的Park 检验,实际上就是做形如如下的回归观察其显著性 i t u GDP b b e ++=ln ln 102进行回归,的结果为:Dependent Variable: LOG(RESID^2) Method: Least Squares Date: 06/23/11 Time: 21:53 Sample: 1 32Included observations: 32VariableCoefficientStd. Error t-Statistic Prob.LOG(GDP)CR-squaredMean dependent varAdjusted R-squared. dependent var. of regressionAkaike info criterionSum squared resid Schwarz criterion Log likelihood F-statisticDurbin-Watson statProb(F-statistic )从结果可以看出,方程是不显著的,既不存在异方差3、White检验由一元回归估计结果,按照路径“view/residual tests/White heteroskedasticity(no cross terms or cross terms)”,进入White检验,根据White检验中附注函数的构造,最后一项为变量的交叉乘积项,因为检验一元函数,故无交叉乘积项,因此应选no cross 。
经估计出现White检验结果如下:White Heteroskedasticity Test:F-statistic ProbabilityObs*R-squared ProbabilityTest Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 06/23/11 Time: 22:05 Sample: 1 32Included observations: 32VariableCoefficientStd. Error t-Statistic Prob.C 2593976.1086913.GDP GDP^2R-squaredMean dependentvar3914645. Adjusted R-squared. dependent var 3866921.. of regression 3794644. Akaike infocriterionSum squared resid +14 Schwarz criterionLog likelihoodF-statisticDurbin-Watson statProb(F-statistic)从表中可以看出,n 2R =,由White 检验知,在α=下,查2χ分布表,得临界值2050。