第三讲 eviews多元线性回归模型
运用EVIEWS建立多元线性回归并进行相关检验
运用EVIEWS 建立多元线性回归并进行相关检验姓名:jelly一、输入数据某社区家庭对某种消费品的消费需要调查二、根据数据画出散点图从上面两散点图可以看出此社区家庭对某商品的消费支出与家庭月收入、商品的价格大致呈线性关系且随着家庭收入和户主受教育年数的逐渐增大对此商品的消费支出也呈逐渐增大的趋势。
三、样本相关阵从样本相关阵可以看出,某商品的消费支出与家庭月收入、商品的价格的相关系数高达0.965046和0.752695 ,说明某商品的消费支出与家庭月收入、商品的价格有显著的线性关序号 商品 价格X1 家庭月 收入X2 对某商品的消费支出Y 1 23.56 7620 591.9 2 24.44 9120 654.5 3 32.07 10670 623.6 4 32.46 11160 647 5 31.15 11900 674 6 34.14 12920 644.4 7 35.3 14340 680 8 38.7 15960 724 9 39.63 18000 757.1 10 46.68 19300 706.8系,可以考虑建立二元线性回归模型。
四、对数据进行普通最小二乘估计,OLS 表如下五、写出估计方程12626.50939.7905700.28618i Y X X ∧=-+(40.13010) (3.197843) (0.05838)t=(15.611195) (-3.061617) (4.902030)20.902218R = 2R =0.874281 六、随机干扰项2'1e e n k σ∧=--'''''ˆˆˆˆˆ()()()()e e Y YY Y Y X Y X Y Y Y X βββ=--=--=-=2116.85 所以22116.85ˆ302.411021σ==-- 由OLS 表得20.902218R = 2R =0.874281 七、由OLS 可得 F=32.29 0.05(2,7) 4.74F =因为32.29>4.74,所以方程的总体线性性显著成立由OLS 表可得 C 的t 值为15.61 X1的t 值为-3.06 X2的值为4.90 0.025(7) 2.365t =所以常输项,X1和X2的总体参数都显著的异于零将数据分别代入以下三个式子:0ˆ00.025ˆt S ββ±⨯ 1ˆ10.025ˆt S ββ±⨯ 2ˆ20.025ˆt S ββ±⨯ 可得参数95%的置信区间分别为(531.62,724.40) -17.35,-2.22) (0.014,0.042)八、X1=35 X2=20000将X1,X2代人方程可得Y 为856.20Y 的均值0ˆY S =37.05 0.025(7) 2.365t = 所以Y 的均值在95%的置信区间为(768.58,943.82)Y 的个值0ˆY S =40.93 0.025(7) 2.365t =所以Y 的个值在95%的置信区间为(759.41,952.99)第二个实验输入数据,对其进行回归分析输出OLS 表由表可得方程为ˆln 101540.609ln 0.361ln Y K L =++ (1.59)(3.45) (1.79)2R =0.8099 2R =0.7963 F=59.660.05(2,28)F =3.34 0.025(28)t =2.048 0.01(28)t =1.701所以lnK 与lnL 联合起来对lnY 有显著的线性影响在5%的显著性水平下,lnK 的参数通过了检验但lnL 的参数未通过t 检验,如果设定显著性水平为10%,lnL 与lnK 都通过检验。
计量经济学第三章-多元线性回归模型PPT课件
用矩阵表示
Y1 1 X 21 X k1 1 u1
Y2
1
X 22
Xk
2
2
u2
Yn
1 X 2n
X
kn
k
u
n
Y
X
βu
n 1
nk
第8页/共55页
k 1 n1
8 8
矩阵表示方式
总体回归函数 E(Y) = Xβ 或 Y = Xβ + u
样本回归函数 Yˆ = Xβˆ 或 Y = Xβˆ + e
第1页/共55页
1
怎样分析多种因素的影响?
分析中国汽车行业未来的趋势,应具体分析这样一些问题:
中国汽车市场发展的状况如何?(用销售量观测) 影响中国汽车销量的主要因素是什么?
(如收入、价格、费用、道路状况、能源、政策环境等)
各种因素对汽车销量影响的性质怎样?(正、负)
各种因素影响汽车销量的具体数量关系是什么?
( j 2,3, , k)
假定5: 无多重共线性假定 (多元中增加的)
假定各解释变量之间不存在线性关系,或各个解
释变量观测值之间线性无关。或解释变量观测值
矩阵X的秩为K(注意X为n行K列)。
Ran(X)= k 即 (X'X) 可逆 假定6:正态性假定
Rak(X'X)=k
ui ~ N(0, 2)
u ~ N(0, 2I)
定值的矩阵
2、 无偏特性E(ˆK ) K
(证明见教材P101附录3.1)
3、 最小方差特性
在 K 所有的线性无偏估计中,OLS估计ˆK
具有最小方差
(证明见教材P101或附录3.2)
结论:在古典假定下,多元线性回归的 OLS估
《计量经济学》(庞浩第一版)第三章多元线性回归模型eviews上机操作
第三章多元线性回归模型案例分析一、研究目的1提出问题:研究中国税收收入增长的主要原因(必须要有研究的意义,且具创新价值)2分析问题:从宏观经济看经济增长是税收增长的源泉;公共财政的需求;物价水平;税收政策(要注重经济理论的相关性和逻辑性)二、模型设定1被解释变量:为了全面反映中国税收增长的全貌,选择包括中央和地方的的“国家财政收入”中的各项税收作为被解释变量2解释变量:选择“国内生产总值GDP”作为经济整体增长水平的代表;选择中央和地方“财政支出”作为公共财政需求的代表,选择“商品零售物价指数”作为物价水平的代表,而由于财政体制的改革难以量化,且1985年后财税体制改革对税收增长影响不是很大,故暂不考虑。
3设定线性模型为:Y t= β1+β2X2t+β3 X3t+β4 X4t +u t注:X1默认为14经济理论构造成功之后,即着手收集数据资料(这要借助统计学的知识进行整理,并不是什么数据都可以直接拿来用。
首先,数据来源的权威性,即必须保证数据的准确可靠性,不能随意捏造,其次,数据的合理分类,最后是数据的合理运用)附:数据三、估计参数利用eviews3.0进行分析1建立工作文件新建工作文档:file-new-workfile,在打开的workfile range 对话框中的workfile frequency 中选择annual,start date 输入1978,end date输入2002,点击ok。
2输入数据直接在命令窗口输入“data Y X2 X3 X4 、、、”本案例中输入data Y X2 X3 X4然后是将excel中的数据复制过来,并点击name命名GROUP01。
3估计参数直接在命令窗口输入“LS Y C X2 X3 X4 、、、”。
LS是做最小二乘估计的命令,Y为被解释变量,C为截距项,X为解释变量,注意LS Y C X之间要有空格,被解释变量紧接在命令LS之后。
本案例中输入LS Y C X2 X3 X4 本题中得到下表,点击name 命名eq01。
多元线性回归eviews操作
一.模型设定本例中我们假设拟建立如下多元回归模型:01122Y X X u βββ=+++二.估计参数1.建立工作文件首先,进入Eviews 主页,在菜单中依次点击File\New\Workfile ,出现对话框Work Create 。
截面数据Unstructured/undated 只需输入样本数就可以。
时间序列数据Dated-regular frequency 在Date specification 中选择数据频率: Annual (年度) Weekly (周数据) Quarterly (季度)Daily (5 day week )每周5天日数据 Daily (7 day week )每周7天日数据 Monthly (月度) integer date (未注明日期或者不规则的) Semi Annual (半年度)其次,点击OK ,出现未命名文件的Workfile UNTITLED 工作框。
其中c 为截距项,resid 为残差项。
若要将文件存盘,点击save ,在save as 对话框中选择存盘路径,并输入文件名。
如多元线性回归案例2.输入数据方法一:Quick\Empty Group 等方法二:data Y X1 X2,得到如下表;3.估计参数方法一:Quick\Estimate Equation 方法二: LS Y C X1 X2三、解释表里参数标准差1β∧S =0.075308,回归标准差=被解释变量标准差=回归模型标准差:σ∧残差平方和:2i e ∑=4170093被解释变量的标准差:2=2388.459 AIC 和SC 准则:这两个准则要求仅当所增加的解释变量能减少AIC 值或SC 值时才在原模型中增加该解释变量。
与调整的可决系数相似。
多元小于一元,可以将前期人均居民消费作为解释变量包括在模型中。
四、模型检验1.经济意义检验估计的参数值都为正数,经济意义合理。
所估计的参数120.555644,0.250085ββ∧∧==,说明在2006年可支配收入不变的情况下,2005年消费支出每增加1元,平均来说,可导致2006年消费支出提高0.250085元。
Eviews实验课讲义_3一元多元线性回归-上机课
第三课一元及多元线性回归模型一元线性回归模型一、做两个变量的散点图,从而看两个变量是否具有线性关系。
案例数据:1985-2002年我国人均钢产量与人均GDP的时间序列数据(数据3_1_1)。
操作方法:通过序列组的形式右键单击打开后,在group窗口下view——graph---scatter,通过对散点图结同样的操作可以检验其它案例数据(3_1_2和3_1_3)的特征:案例数据2、3、4、5:10个家庭人均收入与消费支出的横截面数据;1978-2000年中国人均消费模型;1978年-2008年北京市城镇居民年家庭收入和年消费性支出数据(case1_1的数据); 1970年-1980年美国的咖啡平均真实零售价格(每磅美元)与消费量(每人每日杯数)(其中,零售价格是已经经过物价调整的)二、通过建立方程对象的方式来估计一个方程,并保存我们建立的方程对象。
Workfile窗口下建立新的对象---equation对象并命名,在equation estimation 窗口下的specification 选项卡下的equation specification对话框中设置因变量、自变量及常数项,在estimation settings对话框中注意:建模途径:command: quick\estimation equation回车,或object\equation object,设置。
命令行形式:(1)列表法:consp c gdpp 或(2)公式法:consp=c(1)+c(2)*gdpp三、方程估计结果的解释、评价及模型检验(拟合优度评价,估计参数和方程的显著性检验)消费方程中,C为自发性消费,x(gdpp)的系数为经济参数,关注其意义;通过拟合优度、调整后的拟合优度、t统计量后的精确显著性水平p(相伴概率);f统计量的p来判断对原假设接受与否四、在回归估计结果中显示方程的三种形式(即估计命令,回归方程的一般表达式,带有系数估计值的表达式)Estimation Command:LS GDPP STEELP CEstimation Equation:GDPP = C(1)*STEELP + C(2)Substituted Coefficients:GDPP = *STEELP - 3394.五、如何查看因变量的实际值、拟合值和回归方程的残差(包括表的形式和图的形式)通过方程窗口下的view去实现实际值、拟合值和回归方程的残差;单独显示残差及标准化后的对于案例数据1978年-2008年北京市城镇居民年家庭收入和年消费性支出数据,进行样本内与外的预测。
第三章(1) 多元线性回归模型课件
分离差的大小
解释的那部分离差的大小。也
称剩余平方和。
第三章 多元线性回归模型
§ 3-3 多元线性回归模型的统计检验 一、 拟合优度检验 检验模型对样本观测值的拟合程度。用在总离差分解 基础上确定的可决系数R2 (调整的可决系数 ) 度量。 1、总离差平方和的分解
总离差平方和TSS 回归平方和ESS
3、随机误差项在不同 样本点之间是独立的,
Cov( i,
不存在序列相关
因为 i与 j相互独立,有:
j)=0 i≠j
无自相关假定表明:产生 误差(干扰)的因素是完 全随机的,此次干扰与彼 次干扰互不相关,互相独 立。由此应变量Yi的序列 值之间也互不相关。
第三章 多元线性回归模型
§ 3-1 多元线性回归模型及其基本假定
3、有效性(最小方差性):
指在所有线性、无偏估计量中, OLS参数估计量的 方差最小。
4、 服从正态分布,即:
其中,
, G2是随机误差项的方差,
Cjj是矩阵(X’X)-1 中第j行第j列位置上的元素。
第三章 多元线性回归模型
§ 3-2 多元线性回归模型的参数估计
一、 参数的最小二乘估计
二、 OLS估计量的统计性质及其分布
三、随机误差项方差Q2的估 计
参数估计的另一项任务是: 求随机误差项 i 的分布参数
称作回归标准差 (standard error of regression), 常作为对所估计回归线的拟
合优度的简单度量。
i~N(0, Q2)
随机误差项 i 的 方差的估计量为:
可以
证明:
说明 是QS 的无偏估计量。
t-Statistic 6.411848 22.00035 4.187969
Eviews-多元回归模型
多元回归分析案例——中国税收增长的分析一、研究的目的要求改革开放以来,随着经济体制改革的深化和经济的快速增长,中国的财政收支状况发生很大变化,中央和地方的税收收入1978年为519.28亿元,到2002年已增长到17636.45亿元,25年间增长了33倍,平均每年增长%。
为了研究影响中国税收收入增长的主要原因,分析中央和地方税收收入的增长规律,预测中国税收未来的增长趋势,需要建立计量经济模型。
影响中国税收收入增长的因素很多,但据分析主要的因素可能有:(1)从宏观经济看,经济整体增长是税收增长的基本源泉。
(2)公共财政的需求,税收收入是财政收入的主体,社会经济的发展和社会保障的完善等都对公共财政提出要求,因此对预算支出所表现的公共财政的需求对当年的税收收入可能会有一定的影响。
(3)物价水平。
我国的税制结构以流转税为主,以现行价格计算的GDP等指标和经营者的收入水平都与物价水平有关。
(4)税收政策因素。
我国自1978年以来经历了两次大的税制改革,一次是1984-1985年的国有企业利改税,另一次是1994年的全国范围内的新税制改革。
税制改革对税收会产生影响,特别是1985年税收陡增215.42%。
但是第二次税制改革对税收增长速度的影响不是非常大。
因此,可以从以上几个方面,分析各种因素对中国税收增长的具体影响。
二、模型设定为了全面反映中国税收增长的全貌,选择包括中央和地方税收的“国家财政收入”中的“各项税收”(简称“税收收入”)作为被解释变量,以反映国家税收的增长;选择“国内生产总值(GDP)”作为经济整体增长水平的代表;选择中央和地方“财政支出”作为公共财政需求的代表;选择“商品零售物价指数”作为物价水平的代表。
由于财税体制的改革难以量化,而且1985年以后财税体制改革对税收增长影响不是很大,可暂不考虑税制改革对税收增长的影响。
所以解释变量设定为可观测的“国内生产总值”、“财政支出”、“商品零售物价指数”等变量。
5、计量经济学【多元线性回归模型】
二、多元线性回归模型的参数估计
2、最小二乘估计量的性质 当 ˆ0, ˆ1, ˆ2, , ˆk 为表达式形式时,为随机变量, 这时最小二乘估计量 ˆ0, ˆ1, ˆ2, , ˆk 经过证明同样也 具有线性性、无偏性和最小方差性(有效性)。 也就是说,在模型满足那几条基本假定的前提 下,OLS估计量具有线性性、无偏性和最小方差性 (有效性)这样优良的性质, 即最小二乘估计量
用残差平方和 ei2 最小的准则: i
二、多元线性回归模型的参数估计
1、参数的普通最小二乘估计法(OLS) 即:
min ei2 min (Yi Yˆi )2 min Yi (ˆ0 ˆ1X1i ˆ2 X 2i ˆk X ki )2
同样的道理,根据微积分知识,要使上式最小,只 需求上式分别对 ˆj ( j 0,1, k) 的一阶偏导数,并令 一阶偏导数为 0,就可得到一个包含 k 1 个方程的正 规方程组,这个正规方程组中有 k 1个未知参数 ˆ0, ˆ1, ˆ2, , ˆk ;解这个正规方程组即可得到这 k 1 个参数 ˆ0, ˆ1, ˆ2, , ˆk 的表达式,即得到了参数的最小 二乘估计量;将样本数据代入到这些表达式中,即可 计算出参数的最小二乘估计值。
该样本回归模型与总体回归模型相对应,其中残差 ei Yi Yˆi 可看成是总体回归模型中随机误差项 i 的 估计值。
2、多元线性回归模型的几种形式: 上述几种形式的矩阵表达式: 将多元线性总体回归模型 (3.1) 式表示的 n 个随机方 程写成方程组的形式,有:
Y1 0 1 X11 2 X 21 .Y.2.........0.......1.X...1.2........2.X...2.2. Yn 0 1 X1n 2 X 2n
ˆ0, ˆ1, ˆ2, , ˆk 是总体参数真值的最佳线性无偏估计 量( BLUE );即高斯—马尔可夫定理 (GaussMarkov theorem)。
第三次实验(EVIEWS实现多元线性回归)
7/2/2013
榆林学院数学系统计教研室
9
三、检验方程
1、经济意义检验
模型结果表明在假定户主受教育年限不 变的情况下,家庭月平均收入增加1元,家 庭书刊年消费支出将增加0.086元;在假定 家庭平均月收入不变的情况下,户主受教育 年数增加1年,家庭书刊年消费支出将增加 52.37元。这与我们的认识大致相符。
7/2/2013
榆林学院数学系统计教研室
11
四、进行点预测和区间预测
现有一户家庭的月均收入为4000元,户主受教育年数为 18年,预测该户家庭的书刊消费是多少,构造该估计值 95%的置信区间。
7/2/2013
榆林学院数学系统计教研室
12
四、进行点预测和区间预测
可得当X1=4000,X2=18时,Y等于1238.45。 由单值预测和条件均值预测的公式:
10222021一绘制散点图和样本相关阵从样本相关阵可以看出家庭书刊消费与家庭收入户主受教育年数之间的相关系数高达0788517和0960757说明家庭书刊消费与家庭收入户主受教育年数有显著的线性关系可以考虑建立二元线性回归模型
《计量经济学》实验指导 ——基于Eviews软件 实验三:运用EVIEWS建立多元线 性回归并进行相关检验
7/2/2013
榆林学院数学系统计教研室
5
一、绘制散点图和样本相关阵
从样本相关阵可以看出,家庭书刊消费与 家庭收入、户主受教育年数之间的相关系数高 达0.788517和0.960757 ,说明家庭书刊消 费与家庭收入、户主受教育年数有显著的线性 关系,可以考虑建立二元线性回归模型。
7/2/2013
7/2/2013
榆林学院数学系统计教研室
2
多元线性回归模型建模步骤
第三讲eviews多元线性回归模型ppt课件
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
3.2 多元线性回归模型的检验
3.2.1 拟合优度检验
拟合优度是指样本回归直线与观测值之间的拟合程度。 1.多重决定系数
总离差平方和=残差平方和+ 回归平方和 自由度: (n-1)= (n-k-1)+ k ESS:由回归直线(即解释变量)所解释的部分,表示x对y的线性影响。 RSS:是未被回归直线解释的部分,由解释变量x对y影响以外的因素而造成的。
507.7
613.9
563.4
501.5
781.5
541.8
611.1
1222.1
793.2
660.8
792.7580.8Fra bibliotek612.7
890.8
1121.0
1094.2
1253.0
家庭收入 x 1027.2 1045.2 1225.8 1312.2 1316.4 1442.4 1641.0 1768.8 1981.2 1998.6 2196.0 2105.4 2147.4 2154.0 2231.4 2611.8 3143.4 3624.6
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
多重决定系数或决定系数是指解释变差占总变差的比重,用来表述解 释变量对被解释变量的解释程度:
Eviews实验课讲义_3一元多元线性回归-上机课
第三课一元及多元线性回归模型3.1一元线性回归模型一、做两个变量的散点图,从而看两个变量是否具有线性关系。
案例数据:1985-2002年我国人均钢产量与人均GDP的时间序列数据(数据3_1_1)。
操作方法:通过序列组的形式右键单击打开后,在group窗口下view——graph---scatter,通过对散点图结同样的操作可以检验其它案例数据(3_1_2和3_1_3)的特征:案例数据2、3、4、5:10个家庭人均收入与消费支出的横截面数据;1978-2000年中国人均消费模型;1978年-2008年北京市城镇居民年家庭收入和年消费性支出数据(case1_1的数据); 1970年-1980年美国的咖啡平均真实零售价格(每磅美元)与消费量(每人每日杯数)(其中,零售价格是已经经过物价调整的)二、通过建立方程对象的方式来估计一个方程,并保存我们建立的方程对象。
Workfile窗口下建立新的对象---equation对象并命名,在equation estimation 窗口下的specification 选项卡下的equation specification对话框中设置因变量、自变量及常数项,在estimation settings对话框中注意:建模途径:command: quick\estimation equation回车,或object\equation object,设置。
命令行形式:(1)列表法:consp c gdpp 或(2)公式法:consp=c(1)+c(2)*gdpp三、方程估计结果的解释、评价及模型检验(拟合优度评价,估计参数和方程的显著性检验)消费方程中,C为自发性消费,x(gdpp)的系数为经济参数,关注其意义;通过拟合优度、调整后的拟合优度、t统计量后的精确显著性水平p(相伴概率);f统计量的p来判断对原假设接受与否四、在回归估计结果中显示方程的三种形式(即估计命令,回归方程的一般表达式,带有系数估计值的表达式)Estimation Command:LS GDPP STEELP CEstimation Equation:GDPP = C(1)*STEELP + C(2)Substituted Coefficients:GDPP = 93.6876362857*STEELP - 3394.97191614五、如何查看因变量的实际值、拟合值和回归方程的残差(包括表的形式和图的形式)通过方程窗口下的view去实现实际值、拟合值和回归方程的残差;单独显示残差及标准化后的对于案例数据1978年-2008年北京市城镇居民年家庭收入和年消费性支出数据,进行样本内与外的预测。
第三章多元线性回归模型
第三章 多元线性回归模型一、名词解释1、多元线性回归模型:在现实经济活动中往往存在一个变量受到其他多个变量影响的现象,表现在线性回归模型中有多个解释变量,这样的模型被称做多元线性回归模型,多元是指多个解释变量2、调整的可决系数2R :又叫调整的决定系数,是一个用于描述多个解释变量对被解释变量的联合影响程度的统计量,克服了2R 随解释变量的增加而增大的缺陷,与2R 的关系为2211(1)1n R R n k -=----。
3、偏回归系数:在多元回归模型中,每一个解释变量前的参数即为偏回归系数,它测度了当其他解释变量保持不变时,该变量增加1单位对被解释变量带来的平均影响程度。
4、正规方程组:采用OLS 方法估计线性回归模型时,对残差平方和关于各参数求偏导,并令偏导数为0后得到的方程组,其矩阵形式为ˆX X X Y β''=。
5、方程显著性检验:是针对所有解释变量对被解释变量的联合影响是否显著所作的检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出判断。
二、单项选择题1、C :F 统计量的意义2、A :F 统计量的定义3、B :随机误差项方差的估计值1ˆ22--=∑k n e iσ4、A :书上P92和P93公式5、C :A 参看导论部分内容;B 在判断多重共线等问题的时候,很有必要;D 在相同解释变量情况下可以衡量6、C :书上P99,比较F 统计量和可决系数的公式即可7、A :书P818、D :A 截距项可以不管它;B 不考虑beta0;C 相关关系与因果关系的辨析 9、B :注意!只是在服从基本假设的前提下,统计量才服从相应的分布10、D :AB 不能简单通过可决系数判断模型好坏,还要考虑样本量、异方差等问题;三、多项选择题1、ACDE :概念性2、BD :概念性3、BCD :总体显著,则至少一个参数不为04、BC :参考可决系数和F 统计量的公式5、AD :考虑极端情况,ESS=0,可发现CE 错四、判断题、 1、√2、√3、×4、×:调整的可决系数5、√五、简答题 1、 答:多元线性回归模型与一元线性回归模型的区别表现在如下几个方面:一是解释变量的个数不同;二是模型的经典假设不同,多元线性回归模型比一元线性回归模型多了个“解释变量之间不存在线性相关关系”的假定;三是多元线性回归模型的参数估计式的表达更为复杂。
计量经济学多元线性回归分析eviews操作PPT课件
人均GDP GDPP 1602.3 1727.2 1949.8 2187.9 2436.1 2663.7 2889.1 3111.9 3323.1 3529.3 3789.7
该两组数据是1978~2000年的时间序列数据 (time series data)
1、建立模型 拟建立如下一元回归模型
CONSP C GDPP 采用Eviews软件进行回归分析的结果见下表
μ~ N(0, 2I) 同一元回归一样,多元回归还具有如下两个重要假设:
假设7,样本容量趋于无穷时,各解释变量的方差趋于有 界常数,即n∞时,
1
n
x
2 ji
1 n
( X ji X j )2 Q j
或
1 xx Q n
其中:Q为一非奇异固定矩阵,矩阵x是由各解释变量 的离差为元素组成的nk阶矩阵
nk nk
第15页/共63页
四、参数估计量的性质
在满足基本假设的情况下,其结构参数的普
通最小二乘估计、最大或然估计及矩估计仍具 有:
同时,随线着性样性本、容无量偏增性加、,有参效数性估。计量具有: 渐近无偏性、渐近有效性、一致性。
1、线性性
βˆ (XX)1 XY CY
其中,C=(X’X)-1 X’ 为一仅与固定的X有关的行向量
2 ki
ki
ˆ 0 ˆ1
ˆ k
1 X 11
X k1
1 X 12
X k2
1 Y1 X 1n Y2 X kn Yn
即
(XX)βˆ XY
由于X’X满秩,故有 βˆ (XX)1 XY
第11页/共63页
将上述过程用矩阵表示如下:
即求解方程组:
βˆ (Y
Xβˆ )(Y
第三章-多元线性回归模型ppt课件
32
§3.5 最小二乘估计量的特征
上一章中谈到,经典一元线性回归模
型的OLS估计量满足线性、无偏及方差最
小性,即高斯——马尔可夫定理,对于经
典多元线性回归模型的普通最小二乘估计
量,这一性质仍然存在,换言之,对于满
足经典假设的多元线性回归模型,采用
OLS方法所得估计量 也满足线性、无偏
及方差最小性。 ppt精选版
ˆ 3
yi x3i
x
2 2i
x
2 2i
yi x2i
x2i x3i
x32i ( x2i x3i ) 2
ppt精选版
30
解方程时的系数行列式:
x22i
x2ix3i
x2ix3i
x32i
解 ˆ2 时的分子行列式:
yix2i
x2ix3i
yix3i
x32i
ppt精选版
31
第三章 第五节
ppt精选版
Y 01P2D P 3P I 2 U
ppt精选版
5
二、多元总体线性回归模型 总体模型: 1、分量式:
Y i 0 1 X 1 i 2 X 2 i k X k u ii
2、总量式
Y 01X 1 ppt精选版2X 2 kX k 6U
称 之 为 变 量 Y 关 于 变 量 X1, X2, …, Xk的k元总体线性回 归模型,Y称为被解释变量 ,X1, X2, …, Xk称为解释变 量,k 称为解释变量个数, U 称为随机扰动项,或随机 项,或扰动项。
一、多元总体线性回归模型的矩阵表示
YX βU Y1
Y
Y
2
Yn
1 X 21 X k1
X
1
X 22
04(其他回归模型)多元回归模型及EVIEWS应用基本
cst 1 2 inc t 3 ut
试以此说明如何用软件进行非线性回归参数估 计。
15
EViews进行非线性回归模型参数估计步骤
建立工作文件(cs_inc.wfl) 建立序列对象,录入数据 为了确定初始值,可利用降维法确定参数初 始值,为此令b3=1,建立线性回归模型,创 建线性方程对象,用OLS法估计参数作为非 线性回归的初始值,此为 b1,b2,b3:449.07,0.7345,1 建立非线性回归模型对象
36
1990年前后的中国居民的总储蓄-收入数据
年份 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 储蓄 281 399.5 523.7 675.4 892.5 1214.7 1622.6 2237.6 3073.3 3801.5 5146.9 7034.2 GNP 4038.2 4517.8 4860.3 5301.8 5957.4 7206.7 8989.1 10201.4 11954.5 14922.3 16917.8 18598.4 年份 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 储蓄 9107 11545.4 14762.4 21518.8 29662.3 38520.8 46279.8 53407.5 59621.8 64332.4 73762.4 GNP 21662.5 26651.9 34560.5 46670 57494.9 66850.5 73142.7 76967.2 80579.4 88228.1 94346.4
计量经济学课件:第三章 多元线性回归模型
第三章 多元线性回归模型第一节 多元线性回归模型及基本假定问题:只有一个解释变量的线性回归模型能否满足分析经济问题的需要?简单线性回归模型的主要缺陷是:把被解释变量Y 看成是解释变量X 的函数是前提是,在其它条件不变的情况下,并且,所有其它影响Y 的因素都应与X 不相关,但这在实际情况中很难满足。
怎样在一元线性回归的基础上引入多元变量的回归? 看教科书第72—73页关于汽车销售量的影响因素的讨论。
一、多元线性回归模型的意义1、建立多元线性回归模型的意义,即一元线性回归模型的缺陷,多个主要影响因素的缺失对模型的不利影响。
在一元线性回归模型中,如果总体回归函数的设定是正确的,那么,根据样本数据得到的样本回归模型就应该有较好的拟合效果,这时,可决系数就应该较大。
相反,如果在模型设定时忽略了影响被解释变量的某些重要因素,拟合效果可能就会较差,此时可决系数会偏低,并且由于忽略了一些重要变量而对误差项的影响会加大,这时误差项会表现出一些违背假定的情况。
2、从一个解释变量到多个解释变量的演变。
一个生产函数的例子,一个商品需求函数的例子,(教材第74页)。
二、多元线性回归模型及其矩阵表示1、一般线性回归模型的数学表达式。
设 12233i ii k k ii Y XXXu ββββ=+++++i=1,2,3,…,n在模型表达式里,1β仍是截距项,它反映的是当所有解释变量取值为零时,被解释变量Y 的取值;j β(j=2,3,…,k )为斜率系数,它的经济含义:在其它变量不变的情况下,第j 个解释变量每变动一个单位,Y 平均增加(或减少)j β个单位,这就是所谓的运用边际分析法对多元变量意义下回归参数的解释。
因此,称j β为偏回归系数,它反映了第j 个解释变量对Y 的边际影响程度。
4、2、总体回归函数,即12233(|)i i i k ki E Y X X X X ββββ=++++3、样本回归函数,即12233ˆˆˆˆˆi i k k iY X X Xββββ=++++ 4、将n 个样本观测值代入上述表达式,可得到从形式上看,像似方程组的形式。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.2.2 赤池信息准则和施瓦茨准则
为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准
还有赤池信息准则 ( Akaike information criterion,AIC ) 和施瓦茨准则 (
Schwarz criterion,SC),其定义分别为
这两个准则均要求仅当所增加的解释变量能够减少AIC或SC值时才能在原 模型中增加该解释变量。
借助于计量经济软件EViews对表3.1.1中的样本回归方程作F检验。
F 统计量的值: F =146.2973 , n =18 , n-k-1=18-2-1=15 ,在 5% 的显著性
水平下,查自由度为(2,15)的F分布表,得临界值
3.2.4 回归参数的显著性检验:t检验
回归参数的显著性检验,目的在于检验当其他解释变量不变时,该回归系数 对应的解释变量是否对因变量有显著影响。 由参数估计量的分布性质可知,回归系数的估计量服从如下正态分布:
3.2.3 偏相关系数
3.2.3 回归模型的总体显著性检验:F检验
回归模型的总体显著性检验,旨在对模型中被解释变量与解释变量之间 的线性关系在总体上是否显著成立作出推断。 检验模型中被解释变量与解释变量之间的线性关系在总体上是否显著成 立,即是检验方程:
图3.2.1 阴影部分为F检验的否定区域
F 检验的具体步骤为:
一般地,估计线性模型时可对模型参数施加若干个线性约束条件。例如, 对模型
其中
式中第二项为一非负标量,于是
式(3.5.9)表明受约束样本回归模型的残差平方和大于无约束样本回归模型
的残差平方和,这意味着,通常情况下,对模型施加约束条件会降低模型的解 释能力。
约束条件的个数。
表3.5.1 无约束条件的C-D生产函数估计结果
内容:
(1)残差分布表中,各期残差是否大都落在±的虚线框内,这直观地 反映了模型拟合误差的大小及变化情况。 (2)残差分布是否具有某种规律性,即是否存在着系统误差。 (3)近期残差的分布情况。 另外,利用判定系数比较模型的拟合优度时,如果两个模型包含的解 释变量个数不同,则应采用“调整的判定系数”。 除了调整的判定系数之外,人们还使用另外两个指标 SC ( Schwarz Criterion ,施瓦兹准则)和 AIC(Akaike lnformation Criterion ,赤池 信息准则)来比较含有不同解释变量个数模型的拟合优度。
多重决定系数或决定系数是指解释变差占总变差的比重,用来表述解
释变量对被解释变量的解释程度:
2.修正的决定系数
(1)用自由度调整后,可以消除拟合优度评价中解释变量多少对决定系数计 算的影响; (2)对于包含的解释变量个数不同的模型,可以用调整后的决定系数直接比 较它们的拟合优度的高低。
修正的决定系数与未经修正的多重决定系数之间有如下关系:
在 EViews 软 件 中 , 要 检 验 冗 余 变 量 , 选 择 Equation 工 具 栏 中 的
View\Coefficient Test\Redundant Variable 功能。在对话框中输入需要 检验的变量。 Testadd 检验用于在方程中检验引入新的解释变量,检验引入引入新 的解释变量是否对模型有利。要检验缺失变量,选择Equation工具栏中的 View\Coefficient Test\Omitted 验的变量。 Variable功能。在对话框中输入需要检
图3.5.1 Wald检验定义对话框
在对话框中输入系数的约束条件,若有多个,则用逗号分开。本例中 输入:C(2)+C(3)=1,得检验结果见表3.5.3。 表3.5.3 Wald检验输出结果
由表3.5.3可知,在0.05显著性水平下,两个检验均仍然不能拒绝和为 1的原假设,原假设为真。这个结果与直观判断差异明显,主要是因为变量 LOG(L)的回归系数标准误差较大。
GDP 4517.8 4862.4 5294.7 5934.5 7171.0 8964.4 10202.2
L 42361 43725 45295 46436 48197 49873 51282
K 910.9 961.0 1230.4 1430.1 1832.9 2543.2 3120.6
年份 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003
GDP 11962.5 14928.3 16909.2 18547.9 21617.8 26638.1 34634.4 46759.4 58478.1 67884.6 74462.6 78345.2 82067.5 89442.2 95933.3 102398.0 117251.9
L 52783 54334 55329 63909 64799 65554 66373 67199 67947 68850 69600 69957 71394 72085 73025 73740 74432
借助于计量经济软件EViews对表3.1.1进行分析,具体步骤为 (1)建立工作文件;(2)输入数据;(3)回归分析 表3.1.2 回归结果
2.最小二乘估计量的性质
用最小二乘法得到的多元线性回归的参数估计量具有线性、无偏性、最小 方差性。
3.1.4 随机误差项方差的估计
若记
3.2 多元线性回归模型的检验
将上述过程用矩阵表示如下:
根据矩阵求导法则可得:
例 3.1.1 经过研究,发现家庭书刊消费水平受家庭收入及户主受教
育年数的影响。现对某地区的家庭进行抽样调查,得到样本数据如表3.1.1 所示,其中y表示家庭书刊消费水平(元/年),x表示家庭收入(元/月),T 表示户主受教育年数。下面我们估计家庭书刊消费水平同家庭收入、户主受
3.2.1 拟合优度检验
拟合优度是指样本回归直线与观测值之间的拟合程度。 1.多重决定系数
总离差平方和=残差平方和+ 回归平方和 自由度: (n-1)= (n-k-1)+ k ESS:由回归直线(即解释变量)所解释的部分,表示x对y的线性影响。 RSS:是未被回归直线解释的部分,由解释变量x对y影响以外的因素而造成的。
表3.5.2 有约束条件的C-D生产函数估计结果
在EViews软件中,当估计完C-D生产函数后,在方程结果输出窗口,点击View 按 钮 , 然 后 在 下 拉 菜 单 中 选 择 Coefficient Test\Wald Coefficient Restrictions,屏幕出现图3.5.1对话框。
K 3791.7 4753.8 4410.4 4517.0 5594.5 8080.1 13072.3 17042.1 20019.3 22913.5 24941.1 28406.2 29854.7 32917.7 37213.5 43499.9 55566.6
利用EViews软件解题如下:首先建立工作文件,其次输入样本 数据Q、L、K,再次,在EViews软件的命令窗口,依次键入: GENR lnGDP=LOG(GDP) GENR lnL=LOG(L) GENR lnK=LOG(K)
例3.4.1ຫໍສະໝຸດ 根据表3.4.1给出的1980-2003年间总产出(用国内生产
总值 GDP 度量,单位:亿元 ) ,劳动投入 L( 用从业人员度量,单位 为万人 ),以及资本投入 K( 用全社会固定投资度量,单位:亿元 )。 表3.4.1 1980-2003年中国GDP、劳动投入与资本投入数据
年份 1980 1981 1982 1983 1984 1985 1986
3.3.2 区间预测
3.4 非线性回归模型
3.4.1 可线性化模型
在非线性回归模型中,有一些模型经过适当的变量变换或函数变换就可 以转化成线性回归模型,从而将非线性回归模型的参数估计问题转化成线性 回归模型的参数估计,称这类模型为可线性化模型。 1.对数模型 模型形式:
模型适用对象:对观测值取对数,将取对数后的观测值(lnx,lny)描成散点 图,如果近似为一条直线,则适合于对数线性模型来描述x与y的变量关系。 容易推广到模型中存在多个解释变量的情形。例如,柯布——道格拉斯生产函数 形式:
回归函数的未知参数,就得到多元线性样本回归方程:
它代表了总体变量间的依存规律。
3.1.2
多元线性回归模型的基本假定
假设6: 解释变量之间不存在多重共线性
假设1用矩阵形式表示:
3.1.3 多元线性回归模型的估计
1.参数的最小二乘估计
即:
上述(k+1)个方程称为正规方程。用矩阵表示就是:
LS lnGDP
输出结果如下(表3.4.2):
C lnL lnK
表3.4.2 回归结果
2.半对数模型
在对经济变量的变动规律研究中,测定其增长率或衰减率是一个重要
方面。在回归分析中,我们可以用半对数模型来测度这些增长率。 模型形式:
3.倒数模型
4.多项式模型
多项式回归模型在生产与成本函数这个领域中被广泛地使用。多项式回归模 型可表示为
教育年数之间的线性关系。
表3.1.1 某地区家庭书刊消费水平及影响因素的调查数据表
t
家庭书刊消费 y 450.0
家庭收入 x 1027.2
户主受教育年数 T 8
507.7
613.9 563.4 501.5 781.5 541.8 611.1 1222.1 793.2 660.8 792.7 580.8 612.7 890.8 1121.0 1094.2 1253.0
1045.2
1225.8 1312.2 1316.4 1442.4 1641.0 1768.8 1981.2 1998.6 2196.0 2105.4 2147.4 2154.0 2231.4 2611.8 3143.4 3624.6