第三章 回归模型的检验

合集下载

第三章 一元线性回归模型

第三章  一元线性回归模型

第三章 一元线性回归模型一、预备知识(一)相关概念对于一个双变量总体,若由基础理论,变量和变量之间存在因果),(i i x y x y 关系,或的变异可用来解释的变异。

为检验两变量间因果关系是否存在、x y 度量自变量对因变量影响的强弱与显著性以及利用解释变量去预测因变量x y x ,引入一元回归分析这一工具。

y 将给定条件下的均值i x i yi i i x x y E 10)|(ββ+=(3.1)定义为总体回归函数(PopulationRegressionFunction,PRF )。

定义为误差项(errorterm ),记为,即,这样)|(i i i x y E y -i μ)|(i i i i x y E y -=μ,或i i i i x y E y μ+=)|(i i i x y μββ++=10(3.2)(3.2)式称为总体回归模型或者随机总体回归函数。

其中,称为解释变量x (explanatory variable )或自变量(independent variable );称为被解释y 变量(explained variable )或因变量(dependent variable );误差项解释μ了因变量的变动中不能完全被自变量所解释的部分。

误差项的构成包括以下四个部分:(1)未纳入模型变量的影响(2)数据的测量误差(3)基础理论方程具有与回归方程不同的函数形式,比如自变量与因变量之间可能是非线性关系(4)纯随机和不可预料的事件。

在总体回归模型(3.2)中参数是未知的,是不可观察的,统计计10,ββi μ量分析的目标之一就是估计模型的未知参数。

给定一组随机样本,对(3.1)式进行估计,若的估计量分别记n i y x i i ,,2,1),,( =10,),|(ββi i x y E 为,则定义3.3式为样本回归函数^1^0^,,ββi y ()i i x y ^1^0^ββ+=n i ,,2,1 =(3.3)注意,样本回归函数随着样本的不同而不同,也就是说是随机变量,^1^0,ββ它们的随机性是由于的随机性(同一个可能对应不同的)与的变异共i y i x i y x 同引起的。

第三章 多元线性回归模型 知识点

第三章 多元线性回归模型 知识点

第三章 多元线性回归模型一、知识点列表二、关键词1、多元线性回归模型的代数和矩阵表示形式 关键词: 多元线性总体回归模型多元线性总体回归模型是指被解释变量y 与多个解释变量12,,,n x x x 之间具有线性关系,是解释变量的多元线性函数。

可以表达为:01122(1,2,3,,)i i i k ki iy x x x i n ββββμ=++++=多元线性回归模型相对于一元线性回归模型来说,其解释变量较多,因而计算公式比较复杂。

必要时需要借助计算机来进行。

2、多元线性回归模型的基本假设 关键词: 线性于参数总体回归模型是关于参数是线性的,因此称其为线性于参数。

关键词:完全共线性在样本中,没有一个自变量是常数,自变量之间也不存在严格(完全)的线性关系。

如果方程中有一个自变量是其他自变量的线性组合,那么我们说这个模型遇到了完全共线性问题。

关键词:零条件数学期望给定解释变量的任何值,误差的期望值为零,即:12(|,,,)0n E u x x x =。

关键词:内生解释变量和外生解释变量如果解释变量满足零条件数学期望,则称该自编为内生解释变量;反之,则为外生解释变量。

关键词:同方差对于解释变量的所有观测值,随机误差项有相同的方差,即:22()(),(1,2,3,,)i i Var u E u i n δ===关键词:无序列相关性随机误差项两两不相关。

即(,)(,)0,(,,1,2,3,,)i i i i Cov u u E u u i j i j n ==≠=关键词:最优线性无偏估计量满足以下假设条件的OLS 估计量称为最优线性无偏估计量:(1)线性与参数;(2)X 固定;(3)X 有变异;(4)不存在完全共线性;(5)零条件数学期望;(6)同方差;(7)无序列相关性。

关键词:经典正态线性回归模型如果回归模型的OLS 估计量为最优线性无偏估计量,并且随机误差项u 服从均值为零,方差为2δ的正态分布,则称该线性回归模型为经典正态线性回归模型。

第三章--回归模型的检验

第三章--回归模型的检验
F F(k,n-k-1) 或 FF(k,n-k-1) 来拒绝或接受原假设H0,以判定原方程总体上的 线性关系是否显著成立。
对于中国居民人均消费支出的例子:
一元模型:F=285.92
二元模型:F=2057.3 给定显著性水平 =0.05,查分布表,得到临界 值:
一元例:F(1,21)=4.32 二元例: F(2,19)=3.52 显然有 F F(k,n-k-1) 即二个模型的线性关系在95%的水平下显著成立。
99.4
96.9
2758.9
1637.2
157.0
117.7
1999 4615.9 1932.1
98.7
95.7
2723.0
1566.8
169.5
123.3
2000 4998.0 1958.3
100.8
97.6
2744.8
1529.2
182.1
128.1
2001 5309.0 2014.0
100.7
2、关于拟合优度检验与方程显著性检
验关系的讨论

R2 1 RSS
TSS

F
ESS / k
RSS / n k
1
可推出: R2
kF
n k 1 kF

F
R2 / k
1 R2 / n k 1
三、变量的显著性检验(t检验)
方程的总体线性关系显著每个解释变量对被 解释变量的影响都是显著的
因此,必须对每个解释变量进行显著性检验, 以决定是否作为解释变量被保留在模型中。
问题:
由增加解释变量个数引起的R2的增大与拟合 好坏无关,R2需调整。
调整的可决系数(adjusted coefficient of determination)

第三章多元线性回归模型(stata)

第三章多元线性回归模型(stata)

一、邹式检验(突变点检验、稳定性检验)1.突变点检验1985—2002年中国家用汽车拥有量(t y ,万辆)与城镇居民家庭人均可支配收入(t x ,元),数据见表。

表 中国家用汽车拥有量(t y )与城镇居民家庭人均可支配收入(t x )数据年份 t y (万辆) t x (元)年份 t y (万辆) t x (元)1985 1994 1986 1995 4283 1987 1996 1988 1997 1989 1998 1990 1999 5854 1991 2000 6280 1992 2001 19932002下图是关于t y 和t x 的散点图:从上图可以看出,1996年是一个突变点,当城镇居民家庭人均可支配收入突破元之后,城镇居民家庭购买家用汽车的能力大大提高。

现在用邹突变点检验法检验1996年是不是一个突变点。

:两个字样本(1985—1995年,1996—2002年)相对应的模型回归参数相等HH:备择假设是两个子样本对应的回归参数不等。

1在1985—2002年样本范围内做回归。

在回归结果中作如下步骤(邹氏检验):1、 Chow 模型稳定性检验(lrtest)用似然比作chow检验,chow检验的零假设:无结构变化,小概率发生结果变化* 估计前阶段模型* 估计后阶段模型* 整个区间上的估计结果保存为All* 用似然比检验检验结构没有发生变化的约束得到结果如下;(如何解释)2.稳定性检验(邹氏稳定性检验)以表为例,在用1985—1999年数据建立的模型基础上,检验当把2000—2002年数据加入样本后,模型的回归参数时候出现显著性变化。

* 用F-test作chow间断点检验检验模型稳定性* chow检验的零假设:无结构变化,小概率发生结果变化* 估计前阶段模型* 估计后阶段模型* 整个区间上的估计结果保存为All* 用F 检验检验结构没有发生变化的约束*计算和显示 F 检验统计量公式,零假设:无结构变化然后 dis f_test 则 得到结果;* F 统计量的临界概率然后 得到结果* F 统计量的临界值然后 得到结果(如何解释)二、似然比(LR )检验有中国国债发行总量(t DEBT ,亿元)模型如下:0123t t t t t DEBT GDP DEF REPAY u ββββ=++++其中t GDP 表示国内生产总值(百亿元),t DEF 表示年财政赤字额(亿元),t REPAY 表示年还本付息额(亿元)。

(完整版)第三章(多元线性回归模型)3-3答案

(完整版)第三章(多元线性回归模型)3-3答案

3.3 多元线性回归模型的检验一、判断题1、在线性回归模型中,为解释变量或者被解释变量重新选取单位(比如,元变换成千元),会影响t 统计量和 2R 的数值。

( F )2、在多元线性回归中,t 检验和F 检验缺一不可。

( T )3、回归方程总体线性显著性检验的原假设是模型中所有的回归参数同时为零。

( F )4、多元线性回归中,可决系数2R 是评价模型拟合优度好坏的最佳标准。

( F )二 、单项选择1、在模型0112233t t t t t Y X X X ββββμ=++++的回归分析结果中,有462.58F =,0.000000F p =的值,则表明 ( C )A 、解释变量2t X 对t Y 的影响不显著B 、解释变量1t X 对t Y 的影响显著C 、模型所描述的变量之间的线性关系总体上显著D 、解释变量2t X 和1t X 对t Y 的影响显著2、设k 为回归模型中的实解释变量的个数,n 为样本容量。

则对回归模型进行总体显著性 检验(F 检验)时构造的F 统计量为 ( A )A 、1)ESS k F RSS n k =--B 、(1)()ESS k F RSS n k -=- C 、ESS F RSS = D 、1RSS F TSS=- 3、在多元回归中,调整后的可决系数2R 与可决系数2R 的关系为 ( A ) A 、22R R < B 、22R R >C 、22R R =D 、2R 与2R 的关系不能确定4、根据调整的可决系数2R 与F 统计量的关系可知,当21R =时,有 ( C )A 、F=0B 、F=-1C 、F →+∞D 、F=-∞5、下面哪一表述是正确的 ( D ) A 、线性回归模型01i i i Y X ββμ=++的零均值假设是指110ni i n μ==∑ B 、对模型01122i i i i Y X X βββμ=+++进行方程显著性检验(即F 检验),检验的零假 设是0012:0H βββ===C 、相关系数较大意味着两个变量存在较强的因果关系D 、当随机误差项的方差估计量等于零时,说明被解释变量与解释变量之间为函数关系5、对于01122ˆˆˆˆi i i k ki iY X X X e ββββ=+++++…,如果原模型满足线性模型的基本假设则 在零假设0j β=下,统计量ˆˆ()j j s ββ(其中ˆ()js β是j β的标准误差)服从 (B )A 、()t n k -B 、(1)t n k --C 、(1,)F k n k --D 、(,1)F k n k --6、在由的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重可决系数为0.8500,则调整后的多重可决系数为( D )A 、8603B 、 0.8389C 、0.8655D 、0.83277、可决系数R 2=0.8,说明回归直线能解释被解释变量总变差的:( A )A 、 80%B 、 64%C 、 20%D 、 89%8、线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中,检验0:0(0,1,2,...)t H b i k ==时,所用的统计量服从( C )A.t(n-k+1)B.t(n-k-2)C.t(n-k-1)D.t(n-k+2)三、多项选择题1、对模型满足所有假定条件的模型01122i i i i Y X X βββμ=+++进行总体显著性检验,如果检验结果总体线性关系显著,则很可能出现 ( BCD )A 、120ββ==B 、120,0ββ≠=C 、120,0ββ≠≠D 、120,0ββ=≠E 、120,0ββ==2、设k 为回归模型中的参数个数(包含截距项)则总体线性回归模型进行显著性检验时所 用的F 统计量可以表示为 ( BC )A 、()()()∑∑---1k e k n Y Y 2i 2i i //ˆ B 、()()()∑∑---k n e 1k Y Y 2i2ii //ˆ C 、()()()k n R 11k R 22---// D 、()()()1k R k n R 122---// 30n =E 、()()()1k R 1k n R 22---// 3、在多元回归分析中,调整的可决系数2R 与可决系数2R 之间 ( AD )A 、22R R <B 、22R R ≥C 、2R 只可能大于零D 、2R 可能为负值E 、2R 不可能为负值四、简答题1.在多元线性回归分析中,为什么用修正的可决系数衡量估计模型对样本观测值的拟合优度?答:因为人们发现随着模型中解释变量的增多,多重可决系数2R 的值往往会变大,从而增加了模型的解释功能。

5、计量经济学【多元线性回归模型】

5、计量经济学【多元线性回归模型】

二、多元线性回归模型的参数估计
2、最小二乘估计量的性质 当 ˆ0, ˆ1, ˆ2, , ˆk 为表达式形式时,为随机变量, 这时最小二乘估计量 ˆ0, ˆ1, ˆ2, , ˆk 经过证明同样也 具有线性性、无偏性和最小方差性(有效性)。 也就是说,在模型满足那几条基本假定的前提 下,OLS估计量具有线性性、无偏性和最小方差性 (有效性)这样优良的性质, 即最小二乘估计量
用残差平方和 ei2 最小的准则: i
二、多元线性回归模型的参数估计
1、参数的普通最小二乘估计法(OLS) 即:
min ei2 min (Yi Yˆi )2 min Yi (ˆ0 ˆ1X1i ˆ2 X 2i ˆk X ki )2
同样的道理,根据微积分知识,要使上式最小,只 需求上式分别对 ˆj ( j 0,1, k) 的一阶偏导数,并令 一阶偏导数为 0,就可得到一个包含 k 1 个方程的正 规方程组,这个正规方程组中有 k 1个未知参数 ˆ0, ˆ1, ˆ2, , ˆk ;解这个正规方程组即可得到这 k 1 个参数 ˆ0, ˆ1, ˆ2, , ˆk 的表达式,即得到了参数的最小 二乘估计量;将样本数据代入到这些表达式中,即可 计算出参数的最小二乘估计值。
该样本回归模型与总体回归模型相对应,其中残差 ei Yi Yˆi 可看成是总体回归模型中随机误差项 i 的 估计值。
2、多元线性回归模型的几种形式: 上述几种形式的矩阵表达式: 将多元线性总体回归模型 (3.1) 式表示的 n 个随机方 程写成方程组的形式,有:
Y1 0 1 X11 2 X 21 .Y.2.........0.......1.X...1.2........2.X...2.2. Yn 0 1 X1n 2 X 2n
ˆ0, ˆ1, ˆ2, , ˆk 是总体参数真值的最佳线性无偏估计 量( BLUE );即高斯—马尔可夫定理 (GaussMarkov theorem)。

计量第三章答案

计量第三章答案

第三章 一元经典线性回归模型的基本假设与检验问题TSS,RSS,ESS 的自由度如何计算?直观含义是什么?答:对于一元回归模型,残差平方和RSS 的自由度是(2)n -,它表示独立观察值的个数。

对于既定的自变量和估计量1ˆβ和2ˆβ,n 个残差2ˆˆˆi i i iu Y X ββ=-- 必须满足正规方程组。

因此,n 个残差中只有(2)n -个可以“自由取值”,其余两个随之确定。

所以RSS 的自由度是(2)n -。

TSS 的自由度是(1)n -:n 个离差之和等于0,这意味着,n 个数受到一个约束。

由于TSS=ESS+RSS ,回归平方和ESS 的自由度是1。

为什么做单边检验时,犯第一类错误的概率的评估会下调一半?答:选定显著性水平α之后,对应的临界值记为/2t α,则双边检验的拒绝区域为/2||t t α≥。

单边检验时,对参数的符号有先验估计,拒绝区域变为/2t t α≥或/2t t α≤-,故对犯第I 类错误的概率的评估下下降一半。

常常把高斯-马尔科夫定理简述为:OLS 估计量具有BULE 性质,其含义是什么? 答:含义是:(1)它是线性的(linear ):OLS 估计量是因变量的线性函数。

(2)它是无偏的(unbiased ):估计量的均值或数学期望等于真实的参数。

比如22ˆ()E ββ=。

(3)它是最优的或有效的(Best or efficient ):如果存在其它线性无偏的估计量,其方差必定大于OLS 估计量的方差。

做显著性检验时,针对的是总体回归函数(PRF )的系数还是样本回归函数(SRF )的系数?为什么?答:做显著性检验时,针对的是总体回归函数(SRF )的系数。

总体回归函数是未知的,也是研究者所关心的,所以只能利用样本回归函数来推测总体回归函数,后者是利用样本数据计算所得,是已知的,无需检验。

(习题)以下陈述正确吗?不论正确与否,请说明理由。

(1)X 值越接近样本均值,斜率的OLS 估计值就越精确。

计量经济学第三章第3节多元线性回归模型的显著性检验

计量经济学第三章第3节多元线性回归模型的显著性检验

ˆ b ˆ X b ˆY ˆ b Y t 0 1 t 2 t 1 ˆ b ˆ X b ˆ Y b ˆY ˆ b Y
t 0 1 t 2 t 1
3 t 2
其中t为当前期变量,t-k称为k期滞后变量。
1) 使用软件估计模型
将之前已经建立的Workfile文件打开 点击菜单中的“Quick”→“Estimate Equations”
2
2
2
*赤池信息准则和施瓦茨准则
• 为了比较所含解释变量个数不同的多元回归模型的 拟合优度,常用的标准还有: 赤池信息准则(Akaike information criterion, AIC) e e 2( k 1) AIC ln n n 施瓦茨准则(Schwarz criterion,SC)
Yi b0 b1 X1i b2 X 2i bk X ki ui
样本回归方程为:
ˆ b ˆ X b ˆ X b ˆ X ˆ b Y i 0 1 1i 2 2i k ki
我们将Yi与其平均值Y之间的离差分解如下 ˆ ) (Y ˆ Y ) Y Y (Y Y
B)调整后的拟合优度(样本决定系数)
RSS n k 1 n 1 RSS R 1 1 TSS n 1 n k 1 TSS n 1 2 2 即,R 1 ( 1 R ) n k 1
2
说明:
n 1 “ ”与“1-R 2? 一增一减,此消彼长 n k 1 从而保证R 2不会随解释变量个数的变化产生大的波动。
在对话框中输入:
y c x y(-1)
y c x y(-1) y(-2)
字母之间用空格分隔。 注:滞后变量不需重新形成新的时间序列,软件 自动运算实现,k期滞后变量,用y(-k)表示。

多元线性回归模型

多元线性回归模型
假定4:随机扰动项与解释变量不相关
2 i= j
0 (i j )
Cov( X ji , ui ) 0
j 2,3,, k
假定5:无多重共线性假定
(多元特有)
假定各解释变量之间不存在线性关系,或各个
解释变量观测值之间线性无关。或解释变量观
测值矩阵 X列满秩(k 列)。
Rank ( X ) k
即 X X 可逆 假定6:正态性假定
Rank ( X X ) K
ui ~ N (0, σ )
2
第二节 多元线性回归模型的估计
本节基本内容:
● 普通最小二乘法(OLS) ● OLS估计式的性质
2 ● OLS估计的分布性质
● 随机扰动项方差 的估计
● 回归系数的区间估计
一、普通最小二乘法(OLS)
Y 的总体条件均值表示为多个解释变量的函数
E(Yi X 2i , X 3i ,..., X ki ) 1 2 X 2i 3 X3i ... k X ki
总体回归函数也可表示为:
Yi 1 2 X 2i 3 X 3i ... k X ki ui
Y
Y
n 1
矩阵形式
X
nk
β
k 1
Y X U
u
n 1
总体回归函数 E(Y) = Xβ ˆ 样本回归函数 Y ˆ = Xβ
或 Y = Xβ + u ˆ +e 或 Y = Xβ
ˆ 其中: 都是有 n 个元素的列向量 Y,Y,u,e
ˆ 是有 k 个元素的列向量 β, β
X 是第一列为1的n
取值为1)
二、多元线性回归中的基本假定
假定1:零均值假定 E(ui ) 0 ( i 1,2,, n) 或

计量经济学第三章第3节多元线性回归模型的显著性检验

计量经济学第三章第3节多元线性回归模型的显著性检验
2
当增加一个对被解释变量有较大影响的解释变量时, 残差平方和减小的比n-k-1 减小的更显著,拟合优度 就增大,这时就可以考虑将该变量放进模型。 如果增加一个对被解释变量没有多大影响的解释变量, 残差平方和减小没有n-k-1减小的显著,拟合优度会减 小,其说明模型中不应该引入这个不重要的解释变量, 可以将其剔除。
在对话框中输入:
y c x y(-1)
y c x y(-1) y(-2)
字母之间用空格分隔。 注:滞后变量不需重新形成新的时间序列,软件 自动运算实现,k期滞后变量,用y(-k)表示。
• 使用k期滞后变量,数据将损失k个样本观察值, 例如:
序号 2000 2001 2002 2003 2004 2005 2006 2007 2008 y 3 4 5 6 7 8 9 10 11 Y(-1) Y(-2) Y(-3)
2
2
2
*赤池信息准则和施瓦茨准则
• 为了比较所含解释变量个数不同的多元回归模型的 拟合优度,常用的标准还有: 赤池信息准则(Akaike information criterion, AIC) e e 2( k 1) AIC ln n n 施瓦茨准则(Schwarz criterion,SC)
一元、二元模型的系数均大于0,符合经济意义,三元模型 系数的符号与经济意义不符。 用一元回归模型的预测值是1758.7,二元回归模型的预测值 是1767.4,2001年的实际值是1782.2。一元、二元模型预测 的绝对误差分别是23.5、14.8。
3) 三个模型的拟合优度与残差
二元:R2 =0.9954,E2 ei2 13405 三元:R2 =0.9957,E3 ei2 9707
746.5 788.3

第三章 多元回归模型

第三章 多元回归模型
其计算公式如下:
r0i,12i1i1k
r r r 0i,12i1i1k 1 0k ,12k 1 ik ,12i1i1k 1
1 r02k,12k1
1
r2
ik ,12i1i1k
1
问题:在多元回归中 r12(i1)(i1)k ,0 是越大越好,
还是越小越好?
17
模型显著性检验(F检验): F统计量
核心思想:残差平方和最小准则
min ei2 min yi yˆi 2
min yi ˆ0 ˆ1x1i ˆ2x2i ˆk xki 2
求解原理
ei2
ˆ j
0
结论
j 0,1,2,, k
ˆ X ' X 1 X 'Y
8
例子
经过研究,发现家庭书刊消费水平受家庭 收入及户主教育年数的影响。现对某地区 的家庭进行抽样调查,得到的样本数据如 表所示,其中 y 表示家庭书刊消费水平
其中,n k 1为 ei2 的自由度,n 1 为 yi y2
的自由度
引入修正的样本决定系数R 2的作用:
用自由度调整后,可以消除拟合优度评价中解释变量多 少对决定系数计算的影响
对于包含的解释变量个数不同的模型,可以用调整后的 决定系数直接比较它们的拟合优度的高低,但不能用原 来未调整的决定系数来比较
零阶偏相关系数、一阶偏相关系数、k 1 阶偏相关系数
r01 为零阶偏相关系数、 r02,1 称为一阶偏相关系数、 r01,23 称
为二阶偏相关系数、r01,234 称为三阶偏相关系数,依此类推
16
偏相关系数:一般公式
一般地,在研究多个变量的偏相关系数时,因变量 y
与解释变量 xi i 1,2,, k 的k 1 阶偏相关系数时,

第三章(多元线性回归模型)3-3答案

第三章(多元线性回归模型)3-3答案

3.3 多元线性回归模型的检验一、判断题1、在线性回归模型中,为解释变量或者被解释变量重新选取单位(比如,元变换成千元),会影响t 统计量和 2R 的数值。

( F )2、在多元线性回归中,t 检验和F 检验缺一不可。

( T )3、回归方程总体线性显著性检验的原假设是模型中所有的回归参数同时为零。

( F )4、多元线性回归中,可决系数2R 是评价模型拟合优度好坏的最佳标准。

( F )二 、单项选择1、在模型0112233t t t t t Y X X X ββββμ=++++的回归分析结果中,有462.58F =,0.000000F p =的值,则表明 ( C )A 、解释变量2t X 对t Y 的影响不显著B 、解释变量1t X 对t Y 的影响显著C 、模型所描述的变量之间的线性关系总体上显著D 、解释变量2t X 和1t X 对t Y 的影响显著2、设k 为回归模型中的实解释变量的个数,n 为样本容量。

则对回归模型进行总体显著性 检验(F 检验)时构造的F 统计量为 ( A )A 、1)ESS k F RSS n k =--B 、(1)()ESS k F RSS n k -=- C 、ESS F RSS = D 、1RSS F TSS=- 3、在多元回归中,调整后的可决系数2R 与可决系数2R 的关系为 ( A ) A 、22R R < B 、22R R >C 、22R R =D 、2R 与2R 的关系不能确定4、根据调整的可决系数2R 与F 统计量的关系可知,当21R =时,有 ( C )A 、F=0B 、F=-1C 、F →+∞D 、F=-∞5、下面哪一表述是正确的 ( D ) A 、线性回归模型01i i i Y X ββμ=++的零均值假设是指110ni i n μ==∑ B 、对模型01122i i i i Y X X βββμ=+++进行方程显著性检验(即F 检验),检验的零假 设是0012:0H βββ===C 、相关系数较大意味着两个变量存在较强的因果关系D 、当随机误差项的方差估计量等于零时,说明被解释变量与解释变量之间为函数关系5、对于01122ˆˆˆˆi i i k ki iY X X X e ββββ=+++++…,如果原模型满足线性模型的基本假设则 在零假设0j β=下,统计量ˆˆ()j j s ββ(其中ˆ()js β是j β的标准误差)服从 (B )A 、()t n k -B 、(1)t n k --C 、(1,)F k n k --D 、(,1)F k n k --6、在由的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重可决系数为0.8500,则调整后的多重可决系数为( D )A 、8603B 、 0.8389C 、0.8655D 、0.83277、可决系数R 2=0.8,说明回归直线能解释被解释变量总变差的:( A )A 、 80%B 、 64%C 、 20%D 、 89%8、线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中,检验0:0(0,1,2,...)t H b i k ==时,所用的统计量 服从( C )A.t(n-k+1)B.t(n-k-2)C.t(n-k-1)D.t(n-k+2)三、多项选择题1、对模型满足所有假定条件的模型01122i i i i Y X X βββμ=+++进行总体显著性检验,如果检验结果总体线性关系显著,则很可能出现 ( BCD )A 、120ββ==B 、120,0ββ≠=C 、120,0ββ≠≠D 、120,0ββ=≠E 、120,0ββ==2、设k 为回归模型中的参数个数(包含截距项)则总体线性回归模型进行显著性检验时所 用的F 统计量可以表示为 ( BC )A 、()()()∑∑---1k e k n Y Y 2i 2i i //ˆ B 、()()()∑∑---k n e 1k Y Y 2i2ii //ˆ C 、()()()k n R 11k R 22---// D 、()()()1k R k n R 122---// E 、()()()1k R 1k n R 22---// 3、在多元回归分析中,调整的可决系数2R 与可决系数2R 之间 ( AD )A 、22R R <B 、22R R ≥C 、2R 只可能大于零D 、2R 可能为负值E 、2R 不可能为负值四、简答题30n =1.在多元线性回归分析中,为什么用修正的可决系数衡量估计模型对样本观测值的拟合优度?答:因为人们发现随着模型中解释变量的增多,多重可决系数2R 的值往往会变大,从而增加了模型的解释功能。

第3章 多元线性回归模型

第3章 多元线性回归模型

TSS
TSS
该统计量越接近于1,模型的拟合优度越高。
问题:在应用过程中发现,如果在模型中增加一个解 释变量, R2往往增大(Why?)
因为残差平方和往往随着解释变量个数的增加而减少。
这就给人一个错觉:要使得模型拟合得好,只要增加 解释变量即可。—— 但是,现实情况往往是,由增加 解释变量个数引起的R2的增大与拟合好坏无关,因此在 多元回归模型之间比较拟合优度,R2 就不是一个合适 的指标,必须加以调整。
所以,在多元线性回归模型中,依然有
n
n

yi2 ([ Yˆi Y) ei ]2
i 1
i 1
n
n
n
(Yˆi Y)2 ei2 2 e(i Yˆi Y)
i 1
i 1
i 1
n
n
(Yˆi Y)2 ei2
i 1
i 1
(3-20)
TSS ESS RSS
(3-21)
可决系数
R 2 ESS 1 RSS
μ~ N(0, 2I)
假设5,回归模型的设定是正确的。
第二节 多元线性回归模型的 参数估计
任务
模型结构参数 0 、1、2 、L 、k 的估计
随机误差项的方差 2 的估计
方法
普通最小二乘法
内容
一、参数的普通最小二乘估计 二、参数的普通最小二乘估计量的性质 三、普通最小二乘样本回归函数性质 四、随机误差项的方差的普通最小二乘估计 五、样本容量问题
第三章 经典单方程计量经济学模型: 多元线性回归模型
• 多元线性回归模型 • 多元线性回归模型的参数估计 • 多元线性回归模型的统计检验 • 多元线性回归模型的预测
§3.1 多元线性回归模型

计量经济学-第3章(一元线性回归模型)-文档资料

计量经济学-第3章(一元线性回归模型)-文档资料



即:
Yi E (Yi X i ) u i
Yi的变化可以分为两部分,一部分是可以由Xi的变化解释 的,另一部分来自随机扰动。Yi向Xi所解释的“平均水平”回 归,这就是“回归”的含义。而斜率系数β 1是指,Xi每变化一 个单位,Yi平均变化β 1个单位。β 0是样本回归直线的截距。
《计量经济学》,王少平、杨继生、欧阳志刚主编
假定2:解释变量是外生变量。 即
Cov(ui , u j ) 0
i j , i, j 1, 2,
,N
《计量经济学》,王少平、杨继生、欧阳志刚主编 (3.1.5)
二、普通最小二乘法(OLS)
基于假定3,我们对模型(3.1.1)取条件期望,则有: E (Yi X i ) 0 1 X i 3.1.6) (
5
第一步 构造含有待估计系数的残差平方和 并对其求最小
N Q ˆ ˆ X )0 2 ( Y i 0 1 i ˆ N N 0 i 1 2 ˆ ˆ X )u ˆ ˆi min Q u ( Y i i 0 1 i ˆ ˆ N , 1 i 1 Q i2 ˆ ˆ X )X 0 (Y i 3.1.70 i ( ) 1 i ˆ i 1 1


N 就是说,如果我们能得到不同于最小 由于最小二乘估计量拥有一个“好” 即样本容量趋于无穷大时,估计量依 二乘估计量的其他线性无偏估计量, 渐近有效性 的估计量所应具备的有限样本性质, 概率收剑于总体的真实值,即: 其方差大于或者等于最小二乘估计量 ˆ) P lim( 它也拥有大样本特性,即渐近无偏性、 i i 的方差。 一致性、渐近有效性。 即样本容量趋于无穷大时,估计量 其中:符号“ Plim”表示概率极限,因

计量经济学 第三章 模型检验知识讲解

计量经济学 第三章 模型检验知识讲解
计量经济学家发现,越是拟合好的直线,回归 平方和越大、误差平方和越小。用图表示:
目标:越靠近越好!
注意字母的写法不同,含义一样!
例子:Eviews中的计算
(2)模型的显著性检验——F检 验
为什么拟合优度已经很好地描述了数据对模型 的精确程度,还要进行模型的显著性检验—— F检验呢?
在设定计量经济模型的时候,我们往往根据经 验理论和对所研究系统的经验认识,尽量找出 被解释变量的所有影响因素,这些初步选定的 影响因素中间很可能就有一些实际上并不重要
或其影响可以由其他变量代替的变量。为了使 模型更加简单、合理,应该提出这些不重要的 变量,使模型中只保留有显著影响的变量。剔 除不显著的解释变量的方法,就是解释变量的 显著性检验——t检验。
的,否则模型的线性关系不显著。
例子:Eviews中的计算
(3)解释变量的显著性检验—— t检验
如果模型既有很大的判定系数,也通过了模型 的显著性检验,为什么还要进行解释变量的显 著性t检验呢?
这是因为,如果模型通过了F检验,则表明模 型中所有解释变量对被解释变量的“总影响” 是显著的,但这并不同时意味着模型中的每一 个将诶是变量对y都有重要影响,或者说并不 是每个解释变量的单独影响都是显著。
例子:Eviews中的计算
(4)参数的的置信区间检验
此课件下载可自行编辑修改,仅供参考! 感谢您的支持,我们努力做得更好!谢谢
还有的计量论文是为了验证一些经济理论是否 正确的,此时的经济检验就要另当别论了。
但对于我们来说,经济检验必须通过,只有通 过了经济检验,才能进行下一步的统计检验。
2、统计检验
(1)模型的拟合优度检验——判定系数R2 (2)模型的显著性检验——F检验 (3)解释变量的显著性检验——t检验 (4)参数的的置信区间检验

回归模型的参数估计与假设检验

回归模型的参数估计与假设检验
ˆ 0 ˆ 1
(i 1,2,, n)
Y X
1 2 n
ˆ Y V X
V TV min
ˆ X TY X T X
n XTX n x i i 1
S xx 2 x 1 Q n ˆˆ S xx x
1 x2 n S x xx x 1 S xx
x S xx 1 S xx
V TV n2
2
2 ˆ ( y y ) i i i 1
第三章回归模型的参数估计与假设检验武汉大学测绘学院孙海燕第二节线性回归模型线性回归理论模型回归方程的系数随机模型第三章回归模型的参数估计与假设检验武汉大学测绘学院孙海燕第三节回归参数的最小二乘估计一一元线性回归的参数估计第三章回归模型的参数估计与假设检验武汉大学测绘学院孙海燕第三章回归模型的参数估计与假设检验武汉大学测绘学院孙海燕xxxxxxxxxxxyxxxyxxxyxyxxxxxxxxxxxxxxxx第三章回归模型的参数估计与假设检验武汉大学测绘学院孙海燕编号库水位xm沉陷量ymm102714196951541881143643961201703311293935691350465461403735691449583941014101158211130308418121212342901129xxxy第三章回归模型的参数估计与假设检验武汉大学测绘学院孙海燕二多元线性回归的最小二乘估计22211211多元线性回归方程为第三章回归模型的参数估计与假设检验武汉大学测绘学院孙海燕第四节线性回归统计的分布和统计性质第三章回归模型的参数估计与假设检验武汉大学测绘学院孙海燕第五节回归模型和回归系数的显著性检验相关系数及其检验一元线性回归方程的前提是变量y与x应存在线性的统计相关因此必须有一个数量性指标来描述两个变量间线性相关的程度这一指标通常采用相关系数

第3章 一元回归模型:假设检验

第3章 一元回归模型:假设检验
进一步
ui ~ N (0, )
2
回顾:正态分布由来
高尔顿钉板
回顾:正态分布由来
高尔顿钉板
回顾:正态分布的平均值和方差
第327页
第三章 一元回归模型:假设检验
3.1 古典线性回归模型的基本假定
第三章 一元回归模型:假设检验
3.1 古典线性回归模型的基本假定
第三章 一元回归模型:假设检验
问:随机误差项
答:使用残差项
se(b2 ) var(b2 )
u i 的方差 2 不知道怎么办?? ei 的方差来估计随机误差项的方差:
EViews 回归结果
第三章 一元回归模型:假设检验
3.3 OLS估计量的性质
高斯-马尔科夫定理:
如果满足古典线性回归模型的基本假定,则OLS 估计量是最优线性无偏估计量(Best Linear Unbiased Evaluation , BLUE)。
3.1 古典线性回归模型的基本假定
二、对随机误差项
u i 的假定:
5. 解释变量与随机误差项不相关。
cov(ui , X i ) 0
6. 随机误差项之间不相关(无自相关、无序列相关)。
cov(ui , u j ) 0
i j i, j 1, 2,..., n
回顾:变量间的相关性
相关系数
第三章 一元回归模型:假设检验
3.3 OLS估计量的性质
1. 线性: b1和b2是线性估计量,即它们是Y的线性函数:
b1 Y b2 X
x y ( X X )(Y Y ) b x (X X ) X Y nXY X nX
i i i i 2 2 i 2 i i i 2 i 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
e′e k AC = ln + ln n n n
这两准则均要求仅当所增加的解释变量能够减少 这两准则均要求仅当所增加的解释变量能够减少 AIC值或AC值时才在原模型中增加该解释变量 值或AC值时才在原模型中增加该解释变量。 AIC值或AC值时才在原模型中增加该解释变量
Eviews的估计结果显示: 中国居民消费一元例中: AIC=7.09 AC=7.19
Q = f ( X / P0 , P1 / P0 )
(**)
为了进行比较,将同时估计( 为了进行比较,将同时估计(*)式与(**)式。 式与(**)
首先,确定具体的函数形式 根据恩格尔定律 恩格尔定律,居民对食品的消费支出与居 恩格尔定律 民的总支出间呈幂函数 幂函数的变化关系: 幂函数 对数变换:
Q = A(δ 1 K
ρ
+ δ 2 L ) e
ρ
1 ρ
(δ1+δ2=1)
Q:产出量,K:资本投入,L:劳动投入 ρ:替代参数, δ1、δ2:分配参数 方程两边取对数后,得到:
1 LnQ = LnA ρ Ln(δ 1 K ρ + δ 2 L ρ ) +
将式中ln(δ1K-ρ + δ2L-ρ)在ρ=0处展开台劳级数,取关于 ρ的线性项,即得到一个线性近似式。 如取0阶、1阶、2阶项,可得
ESS / k F= RSS /(n k 1)
服从自由度为(k , n-k-1)的F分布 给定显著性水平α,可得到临界值Fα(k,n-k-1), α F 1 由样本求出统计量F的数值,通过 F> Fα(k,n-k-1) 或 F≤Fα(k,n-k-1)
来拒绝或接受原假设H0,以判定原方程总体上 总体上的 总体上 线性关系是否显著成立。
第三章
回归模型的检验
线性回归模型的统计检验 回归模型的其他形式 回归模型的参数约束
§3.1 多元线性回归模型的统计检验 一、拟合优度检验 方程的显著性检验(F检验) (F检验 二、方程的显著性检验(F检验) 变量的显著性检验( 检验) 三、变量的显著性检验(t检验) 四、参数的置信区间
一、拟合优度检验 1、可决系数与调整的可决系数 、
2、关于拟合优度检验与方程显著性检 、 验关系的讨论

RSS R = 1 TSS
2
ESS / k 与 F= RSS / ( n k 1)
可推出: 或
kF R = n k 1 + kF
2
R2 / k F = 1 R 2 ) / ( n k 1) (
检验) 三、变量的显著性检验(t检验) 变量的显著性检验( 检验
(****)式也可看成是对(***)式施加如下约束而得 β1 + β 2 + β 3 = 0
因此,对 ( **** ) 式进行回归 , 就意味着原需 对 ****) 式进行回归, 求函数满足零阶齐次性条件。
中国城镇居民消费支出( 表 3.2.1 中国城镇居民消费支出(元)及价格指数
注意:一元线性回归中, 检验与F 注意:一元线性回归中,t检验与F检验一致 一方面,t检验与F检验都是对相同的原假设 一方面 H0:β1=0 进行检验; 另一方面,两个统计量之间有如下关系: 另一方面
F =t
2
在中国居民人均收入 消费支出 二元模型 中国居民人均收入-消费支出二元模型例中, 中国居民人均收入 消费支出二元模型 由应用软件计算出参数的t值: t 0 = 3.306 t1 = 3.630 t 2 = 2.651 给定显著性水平α=0.05,查得相应临界值: t0.025(19) =2.093。 可见,计算的所有 值都大于该临界值 计算的所有t值都大于该临界值 计算的所有 值都大于该临界值,所以 拒绝原假设。
2、幂函数模型、指数函数模型与对数变换法 、幂函数模型、 例如,Cobb-Dauglas生产函数:幂函数 例如 Q = AKαLβ Q:产出量,K:投入的资本;L:投入的劳动 方程两边取对数: ln Q = ln A + α ln K + β ln L
3、复杂函数模型与级数展开法 、
例如,常替代弹性CES生产函数 例如
一、模型的类型与变换
1、倒数模型、多项式模型与变量的直接置换法 、倒数模型、 例如, 拉弗曲线:抛物线 例如,描述税收与税率关系的拉弗曲线 拉弗曲线 s = a + b r + c r2 c<0 s:税收; r:税率 设X1 = r,X2 = r2, 则原方程变换为 s = a + b X1 + c X2 c<0
可决系数
ESS RSS R = = 1 TSS TSS
2
该统计量越接近于1,模型的拟合优度越高。 问题: 问题: 由增加解释变量个数引起的R2的增大与拟合 好坏无关,R2需调整。 , 需调整。
调整的可决系数( 调整的可决系数(adjusted coefficient of determination) ) 在样本容量一定的情况下,增加解释变量必定 使得自由度减少,所以调整的思路是:将残差平方 将残差平方 和与总离差平方和分别除以各自的自由度, 和与总离差平方和分别除以各自的自由度,以剔 除变量个数对拟合优度的影响: 除变量个数对拟合优度的影响
方程的总体线性 总体线性关系显著≠每个解释变量 总体线性 ≠每个解释变量对被 解释变量的影响都是显著的 因此,必须对每个解释变量进行显著性检验, 以决定是否作为解释变量被保留在模型中。 检验完成的。 这一检验是由对变量的 t 检验完成的。
1、t分布 、 分布
t=
βi βi sβ
i
=
βi βi e′e cii n k 1
中国居民消费二元例中: AIC=6.68 AC=6.83
从这点看,可以说前期人均居民消费CONSP(-1)应 包括在模型中。
检验) 二、方程的显著性检验(F检验 方程的显著性检验 检验
方程的显著性检验, 方程的显著性检验,旨在对模型中被解释变 量与解释变量之间的线性关系在总体上 在总体上是否显著 量与解释变量之间的线性关系在总体上是否显著 成立作出推断。 成立作出推断。
四、参数的置信区间
参数的置信区间 参数的 置信区间用来考察:在一次抽样中所估 置信区间 在一次抽样中所估 计的参数值离参数的真实值有多“ 计的参数值离参数的真实值有多“近”。 在变量的显著性检验中已经知道: 在变量的显著性检验中已经知道:
t=
βi βi s β
i
=
βi βi e ′e cii n k 1
二、非线性回归实例
例3.2.1 建立中国城镇居民食品消费需求函数模型。 根据需求理论,居民对食品的消费需求函数大致为
Q = f ( X , P1 , P0 )
(*)
Q:居民对食品的需求量,X:消费者的消费支出总额 P1:食品价格指数,P0:居民消费价格总指数。 零阶齐次性,当所有商品和消费者货币支出总额按同 零阶齐次性 一比例变动时,需求量保持不变
总离差平方和的分解

TSS = Σ(Yi Y ) 2 = Σ((Yi Yi ) + (Yi Y )) 2 = Σ(Yi Yi ) 2 + 2Σ(Yi Yi )(Yi Y ) + Σ(Yi Y ) 2
) 2 + ∑ (Y Y ) 2 = RSS + ESS TSS = ∑ (Yi Yi i
如何才能缩小置信区间? 如何才能缩小置信区间? 增大样本容量n,因为在同样的样本容量下,n越 增大样本容量n 因为在同样的样本容量下, 增大样本容量 分布表中的临界值越小,同时, 大,t分布表中的临界值越小,同时,增大样本容 还可使样本参数估计量的标准差减小; 量,还可使样本参数估计量的标准差减小; 提高模型的拟合优度,因为样本参数估计量的标 提高模型的拟合优度, 提高模型的拟合优度 准差与残差平方和呈正比,模型优度越高, 准差与残差平方和呈正比,模型优度越高,残差 平方和应越小。 平方和应越小。 提高样本观测值的分散度,一般情况下,样本观 提高样本观测值的分散度,一般情况下, 提高样本观测值的分散度 测值越分散, 的分母的|X’X|的值越大,致 的值越大, 测值越分散,(X’X)-1的分母的 的值越大 使区间缩小。 使区间缩小。
Q = AX β1 P1β 2 P0β 3
ln(Q) = β 0 + β 1 ln X + β 2 ln P1 + β 3 ln P0 +
(***) (****)
考虑到零阶齐次性时 零阶齐次性时 零阶齐次性
ln(Q) = β 0 + β 1 ln( X / P0 ) + β 2 ln( P1 / P0 ) +
§3.2 回归模型的其他函数形式
一、模型的类型与变换 二、非线性回归实例
在实际经济活动中,经济变量的关系是复杂 的,直接表现为线性关系的情况并不多见。 如著名的恩格尔曲线 恩格尔曲线(Engle curves)表现为幂 恩格尔曲线 幂 函数曲线形式、宏观经济学中的菲利普斯曲线 函数曲线 菲利普斯曲线 (Pillips cuves)表现为双曲线 双曲线形式等。 双曲线 但是,大部分非线性关系又可以通过一些简 单的数学处理,使之化为数学上的线性关系,从 而可以运用线性回归的方法进行计量经济学方面 的处理。
对于中国居民人均消费支出的例子: 一元模型:F=285.92 二元模型:F=2057.3 给定显著性水平α =0.05,查分布表,得到临界 值: 一元例:Fα(1,21)=4.32 二元例: Fα(2,19)=3.52 显然有 F> Fα(k,n-k-1) 即二个模型的线性关系在95%的水平下显著成立。
t (n k 1)
2、t检验 、 检验
设计原假设与备择假设: H0:βi=0 H1:βi≠0 给定显著性水平α,可得到临界值tα/2(n-k-1), 由样本求出统计量t的数值,通过 |t|> tα/2(n-k-1) 或 |t|≤tα/2(n-k-1)
相关文档
最新文档