3.3 多元线性回归模型的统计检验
多元线性回归模型的统计检验
上的线性关系不显著。
12ቤተ መጻሕፍቲ ባይዱ
❖F检验只是把模型作为一个整体,对总体 线性关系进行检验;
❖方程在总体上存在显著的线性关系 每个解释变量对被解释变量都具有显著影响
❖还应对模型中的各个解释变量进行显著性 检验,以决定它们是否应当作为解释变量 被保留在模型之中。
可决系数R2 ESS 1 RSS
TSS
TSS
R2越接近于1,模型的拟合效果越好。
2
问题
❖ 如果在模型中增加一个解释变量,R2往往会 增大(Why?)
❖ 容易产生错觉:要使模型拟合得好,只要增 加解释变量即可。
❖ 但实际上,通过增加解释变量引起的R2的增 大与拟合好坏无关。
❖ R2度量模型拟合效果失真,R2需调整 。
9
若H0 成立,则有:
F
ESS / k
RSS /n k
1
~
F (k
,
n
k
1)
由样本数据求出F统计量的值。
(3)给定显著性水平,查表得到临界
值F(k , n-k-1)。
10
F检验的拒绝域
f (F)
1-
F F
11
(4)比较、判断 ❖ 若F F (k , n-k-1),拒绝H0,接受H1 ,模型
开关
类型,尽量选择平头
键
类的按键,以防按键
下陷。
2.开关按键和塑胶按
F检验的思想来自于TSS的分解: TSS = ESS + RSS
其中,ESS表示X对Y的线性作用结果。
考虑比值:ESS / RSS 如果这个比值较大,则X对Y的解释程 度较高,可认为二者在总体上存在线性 关系;
§3.3 多元线性回归模型的统计检验
t=
βj βj Sβ
j
=
βj βj e′e cjj n k 1
~ t(nk 1)
2、t检验 、 检验
设计原假设与备择假设: 设计原假设与备择假设: H0:βi=0 H1:βi≠0 给定显著性水平α,可得到临界值tα/2(n-k-1), 给定显著性水平α 可得到临界值 ) 由样本求出统计量t的数值 的数值, 由样本求出统计量 的数值,通过 |t|> |t|> tα/2(n-k-1) ) 或 |t|≤ |t|≤tα/2(n-k-1) )
RSS = ∑ ei
2
2 总体平方和
Y )2 ESS = ∑(Y
回归平方和 残差平方和
则
TSS = Σ(Yi Y ) 2 = Σ((Yi Yi ) + (Yi Y )) 2 = Σ(Yi Yi ) 2 + 2Σ(Yi Yi )(Yi Y ) + Σ(Yi Y ) 2
由于
n 1 R = 1 (1 R ) n k 1
2 2
*2、赤池信息准则和施瓦茨准则 、
赤池信息准则( 赤池信息准则(AIC) )
AIC=-2L/n + 2(k + 1) / n
施瓦茨准则(SC) 施瓦茨准则( )
SC=-2L/n + (k + 1) ln n / n
L为对数似然值,n为样本容量,k为解释变量个数。 这两准则均要求仅当所增加的解释变量能够减少 这两准则均要求仅当所增加的解释变量能够减少 AIC值或AC值时才在原模型中增加该解释变量 值或AC值时才在原模型中增加该解释变量。 AIC值或AC值时才在原模型中增加该解释变量
β 0 = 120.70 β 1 = 0.2213 β 2 = 0.4515 s β = 36.51
多元线性回归模型检验
多元线性回归模型检验引言多元线性回归是一种常用的统计分析方法,用于研究两个或多个自变量对目标变量的影响。
在应用多元线性回归前,我们需要确保所建立的模型符合一定的假设,并进行模型检验,以保证结果的可靠性和准确性。
本文将介绍多元线性回归模型的几个常见检验方法,并通过实例进行说明。
一、多元线性回归模型多元线性回归模型的一般形式可以表示为:$$Y = \\beta_0 + \\beta_1X_1 + \\beta_2X_2 + \\ldots + \\beta_pX_p +\\varepsilon$$其中,Y为目标变量,$X_1,X_2,\\ldots,X_p$为自变量,$\\beta_0,\\beta_1,\\beta_2,\\ldots,\\beta_p$为模型的回归系数,$\\varepsilon$为误差项。
多元线性回归模型的目标是通过调整回归系数,使得模型预测值和实际观测值之间的误差最小化。
二、多元线性回归模型检验在进行多元线性回归分析时,我们需要对所建立的模型进行检验,以验证假设是否成立。
常用的多元线性回归模型检验方法包括:1. 假设检验多元线性回归模型的假设包括:线性关系假设、误差项独立同分布假设、误差项方差齐性假设和误差项正态分布假设。
我们可以通过假设检验来验证这些假设的成立情况。
•线性关系假设检验:通过F检验或t检验对回归系数的显著性进行检验,以确定自变量与目标变量之间是否存在线性关系。
•误差项独立同分布假设检验:通过Durbin-Watson检验、Ljung-Box 检验等统计检验,判断误差项是否具有自相关性。
•误差项方差齐性假设检验:通过Cochrane-Orcutt检验、White检验等统计检验,判断误差项的方差是否齐性。
•误差项正态分布假设检验:通过残差的正态概率图和Shapiro-Wilk 检验等方法,检验误差项是否满足正态分布假设。
2. 多重共线性检验多重共线性是指在多元线性回归模型中,自变量之间存在高度相关性的情况。
3多元回归模型说课讲解
四、例题
地区城镇居民消费模型
• 被解释变量:地区城镇居民人均消费Y • 解释变量:
– 地区城镇居民人均可支配收入X1 – 前一年地区城镇居民人均消费X2
• 样本:2006年,31个地区
数据
地区
北京 天津 河北 山西 内蒙 古 辽宁 吉林 黑龙 江 上海 江苏 浙江 安徽 福建 江西 山东 河南
3、关于拟合优度检验与方程显著性检验关 系的讨论
R2 1RS/S(nk1) F ES/Sk
TS/S(n1)
RS/S(nk1)
R21 n1 nk1kF
F
R2 /k
(1R2)/(nk1)
对于一般的实际问题,在5%的显著性水平下,F
统计量的临界值所对应的R2的水平是较低的。所以,
不宜过分注重R2值,应注重模型的经济意义;在进
15000 X1
20000
25000
变量间关系
Y
16000
14000
12000
10000
8000
6000 4000
6000
8000 10000 12000 14000
X2
OLS估计
OLS估计结果
经济意义:
X1的回归系数为0.56,表 示在其他变量不变的情况 下,人均可支配收入每增 加1元,人均消费支出可 增加0.56元。
13773.4 云 南 8621.8 西 藏
12253.7 陕 西 6367.7 甘 肃 8794.4 青 海 6109.4 宁 夏 7457.3 新 疆 6038.0
2006年消费 2006年可 2005年消 支出 支配收入 费支出
Y
7397.3
X1
9802.7
第三章(1) 多元线性回归模型课件
分离差的大小
解释的那部分离差的大小。也
称剩余平方和。
第三章 多元线性回归模型
§ 3-3 多元线性回归模型的统计检验 一、 拟合优度检验 检验模型对样本观测值的拟合程度。用在总离差分解 基础上确定的可决系数R2 (调整的可决系数 ) 度量。 1、总离差平方和的分解
总离差平方和TSS 回归平方和ESS
3、随机误差项在不同 样本点之间是独立的,
Cov( i,
不存在序列相关
因为 i与 j相互独立,有:
j)=0 i≠j
无自相关假定表明:产生 误差(干扰)的因素是完 全随机的,此次干扰与彼 次干扰互不相关,互相独 立。由此应变量Yi的序列 值之间也互不相关。
第三章 多元线性回归模型
§ 3-1 多元线性回归模型及其基本假定
3、有效性(最小方差性):
指在所有线性、无偏估计量中, OLS参数估计量的 方差最小。
4、 服从正态分布,即:
其中,
, G2是随机误差项的方差,
Cjj是矩阵(X’X)-1 中第j行第j列位置上的元素。
第三章 多元线性回归模型
§ 3-2 多元线性回归模型的参数估计
一、 参数的最小二乘估计
二、 OLS估计量的统计性质及其分布
三、随机误差项方差Q2的估 计
参数估计的另一项任务是: 求随机误差项 i 的分布参数
称作回归标准差 (standard error of regression), 常作为对所估计回归线的拟
合优度的简单度量。
i~N(0, Q2)
随机误差项 i 的 方差的估计量为:
可以
证明:
说明 是QS 的无偏估计量。
t-Statistic 6.411848 22.00035 4.187969
(完整版)第三章(多元线性回归模型)3-3答案
3.3 多元线性回归模型的检验一、判断题1、在线性回归模型中,为解释变量或者被解释变量重新选取单位(比如,元变换成千元),会影响t 统计量和 2R 的数值。
( F )2、在多元线性回归中,t 检验和F 检验缺一不可。
( T )3、回归方程总体线性显著性检验的原假设是模型中所有的回归参数同时为零。
( F )4、多元线性回归中,可决系数2R 是评价模型拟合优度好坏的最佳标准。
( F )二 、单项选择1、在模型0112233t t t t t Y X X X ββββμ=++++的回归分析结果中,有462.58F =,0.000000F p =的值,则表明 ( C )A 、解释变量2t X 对t Y 的影响不显著B 、解释变量1t X 对t Y 的影响显著C 、模型所描述的变量之间的线性关系总体上显著D 、解释变量2t X 和1t X 对t Y 的影响显著2、设k 为回归模型中的实解释变量的个数,n 为样本容量。
则对回归模型进行总体显著性 检验(F 检验)时构造的F 统计量为 ( A )A 、1)ESS k F RSS n k =--B 、(1)()ESS k F RSS n k -=- C 、ESS F RSS = D 、1RSS F TSS=- 3、在多元回归中,调整后的可决系数2R 与可决系数2R 的关系为 ( A ) A 、22R R < B 、22R R >C 、22R R =D 、2R 与2R 的关系不能确定4、根据调整的可决系数2R 与F 统计量的关系可知,当21R =时,有 ( C )A 、F=0B 、F=-1C 、F →+∞D 、F=-∞5、下面哪一表述是正确的 ( D ) A 、线性回归模型01i i i Y X ββμ=++的零均值假设是指110ni i n μ==∑ B 、对模型01122i i i i Y X X βββμ=+++进行方程显著性检验(即F 检验),检验的零假 设是0012:0H βββ===C 、相关系数较大意味着两个变量存在较强的因果关系D 、当随机误差项的方差估计量等于零时,说明被解释变量与解释变量之间为函数关系5、对于01122ˆˆˆˆi i i k ki iY X X X e ββββ=+++++…,如果原模型满足线性模型的基本假设则 在零假设0j β=下,统计量ˆˆ()j j s ββ(其中ˆ()js β是j β的标准误差)服从 (B )A 、()t n k -B 、(1)t n k --C 、(1,)F k n k --D 、(,1)F k n k --6、在由的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重可决系数为0.8500,则调整后的多重可决系数为( D )A 、8603B 、 0.8389C 、0.8655D 、0.83277、可决系数R 2=0.8,说明回归直线能解释被解释变量总变差的:( A )A 、 80%B 、 64%C 、 20%D 、 89%8、线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中,检验0:0(0,1,2,...)t H b i k ==时,所用的统计量服从( C )A.t(n-k+1)B.t(n-k-2)C.t(n-k-1)D.t(n-k+2)三、多项选择题1、对模型满足所有假定条件的模型01122i i i i Y X X βββμ=+++进行总体显著性检验,如果检验结果总体线性关系显著,则很可能出现 ( BCD )A 、120ββ==B 、120,0ββ≠=C 、120,0ββ≠≠D 、120,0ββ=≠E 、120,0ββ==2、设k 为回归模型中的参数个数(包含截距项)则总体线性回归模型进行显著性检验时所 用的F 统计量可以表示为 ( BC )A 、()()()∑∑---1k e k n Y Y 2i 2i i //ˆ B 、()()()∑∑---k n e 1k Y Y 2i2ii //ˆ C 、()()()k n R 11k R 22---// D 、()()()1k R k n R 122---// 30n =E 、()()()1k R 1k n R 22---// 3、在多元回归分析中,调整的可决系数2R 与可决系数2R 之间 ( AD )A 、22R R <B 、22R R ≥C 、2R 只可能大于零D 、2R 可能为负值E 、2R 不可能为负值四、简答题1.在多元线性回归分析中,为什么用修正的可决系数衡量估计模型对样本观测值的拟合优度?答:因为人们发现随着模型中解释变量的增多,多重可决系数2R 的值往往会变大,从而增加了模型的解释功能。
5、计量经济学【多元线性回归模型】
二、多元线性回归模型的参数估计
2、最小二乘估计量的性质 当 ˆ0, ˆ1, ˆ2, , ˆk 为表达式形式时,为随机变量, 这时最小二乘估计量 ˆ0, ˆ1, ˆ2, , ˆk 经过证明同样也 具有线性性、无偏性和最小方差性(有效性)。 也就是说,在模型满足那几条基本假定的前提 下,OLS估计量具有线性性、无偏性和最小方差性 (有效性)这样优良的性质, 即最小二乘估计量
用残差平方和 ei2 最小的准则: i
二、多元线性回归模型的参数估计
1、参数的普通最小二乘估计法(OLS) 即:
min ei2 min (Yi Yˆi )2 min Yi (ˆ0 ˆ1X1i ˆ2 X 2i ˆk X ki )2
同样的道理,根据微积分知识,要使上式最小,只 需求上式分别对 ˆj ( j 0,1, k) 的一阶偏导数,并令 一阶偏导数为 0,就可得到一个包含 k 1 个方程的正 规方程组,这个正规方程组中有 k 1个未知参数 ˆ0, ˆ1, ˆ2, , ˆk ;解这个正规方程组即可得到这 k 1 个参数 ˆ0, ˆ1, ˆ2, , ˆk 的表达式,即得到了参数的最小 二乘估计量;将样本数据代入到这些表达式中,即可 计算出参数的最小二乘估计值。
该样本回归模型与总体回归模型相对应,其中残差 ei Yi Yˆi 可看成是总体回归模型中随机误差项 i 的 估计值。
2、多元线性回归模型的几种形式: 上述几种形式的矩阵表达式: 将多元线性总体回归模型 (3.1) 式表示的 n 个随机方 程写成方程组的形式,有:
Y1 0 1 X11 2 X 21 .Y.2.........0.......1.X...1.2........2.X...2.2. Yn 0 1 X1n 2 X 2n
ˆ0, ˆ1, ˆ2, , ˆk 是总体参数真值的最佳线性无偏估计 量( BLUE );即高斯—马尔可夫定理 (GaussMarkov theorem)。
3.3多元回归模型的统计检验
§3.3 多元线性回归模型的统计检验多元线性回归模型的参数估计出来后,即求出样本回归函数后,还需进一步对该样本回归函数进行统计检验,以判定估计的可靠程度。
包括拟合优度检验、方程总体线性性显著性检验、变量显著性检验以及参数的置信区间估计等方面。
一、拟合优度检验1、可决系数与调整的可决系数在一元线性回归模型中,使用可决系数2R 来衡量样本回归线对样本观测值的拟合程度。
在多元线性回归模型中,我们也可用该统计量来衡量样本回归线对样本观测值的拟合程度。
记∑-=2)(Y Y TSS i为总离差平方和,∑-=2)ˆ(Y Y ESS i为回归平方和,∑-=2)ˆ(ii Y Y RSS 为剩余平方和,则 2222)ˆ()ˆ)(ˆ(2)ˆ())ˆ()ˆ(()(Y Y Y Y Y Y Y Y Y Y Y Y Y Y TSS ii i i i i ii i i -∑+--∑+-∑=-+-∑=-∑= 由于∑∑-=--)ˆ()ˆ)(ˆ(Y Y e Y Y Y Y iiii∑∑∑∑++++=i ki i k i i ie Y X e X e eβββˆˆˆ110=0所以有:E S S R S S Y Y Y Y T S Sii i +=-+-=∑∑22)ˆ()ˆ( (3.3.1) 即总离差平方和可分解为回归平方和与剩余平方和两部分。
回归平方和反映了总离差平方和中可由样本回归线解释的部分,它越大,剩余平方和越小,表明样本回归线与样本观测值的拟合程度越高。
因此,可用回归平方和占总离差平方和的比重来衡量样本回归线对样本观测值的拟合程度:T S SR S ST S S E S S R -==12(3.3.2) 该统计量越接近于1,模型的拟合优度越高。
在应用过程中发现,如果在模型中增加一个解释变量,2R 往往增大。
这是因为残差平方和往往随着解释变量个数的增加而减少,至少不会增加。
这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。
计量经济学习题解答 (5)
第三章习题解答3.1 写出二元线性回归模型表达式:(1)总体回归函数表达式; (2)总体回归函数随机设定形式;(3)样本回归函数的表达式; (4)样本回归函数的随机设定形式; (5)回归模型的矩阵表达式。
答:(1)总体回归表达式为:(|)()i i i E Y X f X = 当函数形式为线性的时候,总体回归表达式为: 12(|)i i i E Y X X ββ=+上述为个别值的表达形式,也可以写成抽象形式,如(|)()E Y X f X = 线性表达式也可以写成多元的形式,如122(|)i i i ki E Y X X X ββ=+++(2)总体回归函数随机设定形式为:(|)i i i i Y E Y X u =+或()i i i Y f X u =+ 当函数是线性的时候,总体回归函数随机设定形式为:12i i i Y X u ββ=++同样,也可以写成抽象的形式:12Y X u ββ=++ 线性表达式可以写成多元的形式:122i i ki i Y X X u ββ=++++(3)、(4)样本回归函数的表达式为:12ˆˆˆi iY X ββ=+ 随机设定形式为:12ˆˆi i iY X e ββ=++ 多元线性回归模型时,样本回归函数的表达式为:12233ˆˆˆˆˆi i i k kiY X X X ββββ=++++ 随机设定形式为:12233ˆˆˆˆi i ik ki iY X X X e ββββ=+++++(5)回归模型的矩阵表达式:=+Y X βu3.2 对多元线性回归模型进行检验时,为什么在做了F 检验之后还要做t 检验呢?答:F 检验是各解释变量联合起来对被解释变量影响的显著性检验,是模型的整体性检验,其效果相等于R 2检验,但不能说明具体每个变量的统计显著性问题,因此,需要对每个变量进行t 检验才能看出其对应参数估计值的统计显著性。
3.3 多元线性回归模型的经典假定与简单线性回归模型有什么区别?答:区别在于多元线性回归模型的经典假定设置了解释变量之间无多重共线性的假定。
计量经济学 )多元线性回归模型的统计检验
ˆ) 0 X i1 (Yi Y i
ˆ) 0 X i 2 (Yi Y i
… X (Y Y ˆ) 0 ik i i
所以 从而
ˆ )(Y ˆ Y ) 0 (Y Y
i i
ˆ ) 2 (Y ˆ Y )2 (Y Y ) (Y Y i i i i
解释的那部分离差的大小。
• 那么,TSS、ESS、RSS之间存在的如下关系:
总离差平方和 = 回归平方和 + 残差平方和
TSS
=
ESS
+
RSS
关于TSS=ESS+ RSS的证明过程(教材P73) 证明: 将TSS,即总离差平方和进行分解:
ˆ ) (Y ˆ Y )) 2 TSS (Y Y ) 2 ((Y Y
• 拟合优度检验:检验模型对样本观测值的拟合 程度。
• 在一元回归模型中,拟合优度检验是通过构造 一个可以表征拟合程度的统计量R2来实现。
• 在多元回归模型中,也可以用该统计量来衡量 样本回归线对样本观测值的拟合程度。
总离差平方和、回归平方和及残差平方和
• 定义
TSS (Y Y ) 2
i
2 ˆ y i
y
2 i
1
yi
ei
2 2
检验模型的拟合优度。 R2叫做多重可决系数,也简称为可决系数或判定系数。
毫无疑问,R2越接近于1,模型的拟合优度越高。 但是在应用过程中人们发现,如果在模型中增加一个解释变量, 那么模型的回归平方和随之增大,从而R2也随之增大。 这就给人一个错觉:要使模型拟合得好,就必须增加解释变量。 所以,用来检验拟合优度的统计量必须能够防止这种倾向。
说 明
计量经济学教案
课程教案课程名称:计量经济学授课教师:李晓鸿授课教师所在学院:经济与管理学院授课班级:市场营销1201-03 授课学期: 2014-2015-01学期一、基本信息:课程名称:计量经济学课程性质:必修√限选○选修○素拓○跨学科授课专业班级:市场营销学1201-02 学生人数:69 所处年级:○一年级○二年级√三年级○四年级总学时:48 理论课时:36 实验课时:8 学分: 3 课程教材:计量经济学(第三版)高教出版社上课时间:周一5-6节周四5-6节(单周) 上课地点:A226 A237答疑时间:答疑地点:先修课程:高等数学概率论统计学经济学本课程在授课对象所学专业人才培养中的作用与地位计量经济学是在对社会经济现象作定性分析的基础上,探讨如何运用模型方法定量描述和分析具有随机性特征的经济变量关系的经济学分支。
通过本课程的教学,要求学生达到了解计量经济学作为现代经济学的重要组成部分所具有的特征与地位,了解计量经济分析方法在经济学科的发展和实际经济工作中的作用;掌握计量经济学分析经济问题的基本思想,掌握计量经济学建模的基本原理;熟知计量经济分析的基本内容和工作程序;具备运用计量经济分析软件和计量经济分析方法对实际经济问题作定量分析的初步能力;并打下进一步学习更高层次计量经济学课程的基础。
本课程在知识传授、能力提升、素质培养各方面的教学目标(1)了解现代经济学的特征,了解经济数量分析课程在经济学课程体系中的地位,了解经济数量分析在经济学科的发展和实际经济工作中的作用;(2)掌握基本的经典计量经济学理论与方法,并对计量经济学理论与方法的扩展和新发展有概念性了解;(3)能够建立并应用简单的计量经济学模型,对现实经济现象中的数量关系进行实际分析;(4)具有进一步学习与应用计量经济学理论、方法与模型的基础和能力。
学生情况分析市场营销专业12级学生已经先修过经济学,概率论与数理统计以及应用统计学,具备学习计量经济学的理论基础二、课程大纲《计量经济学》课程教学大纲Econometrics课程编码:JJ111070 适用专业:经济学先修课程:经济学、概率论、统计学学分数:3总学时数:48 实验(上机)学时:8考核方式:院系考执笔者:李晓鸿编写日期:2010年7月一、课程性质和任务计量经济学是经济学类各专业的专业必修课,是以揭示经济活动中客观存在的数量关系为内容的分支学科。
计量经济学第三章第3节多元线性回归模型的显著性检验
当增加一个对被解释变量有较大影响的解释变量时, 残差平方和减小的比n-k-1 减小的更显著,拟合优度 就增大,这时就可以考虑将该变量放进模型。 如果增加一个对被解释变量没有多大影响的解释变量, 残差平方和减小没有n-k-1减小的显著,拟合优度会减 小,其说明模型中不应该引入这个不重要的解释变量, 可以将其剔除。
在对话框中输入:
y c x y(-1)
y c x y(-1) y(-2)
字母之间用空格分隔。 注:滞后变量不需重新形成新的时间序列,软件 自动运算实现,k期滞后变量,用y(-k)表示。
• 使用k期滞后变量,数据将损失k个样本观察值, 例如:
序号 2000 2001 2002 2003 2004 2005 2006 2007 2008 y 3 4 5 6 7 8 9 10 11 Y(-1) Y(-2) Y(-3)
2
2
2
*赤池信息准则和施瓦茨准则
• 为了比较所含解释变量个数不同的多元回归模型的 拟合优度,常用的标准还有: 赤池信息准则(Akaike information criterion, AIC) e e 2( k 1) AIC ln n n 施瓦茨准则(Schwarz criterion,SC)
一元、二元模型的系数均大于0,符合经济意义,三元模型 系数的符号与经济意义不符。 用一元回归模型的预测值是1758.7,二元回归模型的预测值 是1767.4,2001年的实际值是1782.2。一元、二元模型预测 的绝对误差分别是23.5、14.8。
3) 三个模型的拟合优度与残差
二元:R2 =0.9954,E2 ei2 13405 三元:R2 =0.9957,E3 ei2 9707
746.5 788.3
第三章(多元线性回归模型)3-3答案
3.3 多元线性回归模型的检验一、判断题1、在线性回归模型中,为解释变量或者被解释变量重新选取单位(比如,元变换成千元),会影响t 统计量和 2R 的数值。
( F )2、在多元线性回归中,t 检验和F 检验缺一不可。
( T )3、回归方程总体线性显著性检验的原假设是模型中所有的回归参数同时为零。
( F )4、多元线性回归中,可决系数2R 是评价模型拟合优度好坏的最佳标准。
( F )二 、单项选择1、在模型0112233t t t t t Y X X X ββββμ=++++的回归分析结果中,有462.58F =,0.000000F p =的值,则表明 ( C )A 、解释变量2t X 对t Y 的影响不显著B 、解释变量1t X 对t Y 的影响显著C 、模型所描述的变量之间的线性关系总体上显著D 、解释变量2t X 和1t X 对t Y 的影响显著2、设k 为回归模型中的实解释变量的个数,n 为样本容量。
则对回归模型进行总体显著性 检验(F 检验)时构造的F 统计量为 ( A )A 、1)ESS k F RSS n k =--B 、(1)()ESS k F RSS n k -=- C 、ESS F RSS = D 、1RSS F TSS=- 3、在多元回归中,调整后的可决系数2R 与可决系数2R 的关系为 ( A ) A 、22R R < B 、22R R >C 、22R R =D 、2R 与2R 的关系不能确定4、根据调整的可决系数2R 与F 统计量的关系可知,当21R =时,有 ( C )A 、F=0B 、F=-1C 、F →+∞D 、F=-∞5、下面哪一表述是正确的 ( D ) A 、线性回归模型01i i i Y X ββμ=++的零均值假设是指110ni i n μ==∑ B 、对模型01122i i i i Y X X βββμ=+++进行方程显著性检验(即F 检验),检验的零假 设是0012:0H βββ===C 、相关系数较大意味着两个变量存在较强的因果关系D 、当随机误差项的方差估计量等于零时,说明被解释变量与解释变量之间为函数关系5、对于01122ˆˆˆˆi i i k ki iY X X X e ββββ=+++++…,如果原模型满足线性模型的基本假设则 在零假设0j β=下,统计量ˆˆ()j j s ββ(其中ˆ()js β是j β的标准误差)服从 (B )A 、()t n k -B 、(1)t n k --C 、(1,)F k n k --D 、(,1)F k n k --6、在由的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重可决系数为0.8500,则调整后的多重可决系数为( D )A 、8603B 、 0.8389C 、0.8655D 、0.83277、可决系数R 2=0.8,说明回归直线能解释被解释变量总变差的:( A )A 、 80%B 、 64%C 、 20%D 、 89%8、线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中,检验0:0(0,1,2,...)t H b i k ==时,所用的统计量 服从( C )A.t(n-k+1)B.t(n-k-2)C.t(n-k-1)D.t(n-k+2)三、多项选择题1、对模型满足所有假定条件的模型01122i i i i Y X X βββμ=+++进行总体显著性检验,如果检验结果总体线性关系显著,则很可能出现 ( BCD )A 、120ββ==B 、120,0ββ≠=C 、120,0ββ≠≠D 、120,0ββ=≠E 、120,0ββ==2、设k 为回归模型中的参数个数(包含截距项)则总体线性回归模型进行显著性检验时所 用的F 统计量可以表示为 ( BC )A 、()()()∑∑---1k e k n Y Y 2i 2i i //ˆ B 、()()()∑∑---k n e 1k Y Y 2i2ii //ˆ C 、()()()k n R 11k R 22---// D 、()()()1k R k n R 122---// E 、()()()1k R 1k n R 22---// 3、在多元回归分析中,调整的可决系数2R 与可决系数2R 之间 ( AD )A 、22R R <B 、22R R ≥C 、2R 只可能大于零D 、2R 可能为负值E 、2R 不可能为负值四、简答题30n =1.在多元线性回归分析中,为什么用修正的可决系数衡量估计模型对样本观测值的拟合优度?答:因为人们发现随着模型中解释变量的增多,多重可决系数2R 的值往往会变大,从而增加了模型的解释功能。
第3章 多元线性回归模型
TSS
TSS
该统计量越接近于1,模型的拟合优度越高。
问题:在应用过程中发现,如果在模型中增加一个解 释变量, R2往往增大(Why?)
因为残差平方和往往随着解释变量个数的增加而减少。
这就给人一个错觉:要使得模型拟合得好,只要增加 解释变量即可。—— 但是,现实情况往往是,由增加 解释变量个数引起的R2的增大与拟合好坏无关,因此在 多元回归模型之间比较拟合优度,R2 就不是一个合适 的指标,必须加以调整。
所以,在多元线性回归模型中,依然有
n
n
即
yi2 ([ Yˆi Y) ei ]2
i 1
i 1
n
n
n
(Yˆi Y)2 ei2 2 e(i Yˆi Y)
i 1
i 1
i 1
n
n
(Yˆi Y)2 ei2
i 1
i 1
(3-20)
TSS ESS RSS
(3-21)
可决系数
R 2 ESS 1 RSS
μ~ N(0, 2I)
假设5,回归模型的设定是正确的。
第二节 多元线性回归模型的 参数估计
任务
模型结构参数 0 、1、2 、L 、k 的估计
随机误差项的方差 2 的估计
方法
普通最小二乘法
内容
一、参数的普通最小二乘估计 二、参数的普通最小二乘估计量的性质 三、普通最小二乘样本回归函数性质 四、随机误差项的方差的普通最小二乘估计 五、样本容量问题
第三章 经典单方程计量经济学模型: 多元线性回归模型
• 多元线性回归模型 • 多元线性回归模型的参数估计 • 多元线性回归模型的统计检验 • 多元线性回归模型的预测
§3.1 多元线性回归模型
第3.3多元线性回归模型教案
面数据问题 3.问题与应用(能力要求):选择现实的例子,寻找数据进行多元回归
分析的操作。
2
具有多个因变量的实际经济金融问题进行实证研究,使学生掌握多元线性回归模型参数
估计和统计检验的 Eviews 软件实现。 2.能力培养:通过案例分析,了解建立计量经济学模型的步骤,掌握多元线性回归
模型的参数估计、理解拟合优度的度量,掌握回归系数的区间估计和假设检验,理解回 归模型的预测。
教学重点及难点: 【重点】实际问题分析,建立模型、参数估计、统计检验,并预测
金融计量学 课程教案
授课题目(教学章、节或主题):
第 3 章 多元线性回归模型
授课时间 安排
第 5-6 周 2 课时
教学器材与工具 多媒体
授课类型 (请打√)
理论课√讨论课□ 实验课□ 习题课□ 双语课程□ 其他□
教学目的、要求(分掌握、熟悉、了解三个层次):
1.知识掌握:运用本章的多元线性回归模型的参数估计、统计检验、预测方法,对
作业、讨论题、思考题: P88 课堂讨论 3.1-3.3 (不交书面作业,当堂答疑)
参考资料(含参考书、文献等):庞浩等《经济计量学》;李子奈《计量经济学》;张 成思《金融计量学:时间序列分析视角》;汪昌云等《基于 EVIEWS 的金融计量学》; 邹平 《金融计量学》;姜近勇《金融计量学》 课后小结:本章我们讨论多元回归模型,多元回归分析中,为了分别检验当其它解释变 量不变时,各个解释变量是否对被解释变量有显著影响,需要分别对所估计的各个回归 系数作 t 检验。利用多元线性回归模型作被解释变量平均值预测与个别值预测的方法。
多元线性回归模型的统计检验
我们所要进行的统计检验包括两个方面,一方面检验回归方程对样本数据的拟合程度,通过可决系数来分析;另一方面检验回归方程的显著性,通过假设检验对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断,包括对回归方程线性关系的检验和对回归系数显著性的检验。
一、拟合优度检验
Testing the Simulation Level
变量显著性检验即对回归系数的显著性进行检验,如果变量是显著的,那么回归系数应该显著地不为0。于是,在变量显著性检验中设计的原假设为:
H0:i=0
而备择假设为:
H1: i0
其中 的下角标i,在一元回归模型中取值1:
在二元回归模型中取值1、2。
可见,F与R2同向变化:当R2 =0时,F=0;当R2=时,F为无穷大;R2越大,F值也越大。
因此,F检验是所估计回归总显著性的一个度量,也
是对
的一个显著性检验。即:
检验原假设
,等价于检验
Back
9、静夜四无邻,荒居旧业贫。。10、雨中黄叶树,灯下白头人。。11、以我独沈久,愧君相见频。。12、故人江海别,几度隔山川。。13、乍见翻疑梦,相悲各问年。。14、他乡生白发,旧国见青山。。15、比不了得就不比,得不到的就不要。。。16、行动出成果,工作出财富。。17、做前,能够环视四周;做时,你只能或者最好沿着以脚为起点的射线向前。。9、没有失败,只有暂时停止成功!。10、很多事情努力了未必有结果,但是不努力却什么改变也没有。。11、成功就是日复一日那一点点小小努力的积累。。12、世间成事,不求其绝对圆满,留一份不足,可得无限完美。。13、不知香积寺,数里入云峰。。14、意志坚强的人能把世界放在手中像泥块一样任意揉捏。15、楚塞三湘接,荆门九派通。。。16、少年十五二十时,步行夺得胡马骑。。17、空山新雨后,天气晚来秋。。9、杨柳散和风,青山澹吾虑。。10、阅读一切好书如同和过去最杰出的人谈话。11、越是没有本领的就越加自命不凡。12、越是无能的人,越喜欢挑剔别人的错儿。13、知人者智,自知者明。胜人者有力,自胜者强。14、意志坚强的人能把世界放在手中像泥块一样任意揉捏。15、最具挑战性的挑战莫过于提升自我。。16、业余生活要有意义,不要越轨。17、一个人即使已登上顶峰,也仍要自强不息。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
e i2 ∑
因此,可构造如下t统计量
t= ˆ βj − βj S βˆ
j
=
ˆ βj − βj e′e c jj n − k −1
t (n − k − 1)
2.t检验 检验 检验的原假设与备择假设:
H 0 : β j = 0, H1 : β j ≠ 0 j = 0,1, 2,L , k
j j
2
2
教材71页 例3.7 教材 页
解 给定置信水平1-α,β j(j = 1,2)的置信区间是
ˆ ˆ ( β j − tα × S βˆ , β j + tα × S βˆ )
j j
2
2
ˆ ˆ 将β1 = −8.3553,β 2 = 0.1801,S βˆ = 2.2907,S βˆ = 0.1997
(2)如果模型对样本有较高的拟合优度,则F检验 一般都能通过。
(3)实际应用中不必过分苛求R 2 值的大小,重要的是 考察模型的经济意义是否合理。
如R = 0.4, n = 20, k = 2, 则
2
0.4 2 F= = 5.67 0.6 17
F0.05 (2,17) = 3.59
检验) 三、变量的显著性检验(t检验) 变量的显著性检验( 检验 方程的整体线性 整体线性关系显著并不等于每个解释 整体线性 每个解释 变量对被解释变量的影响都是显著的。 变量 因此,必须对每个解释变量进行显著性检验, 以决定是否作为解释变量被保留在模型中。 1.t统计量 . 统计量 由于
2
n −1 R = 1 − (1 − R ) n − k −1
2 2
在样本容量一定的情况下,R 2具有下列性质:
(1) 若k ≥ 1,则R 2 < R 2;
(2)R 2 有可能出现负值。
问题:在实际应用中,R 2 达到多大才算模型 通过了拟合优度检验?
检验) 二、回归方程的显著性检验(F检验 回归方程的显著性检验 检验 1.回归方程的显著性检验 回归方程的显著性检验 回归方程的显著性检验,是指在一定的显著 性水平下,对模型中被解释变量与所有的解释变 量之间的线性关系在总体上是否显著成立进行的 一种统计检验。 方程的显著性检验是要检验模型
3.调整的样本可决系数(adjusted coefficient of 调整的样本可决系数( 调整的样本可决系数 determination) ) R2作为拟合优度的度量出现上述问题的原因是, 我们没有考虑三个平方和的自由度,所以解决的办 法是:用平方和的自由度进行修正,以剔除 2对解 用平方和的自由度进行修正, 用平方和的自由度进行修正 以剔除R 释变量个数的依赖性。 释变量个数的依赖性。 自由度:统计量的自由度指可自由变化的样本观测 值个数,它等于所用样本观测值的个数减去对观测 值的约束个数。
∑e
2 i
( n − 2)
=
ˆ β12 ∑ xi2
∑e
2 i
( n − 2)
2
=
∑e
2 i 2 i
(n − 2)∑ xi2
2
ˆ β12
=
∑e
2 i
ˆ β1 = β ˆ 2 1 ( n − 2) ∑ x i
∑e
1 = t2 ⋅ n − 2 ∑ xi2
第三节 多元线性回归模型的统计检验
• • • • 拟合优度检验 回归方程的显著性检验(F检验) 变量的显著性检验(t检验) 参数的数(coefficient of determination) 样本可决系数( 样本可决系数 ) 总离差平方和的分解: 总离差平方和的分解: 记
ˆ Var (β)=σ 2 (X′X)-1
′X)-1 主对角线上的第j个元素, 以c jj 表示矩阵(X ˆ 于是参数估计量的方差为:Var ( β j ) = σ 2 c jj
ˆ 易知β j 服从如下正态分布
ˆ βj N ( β j , σ 2 c jj )
其中σ2为随机误差项的方差,在实际计算时, 用它的估计量代替:
由样本求出统计量t的数值,给定显著性水平α, 可得到临界值tα/2(n-k-1),通过 |t|> |t|> tα/2(n-k-1) ) 或 |t|≤ |t|≤tα/2(n-k-1) ) 来拒绝或接受原假设H0,从而判定对应的解释变 判定对应的解释变 量对被解释变量是否有显著的影响, 量对被解释变量是否有显著的影响,即是否应当 包括在模型中。 包括在模型中。
F检验的思想来自于总离差平方和的分解式: 检验的思想 TSS=RSS+ESS
ˆ 由于回归平方和RSS = ∑ yi2是解释变量X 的联合 体对被解释变量Y的线性作用的结果,考虑比值
RSS = ESS yi2 ∑ˆ ei2 ∑
如果这个比值较大,则X的联合体对Y的解释程 度高,可认为总体上存在线性关系,反之总体上可 能不存在线性关系。 因此, 因此,可通过该比值的大小对总体线性关系进行 推断。 推断 根据数理统计学中的知识,在原假设H0成立的条 件下,统计量
ˆ = β′X′Y − nY 2
问题: 问题: R2不能真实反映拟合优度 R2 是解释变量个数的递增函数,如果在模型 中增加解释变量, R2往往增大。 一个错觉:要使得模型拟合得好 这就给人一个错觉 要使得模型拟合得好,只 一个错觉 要使得模型拟合得好, 要增加解释变量即可。 要增加解释变量即可 但是,现实情况往往是,由增加解释变量个数 引起的R2的增大与拟合好坏无关,R2需调整。 , 需调整。
2
该统计量越接近于1,模型的拟合优度越高。 2.三个平方和的计算 三个平方和的计算
TSS = ∑ (Yi − Y )2 =∑ Yi 2 − nY 2 = Y′Y − nY 2
ˆ ESS = ∑ ei2 = e′e = Y′Y − β′X′Y
ˆ RSS = TSS − ESS = Y′Y − nY 2 − (Y′Y − β′X′Y )
2
与
RSS / k F= ESS /(n − k − 1)
R2 / k 可推出: F = (1 − R 2 ) /(n − k − 1)
F 与R 2同向变化:当R 2 = 0时,F = 0;
R 2 越大,F 值也越大;
当R 2 = 1时,F 为无穷大。
结论:(1)对回归方程显著性的F 检验,实际上也是 对R 2的显著性检验。
教材69页 例3.6 教材 页 解 首先提出原假设和备则假设
H 0 : β j = 0, H1 : β j ≠ 0 j =1,2
计算t 计算 统计量的值 ˆ β1 −8.3553 t1 = = = −3.6474 S βˆ 2.2907
1
t2 =
ˆ β2 S βˆ
2
0.1801 = = 0.9016 0.1997
注意:一元线性回归中, 检验与F 注意:一元线性回归中,t检验与F检验是一致的 一方面, 检验与 检验与F检验都是对相同的原假设 一方面,t检验与 检验都是对相同的原假设 H0:β1=0 进行检验; 进行检验 检验; 另一方面,两个统计量之间有如下关系: 另一方面,两个统计量之间有如下关系:
F= y i2 ∑ˆ
Yi = β 0 + β1 X 1i + β 2 X 2i + L + β k X ki + ui
中的参数β1 , β 2 ,L , β k 是否显著不为0。
可提出如下原假设与备择假设:
H 0 : β1 = β 2 = LL = β k = 0 H1 : β1 , β 2 ,L , β k中至少有一个不为0
总离差平方和TSS = ∑ (Yi − Y )2 =∑ yi2
ˆ ˆ 回归平方和RSS = ∑ (Yi − Y ) 2 = ∑ yi2
ˆ 残差平方和ESS = ∑ (Yi − Yi )2 = ∑ ei2
自由度为n-1 自由度为k 自由度为n-k-1
调整的可决系数为:
ESS /(n − k − 1) R =1− TSS /(n − 1)
给定显著性水平α =0.05,查表得临界值F0.05 2,) 4.74 ( 7 =
判断比较:由于F > F0.05 2,),所以拒绝原假设H 0, ( 7 认为回归方程在总体上存在显著的线性关系。
2.关于拟合优度检验与方程显著性检验关系 . 的讨论 由
RSS ESS R = =1− TSS TSS
例3.5(教材 页) (教材67页 解:提出假设: 提出假设:
H 0 : β1 = β 2 = 0
H1 : β1 , β 2至少有一个不为0
计算检验统计量F的值: RSS / k 3046.8187 / 2 F= = = 26.4493 ESS /(n − k − 1) 403.1813/ 10- 2-1) (
四、参数的置信区间 在变量的显著性检验中已经知道: 在变量的显著性检验中已经知道:
t= ˆ βj − βj S βˆ
j
=
ˆ βj − βj e′e c jj n − k −1
t (n − k − 1)
容易推出:在(1-α )的置信水平下,β j的置信区间是
ˆ ˆ ( β j − tα × S βˆ , β j + tα × S βˆ )
对于给定的显著性水平α = 0.05,查t分布表 得临界值t0.025 (7) = 2.365。
t1 = 3.6474>2.365,所以否定H 0,β1显著地 不等于零,即可以认为该种商品的价格对商品 的需求量有显著性影响; 的需求量有显著性影响;
t2 = 0.9016<2.365,所以不否定H 0,即可以 认为消费者的平均收入对商品的需求量没有显 著性影响。
TSS = ∑ (Yi − Y )2 =∑ yi2 − − 总离差平方和