3 双变量模型:假设检验
经济计量学第三讲双变量回归模型的区间估计及其假设检验
决策准则:
5. 如果 t > tc 或 -t < - tc , 则拒绝 Ho
or | t | > | tc |
接受域
拒绝 H0 区域
( ) bˆ 2 -
t
c
a
* Se
2, n-2
bˆ 2
b2
东北财经大学数量经济系
拒绝 H0 区域
( ) bˆ 2
+
tc a 2,
*
n-2
Se
bˆ 2
第三节 双变量回归的假设检验(4)
t = 0.5091 - 0.3 = 0.2091 = 5.857 0.0357 0.0357
东北财经大学数量经济系
第三节 双变量回归的假设检验(7)
One-Tailed t-test (cont.)
2. 查表得知
tc 0.05, 8
where
tc 0.05 ,
8
=1.860
a = 0.05
3. 比较 t 和临界值 t
sˆ 2
Pr[(n - 2)
s 2 (n - 2)
sˆ 2
] =1-a
2 a/2
2 1-a / 2
东北财经大学数量经济系
第三节 双变量回归的假设检验(1) 第三节 双变量回归的假设检验
一、假设检验的基本问题 1.假设检验的基本思想 2.基本概念
二、假设检验的置信区间方法
东北财经大学数量经济系
一、正态性假定 1.正态性假定的含义 2.随机干扰项做正态假定的理由
二、在正态假定下OLS估计量的性质
东北财经大学数量经济系
第一节 正态性假定:经典正态线性回归模型(2)
三、最大似然法 1.双变量回归模型的最大似然估计 — 似然函数 — 最大似然法的基本思想 — 回归系数和随机干扰项的ML估计量
计量经济学 第3章 双变量模型:假设检验
假设检验的前提是什么?
本章框图 一、古典假设
回归结果好坏? 三、高斯马尔科夫定理
二、估计量的分布问题
四、 假设 检验
七、正态性检验
方法 统计量 显著性
结论
五、拟合优度 六、预测
一、OLS估计需要的基本假设有哪些?
一、OLS估计需要的基本假设有哪些?
一、OLS估计需要的基本假设有哪些
一、OLS估计需要的基本假设有哪些?
十三、案例2股票价格和利率
理论和假说 变量选择 数据6-13 散点图 估计和结果 结论的经济意义
十四、案例3房价和贷款利率
理论和假说 变量选择 数据6-6 散点图 估计和结果 结论的经济意义
十五、案例4古董和拍卖价格
理论和假说 变量选择 数据6-14 散点图 估计和结果 结论的经济意义
第3章 双变量模型:模型检验
引子、样本回归参数的估计问题
引子、样本回归参数的估计问题
结论:
样本回归系数随样本变化。 样本回归系数是随机变量,如何描述? 样本回归系数和总体回归参数是什么关系 基于什么条件下,利用最小二乘估计的得
到的样本回归系数可以用来作为总体回归 参数的估计? 根据什么说明:总体回归函数的模型设定 是正确的。
习题讨论
习题讨论
习题讨论
习题讨论
习题讨论
习题讨论
习题讨论
五、显著性检验方法的原理是什么
五、显著性检验方法的原理是什么
五、显著性检验方法的原理是什么
五、显著性检验方法的原理是什么
六、样本回归函数拟合数据好坏的标准是什么?
六、样本回归函数拟合数据好坏的标准是什么?
六、样本回归函数拟合数据好坏的标准是什么?
七、判决系数的性质有哪些?
第7章 双变量模型:假设检验
7.6 判定系数 拟合优度检验:对样本回归直线与样本 观测值之间拟合程度的检验。 度量拟合优度的指标:判定系数 R2
问题:采用普通最小二乘估计方法,已 经保证了模型最好地拟合了样本观测值, 为什么还要检验拟合程度?
x
2
2 i
)
ˆ 1 1 t ~ t (n 2) 2 2 ˆ se(1 ) ˆ xi
ˆ 1 1
斜率1的显著性检验
ˆ 1 1 t ~ t (n 2) 2 2 ˆ se(1 ) ˆ xi
在上述t统计量中假设1等于零,得到
ˆ 1 1
无偏性成立的关键条件
• CLRM的假设1:µ 和Xi不相关
案例分析
学生的数学考试成绩 被解释变量:在一次高中10年级标准化数学考 试中通过学生的百分比 解释变量:有资格接受联邦政府午餐补助学生 的百分比
math10 = 0 + 1 lnchprg+ 1的含义 1 > 0
Eviews
请解释斜率方差的决定因素
斜率方差的决定因素
1、解释变量的变化程度 解释变量的变化程度越大,对斜率的估 计越精确
0
1
0
1
斜率方差的决定因素
2、总体方差 总体方差越小,对斜率的估计越精确
0
1
Y
X
斜率估计量的标准差
sd() x
2
斜率估计量的标准误
7.3 OLS估计量的性质
当模型参数估计出后,需考虑参数估计值的 精度,即是否能代表总体参数的真值。 可从如下几个方面考察估计量的优劣性: (1)无偏性,即它的均值或期望值是否等 于总体的真实值; (2)有效性,即它是否在所有线性无偏估 计量中具有最小方差。 说明:线性指估计量为随机变量Y的线性函数
[农学]B03 假设检验:双变量模型
i
ˆ ) Var( ˆ ) / Se( 1 1
ˆ ) Se( 0
ˆ ) 2 [ X 2 / n ( X X )2 ] Var( i i 0
2 ( X X ) i
2 2 X /[ n ( X X ) ] i i
5
计量经济学
一、误差项的概率分布
1、进行OLS估计时,对误差项的概率分布没 有假定。对误差项的假定仅仅是:均值为0、没 有自相关且方差相等,有了这些假定,无论误 差项的分布为何,OLS估计量均为BLUE。 2、如果研究的目的只是估计参数,OLS方法 就可达到目的。但是,OLS估计量是误差项的 线性函数,所以OLS估计量的概率分布依赖于 误差项分布的假设。没有分布假设,就不可能 对估计的参数做出有意义的评价,也不可能进 行假设检验。
计量经济学
2、正态变量经过线性变换后仍为正态变量。 3、分布函数仅涉及两个参数:均值和方差。许 多现象都大致服从正态分布。 4、对于小样本或有限容量的样本,正态性假定 有助于推导出OLS估计量的精确概率分布,而且 2 能够用t、F和 分布来对回归模型的性质进行统 计检验。 ◎当样本容量较小时,应注意正态性假定是否 适当。当样本容量大到合理程度时,或许能够放 松正态性假定。
4
计量经济学
第2节
OLS估计的精度:标准误
一、标准误(Standard Error)
1、OLS估计量是样本的函数,评价估计量 的可信度或精度的工具是标准误。 在CLRM假定下,OLS估计量的标准误为: ˆ ) E( ˆ )2 2 / ( X X )2 Var(
18
计量经济学
五、关于假设检验的说明
第3章_双变量模型:假设检验
Yi = b1 + b2 X 2i + b3 X 3i + L + ui
(多元线性) 多元线性)
2. 解释变量X与扰动项u不相关假定 解释变量X与扰动项u
当X是非随机变量,即确定性变量时,该条件 是非随机变量,即确定性变量时, 自动满足; 自动满足; 是随机变量时,该假定要求X 不相关。 当X是随机变量时,该假定要求X与u不相关。
Yi = b1 + b2 X i + ei
ˆ Yi = b1 + b2 Xi
E ( Y X i )= B1+ B2 X i
Yi = B1+B2 X i + ui
双变量模型:假设检验 双变量模型:
X是
非随机的 随机误差项u是 随机的 Y 的生成是在随机误差项( 上加上一个非随机项( 由于Y的生成是在随机误差项( u)上加上一个非随机项( X),因而Y也 就变成了随机变量。 就变成了随机变量。 于是必须对yi的分布做一番讨论 的分布做一番讨论。 于是必须对yi的分布做一番讨论。 所有这些意味着:只有假定随机误差项是如何生成的, 假定随机误差项是如何生成的 所有这些意味着:只有假定随机误差项是如何生成的,才能判定样本 回归函数对真实回归函数拟合的好坏。 回归函数对真实回归函数拟合的好坏。
(博 彩 支 ) 最 小 二 乘 准 则
Y 出
Yi
ˆ SRF : Yi = b1 + b2 X i
e1
e3
e2
e4
X4
X
1
X
2
X
3
X(收入 收入) 收入
B1、B2的估计
双变量模型假设检验
2
x
2 i
var( b2 )
3.2 普通最小二乘估计量的方差与标准误
2 u 随机误差项 i的方差 的估计:
ˆ
2
e
2 i
n2
它是关于2的无偏估计量。
ei
ˆ
2
2
是残差平方和(RSS)
的正根称为估计值的标准差或是回归标准误
3-12
3.2 普通最小二乘估计量的方差与标准误
3.2.1 数学S.A.T一例的方差和标准误
1010
1010 10-8 3-13
10-8 0.000245
3.2 普通最小二乘估计量的方差与标准误
3.2.2 数学S.A.T一例的小结
估计的数学S.A.T函数如下:
ˆ 432.4138 0.0013 X Y i i se (16.9061) (0.000245)
3.1 古典线性回归模型
古典线性回归模型(CLRM)有如下7个基本 假定: 假定 3.1 回归模型是参数线性的,但不一 定是变量线性的。 假定3.2 解释变量X与扰动误差项不相关。 但是,如果X是非随机的(即其值为固定数 值),则该假定自动满足
cov( X i , ui ) 0 i=1,2, …,n
3-20
3-10
3.2 普通最小二乘估计量的方差与标准误
普通最小二乘估计量的方差和标准误
X 2 var( b1 ) n x
2 i 2 i
se( b1 ) var( b2 ) se( b2 )
3-11
var( b1 )
一旦知道了 ² ,很容易计 算等式右边的项,从而可 以求得OLS估计量的方 差和标准差
3-3
古扎拉蒂《经济计量学精要》(第4版)笔记和课后习题详解-双变量模型:假设检验(圣才出品)
第3章双变量模型:假设检验3.1 复习笔记一、古典线性回归模型古典线性回归模型假定如下:假定1:回归模型是参数线性的,但不一定是变量线性的。
回归模型形式如下:Y i=B1+B2X i+u i这个模型可以扩展到多个解释变量的情形。
假定2:解释变量X与扰动误差项u不相关。
但是,如果X是非随机的(即为固定值),则该假定自动满足。
即使X值是随机的,如果样本容量足够大,也不会对分析产生严重影响。
假定3:给定X,扰动项的期望或均值为零。
即E(u|X i)=0(3-1)假定4:u i的方差为常数,或同方差,即var(u i)=σ2(3-2)假定5:无自相关假定,即两个误差项之间不相关。
即:cov(u i,u j)=0,i≠j(3-3)无自相关假定表明误差u i是随机的。
由于假定任何两个误差项不相关,所以任何两个Y值也是不相关的,即cov(Y i,Y j)=0。
由于Y i=B1+B2X i+u i,则给定B值和X值,Y 随u的变化而变化。
因此,如果u是不相关的,则Y也是不相关的。
假定6:回归模型是正确设定的。
换句话说,实证分析的模型不存在设定偏差或设定误差。
这一假定表明,模型中包括了所有影响变量。
二、普通最小二乘估计量的方差与标准误有了上述假定就能够估计出OLS估计量的方差和标准误。
由此可知,教材式(2-16)和教材式(2-17)给出的OLS估计量是随机变量,因为其值随样本的不同而变化。
这种抽样变异性通常由估计量的方差或其标准误(方差的平方根)来度量。
教材式(2-16)和式(2-17)中OLS估计量的方差及标准误是:(3-4)(3-5)(3-6)(3-7)其中,var表示方差,se表示标准误,σ2是扰动项u i的方差。
根据同方差假定,每一个u i具有相同的方差σ2。
一旦知道了σ2,就很容易计算等式右边的项,从而求得OLS估计量的方差和标准误。
根据下式估计σ2:(3-8)其中,σ∧2是σ2的估计量,是残差平方和,是Y的真实值与估计值差的平方和,即()122212var ibiXbn xσσ==∑∑1se()b=()22222varbibxσσ==∑()2se b=22ˆ2ienσ=−∑2ie∑n -2称为自由度,可以简单地看作是独立观察值的个数。
计量经济学第3章习题作业
A n ≥ k +1 B n ≤ k +1 C n ≥ 30 D n ≥ 3(k +1)
6. 对于 Yi =βˆ0 + βˆ1Xi +ei ,以σˆ 表示估计标准误差,r 表示相关系数,则有( ) A σˆ=0时,r=1
B σˆ=0时,r=-1
C σˆ=0时,r=0
7. 简述变量显著性检验的步骤。 8. 简述样本相关系数的性质。 9. 试述判定系数的性质。
五、综合题
1. 为了研究深圳市地方预算内财政收入与国内生产总值的关系,得到以下数据:
年份
地方预算内财政收入 Y
国内生产总值(GDP)X
(亿元)
(亿元)
1990
21.7037
171.6665
1991
27.3291
184.7908
1436.0267
2000
225.0212
1665.4652
2001
265.6532
1954.6539
要求:
(1)建立深圳地方预算内财政收入对 GDP 的回归模型;
(2)估计所建立模型的参数,解释斜率系数的经济意义;
(3)对回归结果进行检验;
(4)若是 2005 年的国内生产总值为 3600 亿元,确定 2005 年财政收入的预测值和预
)
A 可靠性
B 合理性
C 线性
D 无偏性
E 有效性
5. 剩余变差是指(
)
A 随机因素影响所引起的被解释变量的变差
B 解释变量变动所引起的被解释变量的变差
C 被解释变量的变差中,回归方程不能做出解释的部分
D 被解释变量的总变差与回归平方和之差
07_双变量模型:假设检验
ˆ ) X i 2 var( b1 n xi2 ˆ ) 1 2 var( b2 2 xi
2
其中, 2
为扰动项的方差。
因此,在标准假定之下的回归系数的OLS估计 量是最优线性无偏估计量(BLUE) 高斯---马尔可夫定理 经验证明:蒙特卡罗模拟 p175
(二) 回归系数的区间估计:
当用回归标准差估计扰动项方差时,可证 明以下统计量服从t分布:
ˆ ˆ ) Xi b1 b1 ˆ t1 ~ t (n 2) 其中,Se(b1 2 n xi ˆ Se(b1 )
2
ˆ b2 b2 t2 ~ t ( n 2) ˆ Se(b2 )
ˆ ˆ ˆ ˆ (Yi Y ) 2 (Yi Yi ) 2 2 (Yi Y )(Yi Yi ) ˆ ˆ (Yi Y ) 2 (Yi Yi ) 2 ˆ (Yi Y ) 2 ei 2
2 ˆ (Yi Y ) :回归平方和,记为 ESS(explained sum of squares) ;
5.无自相关或序列相关(no autocorrelation)假定: 不同扰动项之间的协方差为零,即: ui , u j ) 0, i j cov( cov( 该假定等价于: Yi , Y j ) 0, i j
6. 回归模型的设定是正确的,即模型不存在设定 偏 差 (Specification bias) 或 设 定 误 差 (specification error)。
八、回归结果的书面表达方式
估计方程式 标准差、t统计量、p值; 主要统计量:R2 ,F值,回归标准误,DW值 等。
4--双变量回归:假设检验
b2 Z 2 SE (b2 )
3、总体服从正态分布( 2未知,即SE (b2)未知)
t
b2 B2 ~ t (n 2) ˆ (b ) SE 2
对给定的置信概率1 ,查t分布表确定临界值 t 2,由
P{t ( ) t t ( ) } 1 2 n2 2 n2
b2 B2 ~ N (0,1) SE (b2 )
P[b2 Z 2 SE (b2 ) b2 b2 Z 2 SE (b2) ] 1
参数B 2的置信度为1 的置信区间为
b2 z 2 SE (b2 )
2、 2未知(即SE (b2)未知),且为大样本时,B2的置信度为1 的置信区间为
第三讲 双变量模型:假设检验
• 假设检验 • 估计回归直线的“优度” • 怎样判别它确实是真实的总体回归函数的 一个好的估计量呢? • 如何仅仅根据一个样本,来确定样本回归 函数确实是真实总体回归函数的一个好的 近似呢?
ui是如何生成的
• 只有对ui的生成做一些特殊的假定,才能完 成假设检验。 • 古典线性回归模型 • (Classical Linear Regression Model, CLRM)。
假定5:随机扰动项服从正态分布
ui ~ N (0, )
2
Yi ~ N (b1 b2 X i , 2 )
7
6.2 普通最小二乘估计量的方差与标准差
为估计值的标准差(standard error of the estimate)或是回归标准差(s t a n d a r d error of theregression), Y值偏离估计的回归直线的标准方 差。 估计回归线的拟合优度(goodness of fit)的简单度量,
第3章 双线性模型:假设检验
Chp 3 双变量模型:假设检验
主要内容
古典线性回归模型的假定 OLS估计量及其性质 OLS估计量的方差与标准误 OLS估计量的抽样分布(概率分布) 假设检验 拟合优度 正态性检验 预测
3.1
古典线性回归模型
线性回归模型的基本假设
假设1. 回归模型是参数线性的,但不一定是变量 线性; Yi=B1+B2Xi+ui
高 斯 — 马 尔 可 夫 定 理 (Gauss-Markov theorem)
在给定经典线性回归的假定下,最小 二乘估计量是具有最小方差的线性无偏估 计量。
蒙特卡洛试验 OLS估计量的无偏性可以通过蒙特卡洛试验验证。 假设有如下信息:
与相应的真实值1.5、2、4很接近,反复的应用最小二乘法,平均的看,估计值将 等于真实值。
同方差
异方差
假设5. 无自相关假定,即:
Cov(ui, uj)=0, ij 由该假定可得,Cov(Yi, Yj)=0, ij ,即Y也不相 关。
假设6. 回归模型是正确设定的,即模型不存在设 定误差(错误)无自相关假定,即: Cov(ui, uj)=0, ij
由该假定可得,Cov(Yi, Yj)=0, ij ,即Y也不相关。
n xi
2 X i
2 2
var (b2) =
2 b2
x
2
2 i
se (b2) var (b2)
其中 var 表示方差, se 表示标准误, 是
2
扰动项i的方差。
一旦知道了 2,就可以求出等式右边的项, 从而求出OLS的方差和标准误。通常根据 下式估价
2
=
双变量模型假设检验
第六章 双变量模型:假设检验本章目的:介绍如何检验样本回归直线对总体回归函数的拟合程度要求:掌握古典线性回归模型的基本假定;OLS 估计量方差、标准差的含义;回归标准差的含义、高斯---马尔柯夫定理的内容;会运用计算机软件得到回归方程。
教学时数: 6学时第一节至第五节:3学时第一节 介绍古典线性回归模型的基本假定及含义1、误差项均值为零 E(u i )=02、误差项同方差 V ar(u i )=σ23、误差项无自相关 Cov(u i ,u j )=04、解释变量与误差项不相关 Cov(X i ,u i )=0 i,j=1,2,3….., i ≠j第二节 OLS 估计量的期望值(均值)、方差、标准差1、OLS 估计量是随机变量对于回归模型 Y i =B 1+B 2X i +u i参数的OLS 估计量为∑∑=-=2221iii xy x b X b Y b由于u 是随机变量, Y 是随机变量u 与非随机变量X 的代数和,则Y 也是随机变量。
由OLS 估计量的表达式可以看出b 1、b 2是Y 的线性函数,所以b 1、b 2也是随机变量。
2、OLS 估计量的期望值E(b 1)= B 1,E(b 2)= B 2可见b 1、b 2 分别为B 1 、B 2无偏估计量。
3、OLS 估计量的方差方差量度随机变量与其平均值的偏离程度,OLS 估计量的方差与观测值及随机误差项 的方差有关系2122)var(σ∑∑=iix n X b)v a r (11b b =σ∑=22)var(2ix b σ)v a r (22b b =σ4、由于我们通常不知道误差的生成过程,当然也不知道误差项的方差,通常使用残差信息来估计误差的方差2ˆ22-=∑n eiσ且22)ˆ(σσ=E5、我们用样本信息、残差信息来估计OLS 估计量的方差和标准差如下21ˆ)ˆvar(22σ∑∑=ii x n X b )ˆv a r ()(11b b se = ∑=22ˆ2)ˆvar(ix b σ)ˆv a r ()(22b b se =6、计算Widget 教科书需求函数中参数的标准差第三节 OLS 估计量的性质1、高斯---马尔柯夫定理如果满足古典线性回归模型的基本假定,OLS 估计量是最优线性无偏估计量。
第3章 双变量模型:假设检验
2X
例题2 假设有人做了如下的回归
yi b1 b2 xi ei
其中,yi,xi分别为Yi,Xi关于各自均值的 离差。 问b1和b2将分别取何值?
解: 1 1 记 x n xi , y n yi ,则易知
于是
b2
x y 0
( x x )( y y ) x y (x x) x
6.回归模型是正确设定的。
3.2 OLS估计量的方差与标准差
var(b1 ) b21 n xi X i2
2 2
se(b1 ) var(b1 )
var(b2 ) b22
x
2
2 i
se(b2 ) var(b2 )
ˆ
2
e
2 i
n2
3.3 OLS估计量的性质
(5) 利用前面所产生的10个 值,将Yi 对 X 进行回归,并 得到b1和b2的值。
(6)重复上述过程21次,我们 将得到如表3-2所示的结果 (即Table 3-2)。
结论: 假如反复利用最小二乘法求解参数 的估计值,所估计出的参数的平均值将 等于其真值。也就是说,OLS 估计量是 无偏的。
故有:
e
2 i
[( B2 b2 ) 2 xi2 2( B2 b2 ) xi (ui u ) (ui u ) 2 ] ( B2 b2 ) xi2 (ui u ) 2 [( ki ui ) xi (ui u )]
2 2 2 2
ˆ ( yi yi ) [( B2 b2 ) xi (ui u )]
2
k
2 i
(c i k i )
2 k i2
第3章 双变量模型-假设检验(1)
n
Xi X Yi Y b2 2 X X i 参数估计量的计算公式为: b1 Y b2 X
消费支出Y 3000 2500 2000 1500 1000 500 0 0
可支配收入X 1000 2000 3000 4000
小结:用EXCEL和Eviews实现最小二乘法
随机误差项ui的方差2的估计
由于随机项ui不可观测,只能从ui的估计——残差ei出发, 对随机项ui的方差2进行估计。
由数理统计的基本原理可以证明,2的最小二乘估计量为
ˆ
2
2 e i
n2
或
2 e i
2 2 2 2 e y b x i i 2 i 2 ˆ n 2 n 2
第3章 双变量模型参数的统计检验
一、线性回归模型的基本假设
二、普通最小二乘估计量的方差与标准误
三、OLS估计量的概率分布
四、变量的显著性检验
五、参数的置信区间
§3.1 线性回归模型的基本假设
回归分析的主要目的是要通过样本回归函数(模型)SRF 尽可能准确地估计总体回归函数(模型)PRF。
估计方法有多种,其种最广泛使用的是普通最小二乘法 (ordinary least squares, OLS)。
为保证参数估计量具有良好的性质,使用普通最小二乘法 通常对模型要提出若干基本假设。
线性回归模型的基本假设
假设1、解释变量X是确定性变量,不是随机变量 假设2、随机误差项具有零均值、同方差和不序列相关性
如果假设1、2 满足,则假设 3也满足; 如果假设4满 足,则假设2 也满足
E(ui)=0
量中,OLS估计量是具有最小方差的最优线性无偏估计量。
3第三章双变量模型 假设检验
如何进行呢?
置信区间法 变量的显著性检验
31
3.5假设检验
建立从样本到总体间的联系 数学S.A.T一例
P45见3-16,ˆ1 =0.0013,Sˆ1 =0.000245,自由度为8(n-2)
t
ˆ1 -1
ˆ /
xi 2
tn2
假定显著性水平 为5%据附录P387可查 t0.05/2 8 2.306
那么,在一次抽样中,参数的估计值与真值的差异有 多大,是否显著,这就需要进一步进行假设检验。
若知道某个估计量的概率分布,则可建立从样本到总 体的联系。
26
3.5假设检验
如何建立从样本到总体间的联系
ˆ1 ~ N (1,
2
) xi2
ˆ0 ~ N ( 0 , n
X
2 i
2)
x
2 i
由于 ˆ1服从正态分布,则变量Z服从标准正态分布
Z = ˆ1 -1
ˆ1 -1
S ˆ1
/
xi 2
N 0, 1
由于 未知,需用 ˆ 代替,则变量t服从t分布
t
ˆ1 -1
ˆ /
xi 2
tn2
数学S.A.T一例
27
假设检验
先给定对总体参数值的原假设和备择假设, 然后根据样本信息,对原假设下的结果进行分析, 判断是否拒绝原假设。(拒绝原假设;不拒接原假设)
1
Step4: 如果原假设的 *值落在该区间中,则不拒绝原假设,
否则,拒绝原假设。
29
3.5.2变量的显著性检验
检验步骤:
计量经计学中,主要是针对变量的参 数真值是否为零来进行显著性检验的
(1)对总体参数提出假设 H0: 1=*, H1:1 *
第3章双变量模型假设检验
正态分布随机变量的线 性函数也服从正态分布
应变量Y也服从正态分布
OLS估计量是线性估计量,是应变量Y的线性函数 正态分布随机变量的线性 函数也服从正态分布
OLS估计量也服从正态分布
b1
N ( B1 ,
X n x
2 2
2
)
b2
N ( B2 ,
x
2 2
)
为什么要推导OLS估计量的抽样分布?
异方差
Y
var(i | X i ) i 2
var(i | X1 ) 12
var(i | X 3 ) 32
X1
X2
X3
X
假定3.5 无自相关假定, Cov(ui , u j ) 0
i j
ui
ui
ui
uj
uj
uj
3.2 OLS估计量的方差与标准误
OLS估计量是随机变量,这样,就会产生抽样误差, 即不同样本的估计值的差异。
2 var( | X ) 假定3.4 同方差假定 i i
Y
var(i | X 3 ) 2
var(i | X1 ) 2
X1
X2
X3
X
假定同方差的目的是从不同的子总体中抽取 的Y值都是同样可靠的。因为它们各自的方 差是相等的,其分散程度相同。
相反,如果存在异方差,不同的子总体的方差 不同,那么一般说来,从方差较大的子总体中 抽取的Y值代表性较____。
Y
E(u | X 3 ) 0
E(u | X1 ) 0
X1
X2
X3
X
对于确定性的总体回归函数
E(Y | X i ) B1 B2 X i
双变量模型之假设检验
ˆ 2 ei2 yi2 ˆ12 xi2 4590020 0.7772 7425000 13402
n2
n2
10 2
Sˆ0 ˆ 2
X
2 i
n
xi2 13402 53650000 /10 7425000 98.41
t
ˆ0 0
因此,定义 拟合优度:回归平方和ESS/总离差平方和TSS
2020/2/10
qcc
9
2、可决系数R2统计量
记
R2 ESS 1 RSS
TSS
TSS
称 R2 为(样本)可决系数/判定系数 (coefficient of determination)。
可决系数的取值范围:[0,1]
R2越接近1,说明实际观测点离样本线 越近,拟合优度越高。
R 2
ˆ12
xi2 yi2
在例收入-消费支出例中,
R2 ˆ12
xi2 yi2
(0.777)2 7425000 0.9766
4590020
注:可决系数是一个非负的统计量。它也是
随着抽样的不同而不同。为此,对可决系数
的统计可靠性也应进行检验。
2020/2/10
2020/2/10
qcc
15
二、变量的显著性检验
回归分析是要判断解释变量X是否是被解释变量Y 的一个显著性的影响因素。
在一元线性模型中,就是要判断X是否对Y具有显 著的线性影响。这就需要进行变量的显著性检验。
变量的显著性检验所应用的方法是数理统计学中的 假设检验。
计量經濟学中,主要是针对变量的参数真值是否为 零来进行显著性检验的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
E(u | X i ) 0
因此,给定 X ,随机扰动项 u i 的均值为零。由此可以得到 下图(见下一页):
i
扰动项 u i 的条件分布
4.随机误差项 u i 的方差为常数,或同方差;否则称为异方差。 即:
var(ui ) E(ui 2 ) 2
同方差
异方差
5.两个误差项之间不相关,即:
四、判定系数
r2
2
判定系数(Coefficient of Determination)r 用来度量 2 回归线拟合真实Y值的优劣程度。r 的计算过程如下:
首先有:
ˆ e Y i Y i i
恒等变化后得到: ˆ Y ) (Y Y ˆ )(即e ) Yi Y (Y i i i i
相关系数与判定系数
根据以前的知识可知:
r
(X
i 2 i
i
X )(Yi Y )
( X i X ) 2 (Yi Y ) 2
x y x y
i
2 i
可知判定系数与相关系数之间的关系为:
r r2
五、回归结果的报告
对于教材来说,回归分析结果(博彩一例)常写成如下形式:
该模型参数 B1 和 B2 的最小二乘估计量分别是
b1 Y b2 X
b2
x y x
i 2 i
i
X Y nXY X nX
i i 2 i 2
更详细地说,OLS估计量具有如下性质: (1)b1和b2是线性估计量,即它们是随机变量Y的线性函数。 E (b1 ) B1 和 (2) b1 和 b2 分别是 B1 和 B2 的无偏估计量,即有: E (b2 ) B2。 (3)b1和b2是有效估计量。即 var(b ) 小于任何一个 B 的线性无 var (b2 ) 小于任何一个 B 的线性无偏估计 偏估计量的方差, 量的方差。因此,与其他任何能够得到真实参数无偏估计 量的方法相比,OLS法更准确地估计了 B1 和 B2 。 ˆ 2 ) 2 ;即误差方差的OLS估计量是无偏的。 (4) E(
博彩一例的Eviews输出显示
博彩一例Eviews输出结果的实际Y值、估计的Y值以及残差 图:
正态性检验 1.残差直方图
残差直方图是用于获知随机变量密度函数(PDF)形状的一种简单工 具。图中,横轴是经过区间划分的残差,纵轴是对应于每一个区的频 数。 例如:博彩一例的残差直方图如下图
Series: RESID Sample 1 10 Observations 10
ˆ2 e
2 i
n2
ˆ ) 为残差平方和(RSS)。 ˆ 2 常作为 2 的 其中, e (Y Y 估计量。需要指出的是:
2 i 2 i
ˆ ˆ2
称为回归标准误(standard error of the regression,SER),ˆ ˆ 值越小,Y的实际值 常用来度量估计回归线的拟合优度。 越接近根据回归模型得到的估计值。
残差平方和(residual sum of squares,RSS ) ,Y变异未被解释
e
2 i
的部分。
根据以上分析,可以有如下式:
TSS ESS RSS
如果选择的SRF很好地拟合了样本数据,则ESS远大于 RSS。如果所有真实的Y值都落在了SRF上,则ESS等于TSS, RSS等于0;另一方面,如果SRF拟合得不好,则RSS远大 于ESS。一般来讲,如果ESS相对比RSS大,则SRF能够在很大 程度上解释Y的变异;如果RSS相对大一些,则SRF只能够部 分解释Y的变异。 为了便于分析,将上式进行变换如下:
例如博彩支出一例,结果见下表:
估计的博彩支出一例的函数:
ˆ 7.6182 0.0814 X Y i i
se (3.053) (0.0112)
三、OLS估计量的抽样分布及假设检验
根据古典线性回归模型的假定,参数估计量的抽样分布为:
b1~ N ( B1 , )
2 b1
2 b2 ~ N (B2 , b ) 2
它服从自由度为 n 2 的t分布。 例如博彩一例。可以计算得到t统计量的值为:
t 0.0814 7.2624 0.0112
对于显著性水平分别为1%、5%、10%来说,得到 t 的临界值见 下图:
由临界值和t值的对比可以得到结论:拒绝零假设。
3.利用P值进行检验
本例t统计量的p值约为0.0001。如果在p值这个水平上拒绝零假设, 则犯错误的机会只有万分之一。
第三章 双变量模型:假设 检验
上海立信会计学院
1.古典线性回归模型的假设 2.普通最小二乘估计量的方差、标准误以及高斯-马
尔柯夫定理
3.OLS估计量的抽样分布或概率分布 4.假设检验 5.判定系数 6.回归分析结果的报告
上一章用最小二乘法对计量经济模型的待估参数进行了估 计,并得到了解释变量与被解释变量之间的数量关系。例 如博彩一例得到如下需求函数:
假设有如下一元线性回归模型
Yi B 1 B 2 X i ui
则对它的假定如下: 1.回归模型是参数线性的。 2.解释变量与扰动项不相关,即有:
C ov(ui , X i ) E([ui E(ui )][ X i E( X i )]) E(ui X i ) 0
3.给定 X i ,扰动项的期望值为零,即:
1
1
2
2.普通最小二乘估计量的方差和标准误
那么,依照我们对模型做出的假设可以有如下结论:
var(b1 )
2 b1
X n x
2
2 i 2 i
2
se(b1 ) var(b1 )
var(b2 )
2 b2
x
2 i
se(b2 ) var(b2 )
其中,se 表示标准误. 2 一旦知道了 ,就可以根据上式计算各统计量的方差等,但 一般情况下 2 是一个需要估计的参数。常常根据下式估计 2 :
2
2
2
2 i
t
b2 B2 ˆ/
其中,2为包括截距在内的参数 的个数
2 i
x
~
tn 2
1.置信区间法 设显著性水平为 ,则可以得到如下式子:
P ( t / 2 b2 B2 ˆ/
x
2 i
t / 2 ) 1
继而得到 B2 的一个显著性水平为 的置信区间
cov(ui , u j ) E(ui u j ) 0, i j
由于任何两个扰动项不相关,所以任何两个Y也是不相关 的,即:cov(Y , Y ) 0. 。见下图:
i j
自相关的几种情况
6.回归模型是正确设定的。或者说,实证分析的模型不存 在设定误差或设定错误。 7.在总体回归函数 Yi B1 B2 X i ui 中,随机误差项 u i 服 从均值为0,方差为 2 的正态分布。即:
上式中出现的各种平方和定义如下: 均值Y 的总变异。
y
2 i
总平方和(total sum of squares,TSS) ,真实Y值围绕其
ˆ 的变异,也称为回归平方和(由解释变量解释的部分)。 其均值 Y
ˆ y
2 i
,估计的Y值围绕 解释平方和(explained sum of sqrares,ESS)
ui
N (0, )
2
注意:这个假设的理论基础来自中心极限定理(Central Limit Theorem,CLT)
二、高斯-马尔柯夫定理以及普通最 小二乘估计量的方差、标准误
由于普通最小二乘估计量是随机变量,所以我们想了解这 些随机变量的概率分布、方差和标准误等数字特征,同时 也想了解普通最小二乘估计量的性质。
P (b2 t / 2
ˆ
x
2 i
B2 b2 t / 2
ˆ
x
2 i
) 1
例如博彩一例,如果设 5% ,则可以得到 B2 的一个 置信区间为:
0.0814 2.306(0.0112) B2 0.0814 2.306(0.0112)
即:
0.0556 B2 0.1072
Yi 的变异
由 X 变异所 解释的部分 未解释部分
如图:
Yi 变异的分解图
用小写字母表示与均值的离差,得: ˆi ei yi y ˆi b2 xi,得到: 由于 y
yi b2 xi ei
对上上式两边同时平方再求和,经过简单数学变换,得:
y
2 i
ˆ y
2 i
2 ei
ˆ 7.618 0.081X Y i i
现在的问题是:如何根据一个样本,确定估计的回归 函数(样本回归函数)确实是真实总体回归函数的一个好 的近似? 怎么判断最小二乘法是否是一个拟合样本数据 的好的方法? 在对以上问题做出回答以前,我们必须对总体回归函数做 出一些必要的假设。
一、古典线性回归模型的假设
1.高斯-马尔柯夫定理 高斯-马尔柯夫定理:如果满足古典线性回归模型的基