古扎拉蒂计量经济学第四版讲义Ch7 Heteroscedasticity
管理研究方法07-计量经济学方法new(二)

1. 多重共线性问题
多重共线性的例子 例1:消费—收入的例子 例2:农民消费与农业产值 多重共线性的程度 -- pp 313 多重共线性的原因:--pp313 -- 数据采集方法和范围 -- 模型或总体受到约束 -- 模型设定 -- 过度决定的模型(样本信息过于集中)
--cont’
多重共线性的实质 -- 样本(间)的回归现象
问题的提出:
自相关是指按时间顺序或空间顺序排列的观察值之间的相关现 象,又称序列相关。 Cov(Ui,Uj)= E(Ui,Uj)≠0
自相关的来源:pp395-398
在经济时间序列中,序列相关现象之所以经常存在,是因为模 型常把一些不重要的或无法观测到的因素都包括在随机误差中, 而这些因素往往具有时间趋势,从而在随机误差项Ut中体现了在 时间先后上的某种相关性。 -- 惯性:时间序列数据的回归中,连续观测值可能是相互依存 的。 -- 省略了不该省的解释变量
问题的提出 -- 不满足统计假设中的随机扰动项同方差
同方差(homo-scedasticity):E(ui2 )=σ2 异方差(heter-scedasticity):E(ui2 )=σi2 -- 实际经济问题的同方差假定不合理 (尤其时间序列数据,要格外当心!) 异方差的来源 -- 干中学,边错边改(error - learning) -- 行为方式或偏好发生改变 -- 数据采集技术的改进,使误差可能减小 -- 异常值(离群值,outliers)的出现 -- 模型设定错误
☆ 估计的方差可能增大:
Var(1* ) Var(1ols )
☆OLS剩估余计的式方的差方E差(和∑e标i2)准可差能也低可估能扰低动于项真u实t的的方方差差σ和2 ;标 准差。
☆ 使检验失效, 如 t – 检验(t -值放大),拒绝H0
计量经济学(英文PPT)Chapter 11 HETEROSCEDASTICITY

n n
X iYi
X
2 i
(
X i Yi Xi )2
(11.2.1)
under the assumption of heterscedasticity namely:
var(2 ) (
xi2
2 i
xi2 )2
(11.2.2) return
under the assumption of homoscedasticity namely::
(11.2.2)
The Method of Generalized Least
Squares(GLS)
The usual OLS method does not make use of the information, but GLS(generalized least squares) take such information into account
Consequences of Using OLS in the Presence of Heteroscedasticity
Suppose
we
use
2
,
and
use
the
variance
formula
given
in
(11.2.2),
which takes into account heteroscedasticity explicitly.
2
ui (Yi 1 2 Xi )2
(11.3.10)
But in GLS we minimize the expression(11.3.7),
which can also be written as:
古扎拉蒂计量经济学第四版讲义Ch5 Dummy Variables Models

第五章 虚拟变量回归模型Dummy Variable Regression Models1、什么是虚拟变量?名义型变量又称为指标变量、分类变量、定性变量,或者虚拟变量(哑变量)。
2、方差分析模型(ANOVA models )一种类型的回归模型就是解释变量全部是虚拟变量,这样的模型称为Analysis of Variance (ANOV A) models 。
假如我们想检验东(10个省)中(12个省)西(9个省)部三个地区教师的平均收入是否不同。
对三个地区教师工资数据取算术平均值,发现不同,这种不同显著吗?一般用D 表示哑变量,设定如下的哑变量: D2 =1 代表东部省份;否则用0表示 D3 =1代表中部省份;否则用0表示可以写出如下的模型12233i i i i y D D βββε=+++ 9.2.1这类似于一般的多元回归模型的形式。
假定该模型的误差项满足通常OLS 回归的假定,对上式两边取期望,得到 对东部地区: ()2312|1,0i i i E y D D ββ===+ 对中部地区: ()2313|0,1i i i E y D D ββ===+ 对西部地区: ()231|0,0i i i E y D D β===假定回归结果为()()()2322158.622264.6151734.473:0.00000.03490.23300.0901i i i y D D p R =++=1)虚拟变量使用注意使用虚拟变量要小心,特别要注意以下几点:1)一个定性解释变量如果分成m 类,则用m-1个哑变量表示;如果分成m 类用m 个哑变量表示,则会掉进哑变量陷阱,即引起多重共线性。
该规则同样适用于两个定性解释变量的情形。
2)对于一个定性解释变量,其没有赋予值1的区间称为基准区间(base, benchmark, control, comparison, reference, or omitted category )。
经济计量学精要(第4版)(美)古扎拉蒂

⭐️经济计量学精要(第4版)/(美)古扎拉蒂大佬点个赞支持一下呗ヽ(´▽`)ノヽ(´▽`)ノヽ(´▽`)ノ经济计量学精要(第4版)/(美)古扎拉蒂•综述1.1 什么是经济计量学1.2 为什么要学习经济计量学1.3 经济计量学方法论经济计量分析步骤:(1)建立一个理论假说(2)收集数据(3)设定数学模型线性回归模型为例线性回归模型中,等式左边的变量称为应变量,等式右边的变量称为自变量或解释变量。
线性回归分析的主要目标就是解释一个变量(应变量)与其他一个或多个变量(解释变量)之间的行为关系。
简单数学模型•(4)设立统计或经济计量模型误差项u•u代表随机误差项,简称误差项。
u包括了X以外其他所有影响Y,但并未在模型中具体体现的因素以及纯随机影响。
(5)估计经济计量模型参数线性回归模型常用最小二乘法估计模型中的参数^读做"帽",表示某的估计值(6)核查模型的适用性:模型设定检验(7)检验源自模型的假设:假设检验(8)利用模型进行预测数据类型时间序列数据:按时间跨度收集得到的截面数据:一个或多个变量在某一时间点上的数据集合合并数据:既包括时间序列数据又包括截面数据面板数据:也称纵向数据、围观面板数据,即同一个横截面单位的跨期调查数据模型因果关系统计关系无论有多强,有多紧密,也决不能建立起因果关系,如果两变量存在因果关系,则一定建立在某个统计学之外的经济理论基础之上。
第一部分线性回归模型2.1回归的含义回归分析的主要目的:根据样本回归函数SRF估计总体回归函数PRF2.2总体回归函数(PRF):假想一例总体回归线给出了对应于自变量的每个取值相应的应变量的均值。
(总体回归线表明了Y的均值与每个X的变动关系)PRL•E(Y|xi)表示与给定x值相对应的Y的均值。
下标i代表第i个子总体。
B1、B2称为参数,也称为回归系数。
B1称为截距,B2称为斜率。
斜率系数度量了X每变动一单位,Y( 条件)均值的变化率。
计量经济学(第四版)课件:一元线性回归分析基础

一元线性回归分析基础
第三节 最小二乘估计量的性质
β*1= - β1 =(1/n)∑Yt- ∑btYt =∑[(1/n)- bt]Yt 令 at= [(1/n)- bt] 由于和bt均为非随机变量,所以at也是非随机变量。 因此 β*1 =∑atYt 即β*1是Yt的线性组合。
一元线性回归分析基础
第三节 最小二乘估计量的性质
二、无偏性 指β*1和β*2 的期望值分别等于总体参数β1和β2。 即E(β*1)=β1 E(β*2 )=β2 E(β*2 )=E(β2+∑btut) =β2+∑btE(ut) =β2 E(β*1)=E(β1+∑atut) =β1
总体
有限总体
无限总体
任何样本都是有限的
一元线性回归分析基础
第三节 最小二乘估计量的性质
一、线性特性
是指参数估计值β*1和β*2分别为观察值Yt或扰动项ut的线性组合。
证: β*2 =∑Xtyt/ ∑Xt2 =∑Xt(Yt- )/∑X2t =∑(Xt/∑Xt2)Yt 令 bt= (Xt/∑Xt2) 得 β*2 = ∑ bt Yt 即β*2 是Yt的线性组合
一元线性回归分析基础
第三节 最小二乘估计量的性质
2.证明最小方差性 假设β**2是其他方法得到的关于β2的线性无偏估计 β**2=∑ctYt 其中,ct=bt+dt,dt为不全为零的常数 则容易证明 var(β**2)≥ var(β*2) 同理可证明β1的最小二乘估计量β*1具有最小方差。 高斯—马尔可夫定理(Gauss-Markov theorem): 满足性质1、2、3的最小二乘估计量是最优线性无偏估计量(best linear unbiased estimator:BLUE)
古扎拉蒂《经济计量学精要》(第4版)笔记和课后习题详解-双变量模型:假设检验(圣才出品)

第3章双变量模型:假设检验3.1 复习笔记一、古典线性回归模型古典线性回归模型假定如下:假定1:回归模型是参数线性的,但不一定是变量线性的。
回归模型形式如下:Y i=B1+B2X i+u i这个模型可以扩展到多个解释变量的情形。
假定2:解释变量X与扰动误差项u不相关。
但是,如果X是非随机的(即为固定值),则该假定自动满足。
即使X值是随机的,如果样本容量足够大,也不会对分析产生严重影响。
假定3:给定X,扰动项的期望或均值为零。
即E(u|X i)=0(3-1)假定4:u i的方差为常数,或同方差,即var(u i)=σ2(3-2)假定5:无自相关假定,即两个误差项之间不相关。
即:cov(u i,u j)=0,i≠j(3-3)无自相关假定表明误差u i是随机的。
由于假定任何两个误差项不相关,所以任何两个Y值也是不相关的,即cov(Y i,Y j)=0。
由于Y i=B1+B2X i+u i,则给定B值和X值,Y 随u的变化而变化。
因此,如果u是不相关的,则Y也是不相关的。
假定6:回归模型是正确设定的。
换句话说,实证分析的模型不存在设定偏差或设定误差。
这一假定表明,模型中包括了所有影响变量。
二、普通最小二乘估计量的方差与标准误有了上述假定就能够估计出OLS估计量的方差和标准误。
由此可知,教材式(2-16)和教材式(2-17)给出的OLS估计量是随机变量,因为其值随样本的不同而变化。
这种抽样变异性通常由估计量的方差或其标准误(方差的平方根)来度量。
教材式(2-16)和式(2-17)中OLS估计量的方差及标准误是:(3-4)(3-5)(3-6)(3-7)其中,var表示方差,se表示标准误,σ2是扰动项u i的方差。
根据同方差假定,每一个u i具有相同的方差σ2。
一旦知道了σ2,就很容易计算等式右边的项,从而求得OLS估计量的方差和标准误。
根据下式估计σ2:(3-8)其中,σ∧2是σ2的估计量,是残差平方和,是Y的真实值与估计值差的平方和,即()122212var ibiXbn xσσ==∑∑1se()b=()22222varbibxσσ==∑()2se b=22ˆ2ienσ=−∑2ie∑n -2称为自由度,可以简单地看作是独立观察值的个数。
古扎拉蒂计量经济学第四版讲义Ch6 Multicollinearity

v ' j ( X ∗ ' X∗ ) v j ≅ 0
这也就意味着对特征向量 v j ,有
∑v x
l =2 lj
K
∗ l
≅0
其中, vij . 是向量 v j 的第 i 个元素。
2、存在多重共线性的 OLS 估计 1)在完全多重共线性(perfect multicollinearity)在情况下,回归系数不可确定,其标准误 差无限大。 实际上就是 b = ( X ' X ) X ' y 和 var ( b ) = σ
λ1x1 + λ2 x 2 + " + λK x K = 0
10.1.1
其中,λ1 , λ2 ," λK 为不同时为 0 的常数。实际中,除非观察值的个数小于解释变量的个数, 或者,掉入虚拟变量陷阱的情形,上述表达式成立的机会很小。 现在,多重共线性的含义更加广泛,不仅包括如上面 10.1.1 式表示的情形,而且也包括如下 解释变量 x 不是 perfect 线性关系,而是交互相关(intercorrelated)的情形,即:
(
)
(
)
yi − y = ( b2 + λ b3 ) xi 2 + ei = axi 2 + ei
其中, a = b2 + λb3 。 因此,在完全共线性情况下,利用 OLS 可以估计出
a = b2 + λb3 =
∑ ( y − y )( x − x ) ∑(x − x )
i i2 2 2 i2 2
多重共线性之矩阵说明 考虑一般多元线性回归模型(3.2)。多重共线性的根源就来自数据矩阵 X 的列的性质。假如 把 X 按列分块,
古扎拉蒂计量经济学第四版讲义Ch3 Simple Linear Regression

而 有 些 模 型 即 使 转 换 也 不 能 够 linearized in the parameters , 这 样 的 模 型 称 为 intrinsically nonlinear regression model,简称为非线性回归模型(NLRM)。如:
( ) Yi = β1 +
0.75 − β1
or
Yi = E (Y | Xi ) + εi
这里,偏差 εi 是一个不可观察的随机变量,可以取正值或负值。 我们把 εi 称为随机干扰项(stochastic disturbance)或随机误差项(stochastic error
term),它是随机的非系统的部分;而 E (Y | Xi ) 则是系统的,或确定性的部分。
ln Yi = β1 + β2 Xi + εi → inverse semilogarithmic
ln Yi
=
β1
−
β2
1 Xi
+
ε
i
→
logarithmic
reciprocal
甚至 ln Yi = ln β1 + β2 ln Xi + εi → logarithmic or double logarithmic let α = ln β1
如果对上式的两端同取期望值,得到
E (Yi | Xi ) = E E (Y | Xi ) + E (εi | Xi ) = E (Y | Xi ) + E (εi | Xi ) 这里用到了一个常数的期望值还是这个常数的性质;另外, E (Yi | Xi ) 与 E (Y | Xi ) 是一 回事,所以上述变换意味着: E (εi | X i ) = 0 。
古扎拉蒂《经济计量学精要》(第4版)笔记和课后习题详解-自相关:如果误差项相关会有什么结果(圣才出品

量对其滞后一期的回归。
(2)德宾-沃森 d 统计量的定义
n
( ) et − et−1 2
d = t=2 n
et 2
t =1
5 / 28
(10-3)
圣才电子书 十万种考研考证电子书、题库视频学习平台
即残差递差的平方和与残差平方和的比值。注意:在计算 d 统计量分子时,其样本容量
1 / 28
圣才电子书 十万种考研考证电子书、题库视频学习平台
图 10-1 自相关的模式 3.自相关产生的原因 (1)惯性 大多数经济时间序列的一个显著特征就是惯性或者说是迟滞性,即各经济变量的观测值 在时间前后存在着关联性。因此,在涉及时间序列数据的回归方程中,连续的观察值之间很 可能是互相依赖或是相关的。 (2)模型设定误差 不正确的模型设定是指本应纳入模型的重要变量未纳入模型或是模型选择了错误的函 数形式,如果发生这样的模型设定误差,得到的残差则会呈现出系统模式。一个简单的检验 方法是将遗漏变量纳入模型,判定残差是否仍然呈现系统模式。如果不存在系统模式,则序
可见,自相关的后果与异方差相似,也是严重的。因此,与异方差情形相同,在实际应 用中必须确定是否存在自相关问题。
三、自相关的诊断 1.图形法 与异方差情形相同,通过直接观察 OLS 残差 e 来判断误差项 u 中是否存在自相关。有 多种不同的残差图形的检验方法。 (1)残差 e 对时间的散点图 可以用残差对时间作图,如果随着时间的变化,残差呈现出某种有规律的趋势,则可能 存在着自相关。图 10-2 是回归的残差关于时间的时序图,从图可以看出:残差 e 并不是随 机分布的,而是呈现出明显的变动模式——开始是正的,接着变成负的,然后是正的,再然 后是负的,最后又是正的。图形展示了这样一种趋势:残差的递差之间正相关,表明序列存 在着正的自相关。
第3章_双变量回归模型: 计量经济学-古扎拉蒂 教学课件_834

vauir|(Xi)E[ui E(ui)|Xi]2
E(ui2|Xi)2
f(u)
0
Y
X1
X2
X3
X4
X 同方差性:Var(ui|Xi)= Var(uj|Xj),i≠j
3.2经典线性回归模型
• 最小二乘法的基本假定
– 假定5:各个干扰之间无自相关
E (Yi X i ) 0 1 X i Var (Yi | X i ) 2
Cov (Yi , Y j ) 0 (i j )
Yi ~ N ( 0 1 X i , 2 )
3.3最小二乘估计的精度或标准 误差
方差:
var(ˆ2)
2
xi2
var( ˆ1 ) n
X
2 i
x
2 i
2
标准误:
3.2经典线性回归模型
• 最小二乘法的基本假定
– 假定7:观测次数n必须大于待估计的参数个 数.即观测次数n必须大于解释变量的个数
– 假定8:X值要有变异性 – 假定9:正确地设定了回归模型. – 假定10:没有完全的多重共线性.
3.2经典线性回归模型
• 由于被解释变量 Yi分布的性质决 定于ui ,因而对 ui的各项假定也 适用于 Yi,从而 有:
se(ˆ2)
xi2
se ( ˆ1 )
n
X
2 i
x
2 i
3.4最小二乘法回归线性质
• 回归线的性质
1. 它是通过Y和X的样本均值的一条直线. 2. 估计的Y(即 Yˆi )的期望值等于实测的Y的期望值. 3. 残差的期望值为零. 4. 残差和预测的Yi值不相关. 5. 残差和Xi不相关.
计量经济学导论第四版第七章

当我们把(7.1)和(7.6)结合起来时,
便发现 实际上服从一个二阶自回归模型,
或AR(2)模型。为说明这一点,我们把它
写成 ut -1 yt 1 0 1yt 2,并代入 ut ut 1 et
于是(7.6)就可以写成:
12
出现滞后因变量时的序列相关
中的t统计量忽略了 和 −1 之间可能
的相关,所以在回归元不是严格外生的
情况下它不是有效的。
27
例2检验最低工资方程中的AR(1)序列
相关
在第5章,我们考察了最低工资对波多黎
各就业率的影响 ,我们现在来检验误差
中是否包含了序列相关,所用的检验并
不假定最低工资和GNP有严格外生性。
我们假定潜在的随机过程是弱相关的,
7
效率和推断
单个假设的t统计量也不再确当。因为较
小的标准误意味着较大的t统计量,所以
当 > 时,通常t统计量常常过大。用
于检验多重假设的通常F统计量和LM统
计量也不再可靠。
8
拟合优度
有时我们有这样一种观点:时间序列回
归模型中的误差若存在序列相关,我们
通常的拟合优度指标2 和调整 2 便失效
如同检验异方差性那样,虚拟假设就是
相应的高斯-马尔科夫假定正确。在
AR(1)模型中,误差序列无关的这个虚
拟假设是:H 0 : 0 (7.12)
这里我们把定理(6.2)的渐进正态结论
直接应用于动态回归模型:
ut ut 1 et , t 2,3..., n (7.13)
15
严格外生时对AR(1)的t检验
值。
17
例1菲利普斯曲线AR(1)序列相关
古扎拉蒂计量经济学第四版讲义Ch...

古扎拉蒂计量经济学第四版讲义Ch...第⼗章⾃回归和分布滞后模型Lecture Note 13 – Dynamic Econometric Models: Autoregressive and Distributed-Lag Models1. Some conceptsRegression models that take into account time lags are known as dynamic or lagged regression models .There are two types of lagged models: distributed-lag models and autoregressive models . In the former, the current and lagged values of regressors are explanatory variables. In the latter, the lagged value(s) of the regressand appears as explanatory variables.2. The role of “lag” or “time” in economics什么是lag :In economics the dependence of a variable y (the dependent variable) on another variable(s) x (the explanatory variable) is rarely instantaneous. Very often, y responds to x with a lapse of time. Such a lapse of time is called a lag .The reasons for lag:1. Psychological reasons.2. Technological reasons.3. Institutional reasons.3. Estimation of distributed-lag models假定含有⼀个解释变量及其滞后(这只是⼀种简化,当然可以推⼴到⼏个解释变量及其各⾃滞后)的分布滞后模型如下:01122t t t t t y x x x αβββε??=+++++ 17.3.1这⾥没有定义滞后长度,即,how far back into the past we want to go ,这样的模型称为infinite (lag) model 。
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(双变量回归模型:估计问题)【圣才出品】

6.假定 6:观测次数 n 必须大亍待估计的参数个数。
7.假定 7:X 发量的性质。 (1)在一个给定的样本中,X 的叏值必须要有发异,即 var(X)是有限的正数。 (2)为了避免回归结果叐到异常观测值的支配,X 发量的叏值没有异常,即没有一个 X 值相对余观测而言过大戒过小。
3.假定 3:干扰项 ui 的均值为零,即 E(ui|Xi)=0。 此假定是所选回归模型中丌存在设定偏误的另一种表述,该假定意味着模型设定中丌存 在遗漏重要发量、包含丌必要发量和错误函数形式的情况。E(ui|Xi)=0 同时也意味着这 两个发量乊间无关,ui 是一个外生的发量。若 X 是非随机的,E(ui)=0。
Yi=β1+β2Xi+ui
由亍 PRF 无法直接观测,可通过样本回归斱程 SRF 去估计:
∧
∧
∧
∧
∧
Yi=β1+β2Xi+ui=Yi+ui
∧
∧
∧
∧
所以:ui=Yi-Yi=Yi-β1-β2Xi。
选择残差平斱和尽可能小的 SRF,即最小化下式:
∧
∧
∧
∧
∑ui2=∑(Yi-Yi)2=∑(Yi-β1-β2Xi)2
ˆ2 n
n
Yi X i
X
2 i
Xi
Yi
n
Xi X
Yi Y
2
2
Xi
n Xi X
xi yi xi2
__
_
_
其中X和Y是 X 和 Y 的样本均值,幵且定义 xi=Xi-X和 yi=Yi-Y,可得:
ˆ1 n
X
2 i
Yi
n
X
2 i
Xi
X iYi
2
Y ˆ2 X
古扎拉蒂计量经济学第四版讲义Ch11 Simultaneous Equations

= β2 +
( ) ( ) ( ) ∑ ∑ ∑ Yt −Y
Yt − Y
εt
2
←
Yt − Y
Yt − Y = 0,
Yt
Yt − Y
2
=1
Yt − Y
对上式两边取期望
(( )) ∑∑ E
(b2
)
=
β2
+
E
Yt − Y
εt
Yt − Y 2
很遗憾,我们不能评估上式右端的第二项,因为 the expectations operator is a linear operator,
/
n
2
Yt − Y / n
{ } ( ) ∑ plim
= β2 +
Yt
−Y
ε
t
/
n
2
{ } ( ) ∑ p lim Yt −Y / n
注意上式右端第二项分子分母同除以了 n,因此分子大括号里的表达式是 Y 和 ε 的样本协方
差,而分母是 Y 的样本方差。 而在 n 趋于无穷的情况下,样本协方差将近似于总体协方差,样本方程将近似于总体方差, 所以
因此,古典假定被违背。
例 3:Wage-Price models 考虑以下的 Phillips-type model of money-wage and price determination:
i
i
W t = α1 + α2UNt + α3 Pt + ε1t
i
i
i
i
Pt = β1 + β2 W t + β3 Rt + β4 M t + ε 2t
古扎拉蒂计量经济学第四版讲义Ch4 Multiple Linear Regression

∑ ∑ ( ) yi xiK = b1 + b2 xi2 + b3xi3 + + bK xiK xiK
(2.3.6-2)
接着解,
∑ ∑ ∑ ∑ nb1 + b2 xi2 + b3 xi3 + + bK xiK = yi ∑ ∑ ∑ ∑ ∑ b1 xi2 + b2 xi22 + b3 xi2 xi3 + + bK xi2 xiK = yi xi2
This assumption is automatically fulfilled if x are nonstochastic and E (ε | x) = 0 .
4、No exact linear relationship between x, or no collinearity between the x variables, or no
6
var (b) = E (b − β)(b − β) '
min RSS = e 'e = (y − y) '(y − y) = (y − Xb) '(y − Xb)
一阶条件为
∂ ∂b
( y
−
Xb
)
'
(
y
−
Xb)
=
0
∂ ∂b
(
y
'−
b
'
X
')
(y
−
Xb
)
=
0
∂ ∂b
(
y
'
y
−
y
'
Xb
−
b
'
古扎拉蒂计量经济学第四版讲义Ch8 Autocorrelation

It is critical to note that ρ < 1. If ρ < 1, we say that the AR(1) process given in 12.2.1 is
=
n t=2
i
xt − ρ
n t=2
i
x t −1
i
xt −
i
y
t
−
ρ
ρ
i
xt −1
2
i
y t −1
+
C
12.3.1
where
i
xt = xt − x,
i
yt = yt − y,
i
xt−1 = xt−1 − x
i
yt−1 = yt−1 − y
and C is a correction factor that may be disregarded in practice.
,εt−2
)
=
ρ
2
σ 1−
2 u
ρ
2
cov (εt
, ε t −3
)
=
ρ3
σ
2 u
1− ρ
2
and so on. Now the correlation coefficient is the ratio of covariance to variance (p6 注脚 3). Hence,
cor (εt ,εt−1 ) = ρ
cor (εt ,εt−2 ) = ρ 2
古扎拉蒂《计量经济学基础》第7章

Yi=β0+β1Xi+β2Xi2+ui
八、偏相关系数
简单相关系数:r1j(Y与Xj之间的相关), rij 表示Xi与Xj的相关。 偏相关系数: r1j,i(在Xi不变的条件下, Y与Xj之间的偏相关), rij,1 表示在Y不变条件 下,Xi与Xj的偏相关。
具体的偏相关系数的表达式
r1 2 . 3 r1 3 . 2 r2 3 .1
r1 2 r1 3 r 2 3
(1
r1
2 3
) (1
r
2 23
)
r1 3 r1 2 r 2 3
(1
r1
2 2
) (1
r
2 23
)
r 2 3 r1 2 r1 3
(1
r1
2 2
) (1
r1
2 3
)
R 2 r122 + r123 + 2 r1 2 r1 3 r2 3 1- r223
OLS估计量的方差和标准误 得到了偏回归系数的OLS估计量,就可按照 附录所指示的方法推出这些估计量的方差和标 准误。如同双变量情形,计算标准误有两个主 要目的:建立置信区间和检验统计假设。
var
(β 1 )=[
1
+
X
2 2
n
x32i
+X2 3 Nhomakorabeax22i
x22i +2 X 2 X 3 x32i -( x2i x3i )2
数
于是 : R2 1
uˆi2 / (n k ) yˆi2 / (n 1)
R2
1
ˆ 2
sY2
1 (1 R2 )
n 1 nk
读者完全可以把 R 2 当作另一个摘要统计量来看待。
古扎拉蒂《计量经济学》4人大版读书笔记

古扎拉蒂《计量经济学》4人大版读书笔记第一章回归分析的性质“回归”一词是费朗西斯·高尔顿在研究子女身高与父母身高的关系时提出来的,他发现,给定父母的身高,子女的身高会趋向于或“回归”到总人口的平均身高。
换言之,父母异常高或异常矮,其儿子的身高都会趋向于或回归到所有男子的平均身高。
统计关系与确定性关系的区别:先看了解什么叫确定性关系,某个应变量确定的依赖于自变量,数学中和经典物理学中的各种定律都是确定性的关系,比如宇宙间两个粒子的引力离,k是比例常数,给定两个粒子质量和他们间的距离,那么他们之间的引力随机可以确定,而且是唯一的。
而统计关系是不确定性的,应变量和自变量间是统计依赖关系,给定解释变量的某个取值,不能预测因变量的确定取值,因为这时因变量的取值有着概率分布范围,所以我们说它是一个随机变量,如农作物的收成对气温、降雨量、光照条件的依赖关系是统计性质的,这个性质的意义在于影响农作物的因素(变量)还有很多很多,无法一一辨认出来,无论考虑的多少个解释变量,都无法完全解释农作物收成这个因变量,所以它内在的或随机的变异是存在的。
回归和因果:统计关系式本身不能意味着任何因果关系,回归分析研究一个变量对另一些变量的依赖关系但他们绝不是因果关系。
对于因果关系的理念,必须来自与统计学之外的经验或者理论,比如说用经济学的理论来说明价格对需求变动的影响。
回归与相关的区别:回归区分哪个是解释变量,哪个是被解释变量(因变量),相关不区分两者,也就是说前者变量间是不对称的,后者变量间是对称的。
另一方面,相关分析中的所有变量被看作都是随机的,而回归分析则基于以下假定:因变量是随机的,而解释变量是固定的或者非随机的。
给定每个x,都有很多相应的y值(即y有一个分布范围),但不可能知道每一个y的值,所以我们用回归线来预测y的均值第二章回归分析的一些基本概念1、条件均值(条件期望值):为什么叫“条件”?因为他们取决于(条件)变量x的给定值,E(Y|X i)读成给定X下Y的期望值,与E(Y)的区别:E(Y)是总体的Y的均值2、随机或统计总体回归函数(statistical PRF):E(Y|X i)=B1+B2X i;非随机的或确定的总体回归函数(non-stochastic PRF):Y i=B1+B2X i+μi,μi的方差记为σ2。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章 异方差 Heteroscedasticity1、异方差的实质异方差和自相关是一对,分别检测误差项的方差和协方差,涉及的方法都是GLS 或EGLS 。
同方差的假定如下表示:()221,2,,i E i n εσ== 11.1.1异方差则表示为()22i i E εσ=11.1.22、存在异方差的OLS 估计首先举一个两变量回归模型的例子:异方差下2β的OLS 估计量与同方差假定下的公式(3.1.6)相同,但是它的方差现在由下式给出:()()()22222var ii i x x b x x σ − = −∑∑11.2.2这显然与同方差下的公式3.3.1不同。
()()222var ib x x σ=−∑ (3.3.1) (11.2.3)Proof for 11.2.2.:从一元回归中已知,()()21i i nii x x k x x =−=−∑()2122i i i i i i i b k y k x k ββεβε==++=+∑∑∑()()()()()2222222222211221212112222221122var 22i i n n n n n n n n b E b E k E k k k k k k k E k k k βεεεεεεεεεεε−−=−==++++++=+++∑这是因为无序列相关的假定,误差项交互项乘积的期望等于0。
由于i k 已知,而且()22ii Eεσ=,()()()()()()()222222211222222222211222222222var n n n n i i i i i i i i b k E k E k E k k k k x x x x x x x x εεεσσσσσσ=+++=+++=−−==−−∑∑∑∑∑可以证明在异方差情况下,2b 估计量仍然是线性的和无偏的;同理,不管误差项是否同方差还是异方差,2b 估计量都是一致的估计量;进一步,2b 是asymptotically normally distributed 。
这里关于一元回归在异方差出现下OLS 估计量2b 的特性可以完全推广到多元回归的情况。
但是,在异方差下,2b 虽然是线性、无偏和一致的,却不是有效的和最优的,不具有无偏估计量族中的最小方差。
3、广义最小二乘Generalized Least Squares (GLS)1)广义最小二乘(GLS ) 还是首先回到简单回归模型12i i i y x ββε=++ or ()10201i i i ii y x x x ββε=++=Now assume that the heteroscedasticity variance2i σ are known .012i i i ii i i i y x xεββσσσσ=++11.3.3 For ease of exposition we write as102i i i i y x x ββε∗∗∗∗∗∗=++ 11.3.4where the starred, or transformed, variables are the original variables divided by (the known) i σ.What’s the purpose of transforming the original model?()()2222221var 11i i i i i ii iE E knownεεεσσσσσ∗ ==← == 11.3.5Therefore, the variance of the transformed disturbance term is now homoscedastic.Since we are still retaining the other assumptions of the CLRM, the finding suggest that if we apply OLS to the transformed model 11.3.3 it will produce estimators that are BLUE.This procedure of transforming the original variables in such a way that the transformed variables satisfy the assumptions of the classical model and then applying OLS to them is known as the method of generalized least squares (GLS). In short, GLS is OLS on the transformed variables that satisfy the standard least-squares assumptions. The estimators thus obtained are known as GLS estimators , and it is these estimators that are BLUE.GLS 的估计程序如下:First, we write down the SRF of 11.3.3012ii iii i i i y x x e b b σσσσ∗∗ =++or102i i i i y b x b x e ∗∗∗∗∗∗=++11.3.6Now, to obtain the GLS estimators, we minimize()22102i i i i e y b x b x ∗∗∗∗∗∗=−+∑∑ 11.3.7The actual mechanics of minimizing 11.3.7 follow the standard calculus techniques. The GLS estimator of 2b ∗is()()()()()()()222ii iii ii iii ii iw w x y w x w y bw w x w x ∗−=−∑∑∑∑∑∑∑ 11.3.8 and its variance is given by()()()()222var iii ii iwb w w x w x ∗=−∑∑∑∑ 11.3.9where 21/i i w σ=.2)加权最小二乘(WLS ) Weighted Least Squares (WLS)以简单回归为例。
The unweighted least squares method minimizes2212()iiie y b b x =−−∑∑ 1The weighted least squares minimizes2212()i iiii w e w y bb x ∗∗=−−∑∑2where 12,b b ∗∗are the weighted least-squares estimators 。
In the case of heteroscedasticity, 21i i w σ=, which are inversely proportional to the variance ofi ε or i y .Differencing 2 with respect to 12,b b ∗∗, we obtain()()212121222()12()i i i i i i ii i i i w e w y b b x bw ew y b b x x b ∗∗∗∗∗∗∂=−−−∂∂=−−−∂∑∑∑∑Setting the preceding expressions equal to zero, we obtain the following two normal equations12212i iii ii i ii ii iw y b w b w xw x y b w x b w x∗∗∗∗=+=+∑∑∑∑∑∑Solving these equations simultaneously, we obtain12b y b x ∗∗∗∗=−()()()()()()()222ii iii ii iii ii iw w x y w x w y bw w x w x ∗−=−∑∑∑∑∑∑∑ where /i i i y w y w =∑∑ and /i i i x w x w ∗=∑∑.3)OLS, GLS and WLS总的说来,WLS 只是GLS 的一个特例,但是,在异方差的背景下,GLS 和WLS 术语可以互换;以后我们会讨论GLS 估计的其它特例。
如果确实存在异方差和序列相关性,则通过GLS 这些违背被有效地消除了;如果不存在异方差和序列相关,则GLS 等价于OLS 。
4)矩阵描述GLS 和EGLSTo take into account heteroscedasticity variances (the elements on the main diagonal of 'εε) and autocorrelations in the error terms (the elements off the main diagonal of 'εε), assume that()2'E σ=εεVwhere V is a known n*n matrix. Therefore, if the model is=+y X βεwhere ()0E =ε and ()2var cov σ−=εV . In case 2σ is unknown , which is typically thecase, V then represents the assumed structure of variances and covariances among the random errorsi ε.Under the stated condition of the variance-covariance of the error terms, it can be shown that()1gls 11''−−−=b X V X X V ygls b is known as the generalized least-squares (GLS) estimator of β.It can also be shown that()()1gls21var cov 'σ−−−=bX V XIt can be proved that glsb is the best linear unbiased estimator (BLUE) of β.The real problem in practice is that we do not know 2σ as well as the true variances and covariances (i.e., the structure of the V matrix). As a solution, we can use the method of estimated (or feasible) generalized least squares (EGLS).For EGLS, we first estimate our model by OLS disregarding the problems of heteroscedasticity and/or autocorrelation. We obtaine the residuals from this estimated model and form the(estimated) variance-covariance matrix of the error term, V. It can be shown that EGLS estimators are consisten t estimators of GLS. Symbolically,()111egls''−−−=bX VX X Vy () ()11egls2var cov 'σ−−−=bX V Xwhere Vis an estimate of V .4、异方差下使用OLS 估计的结果假如我们不使用GLS 方法,而是继续使用OLS 方法,我们分别考虑异方差和不考虑异方差两种情况来分析置信区间和假设检验可能出现的不同情况。