古扎拉蒂《计量经济学》4人大版读书笔记
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(多元回归分析:推断问题)【圣才出品】
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(多元回归分析:推断问题)【圣才出品】第8章多元回归分析:推断问题8.1 复习笔记考点一:再议正态性假定★当回归模型的参数用于估计和推断两个方面时,还需要假定u i服从正态性假定,即:u i~N(0,σ2)。
在三变量模型中,偏回归系数的OLS估计量与ML估计量一致,是最优线性无偏估计量(BLUE)。
参数估计量也是正态分布的,且(n-3)(σ∧2/σ2)~χ2(n-3)。
参数的t值均服从自由度为n-3的t分布。
t分布可用于构造置信区间并进行假设检验。
χ2分布可用于检验关于真实σ2的假设。
考点二:多元回归中的假设检验的多种形式★1.检验个别偏回归系数的假设。
2.检验估计的多元回归模型的总体显著性,即判别全部偏斜率系数是否同时为零。
3.检验两个或多个系数是否相等。
4.检验偏回归系数是否满足某种约束条件。
5.检验所估计的回归模型在时间上或在不同横截面单元上的稳定性。
6.检验回归模型的函数形式是否正确。
考点三:检验关于个别偏回归系数的假设★★t检验的程序是基于随机误差项u i服从正态分布的假定。
检验方法:给定一个特定的显著性水平α,当t值超过临界值tα/2(df),则拒绝原假设。
或使用p值判断,当p足够小,则拒绝原假设。
参数β∧2的(1-α)置信区间为:(β∧2-tα/2se(β∧2),β∧2+tα/2se(β∧2))。
由于不能直接观测u i,所以利用代理变量u∧i,即残差。
残差的正态性可进行雅克-贝拉(JB)检验(大样本检验)。
考点四:检验样本回归的总体显著性★★★★★1.总体显著性检验(1)定义总体显著性检验的原假设为:H0:β2=β3=0。
也就是检验Y是否与X2和X3存在线性关系。
(2)总体显著性检验与个别显著性检验检验个别显著性时,隐含地假定每一个显著性检验都是根据一个不同的(即独立的)样本进行的。
如果用同一样本数据去进行联合检验,就违反了检验方法所依据的基本假定。
计量经济学读书笔记
计量经济学读书笔记第一部分基础内容一、计量经济学与相关学科的关系二、古典假设下计量经济学的建模过程1.依据经济理论建立模型2.抽样数据收集3.参数估计4.模型检验(1)经济意义检验(包括参数符号、参数大小等)(2)统计意义检验(拟合优度检验、模型显著性检验、参数显著性检验)(3)计量经济学检验(异方差检验、自相关检验、多重共线性检验)(4)模型预测性检验(超样本特性检验)5.模型的应用(结构分析、经济预测、政策评价、检验和发展经济理论)三、 几个重要的“变量”1. 解释变量与被解释变量2. 内生变量与外生变量3. 滞后变量与前定变量4. 控制变量四、 回归中的四个重要概念1. 总体回归模型(Population Regression Model ,PRM)t t t u x b b y ++=10--代表了总体变量间的真实关系。
2. 总体回归函数(Population Regression Function ,PRF ) t t x b b y E 10)(+=--代表了总体变量间的依存规律。
3. 样本回归函数(Sample Regression Function ,SRF )tt t e x b b y ++=10ˆˆ--代表了样本显示的变量关系。
4. 样本回归模型(Sample Regression Model ,SRM )tt x b b y 10ˆˆˆ+=---代表了样本显示的变量依存规律。
总体回归模型与样本回归模型的主要区别是:①描述的对象不同。
总体回归模型描述总体中变量y 与x 的相互关系,而样本回归模型描述所关的样本中变量y 与x 的相互关系。
②建立模型的依据不同。
总体回归模型是依据总体全部观测资料建立的,样本回归模型是依据样本观测资料建立的。
③模型性质不同。
总体回归模型不是随机模型,而样本回归模型是一个随机模型,它随样本的改变而改变。
总体回归模型与样本回归模型的联系是:样本回归模型是总体回归模型的一个估计式,之所以建立样本回归模型,目的是用来估计总体回归模型。
经济计量学精要(第4版)(美)古扎拉蒂
⭐️经济计量学精要(第4版)/(美)古扎拉蒂大佬点个赞支持一下呗ヽ(´▽`)ノヽ(´▽`)ノヽ(´▽`)ノ经济计量学精要(第4版)/(美)古扎拉蒂•综述1.1 什么是经济计量学1.2 为什么要学习经济计量学1.3 经济计量学方法论经济计量分析步骤:(1)建立一个理论假说(2)收集数据(3)设定数学模型线性回归模型为例线性回归模型中,等式左边的变量称为应变量,等式右边的变量称为自变量或解释变量。
线性回归分析的主要目标就是解释一个变量(应变量)与其他一个或多个变量(解释变量)之间的行为关系。
简单数学模型•(4)设立统计或经济计量模型误差项u•u代表随机误差项,简称误差项。
u包括了X以外其他所有影响Y,但并未在模型中具体体现的因素以及纯随机影响。
(5)估计经济计量模型参数线性回归模型常用最小二乘法估计模型中的参数^读做"帽",表示某的估计值(6)核查模型的适用性:模型设定检验(7)检验源自模型的假设:假设检验(8)利用模型进行预测数据类型时间序列数据:按时间跨度收集得到的截面数据:一个或多个变量在某一时间点上的数据集合合并数据:既包括时间序列数据又包括截面数据面板数据:也称纵向数据、围观面板数据,即同一个横截面单位的跨期调查数据模型因果关系统计关系无论有多强,有多紧密,也决不能建立起因果关系,如果两变量存在因果关系,则一定建立在某个统计学之外的经济理论基础之上。
第一部分线性回归模型2.1回归的含义回归分析的主要目的:根据样本回归函数SRF估计总体回归函数PRF2.2总体回归函数(PRF):假想一例总体回归线给出了对应于自变量的每个取值相应的应变量的均值。
(总体回归线表明了Y的均值与每个X的变动关系)PRL•E(Y|xi)表示与给定x值相对应的Y的均值。
下标i代表第i个子总体。
B1、B2称为参数,也称为回归系数。
B1称为截距,B2称为斜率。
斜率系数度量了X每变动一单位,Y( 条件)均值的变化率。
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(虚拟变量回归模型)【圣才出品】
第9章虚拟变量回归模型9.1 复习笔记考点一:ANOVA模型★★★1.虚拟变量含义虚拟变量是指仅有0和1两个取值的变量,是一种定性变量。
一般而言,虚拟变量等于0表示变量不具有某种性质,等于1表示具有某种性质。
虚拟变量也可以放到回归模型中。
这种模型被称为方差分析(ANOVA)模型。
2.虚拟变量模型(1)虚拟变量的表达式Y i=β1+β2D2i+β3D3i+u i应看到,除了不是定量回归元而是定性或虚拟回归元(若观测值属于某特定组则取值为1,若它不属于那一组则取值0)之外,方程与前面考虑的任何一个多元回归模型都是一样的。
所有的虚拟变量都用字母D表示。
(2)使用虚拟变量的注意事项①若定性变量有m个类别,则只需引入m-1个虚拟变量,否则就会陷入虚拟变量陷阱,即完全共线性或完全多重共线性(若变量之间存在不止一个精确的关系)情形。
对每个定性变量而言,所引入的虚拟变量的个数必须比该变量的类别数少一个。
②不指定其虚拟变量的那一组被称为基组、基准组、控制组、比较组、参照组或省略组。
所有其他的组都与基准组进行比较。
③截距值(β1)代表了基准组的均值。
④附属于方程中虚拟变量的系数被称为级差截距系数,它反映取值为1的地区的截距值与基准组的截距系数之间的差别。
⑤如果定性变量不止一类,那么,基准组的选择完全取决于研究者。
⑥对于虚拟变量陷阱,如果在这种模型中不使用截距项,那么引入与变量的类别相同数量的虚拟变量就能够回避虚拟变量陷阱的问题。
因此,如果从方程中去掉截距项,并考虑如下模型Y i=β1D1i+β2D2i+β3D3i+u i由于此时没有完全共线性,所以就不会陷入虚拟变量陷阱。
但要确定做这个回归时,一定要使用回归软件包中的无截距选项。
⑦在一个含有截距的方程中,能更容易地处理是否有某个组与基准组有所不同以及有多大的不同,所以在方程中包括截距更方便。
为了检查分组是否得当,也可通过将虚拟变量的系数相对0做t检验(或者更一般地,对适当的虚拟变量系数集做一个F检验),就可以检验分类是否适当。
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(定性响应回归模型)【圣才出品】
第15章定性响应回归模型15.1 复习笔记考点一:定性响应模型的性质★★定性响应模型是指模型中的回归子是一个二值或二分变量的模型,通常被称为概率模型。
回归子也可以是多分响应变量或多类型响应变量。
将二值响应变量建立成概率模型的方法包括线性概率模型(LPM)、logit模型、probit模型和tobit模型。
考点二:线性概率模型(LPM)★★★★1.LPM的定义以下述回归模型为例说明:Y i=β1+β2X i+u i。
其中X表示家庭收入;Y=1,则表示该家庭拥有住房;Y=0,则该家庭不拥有住房。
该模型被称为线性概率模型,因为Y i在给定X i下的条件期望E(Y i|X i)可解释为在给定X i下事件(家庭拥有住房)发生的条件概率,即Pr(Y i=1|X i)。
2.LPM的特征令P i表示“Y i=1”(即事件发生)的概率,而1-P i表示“Y i=0”(即事件不发生)的概率,则变量Y i服从贝努利概率分布。
根据期望的定义,有:E(Y i)=0(1-P i)+1P i=P i。
此外有:E(Y i|X i)=β1+β2X i =P i,即模型的条件期望事实上可以解释为Y i的条件概率。
该模型的约束条件为:0≤E(Y i|X i)≤1。
3.LPM的问题(1)干扰项u i的非正态性若把方程写成:u i=Y i-β1-β2X i,u i的概率分布见表15-1。
表15-1 u i的概率分布可见u i服从贝努利分布而不是正态分布。
虽然干扰项不满足正态性假定,但OLS的点估计值仍具有无偏性。
此外在大样本下,OLS估计量一般都趋于正态分布,因此LPM的统计推断仍可用正态性假定下的OLS程序。
(2)干扰项的异方差性即使LPM中的干扰项满足零均值和无序列相关性假定,但也不能说它具有同方差性。
对于贝努利分布,理论上的均值和方差分别为P和P(1-P),可见方差是均值的函数,而均值的取值依赖于X的值,因此LPM中的干扰项具有异方差性。
古扎拉蒂计量经济学第四版讲义Ch10 Autoregression and Distribution Lag Model
第十章 自回归和分布滞后模型Lecture Note 13 – Dynamic Econometric Models: Autoregressive and Distributed-Lag Models1. Some conceptsRegression models that take into account time lags are known as dynamic or lagged regression models .There are two types of lagged models: distributed-lag models and autoregressive models . In the former, the current and lagged values of regressors are explanatory variables. In the latter, the lagged value(s) of the regressand appears as explanatory variables.2. The role of “lag” or “time” in economics什么是lag :In economics the dependence of a variable y (the dependent variable) on another variable(s) x (the explanatory variable) is rarely instantaneous. Very often, y responds to x with a lapse of time. Such a lapse of time is called a lag .The reasons for lag:1. Psychological reasons.2. Technological reasons.3. Institutional reasons.3. Estimation of distributed-lag models假定含有一个解释变量及其滞后(这只是一种简化,当然可以推广到几个解释变量及其各自滞后)的分布滞后模型如下:01122t t t t t y x x x αβββε−−=+++++ 17.3.1这里没有定义滞后长度,即,how far back into the past we want to go ,这样的模型称为infinite (lag) model 。
古扎拉蒂《经济计量学精要》(第4版)笔记和课后习题详解-双变量模型:假设检验(圣才出品)
第3章双变量模型:假设检验3.1 复习笔记一、古典线性回归模型古典线性回归模型假定如下:假定1:回归模型是参数线性的,但不一定是变量线性的。
回归模型形式如下:Y i=B1+B2X i+u i这个模型可以扩展到多个解释变量的情形。
假定2:解释变量X与扰动误差项u不相关。
但是,如果X是非随机的(即为固定值),则该假定自动满足。
即使X值是随机的,如果样本容量足够大,也不会对分析产生严重影响。
假定3:给定X,扰动项的期望或均值为零。
即E(u|X i)=0(3-1)假定4:u i的方差为常数,或同方差,即var(u i)=σ2(3-2)假定5:无自相关假定,即两个误差项之间不相关。
即:cov(u i,u j)=0,i≠j(3-3)无自相关假定表明误差u i是随机的。
由于假定任何两个误差项不相关,所以任何两个Y值也是不相关的,即cov(Y i,Y j)=0。
由于Y i=B1+B2X i+u i,则给定B值和X值,Y 随u的变化而变化。
因此,如果u是不相关的,则Y也是不相关的。
假定6:回归模型是正确设定的。
换句话说,实证分析的模型不存在设定偏差或设定误差。
这一假定表明,模型中包括了所有影响变量。
二、普通最小二乘估计量的方差与标准误有了上述假定就能够估计出OLS估计量的方差和标准误。
由此可知,教材式(2-16)和教材式(2-17)给出的OLS估计量是随机变量,因为其值随样本的不同而变化。
这种抽样变异性通常由估计量的方差或其标准误(方差的平方根)来度量。
教材式(2-16)和式(2-17)中OLS估计量的方差及标准误是:(3-4)(3-5)(3-6)(3-7)其中,var表示方差,se表示标准误,σ2是扰动项u i的方差。
根据同方差假定,每一个u i具有相同的方差σ2。
一旦知道了σ2,就很容易计算等式右边的项,从而求得OLS估计量的方差和标准误。
根据下式估计σ2:(3-8)其中,σ∧2是σ2的估计量,是残差平方和,是Y的真实值与估计值差的平方和,即()122212var ibiXbn xσσ==∑∑1se()b=()22222varbibxσσ==∑()2se b=22ˆ2ienσ=−∑2ie∑n -2称为自由度,可以简单地看作是独立观察值的个数。
古扎拉蒂计量经济学第四版讲义Ch6 Multicollinearity
v ' j ( X ∗ ' X∗ ) v j ≅ 0
这也就意味着对特征向量 v j ,有
∑v x
l =2 lj
K
∗ l
≅0
其中, vij . 是向量 v j 的第 i 个元素。
2、存在多重共线性的 OLS 估计 1)在完全多重共线性(perfect multicollinearity)在情况下,回归系数不可确定,其标准误 差无限大。 实际上就是 b = ( X ' X ) X ' y 和 var ( b ) = σ
λ1x1 + λ2 x 2 + " + λK x K = 0
10.1.1
其中,λ1 , λ2 ," λK 为不同时为 0 的常数。实际中,除非观察值的个数小于解释变量的个数, 或者,掉入虚拟变量陷阱的情形,上述表达式成立的机会很小。 现在,多重共线性的含义更加广泛,不仅包括如上面 10.1.1 式表示的情形,而且也包括如下 解释变量 x 不是 perfect 线性关系,而是交互相关(intercorrelated)的情形,即:
(
)
(
)
yi − y = ( b2 + λ b3 ) xi 2 + ei = axi 2 + ei
其中, a = b2 + λb3 。 因此,在完全共线性情况下,利用 OLS 可以估计出
a = b2 + λb3 =
∑ ( y − y )( x − x ) ∑(x − x )
i i2 2 2 i2 2
多重共线性之矩阵说明 考虑一般多元线性回归模型(3.2)。多重共线性的根源就来自数据矩阵 X 的列的性质。假如 把 X 按列分块,
古扎拉蒂《经济计量学精要》(第4版)笔记和课后习题详解-自相关:如果误差项相关会有什么结果(圣才出品
量对其滞后一期的回归。
(2)德宾-沃森 d 统计量的定义
n
( ) et − et−1 2
d = t=2 n
et 2
t =1
5 / 28
(10-3)
圣才电子书 十万种考研考证电子书、题库视频学习平台
即残差递差的平方和与残差平方和的比值。注意:在计算 d 统计量分子时,其样本容量
1 / 28
圣才电子书 十万种考研考证电子书、题库视频学习平台
图 10-1 自相关的模式 3.自相关产生的原因 (1)惯性 大多数经济时间序列的一个显著特征就是惯性或者说是迟滞性,即各经济变量的观测值 在时间前后存在着关联性。因此,在涉及时间序列数据的回归方程中,连续的观察值之间很 可能是互相依赖或是相关的。 (2)模型设定误差 不正确的模型设定是指本应纳入模型的重要变量未纳入模型或是模型选择了错误的函 数形式,如果发生这样的模型设定误差,得到的残差则会呈现出系统模式。一个简单的检验 方法是将遗漏变量纳入模型,判定残差是否仍然呈现系统模式。如果不存在系统模式,则序
可见,自相关的后果与异方差相似,也是严重的。因此,与异方差情形相同,在实际应 用中必须确定是否存在自相关问题。
三、自相关的诊断 1.图形法 与异方差情形相同,通过直接观察 OLS 残差 e 来判断误差项 u 中是否存在自相关。有 多种不同的残差图形的检验方法。 (1)残差 e 对时间的散点图 可以用残差对时间作图,如果随着时间的变化,残差呈现出某种有规律的趋势,则可能 存在着自相关。图 10-2 是回归的残差关于时间的时序图,从图可以看出:残差 e 并不是随 机分布的,而是呈现出明显的变动模式——开始是正的,接着变成负的,然后是正的,再然 后是负的,最后又是正的。图形展示了这样一种趋势:残差的递差之间正相关,表明序列存 在着正的自相关。
计量经济学读书笔记
计量经济学读书笔记【篇一:很好的计量经济学读书笔记】很好的计量经济学读书笔记第一章:统计基础 ....................................................................................................... .. (2)第二章:计量经济学总论 ....................................................................................................... .. (7)第三章:双变量回归分析 ....................................................................................................... .. (9)第3.1回归方法 ....................................................................................................... .. (9)第3.2结果检验 ....................................................................................................... (10)第3.3回归参数的分布 ....................................................................................................... . (11)第四章:多变量回归分析 ....................................................................................................... (13)第五章:ols的基本假设 ....................................................................................................... .. (13)第六章:多重共线性 ....................................................................................................... .. (15)第七章:异方差性 ....................................................................................................... (16)第八章:自相关 ....................................................................................................... . (17)第九章:时间序列分析 ....................................................................................................... . (19)第十章:面板数据分析 ....................................................................................................... . (29)第十一章:其他重要的分析方法 ....................................................................................................... (47)******加权最小二乘法 ....................................................................................................... .. (48)******二阶段最小二乘法tsls ..................................................................................................... (48)******非线性最小二乘法 ....................................................................................................... . (49)******多项分布滞后(pdls) ............................................................................................ . (49)******广义矩估计 ....................................................................................................... . (50)******logit和probit模型 ....................................................................................................... (50)******因子分析 ....................................................................................................... .. (51)******granger因果分析 ....................................................................................................... .. (52)****** 广义线性回归(generalized leastsquares) (52)******格兰格因果检验 ....................................................................................................... .. (55)******误差修正模型(ecm) ............................................................................................ (55)第十二章:eviews ............................................................................................... .. (55)第12.1节eviews基本操作 ....................................................................................................... (55)第12.3节eviews时间序列分析 ....................................................................................................... . (57)第十三章:spss ................................................................................................... . (58)第13.1spss基本操作 ....................................................................................................... . (58)第十四章:数据分析实战经验 ....................................................................................................... . (67)第一章:统计基础0 常用英文词汇的统计意义 panel data=longitudinal data 是对各个个体进行连续观察的截面数据。
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(自相关:误差项相关会怎么样?)【圣才出品】
第 12 章 自相关:误差项相关会怎么样? 12.1 复习笔记
考点一:自相关问题癿性质 ★★★ 1.定义 自相关定义为“按时间(如在时间序列数据中)戒空间(如在横截面数据中)排序癿观 测序列各成员乊间癿相关”。若存在自相关,则用符号表示为:E(uiuj)≠0(i≠j)。 2.可能模式 自相关和无自相关癿一些可能模式,如图 12-1 所示。图 12-1(a)到图 12-1(d)中, 残差项随着时间发化表现出明显癿觃律性,本期癿残差和上期癿残差存在一定癿关联性。而 图 12-1(e)则没有明显癿关联,是非自相关模式。
4.自相关出现时癿 BLUE
利用双发量模型幵假定 AR(1)过程,可以证明 β2 癿 BLUE 估计量由下式给出:
ˆ2GLS
n t2
xt xt1
yt yt1 C
n t2
xt xt1
2
其中 C 是一校正因子,在实际中可以忽略。注意下标从 t=2 发到 t=n。从而斱差是:
var ˆ2GLS
2.德宾-沃森d 检验 (1)d 统计量癿一些基本假定 ①回弻含有截距项;
斱差不相关系数和跨度期数 s 相关。
斱程表明,在 AR(1)模式下,ut 癿斱差仍是同斱差癿,但 ut 丌仁不其过去一期癿值
相关,而丏不过去几期癿值也相关。若 ρ=1,上述斱差和协斱差都没有定义。若|ρ|<1,
斱程中给出癿 AR(1)过程是平稳癿,此时残差项癿均值和斱差丌发,协斱差癿值将随着
两个误差癿时间间隑越进而越小。
3.AR(1)模式癿估计结果
回到双发量回弻模型:Yt=β1+β2Xt+ut。在 AR(1)模式下,估计量癿斱差为:
var ˆ2 AR1
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(双变量回归分析:一些基本思想)【圣才出品】
第2章双变量回归分析:一些基本思想2.1 复习笔记考点一:总体回归函数相关概念★★★★1.条件期望函数(CEF)条件期望值E(Y|X i)是关于X i的一个函数,其中X i是X的某个给定值,用符号表示:E(Y|X i)=f(X i)。
该式也被称为条件期望函数(CEF)或总体回归函数(PRF),或简称为总体回归(PR),表明在给定X i下Y的分布的(总体)均值与X i有函数关系。
2.线性总体回归函数假定总体回归函数E(Y|X i)是系数的线性函数,表达为:E(Y|X i)=β1+β2X i。
其中β1和β2为未知但却固定的参数,称为回归系数;β1和β2也分别称为截距和斜率系数。
方程本身则称为线性总体回归函数,或简称线性总体回归。
3.“线性”的含义(1)对变量为线性Y的条件期望值是X i的线性函数。
从几何意义上说,这时回归曲线是一条直线。
(2)对参数为线性Y的条件期望E(Y|X i)是参数β的一个线性函数,X和Y都可以以任何形式存在(二次项、对数等)。
本书中所有的“线性回归”总是指对参数β为线性的一种回归(即参数只以它的一次方出现)。
4.PRF的随机设定(1)随机误差项个别的Y i围绕它的期望值的离差为:u i=Y i-E(Y|X i),其中离差u i是一个不可观测的可正可负的随机变量,称为随机干扰项或随机误差项。
解释方程Y i=E(Y|X i)+u i,给定X i水平,Y i可表示为两个成分之和:E(Y|X i)被称为系统性或确定性成分;u i为随机或非系统性成分。
(2)随机误差项的条件均值方程Y i=E(Y|X i)+u i的两边取期望,得到:E(Y i|X i)=E[E(Y|X i)|X i]+E(u i|X i)=E(Y|X i)+E(u i|X i)因为E(Y i|X i)=E(Y|X i),则E(u i|X i)=0。
5.随机干扰项的意义不将随机误差项清晰地引进模型中的原因:(1)理论的含糊性;(2)数据的欠缺;(3)核心变量与周边变量;(4)人类行为的内在随机性;(5)糟糕的替代变量;(6)节省原则;(7)错误的函数形式。
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(双变量回归模型:估计问题)【圣才出品】
6.假定 6:观测次数 n 必须大亍待估计的参数个数。
7.假定 7:X 发量的性质。 (1)在一个给定的样本中,X 的叏值必须要有发异,即 var(X)是有限的正数。 (2)为了避免回归结果叐到异常观测值的支配,X 发量的叏值没有异常,即没有一个 X 值相对余观测而言过大戒过小。
3.假定 3:干扰项 ui 的均值为零,即 E(ui|Xi)=0。 此假定是所选回归模型中丌存在设定偏误的另一种表述,该假定意味着模型设定中丌存 在遗漏重要发量、包含丌必要发量和错误函数形式的情况。E(ui|Xi)=0 同时也意味着这 两个发量乊间无关,ui 是一个外生的发量。若 X 是非随机的,E(ui)=0。
Yi=β1+β2Xi+ui
由亍 PRF 无法直接观测,可通过样本回归斱程 SRF 去估计:
∧
∧
∧
∧
∧
Yi=β1+β2Xi+ui=Yi+ui
∧
∧
∧
∧
所以:ui=Yi-Yi=Yi-β1-β2Xi。
选择残差平斱和尽可能小的 SRF,即最小化下式:
∧
∧
∧
∧
∑ui2=∑(Yi-Yi)2=∑(Yi-β1-β2Xi)2
ˆ2 n
n
Yi X i
X
2 i
Xi
Yi
n
Xi X
Yi Y
2
2
Xi
n Xi X
xi yi xi2
__
_
_
其中X和Y是 X 和 Y 的样本均值,幵且定义 xi=Xi-X和 yi=Yi-Y,可得:
ˆ1 n
X
2 i
Yi
n
X
2 i
Xi
X iYi
2
Y ˆ2 X
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(计量经济建模:模型设定与诊断检验)【圣才出品】
第13章计量经济建模:模型设定与诊断检验13.1 复习笔记考点一:模型选择准则和设定误差★★★1.模型的选择准则(1)数据容纳性;(2)与理论一致;(3)回归元的弱外生性;(4)表现出参数的不变性;(5)表现出数据的协调性;(6)模型有一定的包容性。
2.设定误差类型及解释(见表13-1)表13-1 设定误差类型及解释考点二:模型设定误差的后果★★★★1.模型拟合不足(漏掉一个有关变量)假如真实模型是:Y i=β1+β2X2i+β3X3i+u i。
但出于某种原因拟合了如下模型:Y i=α1+α2X2i+v i。
漏掉X3的后果将是:(1)如果放弃或漏掉的变量X3与变量X2两变量的相关系数r23非零,则α∧1和α∧2是有偏误且非一致的。
此时E(α∧1)≠β1,E(α∧2)≠β2,而且这种偏误不会随着样本容量的增大而消失。
(2)即使X2与X3不相关(r23=0),尽管α∧2现在是无偏的,但α∧1是有偏的。
(3)由于误差项包含了X3的信息,方差σ2将被不正确地估计。
(4)计算的α∧2的方差σ2/∑x2i2,是真实估计量β∧2的方差的一个有偏误的估计量。
(5)通常的置信区间和假设检验程序对于所估计参数的统计显著性容易导出误导性的结论。
(6)基于不正确模型做出的预测及预测(置信)区间都是不可靠的。
2.包含一个无关变量(模型拟合过度)假定:Y i=β1+β2X2i+u i是真实模型,但拟合了以下模型:Y i=α1+α2X2i+α3X3i+v i,从而导致了在模型中引入一个无关变量的设定误差。
这一设定误差将导致如下后果:(1)“不正确”模型中全部参数的OLS估计量都是无偏而又一致的,即E(α∧1)=β1,E(α∧2)=β2,和E(α∧3)=β3=0。
(2)误差方差σ2的估计是正确的。
(3)置信区间和假设检验程序仍然有效。
(4)一般地说,各个系数的估计量将是非有效的,也就是说,它们的方差一般都大于真实模型中β∧的方差。
古扎拉蒂经济计量学精要第四版笔记和课后习题答案
古扎拉蒂经济计量学精要第四版笔记和课后习题答案内容第1章经济计量学的特征及研究范围1.1 复习笔记一、什么是经济计量学经济计量学是利用经济理论、数学、统计推断等工具对经济现象进行分析的一门社会科学。
经济计量学运用数理统计学分析经济数据,对构建于数理经济学基础之上的模型进行实证分析,并得出数值结果。
二、为什么要学习经济计量学经济计量学涉及经济理论、数理经济学、经济统计学(即经济数据)以及数理统计学。
然而,它又是一门有独立研究方向的学科,原因如下:1.经济理论所提出的命题和假说,多以定性描述为主。
但是,经济理论本身却无法定量测度这两个变量之间的强度关系,经济计量学家的任务就是提供这样的数值估计。
经济计量学依据观测或试验,对大多数经济理论给出经验解释。
2.数理经济学主要是用数学形式或方程(或模型)描述经济理论,而不考虑对经济理论的测度和经验验证。
而经济计量学主要关注的却是对经济理论的经验验证。
经济计量学家通常采用数理经济学家提出的数学模型,只不过是把这些模型转换成可以用于经验验证的形式。
3.经济统计学主要涉及经济数据的收集、处理、绘图、制表。
经济统计学家的工作是收集GDP、失业、就业、价格等数据,而不是利用这些数据来验证经济理论。
但这些数据恰恰是经济计量分析的原始数据。
虽然数理统计学提供了许多分析工具,但由于经济数据独特的性质(大多数经济数据的生成并非可控试验的结果),经济计量学经常需要使用特殊方法。
三、经济计量学方法论1建立一个理论假说首先要了解经济理论对这一问题是怎样阐述的,然后是对这个理论进行验证。
2收集数据一般来说,有三类数据可用于实证分析:(1)时间序列数据:时间序列数据是按时间跨度收集得到的。
比如GDP、失业、就业、货币供给、政府赤字等,这些数据是按照规则的时间间隔收集得到的。
这些数据可能是定量的,也可能是定性的。
(2)截面数据:截面数据是指一个或多个变量在某一时点上的数据集合。
例如美国人口调查局每十年进行的人口普查。
古扎拉蒂计量经济学第四版讲义Ch5DummyVariablesModels
第五章第五章 虚拟变量回归模型虚拟变量回归模型Dummy Variable Regression Models1、什么是虚拟变量?、什么是虚拟变量?名义型变量又称为指标变量、分类变量、定性变量,或者虚拟变量(哑变量)。
2、方差分析模型(ANOVA models )一种类型的回归模型就是解释变量全部是虚拟变量,这样的模型称为Analysis of Variance (ANOV A) models 。
假如我们想检验东(10个省)中(12个省)西(9个省)部三个地区教师的平均收入是否不同。
对三个地区教师工资数据取算术平均值,发现不同,这种不同显著吗?一般用D 表示哑变量,设定如下的哑变量:表示哑变量,设定如下的哑变量: D2 =1 代表东部省份;否则用0表示表示 D3 =1代表中部省份;否则用0表示表示可以写出如下的模型可以写出如下的模型12233i i i i y D D βββε=+++ 9.2.1这类似于一般的多元回归模型的形式。
这类似于一般的多元回归模型的形式。
假定该模型的误差项满足通常OLS 回归的假定,对上式两边取期望,得到回归的假定,对上式两边取期望,得到 对东部地区:对东部地区: ()2312|1,0i i i E y D D ββ===+ 对中部地区:对中部地区: ()2313|0,1i i i E y D D ββ===+ 对西部地区:对西部地区: ()231|0,0i i i E y D D β===假定回归结果为假定回归结果为()()()2322158.622264.6151734.473:0.00000.03490.23300.0901i i i y D D p R =++=1)虚拟变量使用注意)虚拟变量使用注意使用虚拟变量要小心,特别要注意以下几点:使用虚拟变量要小心,特别要注意以下几点:1)一个定性解释变量如果分成m 类,则用m-1个哑变量表示;如果分成m 类用m 个哑变差别截距系数,代表该类别均值比基准别均,前系数称为差别截距系数差别截距,前系数称为的类别可称为差别截距()()()()2321077.231900.2361634.256 3.2889:9.5115 1.3286 2.088910.35390.7266i i ii y D D x t R =+++=4、Chow Test 的替代方法:虚拟变量方法的替代方法:虚拟变量方法多元回归章节的多步Chow Test 程序只能告诉我们两个子区间的回归是否不同,并没有告诉我们这种不同的根源,是由于截距项的差异呢,还是由于斜率项的差异,或者来自两者。
古扎拉蒂计量经济学第四版讲义Ch3 Simple Linear Regression
而 有 些 模 型 即 使 转 换 也 不 能 够 linearized in the parameters , 这 样 的 模 型 称 为 intrinsically nonlinear regression model,简称为非线性回归模型(NLRM)。如:
( ) Yi = β1 +
0.75 − β1
or
Yi = E (Y | Xi ) + εi
这里,偏差 εi 是一个不可观察的随机变量,可以取正值或负值。 我们把 εi 称为随机干扰项(stochastic disturbance)或随机误差项(stochastic error
term),它是随机的非系统的部分;而 E (Y | Xi ) 则是系统的,或确定性的部分。
ln Yi = β1 + β2 Xi + εi → inverse semilogarithmic
ln Yi
=
β1
−
β2
1 Xi
+
ε
i
→
logarithmic
reciprocal
甚至 ln Yi = ln β1 + β2 ln Xi + εi → logarithmic or double logarithmic let α = ln β1
如果对上式的两端同取期望值,得到
E (Yi | Xi ) = E E (Y | Xi ) + E (εi | Xi ) = E (Y | Xi ) + E (εi | Xi ) 这里用到了一个常数的期望值还是这个常数的性质;另外, E (Yi | Xi ) 与 E (Y | Xi ) 是一 回事,所以上述变换意味着: E (εi | X i ) = 0 。
古扎拉蒂计量经济学第四版讲义Ch8 Autocorrelation
It is critical to note that ρ < 1. If ρ < 1, we say that the AR(1) process given in 12.2.1 is
=
n t=2
i
xt − ρ
n t=2
i
x t −1
i
xt −
i
y
t
−
ρ
ρ
i
xt −1
2
i
y t −1
+
C
12.3.1
where
i
xt = xt − x,
i
yt = yt − y,
i
xt−1 = xt−1 − x
i
yt−1 = yt−1 − y
and C is a correction factor that may be disregarded in practice.
,εt−2
)
=
ρ
2
σ 1−
2 u
ρ
2
cov (εt
, ε t −3
)
=
ρ3
σ
2 u
1− ρ
2
and so on. Now the correlation coefficient is the ratio of covariance to variance (p6 注脚 3). Hence,
cor (εt ,εt−1 ) = ρ
cor (εt ,εt−2 ) = ρ 2
古扎拉蒂计量经济学第四版讲义Ch9 Model Specification
第九章模型设定Model Specification and Diagnostic Testing1. Introduction假如模型没有被正确设定,我们会遇到model specification error或model specification bias 问题。
本章主要回答这些问题:1、选择模型的标准是什么?2、什么样的模型设定误差会经常遇到?3、模型设定误差的后果是什么?4、有那些诊断工具来发现模型设定误差?5、如果诊断有设定误差,如何校正,有何益处?6、怎样评估相互竞争模型的表现(model evaluation)?Model Selection Criteria这是笼统的模型选择标准:1、利用该模型进行预测在逻辑上是可能的;2、模型的参数具有稳定性,否则,预测就很困难。
弗里德曼说:模型有效性的唯一检验标准就是比较模型的预测是否与经验一致。
3、模型要与经济理论一致。
4、解释变量必须与误差项不相关。
5、模型的残差必须是白噪声;否则就存在模型设定误差。
6、最后选择的模型应该涵盖其它可能的竞争模型;也就是说,其他模型不应该比所选模型的表现更好。
Types of specification errors大概有这几种设定误差:设定误差之一:所选模型忽略了重要的解释变量(该解释变量被包含在模型误差中)设定误差之二:所选模型包含了不必要或不相关的解释变量设定误差之三:所选模型具有错误的方程形式(比如y采用了不该采用的对数转换)设定误差之四:被解释变量and/or解释变量测量偏差(所用数据相对于真实值有偏差)导致的误差(commit the errors of measurement bias)设定误差之五:随机误差项进入模型的形式不对引起的误差(比如是multiplicatively还是additively)The assumption of the CLRM that the econometric model is correctly specified has two meanings. One, there are no equation specification errors, and two, there are no model specification errors.上面概括的五种设定误差称为equation specification errors。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
古扎拉蒂《计量经济学》4人大版读书笔记第一章回归分析的性质“回归”一词是费朗西斯·高尔顿在研究子女身高与父母身高的关系时提出来的,他发现,给定父母的身高,子女的身高会趋向于或“回归”到总人口的平均身高。
换言之,父母异常高或异常矮,其儿子的身高都会趋向于或回归到所有男子的平均身高。
统计关系与确定性关系的区别:先看了解什么叫确定性关系,某个应变量确定的依赖于自变量,数学中和经典物理学中的各种定律都是确定性的关系,比如宇宙间两个粒子的引力离,k是比例常数,给定两个粒子质量和他们间的距离,那么他们之间的引力随机可以确定,而且是唯一的。
而统计关系是不确定性的,应变量和自变量间是统计依赖关系,给定解释变量的某个取值,不能预测因变量的确定取值,因为这时因变量的取值有着概率分布范围,所以我们说它是一个随机变量,如农作物的收成对气温、降雨量、光照条件的依赖关系是统计性质的,这个性质的意义在于影响农作物的因素(变量)还有很多很多,无法一一辨认出来,无论考虑的多少个解释变量,都无法完全解释农作物收成这个因变量,所以它内在的或随机的变异是存在的。
回归和因果:统计关系式本身不能意味着任何因果关系,回归分析研究一个变量对另一些变量的依赖关系但他们绝不是因果关系。
对于因果关系的理念,必须来自与统计学之外的经验或者理论,比如说用经济学的理论来说明价格对需求变动的影响。
回归与相关的区别:回归区分哪个是解释变量,哪个是被解释变量(因变量),相关不区分两者,也就是说前者变量间是不对称的,后者变量间是对称的。
另一方面,相关分析中的所有变量被看作都是随机的,而回归分析则基于以下假定:因变量是随机的,而解释变量是固定的或者非随机的。
给定每个x,都有很多相应的y值(即y有一个分布范围),但不可能知道每一个y的值,所以我们用回归线来预测y的均值第二章回归分析的一些基本概念1、条件均值(条件期望值):为什么叫“条件”?因为他们取决于(条件)变量x的给定值,E(Y|X i)读成给定X下Y的期望值,与E(Y)的区别:E(Y)是总体的Y的均值2、随机或统计总体回归函数(statistical PRF):E(Y|X i)=B1+B2X i;非随机的或确定的总体回归函数(non-stochastic PRF):Y i=B1+B2X i+μi,μi的方差记为σ2。
3、样本回归函数(SRF):Y i^=b1+b2X i;随机样本回归函数:Y i=b1+b2X i+e i,各小写字母都是总体回归函数中对应大写字母的估计量。
e i的方差记为2ˆσ,2ˆσ是真正的但未知的σ2的OLS估计量。
2ˆσ开方的正数(公式中的符号μ帽改为e,其他不变)被称为回归估计的标准误差(标准误),即Y 对估计的回归线的离差的标准差,用于衡量所估计的回归线的拟合优度(goodness of fit )。
4、标准误和标准差的区别(个人理解):标准误衡量的是一个估计量的精度问题,标准误越大,估计量对真实值的估计就越不精准;标准差则是一组数据的离散程度的度量,标准差越大,该组数据越离散。
第三章 双变量模型:估计问题1、最小二乘法(点估计):A 、样本回归函数中使用;B 、使得Σe i 2=f (b 1,b 2),要使min Σe i 2,分别对b 1,b 2的偏导等于零的时候可以使得Σe i 2最小,得出正规方程1(可以这样记忆:就是SRF i 加和)、2(可以这样记忆就是SRF i *X i 再加和);C 、通过简单代数运算求得∑∑∑∑--==2222b X n X Y X n Y X x y x i i i i i i ,X Y 21b b -=2、经典线性回归模型(CLRM ):最小二乘法的基本假定(都是针对PRF 而不是SPF 的)假定1:回归模型对参数而言是线性的。
Y i =B 1+B 2X i +μi假定2:在重复抽样中X 值是固定的,即X 是非随机的。
每一个固定的Xi 值都会有一个Y 总体(即给定一个Xi 值会有若干个Y 值对应),而且每次抽样(重复抽样)的时候Xi 都是同一个值,来看Y 是怎么如何取值的,这意味着我们的分析是条件回归分析,即以回归元X 的给定值作为条件的。
假定3:干扰项μi 的均值为零。
E(μi |X i )=0。
给定X ,对应的Y 值都是围绕其均值分布的,最终Y 与其均值的离差会互相抵消,所以μi 的均值为零。
这意味着凡是模型未包含的且归属于μi 的因素对Y 的平均影响为零。
假定4:同方差性或者的μi 方差相等。
这意味着给定X 值的Y 总体有相同的分布或相同的方差同方差假定5:各干扰项之间无自相关。
给定两个X值,X i和X j(i不等于j),μi和μj的相关性为零。
设想μi和μj正相关,那么Y i不仅依赖于X i而且依赖于μj,因为μj在一定程度上决定了μi。
假定6:X i和μi的协方差为零。
干扰项μ和解释变量X是不相关的,即可以区分Y受到的只是X的影响,而不会收到随机干扰项中未纳入模型的因素的影响。
假定7:观测次数n必须大于待估计的参数个数。
假定8:X值要有变异性。
给定一个样本,X值不可以全是相同的。
假定9:正确的设定了回归模型。
即在经验分析中,模型没有设定偏差。
假定10:没有完全的多重共线性。
即解释变量之间没有完全的线性关系。
3、在统计学中一个估计量的精密度(或者可靠性)可以用它的标准误(se)来度量。
4、最小二乘估计量的性质:高斯-马尔可夫定理、最优线性无偏估计(BLUE)。
5、(样本)判定系数r2:“拟合优度”的一个度量。
r2测度了在Y的总变异中由回归模型解释的部分所占的百分比。
而r2的开平方根r则是样本的相关系数。
在对时间序列数据的回归中通常能得到很高的r2值,而横截面数据的回归中得到r2的值较低是因为样本单位的分散性所致。
第四章经典正态线性回归模型1、μi的正态性假定:μi~(0,σ2)2、正态性假定下估计的性质:b1~(B1,σb12),b2~(B2,σb22)第五章双变量回归:区间估计与假设检验1、B1、B2、σ2三个统计量的区间估计(运用OLS计算得出的b1、b2、2ˆ 是点估计值):构造t变量、B1的置信区间、B2的置信区间、构造χ2变量、σ2的置信区间、2、假设检验:(1)置信区间法:一个决策规则(2)显著性检验法:两个决策规则3、显著性检验的决策语言:4、2倍t经验法则:双侧、单侧5、两类错误的相对代价:6、精确的显著性水平p值:|t|(t=)值越大,估计的b2值越远离假设的B2值,则说明数据(样本)越不支持虚拟假设(H0:B2=0),真实的B2不等于零就越显著,查t表可知同样自由度下,|t|越大,p值越小。
在回归结果中,p值与|t|成反向变动,t统计量的p值(即t等于多少时,对应的p值是多少)是精确的显著性水平(α),p值越小B2不等于零就越显著。
7、P值判断:对于双边检验,当P值小于α(给定的置信水平)时即可判断通过t检验;对于单边检验,当P/2值小于α(给定的置信水平)时,即可判断通过t检验。
8、回归分析与方差分析:第十章多重共线性1、完全共线性和近似共线性:完全的多重线性关系即X间有准确的线性函数关系,如下面情形:。
不完全的多重共线性(近似共线性)即X间不是准确的线性函数关系,而是高度相关关系,如。
完全共线性的情形用ols估计各参数是不可能的,近似共线性的情形中,不管相关度有多高,只要不等于1,用ols估计各参数都是可能的。
2、注意:多重共线性仅对X变量之间的线性关系而言的,若解释变量之间有非线性关系,比如变量X1和X12是非线性的函数关系,严格的讲并不违反无多重共线性假定。
但这种情况,X1和X12是的相关系数将会接近1,那么他们的系数将很难准确(即以较小的标准误差估计)。
另外,由于多重共线性是对假定的非随机的解释变量之间的关系而言的,所以它是一种样本现象,而非总体特征;多重共线性是一个程度问题而不是有无问题,有意义的程度不在于有无之间而在于它的不同的程度。
3、多重共线性的实际后果:4、多重共线性的做题步骤:A、根据ols结果初步判断:观察因变量对所有自变量回归模型的结果,看各系数的经济意义是否与预期一致以及是否存在高R2和F值而部分系数小t值的情况,如果存在,则初步认为解释变量间存在多重共线性。
B、找出是哪些变量间存在多重共线性:对各x进行相关系数分析,若存在两变量间相关系数≥0.8的情况,则可认为此两变量高度相关。
C、单独回归、辅助回归和逐步回归求最优模型:Y对各自变量分别回归(单独回归),对R i2值进行排序,选R i2值最大的自变量作为初始回归模型逐步引入各个X自变量进行逐步回归,每引入一个X自变量都要观察其回归结果的t值,对t值不显著的予以剔除(剔除该X 自变量)。
最后仅以留下来的自变量为回归元做最优的回归模型。
5、利用差分法消除多重共线性:由于多重共线性会引起各种实际后果(如3所说),在现实工作中,如果选取的必须变量(特别是时间序列变量)存在着多重共线性,为了提高模型的精确度,可以用差分法消除变量间的多重共线性。
可以用增量或增长率来作为变量,如△Y 对△X进行回归,从而消除多重共线性。
iA、一次差分形式(增量):B 、比率变换:C 、A 和B 的缺陷:第十一章 异方差:误差的方差不是常数会怎么样?1、异方差的缘由:2、异方差情形用ols 估计后果:b2已经不是BLUE ,不是“有效的”或“最优的”,但仍是线性的和无偏的。
不是“最优的”意味着b2在线性无偏估计量一类中不是最小方差。
3、异方差的诊断:方法多种多样,下面仅介绍三种方法,着重掌握C 。
A 、问题的性质:往往根据所考虑的性质就能判断是否存在异方差性,例如,在储蓄对收入的回归模型中,残差的方差随着收入的增加而增加;又如,在打字出错率对训练时间的回归中,残差的方差随训练时间的增多而变小(这是由于边错边改学习模型决定的)。
B 、图解法:在做题时首选的方法,a 、可想利用ols 的 回归结果将2ie ˆ对Y 帽做散点图,看是否呈现出一定的关系样式,并确定是单调递增、单调递减还是复杂型;b 、也可以做2ie ˆ和解释变量之一做散点图,当双变量模型时结果是和a 一样的,当多变量模型时,可以根据A 判断异方差是那个变量引起的,做2ie ˆ和该变量的散点图确定是单调递增、单调递减还是复杂型。
C 、A 和B 都是非正式的方法,正式的方法常用怀特检验:4、异方差的修正:加权最小二乘法——在实际操作中人们通常采用如下的经验方法:不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。
如果确实存在异方差,则被有效地消除了;如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法5、第十二章自相关:误差项相关会怎么样?1、自相关的缘由:2、序列相关的后果:3、侦查序列相关:A、做et与et-1的散点图B、杜宾-瓦森检验法(即D.W检验,只能检验是否存在一阶序列相关):ols结果中都会给出D.W值,如何判断?C、拉格朗日乘数(LM)检验:eviews直接输入命令V iew》residual tests》serial correlation lm tests4、序列相关的补救:广义最小二乘法、科克伦-奥科特迭代、杜宾两步法。