(完整版)计量经济学中相关证明
计量经济学-中国人民大学,赵国庆
r Xt X Yt Y SXY
2
2
Xt X
Yt Y
SXX SYY
§2.3最小二乘估计量的性质
1. 线性特性(Linear)
估计量a,b均可由被解释变量Yt线性表出,即:
b wtYt a vtYt wt ,vt均为确定性变量。
b
Xt X Xt
Yt Y X 2
Xt SXX
≥
t
2
≤
的 置 信 区 间 为 :
b
p
S
1 S XX
t
2
=
1
-
b t S
2
1 S XX
≤
≤
b + t S
2
1 S XX
同 样 的 置 信 区 间 为 :
a t S
2
1 n
X2 S XX
≤
≤
a + t S
2
1 X2
n S XX
§2.4 系数的显著性检验
例 题 :给 出 下 列 数 据 X 23 159 Y 4 7 3 9 17 (1)估 计 模 型 :Y X u
( 2 ) 给 出 方 差 : v aˆ r a v aˆ r b
(3) 对 系 数 作 显 著 性 检 验
§2.4 系数的显著性检验
解:(1) Yˆ a bX 1 1.75 X
(2) S 2 TSS ESS 1.24 1.75 70 0.5
n2
3
vaˆr a
S
2
1 n
则 式变为: S XX SXY
S XY
S XX
Y X
§2.2参数的最小二乘估计
最小二乘估计:
b
X t X Yt X t X 2
计量经济学讲义第六讲(共十讲)
第六讲 多重共线一、 FWL 定理及其应用考虑模型:112233i i i i i y a b x b x b x ε=++++ (1)假如我们只关注1ˆb,则通过如下步骤可以获得之。
第1步:把1x 对其他解释变量进行回归(请注意,截距所对应的解释变量为1),即有: 101223ˆˆˆˆi i i ix x x v βββ=+++ (2)第2步:把y 也对(2)中的解释变量进行回归,即有:01223ˆˆˆˆi i i i y x x w ϕϕϕ=+++ (3)第3步:把ˆw 对ˆv 进行回归(不含截距,当然你可以包含截距,但你会发现,截距的估计结果是零,这是因为ˆw 与ˆv 其均值都为零),即有模型:ˆˆi i i ve w η=+ (4) 则有:2ˆˆˆˆi i iw v v η=∑∑,可以验证,1ˆˆb η=,且残差ˆi e 等于初始的残差ˆi ε。
此即著名的FWL 定理(Frisch-Waugh-Lovell theorem )。
关于FWL 定理的一个简单证明见附录1。
思考题:利用关于“偏导数”的直觉,你能够理解1ˆˆb η=吗? 考察2ˆˆˆˆi i iw v v η=∑∑,把01223ˆˆˆˆi i i i y x x w ϕϕϕ=---代入,现在分子是:2012230123ˆˆˆˆ()ˆˆˆˆˆˆˆˆˆi i i i i i i ii i i v x i i y x x y v x v v v wv ϕϕϕϕϕϕ------∑∑∑==∑∑∑应该注意到,在进行第一步回归时,OLS 法保证了203ˆˆˆi i i i i v x x vv ===∑∑∑ 因此,22ˆˆˆˆˆˆi i i i i iw v y v v v η==∑∑∑∑ 显然,如果把y 对ˆv 直接进行无截距回归:*ˆiiiy v ης=+ (5)我们也可以得到:*122ˆˆˆˆˆˆˆi i i i i i y v w v b v vηη====∑∑∑∑。
计量经济学随机项方差无偏估计量的证明
故
即 是 的无偏估计量,从而
而样本残差平方和 的自由度 。
因为,样本残差可以看作是总体随机项的估计量,而样本残差 ,是完全可以计算的,因此,可以用样本残差的方差来估计总体随机项的方差。
我们目的是得到 的无偏估计量,因此,我们需要确定样本残差平方和的自由度 ,使得
(3.4.3)
由于 ,所以,上式等价于
(3.4.4)
可以证明 ,其中n是样本容量。下面给出证明:
证明
证明:为了得到 的值,我们不妨先求 ,看它和 是什么关系。由于
而
两边求均值,有
所以
而
两边求均值有:
由于 ,所以有:
将 和 代入 有
对上式平方求和再取期望值有:
在式中:
由于 ,其中 ,所以,上式可以写为:
注意式中 是n项之和,而 则是n(n-1)项之和。
注意:式中 是n项之和,而 则是nn-1)项之和。
(完整)计量经济学重点知识归纳整理,推荐文档
1.普通最小二乘法(Ordinary Least Squares,OLS):已知一组样本观测值{}n i Y X i i ,2,1:),(⋯=,普通最小二乘法要求样本回归函数尽可以好地拟合这组值,即样本回归线上的点∧i Y 与真实观测点Yt 的“总体误差”尽可能地小。
普通最小二乘法给出的判断标准是:被解释变量的估计值与实际观测值之差的平方和最小。
2.广义最小二乘法GLS :加权最小二乘法具有比普通最小二乘法更普遍的意义,或者说普通最小二乘法只是加权最小二乘法中权恒取1时的一种特殊情况。
从此意义看,加权最小二乘法也称为广义最小二乘法。
3.加权最小二乘法WLS :加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数。
4.工具变量法IV :工具变量法是克服解释变量与随机干扰项相关影响的一种参数估计方法。
5.两阶段最小二乘法2SLS, Two Stage Least Squares :两阶段最小二乘法是一种既适用于恰好识别的结构方程,以适用于过度识别的结构方程的单方程估计方法。
6.间接最小二乘法ILS :间接最小二乘法是先对关于内生解释变量的简化式方程采用普通小最二乘法估计简化式参数,得到简化式参数估计量,然后过通参数关系体系,计算得到结构式参数的估计量的一种方法。
7.异方差性Heteroskedasticity :对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差性。
8.序列相关性Serial Correlation :多元线性回归模型的基本假设之一是模型的随机干扰项相互独立或不相关。
如果模型的随机干扰项违背了相互独立的基本假设,称为存在序列相关性。
9.多重共线性Multicollinearity :对于模型i k i i X X X Y μββββ++⋯+++=i k 22110i ,其基本假设之一是解释变量X 1,X 2,…,Xk 是相互独立的。
(完整版)计量经济学(第四版)习题及参考答案详细版
计量经济学(第四版)习题参考答案潘省初第一章 绪论1.1 试列出计量经济分析的主要步骤。
一般说来,计量经济分析按照以下步骤进行:(1)陈述理论(或假说) (2)建立计量经济模型 (3)收集数据 (4)估计参数 (5)假设检验 (6)预测和政策分析 1.2 计量经济模型中为何要包括扰动项?为了使模型更现实,我们有必要在模型中引进扰动项u 来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。
1.3什么是时间序列和横截面数据? 试举例说明二者的区别。
时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。
横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。
如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。
1.4估计量和估计值有何区别?估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。
在一项应用中,依据估计量算出的一个具体的数值,称为估计值。
如Y就是一个估计量,1nii YY n==∑。
现有一样本,共4个数,100,104,96,130,则根据这个样本的数据运用均值估计量得出的均值估计值为5.107413096104100=+++。
第二章 计量经济分析的统计学基础2.1 略,参考教材。
2.2请用例2.2中的数据求北京男生平均身高的99%置信区间NSS x ==45=1.25 用α=0.05,N-1=15个自由度查表得005.0t =2.947,故99%置信限为 x S t X 005.0± =174±2.947×1.25=174±3.684也就是说,根据样本,我们有99%的把握说,北京男高中生的平均身高在170.316至177.684厘米之间。
《计量经济学(第二版)》习题解答(第1-3章)
《计量经济学(第二版)》习题解答第一章1.1 计量经济学的研究任务是什么?计量经济模型研究的经济关系有哪两个基本特征? 答:(1)利用计量经济模型定量分析经济变量之间的随机因果关系。
(2)随机关系、因果关系。
1.2 试述计量经济学与经济学和统计学的关系。
答:(1)计量经济学与经济学:经济学为计量经济研究提供理论依据,计量经济学是对经济理论的具体应用,同时可以实证和发展经济理论。
(2)统计数据是建立和评价计量经济模型的事实依据,计量经济研究是对统计数据资源的深层开发和利用。
1.3 试分别举出三个时间序列数据和横截面数据。
1.4 试解释单方程模型和联立方程模型的概念,并举例说明两者之间的联系与区别。
1.5 试结合一个具体经济问题说明计量经济研究的步骤。
1.6 计量经济模型主要有哪些用途?试举例说明。
1.7 下列设定的计量经济模型是否合理,为什么?(1)ε++=∑=31i iiGDP b a GDPε++=3bGDP a GDP其中,GDP i (i =1,2,3)是第i 产业的国内生产总值。
答:第1个方程是一个统计定义方程,不是随机方程;第2个方程是一个相关关系,而不是因果关系,因为不能用分量来解释总量的变化。
(2)ε++=21bS a S其中,S 1、S 2分别为农村居民和城镇居民年末储蓄存款余额。
答:是一个相关关系,而不是因果关系。
(3)ε+++=t t t L b I b a Y 21其中,Y 、I 、L 分别是建筑业产值、建筑业固定资产投资和职工人数。
答:解释变量I 不合理,根据生产函数要求,资本变量应该是总资本,而固定资产投资只能反映当年的新增资本。
(4)ε++=t t bP a Y其中,Y 、P 分别是居民耐用消费品支出和耐用消费品物价指数。
答:模型设定中缺失了对居民耐用消费品支出有重要影响的其他解释变量。
按照所设定的模型,实际上假定这些其他变量的影响是一个常量,居民耐用消费品支出主要取决于耐用消费品价格的变化;所以,模型的经济意义不合理,估计参数时可能会夸大价格因素的影响。
计量经济学1-5章(超详细完整版)
26
理论计量经济学和应用计量经济学
计量经济学根据研究对象和内容侧重面不同,
可以分为理论计量经济学和应用计量经济学。 理论计量经济学:是以介绍研究计量经济学的 理论与方法为主要内容,侧重于理论与方法的数学 证明与推导。
应用计量经济学:以建立与应用计量经济学模
型为主要内容,强调应用模型的经济学和经济统计
拉格纳·弗里希( R. Frish )
19
计量经济学是用数学语言 来表达经济理论,以便通 过统计方法来论述这些理 论的一门经济学分支。
计量经济学可定义为:根据
理论和观测的事实,运用合
适的推理方法使之联系起来 同时推导,对实际经济现象 进行的数量分析。
20
教科书中的一般表述: 统计学、经济
理论和数学
(1.1) (1.1)式为数理经济模型,该模型是不可以 估计的。要研究收入I 的变化对消费支出C的数量 影响程度,需要对(1.1)进行改造模型。
35
首先,明确(1.1)式的函数形式。例如, C a bI (1.2) 其中 a、 b 为未知的参数, 其次,在(1.2)式右端引入随机变量u,以
16
当前的计量理 论前沿问题
17
○ 计 量 经 济 学 在 中 国 的 发 展
我国计量经济学研究
和应用水平同世界前
沿的差距迅速缩小
2000年
我国计量经济学研 究和应用的普及阶 段
成立了“中国数量经济研
究会”,为创立我国的计
1984年 量经济学奠定了基础
1979年
18
二、什么是计量经济学?
用数学方法探讨经济学可以从好几个方面着手,但 任何一个方面都不能和计量经济学混为一谈。计量 经济学与经济统计学绝非一码事;它也不同于我们 所说的一般经济理论,尽管经济理论大部分具有一 定的数量特征;计量经济学也不应视为数学应用于 经济学的同义语。经验表明,统计学、经济理论和 数学这三者对于真正了解现代经济生活的数量关系 来说,都是必要的,但本身并非是充分条件。三者 结合起来,就是力量,这种结合便构成了计量经济 学。
《计量经济学》第五章最新完整知识
第五章 多元线性回归模型在第四章中,我们讨论只有一个解释变量影响被解释变量的情况,但在实际生活中,往往是多个解释变量同时影响着被解释变量。
需要我们建立多元线性回归模型。
一、多元线性模型及其假定 多元线性回归模型的一般形式是i iK K i i i x x x y εβββ++++= 2211令列向量x 是变量x k ,k =1,2,的n 个观测值,并用这些数据组成一个n ×K 数据矩阵X ,在多数情况下,X 的第一列假定为一列1,则β1就是模型中的常数项。
最后,令y 是n 个观测值y 1, y 2, …, y n 组成的列向量,现在可将模型写为:εββ++=K K x x y 11构成多元线性回归模型的一组基本假设为 假定1. εβ+=X y我们主要兴趣在于对参数向量β进行估计和推断。
假定2. ,0][][][][21=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=n E E E E εεεε 假定3. n I E 2][σεε='假定4. 0]|[=X E ε我们假定X 中不包含ε的任何信息,由于)],|(,[],[X E X Cov X Cov εε= (1)所以假定4暗示着0],[=εX Cov 。
(1)式成立是因为,对于任何的双变量X ,Y ,有E(XY)=E(XE(Y|X)),而且])')|()([(])')((),(EY X Y E EX X E EY Y EX X E Y X Cov --=--=))|(,(X Y E X Cov =这也暗示 βX X y E =]|[假定5 X 是秩为K 的n ×K 随机矩阵 这意味着X 列满秩,X 的各列是线性无关的。
在需要作假设检验和统计推断时,我们总是假定: 假定6 ],0[~2I N σε 二、最小二乘回归 1、最小二乘向量系数采用最小二乘法寻找未知参数β的估计量βˆ,它要求β的估计βˆ满足下面的条件 22min ˆ)ˆ(ββββX y X y S -=-∆ (2)其中()()∑∑==-'-=⎪⎪⎭⎫ ⎝⎛-∆-nj Kj j ij i X y X y x y X y 1212ββββ,min 是对所有的m 维向量β取极小值。
正态分布标准化的证明计量经济学-概述说明以及解释
正态分布标准化的证明计量经济学-概述说明以及解释1.引言1.1 概述在计量经济学中,正态分布是一种非常重要的概率分布。
它具有许多良好的性质,例如对称性、稳定性和易于处理的特点,因此在经济学研究中得到了广泛的应用。
正态分布标准化是将原始的正态分布数据转化为具有均值为0,标准差为1的标准正态分布数据的过程。
通过标准化,我们可以更好地比较不同数据集之间的差异,也可以更方便地进行概率统计推断。
本文旨在探讨正态分布标准化的原理、计算方法以及在计量经济学中的重要性和实际意义。
我们将深入解析正态分布的基本概念,阐述在计量经济学中如何运用正态分布标准化进行数据分析和推断。
通过本文的学习,读者将更好地理解正态分布标准化的意义和应用,为其在经济学领域的研究提供更深入的思路和方法。
愿本文能为读者提供有益的启发和帮助。
1.2 文章结构文章结构部分内容:在本文中,我们将首先介绍正态分布的基本概念,包括其定义、性质和重要性。
接着,我们将详细讨论正态分布标准化的原理,探讨为何需要对正态分布进行标准化以及标准化的方法。
最后,我们将总结正态分布标准化的重要性,探讨其在实际应用中的意义,并展望在计量经济学领域中正态分布标准化的未来发展趋势。
通过本文的阐述,读者将深入了解正态分布标准化的理论基础和实际应用,为进一步的研究和应用提供有力的支持。
1.3 目的本文旨在深入探讨正态分布标准化在计量经济学中的重要性及应用。
具体目的包括:1. 探讨正态分布的基本概念,帮助读者更好地理解正态分布及其特点;2. 分析正态分布标准化的原理,揭示其实现标准化的过程及意义;3. 阐述正态分布标准化的计算方法,为读者提供实际操作的指导;4. 总结正态分布标准化在计量经济学中的重要性,强调其在数据处理和分析中的优势;5. 探讨正态分布标准化的实际意义,展示其在实践中的应用场景及效果;6. 展望正态分布标准化在计量经济学中的未来发展,指出其可能的应用领域和研究方向。
计量经济学一些结论和证明
xi2 yi2
(2)
又知:
b2
xi yi xi2
将 b2 带入(2)式可得到:
r 2 (
xi yi )2
xi2
yi2
化简得到如下正规方程:
(Yt b1 b2 X t ) 0
(Yt b1 b2 X t ) X t 0
由正规方程得到如下解:
b1 Y b2 X
b2
X tYt
1 n
Xt2
1 n
(
X t Yt
Xt )2
XtYt nXY X t 2 nX 2
xt yt xt 2
(2)关于b1
E(b1) E (Dt (B1 B2 X t ut )) E( B1Dt B2 Dt X t Dtut )
B1Dt B2Dt X t (Dt E(ut )) B1 Dt B2 Dt X t 0
B1
所以,b1是B1的无偏估计量。
3.有效性
首先求解b1和b2的方差
ct 2
gt2 2
xt gt xt 2
ct 2
gt2 2
Xt gt X xt 2
gt
ct2 gt2
因此
Var(b%2 ) 2 ( ct2 gt2 )
2 xt 2
2
gt 2
Var(b2 ) 2 gt2
所以
Var(b2) Var(b%2)
(2)关于b1 其证明和b2类似。
1.线性
(1)关于b2。 证:
b2
xt yt xt 2
xtYt xt 2
xt xt 2
Yt
ctYt
其中,ct
xt xt 2
由于ct是非随机变量,所以b2是关于Yt的线性函数。
计量经济学题库(超完整版)及答案.详解
计量经济学题库
计算与分析题(每小题10分)
(2)计算X与Y的相关系数。其中 , , , , (3)采用直线回归方程拟和出的模型为
t值1.24277.2797R2=0.8688 F=52.99
解释参数的经济意义。
2.已知一模型的最小二乘的回归结果如下:
标准差 (45.2)(1.53)n=30 R2=0.31
其中,Y:政府债券价格(百美元),X:利率(%)。
31.假设王先生估计消费函数(用模型 表示),并获得下列结果:
,n=19
(3.1) (18.7) R2=0.98
这里括号里的数字表示相应参数的T比率值。
要求:(1)利用T比率值检验假设:b=0(取显着水平为5%,);(2)确定参数估计量的标准误差;
(3)构造b的95%的置信区间,这个区间包括0吗?
32.根据我国1978——2000年的财政收入 和国内生产总值 的统计资料,可建立如下的计量经济模型:
23.检验下列模型是否存在异方差性,列出检验步骤,给出结论。
样本共40个,本题假设去掉c=12个样本,假设异方差由 引起,数值小的一组残差平方和为 ,数值大的一组平方和为 。
24.假设回归模型为: ,其中: ;并且 是非随机变量,求模型参数 的最佳线性无偏估计量及其方差。
25.现有x和Y的样本观测值如下表:
2.0
5.0
1989
3.3
7.2
1993
计量经济学课件05-自相关
缺点:计算量大。
et et et 检验每种估计式是否显著 e t et
e t 1 vt
et21 vt 1et 1 2 et 2 vt et 1 vt
et 1
vt
自相关检验3——偏相关系数检验
2
4、统计检验(t检验和F检验)失效
自相关性的检验
按时间先后顺序绘制残差图et-t
正自相关
负自相关
由于经济的惯性,通常不会出现负自相关的形式
绘制et-et-1散点图
正自相关
负自相关
自相关检验1——DW检验
DW检验(德宾-沃森检验)
特点: (1).解释变量是非随机的 (2).只适用于检验一阶自相关(一元和多元回归都适用) (3).当模型中出现被解释变量的滞后期,DW检验失效 即方程中不能出现yt=β0+β1xt+ β2yt-1+ut
Yt -1= 0 + 1 X t -1 + ut-1
相减,得:Yt-Yt -1 = 0 (1-) + 1 (Xt - Xt-1) + ut - ut-1 作广义差分变换: Yt* = Yt - Yt -1 ;
0* = 0 (1- ) ; X t* = X t - Xt-1;
在多个变量的之间如果只考虑之间的相关关系其他变量固定不变这种相关性称为偏相关用来衡量片相关的指标叫做是对残差做相关性检验得到相关图看图判断偏自相关偏相关系数系数的类型具体的操作而应介绍房内空调开关及棉被加枕的位置
第5章 自相关性
本章内容
5.1 5.2 5.3 5.4 自相关性及产生原因 自相关性的影响 自相关性的检验 自相关性的解决方法
计量经济学基础知识梳理(超全)
X1 X 2 X n X X n n
三、加权算术平均
加权平均是将各数据先乘以反映其重要性的权 数(w),再求平均的方法。其定义如下式:
w1 X 1 w2 X 2 wn X n wi X i Xw w1 w2 wn w
四、变化率
换言之,对数“解除了”指数,反之亦然。对数函数和指数 函数互为反函数。
指数函数的两个有用性质是
exp(x1+x2)=exp(x1)exp(x2) 和 exp﹝c· log(x)﹞=xc
4.微分学
记忆:经济学中常用的一些函数及其导数有
y 0 1x 2 x2 ; dy dx 1 22 x y 0 1 x ; dy dx 1 x2
变化率的定义如下式:
X t X t 1 (t 2,3, n) X t 1
五、几何平均
几何平均是n个数据连乘积的n次方根 ,其定义如下式:
G n X 1 X 2 X n
六、线性函数
如果两个变量x和y的关系是: 我们便说y是x的线性函数:而 0 和 1 是描述这一关 0 为截距(Intercept),1 为斜率。 系的两个参数, 一个线性函数的定义特征在于,y的改变量总是x y 1x 的改变量的 1倍: 其中,表示“改变量”。换句话说,x对y的边 1 的常数。 际效应是一个等于
例: 对数工资方程
假设小时工资与受教育年数有如下关系: 根据前面所述方程,有
logwage 2.78 0.094edu
%wage 100 0.094edu 9.4edu
由此可知,多受一年教育将使小时工资增加约9.4%。
通常把%△y/△x称为y对x的半弹性,半弹性表示当x增加 一个单位时y的百分数变化。在上述模型中,半弹性是个常 数并且等于 100 ,在上述例子中,我们可以方便的把工 1 资和教育的关系概括为:多受一年教育——无论所受教育的 起点如何——都将使工资提高约9.4%。这说明了这类模型 在经济学中的重要作用。
计量经济学 终稿
一、考虑储蓄函数sav=β0+β1inc+u, u=√inc e. 其中,.是一个随机变量,且具有E(.)=0和Var(.)=σ2., 假设.独立于inc(1)证明:若E(u丨inc)=0, 则满足零条件均值的关键假设(2)证明:若Var(u丨inc)=σe2inc, 则不满足同方差假定SLR.5.(3)讨论支持储蓄方差随着家庭收入递增的证据.答案(1)∵.独立于inc则E(.丨inc)=E(.)=0∴E(u丨inc)=E(√inc e.丨inc)=√inc E(.丨inc)=0即满足零条件均值的假设(2)Var(u丨inc)=var(√inc e.丨inc)=(√inc)2evar(.丨inc)=incevar(.丨inc)∵e独立于inc, var(e丨inc)=var(e)=∴var(u丨inc)=σ2e*inc(3)一个低收入家庭会把大部分收入用在食物衣服等生活必需品上,可能有一部分储蓄, 随着收入的增加, 他们的额消费范围会扩大,也就是说储蓄方差会变大二、用WAGE2 RAW中有关男工人的数据估计了如下方程(1)Sibs是否具有预期的影响?(2)讨论对m.duc的系数的解释(3)假设一个男工人A没有兄弟姐妹答案:(1)有预期的影响,因为sibs前系数为-0 094,即代表兄弟姐妹每增加1个,预期受教育年数少0 094年Δsibs=1/0.094=10.64,即为使预测受教育程度较少一年需增加sibs10.64个(2)M.duc系数为0 131,代表母亲受教育年数每增加一年男工人预期受教育年数增加0 131年̂A)=10 36-0+0 131e12+0 21e12=14 425(3)E(eduĉB)=10 36-0+0 131e16+0 21e16=15 816E(eduĉ)=1 364∆E(educ三、刚从法学院毕业的学生的起薪中位数由下式决定(1)解释为什么我们预期(2)你预计其他斜率参数的符号如何?(3)使用LAWSCH85 RAW中的数据(4)解释变量log(libvol)的系数(5)你是否认为应该进入一个排名更高的法学院?答案:(1)因为β5是rank的系数, 而rank越小代表法学院越好,即毕业生的工资越高所以rank值应和工资相关, 所以β5≤0(2)预计β≥1, β4均大于0 因为图书馆书量越多,学费越高代表教学条件越高,学生所获取只是越多,应与工资正相关=77.01%(100∗0.248)=24.8%(3)1.7701−11(4)log libvol的系数为0 095表示图书馆藏书量增加1%工资增加0 095%(5)应当进入排名更高的法学院当∆rank=20时, ∆lang=1 1641即排名相差20位, 工资起薪相差16 41%四、在一项调查大学GPA与每种活动中所耗时间之关系的研究(1)在模型中保持sl..p和l.isur.不变而改变study有意义?(2)解释为什么这个模型违背了假定MLR 3(3)你如何才能将这个模型重新表述?答案:(1)无意义,时间之和为参值(2)四活动之和为168,即四者中人任意者均可由其他三者线性表示, 与MLR 3不存在完全共线性矛盾(3)讲study变成168-work-sl..p-l.isur.GPA=β0+168β1+(β2-β1)work+(β3-β1)sl..p+(β4-β1)l.isur.+μ五、假定一名大学生正在修读三门课,一门两学分一门三学分和一门四学分答案:三门课在总学分中所占权重分别为22+3+4=2932+3+4=1342+3+4=49E(GPA)=3 5e2/9 +3e1/3 +3e4/9 = 10/3六、令X为美国大学教授以千美元计的年薪, 假定平均年薪52 3 答案:设一下美元计的年薪为YY=1000X∵E(X)=52.3 sd(X)=14.6∴E(Y)=E(1000X)=52300(美元)Sd(Y)=sd(1000X)=14600所以以美元计的年薪均值和标准值分别为52300和14600七、假定在一所大型的大学里,大学平均成绩GPA和SAT分数的关系由条件期望(1)求当SAT=800时的期望GPA, 求并评论(2)若该大学的平均SAT为1100, 则平均GPA是多少?(3)若一个学生的SAT是1100, 这是否意味着答案:(1)∵E(GPA丨SAT)=0 70+0 002SAT∴ SAT=800时E(GPA)=E(GPA丨SAT)=2.30E(GPA丨SAT =1400)=3.50由于给定的SAT成绩不同,所以GPA不同(2)E(GPA)=0.70+0.002*100=2.90(3)总体均值为2.90, 不一定个体均值也是。
计 量 经 济 学
计 量 经 济 学期望与方差补充知识设ij z 是一组随机变量,其中n j m i ,,1;,,1 ==,记)(ij z Z =,即将ij z 排列得到的n m ⨯矩阵。
记ij z 的数学期望为)(ij z E 。
定义Z 的数学期望为))(()(ij z E Z E =即),(j i 元为)(ij z E 的矩阵。
下面若干定理是计量经济学中要用到的。
定理一:对于数量矩阵)(),(),(ij p l ij p n ij m l c C b B a A ===⨯⨯⨯有C B Z AE C AZB E +=+)()(即数学期望运算具有线性性质。
证明:记C AZB W +=,则因为AZ 为n l ⨯矩阵,B AZ )(为p l ⨯阵,可见矩阵加法有定义,注意到W 阵为⎪⎭⎫ ⎝⎛+∑∑=⎪⎭⎫ ⎝⎛+∑∑==+====ij n r m k rj kr ik ij n r m k rj kr ik ij c b z a c b z a w C AZB 1111)()( 故与上式最右端比较知CB Z AE c b z E a w E W E ij n r mk rj kr ik ij +=⎪⎭⎫ ⎝⎛+∑∑====)()())(()(11 □推论:若Z 为1⨯m 向量,则有)()(Z AE AZ E =。
证明:只要在定理中取B 为单位阵,C 为零矩阵即得。
□定理二:对数量阵n m n m B A ⨯⨯,及随机向量11,⨯⨯n n Y X 有)()()(Y BE X AE BY AX E +=+推论:)()()(Y bE X aE bY aX E +=+证明:取bI B aI A ==,再利用定理即可,其中I 为单位阵。
□对1⨯m X 与1⨯n Y ,定义协方差阵为()),(),(j i Y X Cov Y X Cov =即矩阵的第),(j i 元为随机变量i X 与j Y 的协方差),(j i Y X Cov 。
计量经济学随机项方差无偏估计量的证明
两边求均值,有
所以
而
两边求均值有:
由于 ,所以有:
将 和 代入 有
对上式平方求和再取期望值有:
在式中:
由于 ,其中 ,所以,上式可以写为:
注意式中 是n项之和,而 则是n(n-1)项之和。
注意:式中 是n项之和,而 则是n(n-1)项之和。
所以,
故
即 是 的无偏估计量,从而
而样本残差平方和 的自由度 。
因为,样本残差可以看作是总体随机项的估计量,而样本残差 ,是完全可以计算的,因此,可以用样本残差的方差来估计总体随机项的方差。
我们目的是得到,使得
(
由于 ,所以,上式等价于
(
可以证明 ,其中n是样本容量。下面给出证明:
证明
证明:为了得到 的值,我们不妨先求 ,看它和 是什么关系。由于
计量经济学 第六章 自相关
体回归模型(PRF)的随机项为 u1,u2,...,un,
如果自相关形式为
u t=u t-1+ vt -1<<1
ห้องสมุดไป่ตู้
其中
为自相关系数, v
为经典误差项,即
t
E ( v t) 0 , V a r ( v t) 2 , C o v ( v t, v t + s ) 0 , s 0
其中, 1 为一阶自相关系数, 2 为二阶自相关系 数,v t 是经典误差项。此式称为二阶自回归模式,
记为 A R。(2 )
19
一般地,如果 u1,u2 ,...,ut 之间的关系为
u t= 1 u t- 1 + 2 u t- 2 + ...+ m u t- m + v t
其中, v t 为经典误差项。则称此式为 m 阶自回 归模式,记为 AR (m ) 。
在经济计量分析中,通常采用一阶自回归形式,
即假定自回归形式为一阶自回归 A R (1 ) 。
20
第二节 自相关的后果
本节基本内容:
●一阶自回归形式的性质 ●自相关对参数估计的影响 ●自相关对模型检验的影响 ●自相关对模型预测的影响
21
一、一阶自回归形式的性质
对于一元线性回归模型:
Y=1+2X+u
在有自相关的条件下,仍然使用普通最小二乘 法将低估估计量 ˆ 2 的方差 Var(ˆ2 )
并且
ˆ 2
e
2 i
将低估真实的
2
n-k
27
对于一元线性回归模型,当 u 为经典误差项时,
普通最小二乘估计量 ˆ 2 的方差为:
计量经济学(第六章自相关)
Econometrics 2003
二、设定偏误1:应含而未含变量的情形
例如, 如果真实的回归方程的 形式为: Yt 1 2 X 2t 3 X 3t X 4t 4 ut 其中,因变量表示牛肉 需求量,解释变量分别 为 牛肉价格、消费者收入 和猪肉价格。但是在做 回 归时用的是: t 1 2 X 2t 3 X 3t vt Y 则,随机扰动项会出现 系统模式:vt X 4t 4 ut 从而出项自相关。
Econometrics 2003
9
五、滞后效应
例如:在消费支出对收入的时间序列 分析中,当期的消费支出除了依赖于 其他变量外,还依赖于前期的消费支 出。即: Ct 1 2 I t 2 I t 1 ut 如果作回归是选用的是: Ct 1 2 It t 则会出现自相关。
ˆ 2 估计值 t检验统计量为: t 估计量的标准误 ˆ se( 2 )
ˆ 由于 SE( 2 ) 的错误夸大,得到的 t统计量就 可能小于临界值 t / 2 ,从而得到参数 不显著
的结论。而这一结论可能是不正确的。
Econometrics 2003
18
忽视自相关时的检验
如果我们忽视自相关问题依然假设经典假定成 2 ,将会导致错误结果。 ˆ 立,使用 Var(2 ) = 2 Σxt j 当 >0 ,即有正相关时,对所有 j 的有 >0 。 另外回归模型中的解释变量在不同时期通常是 正相关的,对于 X t 和 X 来说 t j
Econometrics 2003
24
图 6.1 绘制
et 与 et 1 的关系
(et -1 , et ) (t 1,2,..., n)
计量经济学中相关证明
课本中相关章节的证明过程第2章有关的证明过程2.1 一元线性回归模型有一元线性回归模型为:y t = β0 + β1 x t + u t上式表示变量y t 和x t之间的真实关系。
其中y t 称被解释变量(因变量),x t称解释变量(自变量),u t称随机误差项,β0称常数项,β1称回归系数(通常未知)。
上模型可以分为两部分。
(1)回归函数部分,E(y t) = β0 + β1 x t,(2)随机部分,u t。
图2.8 真实的回归直线这种模型可以赋予各种实际意义,收入与支出的关系;如脉搏与血压的关系;商品价格与供给量的关系;文件容量与保存时间的关系;林区木材采伐量与木材剩余物的关系;身高与体重的关系等。
以收入与支出的关系为例。
假设固定对一个家庭进行观察,随着收入水平的不同,与支出呈线性函数关系。
但实际上数据来自各个家庭,来自各个不同收入水平,使其他条件不变成为不可能,所以由数据得到的散点图不在一条直线上(不呈函数关系),而是散在直线周围,服从统计关系。
随机误差项u t中可能包括家庭人口数不同,消费习惯不同,不同地域的消费指数不同,不同家庭的外来收入不同等因素。
所以,在经济问题上“控制其他因素不变”实际是不可能的。
回归模型的随机误差项中一般包括如下几项内容,(1)非重要解释变量的省略,(2)人的随机行为,(3)数学模型形式欠妥,(4)归并误差(粮食的归并)(5)测量误差等。
回归模型存在两个特点。
(1)建立在某些假定条件不变前提下抽象出来的回归函数不能百分之百地再现所研究的经济过程。
(2)也正是由于这些假定与抽象,才使我们能够透过复杂的经济现象,深刻认识到该经济过程的本质。
通常,线性回归函数E(y t) = β0 + β1 x t是观察不到的,利用样本得到的只是对E(y t) = β0 + β1 x t 的估计,即对β0和β1的估计。
在对回归函数进行估计之前应该对随机误差项u t做出如下假定。
(1) u t 是一个随机变量,u t 的取值服从概率分布。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课本中相关章节的证明过程第2章有关的证明过程2.1 一元线性回归模型有一元线性回归模型为:y t = β0 + β1 x t + u t上式表示变量y t 和x t之间的真实关系。
其中y t 称被解释变量(因变量),x t称解释变量(自变量),u t称随机误差项,β0称常数项,β1称回归系数(通常未知)。
上模型可以分为两部分。
(1)回归函数部分,E(y t) = β0 + β1 x t,(2)随机部分,u t。
图2.8 真实的回归直线这种模型可以赋予各种实际意义,收入与支出的关系;如脉搏与血压的关系;商品价格与供给量的关系;文件容量与保存时间的关系;林区木材采伐量与木材剩余物的关系;身高与体重的关系等。
以收入与支出的关系为例。
假设固定对一个家庭进行观察,随着收入水平的不同,与支出呈线性函数关系。
但实际上数据来自各个家庭,来自各个不同收入水平,使其他条件不变成为不可能,所以由数据得到的散点图不在一条直线上(不呈函数关系),而是散在直线周围,服从统计关系。
随机误差项u t中可能包括家庭人口数不同,消费习惯不同,不同地域的消费指数不同,不同家庭的外来收入不同等因素。
所以,在经济问题上“控制其他因素不变”实际是不可能的。
回归模型的随机误差项中一般包括如下几项内容,(1)非重要解释变量的省略,(2)人的随机行为,(3)数学模型形式欠妥,(4)归并误差(粮食的归并)(5)测量误差等。
回归模型存在两个特点。
(1)建立在某些假定条件不变前提下抽象出来的回归函数不能百分之百地再现所研究的经济过程。
(2)也正是由于这些假定与抽象,才使我们能够透过复杂的经济现象,深刻认识到该经济过程的本质。
通常,线性回归函数E(y t) = β0 + β1 x t是观察不到的,利用样本得到的只是对E(y t) = β0 + β1 x t 的估计,即对β0和β1的估计。
在对回归函数进行估计之前应该对随机误差项u t做出如下假定。
(1) u t 是一个随机变量,u t 的取值服从概率分布。
(2) E(u t) = 0。
(3) D(u t) = E[u t - E(u t) ]2 = E(u t)2 = σ2。
称u i 具有同方差性。
(4) u t 为正态分布(根据中心极限定理)。
以上四个假定可作如下表达:u t~ N (0,σ2)。
(5) Cov(u i, u j) = E[(u i - E(u i) ) ( u j - E(u j) )] = E(u i, u j) = 0, (i≠j )。
含义是不同观测值所对应的随机项相互独立。
称为u i 的非自相关性。
(6) x i是非随机的。
(7) Cov(u i , x i ) = E[(u i - E(u i ) ) (x i - E(x i ) )] = E[u i (x i - E(x i ) ] = E[u i x i - u i E(x i ) ] = E(u i x i ) = 0. u i 与x i 相互独立。
否则,分不清是谁对y t 的贡献。
(8) 对于多元线性回归模型,解释变量之间不能完全相关或高度相关(非多重共线性)。
在假定(1),(2)成立条件下有E(y t ) = E(β0 + β1 x t + u t ) = β0 + β1 x t 。
2.2 最小二乘估计(OLS ) 对于所研究的经济问题,通常真实的回归直线是观测不到的。
收集样本的目的就是要对这条真实的回归直线做出估计。
图2.9怎样估计这条直线呢?显然综合起来看,这条直线处于样本数据的中心位置最合理。
怎样用数学语言描述“处于样本数据的中心位置”?设估计的直线用t y ˆ =0ˆβ+1ˆβ x t 表示。
其中t y ˆ称y t 的拟合值(fitted value ),0ˆβ和1ˆβ分别是 β0 和β1的估计量。
观测值到这条直线的纵向距离用t uˆ表示,称为残差。
y t =t y ˆ+t u ˆ=0ˆβ+1ˆβ x t +t u ˆ 称为估计的模型。
假定样本容量为T 。
(1)用“残差和最小”确定直线位置是一个途径。
但很快发现计算“残差和”存在相互抵消的问题。
(2)用“残差绝对值和最小”确定直线位置也是一个途径。
但绝对值的计算比较麻烦。
(3)最小二乘法的原则是以“残差平方和最小”确定直线位置。
用最小二乘法除了计算比较方便外,得到的估计量还具有优良特性(这种方法对异常值非常敏感)。
设残差平方和用Q 表示, Q =∑=Ti tu12ˆ= ∑=-T i t t y y 12)ˆ(= ∑=--Ti tt x y 1210)ˆˆ(ββ, 则通过Q 最小确定这条直线,即确定0ˆβ和1ˆβ的估计值。
以0ˆβ和1ˆβ为变量,把Q 看作是0ˆβ和1ˆβ的函数,这是一个求极值的问题。
求Q 对0ˆβ和1ˆβ的偏导数并令其为零,得正规方程, 0ˆβ∂∂Q = 2∑=--Ti t t x y 110)ˆˆ(ββ(-1) = 0 (2.7) 1ˆβ∂∂Q = 2∑=--T i t t x y 110)ˆˆ(ββ(- x t ) = 0 (2.8) 下面用代数和矩阵两种形式推导计算结果。
首先用代数形式推导。
由(2.7)、(2.8)式得,∑=--Ti tt x y 110)ˆˆ(ββ= 0 (2.9) ∑=--Ti tt x y 110)ˆˆ(ββx t = 0 (2.10) (2.9)式两侧用除T ,并整理得,0ˆβ= x y 1ˆβ- (2.11) 把(2.11)式代入(2.10)式并整理,得,])(ˆ)[(11∑=---Ti ttx x y yβx t = 0 (2.12) ∑∑==---Ti t tTi t t x x xx y y 111)(ˆ)(β= 0 (2.13)1ˆβ= ∑∑--ttt txx x y y x )()( (2.14) 因为∑=-Ti ty yx 1)(= 0,∑=-Ti tx xx 1)(= 0,[采用离差和为零的结论:∑==-Ti tx x10)(,0)(1=-∑=Ti ty y]。
所以,通过配方法,分别在(2.14)式的分子和分母上减∑=-Ti ty yx 1)(和∑=-Ti tx xx 1)(得,1ˆβ= ∑∑∑∑------)()()()(x xx x x xy yx y y x ttttt t (2.15)= ∑∑---2)())((x x y y x x ttt(2.16) 即有结果:1ˆβ= ∑∑---2)())((x x y y x x t t t t t (2.17) 0ˆβ= x y 1ˆβ- 这是观测值形式。
如果以离差形式表示,就更加简洁好记。
1ˆβ= ∑∑2ttt xyx0ˆβ= x y 1ˆβ-矩阵形式推导计算结果:由正规方程,ˆβ∂∂Q = 2∑=--Ti t t x y 110)ˆˆ(ββ(-1) = 0 1ˆβ∂∂Q = 2∑=--T i t t x y 110)ˆˆ(ββ(- x t ) = 0 0ˆβT +1ˆβ (∑=T i t x 1) = ∑=Ti t y 1ˆβ∑=Ti t x 1+1ˆβ (∑=Ti tx 12) = ∑=Ti t t y x 1⎥⎦⎤⎢⎣⎡∑∑∑2ttt xx xT ⎥⎥⎦⎤⎢⎢⎣⎡10ˆˆββ=⎥⎥⎦⎤⎢⎢⎣⎡∑∑t t t y x y ⎥⎥⎦⎤⎢⎢⎣⎡10ˆˆββ=12-⎥⎥⎦⎤⎢⎢⎣⎡∑∑∑t t t x x x T ⎥⎥⎦⎤⎢⎢⎣⎡∑∑t t t y x y =22)(1∑∑-t t x x T ⎥⎥⎦⎤⎢⎢⎣⎡--∑∑∑T x x x tt t 2⎥⎥⎦⎤⎢⎢⎣⎡∑∑t t t y x y = ⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛----∑∑∑∑∑∑∑∑∑∑∑22222)()(t t t t t t t t t t t t t x x T y x y x Tx x T y x x y x 注意:关键是求逆矩阵12-⎥⎥⎦⎤⎢⎢⎣⎡∑∑∑t tt x x x T。
它等于其伴随阵除以其行列式,伴随阵是其行列式对应的代数余子式构成的方阵的转置。
写成观测值形式。
1ˆβ= ∑∑---2)())((x x y y x x t t t t t0ˆβ= x y 1ˆβ- 如果,以离式形式表示更为简洁:1ˆβ= ∑∑2ttt xyx0ˆβ= x y 1ˆβ-2.3 一元线性回归模型的特性1. 线性特性(将结果离差转化为观测值表现形式)∑∑∑∑-==222)(ˆi i i i i i x Y Y x x y x β∑∑∑∑∑=-=i i iii iiY K x x Y Y x x 22∑-=-=i i Y K X Y X Y 21ˆˆββ∑∑∑⎪⎭⎫ ⎝⎛-=-=i i i i i Y X K n Y X K Y n 112. 无偏性∑∑++==)(ˆ212i i i i i u X K Y K βββ∑∑∑++=i i i i i u K X K K 21ββ ∑∑∑++=i i i i i u K X K K 21ββ其中:0)222=-===∑∑∑∑∑∑∑i i i i i ii x X X x x x x K (∑∑∑∑+-==22)(i i i i i ii i x X X X x X x x X K∑∑∑+-=2)(i i i i x X x X X x11222==+=∑∑∑∑∑i i i ii x x x x Xx故有:∑+=i i u K 22ˆββ2222)(ˆββββ=+=+=∑∑i i i i Eu K u K E Ei i Y X K n ∑⎪⎭⎫ ⎝⎛-=1ˆ1β()i i i u X X K n ++⎪⎭⎫⎝⎛-=∑211ββ∑∑∑++=n u n X n i i21ββ∑∑∑---i i i i i u X K X X K X K 21ββ∑∑∑---++=i i i i i u K X X K X K X u X 2121ββββ∑-+=ii u K X n )1(1β∑=-+=∴111)1(ˆβββi i Eu X K n E3. 有效性首先讨论参数估计量的方差。
2222))ˆ(ˆ()ˆ(βββE E Var -=2222222)())(()ˆ(∑∑=-+=-=i i i i u K E u K E E ββββ()))((221122112n n n n i i u K u K u K u K u K u K u K ++++++=∑∑∑∑≠+=ji ji j i i i u u K K u K 2)(∑∑∑∑≠+=∴ji ji j i i i i i u u K K Eu K Eu K E 22)()(∑∑∑∑=⎪⎪⎭⎫ ⎝⎛==2222222i i i i i x x x Eu K οο 即:∑=222)ˆ(i x Var οβ同理有:∑∑=2221)ˆ(i i x n X Var οβ∑⎪⎭⎫ ⎝⎛-=-=22111)1())ˆ(ˆ()ˆ(i i u X K n E E E Var βββ22211i i i i u X K n u X K n ∑∑⎪⎭⎫ ⎝⎛-=⎪⎭⎫⎝⎛⎪⎭⎫ ⎝⎛-j i j j i i u u X K n X K n ⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛+∑∑≠112211)ˆ(∑⎪⎭⎫ ⎝⎛-=X K n Var i οβ∑+-=)21(2222X K n X K n i i ο∑∑+-=222222i i K X K n Xn οοο∑∑+=22222)(i i x n X nοο⎪⎪⎭⎫ ⎝⎛+=∑∑∑22222)()(i i i x X x n n ο∑∑∑⎪⎭⎫ ⎝⎛+-=222222)(1)(i i i x n X nX n X n ο∑∑=222i i x n X ο显然各自的标准误差为:∑=22)ˆ(i x se οβ,∑∑=221)ˆ(i i x n X se οβ标准差的作用:衡量估计值的精度。