计量经济学中相关证明

合集下载

计量经济学

计量经济学

X的值,被解释变量Y的值就唯一地确定了,Y与X的关系就是函数关系。

是指两个以上的变量的样本观测值序列之间表现出来的随机数学关系,用相关系数来衡量。

因果关系是指两个或两个以上变量在行为机制上的依赖性,作为结果的变量是由作为原因的变量所决定的,原因变量的变化引起结果变量的变化。

果关系的变量之间一定具有数学上的相关关系。

而具有相关关系的变量之间并不一定具有因果关系。

是分析两个或以上变量的样本观测值序列之间的非确定随机数学关系,用相关系数来衡量。

回归分析是分析两个或两个以上变量之间的相互依赖关系或因果关系,作为结果的变量是由作为原因的变量所决定的,原因变量的变化引起结果变量的变化。

回归分析的因果关系一定有相关关系,具有相关关客观事物或现象相互关系密切程度的问题,而回归则是用函数的形式表示变量之间的因果关系。

二者相互补充,只有当变量间存在一定程度的相关关系时,才能进行回归分析;而在进行相关分析时,如果要具体确定变量间相关的具体数学形式,又依赖于回归分析。

内生变量是其数值由经济模型所内在决定的变量,内生变量可以在模型内得到说明,由给定的经济模型本身决定的变量。

外生变量是指在经济模型中,给定的经济模型本身无法决定而由这个模型以外的因素决定的变量。

它是模型据以建立的外部条件。

其对被解释变量的影响效果通过随机误差项体现。

外生变量决定内生变量,外生变量不能在模型内部得到说明。

外生变量是在经济模型中受外部因素影响而内部因素所决定的变量。

1)增大样本容量n。

因为在同样的显著性水平下,n越大,t分布表中的临界值越小。

同时,增大样本容量,还可使样本参数估计量的标准差减小。

(2)提高模型的拟合优度。

因为样本参数估计量的标准差与残差平方和呈正比,模型拟合优度越高,残差平方和越小。

(3)提高样本观测值的分散度。

这样计算参数估计量的标准差的分母越大,则可使得参数估计量的标准差减小。

最小样本容量的确定,样本数量不得少于模型中解释变量的数目(包括常数项),即: n ≥ k+1。

序列相关性

序列相关性
yt 1 2 Pt 1 ut
5.滞后效应 在经济中,因变量受到自身或另一解释变量的前几期值影响的现象称为 滞后效应。在一个消费支出对收入的时间序列回归中,人们常常发现当前时 期的消费支出除了依赖于其他变量外,还依赖于前期的消有效 因为,在有效性证明中利用了 E(NN’)=2I 即同方差性和互相独立性条件。而且,在大样本情况下,参数估计量 虽然具有一致性,但仍然不具有渐近有效性。 2、变量的显著性检验失去意义 在变量的显著性检验中,统计量是建立在参数方差正确估计基础之 上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。如果存 在序列相关,估计的参数方差 S ˆ ,出现偏误(偏大或偏小) ,t 检验就失去
~ e ~ e t t 1 t

~ e ~ ~ e t 1 t 1 2 et 2 t
3
, 。 。 。
醉客天涯之计量经济学
如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。 回归检验法的优点是: (1)能够确定序列相关的形式 (2)适用于任何类型序列相关性问题的检验。 3、杜宾-瓦森(Durbin-Watson)检验法(最常用) (1)方法使用条件: ①解释变量 X 非随机; ②随机误差项 i 为一阶自回归形式: i=i-1+i ③回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式: Yi=0+1X1i+kXki+Yi-1+i ④回归含有截距项 ⑤误差项被假定为正态分布 (2)D.W.统计量: 杜宾和瓦森针对原假设:H0: =0, 即不存在一阶自回归,构如下造统计量:
D.W .
~ (e
t 2
n
t
~ )2 e t 1
2 t

计量经济学的数学基础

计量经济学的数学基础

2.1.1. 求和算子运算规则求和算子定义:对于T个观测值,x1, x2, …, xT,求和可以简化地表示为其中称作求和算子。

求和算子的运算规则如下:(1) 变量观测值倍数的和等于变量观测值和的倍数。

(2) 两个变量观测值和的总和等于它们分别求总和后再求和。

(3) T个常数求和等于该常数的T倍。

其中k是常数。

利用求和算子定义,样本平均数可表示为(4) 变量观测值对于其平均数的离差和等于零。

利用规则(2),(3)和样本平均数定义即可推导出上述结果。

(5) 随机变量的方差等于其平方的均值减去其均值的平方证明(6) 两个随机变量的协方差等于它们乘积的均值减去它们均值的乘积。

与规则(5)的证明类似,即可证明上述结果。

定义双重求和为(7) 两个变量和的双重求和等于它们各自双重求和的和。

(8) 两个不同单下标变量积的双重求和等于它们各自求和的乘积。

2.2.1 随机变量的数学期望随机变量定义:按一定的概率取不同实数值的变量称为随机变量,用x, y等表示。

若随机变量x可能取的值为有限个或可列个,则称x为离散型随机变量。

离散型随机变量的一切可能取值及其取值的相应概率称作离散型随机变量的概率分布。

若随机变量x可能取的值是整个数轴,或数轴上的某个区间,则称x为连续型随机变量。

连续型随机变量的概率分布是通过随机变量在一切可能区域内取值的概率定义的。

最常用和最简便的形式是通过概率密度函数表示。

对于随机变量x,若存在非负可积函数f(x),(- ∞< x< ∞),使对任意实数a, b, (a < b)有则称x为连续型随机变量。

f (x)为x的概率密度函数(简称概率密度或密度)。

由上式知f (x)在[a, b]区间上的积分等于随机变量x在[a, b]区间取值的概率。

1 随机变量的数学期望对于离散型随机变量x,若有概率分布 P{x = x i} = p i, (i= 1, 2, …, )则称为x的数学期望,简称为期望或均值。

计量经济学随机项方差无偏估计量的证明

计量经济学随机项方差无偏估计量的证明
所以,

即 是 的无偏估计量,从而
而样本残差平方和 的自由度 。
因为,样本残差可以看作是总体随机项的估计量,而样本残差 ,是完全可以计算的,因此,可以用样本残差的方差来估计总体随机项的方差。
我们目的是得到 的无偏估计量,因此,我们需要确定样本残差平方和的自由度 ,使得
(3.4.3)
由于 ,所以,上式等价于
(3.4.4)
可以证明 ,其中n是样本容量。下面给出证明:
证明
证明:为了得到 的值,我们不妨先求 ,看它和 是什么关系。由于

两边求均值,有
所以

两边求均值有:
由于 ,所以有:
将 和 代入 有
对上式平方求和再取期望值有:
在式中:
由于 ,其中 ,所以,上式可以写为:
注意式中 是n项之和,而 则是n(n-1)项之和。
注意:式中 是n项之和,而 则是nn-1)项之和。

计量经济学 —理论方法EVIEWS应用--第七章 序列相关性

计量经济学 —理论方法EVIEWS应用--第七章  序列相关性
C o v ( , j ) E ( ) 0 i i j
在其他假设仍然成立的条件下,随机干扰项序列相关意味着
(7-2)
如果仅存在
E ( ) 0 , i 1 , 2 , . . . , n i i 1
(7-3)
则称为一阶序列相关或自相关(简写为AR(1)),这是常见的一种序列相关问题。
D .W .
不存在一阶自相关,构造如下统计量: t
t
( eˆ
t2
n
ˆt 1 ) 2 e
2 t

t 1
n
杜宾—沃森证明该统计量的分布与出现在给定样本中的X值有复杂的关系,
其准确的抽样或概率分布很难得到;
因为D.W.值要从
eˆ t 中算出,而 eˆ t
又依赖于给定的X的值。
2 χ 因此D-W检验不同于t、F或 检验,它没有唯一的临界值可以导出拒绝或
用OLS法估计序列相关的模型得到的随机误差项的方差不仅是 有偏的,而且这一偏误也将传递到用OLS方法得到的参数估计 量的方差中来,从而使得建立在OLS参数估计量方差基础上的 变量显著性检验失去意义。
以一元回归模型为例,
Y X i 0 1 i i
2
ˆ) Var ( 1 2 xt
序列相关性及其产生原因序列相关性的影响序列相关性的检验序列相关的补救第一节序列相关性及其产生原因序列相关性的含义对于多元线性回归模型71在其他假设仍然成立的条件下随机干扰项序列相关意味着如果仅存在则称为一阶序列相关或自相关简写为ar1这是常见的一种序列相关问题
—理论· 方法· EViews应用
郭存芝 杜延军 李春吉 编著
二、回归检验法
, eˆ, 以 e ˆ t 为解释变量,以各种可能的相关变量,诸如 t1

计量经济学 第四章_2 序列相关性

计量经济学 第四章_2 序列相关性

ij, i,j=1,2, …,n
则认为出现了序列相关性(serial correlation)。
# 序列相关性下的方差-协方差阵
在其他假设仍成立的条件下,序列相关即意味着 E ( i j ) 0
此时,随机误差项之间的方差-协方差阵为:
2 2 E ( 1 n ) Cov (μ ) E (μμ ) E ( ) 2 n 1 n1
(3)回归模型中不应含有滞后因变量作为解释变量,即不应
出现下列形式: Yt=0+1X1t+kXkt+Yt-1+t
(4)回归含有截距项
# D.W.检验统计量
杜宾和瓦森针对原假设:H0: =0, 即不存在一阶自回归,构造如下 统计量:
D. W.
~ (e
t 2
n
t
~ )2 e t 1
(0.22) (-0.497) (4.541) (-1.842) (0.087)
R2=0.6615
五、序列相关性的补救

如果模型被检验证明存在序列相关性,则首先需要分析其 原因,对症下药:
◦ 如果产生序列相关的原因是变量选择失准(如遗漏了重要的解释 变量等),则应调整变量;如果是模型设定不当,应当调整模型 形式。——虚假的序列相关问题 ◦ 如果原因在于客观经济现象的自身特点,如经济变量的惯性作用 等,则需要发展新的估计方法
~2 e t
t 1
n
• 该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精 确的分布很难得到。
• 但是,他们成功地导出了临界值的下限 dL 和上限 dU ,且这些上下 限只与样本的容量 n 和解释变量的个数 k 有关,而与解释变量X的 取值无关。

计量经济学复习笔记(二):一元线性回归(下)

计量经济学复习笔记(二):一元线性回归(下)

计量经济学复习笔记(⼆):⼀元线性回归(下)回顾上⽂,我们通过OLS推导出了⼀元线性回归的两个参数估计,得到了以下重要结论:ˆβ1=∑x i y i∑x2i,ˆβ0=¯Y−ˆβ1¯X.注意总体回归模型是Y=β0+β1X+µ,同时我们还假定了µ∼N(0,σ2),这使得整个模型都具有正态性。

这种正态性意味着许多,我们能⽤数理统计的知识得到点估计的优良性质,完成区间估计、假设检验等,本⽂就来详细讨论上述内容。

1、BLUE我们选择OLS估计量作为⼀元线性回归的参数估计量,最主要的原因就是它是最⼩⽅差线性⽆偏估计(Best Linear Unbiased Estimator),这意味着它们是:线性的。

⽆偏的。

最⼩⽅差的。

不过,光给你这三个词,你可能会对定义有所困扰——⽐如,关于什么线性?⼜关于什么是⽆偏的?我们接下来就对OLS估计量的BLUE性详细讨论,包括简单证明。

原本我认为,证明在后⾯再给出会更合适,引⼊也更顺畅,但是我们接下来要讨论的许多,都有赖于OLS估计量的BLUE性,因此我还是决定将这部分内容放在这⾥。

⾸先是线性性,它指的是关于观测值Y i线性,这有什么意义呢?注意到,在之前的讨论中,我们总讨论在给定X的取值状况下的其他信息,如µ的条件期望、⽅差协⽅差等,因此我们往往会在这部分的讨论中将X视为常数(⽽不是随机变量)看待,这会带来⼀些好处。

⽽因为µ∼N(0,σ2)且µi是从µ中抽取的简单随机样本,且µi与X i⽆关,所以由正态分布的性质,有Y i|X i∼N(β0+β1X i,σ2).实际上,由于参数真值β1,β1是常数,所以每⼀个Y i在给定了X i的⽔平下,都独⽴地由µi完全决定,⽽µi序列不相关(在正态分布的情况下独⽴),所以Y i之间也相互独⽴。

这样,如果有⼀个统计量是Y i的线性组合,那么由正态分布的可加性,这个统计量就⾃然服从正态分布,从⽽我们可以很⽅便地对其进⾏参数估计、假设检验等。

二阶段最小二乘法和工具变量法结果相同的证明

二阶段最小二乘法和工具变量法结果相同的证明

二阶段最小二乘法(Two-Stage Least Squares, 2SLS)和工具变量法(Instrumental Variables, IV)在计量经济学中被广泛应用,用于解决因果关系的内生性问题。

虽然这两种方法在形式上有所不同,但是它们在某些条件下可以得到相同的结果。

本文将就二阶段最小二乘法和工具变量法结果相同的证明展开探讨。

1. 二阶段最小二乘法的基本原理及公式我们需要了解二阶段最小二乘法的基本原理。

在计量经济学中,当自变量存在内生性问题时,我们无法直接使用最小二乘法进行回归分析。

这时,我们可以通过引入工具变量来解决内生性问题。

二阶段最小二乘法包括两个阶段,第一阶段是利用工具变量估计内生变量的值,第二阶段是利用第一阶段的估计值替代内生变量进行普通最小二乘法回归分析。

其公式为:[Y_i = _0 + _1X_i + _i][X_i = _0 + _1Z_i + _i]其中,(Y_i)代表因变量,(X_i)代表内生解释变量,(Z_i)代表工具变量,(_i)和(_i)分别为误差项。

通过两个阶段的回归分析,我们可以得到最终的估计结果。

2. 工具变量法的基本原理及公式工具变量法是一种处理内生性的方法,其基本原理是利用与内生解释变量相关但与误差项不相关的外生变量作为工具变量,通过工具变量的线性组合来替代内生变量进行估计。

工具变量法的回归模型可以表示为:[X_i = _0 + _1Z_i + _i] [Y_i = _0 + _1 + _i]其中,()是利用工具变量估计的内生变量的值。

3. 二阶段最小二乘法和工具变量法结果相同的条件现在让我们来探讨二阶段最小二乘法和工具变量法结果相同的条件。

事实上,当工具变量法满足一定条件时,其结果与二阶段最小二乘法是等价的。

具体而言,若工具变量满足外生性和相关性条件(即与内生变量相关),并且内生变量的影响能够完全通过工具变量进行替代,那么工具变量法的结果将与二阶段最小二乘法一致。

正态分布标准化的证明计量经济学-概述说明以及解释

正态分布标准化的证明计量经济学-概述说明以及解释

正态分布标准化的证明计量经济学-概述说明以及解释1.引言1.1 概述在计量经济学中,正态分布是一种非常重要的概率分布。

它具有许多良好的性质,例如对称性、稳定性和易于处理的特点,因此在经济学研究中得到了广泛的应用。

正态分布标准化是将原始的正态分布数据转化为具有均值为0,标准差为1的标准正态分布数据的过程。

通过标准化,我们可以更好地比较不同数据集之间的差异,也可以更方便地进行概率统计推断。

本文旨在探讨正态分布标准化的原理、计算方法以及在计量经济学中的重要性和实际意义。

我们将深入解析正态分布的基本概念,阐述在计量经济学中如何运用正态分布标准化进行数据分析和推断。

通过本文的学习,读者将更好地理解正态分布标准化的意义和应用,为其在经济学领域的研究提供更深入的思路和方法。

愿本文能为读者提供有益的启发和帮助。

1.2 文章结构文章结构部分内容:在本文中,我们将首先介绍正态分布的基本概念,包括其定义、性质和重要性。

接着,我们将详细讨论正态分布标准化的原理,探讨为何需要对正态分布进行标准化以及标准化的方法。

最后,我们将总结正态分布标准化的重要性,探讨其在实际应用中的意义,并展望在计量经济学领域中正态分布标准化的未来发展趋势。

通过本文的阐述,读者将深入了解正态分布标准化的理论基础和实际应用,为进一步的研究和应用提供有力的支持。

1.3 目的本文旨在深入探讨正态分布标准化在计量经济学中的重要性及应用。

具体目的包括:1. 探讨正态分布的基本概念,帮助读者更好地理解正态分布及其特点;2. 分析正态分布标准化的原理,揭示其实现标准化的过程及意义;3. 阐述正态分布标准化的计算方法,为读者提供实际操作的指导;4. 总结正态分布标准化在计量经济学中的重要性,强调其在数据处理和分析中的优势;5. 探讨正态分布标准化的实际意义,展示其在实践中的应用场景及效果;6. 展望正态分布标准化在计量经济学中的未来发展,指出其可能的应用领域和研究方向。

计量经济学-多元线性回归模型

计量经济学-多元线性回归模型

e e ˆ n k 1 n k 12e i2 3-21
*二、最大或然估计
对于多元线性回归模型
Yi 0 1 X 1i 2 X 2 i k X ki i
易知
Yi ~ N ( X i β , 2 )
Y的随机抽取的n组样本观测值的联合概率 ˆ, L (β 2 ) P (Y1 , Y2 , , Yn )
解该(k+1) 个方程组成的线性代数方程组,即
$ ,, 可得到(k+1) 个待估参数的估计值 j , j 012,, k 。
3-14
正规方程组的矩阵形式
n X 1i X ki
X X

1i 2 1i

X X X
ki
X
ki
X 1i
ˆ 0 1 1 ˆ X 11 X 12 1i ki 1 2 ˆ X ki k X k1 X k 2
ˆ 1 ˆ ˆ 2 β ˆ k
在离差形式下,参数的最小二乘估计结果为
ˆ β ( x x) 1 x Y
ˆ ˆ ˆ 0 Y 1 X 1 k X k
3-20
随机误差项的方差2的无偏估计
可以证明:随机误差项 的方差的无偏估计量为:
第三章

多元线性回归模型
多元线性回归模型 多元线性回归模型的参数估计 多元线性回归模型的统计检验 多元线性回归模型的预测 回归模型的其他形式 回归模型的参数约束
3-1
§3.1 多元线性回归模型
一、多元线性回归模型 二、多元线性回归模型的基本假定

计量经济学一些结论和证明

计量经济学一些结论和证明

xi2 yi2
(2)
又知:
b2
xi yi xi2
将 b2 带入(2)式可得到:
r 2 (
xi yi )2
xi2
yi2
化简得到如下正规方程:
(Yt b1 b2 X t ) 0
(Yt b1 b2 X t ) X t 0
由正规方程得到如下解:
b1 Y b2 X
b2
X tYt
1 n
Xt2
1 n
(
X t Yt
Xt )2
XtYt nXY X t 2 nX 2
xt yt xt 2
(2)关于b1
E(b1) E (Dt (B1 B2 X t ut )) E( B1Dt B2 Dt X t Dtut )
B1Dt B2Dt X t (Dt E(ut )) B1 Dt B2 Dt X t 0
B1
所以,b1是B1的无偏估计量。
3.有效性
首先求解b1和b2的方差
ct 2
gt2 2
xt gt xt 2
ct 2
gt2 2
Xt gt X xt 2
gt
ct2 gt2
因此
Var(b%2 ) 2 ( ct2 gt2 )
2 xt 2
2
gt 2
Var(b2 ) 2 gt2
所以
Var(b2) Var(b%2)
(2)关于b1 其证明和b2类似。
1.线性
(1)关于b2。 证:
b2
xt yt xt 2
xtYt xt 2
xt xt 2
Yt
ctYt
其中,ct
xt xt 2
由于ct是非随机变量,所以b2是关于Yt的线性函数。

计量经济学公式推导

计量经济学公式推导

计量经济学公式推导⼀、最⼩⼆乘估计式推导过程:由⽅程组0?)(112=??∑=βnt t e (1)0?)(212=??∑=βnt t e …………………(2) ,得(注意:根据导数运算法则,若)(x f 和)(x g )在⼀个共同的区间),(b a 上有定义,并且在每⼀点),(b a x ∈都可导,则有)()(])()([x g x f x g x f '±'='±;)()()()(])()([x g x f x g x f x g x f '*+*'='*;对于常数c ,则)(])([x f c x cf '=';当0)(≠x g 时,2)]([)()()()(])()([x g x g x f x g x f x g x f '-'=')因此,由(1)式得,0?)(?)(1122=??=??∑∑==nt t nt t e e ββ (3)由(2)式得,0?)(?)(122212=??=??∑∑==nt t nt t e e ββ (4)根据复合函数微商定理:若对于)(y g z =,)(x f y =,若)(x f y =在⼀点0x 可导,且)(y g z =在相应的点)(00x f y =处可导,则复合函数))((x f g 在0x 可导,且有公式)()())((000x f y g dx x f dg x x ''==因此,依复合函数微商定理,由(3)式得,0)?)()()((?)(112112=??*??=??∑∑==n t t t t nt t e e e e ββ…………(5)⼜依据微商运算公式:1)(-='m m mxx ,⼜t)12(112112=?-*=??*??=??∑∑∑∑=--==t nt t n t t t t nt t e e e e e e βββ………(7) 同理根据复合函数微商定理,由(4)式得,0))?()()()((?)(122122=??*??=??∑∑==n t t t t nt t e e e e ββ……………(6) 同理⼜依据1)(-='m m mxx ,及tt t t t t t t X Y e e X e Y Y 2121ββββ--=?++=+= 可得,0)?1)(2())?()()()((?)(11)11(2)12(12 2122=-*?=??*??=??∑∑∑∑==--==n t t t n t t t n t t tt nt t X e X e e e e e βββ……(8) 同样根据:tt t t t t t t X Y e e X e Y Y 2121ββββ--=?++=+=,可以得到⽅程组: 0)??(1211=--=∑∑==nt ttn t t X Ye ββ……………………(9) 0)??(1211=--=∑∑==nt tt ttX X YX e ββ………………(10) ⽅程(9)、(10)称为正规⽅程,合起来组成的⽅程组称为正规⽅程组。

计量经济学中的各种检验

计量经济学中的各种检验
n k 1 的决定系数为负(推导过程略,可自己推导)。此时修正的决定系数将失去 意义,作R 2=0处理。事实上,R 2只适用于被解释变量与解释变量的整体相关 程度比较高的情况。
需要说明的问题
在实际应用中,我们往往希望所建立模型的决定 系数或修正的决定系数越大越好。但应注意,决 定系数只是对模型拟合优度的度量,决定系数或 修正的决定系数越大,只能说明列入模型的解释 变量对被解释变量整体的影响程度很大,并不能 说明模型中各个解释变量对被解释变量的影响程 度显著。因此在选择模型时,不能单纯地凭决定 系数的高低来断定模型的优劣,有时从模型的经 济意义和整体可靠程度的角度出发,可以适当降 低对决定系数的要求。
拟合优度检验和F检验的关系
F检验和拟合优度检验都是把总变差TSS分 解为回归平方和与残差平方和,并在这一 分解的基础上构造统计量进行的检验。区 别在于前者有精确的分布而后者没有。一 般来说,模型对观测值的拟合程度越高, 模型总体线性关系的显著性越强。
拟合优度检验和F检验的关系
F显著==>拟合优度必然显著
这两准则均要求仅当所增n 加n的解释变量能够减少 AIC值或SC值时才在原模型中增加该解释变量。
回归模型的总体显著性检验
拟合优度检验可以说明模型对样本数据的 近似情况。模型的总体显著性检验则一般 用来检验全部解释变量对被解释变量的共 同影响是否显著。
回归模型的总体显著性检验
检验全部解释变量对被解释变量的共同影响是否显著,或者说,检验回
TSS=RSS+ESS 被解释变量Y总的变动(差异)=解释变量
X引起的变动(差异)+除X以外的因素引 起的变动(差异) 如果X引起的变动在Y的总变动中占很大比 例,那么X很好地解释了Y;否则,X不能 很好地解释Y。

计量经济学复习笔记(四):多元线性回归

计量经济学复习笔记(四):多元线性回归

计量经济学复习笔记(四):多元线性回归⼀元线性回归的解释变量只有⼀个,但是实际的模型往往没有这么简单,影响⼀个变量的因素可能有成百上千个。

我们会希望线性回归模型中能够考虑到这些所有的因素,⾃然就不能再⽤⼀元线性回归,⽽应该将其升级为多元线性回归。

但是,有了⼀元线性回归的基础,讨论多元线性回归可以说是轻⽽易举。

另外我们没必要分别讨论⼆元、三元等具体个数变量的回归问题,因为在线性代数的帮助下,我们能够统⼀讨论对任何解释变量个数的回归问题。

1、多元线性回归模型的系数求解多元线性回归模型是⽤k 个解释变量X 1,⋯,X k 对被解释变量Y 进⾏线性拟合的模型,每⼀个解释变量X i 之前有⼀个回归系数βi ,同时还应具有常数项β0,可以视为与常数X 0=1相乘,所以多元线性回归模型为Y =β0X 0+β1X 1+β2X 2+⋯+βk X k +µ,这⾥的µ依然是随机误差项。

从线性回归模型中抽取n 个样本构成n 个观测,排列起来就是Y 1=β0X 10+β1X 11+β2X 12+⋯+βk X 1k +µ1,Y 2=β0X 20+β1X 21+β2X 22+⋯+βk X 2k +µ2,⋮Y n =β0X n 0+β1X n 1+β2X n 2+⋯+βk X nk +µn .其中X 10=X 20=⋯=X n 0=1。

⼤型⽅程组我们会使⽤矩阵表⽰,所以引⼊如下的矩阵记号。

Y =Y 1Y 2⋮Y n,β=β0β1β2⋮βk,µ=µ1µ2⋮µn.X =X 10X 11X 12⋯X 1k X 20X 21X 22⋯X 2k ⋮⋮⋮⋮X n 0X n 1X n 2⋯X nk.在这些矩阵表⽰中注意⼏点:⾸先,Y 和µ在矩阵表⽰式中都是n 维列向量,与样本容量等长,在线性回归模型中Y ,µ是随机变量,⽽在矩阵表⽰中它们是随机向量,尽管我们不在表⽰形式上加以区分,但我们应该根据上下⽂明确它们到底是什么意义;β是k +1维列向量,其长度与Y ,µ没有关系,这是因为β是依赖于变量个数的,并且加上了对应于常数项的系数(截距项)β0;最后,X 是数据矩阵,且第⼀列都是1。

计量经济学 终稿

计量经济学 终稿

一、考虑储蓄函数sav=β0+β1inc+u, u=√inc e. 其中,.是一个随机变量,且具有E(.)=0和Var(.)=σ2., 假设.独立于inc(1)证明:若E(u丨inc)=0, 则满足零条件均值的关键假设(2)证明:若Var(u丨inc)=σe2inc, 则不满足同方差假定SLR.5.(3)讨论支持储蓄方差随着家庭收入递增的证据.答案(1)∵.独立于inc则E(.丨inc)=E(.)=0∴E(u丨inc)=E(√inc e.丨inc)=√inc E(.丨inc)=0即满足零条件均值的假设(2)Var(u丨inc)=var(√inc e.丨inc)=(√inc)2evar(.丨inc)=incevar(.丨inc)∵e独立于inc, var(e丨inc)=var(e)=∴var(u丨inc)=σ2e*inc(3)一个低收入家庭会把大部分收入用在食物衣服等生活必需品上,可能有一部分储蓄, 随着收入的增加, 他们的额消费范围会扩大,也就是说储蓄方差会变大二、用WAGE2 RAW中有关男工人的数据估计了如下方程(1)Sibs是否具有预期的影响?(2)讨论对m.duc的系数的解释(3)假设一个男工人A没有兄弟姐妹答案:(1)有预期的影响,因为sibs前系数为-0 094,即代表兄弟姐妹每增加1个,预期受教育年数少0 094年Δsibs=1/0.094=10.64,即为使预测受教育程度较少一年需增加sibs10.64个(2)M.duc系数为0 131,代表母亲受教育年数每增加一年男工人预期受教育年数增加0 131年̂A)=10 36-0+0 131e12+0 21e12=14 425(3)E(eduĉB)=10 36-0+0 131e16+0 21e16=15 816E(eduĉ)=1 364∆E(educ三、刚从法学院毕业的学生的起薪中位数由下式决定(1)解释为什么我们预期(2)你预计其他斜率参数的符号如何?(3)使用LAWSCH85 RAW中的数据(4)解释变量log(libvol)的系数(5)你是否认为应该进入一个排名更高的法学院?答案:(1)因为β5是rank的系数, 而rank越小代表法学院越好,即毕业生的工资越高所以rank值应和工资相关, 所以β5≤0(2)预计β≥1, β4均大于0 因为图书馆书量越多,学费越高代表教学条件越高,学生所获取只是越多,应与工资正相关=77.01%(100∗0.248)=24.8%(3)1.7701−11(4)log libvol的系数为0 095表示图书馆藏书量增加1%工资增加0 095%(5)应当进入排名更高的法学院当∆rank=20时, ∆lang=1 1641即排名相差20位, 工资起薪相差16 41%四、在一项调查大学GPA与每种活动中所耗时间之关系的研究(1)在模型中保持sl..p和l.isur.不变而改变study有意义?(2)解释为什么这个模型违背了假定MLR 3(3)你如何才能将这个模型重新表述?答案:(1)无意义,时间之和为参值(2)四活动之和为168,即四者中人任意者均可由其他三者线性表示, 与MLR 3不存在完全共线性矛盾(3)讲study变成168-work-sl..p-l.isur.GPA=β0+168β1+(β2-β1)work+(β3-β1)sl..p+(β4-β1)l.isur.+μ五、假定一名大学生正在修读三门课,一门两学分一门三学分和一门四学分答案:三门课在总学分中所占权重分别为22+3+4=2932+3+4=1342+3+4=49E(GPA)=3 5e2/9 +3e1/3 +3e4/9 = 10/3六、令X为美国大学教授以千美元计的年薪, 假定平均年薪52 3 答案:设一下美元计的年薪为YY=1000X∵E(X)=52.3 sd(X)=14.6∴E(Y)=E(1000X)=52300(美元)Sd(Y)=sd(1000X)=14600所以以美元计的年薪均值和标准值分别为52300和14600七、假定在一所大型的大学里,大学平均成绩GPA和SAT分数的关系由条件期望(1)求当SAT=800时的期望GPA, 求并评论(2)若该大学的平均SAT为1100, 则平均GPA是多少?(3)若一个学生的SAT是1100, 这是否意味着答案:(1)∵E(GPA丨SAT)=0 70+0 002SAT∴ SAT=800时E(GPA)=E(GPA丨SAT)=2.30E(GPA丨SAT =1400)=3.50由于给定的SAT成绩不同,所以GPA不同(2)E(GPA)=0.70+0.002*100=2.90(3)总体均值为2.90, 不一定个体均值也是。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计量经济学中相关证明Newly compiled on November 23, 2020课本中相关章节的证明过程第2章有关的证明过程一元线性回归模型有一元线性回归模型为:y t = 0 + 1 x t + u t上式表示变量y t 和x t之间的真实关系。

其中y t 称被解释变量(因变量),x t称解释变量(自变量),u t称随机误差项,0称常数项,1称回归系数(通常未知)。

上模型可以分为两部分。

(1)回归函数部分,E(y t) = 0 + 1 x t,(2)随机部分,u t。

图真实的回归直线这种模型可以赋予各种实际意义,收入与支出的关系;如脉搏与血压的关系;商品价格与供给量的关系;文件容量与保存时间的关系;林区木材采伐量与木材剩余物的关系;身高与体重的关系等。

以收入与支出的关系为例。

假设固定对一个家庭进行观察,随着收入水平的不同,与支出呈线性函数关系。

但实际上数据来自各个家庭,来自各个不同收入水平,使其他条件不变成为不可能,所以由数据得到的散点图不在一条直线上(不呈函数关系),而是散在直线周围,服从统计关系。

随机误差项u t中可能包括家庭人口数不同,消费习惯不同,不同地域的消费指数不同,不同家庭的外来收入不同等因素。

所以,在经济问题上“控制其他因素不变”实际是不可能的。

回归模型的随机误差项中一般包括如下几项内容,(1)非重要解释变量的省略,(2)人的随机行为,(3)数学模型形式欠妥,(4)归并误差(粮食的归并)(5)测量误差等。

回归模型存在两个特点。

(1)建立在某些假定条件不变前提下抽象出来的回归函数不能百分之百地再现所研究的经济过程。

(2)也正是由于这些假定与抽象,才使我们能够透过复杂的经济现象,深刻认识到该经济过程的本质。

通常,线性回归函数E(y t) = 0 + 1 x t是观察不到的,利用样本得到的只是对E(y t) = 0 +x t 的估计,即对0和1的估计。

1在对回归函数进行估计之前应该对随机误差项u t做出如下假定。

(1) u t 是一个随机变量,u t 的取值服从概率分布。

(2) E(u t) = 0。

(3) D(u t) = E[u t - E(u t) ]2 = E(u t)2 = 2。

称u i 具有同方差性。

(4) u t 为正态分布(根据中心极限定理)。

以上四个假定可作如下表达:u t N(0,)。

(5) Cov(u i, u j) = E[(u i - E(u i) ) ( u j - E(u j) )] = E(u i, u j) = 0, (i j )。

含义是不同观测值所对应的随机项相互独立。

称为u i 的非自相关性。

(6) x i是非随机的。

(7) Cov(u i, x i) = E[(u i - E(u i) ) (x i - E(x i) )] = E[u i (x i - E(x i) ] = E[u i x i - u i E(x i) ] = E(u i x i)= 0.u i与x i相互独立。

否则,分不清是谁对y t的贡献。

(8) 对于多元线性回归模型,解释变量之间不能完全相关或高度相关(非多重共线性)。

在假定(1),(2)成立条件下有E(y t) = E(0+ 1 x t+ u t) = 0+ 1 x t。

最小二乘估计(OLS )对于所研究的经济问题,通常真实的回归直线是观测不到的。

收集样本的目的就是要对这条真实的回归直线做出估计。

图怎样估计这条直线呢显然综合起来看,这条直线处于样本数据的中心位置最合理。

怎样用数学语言描述“处于样本数据的中心位置”设估计的直线用t y ˆ =0ˆβ+1ˆβ x t 表示。

其中t y ˆ称y t 的拟合值(fitted value ),0ˆβ和1ˆβ分别是 0 和1的估计量。

观测值到这条直线的纵向距离用t uˆ表示,称为残差。

y t =t y ˆ+t u ˆ=0ˆβ+1ˆβ x t +t u ˆ 称为估计的模型。

假定样本容量为T 。

(1)用“残差和最小”确定直线位置是一个途径。

但很快发现计算“残差和”存在相互抵消的问题。

(2)用“残差绝对值和最小”确定直线位置也是一个途径。

但绝对值的计算比较麻烦。

(3)最小二乘法的原则是以“残差平方和最小”确定直线位置。

用最小二乘法除了计算比较方便外,得到的估计量还具有优良特性(这种方法对异常值非常敏感)。

设残差平方和用Q 表示,Q = ∑=Ti t u 12ˆ= ∑=-Ti t t y y 12)ˆ(= ∑=--Ti tt x y 1210)ˆˆ(ββ, 则通过Q 最小确定这条直线,即确定0ˆβ和1ˆβ的估计值。

以0ˆβ和1ˆβ为变量,把Q 看作是0ˆβ和1ˆβ的函数,这是一个求极值的问题。

求Q 对0ˆβ和1ˆβ的偏导数并令其为零,得正规方程,ˆβ∂∂Q= 2∑=--Ti tt x y 110)ˆˆ(ββ(-1) = 01ˆβ∂∂Q= 2∑=--Ti tt x y 110)ˆˆ(ββ(- x t ) = 0 下面用代数和矩阵两种形式推导计算结果。

首先用代数形式推导。

由()、()式得,∑=--Ti tt x y 110)ˆˆ(ββ= 0 ∑=--Ti tt x y 110)ˆˆ(ββx t = 0 ()式两侧用除T ,并整理得,0ˆβ= x y 1ˆβ- 把()式代入()式并整理,得,])(ˆ)[(11∑=---Ti ttx x y yβx t = 0 ∑∑==---Ti t tTi t t x x xx y y 111)(ˆ)(β= 01ˆβ= ∑∑--t tt txx x y y x )()( 因为∑=-Ti t y y x 1)(= 0,∑=-Ti t x x x 1)(= 0,[采用离差和为零的结论:∑==-Ti t x x 10)(,0)(1=-∑=Ti ty y]。

所以,通过配方法,分别在()式的分子和分母上减∑=-Ti t y y x 1)(和∑=-Ti t x x x 1)(得,1ˆβ= ∑∑∑∑------)()()()(x xx x x xy yx y y x ttttt t= ∑∑---2)())((x x y y x x ttt即有结果:1ˆβ= ∑∑---2)())((x x y y x x t t t t t ()0ˆβ= x y 1ˆβ- 这是观测值形式。

如果以离差形式表示,就更加简洁好记。

1ˆβ= ∑∑2ttt xyx0ˆβ= x y 1ˆβ- 矩阵形式推导计算结果:由正规方程,ˆβ∂∂Q= 2∑=--Ti tt x y 110)ˆˆ(ββ(-1) = 01ˆβ∂∂Q= 2∑=--T i tt x y 110)ˆˆ(ββ(- x t ) = 0 0ˆβT +1ˆβ (∑=Ti t x 1) = ∑=Ti t y 1ˆβ∑=Ti t x 1+1ˆβ (∑=Ti tx 12) = ∑=Ti t t y x 1⎥⎦⎤⎢⎣⎡∑∑∑2ttt xx xT⎥⎥⎦⎤⎢⎢⎣⎡10ˆˆββ=⎥⎥⎦⎤⎢⎢⎣⎡∑∑t t t y x y ⎥⎥⎦⎤⎢⎢⎣⎡10ˆˆββ=12-⎥⎥⎦⎤⎢⎢⎣⎡∑∑∑t tt x x x T⎥⎥⎦⎤⎢⎢⎣⎡∑∑t t t y x y =22)(1∑∑-t t x x T ⎥⎥⎦⎤⎢⎢⎣⎡--∑∑∑T x x x tt t 2⎥⎥⎦⎤⎢⎢⎣⎡∑∑t t t y x y = ⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛----∑∑∑∑∑∑∑∑∑∑∑22222)()(t t t t t t t t t t t t t x x T y x y x Tx x T y x x y x 注意:关键是求逆矩阵12-⎥⎥⎦⎤⎢⎢⎣⎡∑∑∑t tt x x x T。

它等于其伴随阵除以其行列式,伴随阵是其行列式对应的代数余子式构成的方阵的转置。

写成观测值形式。

1ˆβ= ∑∑---2)())((x x y y x x t t t t t0ˆβ= x y 1ˆβ-如果,以离式形式表示更为简洁:1ˆβ= ∑∑2ttt xyx0ˆβ= x y 1ˆβ-一元线性回归模型的特性1.线性特性(将结果离差转化为观测值表现形式) 2.无偏性其中:0)222=-===∑∑∑∑∑∑∑i i i i i ii x X X x x x x K ( 故有:∑+=i i u K 22ˆββ3. 有效性首先讨论参数估计量的方差。

即: ∑=222)ˆ(i x Var οβ同理有:显然各自的标准误差为:∑=22)ˆ(i x se οβ,∑∑=221)ˆ(i i x n X se οβ标准差的作用:衡量估计值的精度。

由于σ为总体方差,也需要用样本进行估计。

证明过程如下: 因此有: u X Y ++=21ββ那么:)()()(2121u X u X y Y Y i i i i ++-++==-ββββ根据定义:i i i x y e 2ˆβ-=,(实际观测值与样本回归线的差值) 则有:两边平方,再求和: 对上式两边取期望有:其中:2222οο==∑∑i i x x A故有:22)1(ο-=∑n e E i即有:⎥⎥⎦⎤⎢⎢⎣⎡-=∑222n e E i ο, 令2ˆ22-=∑n e i ο,则问题得证。

关于∑2i e 的计算:关于22R R ≤的证明:()()22211111R a k n n RR -⨯-=----=,其中:1≥a 。

当 11=⇒=a k当11>⇒>a k ,当102≤≤R 时,有: 关于2R 可能小于0的证明。

设:t t t u X Y +=2β则有:那么 0ˆ2=∂∂βJ但:0≠∑t e ,因为没有0ˆ1=∂∂βJ存在。

同时,还有:其中:()01=-=-=-∑∑∑∑t t t t e nne e n e e e,和 0=∑t t e X则:考虑到: 若定义可能小于0。

参考书:Dennis J. Aigner Basic Econometrics, Prentice-Hall, Englewood Cliffs, N. J. 1971,pp85-88第二章简单线性回归最小二乘估计最小方差性质的证明对于OLS 估计式^1β和^2β,已知其方差为这里只证明^2()Var β最小,^1()Var β最小的证明可以类似得出。

设2β的另一个线性无偏估计为*2β,即其中2,i i i i ix w k k x ≠=∑因为*2β也是2β的无偏估计,即*22()E ββ=,必须有 0i w =∑,1i i w X =∑同时*2()()i i Var Var wY β=∑ 22i w σ=∑ [因为2()i Var Y σ=]上式最后一项中22222()i i i i iiiiw x x w k k x x -=-∑∑∑∑∑∑0= (因为0i w =∑,1i i w X =∑)所以2*222222()()[]()i i i i x Var w k x βσσ=-+∑∑∑ 而20σ≥,因为i i w k ≠,则有2()0i i w k -≥,为此只有i i w k =时,^*22()()Var Var ββ=,由于*2β是任意设定的2β的线性无偏估计式,这表明2β的OLS 估计式具有最小方差性。

相关文档
最新文档