计量经济学与stata——第一章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 回归的本质
计量经济学的一般模型:
y = F(β, X ) +ε
E[ε ] = 0 E[εε ′] = σ 2Ω
回归是计量经济学的核心,理解回归的本质,对于掌握计量经济的理论与方
法至关重要。回归的本质用语言来描述其实很简单,就是:
对于一组随机变量 y 和 X ,如果 y 和 X 存在特定的关系,为分析 y 和 X 之
随机变量 y 和 X 的所有取值(即总体),来得到真实的 β 。
基于这两点,真实的模型形式 F (β , X ) 和 β 无法得到,只能利用估计方法和
样本数据去尽可能得到与真实 F (β , X ) 和 β 偏差或者误差最小的 Fˆ (β , X ) 和 βˆ ,
即
min E[( y − Fˆ (βˆ, X ))]2
dY
dY
2)平均消费倾向(APC) C 随着收入的增加而减少。 Y
对应的计量经济模型为:
C =α + βY +ε
(3)
模型的假设: 0 < β < 1,α > 0
如果现在从历史记录中或者观察到n个样本,通俗的说就是n套 C 和Y 的数
据,即( Ct ,Yt ), t = 1, 2,", n ,于是有如下一组方程:
2.1 统计关系与确定性关系...............................................................................................3 2.2 回归关系、相关关系与因果关系...............................................................................4 2.3 术语与符号...................................................................................................................4 2.4 数据类型.......................................................................................................................4 2.5 计量经济学的估计框架...............................................................................................5 2.6 经典计量经济学的方法论...........................................................................................5
3
讨论的是变量为确定性变量之间的关系( C = α + βY + ε 讨论的是不是确定性变 量的关系?)。
2.2 回归关系、相关关系与因果关系
回归关系与因果关系:尽管回归分析所研究的是因变量与自变量之间的相依关 系,但这种依赖关系并不是指这些变量之间具有因果关系。计量经济学分析的关 系只是统计意义上的关系。硬要扯上“因果“,计量经济学中多指Granger因果 关系。因果关系需要理论经济学家或者经济规律来确定。 回归关系与相关关系:所谓相关是指两个变量之间线性关联程度的度量,在线 性代数中,相关是对共线性的度量,计量经济学的相关与这一概念一致。而回归 分析的目的不仅是研究变量之间的相关性,重要的是,通过模型能揭示经济变量 之间的相互影响(相依性),其目的之一是在给定自变量的条件下,预测因变量 所对应的均值。
好的估计。最小二乘法能够使得这个标准达到最小,OLS的最小化标准见附录。
总体回归曲线 E(Ci /Yi ) =α + βYi
样本回归曲线 Cˆi = αˆ + βˆYi
Cn C4
C3
来自百度文库
C2 Cˆ2
e2
ε2
C1
Y1
Y2
Y3 Y4
Yn
图 1-1 OLS 回归本质的图示解
2 计量经济学的一些基本概念和术语
2.1 统计关系与确定性关系
2.3 术语与符号
以下对变量的称号,在大量的文献中常出现,不同的研究对象和不同的研究
目的,导致对变量的称号不同,但其基本含义是一致的。
因变量 Dependent variable
解释变量 Explanatory variable
被解释变量 Explained variable 自变量 Independent variable
5
7. 预测; 8. 利用模型进行控制或制定政策。
以上的步骤并不一定循序而进,也非绝对缺一不可,而是经典计量经济方法
论的主要内容。以下仍以凯恩斯消费理论为例来说明上述方法过程。
1.陈述凯恩斯消费理论:人们的收入增长导致消费增长,但消费增长没有收 入增长得快,即边际消费倾向小于 1。
2.设定消费的数理经济学模型:凯恩斯消费理论仅陈述了收入和消费这两个 变量之间的正相关关系,但没有给出具体的函数形式。数理经济学所给出的关系
3 Stata简单介绍.........................................................................................................8 4 第一章附录:.........................................................................................................8
4.1 诺贝尔经济学奖与计量经济学...................................................................................8 4.2 相关数学基础.............................................................................................................14 4.3 本章相关数学证明.....................................................................................................19
⎧ C1 = α + βY1 + ε1 ⎪⎪⎨⎪C"2"= "α +"β"Y2"+"ε2 ⎪⎩Cn = α + βYn + εn
(4)
关键的问题是:如何找到一个对参数α 和 β 的“好”的估计,使模型(3)
能尽可能准确的描述消费与收入的关系?
总体回归(也可称为真实的回归)是 E(Ci / Yi ) = α + βYi 。 假设现在已有一个估计αˆ 和 βˆ ,那么对于 n 个样本中的第 i 项数据点的估计
理解回归的例子:凯恩斯消费函数、OLS、一元线性回归(双变量回归)
凯恩斯消费函数是一个典型的一元线性回归模型,根据凯恩斯的经济理论,
消费和收入存在密切的联系,如果用 C 表示消费,Y 表示收入,则最简单与最常
见的凯恩斯消费函数理论模型可表示为:
C =α + βY
(2)
函数满足以下条件:
1
1)边际消费倾向 β (MPC) dC 位于 0 和 1 之间,即 0 < dC < 1 ;
被预测变量 Predict variable 预测元 Predictor
被回归因子 Regress variable 回归元 Regressor
响应变量 Response variable 控制变量 control variable
内生变量 Endogenous variable 外生变量 Exogenous variable
ei 通常成为残差。
进而可得:
(7)
2
Ci = α + βYi + εi = αˆ + βˆYi + ei
对任何一对估计值αˆ 和 βˆ ,残差平方和是:
(8)
n
n
∑ ∑ ei2 = (Ci − αˆ − βˆYi )2
i =1
i =1
(9)
使得这个残差平方和最小的估计αˆ 和 βˆ ,即是在现有数据下对参数α 和 β 最
由前述,计量经济学的核心内容是回归分析,回归分析所讨论的是随机变量 ,因此回归分析讨论的是随机变量之间的相依性,随机变量之间的相依性即为统 计关系。与之不同的是变量间的确定性关系,如数学里变量 x 和 y 之间的某种函
数关系, y = f (x) (例如:圆面积 = f (π ,半径) = π ⋅半径2 ),这种确定性关系所
(1)
使得(1)成立的 Fˆ (β , X ) 即是 y 对于 X 的条件数学期望:
Fˆ (βˆ, X ) = E[ y / X ]
注:从参数估计的角度来说,对于不同的估计方法,比如OLS(最小二乘估计法)、
MLE(最大似然估计法)、GMM(矩估计或广义矩估计法),最小化均方误差的 表述不尽相同,但本质是一样的。
理论
计量经济学
应用
经典
非经典
抽样估计框架
贝叶斯估计框架
图 2-1 计量经济学的分类与估计框架
2.6 经典计量经济学的方法论
一般而言,经典计量经济学方法论仍支配着经济学的实证或应用,以及其它 的社会科学和行为科学。经典计量经济方法论包括以下几个方面:
1. 陈述经济学理论或感兴趣的假设; 2. 设定表述经济学理论的数理经济学模型; 3. 设定相应的计量经济学模型(或统计模型); 4. 采集数据; 5. 估计计量经济模型的参数; 6. 基于所估计的模型进行假设检验;
2.5 计量经济学的估计框架
一般而言,计量经济学可以分为理论计量经济学和应用计量经济学,理论计 量经济学是以方法论为主要内容的方法论,而应用计量经济学则以方法论和应用 相融合而形成主要内容,而且方法论尽量简化。以抽样分析为主的计量经济学称 为经典计量经济学,而以贝叶斯分析为主要方法论的计量经济学称为非经典计量 经济学。如
第一章 引言
目录
1 回归的本质.............................................................................................................1 2 计量经济学的一些基本概念和术语.....................................................................3
4
(2)横截面数据(cross section data)。横截面数据即是对一个或多个变量 在同一个时间对于多个对象所观测或记录的数据,如人口普查,不同的省同时在 一个时点上记录的人口数量、性别、受教育程度、年龄等就构成一个横截面数据。
(3)时间序列和横截面数据混合的数据(panel data),即纵向为时间序列 数据,横向为不同的对象,这一类数据称为Panel或Pooling数据。
间的相互影响,或用 X 去预测 y ,需要知道 y 和 X 的模型形式以及模型中参数 β
的值,但是,由于——
1、正确的模型形式 y = F (β , X ) 未知,只能尽可能去逼近它(注:这涉及经
济理论模型及模型设定的问题)。
2、即使假定模型的形式 y = F (β , X ) (不包括 β )已被确定,也不可能穷尽
2.4 数据类型
(1)时间序列数据(time series data):对某个变量连续或不连续观测或 记录的数据,如每日的股票价格,每年的收入和消费,每年的GDP等,计量经济 学一般使用有规则的观测数据,如每天,年,季等。还有一些变量用来定义分类, 如性别、工作或失业,受教育程度是大学毕业或非大学毕业等,这一类变量称为 分支变量或分类变量,根据分类的多少,分为二分支或多分支变量。基于时间序 列数据建立的计量经济学称为时间序列计量经济学
可写为:
Cˆi = αˆ + βˆYi 式(5)也称作对 E(Ci / Yi ) 的估计。
与第 i 项数据点相联系的随机干扰项可表示为: εi = Ci − E(Ci / Yi )
8 εi = Ci −α − βYi 则随机干扰项的一个估计就是:
(5) (6)
ei = Ci − Cˆi 8
ei = Ci − αˆ − βˆYi