蒙特卡罗模拟在_计量经济学_教学中的应用_卢二坡
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
是无偏的,因此也不是 BLUE 的,但它比 OLS 估计量更
渐近有效,也就是说在大样本中比 OLS 估计量更有效。
1.2 存在误差序列相关时的蒙特卡罗模拟过程
为了使用蒙特卡罗模拟实验说明序列相关对 OLS
估计的影响,首先需要使用 Stata 软件编写产生一次实
验结果的程序,编写的程序如下:
. capture program drop serialcorr //清 除 内 存 中 名 为 se-
0.8043], 这一置信区间很窄并且包含了参数真值 0.8。
因此,可以验证前述第一条影响:即当随机扰动项存在
序列相关时,回归系数的 OLS 估计量仍然是无偏的。
(2)OLS 估计量的标准差是有偏估计。 由蒙特卡罗
∧
模拟可得到 1000 次点估计量β 1ols, 进一步可计算其方
—— —
Σ 2
差 为 :s ∧ β 1ols
1.3 模拟结果分析
使用 stata 软件的“summarize”命令,可以对得到各
变量的均值、标准差、最小值、最大值等描述性统计量,
命令及运行结果如下:
. summarize b1ols se1ols b1fgls se1fgls
进 一 步 地 , 还 可 以 使 用 “mean” 命 令 得 到 各 变 量 均 值的 95%的置信区间,命令及运行结果如下:
帮助学生轻易获得对相关知识的直接体验和理解,进 而提高教学效果, 还可以提高学生运用统计软件的能 力。 国外就非常重视蒙特卡罗模拟实验在 《计量经济 学》教学 中 的 应 用 ,例 如 莫 瑞 (2009)等 的 教 材 里 ,就 有 很 多 通 过 蒙 特 卡 罗 模 拟 讲 解 基 本 原 理 的 例 子 ,Barreto 和 Howland(2005)甚 至 编 写 了 完 全 通 过 Excel 软 件 进 行蒙特卡罗模拟实验的方法讲解计量经济学的教材。 相比之下,国内对这方面的重视还不够。
蒙特卡罗模拟需要通过计算机编程来实现, 大多 数统计软件例如 R、MatLab、Gauss、Eviews、Stata 等都提 供了进行蒙特卡罗模拟编程的功能,其中,Stata 软件提 供了非常便捷的蒙特卡洛模拟环境和命令。 本文以存 在违背经典假定的残差序列相关性情形时为例, 运用 Stata 软件进行编程,说明蒙特卡罗模拟实验在《计量经 济学》教学中的应用。
关键词: 蒙特卡罗模拟; 计量经济学; 序列相关; Stata 软件
0 引言
《计量经济学》是高等学校经济学门类本科各专业 核心课程之一, 该课程的主要特点是理论与实际应用 并重, 既要突出学生对计量经济学方法理论基础的理 解和掌握, 又要着重培养学生在解决实际经济问题中 运用计量经济学的能力。 然而,在当前教学过程中,教 师大量使用数学公式推导和定理证明, 会使得学生对 计量经济学里的基本概念和原理难以有真正的理解, 感到课程学习压力大,容易产生厌学情绪,很大程度上 影响了教学效果。
不再是有效的估计, 基至也不是渐近有效估计。 或者
说,OLS 估计量的方差是有偏估计,并且这一偏误不会
随着样本容量的增大而消失。 当误差序列存在常见的
正的自相关性时,通常的 OLS 方差公式会低估 OLS 估
计量的真实方差, 会把 OLS 估计量想象得比实际上更
为精确,从而会使参数的显著性检验失效,可能会导致
并将模拟产生的结果保存下来。 Stata 软件提供了重复
上述模拟程序的命令“simulate”,运行程序 serialcorr.do
之后,执行下述命令:
. simulate b1ols=r(b1ols) se1ols=r(se1ols) b1fgls=r(b1fgls)
se1fgls=r(se1fgls), reps(1000):serialcorr
—— —
Σ ∧
∧
∧
估计得到的β 1ols 的均值为:β 1ols=(1/1000) β 1ols=0.8018,
∧
其作为 E(β 1ols)的估计,非常接近于真实数据生成过程
的参数真值 β1=0.8,二者之间细小的差异只是一种随机
误差。 这一点可进一步由“mean”命令输出结果看出:由
∧
模 拟 结 果 产 生 的 E (β 1ols)95% 的 置 信 区 间 为 [0.7993,
教学园地
蒙特卡罗模拟在《计量经济学》教学中的应用
卢二坡
(安徽财经大学统计与应用数学学院, 蚌埠 233030)
摘 要: 在大学本科《计量经济学》教学过程中,运用蒙特卡罗模拟实验可以帮助学生轻易获得对相关 知识的直接体验和理解,而不需要高级的数学知识。 以存在违背经典假定的序列相关情形时 为例,运用 Stata 软件进行编程,说明蒙特卡罗模拟实验在《计量经济学》教学中的应用。
//运用 FGLS 估计模型参数
15. return scalar b1fgls=_b[x] //返回 FGLS 估 计的 回 归
系数
16. return scalar se1fgls=_se [x] //返 回 回 归 系 数 的 标 准
误
17. end
上述程序命名为 serialcorr.do, 该程序首先清除内
yt=β0+β1xt+ut
(1)
式(1)中,β0=1,β1=0.8,xt 是从取值范围在 1~100 之
间的均匀分布抽取的随机变量。 随机扰动项 ut 由如下
的一阶自回归过程生成:
ut=ρut-1+et
(2)
式(2)中,ρ=0.7,et 是从均值为 0、标准差为 10 的正
态分布中抽取的随机变量,即 et~N(0,102)。
在 计 量 经 济 学 里 ,蒙 特 卡 罗 (Monte Carlo)模 拟 是 指 从 已 知 总 体 中 (或 者 从 设 定 的 数 据 生 成 过 程 (DGP) 中),反复生成随机样本,并计算参数估计量和统计量, 进而研究其分布特征的方法。 在大学本科《计量经济 学》教学过程中,可以通过蒙特卡罗模拟向学生讲解怎 样理解统计量的无偏性、有效性和一致性等基本概念; 也可以解释参数 OLS 估计量的抽样分布, 从而支持高 斯-马尔可夫定理的证明结论;当存在违背经典假定情 形(例如存在序列相关性、异方差性、多重共线性、随机 扰动项非正态性等)以及联立方程模型、动态分布滞后 模型等情形时, 还可以用蒙特卡罗模拟方法对不同的 参数估计量的统计特性进行评价。 在教学过程中,如果 能够结合统计软件使用蒙特卡罗模拟方法讲授相关概 念和原理,并进一步通过图形展示模拟结果,不但可以
1 存在误差序列相关时的蒙特卡罗模拟
1.1 误差序列相关性影响及克服办法
经典的线性回归模型包含了一组关于数据生成过 程的基本假定,包括线性性、自变量外生性、样本矩阵 满列秩、随机扰动项同方差、无自相关以及随机扰动项 服从条件正态分布等。 根据高斯-马尔可夫定理,在满 足上述假设的情况下, 回归系数的 OLS 估计量是最优 线性无偏估计量(BLUE)。
11. regress y x
//运用 OLS 估计参数
12. return scalar b1ols=_b [x] //返回 OLS 估 计的 回 归
系数
13. return scalar se1ols=_se [x] //返回 OLS 估 计的 回 归
系数标准误
14. prais y x, corc
σ∧ β 1ols
的估计),但前者明显大于后者。进一步由“mean”命
∧
令 输 出 结 果 看 出 :se(β 1ols)均 值 的 95%的 置 信 区 间 为
[0.03907,0.03961],而
s∧ β 1ols
=0.399986
明显在这一置信区
7. gen u=0
8. replace u=0.7*l.u+e if t>1 //生 成 具 有 一 阶 自 相 关
的残差序列
9. gen x=runiform ()*99+1
//生 成 取 值 范 围 1~100
之间的均匀分布
10. generate y=1+0.8*x+u
//数据生成过程 DGP
设的问题,称为“误差序列相关性”,经济行为自身的惯
性、 模型中的随机扰动项包含有存在自相关的解释变
量、 统计资料的特定生成方式例如移动平均等都会导
致误差序列出现自相关性。 此时, 会产生三种影响:
①回归系数的 OLS 估计量仍然是无偏的, 也就是说系
数估计量的均值仍然等于参数的真值; ②OLS 估计量
(1/999)
∧
∧
2
(β
- 1ols β
1ols)2, 这 是 真 实 方 差
σ∧ β 1ols
=
∧
var(β
1ols)
的
模
拟
估
计
,
类
似
的
,s
∧
β 1ols
是
σ∧ β 1ols
ຫໍສະໝຸດ Baidu
的模拟估计。
由“summarize”命令运行结果可以看出:直接由 1000 次
∧
OLS
估计得到的点估计量β
1ols
的标准差为
. mean b1ols se1ols b1fgls se1fgls
上述运行结果中的观测值数目(obs) 指的是模拟 的 次数 M(1000)而不是每次模拟的样本容量 n(150), 根据上述命令输出结果,可得到如下分析结论:
∧
(1)由 OLS 估计得到的点估计量β 1ols 具有无偏性。 由“summarize”命令运行结果可以看出,由 1000 次 OLS
收稿日期:2011-12-27 修稿日期:2012-01-12 作 者 简 介 :卢 二 坡 (1976-),男 ,河 南 焦 作 人 ,副 教 授 ,博 士 ,研 究 方 向 为 统 计 理 论 方 法 与 应 用
现代计算机 2012.01 趤趽
教学园地
线性回归模型随机扰动项违反序列无自相关性假
rialcorr 的程序
. program serialcorr, rclass //定义程序名
1. version 11.2
2. drop _all
3. set obs 150
4. gen t=_n
//生 成 时 间 变 量
5. tsset t
6. generate e=rnormal(0,10) //生成正态随机误差项
∧
(3)用 OLS 估 计 方 程 (1),并 返 回 估 计 的 参 数 β 1ols
∧
及其对应的标准误 se(β 1ols);
(4)使 用 FGLS 估 计 (科 克 伦-奥 克 特 法 ),并 返 回
∧
∧
估计的参数β 1fgls 及其对应的标准误估计 se(β 1fgls)。
接下来,需要对上述程序重复 M 次(例如 1000次),
原本不显著的变量变得显著; ③通常的 OLS 估计量不
再是 BLUE。
通常有两种方法来克服误差序列相关性产生的问
题:①直接对 OLS 估计的标准误差的偏差进行修正,例
如使用 Newey-West 标准误,从而得到标准误差的一致
估 计 ;②使 用 广 义 最 小 二 乘 (GLS)或 可 行 的 广 度 最 小 二
s∧ β 1ols
=
—— —
姨 Σ∧
∧
(1/999)
(β
1ols-β
)2
1ols
=0.0399986(见
b1ols
的标准
∧
差 ), 而 由 OLS 估 计 得 到 的 点 估 计 量β 1ols 的 标 准 误 差
∧
se (β 1ols) 的 均 值 为 0.03934 ( 见 se1ols 的 均 值 , 其 也 是
该 命 令 将 程 序 serialcorr.do 反 复 运 行 1000 次 , 每
趥趭 现代计算机 2012.01
教学园地
∧
∧
∧
∧
次 模 拟 得 到 估 计 量β 1ols、se(β 1ols)、β 1fgls 以 及 se(β ) 1fgls 都
保存于 b1ols、se1ols、b1fgls 和 se1fgls 四个变量中。
乘(FGLS)估计量。 当知道误差序列自相关性的参数值
ρ 时 ,可 使 用 GLS 估 计 量 ,并 且 GLS 估 计 量 BLUE 的 ;
在实际中,ρ 通常是未知的需要进行估计, 这时可以使
用 FGLS 估计量。 根据估计 ρ 的方法不同, 有科克伦-
奥克特估计和普莱斯-温斯登估计等。 FGLS 估计量不
存中已有的名为 serialcorr 的程序以及所有的变量和观
测值, 然后模拟产生数据生成过程, 并分别用 OLS 和
FGLS 估计模拟产生的数据,其具体思路如下:
(1) 设 定 样 本 容 量 为 n=150, 并 产 生 时 间 变 量 t=
1,2,3…;
(2)模拟生成数据生成过程,数据生成过程如下: