张晓峒2012年最新计量ppt第7章-蒙特卡罗模拟
合集下载
《蒙特卡罗模拟》PPT课件
(3)系统模拟法:是用数字对含有随机变量的系统进行模拟,可看作 是蒙特卡洛法的应用。一般说来,蒙特卡洛法用于静态计算,而系统模 拟法用于动态模型计算。我们主0,1]区间上均匀分布随机数的产生
定义 1:设 R 为[0,1]上服从均匀分布的随机变量,即的分布密度函数与 分布函数分别为:
布物物的理理随方方机法法数::一。一是是放放射射性性物物质质随随机机蜕蜕变变;;二二是是电电子子管管回回路路的的热热噪噪声声。(。(如如
②可可产将将生热热方噪噪法声声源源装装于于计计算算机机外外部部,,按按其其噪噪声声电电压压的的大大小小表表示示不不同同的的随随机机 物数数理。。方此此法法法:产产一生生是的的放随随射机机性性性物最最质好好随,,机但但蜕产产变生生;过过二程程是复复电杂杂子。。)管)回路的热噪声。(如 可查查将随随热机机噪数数声表表源-----装---””R于Raan计ndd算TTaa机bblel外e”(”(部11,995按555其年年噪由由美声美国电国兰压兰德的德公大公司小司编表编制示制,不,有同有随的随机随机数机数 数1100。00 此万万法个个产。。))生随随的机机随数数机表表性中中最的的好数数,字字但具具产有有生均均过匀匀程的的复随随杂机机。性)性,,没没有有周周期期性性。。使使 查用用随时时机,,数可可表根根-据据---需需”R要要an任任d取T取a一b一l段e段”(((1横9横5或或5 竖年竖)由)。。美如如国需需兰220德0个公个,司,便编便可可制从从,中有中取随取(机(顺数顺 1次次00))万2200个个个。,),需随需要机要几几数位位表取取中几几的位位数,,字随随具机机有数数均表表匀无无的所所随谓谓机位位性数数,,,没不不有能能周四四期舍舍性五五入。入。使。 用 次由 个由个时 )我递 随递随2,们推 机推机0可在数公个数公根使是式,是式据用由(需由(中需第如要第如可要同几i同i以个任余个位余在按取数按取数E一一公一几公x定c段式定e位式l公(中)公,)式产横在式随在推生或计推机计算随竖 算算数算出机机)出表机。来数内来无内如的,产的所产需,命生,谓生故令2伪故0位伪并为随个并数随非R机,非a,机真n数便真d不数正(:可正能:的)由从的四由随于中随于舍机第取机第五数(i数+入。i1+顺。。1 由但但递满满推足足公::式(如同余数公式)在计算机内产生伪随机数:由于第 i+1 个aa随))机有有数较较是好好由的的第随随机i机个、、按均均一匀匀定性性公。。式推算出来的,故并非真正的随机数。 但abcbdcbdc) ))满)) ))))有 算周足算周 算 故算故周算较 法期:法期 法 这法期法这好 过长过长 可 是过长可是的 程、程、 再 目程、再目随 不重不前重 现不前重现机 退复退复 , 最退复,最、 化化性性 速常化性速常均 ((差差 度 用(差度用即匀 即的。 快。即的。快不方性 不。不方。能法。 能能法反。反反。cd复复))复出出算算出现现法法现某某过可某一程再一一常不现常常数退,数数。化速。。)))度快。
定义 1:设 R 为[0,1]上服从均匀分布的随机变量,即的分布密度函数与 分布函数分别为:
布物物的理理随方方机法法数::一。一是是放放射射性性物物质质随随机机蜕蜕变变;;二二是是电电子子管管回回路路的的热热噪噪声声。(。(如如
②可可产将将生热热方噪噪法声声源源装装于于计计算算机机外外部部,,按按其其噪噪声声电电压压的的大大小小表表示示不不同同的的随随机机 物数数理。。方此此法法法:产产一生生是的的放随随射机机性性性物最最质好好随,,机但但蜕产产变生生;过过二程程是复复电杂杂子。。)管)回路的热噪声。(如 可查查将随随热机机噪数数声表表源-----装---””R于Raan计ndd算TTaa机bblel外e”(”(部11,995按555其年年噪由由美声美国电国兰压兰德的德公大公司小司编表编制示制,不,有同有随的随机随机数机数 数1100。00 此万万法个个产。。))生随随的机机随数数机表表性中中最的的好数数,字字但具具产有有生均均过匀匀程的的复随随杂机机。性)性,,没没有有周周期期性性。。使使 查用用随时时机,,数可可表根根-据据---需需”R要要an任任d取T取a一b一l段e段”(((1横9横5或或5 竖年竖)由)。。美如如国需需兰220德0个公个,司,便编便可可制从从,中有中取随取(机(顺数顺 1次次00))万2200个个个。,),需随需要机要几几数位位表取取中几几的位位数,,字随随具机机有数数均表表匀无无的所所随谓谓机位位性数数,,,没不不有能能周四四期舍舍性五五入。入。使。 用 次由 个由个时 )我递 随递随2,们推 机推机0可在数公个数公根使是式,是式据用由(需由(中需第如要第如可要同几i同i以个任余个位余在按取数按取数E一一公一几公x定c段式定e位式l公(中)公,)式产横在式随在推生或计推机计算随竖 算算数算出机机)出表机。来数内来无内如的,产的所产需,命生,谓生故令2伪故0位伪并为随个并数随非R机,非a,机真n数便真d不数正(:可正能:的)由从的四由随于中随于舍机第取机第五数(i数+入。i1+顺。。1 由但但递满满推足足公::式(如同余数公式)在计算机内产生伪随机数:由于第 i+1 个aa随))机有有数较较是好好由的的第随随机i机个、、按均均一匀匀定性性公。。式推算出来的,故并非真正的随机数。 但abcbdcbdc) ))满)) ))))有 算周足算周 算 故算故周算较 法期:法期 法 这法期法这好 过长过长 可 是过长可是的 程、程、 再 目程、再目随 不重不前重 现不前重现机 退复退复 , 最退复,最、 化化性性 速常化性速常均 ((差差 度 用(差度用即匀 即的。 快。即的。快不方性 不。不方。能法。 能能法反。反反。cd复复))复出出算算出现现法法现某某过可某一程再一一常不现常常数退,数数。化速。。)))度快。
《蒙特卡罗方法》PPT课件
1.引言
MC的基础 – 随机过程
1 定义,X=X (x,t) 随时间变化的随机变量,或时间随机变量序列
2 按分布函数,分类 a) 平稳随机过程 b) Markov 过程 c) 独立增量随机过程 d) 独立随机过程
14 完整版ppt
1.引言
MC的基础 - 平稳随机过程
1 定义:X(t) , 如果它的n维(n个状态)概率密度与初始分布无关,即对任何 n 和 t’满足fx(x1,x2,…,xn; t1,t2,..,tn)=fx(x1,..,tn +t’) 含义:平稳随机过程的统计特性与所选择的时间起点无关,不随时间的 推移而变化,即是“时间平稳的”。
Monte Carlo名字的由来: • 是由Metropolis在二次世界大战期间提出的:Manhattan 计划,研究与原子弹有关的中子输运过程;
• Monte Carlo是摩纳哥(monaco)的首都,该城以赌博闻名
Nicholas Metropolis (1915-1999)
完整版ppt
Monte-Carlo, Monaco
2 统计特性 1)一维概率密度与时间无关 2)二维概率密度,只与两个状态对应的时间间隔Δt有关,其时间自相关 仅是Δt的函数
3 应用: 电阻的热噪声,电子信号,…
15 完整版ppt
1.引言
MC的基础 - Markov 链
1 定义:在可列个离散状态x1,x2,..xN 和离散时间t1,t2,..tn, 若随 机过程在tm+k时刻变成任一状态xi的概率,只与tm时刻的 状态有关(无后效),而与此前状态无关,称离散随机序列
(2) 确定性模拟方法。它是通过数值求解一个个的粒子运动方程 来模拟整个系统的行为。在统计物理中称为分子动力学 (Molecular Dynamics)方法。此外, 近年来还发展了神经元 网络方法和原胞自动机方法。
蒙特卡洛模拟方法-蒙特卡洛模拟做什么用44页PPT
拉
60、生活的道路一旦选定,就要勇敢地走到底 ,决不 回头。 ——左
56、书不仅是生活,而且是现在、过 去和未 来文化 生活的 源泉。 ——库 法耶夫 57、生命不可能有两次,但许多人连一 次也不 善于度 过。— —吕凯 特 58、问渠哪得清如许,为有源头活水来 。—— 朱熹 59、我的努力求学没有得到别的好处, 只不过 是愈来 愈发觉 自己的 无知。 ——笛 卡儿
蒙特卡洛模拟方法-蒙特卡 洛模拟做什么用
26、机遇对于有准备的头脑有特别的 亲和力 。 27、自信是人格的核心。
28、目标的坚定是性格中最必要的力 量泉源 之一, 也是成 功的利 器之一 。没有 它,天 才也会 在矛盾 无定的 迷径中 ,徒劳 无功。- -查士 德斐尔 爵士。 29、困难就是机遇。--温斯顿.丘吉 尔。 30、我奋斗,所以我快乐。--格林斯 潘。
60、生活的道路一旦选定,就要勇敢地走到底 ,决不 回头。 ——左
56、书不仅是生活,而且是现在、过 去和未 来文化 生活的 源泉。 ——库 法耶夫 57、生命不可能有两次,但许多人连一 次也不 善于度 过。— —吕凯 特 58、问渠哪得清如许,为有源头活水来 。—— 朱熹 59、我的努力求学没有得到别的好处, 只不过 是愈来 愈发觉 自己的 无知。 ——笛 卡儿
蒙特卡洛模拟方法-蒙特卡 洛模拟做什么用
26、机遇对于有准备的头脑有特别的 亲和力 。 27、自信是人格的核心。
28、目标的坚定是性格中最必要的力 量泉源 之一, 也是成 功的利 器之一 。没有 它,天 才也会 在矛盾 无定的 迷径中 ,徒劳 无功。- -查士 德斐尔 爵士。 29、困难就是机遇。--温斯顿.丘吉 尔。 30、我奋斗,所以我快乐。--格林斯 潘。
蒙特卡洛分析ppt课件
Model file used for LNA example
NoteThis is not based on foundry data but modeled for illustrative purposes.
13
Cadence simulation setup (Monte Carlo)
Monte Carlo simulation
6
Cadence simulation setup (Normal)
Monte Carlo simulation
1.Choose analysis to run 2.Choose output to plot 3.Create netlist and run
Set up analysis(dc,ac,sp etc.),create netlist and run simulator
Design- Specific Section – designer according to his need can specify Monte Carlo analysis.For example in a current mirror circuit,matched transistors are used and designer can give some correlation factor between these matched transistor.
Matching S11
S22
(Analyzing waveform)
Process parameter and mismatch effect
DEGRADES Input & Output matching N/W
DEGRADES Overall design performance (noise,gain etc.)
NoteThis is not based on foundry data but modeled for illustrative purposes.
13
Cadence simulation setup (Monte Carlo)
Monte Carlo simulation
6
Cadence simulation setup (Normal)
Monte Carlo simulation
1.Choose analysis to run 2.Choose output to plot 3.Create netlist and run
Set up analysis(dc,ac,sp etc.),create netlist and run simulator
Design- Specific Section – designer according to his need can specify Monte Carlo analysis.For example in a current mirror circuit,matched transistors are used and designer can give some correlation factor between these matched transistor.
Matching S11
S22
(Analyzing waveform)
Process parameter and mismatch effect
DEGRADES Input & Output matching N/W
DEGRADES Overall design performance (noise,gain etc.)
蒙特卡罗模拟与编程张晓峒PPT课件
@cbinom(x, n, p) @dbinom(x, n, p)
@qbinom(s, n, p)
卡方分布
@rchisq(v)
@cchisq(x, v)
@dchisq(x, v)
@qchisq(p, v)
指数分布
@rexp(m)
@cexp(x, m)
@dexp(x, m)
@qexp(p, m)
极值分布 I @rextreme
第6页/共50页
2.蒙特卡罗模拟和自举原理 进行蒙特卡罗模拟和自举首先要设定数据生成系统。而设定数据生成系 统的关键是要产生大量的随机数。例如模拟样本容量为 100 的一元线性回归 模型中参数的分布,若试验 1 万次,则需要生成 200 万个随机数。 计算机所生成的随机数并不是“真随机数”,而是具有某种相同统计性质 的随机数。计量经济学中蒙特卡罗模拟和自举所用到的随机数一般是服从 N(0,1)分布或均匀分布的随机数。计算机生成的随机数称作“伪随机数” (pseudo-random number)(以下简称随机数)。生成的随机数的程序称作“伪 随机数生成系统”。实际上计算机不可能生成真随机数。
' u序列初始值为零。
' 生成 AR(1) 序列 x1=0.8*x1(-1)+u
series x1
' 定义x1序列
x1(1)=0
' 定义x1序列初始值为零
smpl 2 1000 x1=.8*x1(-1)+u ' 生成 AR(1) 序列 ' 生成 MA(1) 序列 x1=u+0.8*u(-1)
一种为数值计算法。也称为有限样本近似法(finite-sample approximation)。 这种方法要用到许多数学知识,专业性很强,使没有受过专门训练的人员运用 此方法受到限制。
张晓桐-计量经济
DRESt = -0.1957 RESt -1 +0.3258 DRESt-1
(-3.0)*
(2.8)
R2 = 0.16, DW = 2.1, T= 70, (1991:03-1996:12)
临界值为 -4.23。而-3.0 -4.23,所以误差序列是非平稳的,人民币元兑美元
汇率序列是一个含有均值、斜率双突变的单位根序列。
DF(Dickey-Fuller)、ADF(Augmented-Dickey-Fuller)检验。
数据生成过程: yt = yt-1 + ut , y0 = 0, ut IID(0, 2)
最常用的单位根检验方法。检验式有 3 种。 .12
DF
DF1
DF2
p1
.10
yt = yt-1 + j yt j + ut
0.M15ean Median Maximum 0M.1inimum Std. Dev. Skewness Kurtosis
0.05
0.000423 -0.028121 4.278126 -4.938927 1.713000 -0.002115 1.846687
Jarque-Bera 554.2285 Probability 0.000000
案例:人民币元兑美元汇率序列的单位根检验
1980 年 4 月 1 日开始,中国货币市场上出现了一种崭新而神秘的支付凭 证,外汇兑换券。
1981~1984 年,经历了官方汇率与贸易外汇内部结算价并存。 1985~1993 年,官方汇率与外汇调剂价格并存的两个汇率双轨制时期。
造成了外汇市场秩序混乱,长期存在外汇黑市。 1995 年 7 月 1 日起,外汇券在中国市场上停止流通。 1994 年 1 月 1 日中国人民银行改人民币元兑美元汇率的双轨制为单轨制。
蒙特卡罗方法介绍及其建模应用 ppt课件
主要内容
1 蒙特卡洛方法介绍 2 蒙特卡洛方法应用实例 3 排队论模拟介绍 4 2009-B 眼科病床安排应用
蒙特卡洛方法应用实例
1 "概率"计算模拟分析 2 定积分的MC计算 3 系统可靠性模拟计算
1 "概率"计算模拟分析
频率的稳定性模拟
• 频率:
– 在一组不变的条件下,重复作n次试验,记m是n次试验中事件A 发生的次数,频率 f=m/n
• 频率的稳定性: f---->P
– 例1:掷一枚均匀硬币,记录掷硬币试验中频率P的波动情况
– function liti21(p,mm) – pro=zeros(1,mm); – randnum = binornd(1,p,1,mm) – a=0; – for i=1:mm – a=a+randnum(1,i); – pro(i)=a/i; – end – pro=pro – num=1:mm; – plot(num,pro)
function liti22(p,mm) pro=zeros(1,mm); randnum = binornd(1,p,2,mm);a=0; for i=1:mm a=a+randnum(1,i)*randnum(2,i); pro(i)=a/i; end pro=pro,num=1:mm;plot(num,pro)
liti21(0.5,1000)
liti21(0.5,10000)
liti21(0.4,100)
liti21(0.4,10000)
例1':掷一枚不均匀硬币,正面出现概率为0.3,记录前1000 次掷硬币试验中正面频率的波动情况
liti21(0.3,1000)
例2: 掷两枚不均匀硬币,每枚正面出现概率为0.4,记录前 1000次掷硬币试验中两枚都为正面频率的波动情况
蒙特卡罗模拟方法ppt课件
2,不可避免的出现重复问题 所以成为伪随机数
问题的解决:1.选取好的递推公式 2.不是本质问题
严格执行突发事件上报制度、校外活 动报批 制度等 相关规 章制度 。做到 及时发 现、制 止、汇 报并处 理各类 违纪行 为或突 发事件 。
产生伪随机数的乘同余方法
▪ 乘同余方法是由Lehmer在1951年提出来的,它的一般形式是:对于
N
1
AaPbL2cQ2d
根据历史数据,预测未来。
1
AaPbL2cQ2d
收集P,L,Q数据,确定分布函 数 f(P),f(L),f(Q)
模拟次数N;根据分
N
布函数,产生随机数
产生 N 个 A值
N
抽取 P,L,Q一 组随机 数,带 入模型
统计分析,估计 均值,标准差
X
严格执行突发事件上报制度、校外活 动报批 制度等 相关规 章制度 。做到 及时发 现、制 止、汇 报并处 理各类 违纪行 为或突 发事件 。
1,0 x 1 f (x) 0,其他
分布函数为:
0, x 0
F
(x)
x,0
x
1
特征:独立性、均匀性 1, x 1
严格执行突发事件上报制度、校外活 动报批 制度等 相关规 章制度 。做到 及时发 现、制 止、汇 报并处 理各类 违纪行 为或突 发事件 。
随机数的产生方法
▪ 随机数表 ▪ 物理方法 ▪ 计算机方法
概rg2(,r率2通)…,语过,…言某,r来N种,g说试(r)N,验),的从,算将分得术相布到平应密N均的度个值N函观个数察随值f(r)机r中1,变抽r2量取,的N…值,个gr子N(r(样1)用,r1,
1 N
gN N i1 g(ri )
问题的解决:1.选取好的递推公式 2.不是本质问题
严格执行突发事件上报制度、校外活 动报批 制度等 相关规 章制度 。做到 及时发 现、制 止、汇 报并处 理各类 违纪行 为或突 发事件 。
产生伪随机数的乘同余方法
▪ 乘同余方法是由Lehmer在1951年提出来的,它的一般形式是:对于
N
1
AaPbL2cQ2d
根据历史数据,预测未来。
1
AaPbL2cQ2d
收集P,L,Q数据,确定分布函 数 f(P),f(L),f(Q)
模拟次数N;根据分
N
布函数,产生随机数
产生 N 个 A值
N
抽取 P,L,Q一 组随机 数,带 入模型
统计分析,估计 均值,标准差
X
严格执行突发事件上报制度、校外活 动报批 制度等 相关规 章制度 。做到 及时发 现、制 止、汇 报并处 理各类 违纪行 为或突 发事件 。
1,0 x 1 f (x) 0,其他
分布函数为:
0, x 0
F
(x)
x,0
x
1
特征:独立性、均匀性 1, x 1
严格执行突发事件上报制度、校外活 动报批 制度等 相关规 章制度 。做到 及时发 现、制 止、汇 报并处 理各类 违纪行 为或突 发事件 。
随机数的产生方法
▪ 随机数表 ▪ 物理方法 ▪ 计算机方法
概rg2(,r率2通)…,语过,…言某,r来N种,g说试(r)N,验),的从,算将分得术相布到平应密N均的度个值N函观个数察随值f(r)机r中1,变抽r2量取,的N…值,个gr子N(r(样1)用,r1,
1 N
gN N i1 g(ri )
概率统计中的MonteCarlo方法及其建模应用PPT课件
下面叙述的抽样方法是能够克服这些困难的比较好的方法。
南京信息工程大学
2020/1/11 17:32
复合抽样方法
复合抽样方法的基本思想是由kahn提出的。
考虑如下复合分布:
f (x) f2(x | y)dF1(y)
其中f2(x|y)为给定Y=y时X的条件密度,F1(y)为Y的分布函数 如果X密度函数f(x)难于抽样,而X关于Y的条件密度函数 f2(x|y)以及Y的分布F1(y)均易于抽样,则X的随机数抽样:
i=1
i=1
x xI , I 1,2,...
I-1
其中令I=1时 pi 0 i=1
p1
O
x1
pI 1 pI O
O
O
0 xI 1 xI
F(x)
为了实现由任意离散型分布的随机抽样,直接抽样方法 是非常理想的!
南京信息工程大学
2020/1/11 17:32
[1]离散型分布
例1.
掷骰子点数的抽样
P( X
1 I ) pi 6
按照离散分布的直接抽样:
(1)由U(0,1)抽取u
I -1
I
(2) x I , 当 pi u pi
i =1
i =1
即:
I 1 u I , I {1,2,3,4,5,6}, x I
6
6
等价于:I 1 6u I, I 1,2,3,4,5,6, x I
收敛速度与问题维数无关
– Monte Carlo方法的收敛速度为O(n -1/2),与一般数值方法相比很慢。 因此,用Monte Carlo方法不能解决精确度要求很高的问题
– Monte Carlo方法误差只与标准差和样本容量n有关,而与样本所 在空间无关,即Monte Carlo方法的收敛速度与问题维数无关,而 其他数值方法则不然。
南京信息工程大学
2020/1/11 17:32
复合抽样方法
复合抽样方法的基本思想是由kahn提出的。
考虑如下复合分布:
f (x) f2(x | y)dF1(y)
其中f2(x|y)为给定Y=y时X的条件密度,F1(y)为Y的分布函数 如果X密度函数f(x)难于抽样,而X关于Y的条件密度函数 f2(x|y)以及Y的分布F1(y)均易于抽样,则X的随机数抽样:
i=1
i=1
x xI , I 1,2,...
I-1
其中令I=1时 pi 0 i=1
p1
O
x1
pI 1 pI O
O
O
0 xI 1 xI
F(x)
为了实现由任意离散型分布的随机抽样,直接抽样方法 是非常理想的!
南京信息工程大学
2020/1/11 17:32
[1]离散型分布
例1.
掷骰子点数的抽样
P( X
1 I ) pi 6
按照离散分布的直接抽样:
(1)由U(0,1)抽取u
I -1
I
(2) x I , 当 pi u pi
i =1
i =1
即:
I 1 u I , I {1,2,3,4,5,6}, x I
6
6
等价于:I 1 6u I, I 1,2,3,4,5,6, x I
收敛速度与问题维数无关
– Monte Carlo方法的收敛速度为O(n -1/2),与一般数值方法相比很慢。 因此,用Monte Carlo方法不能解决精确度要求很高的问题
– Monte Carlo方法误差只与标准差和样本容量n有关,而与样本所 在空间无关,即Monte Carlo方法的收敛速度与问题维数无关,而 其他数值方法则不然。
蒙特卡罗方法PPT课件
第14页/共83页
5.2 随机数和伪随机数
• 5.2.2 伪随机数
• 伪随机数是用数学方法产生的随机数,在给定初值下,由以下的递推公式
• 确定
(n=1,2,…)n。1 T (n )
(5.9)
• 由此产生的随机数n1并不相互独立,可通过适当地选取递推公式来近似满足
独立性要求;另一方面,在电子计算机表示中在(0,1)之间的随机数是有
第25页/共83页
5.3.2 重要抽样
• 把任意陡的被积函数变换成非常平滑的函数且调整积分区间的想法是至要 抽样法的基本思想。换句话.由简单抽样法扩展为重要抽样法,其一个最 主要的改进应当是使用了权重被积函数。这就是说,所使用的伪随机数是 从非均勾分布中选取的。这种操作方法允许我们把精力集中于在空间区域 对函数值的计算与评价,使其对积给出恰当的贡献。引入权重函数g(x), 则对积分J得估算可以写成:
第4页/共83页
• 针相对于平行线的位置可以用一个随机向量表示 A [0, d )
[0, )
• 随机向量平均分布在区间[0,d)×[0,).
• 其概率密度函数为1/d.
•
针
与
平
行
线p
相
交
0
的0lsin概 d1率d为Ad
2l
d
(5.1)
第5页/共83页
5.1 基本思想和一般过程
• 5.1.2 马尔科夫(Markov)过程
•
初 或
始 转
概
率
p
(
x
0
)=
1
。
因
此
将
这
些
条
件
概率称之
为单步 (5.3)
跃
5.2 随机数和伪随机数
• 5.2.2 伪随机数
• 伪随机数是用数学方法产生的随机数,在给定初值下,由以下的递推公式
• 确定
(n=1,2,…)n。1 T (n )
(5.9)
• 由此产生的随机数n1并不相互独立,可通过适当地选取递推公式来近似满足
独立性要求;另一方面,在电子计算机表示中在(0,1)之间的随机数是有
第25页/共83页
5.3.2 重要抽样
• 把任意陡的被积函数变换成非常平滑的函数且调整积分区间的想法是至要 抽样法的基本思想。换句话.由简单抽样法扩展为重要抽样法,其一个最 主要的改进应当是使用了权重被积函数。这就是说,所使用的伪随机数是 从非均勾分布中选取的。这种操作方法允许我们把精力集中于在空间区域 对函数值的计算与评价,使其对积给出恰当的贡献。引入权重函数g(x), 则对积分J得估算可以写成:
第4页/共83页
• 针相对于平行线的位置可以用一个随机向量表示 A [0, d )
[0, )
• 随机向量平均分布在区间[0,d)×[0,).
• 其概率密度函数为1/d.
•
针
与
平
行
线p
相
交
0
的0lsin概 d1率d为Ad
2l
d
(5.1)
第5页/共83页
5.1 基本思想和一般过程
• 5.1.2 马尔科夫(Markov)过程
•
初 或
始 转
概
率
p
(
x
0
)=
1
。
因
此
将
这
些
条
件
概率称之
为单步 (5.3)
跃
本科经济计量学第7章第幻灯片PPT
3
第7章
7.1 “好的〞模型具有的特性
简约性〔节省性〕 ---- 模型应尽可能的简单 可识别性 ---- 每个参数只有一个估计值 拟合优度高 ---- 拟合优度越大越好 理论一致性 ---- 与理论相合而非相背 预测能力好 ---- 理论预测能被实际经历所验证
4
第7章
7.2 设定误差的类型
此时有可能犯“过度拟合〞或者“过度设定〞 模型(也就是说包括非必须变量)的错误。
这有可能是因为经济理论不完善,或者研究人 员不能确定变量在模型中的作用。
模型中包括非相关变量会导致什么后果呢?
10
第7章
我们仍用简单的双变量和三变量模型加以说明。
假设:
Yi=B1+B2X2i+ui
(7-
9)
是正确设定的模型,但是,某研究者却参加了多余 的变量X3,估计了以下的模型:
但是通常并不鼓励为防止遗漏相关变量而包 括可能不相关的变量,因为:
1.不必要变量的增加会减少估计量的有效性 (即更大的标准差);
2.可能导致多重共线性问题; 3.自由第7章
7.5 不正确的函数形式 现在考虑另外一种设定误差。假设模
型所包括的变量Y,X2,X3都是理论上 正确的变量,考虑如下两种模型设定:
如果我们采用并估计的是下面的方程: 返回残差检验 Yi= A1+A2X2i+vi (7-2)
注意此时vi的性质:vi中包含B3X3i+ui 。 这就可能会产生遗漏重要解释变量的错误。
6
第7章
由于遗漏了变量X3t,假设该变量是重要变量, 那么会出现遗漏变量偏差,可能会产生如下后果: (1) 如果X3与X2相关,那么估计量a1和a2是有偏和 不一致的 (2)如果X3与X2不相关,那么估计量a2是无偏和一致 的 (3) 误差方差的估计是有偏的 (4) 估计量a2的方差是有偏的 (5)置信区间和假设检验不可靠
第7章
7.1 “好的〞模型具有的特性
简约性〔节省性〕 ---- 模型应尽可能的简单 可识别性 ---- 每个参数只有一个估计值 拟合优度高 ---- 拟合优度越大越好 理论一致性 ---- 与理论相合而非相背 预测能力好 ---- 理论预测能被实际经历所验证
4
第7章
7.2 设定误差的类型
此时有可能犯“过度拟合〞或者“过度设定〞 模型(也就是说包括非必须变量)的错误。
这有可能是因为经济理论不完善,或者研究人 员不能确定变量在模型中的作用。
模型中包括非相关变量会导致什么后果呢?
10
第7章
我们仍用简单的双变量和三变量模型加以说明。
假设:
Yi=B1+B2X2i+ui
(7-
9)
是正确设定的模型,但是,某研究者却参加了多余 的变量X3,估计了以下的模型:
但是通常并不鼓励为防止遗漏相关变量而包 括可能不相关的变量,因为:
1.不必要变量的增加会减少估计量的有效性 (即更大的标准差);
2.可能导致多重共线性问题; 3.自由第7章
7.5 不正确的函数形式 现在考虑另外一种设定误差。假设模
型所包括的变量Y,X2,X3都是理论上 正确的变量,考虑如下两种模型设定:
如果我们采用并估计的是下面的方程: 返回残差检验 Yi= A1+A2X2i+vi (7-2)
注意此时vi的性质:vi中包含B3X3i+ui 。 这就可能会产生遗漏重要解释变量的错误。
6
第7章
由于遗漏了变量X3t,假设该变量是重要变量, 那么会出现遗漏变量偏差,可能会产生如下后果: (1) 如果X3与X2相关,那么估计量a1和a2是有偏和 不一致的 (2)如果X3与X2不相关,那么估计量a2是无偏和一致 的 (3) 误差方差的估计是有偏的 (4) 估计量a2的方差是有偏的 (5)置信区间和假设检验不可靠
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第 7 章 蒙特卡罗模拟
南开大学数量经济研究所所长 数量经济学专业博士生导师 张晓峒 (2012 年 2 月 1317 日) nkeviews@
第7章 蒙特卡罗模拟
7.1 蒙特卡罗模拟和自举原理 7.2 生成服从某种分布的随机数(随机序列) 7.3 模拟回归系数估计量和检验统计量的分布特征 7.4 估计响应面函数 7.5 执行某种计算
第7章 蒙特卡罗模拟
7.1.2 生成随机数 进行蒙特卡罗模拟和自举首先要设定数据生成系统。而设定数据生成 系统的关键是要产生大量的随机数。例如模拟样本容量为 100 的一元线性 回归模型中参数的分布,若试验 1 万次,则需要生成 200 万个随机数。 计算机所生成的随机数并不是“真随机数” ,而是具有某种相同统计性 质的随机数。计量经济学中蒙特卡罗模拟和自举所用到的随机数一般是服 从 N(0,1)分布或均匀分布的随机数。计算机生成的随机数称作“伪随机数” (pseudo-random number) (以下简称随机数) 。生成的随机数的程序称作 “伪随机数生成系统” 。实际上计算机不可能生成真随机数。
作为地名,蒙特卡罗在欧洲的摩纳哥(Monaco),模拟以著名赌城而得名。
蒙特卡罗
第7章 蒙特卡罗模拟
自举与蒙特卡罗模拟既有联系,又不相同。自举(Bootstrap)这个名词 是 Efron 在 1979 年提出的。 “自举” 一词来源于童话故事。 指一个人落水时, 试图用自提鞋扣儿的方法自救。自举(Bootstrap)有人翻译成“靴襻”不恰 当。 自举,即采用从样本中反复抽取子样本的方法计算参数估计量的值,置 信区间或相应统计量的值并估计这些量的分布。这里介绍的远不是自举技术 的全貌,而是参数估计方面的应用。 因为这些方法的实现是以高容量和高速度的计算机为前提条件,所以只 是在近年才得到广泛推广。20 世纪 80,90 年代发展很快,现在已很普及。
第7章 蒙特卡罗模拟
7.1.3 设计计算过程 蒙特卡罗模拟和自举的实现要通过计算机编程来实现。常用的高级编程语 言软件有 Mathematica, Gauss, Ox, EViews, S-Plus, Matlap, rats, stata, R 等。 这里主要介绍利用 EViews 做蒙特卡罗模拟与编程。编程也是一个很宽 的概念,这里只介绍与蒙特卡罗模拟有关的编程。 编程像一门艺术,需要经验和技巧。只有多思,熟记各种命令,才能 编出最优的程序来。否则会浪费大量时间。 首先需要把自己需要计算的问题设计出合理的计算流程框图,然后转 化为正确的计算机语言。
4 2 0 -2
Y1
30
Y3
20
10
-4 -6 250 500 750 1000
0 250 500 750 1000
标准正态分布随机数
10 Y4 8 6 4 2 0 250 500 750 1000
5 0 -5 -10 -15 10 Y5
指数分布随机数
250
500
750
1000
3个自由度的poisson分布随机数
(file:7gener2) (file:5logit1)
7.1 蒙特卡罗模拟和自举原理 大家知道,只有当回归模型满足 OLS 法所有的假定条件时,参数的估计量才具有 最佳线性无偏特性,同时也具有一致性。 当假定条件不成立时(比如存在异方差、自相关等) ,所采用的广义最小二乘法, 以及对联立方程模型的估计,动态分布滞后模型的估计,向量自回归模型的估计所得 参数的估计量只具有渐近特性(渐近无偏性、一致性) 。这意味着,只有当样本容量相 当大时,渐近特性才起作用。而当样本容量不是很大,甚至很小时,仍然不知道估计 量的有限样本分布特征。 另外通过对非平稳过程的研究知道,单位根检验式和用非平稳变量建立的回归函 数的参数和 t 统计量都不服从正态分布。他们都是渐近地服从 Wiener 过程的泛函。参 数估计量和统计量的有限样本特性不能用解析的方法求解。 对于上述两种情形,若要研究这些估计量和统计量的有限样本分布特征,通常采 用两种方法。 一种为数值计算法。也称为有限样本近似法(finite-sample approximation) 。这种 方法要用到许多数学知识,专业性很强,使没有受过专门训练的人员运用此方法受到 限制。 另一种为蒙特卡罗模拟方法。又称随机模拟法。本章主要介绍蒙特卡罗模拟与计 算机编程。
(5)在生成服从某种分布的随机数序列的基础上生成各种 ARIMA 序列 这里主要指在生成服从标准正态分布白噪声序列的基础上生成各种 ARIMA 序列。 【例】 在生成 N(0,1) 白噪声序列的基础上生成 AR(1)、 (1)、 MA ARMA (1,1)、 ARIMA (1,1,1)序列 workfile random2 u 1 1000 ' u表示非时间工作文件,a表示年度文件。 series u=@nrnd ' 生成白噪声序列 u~ N(0,1) u(1)=0 ' u序列初始值为零。 ' 生成 AR(1) 序列 x1=0.8*x1(-1)+u series x1 ' 定义x1序列 x1(1)=0 ' 定义x1序列初始值为零 smpl 2 1000 x1=.8*x1(-1)+u ' 生成 AR(1) 序列 ' 生成 MA(1) 序列 x1=u+0.8*u(-1) smpl 1 1000 series x2 ' 定义x2序列 x2(1)=0 ' 定义x2序列初始值为零 smpl 2 1000 x2= u+0.8*u(-1) ' 生成 MA(1) 序列
提出研究的问题 设计计算流程框图 转换为计算机语言
7.2 生成服从某种分布的随机数(随机序列) 生成服从某种分布的随机数、累计分布函数、概率密度函数、p 分位数函数的表达语言 见表 1。
表 1:生成 18 种分布的随机数、累计分布函数、概率密度函数、p 分位数函数的用语 分布类型 二项式分布 卡方分布 指数分布 极值分布 I F 分布 Gamma 分布 logistic 分布 对数正态分布 负二项分布 标准正态分布 泊松分布 t 分布 均匀分布 生成随机数 @rbinom(n, p) @rchisq(v) @rexp(m) @rextreme @rfdist(v1, v2) @rgamma(b, r) @rlogistic @rlognorm(m, s) @rnegbin(n, p) @rnorm, nrnd @rpoisson(m) @rtdist(v) @runif(a, b) 累计分布函数 @cbinom(x, n, p) @cchisq(x, v) @cexp(x, m) @cextreme(x) @cfdist(x ,v1, v2) @cgamma(x, b, r) @clogistic(x) @clognorm(x,m,s) @cnegbin(x, n, p) @cnorm(x) @cpoisson(x, m) @ctdist(x, v) @cunif(x, a, b) 概率密度函数 @dbinom(x, n, p) @dchisq(x, v) @dexp(x, m) @dextreme(x) @dfdist(x, v1, v2) @dgamma(x, b, r) @dlogistic(x) @dlognorm(x, m, s) @dnegbin(x, n, p) @dnorm(x) @dpoisson(x, m) @dtdist(x, v) @dunif(x, a, b) p 分位数函数 @qbinom(s, n, p) @qchisq(p, v) @qexp(p, m) @qextreme(p) @qfdist(p, v1, v2) @qgamma(p, b, r ) @qlogistic(p) @qlognorm(p, m, s) @qnegbin(s, n, p) @qnorm(p) @qpoisson(p, m) @qtdist(p, v) @qunif(p, a, b)
第7章 蒙特卡罗模拟
(4)查看随机数列的频数、频率(百分数)、累积频数、频率(百分数)直方图 【例】以 Y1 为例,查看频数、频率(百分数)、累积频数、频率(百分数)直方图。 激活序列窗口,点击 View 选 one-way tabulation 功能,点击 OK 键。 上述合并在一起,变成如下: ' 生成服从某种分布的随机数序列(T=1000),并存入random1文件。 workfile random1 u 1 1000 series Y1=@rnorm series Y2=nrnd series Y3=@rexp(3) series Y4=@rpoisson(3) series Y5=@rtdist(3) series Z=nrnd series X=Z*2+50 scalar q1=@quantile(Y1, .2,1) scalar q2=@quantile(Y1, .5,1)
df=3的t分布随机数
(2)生成任意(非标准)正态分布随机数序列 用 nrnd 和@rnorm 可以生成标准正态分布随机数,那么,任何参数的 正态分布随机数都可以生成。 用 Z 表示标准正态分布的随机数,用 X 表示任一参数的正态分布的伪 随机数,那么,把 X 标准化的公式是
XX Z N(0,1) s( X )
52.0 51.6 51.2 50.8 50.4 50.0 49.6 49.2 48.8 48.4 50 100 150 200 250 300 350 400 450 500 550 600 650 700 750 800 850 900 950 1000
X
第7章 蒙特卡罗模拟
(3)生成服从某种分布随机数序列基础上求分位数值,求频数分布表。 计算分位数的 EViews 命令为: scalar q=@quantile(y, τ, s), 其中 y 表示求分位数所用的序列;τ 表示要计算的分位数;s 取 1~6,依次 表示 6 种计算分位数序数方法, 上命令的含义是计算第 τ 分位数所对应的分 位数值,存入标量 q 中。 【例】以生成的 Y1 为例,求 0.2 分位数和中位数值。 在空白处键入命令: (file:gener2-text01) scalar q1=@quantile(Y1, .2,1) scalar q2=@quantile(Y1, .5,1) 注意:q1 和 q2 以标量形式存入工作文件。双击之,EViews 6 可以在窗口 下方显示该值。EViews 7 则用矩阵窗口的形式显示。
南开大学数量经济研究所所长 数量经济学专业博士生导师 张晓峒 (2012 年 2 月 1317 日) nkeviews@
第7章 蒙特卡罗模拟
7.1 蒙特卡罗模拟和自举原理 7.2 生成服从某种分布的随机数(随机序列) 7.3 模拟回归系数估计量和检验统计量的分布特征 7.4 估计响应面函数 7.5 执行某种计算
第7章 蒙特卡罗模拟
7.1.2 生成随机数 进行蒙特卡罗模拟和自举首先要设定数据生成系统。而设定数据生成 系统的关键是要产生大量的随机数。例如模拟样本容量为 100 的一元线性 回归模型中参数的分布,若试验 1 万次,则需要生成 200 万个随机数。 计算机所生成的随机数并不是“真随机数” ,而是具有某种相同统计性 质的随机数。计量经济学中蒙特卡罗模拟和自举所用到的随机数一般是服 从 N(0,1)分布或均匀分布的随机数。计算机生成的随机数称作“伪随机数” (pseudo-random number) (以下简称随机数) 。生成的随机数的程序称作 “伪随机数生成系统” 。实际上计算机不可能生成真随机数。
作为地名,蒙特卡罗在欧洲的摩纳哥(Monaco),模拟以著名赌城而得名。
蒙特卡罗
第7章 蒙特卡罗模拟
自举与蒙特卡罗模拟既有联系,又不相同。自举(Bootstrap)这个名词 是 Efron 在 1979 年提出的。 “自举” 一词来源于童话故事。 指一个人落水时, 试图用自提鞋扣儿的方法自救。自举(Bootstrap)有人翻译成“靴襻”不恰 当。 自举,即采用从样本中反复抽取子样本的方法计算参数估计量的值,置 信区间或相应统计量的值并估计这些量的分布。这里介绍的远不是自举技术 的全貌,而是参数估计方面的应用。 因为这些方法的实现是以高容量和高速度的计算机为前提条件,所以只 是在近年才得到广泛推广。20 世纪 80,90 年代发展很快,现在已很普及。
第7章 蒙特卡罗模拟
7.1.3 设计计算过程 蒙特卡罗模拟和自举的实现要通过计算机编程来实现。常用的高级编程语 言软件有 Mathematica, Gauss, Ox, EViews, S-Plus, Matlap, rats, stata, R 等。 这里主要介绍利用 EViews 做蒙特卡罗模拟与编程。编程也是一个很宽 的概念,这里只介绍与蒙特卡罗模拟有关的编程。 编程像一门艺术,需要经验和技巧。只有多思,熟记各种命令,才能 编出最优的程序来。否则会浪费大量时间。 首先需要把自己需要计算的问题设计出合理的计算流程框图,然后转 化为正确的计算机语言。
4 2 0 -2
Y1
30
Y3
20
10
-4 -6 250 500 750 1000
0 250 500 750 1000
标准正态分布随机数
10 Y4 8 6 4 2 0 250 500 750 1000
5 0 -5 -10 -15 10 Y5
指数分布随机数
250
500
750
1000
3个自由度的poisson分布随机数
(file:7gener2) (file:5logit1)
7.1 蒙特卡罗模拟和自举原理 大家知道,只有当回归模型满足 OLS 法所有的假定条件时,参数的估计量才具有 最佳线性无偏特性,同时也具有一致性。 当假定条件不成立时(比如存在异方差、自相关等) ,所采用的广义最小二乘法, 以及对联立方程模型的估计,动态分布滞后模型的估计,向量自回归模型的估计所得 参数的估计量只具有渐近特性(渐近无偏性、一致性) 。这意味着,只有当样本容量相 当大时,渐近特性才起作用。而当样本容量不是很大,甚至很小时,仍然不知道估计 量的有限样本分布特征。 另外通过对非平稳过程的研究知道,单位根检验式和用非平稳变量建立的回归函 数的参数和 t 统计量都不服从正态分布。他们都是渐近地服从 Wiener 过程的泛函。参 数估计量和统计量的有限样本特性不能用解析的方法求解。 对于上述两种情形,若要研究这些估计量和统计量的有限样本分布特征,通常采 用两种方法。 一种为数值计算法。也称为有限样本近似法(finite-sample approximation) 。这种 方法要用到许多数学知识,专业性很强,使没有受过专门训练的人员运用此方法受到 限制。 另一种为蒙特卡罗模拟方法。又称随机模拟法。本章主要介绍蒙特卡罗模拟与计 算机编程。
(5)在生成服从某种分布的随机数序列的基础上生成各种 ARIMA 序列 这里主要指在生成服从标准正态分布白噪声序列的基础上生成各种 ARIMA 序列。 【例】 在生成 N(0,1) 白噪声序列的基础上生成 AR(1)、 (1)、 MA ARMA (1,1)、 ARIMA (1,1,1)序列 workfile random2 u 1 1000 ' u表示非时间工作文件,a表示年度文件。 series u=@nrnd ' 生成白噪声序列 u~ N(0,1) u(1)=0 ' u序列初始值为零。 ' 生成 AR(1) 序列 x1=0.8*x1(-1)+u series x1 ' 定义x1序列 x1(1)=0 ' 定义x1序列初始值为零 smpl 2 1000 x1=.8*x1(-1)+u ' 生成 AR(1) 序列 ' 生成 MA(1) 序列 x1=u+0.8*u(-1) smpl 1 1000 series x2 ' 定义x2序列 x2(1)=0 ' 定义x2序列初始值为零 smpl 2 1000 x2= u+0.8*u(-1) ' 生成 MA(1) 序列
提出研究的问题 设计计算流程框图 转换为计算机语言
7.2 生成服从某种分布的随机数(随机序列) 生成服从某种分布的随机数、累计分布函数、概率密度函数、p 分位数函数的表达语言 见表 1。
表 1:生成 18 种分布的随机数、累计分布函数、概率密度函数、p 分位数函数的用语 分布类型 二项式分布 卡方分布 指数分布 极值分布 I F 分布 Gamma 分布 logistic 分布 对数正态分布 负二项分布 标准正态分布 泊松分布 t 分布 均匀分布 生成随机数 @rbinom(n, p) @rchisq(v) @rexp(m) @rextreme @rfdist(v1, v2) @rgamma(b, r) @rlogistic @rlognorm(m, s) @rnegbin(n, p) @rnorm, nrnd @rpoisson(m) @rtdist(v) @runif(a, b) 累计分布函数 @cbinom(x, n, p) @cchisq(x, v) @cexp(x, m) @cextreme(x) @cfdist(x ,v1, v2) @cgamma(x, b, r) @clogistic(x) @clognorm(x,m,s) @cnegbin(x, n, p) @cnorm(x) @cpoisson(x, m) @ctdist(x, v) @cunif(x, a, b) 概率密度函数 @dbinom(x, n, p) @dchisq(x, v) @dexp(x, m) @dextreme(x) @dfdist(x, v1, v2) @dgamma(x, b, r) @dlogistic(x) @dlognorm(x, m, s) @dnegbin(x, n, p) @dnorm(x) @dpoisson(x, m) @dtdist(x, v) @dunif(x, a, b) p 分位数函数 @qbinom(s, n, p) @qchisq(p, v) @qexp(p, m) @qextreme(p) @qfdist(p, v1, v2) @qgamma(p, b, r ) @qlogistic(p) @qlognorm(p, m, s) @qnegbin(s, n, p) @qnorm(p) @qpoisson(p, m) @qtdist(p, v) @qunif(p, a, b)
第7章 蒙特卡罗模拟
(4)查看随机数列的频数、频率(百分数)、累积频数、频率(百分数)直方图 【例】以 Y1 为例,查看频数、频率(百分数)、累积频数、频率(百分数)直方图。 激活序列窗口,点击 View 选 one-way tabulation 功能,点击 OK 键。 上述合并在一起,变成如下: ' 生成服从某种分布的随机数序列(T=1000),并存入random1文件。 workfile random1 u 1 1000 series Y1=@rnorm series Y2=nrnd series Y3=@rexp(3) series Y4=@rpoisson(3) series Y5=@rtdist(3) series Z=nrnd series X=Z*2+50 scalar q1=@quantile(Y1, .2,1) scalar q2=@quantile(Y1, .5,1)
df=3的t分布随机数
(2)生成任意(非标准)正态分布随机数序列 用 nrnd 和@rnorm 可以生成标准正态分布随机数,那么,任何参数的 正态分布随机数都可以生成。 用 Z 表示标准正态分布的随机数,用 X 表示任一参数的正态分布的伪 随机数,那么,把 X 标准化的公式是
XX Z N(0,1) s( X )
52.0 51.6 51.2 50.8 50.4 50.0 49.6 49.2 48.8 48.4 50 100 150 200 250 300 350 400 450 500 550 600 650 700 750 800 850 900 950 1000
X
第7章 蒙特卡罗模拟
(3)生成服从某种分布随机数序列基础上求分位数值,求频数分布表。 计算分位数的 EViews 命令为: scalar q=@quantile(y, τ, s), 其中 y 表示求分位数所用的序列;τ 表示要计算的分位数;s 取 1~6,依次 表示 6 种计算分位数序数方法, 上命令的含义是计算第 τ 分位数所对应的分 位数值,存入标量 q 中。 【例】以生成的 Y1 为例,求 0.2 分位数和中位数值。 在空白处键入命令: (file:gener2-text01) scalar q1=@quantile(Y1, .2,1) scalar q2=@quantile(Y1, .5,1) 注意:q1 和 q2 以标量形式存入工作文件。双击之,EViews 6 可以在窗口 下方显示该值。EViews 7 则用矩阵窗口的形式显示。