fortran产生随机数方法介绍
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
fortran产生随机数方法介绍(附代码)
注意:现在计算机产生的随机数都是伪随机数。
1.0-1之间均匀分布的随机数
random_number(x) 产生一个0到1之间的随机数(x可以是向量),但是每次总是那几个数。
用了random_seed ()后,系统根据日期和时间随机地提供种子,使得随机数更随机了。
program random
implicit none
real :: x
call random_seed () ! 系统根据日期和时间随机地提供种子
call random_number (x) ! 每次的随机数就都不一样了
write(*,*) x
stop
end program random
2.任意区间均匀分布的随机数
function my_random (lbound,ubound)
implicit none
real :: lbound,ubound
real :: len
real :: my_random
real :: t
len=ubound-lbound !计算范围大小
call random_number(t) !t是0-1之间的随机数
my_random=lbound+len*t
return
end
注意:在循环外call random_seed()
3.产生一个随机数数组,只需加一个循环即可
function my_random (lbound,ubound)
implicit none
real :: lbound,ubound
real :: len
integer size
real :: my_random(size) !size代表数组元素的个数
real :: t
integer i
len=ubound-lbound !计算范围大小
do i=1,10
call random_number(t) !t是0-1之间的随机数
my_random(i)=lbound+len*t !把t转换成lbound-ubound间的随机数
end do
return
end
注意:同理在循环外call random_seed()
4.标准正态分布随机数/高斯分布随机数
(1)徐士良的那本程序集里介绍了正态分布随机数产生的原理,不过他的方法只能产生较为简
单的随机数,随机数的质量并不高,特别是随机数的数目较多时。
(2)Box 和 Muller 在 1958 年给出了由均匀分布的随机变量生成正态分布的随机变量的算法。
设 U1, U2 是区间 (0, 1) 上均匀分布的随机变量,且相互独立。
令
X1 = sqrt(-2*log(U1)) * cos(2*PI*U2);
X2 = sqrt(-2*log(U1)) * sin(2*PI*U2);
那么 X1, X2 服从 N(0,1) 分布,且相互独立。
等于说我们用两个独立的 U(0,1) 随机数得到了
两个独立的 N(0,1)随机数。
值得说明的是,该方法产生的随机数质量很高。
嘻嘻,本人亲自验证过。
SAS和蒙特卡罗模拟_随机数
一、为什么选择SAS做蒙特卡罗模拟?
为什么要用SAS做蒙卡?首先,对我来说,我只会用SAS,而且打算用SAS完成我所有的工作。
当然,其他一些通用的理由有(Fan, etc.,2002):
1.蒙卡是个计算密集的活,而SAS Base、SAS Macro、SAS/IML强大而灵活
的编程能力能满足这一要求;
2.做蒙卡时要用到大量的统计/数学技术,而SAS就内置了大量的统计/数
学函数(在 SAS/Stat和SAS/ETS);用Fortran或C++当然也是非常好的
主意,只是他们缺少内置的统计函数,代码就要冗长复杂很多。
二、什么是蒙卡?一个启发性例子
好,开始,什么是蒙卡?了解它背景知识的最好办法当然是
wiki-Monte_Carlo_method。
蒙特卡罗是位于摩洛哥的一家赌场,二战时,美国Los Alamos国家实验室把它作为核裂变计算机模拟的代码名称。
作为模拟方法,蒙卡以前就叫统计抽样(statistical sampling),我们感兴趣的结果因为输入变量的不确定而不可知,但如果能依概率产生输入变量的样本,我们就可以估计到结果变量的分布。
跟蒙卡对应的,还有一种模拟技术叫系统模拟,包括排队、库存等模型,这些模型都跟随时间推移而出现的事件序列有关。
下面举个蒙卡的例子,来自Evans, etc.( 2001)的超级简化版。
假设一家企业,利润是其需求量的函数,需求是随机变量。
为了简化讨论,假定利润就是需求的两倍。
这里输入变量就是不可控的需求,结果变量就是我们感兴趣的利润。
假设需求以相同的概率取10、20、30、40、50、60这六种情况。
在这样的简化下,我们就可以投一枚均匀的骰子来产生需求的样本,如果点数为1,对应得需求就是10,点数为2,需求就是20,以下类推。
这样,我们的模拟过程就是:
1.投骰子;
2.根据骰子的点数确定需求量;
3.根据需求量,求利润。
掷10次骰子,假设我们的模拟结果如下:
重复次数骰子点数需求量利润
1 5 50 100
2 3 30 60
3 3 30 60
4 6 60 120
5 1 10 20
6 3 30 60
7 4 40 40
8 5 50 100
9 2 20 20
10 5 50 50
这样通过模拟需求的样本,我们对结果利润的分布也就有所知晓,比如平均利润可以算出就是63。
蒙卡一个重要的步骤就是生成随机数,这里我们是用投骰子来完成。
三、又一个例子:利用蒙特卡罗模拟方法求圆周率∏(pi)
再举个很有名的例子,就是估计圆周率∏的值,来自Ross(2006)。
这个试验的思路正好可以帮我们温习一下几何概型的概念。
我们知
道概率的古典概型,就是把求概率的问题转化为计数:样本空间由
n个样本点组成,事件A由k个样本点组成,则事件A的概率就是
k/n。
考虑到概率和面积在测度上具有某种共性,几何概型的基本想
法是把事件跟几何区域相对应,用面积来计算概率,其要点是:
1.认为样本空间Ω是平面上的某个区域,其面积记为υ(Ω);
2.向区域Ω随机投掷一点,该点落入Ω内任何部分区域内的
可能性只与这部分区域的面积成比例,而与这部分区域的位置和形状无
关;
3.设事件A是Ω的某个区域,面积为υ(A),则向区域Ω上随机投掷一
点,该点落在区域A的可能性称为事件A的概率,P(A)=υ(A)/υ(Ω)。
扯远了,回到用蒙卡估计圆周率∏的实验思路。
假设样本空间是一个边长为2
面积为4的正方形,我们感兴趣的事件是正方形内的一个半径为1面积为∏的圆,所以向正方形内随机投掷一点,落在圆里面的概率为∏/4。
实验的思路如下:
1.1)生成随机数——生成n个均匀落在正方形内的点;
2.2)对落在正方形内的n个点,数一数正好落在圆里面的点的个数,假设
为k(另外n-k个点就落在圆外面的正方形区域内)。
3.3)k/n就可以大致认为是圆的面积与正方形的面积之比,另其等于∏/4,
就可以求出圆周率∏的估计值。
又,Forcode提供了利用电子表格Excel求解以上问题的详细过程,有兴趣可以看看。
另外,这里也有一个详细的说明,用Mathematica实现。
四、随机数很重要(以及下期预告)
在第一个例子中,我强调了骰子要是均匀的。
那里骰子就是我们的随机数生成器,骰子的均匀程度就是我们随机数的“随机”成分。
在上面的10次试验中,投出了3次点数“3”和3次点数“5”,然后点数“1”、“2”、“4”、“6”各出现一次——因为只是重复了10次,这样我们对骰子的均匀程度不好评估,但如果重复无数次——假如是十万次,如果还出现类似比例的结果,那么就有理由怀疑这粒骰子的均匀程度了。
如果骰子灌了铅,比如投出点数“6”的可能性从六分之一上升到6分之三,那么根据这粒骰子来做模拟,我们就有高估需求以及利润的危险。
下次就讲讲随机数的生成原理,当然结合SAS来讲,或者也会提一下Excel。
五、其他软件包
在商业领域,基于Excel的插件比较兴盛,比如Crystal Ball应用就较为普遍,有试用版可以下载。
其他竞争产品有@Risk、Risk Solver等。
现在据说Risk Simulator也开始兴盛起来,大有后来居上之势。
他的开发者Johnathan Mun还在Wiley Finance系列有一本书,Modeling Risk: Applying Monte Carlo Simulation, Real Options Analysis, Forecasting, and Optimization Techniques。
S语言(R或者S-Plus)由于其面对对象的特性,加之丰富的内置函数和诸多用户提供的库,使得R或者S-Plus也是蒙卡研究的得力工具——或者比SAS更有前景。
这个我不熟,略之。
Random Numbers
最简单、最基本、最重要的随机变量是在[0,1]上均匀分布的随机变量。
一般地,我们把[0,1]上均匀分布随机变量的抽样值称为随机数,其他分布随机变量的抽样都是借助于随机数来实现的。
以下谈的都是所谓“伪随机数”(Pseudo Random Numbers)。
产生随机数,可以通过物理方法取得(很久很久以前,兰德公司就曾以随机脉冲源做信息源,利用电子旋转轮来产生随机数表),但当今最为普遍的乃是在计算机上利用数学方法产生随机数。
这种随机数根据特定的迭代公式计算出来,初值确定后,序列就可以预测出来,所以不能算是真正的随机数(就成为“伪随机数”)。
不过,在应用中,只要产生的伪随机数列能通过一系列统计检验,就可以把它们当成“真”随机数来用。
现在大多软件包内置的随机数产生程序,都是使用同余法(Congruential Random Numbers Generators)。
“同余”是数论中的概念。
0.预备知识:同余
捡回小学一年级的东西:"4/2=2"读作“4除以2等于2”,或者,“2除4等于2”。
还有求模的符号mod(number,divisor),其中,number是被除数(在上式中,为4),divisor是除数(上式中的2)。
这样的约定对SAS和Excel都通用,如mod(4,13)=4,mod(13,4)=1。
现在我们可以开讲“同余”了。
设m是正整数,用m去除整数a、b,得到的余数相同,则称“a与b关于模m同余”。
上面的定义可以读写成,对整数a、b 和正整数m,若mod(a,m)=mod(b,m),则称“a与b关于模m有相同的余数(同余)”,记做a≡b(mod m)(这就是同余式)。
举个例子,mod(13,4)=1,mod(1,4)=1,则读成13和1关于模4同余,记做13≡1(mod 4)。
当然,同余具有对称性,上式还可以写成1=13(mod 4)。
a≡b(mod m)的一个充要条件是a=b+mt,t是整数,比如13=1+3*4。
a=b+mt可以写成(a-b)/m=t,即m能整除(a-b)。
这些就够了。
更多基础性的介绍,可以参考《同余(数据基础)》。
1.乘同余法
同余法是一大类方法的统称,包括加同余法、乘同余法等。
因为这些方法中的迭代公式都可以写成上面我们见过的同余式形式,故统称同余法。
常用的就是下面的乘同余法(Multiplicative Congruential Generator.)。
符号不好敲,做些约定,如R(i)就是R加一个下标i。
乘同余法随机数生成器的同余形式如下:R(i+1)=a*R(i) (mod m)。
这个迭代式可以写成更直观的形式,R(i+1)=mod[a*R(i),m],其中初值R(0)称为随机数种子。
因为mod(x,m)总是等于0到m-1的一个整数,所以最后把R(i+1)这个随机序列都除以m,就可以得到在[0,1]上均匀分布的随机数。
下面用电子表格演示一遍,假设随机数种子R(0)=1,a=4,m=13:
上面显示的是公式(Excel中,公式与计算结果的转换,用快捷键ctrl+~实现),结果看起来是这样的,E列就是我们想要的在[0,1]上均匀分布的随机数:
上表中,a*R(1)=16,R(2)=3,m=13,一个同余式就是R(2)=a*R(1) (mod m),3=16(mod 13),或者说,16-3能够被13整除——同余法就是这意思了。
说“乘同余法”,要点在于a*R(i)是乘法形式。
在SAS系统中,a=397,204,094,m = 2^31-1=2147483647(一个素数),随机种子R(0)可以取1到m-1之间的任何整数。
2.伪随机数的检验
现在内置于各大软件包的随机数生成器都经过了彻底的检验,我们当然可以安心地使用这个黑箱。
或则我们也可以多了解些。
一个好的“伪”随机数列,应该看起来就跟从[0,1]上均匀分布的随机数列中随机抽取出来的一样。
两个比较直观的检验有:
1.均匀性检验——所有的数是否均匀地分布在[0,1]区间;
2.独立性(或不相关)检验——序列中的数不存在序列相关,每个数都跟
其前后出现的数独立无关。
一个例子是如0.1、0.2、0.3、0.4、0.5,
这里每一个相继的数都正好比它前面的一个数大0.1,这样这个数列就
似乎有了某种“格局”。
具体的检验方法就略之了,更多请参见徐钟济(1985)。
3.生成其他概率分布的随机数
前面提到过,我们把[0,1]上均匀分布随机变量的抽样值称为随机数,其他分布随机变量的抽样都是借助于随机数来实现的。
对其他连续型分布,(累积)分布函数为F(x),r是在[0,1]上均匀分布的随机变量,另r=F(x),解出的x就是该连续型分布的随机抽样。
由于x可以写成r的反函数,该变换就称作“逆变换”(Inverse Transformation method)。
对离散型分布,思路类似,不过繁琐些,具体可以见徐钟济(1985)、Ross(2006)和Evans等(2001)。
大多数相关软件包都会提供各种分布的随机数生成函数,知道有这回事就可以。
最重要的,是我们陈述一类问题时,知道需要用哪种概率分布来描述Evans等(2001):
常用的连续分布
1.均匀分布(Uniform Distribution)描述在某最小值和最大值之间所有结
果等可能的随机变量的特性。
2.正态分布(Normal Distribution)是对称的,具有中位数等于均值的性
质,就是我们熟悉的钟形形状。
各种类型的误差常常是正态分布的。
最
后,作为中心极限定理的推论,大量具有任意分布的随机变量的平均数
也呈正态分布。
3.三角形分布(Triangular Distribution)由三个参数来定义,最大值、最
小值和最可能值。
临近最可能值的结果比那些位于端点的结果有更大的
出现机会。
4.指数分布(Exponential Distribution)常用来构建在时间上随机重现的
事件的模型,如顾客到达服务系统的时间间隔、机器元件失效前的工作
时间等。
它的主要性质是“无记忆性”(Memoryless) ,即当前时间对
未来结果没有影响。
例如,不论机器原先已经运转了多长时间,它继续
运转直至出现故障的时间间隔总有同样的分布。
5.对数正态分布(Lognormal Distribution):若随机变量x的自然对数是
正态的,则x就服从对数正态分布。
对数正态分布的常见例子是股票价
格。
常用的离散分布
1.贝努利分布(Bernoulli Distribution)描述的是只有两个以常数概率出
现的可能结果的随机变量的特性;
2.二项分布(Binomial Distribution)给出每次试验成功概率为p的n次独
立重复贝努利实验的模型;
3.泊松分布(Poisson Distribution)用于建立某种度量单位内发生次数的
模型的一种离散分布,如某时段内某事件发生的次数。
其他有用的分布如伽玛分布(Gamma Distribution)、威布尔分布(Weibull Distribution)、贝塔分布(Beta Distribution)略之。
4.下期预告
上次落了些东西。
说到蒙卡与C++,在数量金融领域,不能不提的一本书就是Mark Joshi的C++ Design Patterns and Derivatives Pricing (Cambridge Uni. Press, 2004),面试中一定要说自己读过的,这样人家以为你至少会用C++做一个蒙特
卡罗模拟。
这个系列只讲SAS,下次先讲如何用SAS生成随机数,然后就是具体的项目。
SAS随机数函数及CALL子程序
********************************************************************
******************************************************
《SAS和蒙特卡罗模拟(1):开篇》——简介,通过例子建立起蒙卡的直观概念;参考软件包及书目
《SAS和蒙特卡罗模拟(2):随机数基础》——随机数入门;参考书目
********************************************************************* ********************************************************************* ********
一、SAS随机数函数和CALL子程序
SAS系统产生随机数,两种方式,利用SAS函数(Functions)或者CALL子程序(CALL Routines),它们的语法格式是(具体的区别容后讨论):
SAS可用的随机数函数列表如下(可以参见SAS Help and Documentation-SAS Products-Base SAS-SAS Language Dictionary-Functions and CALL Routines-Functions and CALL Routines by Category):
上面的随机函数,除了normal和uniform,都可以由直接相应的CALL子程序调用。
二、SAS随机数函数和CALL子程序:比较
用SAS随机数函数同时创建的多个随机数变量其实都属于同一个随机数列。
这话费解,一个例子先,创建两个随机数变量,各包含3个记录,其中x1的种子为123,x2的种子为456:
data ranuni(drop=i);
retain seed1 123 seed2 456;
do i=1 to 3;
x1=ranuni(seed1);
x2=ranuni(seed2);
output;
end;
run;
proc print data=ranuni;run;
结果为:
Obs seed1 seed2 x1 x2
1 123 456 0.75040 0.32091
2 12
3 456 0.17839 0.90603
3 123 456 0.35712 0.22111
好像没什么异样。
我们把上面的x1增加为6个记录:
data ranuni2(drop=i);
retain seed1 123;
do i=1 to 6;
x1=ranuni(seed1);
output;
end;
run;
proc print data=ranuni2;run;
结果如下,把上下用红色标出的数字对照看一看:
Obs seed1 x1
1 123 0.75040
2 12
3 0.32091
3 123 0.17839
4 123 0.90603
5 123 0.35712
6 123 0.22111
什么意思?在第一段代码中,x2的种子根本不起作用,把x2的记录安插到x1里,看起来就是用种子123产生的随机数列加长了而已。
x2的第一个值并不是由种子456产生的,而是产生第一个x1后的下一个值,x1、x2其实属于同一个随机数列,尽管x2的种子被指定为456,而x1的被指定为123。
现在就可以重复上面的一句话:用SAS随机数函数同时创建的多个随机数变量其实都属于同一个随机数列。
用CALL子程序就能够同时产生独立的随机数列。
data ranuni3(drop=i);
retain seed3 123 seed4 456;
do i=1 to 3;
call ranuni(seed3,x3);
call ranuni(seed4,x4);
output;
end;
run;
proc print data=ranuni3;run;
结果如下:
Obs seed3 seed4 x3 x4
1 1611463328 736440516 0.75040 0.34293
2 689153326 774069794 0.32091 0.36045
3 38308885
4 686944750 0.17839 0.31988
以上x3就是x1。
x1和x3的初始种子都是123,但x3那个结果显示的种子是当前种子值。
要在SAS随机数函数语句中显示随机种子的当前值,可以由以下代码给出:
data ranuni4(drop=i);
retain seed1 123;
do i=1 to 3;
x1=ranuni(seed1);
seed=x1*(2**31-1);
output;
end;
run;
proc print data=ranuni4;
var seed1 seed x1;
run;
结果如下,可以跟上面由CALL子程序得出的结果对照:
Obs seed1 seed x1
1 123 1611463328 0.75040
2 12
3 689153326 0.32091
3 123 38308885
4 0.17839
---------参考资料---------
1.Xitao Fan, etc..Monte Carlo Studies: A Guide for Quantitative
Researchers. SAS Institute Inc.,2002
2.朱世武《SAS编程技术与金融数据处理》,北京:清华大学出版社,2003 Matlab() 随机数生成方法:
第一种方法是用random 语句,其一般形式为
y = random('分布的英文名',A1,A2,A3,m,n),
表示生成m 行n 列的m × n 个参数为( A1 , A2 , A3 ) 的该分布的随机数。
例如:
(1) R = random('Normal',0,1,2,4): 生成期望为0,标准差为1 的(2 行4 列)2× 4 个正态随机
数
(2) R = random('Poisson',1:6,1,6):依次生成参数为1 到6 的(1 行6 列)6 个Poisson 随机数
第二种方法是针对特殊的分布的语句:
一.几何分布随机数(下面的P,m 都可以是矩阵)
R = geornd(P) (生成参数为P 的几何随机数)
R = geornd(P,m)(生成参数为P 的× m 个几何随机数)
1
R = geornd(P,m,n)(生成参数为P 的m 行n 列的m × n 个几何随机数)例如
(1)R = geornd(1./ 2.^(1:6)) ( 生成参数依次为1/2,1/2^2,到1/2^6 的6 个几何随机数)
(2)R = geornd(0.01,[1 5]) (生成参数为0.01 的(1行5列)5 个几何随机数).
二.Beta 分布随机数
R = betarnd(A,B)(生成参数为A,B 的Beta 随机数)
R = betarnd(A,B,m)(生成× m 个数为A,B 的Beta 随机数)
1
R = betarnd(A,B,m,n)(生成m 行n 列的m × n 个数为A,B 的Beta 随机数).
三.正态随机数
R = normrnd(MU,SIGMA)(生成均值为MU,标准差为SIGMA 的正态随机数)
R = normrnd(MU,SIGMA,m)(生成× m 个正态随机数)
1
R = normrnd(MU,SIGMA,m,n) (生成m 行n 列的m × n 个正态随机数)
例如
(1) R = normrnd(0,1,[1 5]) 生成5 个正态(0,1) 随机数
(2) R = normrnd([1 2 3;4 5 6],0.1,2,3)生成期望依次为[1,2,3;4,5,6], 方差为0.1 的2× 3 个
正态
随机数.
四.二项随机数:类似地有
R = binornd(N,P)R = binornd(N,P,m) R = binornd(N,p,m,n)
例如
n = 10:10:60; r1 = binornd(n,1./n)或r2 = binornd(n,1./n,[1 6]) (都生成参数分别为
1 1
), L, ( 60, ) 的6个二项随机数.
(10,
10 60
五.自由度为V 的χ 2 随机数:
R = chi2rnd(V)R = chi2rnd(V R = chi2rnd(V
,m) ,m,n)
六.期望为MU 的指数随机数(即Exp 随机数):
1
MU
R = exprnd(MU)R = exprnd(MU,m)R = exprnd(MU,m,n)
七.自由度为V1,V2 的 F 分布随机数:
R = frnd(V1,V2)R = frnd(V1,V2,m)R = frnd(V1,V2,m,n)
八.Γ ( A, λ ) 随机数:
R = gamrnd(A,lambda)R = gamrnd(A,lambda,m)R = gamrnd(A,lambda,m,n) 九.超几何分布随机数:
R = hygernd(N,K,M)R = hygernd(N,K,M,m)R = hygernd(N,K,M,m,n)
十.对数正态分布随机数
R = lognrnd(MU,SIGMA)R = lognrnd(MU,SIGMA,m)R = lognrnd(MU,SIGMA,m,n) 十一.负二项随机数:
R = nbinrnd(r,p)R = nbinrnd(r,p,m)R = nbinrnd(r,p,m,n)
十二.Poisson 随机数:
R = poissrnd(lambda) R = poissrnd(lambda,m)R = poissrnd(lambda,m,n) 例如,以下3 种表达有相同的含义:lambda = 2;R = poissrnd(lambda,1,10)
(或R = poissrnd(lambda,[1 10])或R = poissrnd(lambda(ones(1,10)))
十三.Rayleigh 随机数:
R = raylrnd(B) R = raylrnd(B,m)R = raylrnd(B,m,n)
十四.V 个自由度的t 分布的随机数:
R = trnd(V) R = trnd(V,m)R = trnd(V,m,n)
42
十五.离散的均匀随机数:
R = unidrnd(N) R = unidrnd(N,m)R = unidrnd(N,m,n)
十六.[A,B] 上均匀随机数
R = unifrnd(A,B) R = unifrnd(A,B,m)R = unifrnd(A,B,m,n)
例如unifrnd(0,1:6)与unifrnd(0,1:6,[1 6]) 都依次生成[0,1] 到[0,6]的6个均匀随机数.: 十七.Weibull 随机数
R = weibrnd(A,B) R = weibrnd(A,B,m)R = weibrnd(A,B,m,n)。