一维正态分布随机数序列产生的几种方法介绍
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一维正态分布随机数序列产生的几种方法介绍
【摘要】正态分布在数理统计中具有基础性的作用,因此产生高质量的正态分布有重要的意义。
我们将介绍几种数值方法求正态分布:中心极限定理,Hasiting 有理逼近法,统计工具箱,反函数法,舍选法,R 软件及一维正态随机数的检验。
【关键词】正态分布;一维;随机数。
一.利用中心极限定理
中心极限定理:(一般 n≥10),
产生服从N(μ,σ2)的算法步骤:
(1)产生n 个RND 随机数:r 1,r 2,…,r n ;
(2) (3) 计算 y =σx +μ ,y 是服从 N(μ,σ2) 分布的随机数。
原理分析:
设ζ1,ζ2,…,ζn 是n 个相互独立的随机变量,且ζi ~U(0,1), i = 1,2, …,n, 由中心极限定理知 : ,渐近服从正态分布N(0, l )。
注意:我们现在已经能产生[0,1]均匀分布的随机数了,那么我们可以利用这个定理来产生标准正态分布的随机数。
现在我们产生n 个[0,1]均匀分布随机数,
我们有: 为方便起见,我们特别选 n = 12,则 : 这样我们很方便地就把标准正态分布随机数计算出来了。
在C 语言中表示为:
例1:利用中心极限定理产生标准正态分布随机数并检验
% example 1
n r r r ,,,21 ⎪⎪⎭
⎫ ⎝⎛-=∑=211121n i i r n n u ∑=-=12
16
i i r u ;
/
)(1122∑=-=n i n n i r x 计算,12
1)()(21
==i i D E ζζ,有∑=-=n
i n n i 1122/)(ζη
clc,clear
for i=1:1000
R=rand(1,12);
X(i)=sum(R)-6;
end
X=X';
m=mean(X)
v=var(X)
subplot(1,2,1),cdfplot(X)
subplot(1,2,2),histfit(X)
h=kstest(X, [X normcdf(X, 0,1)])
结果为:H=0, 接受原假设,变换后的确为标准正态分布。
二.Hasiting 有理逼近法
这是一种计算速度快,也能满足一定精度的算法。
我们可以构造分布函数反函数的近似逼近公式,来产生标准正态分布的随机数。
其计算公式为:
这里
,系数为: a 0 = 2.515517 b 1 = 1.432788
a 1 = 0.802853
b 2 = 0.189269
a 2 = 0.010328
b 3 = 0.001308
三.利用统计工具箱
在MATLAB 统计工具箱中为我们提供了大量的产生各种随机数发生器程序,我们只需要调用就可以产生我们想要的随机数。
四.反函数法
设连续型随机变量Y 的概率函数为 f (x ), 需产生给定分布的随机数.
算法:
(1)产生n 个RND 随机数r 1,r 2,…,r n ;
(2) 所得y i , i =1,2, …,n 即所求.
基本原理:
设随机变量Y 的分布函数F (y )是连续函数,而且随机变量X ~U (0,1),令Z =F -1(X )。
则Z 与Y 有相同分布。
证明 :F Z (z )= P {F -1(X ) ≤ z }= P {X ≤F (z )}=G (F (z )) = F (z )
因G (x )是随机变量X 的分布函数:
若Y 的概率密度为 f (y ),由Y =F -1(X )可得: 对给出定的(0, 1)上均匀分布随机数r i ,则具有给定分布的随机数 y i 可由方程
解出。
3
322122101y b y b y b y a y a a y x +++++-=)1,0(~,)ln 2(2/1U r r y -=;)(i y i y dy y f r i 中解出从等式⎰∞-=⎪⎩⎪⎨⎧≤<≤<=.
1,1;10,
;0,0)(x x x x x G ⎰∞
-==Y dy y f Y F X )()(⎰∞-=i y
i dy y f r )(
五.舍选法
基本思想:
实质上是从许多RND 随机数中选出一部分, 使之成为具有给定分布的随机数。
设随机变量X 的概率密度函数为f (x ),存在实数a <b ,使P{a <X<b }=1。
算法步骤:
(1) 选取常数λ,使λf (x )<1,x ∈(a, b);
(2) 产生两个RND 随机数r 1 、r 2,令y = a +(b -a )r 1 ;
(3) 若r 2≤λf (y ),则令x=y ;否则剔除 r 1和r 2, 重返步骤(2),重复循环, 产生的随机数x 1,x 2,…,x N 的分布由概率函数 f (x ) 确定。
舍选法算法原理分析:
设P {a <Z <b }=1,Z 的概率密度为f (z ),
(1)选常数λ,使λf (z )≤1,z ∈(a ,b );
(2)随机变量X 1,X 2相互独立X i ~U (0, 1),令Y 1=a +(b -a )X 1~U(a, b );
(3)若X 2≤λf (Y 1),则令X = Y 1,否则剔除X 1,X 2重复到(2); 则随机变量X 的分布与Z 相同。
注: 可选取有限区间(a 1, b 1),使得 (ε是很小的正数) 例如,取 a 1=μ-3σ,b 1=μ+3σ,有 在区间(a 1, b 1)上应用舍选法,不会出现较大的系统误差。
六.R 软件
利用R 软件,可方便地求各种常见概率分布的分布函数,分位点及生成各种常见分布的随机数等。
在各种分布名称中加上不同的前缀表示不同的意义如:p-求分布函数,q-求分位点,r 产生随机数等。
七、一维正态随机数的检验
,1)(=⎰b a
dx x f 若不满足条件:ε-≥⎰1)(11b a dx x f 003.011
122)(221->⎰σμ-σπ-dx e b a x
我们已经基本搞清伪随机数的产生原理,由于并不是真正的随机数,很自然的问题是,它们是否具有真正随机数的那些统计性质如参数大小、独立性,均匀性等等。
设:随机数具有连续的分布函数F (X ),则随机变量R=(X )是均匀分布(0,1)的随机变量,因此如果R 通过统计检验随机变量 X 也可以通过。
因此我们以下着重讨论均匀分布R 的检验问题,再简单地讨论正态随机数检验问题。
统计推断原理:
统计量的定义:设
为 随机变量序列,则随机序列的函数称为统计量。
记为:
显然统计量 S 也是随机变量。
既然是随机变量,它们就应该有其分布或称总体的规律,当然也有各种数字特征。
例如均值、标准差、方差等等各阶矩。
我们的统计推断方式是:
(1)H 0:某假定成立;
(2)在假定成立的条件下构造统计量S ;
(3)统计量构造完毕,我们也就知道了该统计量的全部统计规律。
如它的分布函数,或密度函数各阶矩等;
(4)根据统计量的分布,在给定的显著性水平α,对统计量S 的一次抽样确定以 1-α为概率的区域,该区域称为接受域 。
如果该次抽样计算出统计量 S 的值 s 落入该领域,我们就接受原假,否则推翻原假设。
这个就是小概率事件在一次实验实际不可能发生原理。
落入由α 确定的区域是一个小概率事件,在一次实验中我们认为是不可能发生的。
统计检验中两类常用统计量的构造检验方法:
1.设随机变量 X 具有数学期望E (X )=
,和有限方差D (X )= ,我们抽 N n X X X ,,,21 ),,,(21n X X X S S =X N
i μ
∑-μ2σ
次样本X 1,X 2……,X N ,当N 充分大时,统计量
以 N (0,1)为极限分布,取显著水平 α = 0.05, 则拒绝为(—∞,—1.96),(1.96,∞)。
当
>1.96,则认为差异显著,拒绝假设 E (X )=μ 2.将样本X 1,X 2,……,N N ,按一定规则分为不相交的 K 组,记 i 组的观测频数为 n i (i=1,……,k ),若随机变量 X 落于弟 i 组的概率为 P i ,则得理论频数m i = N × P i ,由n i ,m i 构造统计量。
= 渐近服从自由度为
的分布,简记 。
这里,l 是确定概率 P 时,由子样 X 中给出的约束条件数。
为有效地进行统计检验,一般要求(4.6.2)的样本数 N >30;在(4.6.2)中k ≥5,m i≥5。
当统计量的自由度
时,U = ,渐近服从N (0,1)分布。
服从柯尔莫格洛夫—斯米尔诺夫的统计量 取显著性水平α= 0.05, ,可拒绝原假设。
我们可以用这种方法进行独立性,及拟合优度检验。
八、其他一维正态分布随机数序列的产生方法:
1、 直接抽样法:
由基本定理我们知道,对于有些随机变量可以建立与R 的函数关系,因此只需对R 进行抽样,利用函数的映射关系我们就可以方便地得到该随机变量的抽样了。
如前面的指数分布随机数。
2、变换抽样:
产生随机变量的变换抽样方法,是讨论均匀分布的不同函数分布,为随机变量抽U 2χ∑=-k
i i i i m n m 12)(1--l k )1(2--l k χ30>d 1222--d χ∑=≤≤⎪⎭
⎫ ⎝⎛-=j i i k j N k N n N D N 1
1max 135.1>N D N
样提供一些简单可行的算法。
在概率论中,从不同的角度出发,对随机变量函数进行了讨论,以下列出一些结果。
设随机变量 X 具有密度函数
, 是对随机变量 X 的变换,且 的逆函数存在,记为 有一阶连续导数,则随机变量的密度函数 3.值序抽样
值序统计量 ,通常称为值序量。
是随机向量 的一个函数,取其一
个实现 并排序得 其中的第 l 个值为函数值。
显然这是一个统计量。
若随机变量 的各个分量独立且同分布,则值序统计量 的密度函数
和分布函数分别为:
这里,F (x), f (x) 分别为随机变量在分布函数和密度函数。
特别当随机变量 为[0,1]上的均匀分布时,
得密度函数为:
这是 分布的密度函数
因此我们可以很容易地产生特殊的 分布的随机数。
【个人体会】
)(x f )(X g Y =)(x g )
()(1y h x g =-)
(X g Y =)
(n l η),,(21n X X X )
,,,,,()()1()()1()2()1(n l l l x x x x x x +-[][])
()(1)()!()!1(!
)(1x f x F x F l n l n x f l n l nl -----=⎰-----=)(01
)1()!()!1(!)(x F l n l nl dt
t t l n l n x F n i X i ,,2,1 =⎪⎪⎩⎪⎪⎨⎧≤≤---=--else
x x x l n l n x f l
n l nl 01
0)1()!
()!1(!)(1ββ[])
()()('*y h y h f y f ⋅=)
,,(21n x x x )
,,(21n X X X )
(n l η
一维正态分布随机数序列的产生方法有很多种,其中直接抽样、变换抽样、值序抽样等抽样方法较简单但比较常用,利用中心极限定理是最常用的一种求正态分布随机数的一种方法。
本文还提供了两种随机数的检验方法,用于检验产生的随机数实际值与理论值的差异。
反函数法和舍远法是连续随机变量通用的方法,应用与正态分布的时候可适当做调整。
个人体会较深的是,在文献查阅上网搜索过程中,面对繁杂的资料,首先应该明确自己要找什么资料,并大约查找相关资料在头脑中形成要写报告的大体框架,然后逐渐精细到点,然后有针对性地查找资料。
【参考文献】
【1】杨振海,张国志;随机数生成[J]。
数理统计与管理,2006,25(2);244-252.
【2】程维虎,杨振海;舍选法几何解释及曲边梯形概率密度随机数生产算法[J]。
数理统计与管理,2006,25(4)。
【3】魏宗舒;概率论与数理统计[M]。
北京:高等教育出版社,1995。
【4】马砚儒. 经验数学期望及性质[J]。
内蒙古民族大学学报,2002 ,17 (2) :97 –100。
【5】高惠璇,统计计算[M]。
北京:北京大学出版社,1995。
【6】杨振海,程维虎.统计模拟[J]。
数理统计与管理,2006,25(1):117-126。