Monte-Carlo simulations of photohadronic processes in astrophysics
GPU加速的水体辐射传输Monte Carlo模拟模型研究

GPU加速的水体辐射传输Monte Carlo模拟模型研究杜克平;薛坤【摘要】水体辐射传输方程是复杂的微积分方程,只能利用数值方法求解,如Monte Carlo光线追踪法、不变嵌入法、离散坐标法等,其中,Monte Carlo方法是目前解决水体水下光场三维问题的唯一有效方法.根据辐射传输理论,开发了水下光场的MonteCarlo模拟模型,主要包含大气、水-气界面、层化水体和水底边界4个模块.实现了模拟任意太阳角度、不同水体固有光学属性和任意深度条件下,考虑大气、粗糙水面和水底边界的水下光场,能够获取辐亮度、辐照度等辐射量的空间分布.该模型暂不考虑Raman散射、偏振、内部光源的影响.实现了GPU加速水下光场Monte Carlo模拟,并用Mobley等提出的海洋光学标准问题中的问题1~6进行验证.在两种计算环境下,通过对不同边界条件下的CPU、GPU运行时间及加速比的对比,发现GPU计算可以达到几百至上千倍的加速比.【期刊名称】《湖泊科学》【年(卷),期】2016(028)003【总页数】7页(P654-660)【关键词】GPU;水体辐射传输方程;Monte Carlo模拟;水下光场【作者】杜克平;薛坤【作者单位】北京师范大学地理学与遥感科学学院,遥感科学国家重点实验室,北京100875;中国科学院南京地理与湖泊研究所,湖泊与环境国家重点实验室,南京210008;中国科学院大学,北京100049【正文语种】中文水下光场计算模型主要通过计算不同水深和太阳天顶角、方位角等条件下的辐照度、辐亮度、漫衰减系数等辐射量与表观光学量来反映水下光场的分布. 精确模拟水下光场对研究海洋初级生产力、生物地球化学模型以及全球循环模型中的热量收支平衡有重要意义.水体辐射传输方程描述了电磁波在水中传播时,受介质的吸收、散射等作用的影响发生衰减的过程. 水体光学模型的核心就是求解水体辐射传输方程,由于方程本身的复杂性及边界条件的限制,只能利用数值分析的方法得到数值解. 求辐射传输方程数值解的方法有Monte Carlo光线追踪法[1-6]、不变嵌入法[7]、离散坐标法[8]和矩阵算法[9-12]等.Monte Carlo光线追踪法直观地表达辐射传输过程中光束被水中粒子(水分子、悬浮颗粒物等)吸收和散射过程,物理结构清晰. 它可以对任意入射光线、散射相函数和固有光学属性分布情况下的水下光场进行三维模拟,可以解决一维模型所不能解决的问题,更加符合客观世界的实际情况. 它具有较强的灵活性,可以模拟野外测量难以达到的极限条件[13]. 在水体光学研究领域,Kattawar [1-2]、Gordon [3]、Kirk [4]、Morel[5]、Mobley[6]等很多学者已经用Monte Carlo方法解决了不同的水体光学问题. 国内,曹文熙等运用Monte Carlo方法模拟了浮标浮体阴影及安装仪器自阴影对水下光辐射测量的影响[14]. 唐军武等[15]和凌在盈 [13]利用Monte Carlo方法模拟了水下光场,但没有考虑大气和水底边界状况.Monte Carlo最大的缺点是计算速度慢,即便有提高计算速度的方法(如方差缩减技术[2,16]、BMC[3]等),但这些方法也只在一定程度上提高了光子的利用效率. Monte Carlo方法具有计算数据相对独立、串行数据处理少等优良的并行化特性,这种特性很适合用GPU加速运算,基于GPU加速Monte Carlo方法可以几倍、几十倍甚至上百倍地提高计算速度[17-20],在图形渲染、真实感场景模拟等应用领域中应用广泛.本文主要研究GPU加速的三维水体辐射传输Monte Carlo模拟模型,描述了水体辐射传输Monte Carlo模拟模型的建立过程,并实现了GPU加速. 比较分析了两种计算环境下不同海洋光学标准问题及复杂水下光场的加速性能.水体辐射传输Monte Carlo模拟模型,主要包含大气部分、水气界面、层化水体和水底边界4大模块,其中大气部分包括大气模型和入射光场分布模型(图1). 输入参数包括光子数、入射角度、固有光学量、水深、风速、大气参数、底边界等. 输出结果包括辐亮度(L)、辐照度(E)、遥感反射率(Rrs)、遥感反射比(R)、平均余弦(μ)、漫衰减系数(K)等辐射量与表观光学量. 该模型实现了模拟任意太阳角度(天顶角和方位角)、不同水体固有光学属性(吸收系数、散射系数和散射相函数)、任意深度条件下,考虑大气、粗糙水面、层化水体和水底边界的水下光场,可以得到辐亮度、辐照度等辐射量的空间分布. 该模型暂不考虑Raman散射、偏振和内部光源的影响.本文采用的大气模型为RADTRAN-X模型[21-22]. 该模型需要的大气参数包括:太阳角度、大气压强、大气类型、相对湿度、降雨量、风速、能见度、臭氧含量、气溶胶参数等,得到特定条件下的漫射天空光辐照度(Esky)、太阳直射光辐照度(Edir)和水面之上总入射辐照度(Etot=Esky+Edir).光子到达水-气界面之前,与大气中粒子发生相互作用,传播方向发生变化. 实际情况下,很难得到天空漫射光的空间分布,需要假设入射光场分布. 入射光场分布模型有理想模型和半分析模型,其中常用的理想模型有各向同性模型和心型分布模型[22]. 本文使用由Harrison等提出的辐亮度分布半分析模型[23],得到上半球空间的入射辐亮度分布. 为了方便统计、记录光子信息,把2π立体角上半球空间分为天顶角间隔10°、方位角间隔15°的格网[7],入射光的初始方向为格网的中心对应的天顶角和方位角.光子到达水-气界面会发生折射、反射. 平静水面情况下,根据Snell定律和菲涅尔反射定律得到折射角和反射率. 然而,实际的海面受风浪、波动等影响,几乎不可能是水平的,需要考虑粗糙水面的情况.粗糙水面的模拟使用Cox等[24]提出的小波面斜率正态分布模型,不考虑重力波. 在模拟过程中,考虑小波面的斜率的概率分布计算、相互遮挡问题以及多次反射等问题. 此处,存在两个坐标系统:系统坐标系和小波面坐标系,需要进行坐标系转换. 系统坐标系以水平面垂直向下为Z轴的正方向,X-Y平面是水平面. 小波面坐标系是以小波面的法线作为Z轴,X-Y平面在小波面所在的平面内.θn是小波面的法线与水平面的法线的夹角,代表小波面的倾斜角度,θn=0时,小波面水平. θn的方差为σ2=0.003+0.00512U,U为风速.光子与水中粒子发生相互作用时,一部分被吸收,为了减小Monte Carlo统计噪声,本文采用变权重的光子跟踪技术,即每次光子的权重乘以单次散射反照率(ω0)作为被吸收后光子的权重. 其中ω0的值越接近于1表示水体散射能力越强,越接近于0表示水体吸收能力越强.相函数是光子与粒子相互作用后散射方向的概率密度函数. 实际模拟中,需要根据水体的类型和水体中组分的含量选择合适的散射相函数. 水中粒子的散射主要分为纯水的散射和悬浮颗粒物的散射. 纯水的散射相函数采用近似瑞利散射相函数,悬浮颗粒物的散射相函数可使用Petzold在1972年测量的不同水体的体散射函数的平均值,或者使用其它相函数公式(如:Henyey-Greenstein相函数、Fournier-Forand相函数)[25]等.针对垂向不均一的水体,把野外实际测量的IOP随深度的廓线或者水体层化模型[26]输入水体辐射传输Monte Carlo模拟模型,可以得到垂向异质水体的水下光场分布.光子到达水底边界部分被水底物质吸收,部分被反射,反射的方向和反射率与水底状况有关,一般用二向反射函数(BRDF)定量描述入射光线与出射光线的关系. 由于水底BRDF测量存在一定的困难,在研究中通常忽略水底边界的二向性,假设水底表面是反射率固定的朗伯体,反射方向为各向同性.最初,GPU(Graphic Processing Unit,图形处理器)是一个高度并行的用于图形渲染任务的计算设备,现在已经发展成为常用的计算处理器. 在数据并行运算方面,GPU已经得到了广泛的应用,也变得越来越高效.水体辐射传输Monte Carlo(MC)模拟模型基于概率统计的方法,模拟光线在水体中与水中粒子相互作用的过程,获取水体的表观光学量. 要模拟得到精确的水下光场,需要初始设置大量光子(107),传统利用CPU计算时需要依次计算每个光子在水体中的传播过程,耗时较长,运行效率低. 然而,根据MC模拟过程的可并行计算的特点,引入GPU计算可以同时并行计算大量光子,大幅提高计算效率. 在基于CPU的水体辐射传输Monte Carlo模型的基础上,按照并行计算的要求,把可以并行计算的部分放到GPU上运行,条件判断、边界确定、结果保存等不具备并行特性的部分在CPU上计算.对CPU-MC程序进行改写可实现MC模拟模型的GPU并行运算. 表1列出了两种计算环境的CPU、GPU配置及对应的软件环境.Mobley等提出了海洋光学的7个标准问题[26],包括理想的简单问题、基本问题、层化水体问题、大气效应问题、粗糙水面问题、水底边界问题和拉曼散射问题. 他们用7种辐射传输模型(Hydrolight、离散坐标法和Monte Carlo方法),得到特定条件下的辐射量(辐亮度和辐照度)的平均值,经常被国内外学者作为检验海洋辐射传输模型精度的标准[9,15].海洋光学7个标准问题中的基本问题假设为:(1)水体表面水平;(2)水体水平与垂向均一且无限水深;(3)不考虑天空光;(4)太阳光为点光源,天顶角为60°;(5)太阳光在其垂直表面上的辐照度为1 W/(m2·nm);(6)水体内部无Raman散射及内部光源存在;(7)假设水体为高散射(ω0=0.9)或者高吸收(ω0=0.2)水体两种情况;(8)水体散射包括水分子和颗粒物散射两部分. 表2是对问题1~6的简单描述,参照文献[26]中的表3,本文没有考虑问题7(Raman散射).表2 海洋光学标准问题中问题1~6的描述[26]Tab.2 Summary of the canonical problems[26]参数问题1简单问题2基本问题3层化水体4大气效应5粗糙水面6水底边界ω00.9,0.20.9,0.2由深度决定0.90.90.2相函数RayleighParticle由深度决定ParticleParticleParticle水-气界面水平水平水平水平粗糙水平漫射天空光无无无考虑无无水底边界无限水深无限水深无限水深无限水深无限水深朗伯体,光学深度5m利用GPU加速的水体辐射传输Monte Carlo模拟模型,对表2的6个问题分别进行水下光场模拟. 表3是入射光子数为107,不同标准问题、光学深度、ω0下的模拟结果(下行辐照度(Ed)、上行辐照度(Eou)和向上辐亮度(Lu))与Mobley等[26]的相应模拟结果的平均值(Ed_aver、Eou_aver和Lu_aver),以及它们之间的平均相对误差(δ)(式1),x分别为Ed、Eou和Lu.(1)从对6个标准问题验证的结果(表3)可以得出,水体辐射传输模拟模型的精度基本达到了Mobley等的研究[26]中多个数值计算模型计算得到的平均值的精度范围. Ed、Eou比Lu的相对误差低,是因为Lu是由落入某个角度范围内少数光子计算得到的,受光子数目影响,稳定性差,而Eou与整个半球空间中的光子数有关,结果相对稳定. 在光学深度较大或强吸收水体存在误差较大的情况下(问题3,在60 m处模拟结果误差达到20%以上),是由于Monte Carlo方法本身存在噪声,复杂水体条件下假设的随机数较多,同样光子数的情况下,在强吸收水体噪声较大.因此,欲得到较好的结果,在强吸收水体需要增加模拟的光子数以保证模拟精度.3.2 不同模拟条件的GPU加速性能分析对海洋光学基本问题及其组合边界条件下的CPU计算时间、GPU加速的运行时间和加速比进行统计,总光子数为106.通过GPU加速,在问题1和问题3中加速比为300~500,而问题2和问题6达到了1000多(表4),这表明GPU加速可以明显提高Monte Carlo算法的运行效率. 问题2(ω0=0.9)CPU计算需要2 d(173604 s/3600 s=48.22 h),而GPU加速之后只需要加入大气模型及天空光之后,GPU加速没有明显提高运算速度,2~3 min(142 s). 从CPU的每个光子依次计算,到GPU的许多光子同时在GPU中计算,节省了时间,大幅提高了运行效率. 与文献[26]中的表4中5个MC模型对问题3的计算时间进行比较,运行速度平均提高了236倍.表3 本文模拟结果与Mobley等[26]研究结果的平均值及平均相对误差(入射光子数为107)Tab.3 Ed, Eou and Lu values in this paper and relative error (δ) with average value of Mobley et al[26] (total initial photons are 107)光学深度Ed_averEdδEou_averEouδLu_averLuδ问题11m3.66E-13.64E-1-0.63%3.72E-13.70E-1-0.46%4.85E-24.85E-2-0.09%(ω0=0.9)5m4.33E-24.37E-20.87%4.35E-24.49E-23.19%5.59E-35.92E-35.88%10m3.16E-33.22E-31.91%3.20E-33.26E-31.78%4.37E-44.39E-40.56%问题11m1.41E-11.40E-1-0.92%1.34E-21.32E-2-1.82%1.72E-31.66E-3-3.31%(ω0=0.2)5m1.07E-31.05E-3-1.92%1.00E-41.00E-40.44%1.37E-51.47E-57.04%10m2.93E-63.32E-613.29%3.00E-73.07E-72.25%3.39E-83.54E-84.56%问题21m4.13E-14.06E-1-1.70%9.31E-29.25E-2-0.62%6.99E-37.93E-313.41%(ω0=0.9)5m1.87E-11.86E-1-0.34%4.63E-24.63E-2-0.01%3.26E-33.08E-3-5.66%10m6.85E-26.72E-2-1.83%1.65E-21.64E-2-0.91%1.21E-31.28E-35.51%问题21m1.62E-11.62E-1-0.19%9.66E-49.94E-42.91%5.47E-55.47E-50.00%(ω0=0.2)5m2.27E-32.26E-3-0.28%1.37E-51.22E-5-10.87%6.24E-77.01E-712.27%10m1.30E-51.34E-52.83%7.28E-84.65E-8-36.08%4.02E-93.19E-9-20.69%问题31m2.30E-12.50E-18.79%4.34E-24.28E-2-1.28%3.13E-33.22E-32.94%(ω0随深25m1.62E-32.00E-323.56%2.86E-43.85E-434.73%2.12E-52.41E-513.79%度变化)60m5.23E-53.69E-5-29.38%5.13E-63.79E-6-26.11%3.57E-72.86E-7-20.01%问题41m3.23E-13.07E-15.26%7.13E-26.29E-213.30%5.63E-35.12E-39.98%(ω0=0.9)5m1.49E-11.46E-11.72%3.57E-23.47E-22.92%2.77E-32.70E-32.72%10m5.56E-25.53E-20.55%1.31E-21.30E-20.77%9.60E-49.80E-4-2.02%问题51m1.14E-11.11E-12.24%3.55E-22.92E-217.76%2.09E-32.49E-3-19.46%(ω0=0.9)5m4.33E-24.61E-2-6.57%1.22E-21.26E-2-3.53%7.43E-47.69E-4-3.56%10m1.48E-21.61E-2-8.85%3.65E-33.97E-3-8.90%2.49E-43.04E-4-22.23%问题61m1.62E-11.62E-1-0.14%9.81E-49.90E-40.93%6.84E-55.58E-5-18.40%(ω0=0.2)5m2.28E-32.28E-30.15%2.28E-32.30E-30.68%3.60E-43.44E-4-4.35%表4 两种计算环境下不同问题的CPU和GPU计算加速比Tab.4 Speedup ratio of different problems under two computer environments问题ω0加速比计算环境1计算环境210.93697910.2515113620.9123128350.2182741243z39356540.931550.986 9194960.2156936903、5、6z3446233、4、5、6z0.720.67z表示ω0随深度变化.加入大气模型及天空光之后,GPU加速没有明显提高运算速度,反而在一些情况下,计算效率降低. 问题4仅能达到几倍到十几倍的加速比,在考虑各种边界条件的复杂水下光场(问题3、4、5、6)模拟时,GPU运算反而降低了运行效率. 原因是在大气入射的上半球空间里,总入射光子数根据天空光的分布分配到每个quad(9*24)里,而在非直射方向quad里的光子数量较少,应用GPU加速反而降低了运行时间.3.3 不同水体散射特性下的加速性能从以上分析可以看出,在同一个标准问题中,ω0=0.2和ω0=0.9的运行时间相差很大. 因此,针对不同散射特性条件(ω0=0.1~0.9)下的Monte Carlo模拟的运行时间和效率进行了比较. 结果(图2)表明,两种计算环境下,CPU运行时间相差不大,而计算环境1的GPU运行时间大约为计算环境2的2倍,也就是计算环境2的加速比是计算环境1的2倍. 在同一计算环境下,水体从高吸收到高散射的过程中,CPU和GPU的运行时间呈指数增加. 在不同散射程度的水体,光子的寿命不同,在高吸收水体,光子存活时间较短. 因此,在总入射光子数一定的情况下,高吸收水体的运行时间会短,光子的利用率下降,导致模拟结果的噪声大于高散射水体.图2 问题2 (a)、5 (b)和6 (c)在两种计算机环境下的CPU和GPU运行时间及加速比(总光子数为106)随ω0的变化Fig.2 Computing time and speedup ratio vary with ω0 under two computer environments of problem 2 (a), problem 5 (b) and problem 6 (c)4 结论根据辐射传输理论,利用Monte Carlo模拟方法,开发了包括大气、水-气界面、层化水体、水底边界4大模块的水下光场模拟模型. 并利用Mobley等发表的海洋光学标准问题中的问题1~6对模型的精度进行验证. 引入GPU加速计算技术,使得水下光场Monte Carlo模拟的加速比得到大幅提高,一些简单问题的加速比可以达到几百到上千. 对于不同散射特性的水体,因为光子利用效率不同,需要加大模拟光子数来保证运行结果的准确性. 但是,对于包含大气模型和入射光场的水下光场Monte Carlo模拟方面,因为模型需要预先判断每个quad里的光子数,导致大量光子一起运算的并行特性被削弱,GPU并行加速的优势没有得到很好的体现. 以后研究中,将进一步解决大气入射光场耦合水下光场的Monte Carlo模拟模型的GPU加速问题.致谢:感谢中国科学院南京地理与湖泊研究所马荣华研究员提供的建议和帮助,以及可以应用GPU加速的工作站作为本文的计算环境2. 感谢美国University of Massachusetts Boston的Zhongping Lee教授对本研究的建议与帮助.5 参考文献[1] Plass GN, Kattawar GW. Monte Carlo calculations of light scattering from clouds. Applied Optics, 1968, 7(3): 415-419.[2] Plass GN, Kattawar GW. Radiative transfer in an atmosphere-ocean system. Applied Optics, 1969, 8(2): 455-466.[3] Gordon HR. Ship perturbation of irradiance measurements at sea. 1: Monte Carlo simulations. Applied Optics, 1985, 24(23): 4172-4182.[4] Kirk JTO. Monte Carlo study of the nature of the underwater light field in, and the relationships between optical properties of, turbid yellow waters. Marine and Freshwater Research, 1981, 32(4): 517-532.[5] Morel A, Gentili B. Diffuse reflectance of oceanic waters: its dependence on Sun angle as influenced by the molecular scattering contribution. Applied Optics, 1991, 30(30): 4427-4438.[6] Mobley CD, Sundman LK. Effects of optically shallow bottoms on upwelling radiances: Inhomogeneous and sloping bottoms. Limnology and Oceanography, 2003, 48(1): 329-336.[7] Mobley CD. Light and water: Radiative transfer in natural waters. New York: Academic Press, 1994.[8] Jin Z, Stamnes K. Radiative transfer in nonuniformly refracting layered media: atmosphere-ocean system. Applied Optics, 1994, 33(3): 431-442. [9] 何贤强, 潘德炉, 白雁等. 基于矩阵算法的海洋-大气耦合矢量辐射传输数值计算模型. 中国科学: D辑: 地球科学, 2006, (9): 860-870.[10] 张鉴, 何晓雄, 赵凤生. 利用大气-海洋系统辐射传输模拟水色遥感信息量的变化特性. 量子电子学报, 2003, (5): 623-628.[11] 何贤强, 潘德炉, 白雁等. 基于辐射传输数值模型PCOART的大气漫射透过率精确计算. 红外与毫米波学报, 2008, (4): 303-307.[12] 何贤强, 潘德炉, 白雁等. 海洋-大气耦合矢量辐射传输粗糙海面模型. 光学学报, 2010, (3): 618-624.[13] 凌在盈. 基于Monte Carlo方法的水体二向反射分布函数(BRDF)模拟[学位论文]. 杭州:浙江大学, 2010.[14] 曹文熙, 吴廷芳, 杨跃忠等. 光学浮标阴影效应的蒙特卡洛模拟. 高技术通讯, 2003,(3): 80-84.[15] 唐军武, 田国良, 陈清莲. 离水辐射非朗伯特性的Monte Carlo模拟及分析. 海洋学报: 中文版, 2000, (2): 48-57.[16] Plass GN, Kattawar GW, Guinn JJA. Radiative transfer in the earth’s atmosphere and ocean: influence of ocean waves. Applied Optics, 1975, 14(8): 1924-1936.[17] Fang Q, Boas DA. Monte Carlo simulation of photon migration in 3D turbid media accelerated by graphics processing units. Optics Express, 2009, 17(22): 20178-20190.[18] Preis T, Virnau P, Paul W et al. GPU accelerated Monte Carlo simulation of the 2D and 3D Ising model. Journal of Computational Physics, 2009, 228(12): 4468-4477.[19] Ren N, Liang J, Qu X et al. GPU-based Monte Carlo simulation for light propagation in complex heterogeneous tissues. Optics Express, 2010, 18(7): 6811-6823.[20] Wang Y, Li P, Jiang C et al. GPU accelerated electric field Monte Carlo simulation of light propagation in turbid media using a finite-size beam model. Optics Express, 2012, 20(15): 16618-16630.[21] Gregg WW, Carder KL. A simple spectral solar irradiance model for cloudless maritime atmospheres. Limnology and Oceanography, 1990,35(8): 1657-1675.[22] Mobley CD, Sundman LK. HydroLight 5-EcoLight 5 Technical Documentation. Sequoia Scientific, Inc, 2008.[23] Harrison AW, Coombes CA. An opaque cloud cover model of sky short wavelength radiance. Solar Energy, 1988, 41(4): 387-392.[24] Cox C, Munk W. Measurement of the roughness of the sea surface from photographs of the Suns Glitter. Journal of the Optical Society of America, 1954, 44(11): 838-850.[25] Mobley CD, Sundman LK, Boss E. Phase function effects on oceanic light fields. Applied Optics, 2002, 41(6): 1035-1050.[26] Mobley CD, Gentili B, Gordon HR et al. Comparison of numerical models for computing underwater light fields. Applied Optics, 1993, 32(36): 7484-7504.Accelerating Monte Carlo radiative transfer simulation of water using GPU techniqueDU Keping1 & XUE Kun2,3(1: State Key Laboratory of Remote Sensing Science, School of Geography, Beijing Normal University, Beijing 100875, P.R.China)(2: State Key Laboratory of Lake Science and Environment, Nanjing Institute of Geography and Limnology, Chinese Academy of Sciences, Nanjing 210008, P.R.China)(3: University of Chinese Academy of Sciences, Beijing 100049, P.R.China)Abstract:Radiative Transfer Equations (RTE) of water body are complex integro-differential equations, which can be solved by different numerical methods, e.g., Monte Carlo ray tracing, invariant imbedding, and discrete ordinates. Monte Carlo method is a powerful technique, which can be used in any water body, even those whose boundary conditions and inherent optical properties (IOPs) vary in three dimensions. However, the Monte Carlo method is computationally costly, which limits the use for many problems in optical oceanography. In this paper, a new kind of acceleration technology to accelerate the ocean radiative transfer simulation, using the CUDA-enabled graphics processing unit (GPU) is presented. With the approach’s help, it is easy to code on NVIDIA GPUs and there is no need to worry about the hardware details of a specific GPU. Firstly, some basic ideas of ocean radiative Monte Carlo simulation are introduced, then GPU programs for ocean radiative transfer simulation are implemented. Finally, the performances of the two GPUs (NVIDIA GTX 670GPU and NVIDIA Quadro 6000 GPU) with their CPU counterparts are compared. From our numerical results, the speedup over hundreds of times for solving the issues is achieved compared with that obtained using CPU.Keywords:Graphics processing unit (GPU); radiative transfer equation; Monte Carlo simulation; underwater light fieldJ. Lake Sci.(湖泊科学), 2016, 28(3): 654-660DOI:10.18307/2016.0322©2016 by Journal of Lake Sciences* 国家自然科学基金项目(41471284,41431176)、国家高技术研究发展计划“863”项目(2012AA12A303)和国家重点基础研究发展计划“973”项目(2013CB733403)联合资助. 2015-06-03收稿;2015-09-17收修改稿. 杜克平(1974~),男,博士,副教授;E-mail:************.cn.海洋光学7个标准问题中的基本问题假设为:(1)水体表面水平;(2)水体水平与垂向均一且无限水深;(3)不考虑天空光;(4)太阳光为点光源,天顶角为60°;(5)太阳光在其垂直表面上的辐照度为1 W/(m2·nm);(6)水体内部无Raman散射及内部光源存在;(7)假设水体为高散射(ω0=0.9)或者高吸收(ω0=0.2)水体两种情况;(8)水体散射包括水分子和颗粒物散射两部分. 表2是对问题1~6的简单描述,参照文献[26]中的表3,本文没有考虑问题7(Raman散射).利用GPU加速的水体辐射传输Monte Carlo模拟模型,对表2的6个问题分别进行水下光场模拟. 表3是入射光子数为107,不同标准问题、光学深度、ω0下的模拟结果(下行辐照度(Ed)、上行辐照度(Eou)和向上辐亮度(Lu))与Mobley等[26]的相应模拟结果的平均值(Ed_aver、Eou_aver和Lu_aver),以及它们之间的平均相对误差(δ)(式1),x分别为Ed、Eou和Lu.从对6个标准问题验证的结果(表3)可以得出,水体辐射传输模拟模型的精度基本达到了Mobley等的研究[26]中多个数值计算模型计算得到的平均值的精度范围. Ed、Eou比Lu的相对误差低,是因为Lu是由落入某个角度范围内少数光子计算得到的,受光子数目影响,稳定性差,而Eou与整个半球空间中的光子数有关,结果相对稳定. 在光学深度较大或强吸收水体存在误差较大的情况下(问题3,在60 m处模拟结果误差达到20%以上),是由于Monte Carlo方法本身存在噪声,复杂水体条件下假设的随机数较多,同样光子数的情况下,在强吸收水体噪声较大. 因此,欲得到较好的结果,在强吸收水体需要增加模拟的光子数以保证模拟精度. 对海洋光学基本问题及其组合边界条件下的CPU计算时间、GPU加速的运行时间和加速比进行统计,总光子数为106.通过GPU加速,在问题1和问题3中加速比为300~500,而问题2和问题6达到了1000多(表4),这表明GPU加速可以明显提高Monte Carlo算法的运行效率. 问题2(ω0=0.9)CPU计算需要2 d(173604 s/3600 s=48.22 h),而GPU加速之后只需要加入大气模型及天空光之后,GPU加速没有明显提高运算速度,2~3 min(142 s). 从CPU的每个光子依次计算,到GPU的许多光子同时在GPU中计算,节省了时间,大幅提高了运行效率. 与文献[26]中的表4中5个MC模型对问题3的计算时间进行比较,运行速度平均提高了236倍.加入大气模型及天空光之后,GPU加速没有明显提高运算速度,反而在一些情况下,计算效率降低. 问题4仅能达到几倍到十几倍的加速比,在考虑各种边界条件的复杂水下光场(问题3、4、5、6)模拟时,GPU运算反而降低了运行效率. 原因是在大气入射的上半球空间里,总入射光子数根据天空光的分布分配到每个quad(9*24)里,而在非直射方向quad里的光子数量较少,应用GPU加速反而降低了运行时间.从以上分析可以看出,在同一个标准问题中,ω0=0.2和ω0=0.9的运行时间相差很大. 因此,针对不同散射特性条件(ω0=0.1~0.9)下的Monte Carlo模拟的运行时间和效率进行了比较. 结果(图2)表明,两种计算环境下,CPU运行时间相差不大,而计算环境1的GPU运行时间大约为计算环境2的2倍,也就是计算环境2的加速比是计算环境1的2倍. 在同一计算环境下,水体从高吸收到高散射的过程中,CPU和GPU的运行时间呈指数增加. 在不同散射程度的水体,光子的寿命不同,在高吸收水体,光子存活时间较短. 因此,在总入射光子数一定的情况下,高吸收水体的运行时间会短,光子的利用率下降,导致模拟结果的噪声大于高散射水体.根据辐射传输理论,利用Monte Carlo模拟方法,开发了包括大气、水-气界面、层化水体、水底边界4大模块的水下光场模拟模型. 并利用Mobley等发表的海洋光学标准问题中的问题1~6对模型的精度进行验证. 引入GPU加速计算技术,使得水下光场Monte Carlo模拟的加速比得到大幅提高,一些简单问题的加速比可以达到几百到上千. 对于不同散射特性的水体,因为光子利用效率不同,需要加大模拟光子数来保证运行结果的准确性. 但是,对于包含大气模型和入射光场的水下光场Monte Carlo模拟方面,因为模型需要预先判断每个quad里的光子数,导致大量光子一起运算的并行特性被削弱,GPU并行加速的优势没有得到很好的体现. 以后研究中,将进一步解决大气入射光场耦合水下光场的Monte Carlo模拟模型的GPU加速问题.。
蒙特卡罗方法 (Monte Carlo simulation)

[0, )
• The random vector is uniformly distributed on the region [0,d)×[0,). Accordingly, it has probability density function 1/d. • The probability that the needle will cross one of the lines is given by the integral
2014-8-27
Monte Carlo模拟
18
4.Monte Carlo算法的主要组成部分
Monte Carlo算法的主要组成部分 概率密度函数(pdf) 必须给出描述一个物理系统的一组概率密度函数;
随机数产生器 能够产生在区间[0,1]上均匀分布的随机数 抽样规则 如何从在区间[0,1]上均匀分布的随机数出发,随机抽 取服从给定的pdf的随机变量;
p
2014-8-27
0
l sin
0
1 d
2l dAd d
Monte Carlo模拟 8
2.Monte Carlo方法简史 Enrico Fermi
• 1930年,利用Monte Carlo方法研究中子的扩散 • 并设计了一个Monte Carlo机械装置,Fermiac,用于计算核 反应堆的临界状态
2014-8-27
Monte Carlo模拟
12
Monte Carlo模拟
第一章 引言 (Introduction)
1. 2. 3. 4. Monte Monte Monte Monte Carlo方法 Carlo方法简史 Carlo模拟的应用 Carlo算法的主要组成部分
计算物理学_蒙特卡罗方法

第八讲蒙特卡罗方法蒙特卡罗(Monte Carlo简称MC)方法又称随机抽样法(Random Sampling)、随机模拟(Random Simulation)或统计试验法(Statistic Testing)。
这个方法的起源可以追溯到十七世纪或更早的年代。
Monte Carlo 是摩纳哥(Monaco)的一个著名城市,位于地中海之滨,以旅游赌博闻名。
Von Neumann 等人把计算机随机模拟方法定名为Monte Carlo方法,显然反映了这种方法带有随机的性质。
简单地说,MC方法是一种利用随机统计规律,进行计算和模拟的方法。
它可用于数值计算,也可用于数字仿真。
在数值计算方面,可用于多重积分、线性代数求解、矩阵求逆以及用于方程求解,包括常微分方程、偏微分方程、本征方程、非齐次线性积分方程和非线性方程等。
在数字仿真方面,常用于核系统临界条件模拟、反应堆模拟以及实验核物理、高能物理、统计物理、真空、地震、生物物理和信息物理等领域。
§8.l蒙特卡罗方法的基础知识8.1.1 基本概念为了对MC方法有一点初步的认识,请先看使用MC方法的几个例子。
蒲丰投针问题:蒲丰(Buffon-法国著名数学家)在1777年发现随机投针的概率与无理数π之间的关系.这个问题是说,若在平面上画有距离为a的平行线束,向平面上投掷长为()<的针,试求针与一平行线相交的概率。
l l a这个问题的解法如下:以M表示落下后针的中点,x表M与最近一平行线的距离,ϕ表针与此线的交角,见上图。
可见,02 0≤≤≤≤/,x a ϕπ这两式决定x ϕ平面上一矩形R ;为了使针与一平行线(这线必定是与针中点M 最近的平行线)相交,充分而且必要条件是2ϕ≤sin lx 这个不等式决定R 中一个子集G 。
因此,我们的问题等价于向R 中均匀分布地掷点而求点落于G 中的概率P.根据概率的几何意义,得222sin ()ld l P a a πϕϕππ==⎰此式提供了求π值的一个方法:可以通过投针事件求得针与平行线相交概率P ,求得π值:2/()l Pa π= (8.1)若投掷次数为m ,针与平行线相交的次数为n ,那么/p n m ≈即 2/()lm an π≈于是,可用投针试验来求无理数π的近似值.下表列举了历史上若干学者投针试验计算π值的结果:射击问题(打靶游戏):设r 表示射击运动员的弹着点到靶心的距离,()g r 表示击中r 处相应的得分数(环数),分布密度函数()f r 表示该运动员的弹着点分布,它反映运动员射击水平。
蒙特卡罗方法简介

第三章蒙特卡罗方法简介3.1 Monte Carlo方法简介Monte Carlo方法是诺斯阿拉莫斯实验室在总结其二战期间工作(曼哈顿计划)的基础上提出来的。
Monte Carlo的发明,主要归功于Enrico Fermi、Von Neumann和Stanislaw Ulam等。
自二战以来,Monte Carlo方法由于其在解决粒子输运问题上特有的优势而得到了迅速发展,并在核物理、辐射物理、数学、电子学等方面得到了广泛的应用。
Monte Carlo的基本思想就是基于随机数选择的统计抽样,这和赌博中掷色子很类似,故取名Monte Carlo。
Monte Carlo方法非常适于解决复杂的三维问题,对于不能用确定性方法解决的问题尤其有用,可以用来模拟核子与物质的相互作用。
在粒子输运中,Monte Carlo技术就是跟踪来自源的每个粒子,从粒子产生开始,直到其消亡(吸收或逃逸等)。
在跟踪过程中,利用有关传输数据经随机抽样来决定粒子每一步的结果[6]。
3.2 Monte Carlo发展历程MCNP程序全名为Monte Carlo Neutron and Photon Transport Code (蒙特卡罗中子-光子输运程序)。
Monte Carlo模拟程序是在1940年美国实施“发展核武器计划”时,由洛斯阿拉莫斯实验室(LANL)提出的,为其所投入的研究、发展、程序编写及参数制作超过了500人年。
1950年Monte Carlo方法的机器语言出现, 1963年通用性的Monte Carlo方法语言推出,在此基础上,20世纪70年代中期由中子程序和光子程序合并,形成了最初的MCNP程序。
自那时起,每2—3年MCNP更新一次, 版本不断发展,功能不断增加,适应面也越来越广。
已知的MCNP程序研制版本的更新时间表如下:MCNP-3:1983年写成,为标准的FORTRAN-77版本,截面采用ENDF /B2III。
第七章 蒙特卡罗方法.

满足如下关系:
F ( x ) = p(ξ ≤ x ) = ∫
−∞
f ( x )dx
(1)均匀密度分布函数
在区间[a,b] 均匀密度分布定义为
⎧ 1 a≤ x≤b ⎪ f ( x) = ⎨ b − a ⎪ x < a, x > b ⎩0
其中重要的特殊情况是 [0,1] 均匀密度分布:
⎧1 f ( x) = ⎨ ⎩0
存在
则函数
f ( x)
描写了
ξ
ξ
取值
x
的概率密度
f ( x ):随机变量
的概率分布密度
-0.6 0.5 f(v) 0.4 0.3 0.2 0.1 0 0
0.5
1
1.5
2 v/vp
2.5
3
3.5
4
概率密度函数的直方图: 处于平衡状态(温度T)N个粒子麦克斯韦速率
¾ 伪随机数(赝随机数): 是指按照某种算法可以给出的似乎随机地出现的数 具有一定的周期 设其周期为 n,则第 n+l 个数就等于第一个数,此后均依次重复出现。 当然,如果周期 n 足够大,可使在整个使用过程中不表现出其周期性。 例如:计算机中的伪随机数发出器要求其周期大于计算机的记忆单元数。 具有统计性质是表征随机数品质的另一重要指标。 9 总之,对随机数要求: 随机性+分布均匀
蒙特卡罗方法的基本思想:
A.直接蒙特卡洛模拟方法 • 对求解问题本身就具有随机性(宏观物理规律具有必然性):
例如: 等离子体放电,中子在介质中的传播,核衰变过程,电子在固体中的散射等 ----按照实际问题所遵循的概率统计规律,用计算机进行直接抽样试 验,然后计算其统计参数。
直接蒙特卡洛模拟法最充分体现出蒙特卡洛方法无可比拟的特殊性 和优越性,因而在物理学的各种各样问题中得到广泛的应用 ----“计算机实验”
monto carlo仿真方法

monto carlo仿真方法蒙特卡洛仿真方法简介蒙特卡洛仿真方法是一种基于随机数生成的统计模拟方法,用于解决复杂问题和评估不确定性。
它通过大量的随机抽样和模拟运算来近似计算数学问题的解决方案。
原理蒙特卡洛仿真方法基于概率统计理论和计算机模拟技术。
其主要思想是通过对模型中的随机变量进行抽样和模拟,计算大量的样本数据,从而得到目标问题的近似解。
步骤1.建立模型:首先需要将目标问题抽象成一个数学模型,明确问题的目标、约束和变量。
2.设定随机变量:为模型中的不确定变量设定随机分布,并生成大量的随机数。
3.进行抽样:根据设定的随机分布,抽取一定数量的随机数,并代入模型进行计算。
4.模拟运算:根据模型的计算规则,对每个随机数进行运算,得到相应的结果。
5.统计与分析:对得到的结果进行统计分析,得出问题的近似解、概率分布、置信区间等。
6.反馈与优化:根据分析结果,对模型进行优化和调整,进一步提高计算的准确性和效率。
应用领域蒙特卡洛仿真方法在各个领域都有广泛应用,包括但不限于: - 金融领域:用于风险评估、衍生品估值、投资组合优化等。
- 工程领域:用于可靠性分析、结构优化、系统建模等。
- 生物医学领域:用于药物研发、流行病传播模拟、生物统计等。
- 物理学领域:用于高能物理实验模拟、粒子轨迹模拟等。
优点与限制蒙特卡洛仿真方法具有如下优点: - 适用范围广,可以解决各种类型的问题; - 能够处理复杂和高维的问题; - 可以提供概率分布和置信区间等统计信息。
然而,蒙特卡洛仿真方法也有一些限制: - 需要大量的计算资源和时间; - 对模型中的不确定性敏感,需要合理设定概率分布; - 结果的准确性受到样本数量的限制。
总结蒙特卡洛仿真方法是一种基于随机数生成的统计模拟方法,可以解决复杂问题和评估不确定性。
它通过随机抽样和模拟运算来近似计算问题的解决方案。
该方法在多个领域都有广泛应用,同时也具有一定的优点和限制。
通过合理的模型建立和参数设定,蒙特卡洛仿真方法可以成为解决实际问题的有力工具。
计算机仿真的Monte_Carlo方法

2014-1-26 8
数学建模专题之计算机仿 真的Monte Carlo方法
2、数学仿真
数学仿真就是用数学模型使现象再现。表示现 象的部分或总体的基本方程和表示自然规律的数 学模型全是数学仿真。狭义地讲主要指的是数字 仿真。它是将复杂现象作出可以用数字计算机表 达的数学模型,从数值上进行各种实验。各种方 法随着计算机的进步已广泛地应用起来。因此, 所说的仿真主要是指数学仿真。 •数学仿真-基于模型的实验。
仿真就是利用物理的、数学的模型来类比、 模仿现实系统及其演变过程,以寻求过程规律的 一种方法。
仿真的基本思想是建立一个试验模型,这个模 型包含所研究系统的主要特点.通过对这个实验 模型的运行,获得所要研究系统的必要信息 仿真的基本思想是建立一个试验模型,这个模 型包含所研究系统的主要特点.通过对这个实验 模型的运行,获得所要研究系统的必要信息
2014-1-26
14
举例
数学建模专题之计算机仿 真的Monte Carlo方法
例1 在我方某前沿防守地域,敌人以一个炮排(含两门火炮) 为单位对我方进行干扰和破坏.为躲避我方打击,敌方对其阵地 进行了伪装并经常变换射击地点. 经过长期观察发现,我方指挥所对敌方目标的指示有50%是 准确的,而我方火力单位,在指示正确时,有1/3的射击效果能 毁伤敌人一门火炮,有1/6的射击效果能全部毁伤敌人火炮. 现在希望能用某种方式把我方将要对敌人实施的20次打击结 果显现出来,确定有效射击的比率及毁伤敌方火炮的平均值。 分析:这是一个概率问题,可以通过理论计算得到相应的概率 和期望值.但这样只能给出作战行动的最终静态结果,而显示不 出作战行动的动态过程. 为了能显示我方20次射击的过程,现采用仿真的方式。
MonteCarlo方法及其简单应用(图文)

MonteCarlo方法及其简单应用(图文)论文导读:本文介绍了Monte Carlo方法的思想,主要从在定积分计算方面介绍了随机投点法和平均值法,并将其推广到二重积分、三重积分和多重积分情形,最后以棋手分奖金问题介绍了Monte Carlo方法在古典概率问题中的应用.分析了误差,介绍了减少误差的方法. 给出这些方法的实例及其Mathematica实现程序.关键词:MonteCarlo方法,积分计算,古典概率,模拟1 引言Monte Carlo方法,源于第二次世界大战美国关于研制原子弹的“曼哈顿计划”.该计划的主持人之一、数学家冯·诺伊曼用驰名世界的赌城——摩纳哥的Monte Carlo——来命名这种方法,为它蒙上了一层神秘色彩.Monte Carlo方法的基本思想很早以前就被人们所发现和利用.19世纪人们用投针试验的方法来确定圆周率.20世纪40年代电子计算机的出现,特别是近年来高速电子计算机的出现,使得用数学方法在计算机上大量、快速地模拟这样的试验成为可能.Monte Carlo方法研究的问题大致可分为两种类型:一种是问题本身就是随机的,另一种本身属于确定性问题,但可以建立它的解与特定随机变量或随机过程的数字特征或分布函数之间的联系,因而也可用随机模拟方法解决.文[1]-[7] 介绍了Monte Carlo方法的思想,但没有给出具体的实例及实现过程。
发表论文。
本文介绍了MonteCarlo方法的思想,从计算定积分和古典概率两方面的应用进行研究,给出了实例及其Mathematica实现程序.2 Monte Carlo方法2.1 Monte Carlo方法思想概述Monte Carlo方法,有时也称随机模拟(RandomSimulation)方法或统计试验(Statistical Testing)方法.它的基本思想是:首先建立一个概率模型或随机过程,使它的参数等于问题的解;然后通过对模型或过程的观察、抽样来计算所求参数的统计特征;最后给出所求解的近似值,而解的精度可用估计值的标准误差来表示.假设所求的量是随机变量的数学期望,那么近似确定的方法是对进行重复抽样,产生相互独立的值的序列并计算其算术平均值:根据大数定理,当充分大时,以概率1成立,即可用作为的估计值.Monte Carlo方法以概率统计理论为基础,以随机抽样(随机变量的抽样)为手段,在很多方面有重要的应用.它的优点表现在三个方面:方法和程序的结构简单,易分析、易理解;收敛的概率性和收敛速度与问题的维数无关,很好的避免了维数问题;受问题条件限制的影响较小,很好的提高可行性.使用Monte Carlo方法的步骤如下:(l)构造或描述概率过程(2)实现从已知概率分布中抽样(3)建立各种估计量2.2 Monte Carlo方法的可行性从Monte Carlo方法的基本思想可以得到它通常的做法,利用数学或物理方法产生[0,1]中均匀分布的随机数,在变换得到任意分布的随机数.随机数个数很大时,可以由大数定理,求出事件的概率值.这种做法的可行性主要依据下面的事实:(1)如果随机变量的分布函数是,由于非降.对于任意的,(),可以定义:作为的反函数.我们考虑随机变量的分布,这里假定是连续函数,则对于有:(1)即服从上的均匀分布.(2)反之,如果服从上的均匀分布,则对于任意的分布函数,令,则:(2)因此是服从分布函数的随机变量.所以我们只要能够产生中均匀分布的随机变量的子样,那么通过(2)式我们就可以得到任意分布函数的随机变量的子样.再结合大数定理、就可以运用Monte Carlo方法进行随机模拟,解决一些实际的问题.3 Monte Carlo方法在定积分中的应用3.1随机投点法对于定积分.为使计算机模拟简单起见,设,有限,,令,并设是在上均匀分布的二维随机变量,其联合密度函数为.则是中曲线下方的面积(如图2).图2假设我们向中进行随机投点.若点落在下方(即)称为中的,否则称不中.则点中的概率为,若我们进行次投点,其中次中的.则可以得到的一个估计(3)该方法的具体计算步骤为:①独立地产生2个随机数,,i=1,…,n;②计算,,和;③统计的个数;④用(3)估计.例1 1777年,法国学者Buffon提出用试验方法求圆周率的值.原理如下:假设平面上有无数条距离为1的等距平行线,现向该平面随机地投掷一根长度为的针.则我们可以计算该针与任一平行线相交的概率.此处随机投针可以这样理解:针中心与最近的平行线间的距离x均匀地分布在区间上,针与平行线间的夹角(不管相交与否)均匀地分布在区间上(如图1).于是,针与线相交的充要条件是,从而针线相交概率为:图1而由大数定律可以估计出针线相交的概率,其中为掷针次数,为针线相交次数,从而圆周率.其mathematica实现语句见附录1.3.2 样本平均值法对积分,设是上的一个密度函数,改写(4)由矩法,若有个来自的观测值,则可给出的一个矩估计,这便是样本平均值法的基本原理.若,有限,可取.设是来自的随机数,则的一个估计为(5)该方法的具体计算步骤为:①独立地产生个随机数;②计算和,;③用(5)估计.后面将给出一个例子说明此方法的应用.4 Monte Carlo方法在计算多重积分中的应用方法一:(重积分)(7)其中为S维单位立方体,,在上有:.很明显.此时积分(5)可以看作为求维空间长方体V:的体积.即:(8)对于这种较为一般形式的多重积分计算问题,采用的还是随机投点.具体步骤如下:首先产生个随机数(i=1,2,…,)及,构造维随机向量,然后检验是否落后在V中,同理可以推论.检验是否成立,如果在构成的个随机向量中,有个随机向量落于V中,那么取作为积分的近似值,即,如果积分区域及被积函数不满足上述条件,那么可以通过变换便可达到所希望的条件.方法二:其中积分区域包含在维多面体中,此多面体决定于个不等式.设函数在内连续且满足条件:,是在维多面体中均匀分布的随机质点的个数,是在个随机点之中落入以维区域V为底以为顶之曲顶柱体内的随机点的个数.这里表示由不等式和决定的维多面体.则重积分的Monte Carlo近似计算公式为:=(9)例 2 在三维空间中,由三个圆柱面:,,围成一个立体,利用Monte Carlo方法求它的体积.分析:据题意,所求体积,其中{,,且,,}.记,,},考虑在空间内随机的产生个点,落在空间内有个,则.在Mathematica中模拟程序见附录2.5 在古典概率问题中的应用下面的例子说明了Monte Carlo方法在古典概率中的应用.例3 甲乙两位棋手棋艺相当,现他们在一项奖金为1000元的比赛中相遇,比赛为五局三胜制,已经进行了三局的比赛,结果为甲三胜一负,现因故要停止比赛,问应该如何分配这1000元比赛奖金才算公平?分析:平均分对甲欠公平,全归甲则对乙欠公平.合理的分法是按一定的比例分配.现在我们用计算机模拟两位棋手后面的比赛,是否就可以知道奖金分配方案.由于两位棋手的棋艺相当,可以假定他们在以下每局的比赛胜负的机会各半.Mathematica中函数产生随机数0或1,0与1出现的机会各占一半,可以用随机数1表示甲棋手胜,而随机数0表示乙胜.(也可以用中的随机实数来模拟两人的胜负,随机数大于0.5表示甲胜,否则乙胜)连续模拟1000次(或更多次数)每次模拟到甲乙两方乙有一方胜了三局为止.按所说方案分配奖金,1000次模拟结束后,计算两棋手每次的平均奖金,就是该棋手应得的奖金.模拟结果:甲:750,乙:250(程序见附录1)最终以甲分到;乙分到.即甲750元,乙250元.实际上,因为比赛只需进行两局.则可分出胜负.结果无非是以下四种情况之一:甲甲、甲乙、乙甲、乙乙.上面四种情况可看出,甲获胜的概率为,乙获胜的概率为.在Mathematica 中模拟程序见附录3.6 误差分析6.1 收敛性蒙特卡罗方法是由随机变量的简单子样的算术平均值:作为所求解的近似值.由大数定律可知,如独立同分布,且具有有限期望值(<∞),则.即随机变量的简单子样的算术平均值,当子样数N充分大时,以概率1收敛于它的期望值.6.2 误差蒙特卡罗方法的近似值与真值的误差问题,概率论的中心极限定理给出了答案.该定理指出,如果随机变量序列,,…,独立同分布,且具有有限非零的方差,即是的分布密度函数.则当N充分大时,有如下的近似式其中称为置信度,1-称为置信水平.这表明,不等式近似地以概率1-成立,且误差收敛速度的阶为.通常,Monte Carlo方法的误差ε定义为上式中与置信度α是一一对应的,根据问题的要求确定出置信水平后,查标准正态分布表,就可以确定出.关于蒙特卡罗方法的误差需说明两点:第一,蒙特卡罗方法的误差为概率误差,这与其他数值计算方法是有区别的.第二,误差中的均方差是未知的,必须使用其估计值来代替,在计算所求量的同时,可计算出.例4 求用平均值法估计圆周率,并考虑置信度为5%,精度要求为0.01的情况下所需的试验次数.解:易知,故考虑令~,令,其期望值为,因此=,其中是[0,1]区间上均匀分布的随机数.此时,,,,所以(次).6.3 减小方差的各种技巧显然,当给定置信度α后,误差ε由σ和N决定.要减小ε,或者是增大N,或者是减小方差.在固定的情况下,要把精度提高一个数量级,试验次数N 需增加两个数量级.因此,单纯增大N不是一个有效的办法.另一方面,如能减小估计的均方差σ,比如降低一半,那误差就减小一半,这相当于N增大四倍的效果.因此降低方差的各种技巧,引起了人们的普遍注意.一般来说,降低方差的技巧,往往会使观察一个子样的时间增加.在固定时间内,使观察的样本数减少.所以,一种方法的优劣,需要由方差和观察一个子样的费用(使用计算机的时间)两者来衡量.这就是蒙特卡罗方法中效率的概念.它定义为,其中c 是观察一个子样的平均费用.显然越小,方法越有效.总的来说,增大样本的值对计算机要求较高;减小方差的技巧都只具有指导思想上的意义.对于实际的计算问题,往往要求对涉及的随机变量有先验的了解,或者对发生的物理过程的性态有一定的认识.通过利用这些预知的信息采取相应的手段减小误差,提高精度.附录1.(1)n=1000;p={}Do[m=0;Do[x=Random[];y=Random[];If[x+y<=1,m++],{k,1,n}];AppendTo[p,N[4m/n]],{t,1,10}];Print[p];Sum[p[[t]],{t,1,10}]/10(2)n=10000;p={}Do[m=0;Do[x=Random[];y=Random[];If[x+y<=1,m++],{k,1,n}];AppendTo[p,N[4m/n]],{t,1,10}];Print[p];Sum[p[[t]],{t,1,10}]/10(3)n=100000;p={}Do[m=0;Do[x=Random[];y=Random[];If[x+y<=1,m++],{k,1,n}];AppendTo[p,N[4m/n]],{t,1,10}];Print[p];Sum[p[[t]],{t,1,10}]/102. n=1000;p={}Do[m=0;Do[x=Random[];y=Random[];z=Random[];If[x+y<=1&&x+z<=1&&y+z<=1,m++],{k,1,n}]; AppendTo[p,N[8m/n]],{t,1,10}];Print[p];Sum[p[[t]],{t,1,10}]/103. n=1000;p={}Do[m=0;Do[x=Random[Integer]+2;y=Random[Integer]+1;If[x>y,m++],{k,1,n}];AppendTo[p,N[m]],{t,1,20}]Print[m];{Sum[p[[t]],{t,1,20}]/20,1000-Sum[p[[t]],{t1,20}]/20}参考文献[1] 徐钟济.蒙特卡罗方法[M].上海:上海科学技术出版社,1985:171-188.[2] 茆诗松,王静龙,濮晓龙.高等数理统计[M].北京:高等教育出版社,2006:415-454.[3] 周铁,徐树方,张平文等.计算方法[M].吉林:清华大学出版社,2006:299-353.[4] 李尚志,陈发来,张韵华等.数学实验[M].北京:高等教育出版社,2004:23-30.[5] 王岩.Monte Carlo方法应用研究[J].云南大学学报(自然科学版),2006,28(S1): 23-26.[6] 薛毅,陈立萍.统计建模与R软件[M].北京:清华大学出版社,2008:476-485.[7] 杨自强.你也需要蒙特卡罗方法———提高应用水平的若干技巧[J]. 数理统计与管理, 2007,27(2):355-376.。
蒙特卡罗模拟

第八章Monte Carlo法§ 8.1 概述Monte Carlo法不同于前面几章所介绍的确定性数值方法,它是用来解决数学和物理问题的非确定性的(概率统计的或随机的)数值方法。
Monte Carlo方法(MCM),也称为统计试验方法,是理论物理学两大主要学科的合并:即随机过程的概率统计理论(用于处理布朗运动或随机游动实验)和位势理论,主要是研究均匀介质的稳定状态[1]。
它是用一系列随机数来近似解决问题的一种方法,是通过寻找一个概率统计的相似体并用实验取样过程来获得该相似体的近似解的处理数学问题的一种手段。
运用该近似方法所获得的问题的解in spirit更接近于物理实验结果,而不是经典数值计算结果。
普遍认为我们当前所应用的MC技术,其发展约可追溯至1944年,尽管在早些时候仍有许多未解决的实例。
MCM的发展归功于核武器早期工作期间Los Alamos (美国国家实验室中子散射研究中心)的一批科学家。
Los Alamos小组的基础工作刺激了一次巨大的学科文化的迸发,并鼓励了MCM在各种问题中的应用[2]-[4]。
“Monte Carlo ”的名称取自于Monaco (摩纳哥)内以赌博娱乐而闻名的一座城市。
Monte Carlo方法的应用有两种途径:仿真和取样。
仿真是指提供实际随机现象的数学上的模仿的方法。
一个典型的例子就是对中子进入反应堆屏障的运动进行仿真,用随机游动来模仿中子的锯齿形路径。
取样是指通过研究少量的随机的子集来演绎大量元素的特性的方法。
例如,f (x)在a :::x :::b上的平均值可以通过间歇性随机选取的有限个数的点的平均值来进行估计。
这就是数值积分的Monte Carlo方法。
MCM已被成功地用于求解微分方程和积分方程,求解本征值,矩阵转置,以及尤其用于计算多重积分。
任何本质上属随机组员的过程或系统的仿真都需要一种产生或获得随机数的方法。
这种仿真的例子在中子随机碰撞,数值统计,队列模型,战略游戏,以及其它竞赛活动中都会出现。
Monte-Carlo(蒙特卡洛方法)解析

常用的线性同余生成器
Modulus m 2^31-1
=2147483647
2147483399 2147483563
Multiplier a 16807
在 n 次中出现的频率。假如我们取 fn ( A) 作为 p P(A) 的估计,即 pˆ fn ( A) 。
然后取 ˆ
2l afn ( A)
作为
的估计。根据大数定律,当 n 时,
pˆ
fn ( A) a.s.
p.
从而有ˆ 2l P 。这样可以用随机试验的方法求得 的估计。历史上 afn ( A)
(2) 计算 X F -1(U ) ,则 X 为来自 F(x) 分布的随机数.
例 1 :设 X ~ U (a,b) ,则其分布函数为
0
F
(
x)
x b
a a
1,
xa a xb
xb
F -1( y) a (b a) y , 0 y 1
生成 U (0,1) 随机数 U,则 a (b - a)U 是来自
算法实现
许多程序语言中都自带生成随机数的方法, 如 c 中的 random() 函数, Matlab中的rand()函数等。 但这些生成器生成的随机数效果很不一样, 比如 c 中的函数生成的随机数性质就比较差, 如果用 c , 最好自己再编一个程序。Matlab 中的 rand() 函数, 经过了很多优化。可以产生性质很好的随 机数, 可以直接利用。
U (a,b) 的随机数。
例 2:
设 X ~ exp( ) 服从指数分布,则 X 的分布函数为:
蒙特拉罗方法

需要计算的积分为I = ∫ f ( x)dx ,积分I等于图中的面积G。
0
在图所示单位正方形内均匀地作投点试验,则随机点落在曲线下 面的概率为 1 f ( x) 1
Pr { y ≤ f ( x)} = ∫
0
∫
0
dydx = ∫ f ( x)dx
0
假设向单位正方形内随机地投入n个点(xi,yi)。如果有m个点落入
• 考虑平面上的一个边长为1的正方形及其内部 的一个形状不规则的“图形”,如何求出这个 “图形”的面积呢?Monte Carlo方法是这样一 种“随机化”的方法:向该正方形“随机地” 投掷N个点,若有M个点落于“图形”内,则 该“图形”的面积近似为M/N。
圆周率的值 π = 3. 14159 26535 89793 23846 26433 83279 50288 41971 69399 37510 58209 74944 59230 78164 06286 20899 86280 34825 34211 70679 82148 08651 32823 06647 09384 46095 50582 23172 53594 08128 48111 74502 84102 70193 85211 05559 64462 29489 54930 38196 44288 10975 66593 34461 28475 64823 37867 83165 27120 19091 45648 56692 34603 48610 45432 66482 13393 60726 02491 41273 72458 70066 06315 58817 48815 20920 96282 92540 91715 36436 78925 90360 01133 05305 48820 46652 13841 46951 94151 16094 33057 27036 57595 91953 09218 61173 81932 61179 31051 18548 07446 23799 62749 56735 18857 52724 89122 79381 83011 94912 98336 73362 44065 66430 86021 39494 63952 24737 19070 21798 60943 70277 05392 17176 29317 67523 84674 81846 76694 05132 00056 81271 45263 56082 77857 71342 75778 96091 73637 17872 14684 40901 22495 34301 46549 58537 10507 92279 68925 89235 42019 95611 21290 21960 86403 44181 59813 62977 47713 .....
三维随机粗糙海面的Monte-Carlo仿真

三维随机粗糙海面的Monte-Carlo仿真为了更好地观察海面的动态变化,我们进行了一次三维随机粗糙海面的Monte-Carlo仿真。
在这个仿真中,我们使用了蒙特卡罗方法来生成随机海浪,并且加入了更多的噪声和动态效果,使其更加真实。
下面将具体介绍这个仿真的实现过程。
首先,我们需要确定海浪的初始状态,包括起伏、速度等参数。
在这里,我们随机生成了一组数据,以模拟海面初始化时的情况。
在这些参数的基础上,我们使用蒙特卡罗方法来模拟海浪的变化过程。
为了模拟海浪的动态效果,我们加入了其他的噪声因素。
例如,我们模拟了海面上漂浮的小物体对海浪的影响,以及海浪受到风力的影响等。
这些噪声因素的加入,使仿真结果更加具有真实性。
除了模拟海浪的动态变化外,我们还模拟了海浪照射在物体表面的效果。
在这里,我们使用了渲染技术,将模拟得到的海浪效果渲染到物体表面上。
这个过程中,我们使用了光照和阴影效果来增强渲染效果,使得观看者能够更好地感受到海浪和物体之间的互动关系。
在这个三维随机粗糙海面的Monte-Carlo仿真中,我们不仅模拟了海浪的动态变化,还考虑了一些噪声和动态效果,使得仿真结果更加真实。
同时,我们也使用了渲染技术来呈现仿真效果,从而使得观看者更加直观地感受到海浪和物体之间的交互作用。
将仿真结果输出到视频中,可以更好地展示仿真的过程和效果。
在三维随机粗糙海面的Monte-Carlo仿真中,我们生成了大量的数据,包括海浪的起伏、速度、漂浮物体对海浪的影响以及海浪照射在物体表面的效果等。
下面我们将对这些数据进行分析,并进一步了解海浪的规律和特点。
首先,我们分析了海浪起伏的数据。
我们生成的海浪起伏数据分别为0.1、0.2、0.3和0.4米,并且在不同的时间点下进行了记录。
我们发现,海浪起伏随着时间的推移而变化,而同一时间点下,不同起伏高度的海浪之间有明显的区别。
高起伏的海浪更为峻峭,波浪起伏周期更短,而低起伏的海浪则更加平缓。
薄膜二维生长的 Monte Carlo 模拟

放映结束
请老师和同学们批评指正!
材料性质分析
建模及其模拟
模拟结果分析
图一 Monte Carlo 模拟的过程
二、薄膜二维生长理论
• 本模拟采用MonteCarlo方法模拟了二维平面上 粒子的单层膜的生长成膜情况。所考虑的成膜过程是大量 微观粒子在给定宏观约束条件下的集体行为,但就每一个 粒子的行为而言,则是随机的。结合粒子的随机运动,根据 过程的物理特性设定一些概率规则,理论模拟结果与实际 情况符合较好。 • 粒子在衬底上的运动可分为三种情况: • (1)吸附:粒子被吸附在衬底表面。在本模型中假设为物理 吸附; • (2)扩散:粒子在衬底上迁徙,粒子的扩散方向应使系统的 整体能量降低; • (3)蒸发:粒子获得一足够大的能量使其脱离衬底。 阵点所在的坐标处
• 3、考虑到衬底点阵原子势能的极小值应当 位于各阵点的正上方,所以落下的粒子只能 位于4个最近邻位置的某个阵点所在的坐标 处,而不会落在阵点之间的位置。当新位置 的能量高于原来位置的能量时,新位置就有 一定的概率被接受。
图3 沉积粒子及其4个最近邻位置
模拟结果图像
N=100
N=400
N=700
模拟结果图像
N=1000
N=1300
N=1700
模拟结果图像
N=4000
N=5000
N=8000
图 12 成团粒子数占沉积粒子数的百分比ρc随沉积粒子数N 变化规律
四、薄膜二维生长的 MC 模拟的结果分析
• 结 论
• 1 用计算机模拟研究了薄膜生长机理,给出了微观 生长过程的详细图像. • 2 在考虑Morse势等相互作用范围影响,这 次粒子扩散及薄膜的形貌,薄膜趋向于成团生长. • 3 得到的成团粒子数――沉积粒子数N图像有上 升趋势,此趋势说明了随着沉积粒子的增加多层生 长所占比重逐渐增加,这更符合实际情况. • 4此次薄膜二维生长的计算模拟课题在我们小组 成员的通力合作下得以顺利完成。同时得到了江 老师的指导。在此表示衷心的感谢!
基于Monte Carlo的光学分子影像仿真平台并行化设计的开题报告

基于Monte Carlo的光学分子影像仿真平台并行化设计的开题报告一、选题背景随着计算机技术的快速发展,计算机模拟已经成为科学研究的重要手段。
在医学领域,光学分子成像技术已经成为一种新型的生物医学成像技术,用于可视化组织内部分子分布与定量生物标志物分析。
其中,Monte Carlo(MC)方法是一种常用的光学分子影像仿真方法,可以模拟光子在组织中传输、散射和吸收的过程。
MC方法的主要优点是可以考虑复杂的光学介质结构和不均匀性,并且可以在不同的时间和不同的角度进行仿真。
然而,由于光学分子影像仿真问题的复杂性和计算量的巨大性,运行时间往往非常长,远远超出了单个CPU的计算能力。
因此,采用并行计算技术可以有效地加速MC方法的运行速度。
近年来,随着计算机硬件和软件技术的不断发展,越来越多的研究人员开始采用并行计算方法来加速Monte Carlo光学分子影像仿真。
二、研究目的、内容和方法本研究的目的是设计并实现一个基于Monte Carlo的光学分子影像仿真平台的并行化方法,以便其能够在分布式计算环境下高效地进行计算。
具体的,本研究的内容包括以下方面:(1)分析并评估不同的并行计算技术,如MPI和OpenMP,并选择合适的技术来实现本平台的并行化设计;(2)分析并评估不同的任务分配策略,以实现任务的均衡分配,优化并行化效果;(3)设计并实现一个数据平行化的方法,以便在计算时能够高效地处理大量数据;(4)对并行化Monte Carlo光学分子影像仿真进行测试和评估,以验证并行化的效果和准确性;(5)撰写开题报告,并撰写论文。
本研究的方法主要包括理论分析、算法设计、系统开发和测试验证等环节。
具体的,本研究将使用C++语言来实现基于Monte Carlo的光学分子影像仿真平台,并采用MPI和OpenMP技术来实现并行计算。
三、论文结构和进度安排本文的结构安排主要包括引言、相关工作综述、基于Monte Carlo的光学分子影像仿真平台的并行化设计、实验结果分析和总结等5个部分。
植被遥感的MonteCarlo模拟研究

[ 3]
26
[ 4, 5]
地 理 科 学 进 展 19 卷
[ 6]
拟 。Smit h 和 Oliver 用蒙特卡罗方法模拟了植被冠层的直接反射随角度的变化特征 , 其从冠层的几何测量中获得每一层的叶子倾角概率分布 , 并用辛普生原则获得累计概率分 布 , 以 Idos 和 de Wit 的孔隙率模型[ 7] 来计算光子入射、 出射时与各层叶子的相互作用概率 , 然后产生随机数与这一概率作比较来判断光子是进入孔隙还是与叶子相碰撞 : 若与叶子相 撞 , 则叶子的法向用叶子倾角分布函数和均匀分布的方位角来确定, 这两个参数也确定了 光子方向和叶子的夹角 ; 若光子穿过孔隙则进入下一层 , 若光子穿过所有叶层则射到土壤 表面并被反射到叶层; 若光子越出冠层上届, 或光子的能量小于某一阈值就死亡。作者对 叶子反射光子的处理上采用非朗伯体处理。 Szw archbaum 等用更严格的蒙特卡罗方法来估 计冠层中的辐射规律 , 即跟踪一束光穿过冠层的路径 ( 包括叶面散射、反射等 ) , 本方法 已经用于 P AR 辐射规律研究。 Kanevski 和 Ross 用蒙特卡罗方法计算了针叶林的 BRDF, 并在模拟中考虑了诸如高 度、角度、纹理数 ( 尺度) 、密度等冠层结构信息, 模拟结果表明了热点的亮度和形态及其 与冠层结构的相关性[ 9] 。 Kimes 等在三维空间冠层模拟光子从生到死的过程中, 将冠层空间 划分为基本单元, 并指定光子的碰撞概率, 以及假设叶子表面的反射为朗伯体特性[ 10] 。 Gerst l 等提出了简单的三维蒙特卡罗光子跟踪模型 , 并用二维模型以叶子尺度为函数来模 拟热点分布 。 Ross 等用蒙特卡罗方法来模拟了植被冠层的双向反射特性, 在模型中考虑 了 树冠高度、冠间距离、树冠面积密度、以及叶长、叶宽、叶子大小、叶倾角分布函数 ( L AD) 、叶面积指数 ( L AI) 及土壤反射率等参数对植被反射的影响 , 尤其是对热点的影 响[ 12 ] 。 Ant yuf eev 等用蒙特卡罗方法模拟了植被冠层的反射率[ 13] 。 Nor th 也用蒙特卡罗方法 模拟了三维离散林冠的双向反射特性 。他定义了描述森林宏观结构的形态、大小、重叠 等参数 , 树冠位置直接由单个树冠的统计模式来确定, 单个树冠的结构参数由叶密度、角 度分布、大小、反射和透射的光学特性来近似描述 , 冠层内部这些参数是均匀的 , 但冠间 可以变化。在判断光子是否射出树冠时, 作者通过比较光子距树冠边界的距离和自由路径 来决定 ; 在光子的碰撞概率方面 , 作者采用了 Jupp 等人的重叠函数 ; 光子单次散射后的 强度用原来的光子强度和向某一新方向散射的条件概率的乘积来获得, 光子散射相位函数 采用 Ro ss 的双朗伯体模型[ 16] , 这和 Anty uf eev 等的做法有点类似。若光子从某一角度射 出 , 则累计这一方向的光子强度 , 否则重复碰撞过程直到光子强度小于一阈值。 以上所述, 蒙特卡罗方法已经大量用于可见光和近红外遥感中植被冠层的 BRDF 和热 点效应的模拟 , 但目前还未见到蒙特卡罗用于植被冠层热辐射特性的报道。从原理上 , 热 辐射过程从微观上可以描述为以量子形式的辐射传输和散射过程 , 植被冠层的热辐射过程 完全可以视为光子在冠层介质中随机输运过程 , 也可用植被的水平冠层透射理论来建立冠 层对辐射的阻截模型。但在机理上和可见光、近红外中的模拟有一定区别, 即热红外辐射 中 , 冠层组分既是辐射的阻截体 ( 对其底层的土壤辐射和底层植被辐射的阻截 ) , 其自身又 是辐射体。笔者采用蒙特卡罗方法模拟了冠层热辐射在天顶角方向上的变化 , 模拟结果得 到了野外实验数据的验证 。
蒙特卡洛方法[知识研究]
![蒙特卡洛方法[知识研究]](https://img.taocdn.com/s3/m/6fa4aa45b7360b4c2e3f64ae.png)
蒙特卡洛(Monte Carlo) 模拟方法
资料类
1
这一方法源于美国在第二次世界大战研制原子弹的"曼哈顿计划"。
建立模型要具体问题具体分析
资料类
14
物理模拟通常花费较大、周 期较长,甚至无法进行
模拟: 建立一个试验模型,这个模型包含所研究系 统的主要特点.通过对这个实验模型的运行, 获得所要研究系统的必要信息
现代的数学模拟都是在计算机上进行的,称 为计算机模拟。
资料类
15
接下来,跳过第二步利用计算机产生随机数的过程, 直接进行对随机数(样本)的统计分析。
资料类
16
蒙特卡洛模拟的理论基础与模拟结果的误差
大数定律
中心极限定理
对此,我们只对更强一些的中心极限定
理展开讨论,将概率论中所学的理论 “机械”的移植过去就行!
资料类
17
中心极限定理
n
Xk
n
lim P k1
x
n
n
1
x t2
e 2 dt
2
满足(1):独立同分布
(2) E( X k ) , D( X k ) 2 0 , k 1,2,
Monte-Carlo, Monaco
资料类
3
但是——
蒙特卡洛模拟方法并不是什么神秘的东西,只 是基于概率论而生的一种算法。其中的大部分 内容概率论都已经涉及。
资料类
4
所谓蒙特卡洛方法,简单地说就是将问题 转化成一个概率问题.并用计算机模拟产 生一堆随机数据,之后就是对随机数据的 统计工作了!
基于米氏理论的蒙特卡洛光学相干层析成像系统模拟研究

第4期
黄亚达等: 基于米氏理论的蒙特卡洛光学相干层析成像系统模拟研究
·51·
2. 3 米氏理论
米氏理论是计算经小球散射后的电磁场的解析解的理论[ 7] 。样品是一个悬浮着很多小球的均匀介质。
这种物理模型与大多数悬浊液以及 OCT 仿真实验中经常采用的聚乙烯小球水溶液等高散射介质完全一
生物组织是一种高散射介质。研究光在高散射介质中的传输的光学特性及光强的分布对于许多医学 应用都有重要意义[ 3] 。最早人们想通过蒙特卡洛方法来模拟光在高散射介质中的随机过程, Wang L H 在
收稿日期: 2004-11-29 基金项目: 国家自然科学基金资助项目( 60372032) 作者简介: 黄亚达( 1980-) , 男, 浙江杭州人, 硕士生, 主要从事光学相干成像系统方面的研究。
( 5)
由( 5) 式可以知道散射后的光强在空间的分布, 易知光子出现在某个方向的概率与这个方向的光强成正
比, 所以可以定义 和 的概率密度函数
∫ P ( , ) =
I( , ) I ( , ) d!
=
m11(
)I0 +
m 12(
) [ Q 0cos( 2 ) + C
U 0 sin( 2 ) ]
( 6)
( 浙江大学现代光学仪器国家重点实验室 光及电磁波研究中心, 浙江 杭州 310027)
摘要: 光学相干层析成像( optical coherence t om ography , OCT ) 是近年来快速发展的 一种生物组织高分辨力实时成像技术。由于生物组织的复杂性, 故一直没有完美的 OCT 理 论模型。现利用结合米氏理论( Mie t heory ) 的蒙特卡洛算法研究光在生物组织( 高散射介 质) 内的行为, 并以此为基础建立了一种 OCT 理论模型。然后利用该模型模拟重建了多层 介质的图像, 分析了空间滤波和偏振光对图像质量的影响, 获得了较理想的结果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
a rXiv:as tr o-ph/993478v131Mar1999BA–99–33March 1999SOPHIA Monte-Carlo simulations of photohadronic processes in astrophysics A.M¨u cke 1,Ralph Engel 2,J.P.Rachen 3,4,R.J.Protheroe 1and Todor Stanev 2Abstract A new Monte Carlo program for photohadronic interactions of relativistic nucleons with an ambient photon radiation field is presented.The event generator is designed to fulfil typical astrophysical requirements,but can also be used for radiation and background studies at high energy colliders such as LEP2and HERA,as well as for simulations of photon induced air showers.We consider the full photopion production cross section from the pion production threshold up to high energies.It includes resonance excitation and decay,direct single pion production and diffractive and non–diffractive multiparticle production.The cross section of each individual process is calculated by fitting experimental data,while the kinematics isdetermined by the underlying particle production process.We demonstrate that our model is capable of reproducing known accelerator data over a wide energy range.PACS:13.85.Tp,13.60.-r,13.60.HbKeywords:photon-hadron interactions,resonance production,resonance decayphotoproduction cross section,Monte Carlo event generator,multiparticle production1Program SummaryTitle of program:SOPHIA2.0Catalog number:Program obtainable from A.M¨u ckee-mail:amuecke@.au Computer on which the program DEC-Alpha and Intel-Pentium based has been thoroughly tested:workstationsOperating system:UNIX,Linux,Open-VMSProgramming language used:FORTRAN77Memory required to execute<1megabyteNo.of bits in a word64Has the code been vectorized?noNumber of lines16500in distributed program:Other programs used in SOPHIA Rndmin modified form Processor independent random numbergenerator based on Ref.[1]Jetset7.4Lund Monte Carlo forjet fragmentation[2]DECSIBSibyll routine which decaysunstable particles[3]Nature of physical problem:Simulation of minimum bias photo-production for astrophysical applications2Method of solution:Monte Carlo simulation of individual eventsfor given nucleon and photon energies,photon energies are sampledfrom various distributions.Restrictions on the complexity Incident ambient photonfields limitedof the problem to power law and blackbody spectra so far.No tests were done for center-of-mass√energies2IntroductionThe cosmic ray spectrum extends to extremely high energies.Giant air showers have been observed with energy exceeding≃1011GeV[4,5].Energy losses due to interactions with ambient photons can become important,even dominant for such energetic nucleons,above the threshold for pion production.Photoproduction of hadrons is expected to cause a dis-tortion of the ultra-high energy cosmic ray(CR)spectrum by interactions of the nucleons with the microwave background(the Greisen-Zatsepin-Kuzmin cutoff[6,7];see also[8]for additional references),but it may also be relevant to the observed high energy gamma ray emission from jets of Active Galactic Nuclei(AGN)(e.g.[9,10])or Gamma-Ray Bursts (GRB)[11].Moreover,it is the major source process for the predictedfluxes of very high energy cosmic neutrinos(e.g.[8,12,13,14,15,16]).The photohadronic cross section at low interaction energies is dominated by the∆(1232) resonance.Since the low energy region of the cross section is emphasized in many astrophys-ical applications,the cross section and decay properties of the prominent∆-resonance have often been used as an approximation for photopion production,and the subsequent produc-tion of gamma rays and neutrinos[17,18].As discussed in[19,20],this approximation is only valid for a restricted number of cases,and does not describe sufficiently well the whole energy range of photohadronic interactions.A more sophisticated photoproduction simula-√tion code is needed to cover the center-of-mass energy range of aboutimulations O hoto H nteractions in AThe relevant conversion constant is (¯h c )2=389.37966GeV −2µbarn.3The physics of photohadronic interactions 3.1Kinematics of N -γcollisionsThere are three reference frames involved in the description of an astrophysical photohadronicinteraction:(i)the astrophysical lab frame (LF),(ii)the rest frame of the nucleon 5(NRF),and (iii)the center-of-mass frame (CMF)of the interaction.For example,in the LF,the initial state can be characterized by the nucleon energy E N ,the photon energy ǫ,and the interaction angle θcos θ=( p N · p γ)/βN E N ǫ.(1)where p N and p γdenote the nucleon and photon momenta.The Lorentz factor is γN =E N /m N =(1−β2N )−1/2with m N being the nucleon mass.The corresponding quantities inthe NRF and CMF are marked with a prime (′)and an asterisk (∗),respectively.Fixed target accelerator experiments where a photon beam interacts with a proton target are performed in the NRF.In astronomical applications we assume that the LF can be chosen such that a the photon distribution function is isotropic.The LF may therefore be different from the astronomical observer’s frame if,for example the emission region is moving relative to the observer such as in AGN jets or GRB.The interaction rate of the nucleon in the LF is given by R (E N )=1ǫ2 s max s thds (s −m 2N )σNγ(s ),(2)where σNγis the total photohadronic cross section ands =m 2N +2E N ǫ(1−βN cos θ)=m 2N +2m N ǫ′,(3)is the square of the center-of-mass energy.The lowest threshold energy for photomeson production is√5In the following the subscript N is used if no distinction between protons and neutrons is made.Inter-actions for both protons and neutrons are implemented in SOPHIA.5can be chosen to be distributed isotropically since we consider only the scattering of unpo-larized photons and nucleons,all other variables are determined by the interaction physics through the differential cross sections.A distinguished role in thefinal state is played by the“leading-baryon”,which is considered to carry the baryonic quantum numbers of the incom-ing nucleon.For this particle,the Lorentz invariant4-momentum transfer t=(P N−Pfinal)2 is often used as afinal state variable.At small s,many interaction channels can be reducedto2-particlefinal states,for which dσ/dt gives a complete description.3.2Interaction processesPhoton-proton interactions are dominated by resonance production at low energies.The in-coming baryon is excited to a baryonic resonance due to the absorption of the photon.Such resonances have very short life times and decay immediately into other hadrons.Conse-quently,the Nγcross section exhibits a strong energy dependence with clearly visible reso-nance peaks.Another process being important at low energy is the incoherent interaction ofphotons with the virtual structure of the nucleon.This process is called direct meson pro-√duction.Eventually,at high interaction energies(s√th≈1.08GeV forγN-interactions up to4πbγ(2J+1)sΓ2(s−m2N)2the angular distribution of thefinal state is given bydσNπ2,λd Jλ,12,λare the Nπ-helicity amplitudes.The functions d Jλ,12and A32,as forthe unexcited nucleon)and∆-resonances(I=32).In contrast to the strongdecay channels,the electromagnetic excitation of the resonance does not conserve isospin. Hence,the resonance excitation strengths for pγand nγinteractions are not related to each other by isospin symmetry and have to be determined experimentally.Table1:Isospin(charge)branching ratios for the decay of a resonance with isospin I res and charge I3+12,and a meson of isospin1(πorρ).For example,the decay N+→∆++π−corresponds to I res=12,I3=12.b iso=I Bf=3/2(B f=∆)∆I3=0∆I3=01/21/61/31/23/28/151/152/53.2.2Direct pion productionDirect pion production can be considered as electromagnetic scattering by virtual charged mesons,which are the quantum–mechanical representation of the(color-neutral)strong force7field around the baryon.The interacting virtual meson gains enough momentum to mate-rialize.Experimentally the direct production of charged pions is observed as a relatively structureless background in the Nπ±and ∆π±final states in photon-nucleon interactions.In terms of Feynman graphs,this process is represented by the t -channel exchange of a meson.Here,t is the squared 4-momentum transfer from the initial to the final state baryon.The graph has a strong vertex at the baryon branch and an electromagnetic vertex for the photon interaction.At the strong vertex,the baryon may be excited and change its isospin.Isospin combination rules determine the iso-branching ratios in the same way as for resonance decay (Table1forI res =1dt∝exp(b dir t ).(7)with an experimentally determined slope of b dir ≈12GeV −2[24].The total cross section for a direct scattering process is roughly ∝m −2t ,where m t is the (nominal)mass of the exchanged virtual particle.Therefore,the direct production of pions is dominant,while the contributions from the exchange of heavier mesons are suppressed.The same applies to direct reactions which involve the exchange of a virtual baryon (u -channel exchange).However,with increasing energy,more and more channels add to the direct cross section,and this makes an explicit treatment difficult.3.2.3High energy processesPhenomenologically,high energy interactions can be interpreted as reggeon and pomeron exchange processes.Both the reggeon and the pomeron are quasi-particles which correspond to sums of certain Feynman diagrams in the Regge limit (|t |≪s )[23].The cross sections for reggeon and pomeron exchange have different but universal energy dependences and account for all of the total cross section [25]at high energy.There are many different Regge theory-based cross section parametrizations possible.Here we use a recent cross section fit [22]based on the Donnachie-Landshoffmodel [25]σreg ∝ s −m 2ps 0 0.095,(8)with the reference scale s 0=1GeV 2.Concerning high energy processes,it is convenient to distinguish between diffractive and non-diffractive interactions.Diffractive interactions are characterized by the production of8very few secondaries along the direction of the incoming particles.They correspond to the quasi-elastic exchange of a reggeon or pomeron between virtual hadronic states the photon (mainly the vector mesonsρ0,ω,andφ)and the nucleon.Because of the spacelike nature of the interaction,the angular distribution is strongly forward peaked,and can be parametrized by Eq.(7)with an energy-dependent slope b diff=6GeV−2+0.5GeV−2ln(s/s0)[24].At high energies,the cross section of diffractive interactions is approximately a constant fraction of the total cross section.The relative contribution of the different vector mesons is predicted by theory[26]toρ0:ω=9:1.The diffractive production ofφor heavier mesons is neglected in SOPHIA.Our treatment of non-diffractive multiparticle production is based on the Dual Parton Model[27].This model can be considered as a phenomenological realization of the expansion of QCD for large numbers of colors andflavours[28,29]in connection with general ideas of Duality and Gribov’s Regge theory[30,31].It provides a well developed basic scheme for the simulation of high energy hadronic interactions.The model can be visualized as follows: (i)the incoming nucleon and photon are split into colored quark and diquark constituents, (ii)in the course of the interaction these constituents exchange color quantum numbers,and (iii)confinement and the colorfield forces result in color strings which fragment to hadrons.To relate the contributions of reggeon and pomeron exchange to parton configurations, we use the correspondence of their respective amplitudes to certain colorflow topologies[32] which are shown in Figs.1and2.The pomeron exchange topology involves the formation of two color neutral strings,while in case of a reggeon topology only one string is stretched from the diquark to the quark of the photon.The quark and diquarkflavors at the string ends are determined by the the spin and valenceflavor statistics for the nucleon.For photons the charge difference between u and d quarks increases the probability that the photon couples to a u-¯u pair instead of a d-¯d pair.In the model we use the theoretically predicted ratio of 4:1between these two combinations.The longitudinal momentum fractions x,1−x of the partons connected to the string ends are given by Regge asymptotics[33,34,35,36].One gets for the valence quark(x)and diquark(1−x)distribution inside the nucleonρ(x)∼1x(1−x)1.5(9)and for the quark antiquark distribution inside the photonρ(x)∼1x(1−x).(10)The relatively small transverse momentum of the partons at the string ends are neglected.In the string fragmentation process,the kinetic energy of the initial partons is reduced by creating new quark-antiquark pairs which are colorfield-connected to the parent partons.9a)b)qq qq qqq q qqFigure 1:Color flow picture of (a)a pomeron exchange graph and (b)the final state topologyqqq q q q qqa)b)Figure 2:Color flow picture of (a)a reggeon exchange graph and (b)the final state topology This process continues until the available kinetic energy drops below the particle production threshold causing the newly produced quarks to combine with the valence quarks to form hadrons (see,for example,[37]).4ImplementationIn this section,all numerical expressions for cross sections are measured in units of µbarn,unless noted otherwise.4.1Method of cross section parametrizationThe basic models of photohadronic interaction processes described in Sect.3are used to ob-tain robust theoretical predictions used for the parametrization of cross sections and final10state distribution functions.For theoretically unpredictable parameters we use,if possible, the estimates given in the Review of Particle Properties(RPP)[22].Remaining parameters are determined infits to available exclusive and inclusive data onγp andγn interactions, as compiled in standard reference series([38],and references therein).Since the parameters published in the RPP generally allow some variations within a given error range,these pa-rameters are then optimized in comparison to data in an iterative process,until a reasonable agreement with the data for a large set of interaction channels is obtained.This method has been previously described by Rachen[19],but was considerably im-proved in the development of SOPHIA.It provides a minimum bias description of photo-production,which reproduces a large set of available data while reducing a possible bias due to data selection,since data are used only tofix model parameters.Considering the in-tended applications of SOPHIA for(i)astrophysical applications and(ii)the determination of background spectra in high energy experiments,we put particular emphasis on a good representation of inclusive cross sections and averagefinal state properties in a wide range of interaction energies,while a good representation of complex exclusive channels is generally not expected.4.2Resonance productionUsing Eq.(4),the contribution to the cross section from a resonance with mass M and width Γcan be written as a function of the NRF photon energyǫ′asσ(ǫ′)=s(s−M2)2+Γ2s.(11)The reduced cross sectionσ0is entirely determined by the resonance angular momentum and the electromagnetic excitation strength bγ.We selected all baryon resonances listed in the RPP with certain existence(overall status:****)and a well determined minimal photo–excitation strength of bγ>10−4for either the pγor the nγexcitation.The resonances fulfilling these criteria and their parameters,as implemented in SOPHIA after iterative op-timization,are given in Table2.The phase-space reduction close to the Nπthreshold is heuristically taken into account by multiplying Eq.(11)with the linear quenching function Qf(ǫ′;0.152,0.17)for the∆(1232)-resonance,and with Qf(ǫ′;0.152,0.38)for all other reso-nances.The function Qf(ǫ′;ǫ′th,w)is defined in Appendix A.The quenching width w has been determined from comparison with the data of the total pγcross section,and of the ex-clusive channels pπ0,nπ+and∆++π−where most of the resonances contribute.The major hadronic decay channels of these baryon resonances are Nπ,∆π,and Nρ;for the N(1535), there is also a strong decay into Nη,and the N(1650)contributes to theΛK channel.The hadronic decay branching ratios b c are all well determined for these resonances and given in the RPP.However,a difficulty arises from the fact that branching ratios can be expected to be energy dependent because of the different masses of the decay products in different11Table2:Baryon resonances and their physical parameters implemented in SOPHIA(see text).Superscripts+and0in the parameters refer to pγand nγexcitations,respectively. The maximum cross section,σmax=4m2N M2σ0/(M2−m2N)2,is also given for reference.resonance MΓ103b0γσ00σ0max5.631.125411.9880.5 1.3897.1244.625.567103.2402.5 6.94827.2441.02.7797.4080.00.0000.0002.117.50846.1432.011.11628.6440.2 1.667 2.8691.011.11617.433s<m∆+mπ≈1.37GeV.To accommodate this problem,we have developed a scheme of energy dependent branching ratios,which change at the thresholds for additional decay channels and are constant in between.The requirements are that(i) the branching ratio b c=0forǫ′<ǫ′th,c,and(ii)the average of the branching ratio over energy,weighted with the Breit-Wigner function,correspond to the average branching ratio given in the RPP for this channel.For all resonances,we considered not more than three decay channels leading to a unique solution to this scheme.Nofits to data are required.In practice,however,the experimental error on many branching ratios allows for some freedom, which we have used to generate a scheme that optimizes the agreement with the data on different exclusive channels.The hadronic branching ratios are given in Tab.4in Appendix B.To obtain the contri-bution to a channel with given particle charges,e.g.∆++π−,the hadronic branching ratio b∆πhas to be multiplied with the iso-branching ratios as given in Tab.1.We note that with the parameters bγ,b c and b iso,the resonant contribution to all exclusive decay channels is completely determined.The angular decay distributions for the resonances follow from Eq.(6).In SOPHIA,the kinematics of the decay channels into Nπis implemented in full detail(see Tab.3).For other decay channels,we assume isotropic decay according to the phase space.Furthermore,there12might be some mixing of the different scattering angular distributions since the sampled resonance mass,in general,does not coincide with its nominal mass.This effect is neglected in our work.Instead,we use the angular distributions applying to resonance decay at its nominal mass M.Table3:Angular distribution probability functions for Nπdecay of resonances considered in SOPHIA.The resonances N(1535),N(1650)and N(1440)decay isotropically.resonance∆(1232)0.673669−0.521007cos2χ∗N+(1520)0.254005+1.427918cos2χ∗−1.149888cos4χ∗N+(1680)0.450238+0.149285cos2χ∗∆(1905)0.397430−1.498240cos2χ∗+5.880814cos4χ∗−4.019252cos6χ∗The two decay products of a resonance may also decay subsequently.This decay is simulated to occur isotropically according to the available phase space.4.3Direct pion productionThe cross section for direct meson production,unlike those of resonances,is not completely determined by well known parameters.The low and high energy constraints suggest the phenomenological parametrizationσdir(ǫ′)=σmax Pl(ǫ′;ǫ′th,ǫ′max,2),(12) where the function Pl(ǫ′;ǫ′th,ǫ′max,α)approaches zero forǫ′=ǫ′th,goes through a maximum atǫ′=ǫ′max and follows an asymptotic behaviour∝(ǫ′)−α.The definition of this function is given in Appendix A.In SOPHIA,we consider explicitly direct channels with charged pion exchange which are dominating at low energies.The selection is further constrained by the fact that sufficient data are only available for the channels pγ→nπ+,nγ→pπ−,and pγ→∆++π−.We note that proton and neutron induced direct reactions are strictly isospin-symmetric.Both proton and neutron data sets(when available)can be used in thefitting procedure.The high energy datafits on the∆πand Nπchannel,i.e.σπ≈18(ǫ′)−2[39]andσ∆≈26.4(ǫ′)−2[40]13forǫ′>1,were primarily used tofixσmax,while a bestfit ofǫ′max was obtained by comparing with the residuals of the low energy data after subtracting the resonance contribution.The adopted cross sections areσNπ(ǫ′)=92.7Pl(ǫ′;0.152,0.25,2)+40exp −(ǫ′−0.29)20.002 ,σ∆π(ǫ′)=37.7Pl(ǫ′;0.4,0.6,2).(14) The two Gaussian-shaped functions included in the direct Nπcross section have been added to improve the representation of the total cross section in the energy region0.152GeV<ǫ′<0.4GeV,where otherwise only the well constrained∆(1232)resonance contributes significantly.For pγ-(nγ-)interactionsσ∆πcontributes to the∆++π−(∆+π−)and∆0π+ (∆−π+)final states with a ratio3:1according to isospin combination rules(see Tab.1).By comparison with the total cross section data wefind that the resonant and direct in-teraction channels account for all of the total interaction cross section below the3πthreshold atǫ′≈0.51GeV.Above this threshold,and below the threshold for diffractive interactions atǫ′≈1GeV,where high energy processes set in,wefind a residual cross section which can be parametrized asσlf=80.3(60.2)Qf(x;0.51;0.1)(ǫ′)−0.34,(15) where the number60.2given in brackets belongs to nγ–interactions while the number80.3 refers to pγ–collisions.The normalization cross section and the quenching width has been determined by aχ2minimization method to the total cross section data for pγ(nγ)inter-actions after subtraction of the respective resonant and direct contributions.By analogy, the power law index for this contribution is taken from the high energy parametrization for reggeon exchange(note thatǫ′∝s−m2N).Physically,this cross section represents the joint contribution of all t-channel scattering processes at low energies not considered so far.This is in principle similar to interactions at high energies.Consequently,we use an adapted string fragmentation model to simulate this contribution,and refer to it as low energy frag-mentation hereafter.4.4High energy multipion productionIn SOPHIA,we assume that the cross sections for diffractive and non-diffractive high energy interactions are proportional to each other at all energies.This assumptionfixes the threshold for high energy interactions to the threshold of the Nρfinal state,which is nominally at ǫ′≈1.1GeV.Because of the large width of theρthere should be some contribution also at lower energies.From comparison with exclusive data of the Nρfinal state,and the residuals14of the total cross section data,with the sum of the contributions of all low energy channels,wefind a common threshold for high energy interactions ofǫ′th,high=0.85GeV.We restrict the diffractive channel to the non-resonant production of Nρand Nωfinal states,for which we assume the theoretically predicted relationσρ=9σω.The ratio betweendiffractive and non-diffractive interactions is derived from the comparison with exclusive Nρdata and total cross section data at high energy,σdiff=0.15σfrag.(16) For the parametrization ofσfrag,we use the power law representations of the reggeon and pomeron exchange cross section at high energies,and multiply them by an exponentialquenching function1−exp([ǫ′th,high−ǫ′]/a).The relative contributions of the reggeon and pomeron cross sections,and the quenching parameter a have been determined by a iterativeχ2minimization method with respect to the total pγ(nγ)cross section data after subtractionof all low energy contributions.Wefindσfrag(ǫ′)= 1−exp −ǫ′−0.85n(ǫ)R(E N)β m2N−sCurrently black body,power law,and broken power law radiation spectra are imple-mented in SOPHIA.The photon density n(ǫ)for a blackbody radiationfield of temperatureT is given in natural units byn(ǫ)=1exp(ǫin the function CROSSECTION.The cross sections for the various channels considered in this code determine the distribution for the probability of a certain process.The sampling of a process(resonance decay,direct channel,diffractive scattering,fragmentation)at a given NRF energy of the photon is carried out in the routine DECRES2).Its branching ratios define the decay mode(in DECDECAY3,and then decays of all unstable particles are carried out in the Sybill routine DECSIB.Secondary particle production is simulated in GAMMAPLIST/P(2000,5), LLIST(2000),NP,Ideb.Here the array P(i,j)contains the4-momenta and rest mass of thefinal state particle i in cartesian coordinates(P(i,1)=P x,P(i,2)=P y,P(i,3)=P z, P(i,4)=energy,P(i,5)=rest mass).LLIST()gives the code numbers of allfinal state particles and NP is the number of stablefinal state particles.5.3Input/Output routinesUsing the standard main program,the user provides the following input parameters.•E0=energy of incident proton(in GeV),or•Emin,Emax=low/high energy cutoffof an energy grid of incident protons(in GeV)•L0=code number of the incident nucleon(L0=13:proton,L0=14:neutron)•ambient photonfield:–blackbody spectrum:TBB=temperature(in K)–straight/broken power law spectrum:ALPHA1,ALPHA2=power law indices,EPSMIN=low energy cut off(in eV),EPSMAX=high energy cut off(in eV),EPSB=break energy(in eV)•NTRIAL=number of inelastic interactions•NBINS=number of bins for output particle spectra(≤200bins)•DELX=stepsize of output particle spectra17For the calculation of the incident particle momenta we assume that the relativistic nucleon is moving along the positive z-axis.The output is organized as follows.All the energy distributions(1/N eve)dN part/d log x of produced particles are given with logarithmically equal bin sizes in the scaling variable x=E part/E0.Here N eve denotes the number of simulated inelastic events and N part is the number of secondary particles of a certain kind.The spectra of photons,protons,neutrons,e-neutrinos,e-antineutrinos,µ-neutrinos andµ-antineutrinos are considered separately.They are stored in afile with name xxxxxx.particle with xxxxxx=input name(chosen by the user):particle=’gamma’−→γspectrum’muneu’−→νµspectrum’muane’−→¯νµspectrum’eFigure3:The totalγp cross section(solid line)with the contributions of baryon resonances (dotted lines),direct pion production processes(dashed line)non-diffractive multipion pro-duction(dash-dotted line),and diffractive scattering(lower dash-triple-dotted line).Data are taken from[41,42,43,44,45,46,47,48].Bottom panel:Residuals of the total cross section data to the sum of all partial cross sections implemented in SOPHIA;the line shows the average over10neighboring data points.19channelγp→π+n constitutes the largest contribution.To assess the quality of the cross section parametrization,the differences between theexperimental data on the totalγp cross section and the cross sectionfit are shown in Fig.3(lower panel).Thetotalγn cross section is overall similar,except at energies of about√2ln E+p m⊥ ,(24)20050100150200250300350σ (µb a r n )ε’(GeV)050100150200250300σ (µb a r n )ε’ (GeV)Figure 4:Total cross section of γp −→π0p and γp −→π+n .Data are from [49,50,51,52,53,54].where p is its momentum component along the direction of the incoming particle.Thetransverse mass m ⊥follows from m 2⊥=E 2−p 2 .Rapidity is additive under Lorentz trans-formations,which keeps the rapidity distribution invariant under such transformations.Moffeit et al.[67]have measured the rapidity distribution for the interaction γp −→π−+21。