海洋环流数值模式POP的GPU并行优化

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

海洋环流数值模式POP的GPU并行优化
郭松;窦勇;雷元武
【期刊名称】《计算机工程与科学》
【年(卷),期】2012(34)8
【摘要】POP是一种全球海洋环流模式,广泛应用于海洋研究和气候预测.但是,随着模式分辨率的提高,POP对计算能力的需求呈几何级数增长,从而限制了POP模式的发展.本文在分析POP原理和特征的基础上,采用CUDA Fortran编程模型将POP模式移植到GPU平台上,并采用了网格块间并行和网格块内并行相结合的多层次并行实现全局存储器合并访问,减少局部存储器的使用,利用寄存器提高数据重用度和增大GPU端代码以减少CPU与GPU间的通信等优化策略.实验结果表明,与运行在IntelXeon X5675 6核处理器上的串行程序和6进程并行程序相
比,GPUPOP可以分别获得8.47倍和1.5倍的加速效果.%POP is a global ocean circumfluence model, which is used widely to the ocean research and climate prediction. With the resolution increasing, the requirement of computing ability is geometrically increasing, which limits the development of the POP ocean model. Based on the analysis of the equations and numerical characteristics of the POP ocean model,this paper plants the POP ocean model to the GPU platform with the CUDA Fortran programming model,and adopts hybrid parallelism to implement coalesced access to the global memory, reduces the use of local memory,improves the data reusability with registers,and enlarges the code executing on the GPU to minimize the communication between CPU and
GPU. Research and experiment show that the CUPOP running on one NVIDIA Tesla C2O7O card can a-chieve up to 8. 47 times and 1. 5 times respectively, compared with the serial program and six-MPI processes program running on the Intel Xeon X5675 CPU.
【总页数】7页(P147-153)
【作者】郭松;窦勇;雷元武
【作者单位】国防科学技术大学高性能计算国家重点实验室,湖南长沙410073;国防科学技术大学高性能计算国家重点实验室,湖南长沙410073;国防科学技术大学高性能计算国家重点实验室,湖南长沙410073
【正文语种】中文
【中图分类】TP302.7
【相关文献】
SG/IAP全球海洋环流模式的并行计算及其优化 [J], 张理论;宋君强;李晓梅
2.GPU在海洋环流模式POP中的应用 [J], 宋振亚;刘海行;雷晓燕;赵伟
3.地下多相流动数值模拟的GPU并行优化 [J], 魏晓辉;朱彤;李洪亮;李维山;许天福
4.海洋环流模式LICOM的GPU实现与优化 [J], 张留莹;王鹏飞;张峰;刘海龙;林鹏飞;王涛;韦俊林;田少博;姜金荣;迟学斌
5.海洋环流模式LICOM的GPU实现与优化 [J], 张留莹;迟学斌;王鹏飞;张峰;刘海龙;林鹏飞;王涛;韦俊林;田少博;姜金荣
因版权原因,仅展示原文概要,查看原文内容请购买。

相关文档
最新文档