武汉大学高性能计算系统
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
作业队列名
1 Cluster_C_Compiler_Linux 集群 Linux 系统 C++编译
2 Cluster_F_Compiler_Linux 集群 Linux 系统 Fortran 编译
3 Cluster_C_Compiler_Win 集群 Windows 系统 C++编译
4 Cluster_F_Compiler_Win 集群 Windows 系统 Fortran 编译
生命科学
amber
10
64bit Linux SMP
序列比对
blast mpiblast
2.2.22 64bit Linux SMP 1.6.0 64bit Linux SMP
分子对接 dock
6.2
64bit Linux 集群
Ansys
12.1 64bit Linux SMP
结构力学 ABAQUS
10
SMP_C_Compiler SMP 上 C++编译
11
SMP_F_Compiler SMP 上 Fortran 编译
4
四、如何运行已安装的程序
1.登录 LSF portal 在与校园网相连的用户计算机上,通过浏览器访问 http://210.42.123.10:8080。出现图 2 所示界 面。在其中输入用户名和密码。用户名和密码的获取方法见第六部分。
择其他的队列。 5) 在输入文件中,选择要编译的 C 文件,例如:hello.c 6) 点击“提交作业”,这个作业就提交到集群中来运行了(即进行编译)。作业提交后可以在页面中
看到编译后的输入和输出文件。
图 9 编译 C++ 的作业提交页面
2.675Tflops
3
SMP
SMP 大型机
42 个 CPU,0.252Tflops 分配给串行计算用户
4 GPU_windows GPU 集群(Windows)
6
个
Tesla
C2050
GPU
卡, 分配给图形、图像处理用户
6.18Tflops,windows 环境
5 GPU_linux GPU 集群(Linux)
2.编译系统:集群上安装 C/C++、FORTRAN 编译系统、MPI 和 MPICH 库。SMP 大型机上另外安装 OpenMP 库。GPU 集群安装有 CUDA C 编译系统
3.作业调度系统:Platform 公司的 LSF。
2
4.应用软件:已安装可直接运行的应用软件如表 1 所示。
学科
子分类
2.作业队列:用户的作业提交给 LSF 的作业队列,由作业调度系统对作业队列中的作业进行调度。
3.通用作业队列:LSF 定义了不同的作业队列,对应不同的运行环境、资源数量、优先级。已定义
的通用作业队列及其简要说明如表 2 所示。
4.编程程序作业队列:LSF 中为已安装的编译程序预定义了作业队列,如表 3 所示,用户可直接运
表 1 应用软件一览表
软件名
版本
操作系统
运行 平台
vasp
4.6.35 64bit Linux 集群
Meterial Studio 4.5
64bit Linux 集群
计算物理 物理化学
pwscf(espresso) 4.1.2
siesta
3.0b
64bit Linux 集群 64bit Linux 集群
abinit
5.8.3 64bit Linux 集群
cpmd
3.13_2 64bit Linux 集群
计算化学 gauss
03
64bit Linux SMP
namd
2.7b3 64bit Linux 集群
分子动力学
gromacs lammps
4.0.5 64bit Linux 集群 5Jun10 64bit Linux 集群
校园网
曙光集群
HP 集群
SMP 大型机 GPU 集群
图 1 网格系统示意图
存储系统
二、主要软件
1.操作系统:集群的计算节点安装 64 位 SuSe11 Linux 系统,其中曙光集群的 10 个节点通过虚拟机 同时安装 Windows Server2008,双操作系统同时运行。SMP 大型机安装 HP-UX 系统。GPU 主机安装 SuSe11 Linux 和 Windows Server2008,双操作系统同时运行。
5 GPU_F_Compiler_Linux GPU Linux 系统 Fortran 编译
6 GPU_F_Compiler_Win GPU Windows 系统 Fortran 编译
7 GPU_C_Compiler_Linux GPU Linux 系统 C++编译
9 GPU_C_Compiler_Win GPU Windows 系统 C++编译
网格系统使用说明 目录
一、网格系统组成 .................................................................................................................................................2 二、主要软件 .........................................................................................................................................................2 三、运行程序的方法 .............................................................................................................................................4 四、如何运行已安装的程序 .................................................................................................................................5 五、如何运行自己编写的程序 .............................................................................................................................8 六、如何开户 .......................................................................................................................................................13
图 2 LSF 登录界面 2.选择作业 在图 3 所示界面上左边“应用软件”栏点击“应用软件”菜单,在右边点击选择一个已安装的软件。 出现如图 4 所示的作业提交界面。
图 3 选择作业
5
图 4 作业提交 3.上传必要的输入参数文件 在图 4 所示的界面上选择输入文件的方式,上传输入参数文件。 4.选择任务队列 在图 4 所示的界面上选择拟运行该程序的作业队列。用户在开通账户时已知自己被分配的队列,用 户就只能将作业提交到这个队列中,如果选择其他的队列,提交作业时就会报错。 5.选择当作业状态改变时是否通知 在图 4 所示界面上选择“当作业状态改变时通知我”为“开启”。当作业状态改变时,会在浏览器的 右下角显示提示。作业状态提示如图 5 所示。
6.9.1 64bit Linux SMP
CAE/CFD
NASTRAN 结构动力学 Lsdyna
1.8.3 12.1
64bit Linux SMP 64bit Linux 集群
流体力学
fluent CFX
12.1 12.1
64bit Linux 集群 64bit Linux 集群
WRF
3.1
64bit Linux 集群
气象
中尺度模拟 MM5
3.7
64bit Linux 集群
Graphs
2.5
64bit Linux 集群
3
三、运行程序的方法
1.用户入口:LSF portal 是所有用户使用网格系统的唯一入口。用户通过 Web 方式登录到 LSF,启
动或提交作业。LSF portal 的登录地址为:http://210.42.123.10:8080。
1
一、网格系统组成
网格系统主要由曙光集群计算机、HP 集群计算机、HP SMP 大型机、GPU 集群、存储系统组成。 曙光集群计算机:峰值计算能力为 19.64TFlops,包括 93 个计算节点,每个节点 2 个 CPU,每个 CPU12 核,主频 2.2GHz,节点内存 32GB。节点由 40Gbps 的 IB 交换机互联。 HP 集群计算机:峰值计算能力为 2.3Tflops,包括 76 个计算节点,每个节点 2 个 CPU,每个 CPU2 核,主频 2.2GHz,节点内存 4GB,节点由 10Gbps 的 IB 交换机互联。 SMP 大型机:包括 42 个 1.5GHz 64 位安腾 2 CPU、196GB 内存。 GPU 集群:峰值计算能力为单精度 6.18TFlops,包括主机及 6 块 Tesla C2050 GPU 卡,主机为 Intel Xeon 4 核 CPU,主频为 2.4GHz,内存为 32GB,硬盘为 300GB。 存储系统:可用容量约为 30TB,由集群、大型机和 GPU 系统共享。 曙光集群和 HP 集群可作为统一系统,运行用户的程序。 网格系统的逻辑结构如图 1 所示。
6
个
Tesla
Cபைடு நூலகம்050
GPU
卡, 分配给图形、图像处理用户
6.18Tflops,Linux 环境
12 核 CPU 集群+双核 CPU 曙光+HP 集群,186 个 12 分配给计算量大、最高优先
6
Cluster_all 集群(Linux)
核 CPU+76 个双核 CPU 级用户
小规模 12 核 CPU 集群 50 个 12 核 CPU,
图 5 作业状态提示 6.提交作业 在图 4 所示的界面上,输入一个作业名称,点击“提交作业”。 7. 暂停、终止和重新调度作业 在作业状态提示界面上,在更多操作下拉菜单中,用户可以选择暂停、终止和重新调度作业。如图 6 所示。
6
图 6 暂停、终止和重新调度作业 8. 查看作业运行状态 点击左边工具栏的作业列表,可显示作业的运行状态,如图 7 所示。
7 Cluster_part
(Linux)
5.28Tflops
分配给计算量中等、较高优 先级用户
8 Cluster_windows 小规模 windows 集群
20 个 12 核 CPU,
分配给计算量小的
2.1Tflops,windows 系统 windows 用户
表 3 编译程序作业队列
序号
作业队列 ID
行。
表 2 LSF 定义的通用作业队列
序号 作业队列 ID
作业队列名
资源说明
备注
大规模 12 核 CPU 集群 曙光集群,186 个 12 核 分配给计算量大、高优先级
1 Cluster_12 (Linux)
CPU,19.64Tflops
用户
2
Cluster_2 双核 CPU 集群(Linux) HP 集群,76 个双核 CPU,分配给普通用户
图 7 作业运行状态 9.查看运行结果 在图 7 所示界面上,点击“下载”可将结果文件下载到本地。 在图 7 所示界面上,点击“查看”就会在本地新的窗口中将文件的内容显示出来,如图 8 所示。
图 8 显示运行结果
7
五、如何运行自己编写的程序
1.编辑源程序 可在 PC 机上用熟悉的方式编辑源程序,然后上传到网格系统编译。 2.编译 方法一 通过 LSF 作业队列进行编译 利用“四、运行已安装的程序”中介绍的方法,运行已安装的编译作业,提交源程序文件,进行编 译。 具体的编译过程为(以 C++为例): 1) 在图 3 所示的作业选择窗口选择 generic 作业并打开提交窗口(如图 9)。 2) 在“运行命令”输入:gcc 编译的命令,如果是其他的编译,请输入其他的编译命令。 3) 在“作业名称“ 输入框中输入编译的应用程序名(推荐)。 4) “提交到这个队列”请选择执行的队列:Cluster_C_Compiler_Linux, 如果是其他的编译,请选