曙光集群系统及其使用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
曙光集群系统及其使用
曙光信息产业股份有限公司 技术支持中心 赖雍兵 laiyb@
提
纲
一、曙光集群的概念
二、曙光集群系统整体架构
三、曙光集群日常使用、管理和维护
一、曙光集群的概念点)按
某种结构连接起来,在并行化设计及可视化人机交互集成
三、曙光集群的日常管理与维护
日常使用过程中需要注意的事项
1. 环境卫生:做好防尘,不得将计算机安置于粉尘高 的环境中 2. 环境要求:环境温度20℃~25℃,湿度保持在40% ~70%,清洁度要求机房尘埃颗粒直径小于0.5μm 等 3. 电源要求:配备UPS,对集群进行电源保护 4. 散热的要求:空调气流需根据热气流流动方向冷却 5. 不能频繁的开关机,关机使用系统命令,不得通过 断电关机 6. 在硬盘写入数据过程中不可断电 7. 若有磁盘阵列,开机需先开盘阵,再开机器,关机 后再关盘阵
– export PATH= /home/your_account/your_workdir/:$PATH
– your_code
运行并行程序(1)
• 确认自己的并行环境 • which mpirun
– /usr/bin/mpirun则是lam/mpi
– /usr/local/mpich-1.2.5.2/bin/mpirun则是mpich
曙光集群
• 曙光集群是使用千兆网络(千兆交换机)或者myrinet、 infiniband等高速网络将节点机网络连接,进行高性能计算 • 使用百兆网络连接,进行网络管理监控 • 一个节点就是一台机器,N台机器通过连接高速网、安装系 统(系统的一致性,即系统配置必须一致)、调试并行环境、 安装应用软件来进行计算 • 曙光集群可扩展性强,如果用户购买的CPU数量不能满足需 要,可以无限制的增加、扩展节点个数来增加CPU数量 • 曙光集群的易管理性:DCMS、DCMM、Mterm、DCIS等监控管 理软件,协助管理集群系统
集群系统使用指南
主要内容
• • • • 登录系统—security SSH 远程图形--VNC 上传数据—ssh FTP 运行程序
运行程序
运行串行程序
• 方法一
– cd /home/your_account/your_workdir – ./your_code
• 方法二
– cd – vi .bashrc
运行并行程序(2)
• 采用MPICH
– 单机并行
• cd /home/your_account/your_workdir • mpirun –np 4 ./your_code
node1 node2 node3 node4
– 跨节点并行
• cd /home/your_account/your_workdir • vi host • mpirun –np 4 –machinefile host ./your_code
Q&A
曙光集群电源系统
电源系统的重要参数
• 电流:2U3P,20A/P • 39个插口/ 机柜 • 2U电源支持5机柜供 电, • 电源支持:可接单相、 3相电端子排提供1路 零线、1路地线和3路 火线接口
曙光SKVM系统
SKVM的主要部件
CIM 和 USTS
传统KVM
SKVM的连接
• 每一个USTS最多连接99个CIM • 两个CIM之间可以用5类线(普通以太网线) 连接,从OUT出从IN入 • USTS可以直接连显示器或接入传统的KVM 切换器级连扩展 • USTS与CIM之间使用屏蔽线连接
开发环境支持下,统一调度、协调处理,实现高效并行处 理的系统 • 所有计算机节点一起工作如同一个单一集成的系统资源, 实现单一系统映像(SSI) • 集群是目前高性能计算机三大体系结构之一,是目前最主 流的和最有生命力的体系结构 • 集群是目前性能价格比最高的高性能计算机体系结构
• 集群特点:容易实现、容易维护、较好用的高性能计算机
二、曙光集群系统整体架构
曙光集群系统整体架构
• 曙光集群硬件系统的基本架构 • 基于节点的集群 CPU:AMD 系列Opteron、intel系列Xeon 高中低端产品: 八路四路、双路、单路
• 外围设备:
机柜系统 网络系统 集群监控系统 集群管理系统
视频管理系统
曙光机柜系统
重要参数 种类名称:机柜 长宽高:110*60*200 重量: 180KG 压强:500KG/MM 容量: 42U 通风设计:风冷 布线设计:电源、网络
曙光信息产业股份有限公司 技术支持中心 赖雍兵 laiyb@
提
纲
一、曙光集群的概念
二、曙光集群系统整体架构
三、曙光集群日常使用、管理和维护
一、曙光集群的概念点)按
某种结构连接起来,在并行化设计及可视化人机交互集成
三、曙光集群的日常管理与维护
日常使用过程中需要注意的事项
1. 环境卫生:做好防尘,不得将计算机安置于粉尘高 的环境中 2. 环境要求:环境温度20℃~25℃,湿度保持在40% ~70%,清洁度要求机房尘埃颗粒直径小于0.5μm 等 3. 电源要求:配备UPS,对集群进行电源保护 4. 散热的要求:空调气流需根据热气流流动方向冷却 5. 不能频繁的开关机,关机使用系统命令,不得通过 断电关机 6. 在硬盘写入数据过程中不可断电 7. 若有磁盘阵列,开机需先开盘阵,再开机器,关机 后再关盘阵
– export PATH= /home/your_account/your_workdir/:$PATH
– your_code
运行并行程序(1)
• 确认自己的并行环境 • which mpirun
– /usr/bin/mpirun则是lam/mpi
– /usr/local/mpich-1.2.5.2/bin/mpirun则是mpich
曙光集群
• 曙光集群是使用千兆网络(千兆交换机)或者myrinet、 infiniband等高速网络将节点机网络连接,进行高性能计算 • 使用百兆网络连接,进行网络管理监控 • 一个节点就是一台机器,N台机器通过连接高速网、安装系 统(系统的一致性,即系统配置必须一致)、调试并行环境、 安装应用软件来进行计算 • 曙光集群可扩展性强,如果用户购买的CPU数量不能满足需 要,可以无限制的增加、扩展节点个数来增加CPU数量 • 曙光集群的易管理性:DCMS、DCMM、Mterm、DCIS等监控管 理软件,协助管理集群系统
集群系统使用指南
主要内容
• • • • 登录系统—security SSH 远程图形--VNC 上传数据—ssh FTP 运行程序
运行程序
运行串行程序
• 方法一
– cd /home/your_account/your_workdir – ./your_code
• 方法二
– cd – vi .bashrc
运行并行程序(2)
• 采用MPICH
– 单机并行
• cd /home/your_account/your_workdir • mpirun –np 4 ./your_code
node1 node2 node3 node4
– 跨节点并行
• cd /home/your_account/your_workdir • vi host • mpirun –np 4 –machinefile host ./your_code
Q&A
曙光集群电源系统
电源系统的重要参数
• 电流:2U3P,20A/P • 39个插口/ 机柜 • 2U电源支持5机柜供 电, • 电源支持:可接单相、 3相电端子排提供1路 零线、1路地线和3路 火线接口
曙光SKVM系统
SKVM的主要部件
CIM 和 USTS
传统KVM
SKVM的连接
• 每一个USTS最多连接99个CIM • 两个CIM之间可以用5类线(普通以太网线) 连接,从OUT出从IN入 • USTS可以直接连显示器或接入传统的KVM 切换器级连扩展 • USTS与CIM之间使用屏蔽线连接
开发环境支持下,统一调度、协调处理,实现高效并行处 理的系统 • 所有计算机节点一起工作如同一个单一集成的系统资源, 实现单一系统映像(SSI) • 集群是目前高性能计算机三大体系结构之一,是目前最主 流的和最有生命力的体系结构 • 集群是目前性能价格比最高的高性能计算机体系结构
• 集群特点:容易实现、容易维护、较好用的高性能计算机
二、曙光集群系统整体架构
曙光集群系统整体架构
• 曙光集群硬件系统的基本架构 • 基于节点的集群 CPU:AMD 系列Opteron、intel系列Xeon 高中低端产品: 八路四路、双路、单路
• 外围设备:
机柜系统 网络系统 集群监控系统 集群管理系统
视频管理系统
曙光机柜系统
重要参数 种类名称:机柜 长宽高:110*60*200 重量: 180KG 压强:500KG/MM 容量: 42U 通风设计:风冷 布线设计:电源、网络