【通用】曙光集群用户使用手册.doc
云南大学高性能计算中心曙光集群系统使用指南
![云南大学高性能计算中心曙光集群系统使用指南](https://img.taocdn.com/s3/m/755c93738e9951e79b892731.png)
云南大学高性能计算中心曙光集群系统使用指南1、使用SSH客户端软件用在高性能计算中心申请的用户名和密码登录到集群系统(Windows系统可使用SSHSecureShellClient-3.2.9软件包,下载地址/structure/download Linux系统可直接使用ssh命令登录)。
登录成功后你所在的节点是登录节点,系统会有一些通知信息显示,操作提示符是[username@node34 ~]$。
这个节点是作用户帐号管理,不要在上面运行程序。
2、编译与调试程序请用rsh转到相关作业区节点。
本集群系统共有32个计算节点(每个节点有4个CPU 8G 内存),分为4个作业区。
小作业区small包含4个节点(node1..node4),中型作业区medium包含8个节点(node5..node13),专用作业区long包含8个节点(node13..node20),大作业区large包含12个节点(node21..node32)。
每一个作业区的第一个节点该作业区的服务节点,small为node1,medium为node5,long为node13,large为node21。
例如从登录节点转到一号节点:[hbli@node34 ~]$rsh node1Last login: Mon Aug 28 15:33:16 from node34[hbli@node1 ~]$3、编译链接、运行用户程序串行程序可使用GCC或PGI编译器,并行程序可使用mpicc, mpiCC, mpif77,mpif90进行编译。
以下是一个c使用mpi的例子:/* hello.c *//* MPI sample c program *//* compile "with mpicc -o hello hello" *//* run with "mpirun -np 8 hello" *//* or submit with pbs script "qsub hello.pbs" *//* you can use "qstat" to dislay your job statusa */#include <stdio.h>#include "mpi.h"int main( argc, argv )int argc;char **argv;{int rank, size;MPI_Init( &argc, &argv );MPI_Comm_size( MPI_COMM_WORLD, &size );MPI_Comm_rank( MPI_COMM_WORLD, &rank );printf( "Hello world from process %d of %d\n", rank, size );MPI_Finalize();return 0;}可以用如下命令对上面的程序进行编译:$ [hbli@node1 sample]mpicc –o hello hello.c生成可运行的文件hello,用ls –l 命令可以看到生成的可执行文件:$ [hbli@node1 sample]ls –l-rwxrwxr-x 1 hbli hbli 507375 Oct 10 10:39 hello-rw-r--r-- 1 hbli hbli 532 Jun 20 08:01 hello.c这样就可运行hello 这个程序了。
曙光集群用户使用手册
![曙光集群用户使用手册](https://img.taocdn.com/s3/m/8ed6b936b9d528ea80c7794a.png)
1. 登录和文件传输登录方式为ssh,与telnet功能类似,推荐的登录工具为putty或者Secure Shell (/html/download/ser/20070917/35112.html,绿色版无需安装)在地址栏输入本集群的登录地址(node1对应的局域网IP),点击“打开”,就会出现登录窗口,输入用户名、密码即可。
文件传输为sftp,与传统ftp类似,但其协议更安全可靠,推荐工具为filezilla。
(https:///p/filezilla/download?filename=FileZilla_3.3.2_win32.zip,绿色版无需安装)输入登录地址222.222.21.29,输入用户名和密码,端口填22(本软件支持ftp,端口为21),点击快速连接,即可使用,操作办法与常用ftp工具类似。
2. 图形窗口支持Linux推荐使用vnc。
vnc可以将用户的操作状态保持在服务器端,即使断开连接也不会影响到正在进行的操作、计算等。
登录到linux服务器中,在命令行运行vncserver。
第一次运行时需要输入VNC登陆用的密码:根据提示输入新的vnc密码。
此密码与用户登录密码无关,将在登录vnc时需要。
此处提示的node1:2即为vnc成功打开的端口。
运行vncclient,输入登录服务器地址和端口号,点确定,输入前面设置的密码,即进入了图形窗口。
注意:1、在第一次启动了vncserver之后,vnc的连接一直可用,全部图形窗口保持在Linux 服务器上。
因此,只在每次服务器重新启动后运行一次vncserver即可,由于用户较多,请勿启动多个。
2、如果需要使用node2的图形界面,可执行ssh -X node2。
3. 作业提交3.1. Fluent3.1.1. 图形方式运行首先通过VNC登陆到图形界面,如果没有Terminal的话在桌面点击左键选择Xterm,输入以下命令即可运行:此处myhosts为用户指定的host文件,内容如下所示:node1node1node1node1node2node2node2node2-t8即指定8个核心参与计算,分别为node1上的4个核心和node2上的4个核心。
clusconf 用户手册
![clusconf 用户手册](https://img.taocdn.com/s3/m/2309cce10029bd64793e2c1b.png)
Clusconf-1.5.1用户手册曙光信息产业股份有限公司解决方案中心马少杰2013年3月目录第1章高性能集群三要素 (3)第2章clusconf功能介绍 (3)2.1 集群配置功能 (3)2.2 集群管理功能 (3)2.3 IPMI配置及管理功能 (4)第3章使用前要求 (4)第4章安装和配置 (4)4.1 安装clusconf (4)4.2 配置/etc/hosts文件 (4)4.3 配置nfs.cfg 文件 (6)4.4 配置ipmi.cfg文件 (7)第5章Clusconf使用帮助 (8)5.1 clusconf 使用选项 (8)5.2 配置操作(setting Operation) (10)5.3 管理操作(Managing Operation) (11)5.4 IPMI相关操作(IPMI Operation) (12)第6章环境变量说明: (14)第1章高性能集群三要素对于一个高性能集群,至少需要满足三个要求:1 全网全通,实现rsh或ssh的无密码访问2 统一的用户信息,可以通过同步用户信息来实现或配置NIS来实现。
3 统一的文件印象,可以通过nfs(或并行文件系统)来实现。
第2章clusconf功能介绍clusconf为一个设置集群并行环境的程序,能够完成Linux系统下的整个集群的配置、管理。
默认为根据/etc/hosts 表来认定集群中所有的节点,可以通过选项-p prefix和-n number 来自己定义集群中的节点包含功能:2.1 集群配置功能1.为某个用户设置ssh 无密码访问(--set-ssh|-ss)2.为所有用户设置rsh 无密码访问(--set-rsh|-sr)3.按照集群规范设置服务(--set-service|-sv)4.设置整个集群的nfs服务(--set-nfs|-sf)5.按照预定的流程一键配置集群(--set-all|-sa)2.2 集群管理功能1.测试全网是否完全通过(--test-net|-tn)2.显示集群信息(--sys-info|-si)3.显示整个集群的cpu负载(负载大于5%的进程) (--disp-cpu|-dc)4.同步整个集群的用户(--sync-user|-yu)5.添加一个用户到整个集群(--useradd|--adduser|-au|-ua username)6.删除一个用户到整个集群(--deluser|--uerdel|-du|-ud username)7.同步整个集群的时间(--sync-time|-yt)8.同步整个集群的某个文件(--sync-file|-yf file|files|path|paths)9.在整个集群上执行相同的命令(--sync-do|-yd command)2.3 IPMI配置及管理功能1.配置ipmi IP地址(--set-ipmi|-si)2.显示ipmi的IP地址及显示电源状态(--ipmi-info|-ii)3.IPMI远程开机(--ipmi-poweron|-in)4.IPMI 远程关机(--ipmi-poweroff|-if)5.IPMI 远程智能开机,可根据集群的角色自动规划开机顺序(--ipmi-ipoweron|-iin)6.IPMI 远程智能关机,可根据集群的角色自动规划开机顺序(--ipmi-ipoweroff|-iif)第3章使用前要求1 整个集群中所有节点操作系统安装好。
曙光天阔A840r-G用户手册V1.1
![曙光天阔A840r-G用户手册V1.1](https://img.taocdn.com/s3/m/db0fc2d728ea81c758f57888.png)
硬件及数据损坏负责; 8、 当服务器出现故障时,如果您不能确定故障的原因,请及时与曙光技术支持部门联系以
获得帮助; 9、 如主板 CMOS 电池失效,请使用与本机配备的电池相同型号的电池进行更换,替换下的
的稳定运行,并将可以延长服务器的使用寿命; 2、 请使用带接地保护的三芯电源线与插座,并使用220V 交流电,不正确的电源设置可能
会导致漏电、烧毁、爆炸甚至人身伤害; 3、 请不要在服务器正在运行时插拔背板连线或是移动服务器,否则将可能造成服务器当机
或是部件损坏; 4、 请尽量避免频繁重启或开关机,以延长服务器的使用寿命; 5、 请用户及时备份重要数据,曙光信息产业有限公司不为任何情况导致的数据丢失负责; 6、 请使用正版操作系统及软件,并进行正确配置。曙光信息产业有限公司对由于操作系统
声明及注意事项
感谢您选用曙光服务器!
曙光服务器将给您带来强大的应用支持和全新的性能体验。为了您能够更安全、方便的 使用曙光服务器,在使用之前,请详细阅读本节所提示的信息。
曙光服务器在设计和制造过程中均遵循了严格的标准,以保证您所使用的服务器拥有卓 越的品质和完美的“SUMA”特性。但是服务器属于精密电子设备,在使用过程中仍然可能因 为各种原因而导致异常,所以请务必明确以下事项: 1、 请将服务器放置在阴凉、干燥、通风、洁净、无强磁场的环境中使用,这有助于服务器
电池请妥善回收处理。 曙光信息产业有限公司保留对以上条款的解释权。
再次感谢您选用曙光服务器!
-3-
曙光天阔 A840r-G 服务器用户手册 V1.1
目录
第一章 系统简介 ........................
曙光DS800-G25磁盘阵列用户手册V1.1
![曙光DS800-G25磁盘阵列用户手册V1.1](https://img.taocdn.com/s3/m/883853dde53a580216fcfe87.png)
本手册的用途在于帮助您正确地使用曙光公司服务器产品(以下称“本产品”),在安装和第一次使用本产品前,请您务必先仔细阅读随机配送的所有资料,特别是本手册中所提及的注意事项。这会有助于您更好和安全地使用本产品。请妥善保管本手册,以便日后参阅。
本手册的描述并不代表对本产品规格和软硬件配置的任何说明。有关本产品的实际规格和配置,请查阅相关协议、装箱单、产品规格配置描述文件,或向产品的销售商咨询。
商标和版权
“SUGON”及图标是曙光信息产业股份有限公司的商标或注册商标。
“曙光”及图标是曙光信息产业股份有限公司的商标或注册商标,文中“曙光信息产业股份有限公司”简称“曙光公司”。
“Intel”、“Xeon”图标是Intel公司的注册商标。
“Microsoft”、“Windows”、“Windows Server”及“Windows Server System”是微软公司的商标或注册商标。
上面未列明的本手册提及的其他产品、标志和商标名称也可能是其他公司的商标或注册商标,并由其各自公司、其他性质的机构或个人拥有。
在本用户手册中描述的随机软件,是基于最终用户许可协议的条款和条件提供的,只能按照该最终用户许可协议的规定使用和复制。
版权所有©2013曙光信息产业股份有限公司,所有权利保留。
本手册受到著作权法律法规保护,未经曙光信息产业股份有限公司事先书面授权,任何人士不得以任何方式对本手册的全部或任何部分进行复制、抄录、删减或将其编译为机读格式,以任何形式在可检索系统中存储,在有线或无线网络中传输,或以任何形式翻译为任何文字。
对于您在本产品之外使用本产品随机提供的软件,或在本产品上使用非随机软件或经曙光公司认证推荐使用的专用软件之外的其他软件,曙光公司对其可靠性不做任何保证。
曙光I840-G10服务器用户手册
![曙光I840-G10服务器用户手册](https://img.taocdn.com/s3/m/88a2f223eefdc8d376ee3298.png)
本手册中所提及的非曙光公司网站信息,是为了方便起见而提供,此类网站中的信息不是曙光公司产品资料的一部 分,也不是曙光公司服务的一部分,曙光公司对这些网站及信息的准确性和可用性不做任何保证。使用此类网站带 来的风险将由您自行承担。
声明4: 注意: 为减少人身伤害.火灾或设备损坏的危险,为机架供电的交流电源分支电路不得超载。请向制定设备布线和安装要求 的电气机构咨询。
声明5: 注意: 请使用调节式不间断电源 (UPS),以免服务器受到电源波动和临时断电的影响。此设备可防止硬件因电涌和电压峰 值的影响而受损,并且可在电源出现故障时使系统保持正常工作状态。
手册版本 V1.0
版权所有©2012 曙光信息产业股份有限公司
v
天阔 I840-G10 服务器用户手册
·在将静电敏感部件运抵不受静电影响的工作区之前,请将它们放在各自的包装中进行保管。 ·将设备从包中取出,不要放下,直接安装到服务器中。如果需要放下设备,请将它放回防静电包中。请勿将设备放 在服务器外盖或金属表面上。 ·当设备仍然在防静电包中时,将它与服务器外部未上漆的金属表面接触至少2秒。这样可以释放防静电包和您身体 上的静电。 ·减少移动。移动会导致您身体周围的静电积累。 ·握住设备的边缘或框架,小心操作设备。 ·请勿触摸焊接点.引脚或裸露的电路。 ·请勿将设备放在其他人可以接触和损坏它的地方。 ·在触摸静电敏感元件或装置时,一定要采取适当的接地措施。 ·在寒冷的天气操作设备时应格外小心。供暖系统会降低室内湿度并增加静电。
防止静电释放的接地方法 接地的方法有几种。在取放或安装静电敏感部件时,您可以使用以下一种或多种接地方法: ·您可以使用腕带,该腕带利用接地线与接地的工作区或计算机机箱相连。腕带必须能够灵活伸缩,而且接地线的 电阻至少为1兆欧姆10%。要达到接地目的,佩戴时请将腕带紧贴皮肤。 ·在立式工作区内,请使用脚跟带.脚趾带或靴带。当您站在导电地板或耗散静电的地板垫上时,请在双脚上系上带 子。 ·请使用导电的现场维修工具。 ·配合使用耗散静电的折叠工具垫和便携式现场维修工具包。
曙光MPI用户手册(TC1700&TC4000L)
![曙光MPI用户手册(TC1700&TC4000L)](https://img.taocdn.com/s3/m/51846114a76e58fafab00382.png)
曙光MPI用户手册(TC1700 & TC4000L)曙光信息产业有限公司2003-9目录MPI的使用 (1)1.MPI简介 (1)2.MPI的程序设计 (1)2.1 MPI的基本功能 (1)2.2 MPI的几个重要元素 (2)2.3 消息 (2)2.4 point-to-point通信 (3)2.5 集群通信 (5)3. MPI应用程序的编译 (6)3.1 环境设置 (6)3.2 make (6)3.3 mpif77和mpicc (7)4. MPI应用程序的运行 (8)5. 常见问题分析 (8)附录MPI函数简表 (9)MPI的使用1.MPI简介MPI(M essage P assing I nterface)是消息传递接口的标准,当前通用的是MPI1.2规范。
不久前制定的MPI2.0规范除支持消息传递外,还支持MPI的I/O规范和进程管理规范。
MPI正成为并行程序设计事实上的工业标准。
MPICH含三层结构,最上层是MPI的API,基本是点到点通信和点到点通信基础上构造的集群通信(Collective Communication);中间层是ADI层(Abstract Device Interface),其中device可以简单地理解为某一种底层通信库,ADI就是对各种不同的底层通信库的不同接口的统一标准;最下层是具体的底层通信库,例如工作站机群上的p4通信库。
MPICH在不同平台上的实现都是根据不同的device(即平台或底层通信)实现不同的ADI 接口,这种实现机制的好处有:将与device有关和无关的代码分开,减小实现难度;利于MPI的不断升级;提高MPI的性能。
2.MPI的程序设计2.1 MPI的基本功能MPI1.2标准中没有对如何产生多个MPI进程作标准性规定,而把这一工作交给了具体的实现。
但是它有如下众所周知的假设:静态加载,即所有进程在加载完以后就全部确定,直至整个程序结束才终止,在程序正常运行期间没有进程的创建和结束。
集群及其使用说明
![集群及其使用说明](https://img.taocdn.com/s3/m/2d199285d0d233d4b14e699f.png)
浙江大学大气污染控制实验室集群使用1系统概况计算系统共有6台曙光I620-G10。
每台计算节点配置Intel E5-2650处理管理登入存储节点为曙光I620-G10,节点配置Intel E5-2609处理器,16G工作站为曙光W580I,节点配置Intel E5-2609处理器,12G 1333MHz2集群配置3 节点配置及IP4. 账号管理该集群中有两个用户组,即apclab与visitor组,本实验组人员归apclab组管理,外来游客归visitor组管理。
(1)创建用户(apclab组)[root@node1 home]# clusconf -au test1REMOTE_SH using ssh/scpOperation is done in following hosts:node1 node2 node3 node4 node5 node6 node7node3: ssh: connect to host node3 port 22: No route to hostpdsh@node1: node3: ssh exited with exit code 255Now add user: test1 on the Whole cluster5.. 4.. 3.. 2.. 1..Input the Home directory for user:test1[/public/home/test1]: /public/home/apclab /test1Input the Group Name for user:test1[users]: apclabInput the uid for user:test1[504]:Changing password for user test1.New password:Retype new password:passwd: all authentication tokens updated successfully.Now Synchronize user and group on the Whole cluster5.. 4.. 3.. 2.. 1..========node1=================node2=================node3=================node4=================node5=================node6=================node7=========adduser test1 on the whole cluster successfully!初始密码:apclab;123(2)创建用户(visitor组)[root@node1 home]# clusconf -au guest1REMOTE_SH using ssh/scpOperation is done in following hosts:node1 node2 node3 node4 node5 node6 node7node3: ssh: connect to host node3 port 22: No route to hostpdsh@node1: node3: ssh exited with exit code 255Now add user: guest1 on the Whole cluster5.. 4.. 3.. 2.. 1..Input the Home directory for user:guest1[/public/home/guest1]: /public/home/visitor/guest1 Input the Group Name for user:guest1[users]: visitorInput the uid for user:guest1[505]:Changing password for user guest1.New password:BAD PASSWORD: it does not contain enough DIFFERENT charactersBAD PASSWORD: is a palindromeRetype new password:passwd: all authentication tokens updated successfully.Now Synchronize user and group on the Whole cluster5.. 4.. 3.. 2.. 1..========node1=================node2=================node3=================node4=================node5=================node6=================node7=========adduser guest1 on the whole cluster successfully!初始密码:111111(3)删除用户[root@node1 home]# clusconf -du test2REMOTE_SH using ssh/scpOperation is done in following hosts:node1 node2 node3 node4 node5 node6 node7node3: ssh: connect to host node3 port 22: No route to hostpdsh@node1: node3: ssh exited with exit code 255Now del user: test2 on the Whole cluster5.. 4.. 3.. 2.. 1../public/home/test2Do you want to delete Home path: /public/home/test2 for test2(n/y)[n]: y(删去家目录,节省空间)Now Synchronize user and group on the Whole cluster5.. 4.. 3.. 2.. 1..========node1=================node2=================node3=================node4=================node5=================node6=================node7=========deluser test2 on the whole cluster successfully!(4)apclab组的共享目录(/public/home/apclab/test1)/public/home/apclab/test1,目前所设置的权限为只读,设置方法:[root@node1 apclab]# chmod 750 /public/home/apclab/test1 -R如果设置的权限为可读可写,设置方法:[root@node1 apclab]# chmod 770 /public/home/apclab/test1 –R5.存储使用管理目前分别有两个存储资源,即/dev/sdb,/dev/sdc分别挂在/public,/data; /public目录通过NFS方式映射给node2~7节点使用;/data通过NFS方式映射给com-gpu节点使用。
中科曙光云盘系统用户手册
![中科曙光云盘系统用户手册](https://img.taocdn.com/s3/m/7d0296390066f5335a8121f5.png)
用户手册
声 明
本手册的用途在于帮助您正确地使用曙光公司服务器产品(以下称“本产品”),在安装和第一次使用本产品前,请您务必先 仔细阅读随机配送的所有资料,特别是本手册中所提及的注意事项。这会有助于您更好和安全地使用本产品。请妥善保管本 手册,以便日后参阅
本手册的描述幵不代表对本产品觃栺和软.硬件配置的任何说明。有关本产品的实际觃栺和配置,请查阅相关协议.装箱单.产 品觃栺配置描述文件,或向产品的销售商咨询。
电源要求 安装本设备时, 必须遵守当地或区域有关安装信息技术设备的电气法觃, 而且必须由经过认可的电气工程师来完成安装操作。 本设备经过精心设计,可在符合国家供电觃范的安装环境中运行。有关选件的电源额定值,请参阅产品额定值标签或随该选 件提供的用户文档。 安装多台服务器时,可能需要使用其它配电设备来为所有设备安全供电。请遵守以下准则: ·平衡可用交流电源分支电路乊间的服务器电源负荷。 ·不允许系统总的交流电流负荷超过分支电路交流电流额定值的80%。 ·请勿使用普通的电源接线板来连接本设备。 ·通过单独的电路为服务器供电。
2 使用说明 ................................................................................................................ 16
2.1 云盘软件安装 ..................................................................................................... 16 2.2 网页版云盘的使用.............................................................................................. 16 2.2.1 2.2.2 2.2.3 2.2.4 2.2.5 2.2.6 2.2.7 2.2.8 2.2.9 用户注册 ......................................................................................................... 16 用户登彔 ......................................................................................................... 16 用户注销 ......................................................................................................... 17 曙光云盘导航栏 .............................................................................................. 17 我的曙光云盘 ................................................................................................. 19 鼠标右键功能 ................................................................................................. 24 社交分享 ......................................................................................................... 30 文件整理功能 ................................................................................................. 33 相册地点 ......................................................................................................... 35
集群普通用户操作手册
![集群普通用户操作手册](https://img.taocdn.com/s3/m/2cf156ced5bbfd0a79567340.png)
集群普通用户操作手册1.登陆管理节点请使用ssh工具登陆,以下示例为xmanger工具。
安装xmanager点击安装程序后直接默认下一步安装即可安装完后点击xshel选项点击后如下界面添加主机点击file里的new选项在此界面下,Connection选项里,Name里随便填写一个名字用来识别你所添加的机器即可,Host选项填写远程主机的IP地址然后点击Authentication选项此选项里,user Name 填写登陆用户名,password 填写登陆密码,填完后点击OK,添加主机完毕直接点解connect即可连上远程主机的shell里以后连接主机,直接点击open选项里所保存的主机即可直接登陆第一次登陆后,请更改自己的用户密码2上传文件到集群点击绿色的new file transfer按钮打开xftp工具右键单击需要上传的文件或者文件夹,选择upload即可把文件上传到用户家目录下。
3. 修改普通用户密码管理员新建用户后初始密码为111111,请用户妥善保管自己用户的密码,更改密码命令为yppasswd来更改,需要在计算节点上更改,无法在mu01上,普通用户自己更改密码。
[test@cu02 ~]$yppasswd #####使用nis提供用户管理。
4. PBS命令PBS提供3条命令用于作业管理。
qsub 命令—用于提交作业脚本命令格式:qsub [-a date_time] [-c interval] [-C directive_prefix][-e path] [-I] [-j join] [-k keep] [-l resource_list] [-m mail_options][-M user_list][-N name] [-o path] [-p priority] [-q destination] [-r c][-S path_list] [-u user_list][-v variable_list] [-V][-W additional_attributes] [-z][script]参数说明:因为所采用的选项一般放在pbs脚本中提交,所以具体见PBS脚本选项。
QBD-CB-UMD-201803280018 曙光天阔I620-G30用户手册V1.3(2)
![QBD-CB-UMD-201803280018 曙光天阔I620-G30用户手册V1.3(2)](https://img.taocdn.com/s3/m/d9b7ce8d0975f46527d3e181.png)
用户手册
DAWNING INFORMATION INDUSTRY CO.,LTD.
声明
本手册的用途在于帮助您正确地使用曙光公司服务器产品(以下称“本产品”),在安装和第一次使用本产品前,请 您务必先仔细阅读随机配送的所有资料,特别是本手册中所提及的注意事项。这会有助于您更好和安全地使用本产 品。请妥善保管本手册,以便日后参阅。
声明 3:
【危险】
分支电路负载过高在某些情况下可能导致火灾和电击危险。为避免这些危险,请确保系统电气要求未超出分支电路 保护要求。请参阅设备随附的信息以了解电气规范。
在通电的服务器内部进行操作。
【警告】
服务器通电时,释放到服务器内部组件的静电可能导致服务器异常中止,这可能会造成数据丢失。要避免出现这一 潜在问题,在通电的服务器内部进行操作时,请始终使用静电释放腕带或其他接地系统。服务器(某些型号)支持 热插拔设备,并且设计为在服务器开启及外盖卸下时可安全运行。对开启的服务器内部进行操作时,请遵守以下准 则。
商标和版权iii
电源相关的操作说明
接通服务器电源
要接通服务器电源,请按“开机/关机”按钮。
断开服务器电源
1. 请确认所有需要保存的工作均已保存到硬盘中。 2. 按照操作系统文档的说明关闭操作系统,同时服务器会由上电模式变为等待电源模式,系统电源LED指示灯由绿 色变为橙色。 3.拔下服务器所有电源线插头,注意系统需要 10s 以上的放电时间。放电完成后,系统即处于断电状态。
静电释放
防止静电释放
为避免损坏系统,在安装系统或取放部件时应注意采取必要的防范措施。手指或其它导体所释放的静电可能损坏主 板或其它对静电敏感的设备。由静电造成的损坏会缩短上述设备的预期使用时间。要避免静电损害,请注意以下事 项: 将产品装入防静电包装中,以免在运输和存储过程中直接用手接触产品。
曙光集群简明使用手册
![曙光集群简明使用手册](https://img.taocdn.com/s3/m/bd1a31e2700abb68a982fb32.png)
技术支持中心
2018/9/5
曙光集群系统使用和管理
1/56
目录
一、曙光集群的概念
二、曙光集群系统整体架构
三、曙光集群的使用
远程登录系统
上传下载数据
Linux常用5 曙光集群系统使用和管理 2/56
一、曙光集群的概念
2018/9/5
安装和运行程序
2018/9/5
曙光集群系统使用和管理
2018/9/5
曙光集群系统使用和管理
19/56
Putty简介
完全免费;
在Windows 9x/NT/2000/Win7下运行的都非常好;
全面支持ssh1和ssh2;
绿色软件,无需安装,解压后即可使用;
体积很小,仅364KB (0.54 beta版本); 操作简单,所有的操作都在一个控制面板中实现。
2018/9/5
曙光集群系统使用和管理
24/56
VNC连接Linux远程桌面
关闭VNC远程桌面:
[dawn@node110 ~]$ vncserver -kill :1 Killing Xvnc process ID 22016
重新打开VNC远程桌面:
[dawn@node110 ~]$ vncserver New 'X' desktop is node110:1
32/56
查询Linux命令使用方法:man
man是“manual”的简写,可查询Linux常用命令的手册。 格式:man [关键字]
2018/9/5
曙光集群系统使用和管理
33/56
显示文件列表:ls
ls是“list”的简写,用来显示指定目录下的内容。 格式:ls [参数] [路径或文件名]
曙光公司服务器产品用户手册说明书
![曙光公司服务器产品用户手册说明书](https://img.taocdn.com/s3/m/81179d6d4a73f242336c1eb91a37f111f1850de1.png)
I240-G20用户手册DAWNING INFORMATION INDUSTRY CO.,LTD.声明本手册的用途在于帮助您正确地使用曙光公司服务器产品(以下称“本产品”),在安装和第一次使用本产品前,请您务必先仔细阅读随机配送的所有资料,特别是本手册中所提及的注意事项。
这会有助于您更好和安全地使用本产品。
请妥善保管本手册,以便日后参阅。
本手册的描述并不代表对本产品规格和软硬件配置的任何说明。
有关本产品的实际规格和配置,请查阅相关协议、装箱单、产品规格配置描述文件,或向产品的销售商咨询。
如您不正确地或未按本手册的指示和要求安装、使用或保管本产品,或让非曙光公司授权的技术人员修理、变更本产品,曙光公司将不对由此导致的损害承担任何责任。
本手册中所提供照片、图形、图表和插图,仅用于解释和说明目的,可能与实际产品有些差别,另外,产品实际规格和配置可能会根据需要不时变更,因此与本手册内容有所不同。
请以实际产品为准。
本手册中所提及的非曙光公司网站信息,是为了方便起见而提供,此类网站中的信息不是曙光公司产品资料的一部分,也不是曙光公司服务的一部分,曙光公司对这些网站及信息的准确性和可用性不做任何保证。
使用此类网站带来的风险将由您自行承担。
本手册不用于表明曙光公司对其产品和服务做了任何保证,无论是明示的还是默示的,包括(但不限于)本手册中推荐使用产品的适用性、安全性、适销性和适合某特定用途的保证。
对本产品及相关服务的保证和保修承诺,应按可适用的协议或产品标准保修服务条款和条件执行。
在法律法规的最大允许范围内,曙光公司对于您的使用或不能使用本产品而发生的任何损害(包括,但不限于直接或间接的个人损害、商业利润的损失、业务中断、商业信息的遗失或任何其他损失),不负任何赔偿责任。
对于您在本产品之外使用本产品随机提供的软件,或在本产品上使用非随机软件或经曙光公司认证推荐使用的专用软件之外的其他软件,曙光公司对其可靠性不做任何保证。
曙光集群系统及其使用
![曙光集群系统及其使用](https://img.taocdn.com/s3/m/8bbb57314431b90d6c85c7c7.png)
曙光信息产业股份有限公司 技术支持中心 赖雍兵 laiyb@
提
纲
一、曙光集群的概念
二、曙光集群系统整体架构
三、曙光集群日常使用、管理和维护
一、曙光集群的概念点)按
某种结构连接起来,在并行化设计及可视化人机交互集成
三、曙光集群的日常管理与维护
日常使用过程中需要注意的事项
1. 环境卫生:做好防尘,不得将计算机安置于粉尘高 的环境中 2. 环境要求:环境温度20℃~25℃,湿度保持在40% ~70%,清洁度要求机房尘埃颗粒直径小于0.5μm 等 3. 电源要求:配备UPS,对集群进行电源保护 4. 散热的要求:空调气流需根据热气流流动方向冷却 5. 不能频繁的开关机,关机使用系统命令,不得通过 断电关机 6. 在硬盘写入数据过程中不可断电 7. 若有磁盘阵列,开机需先开盘阵,再开机器,关机 后再关盘阵
– export PATH= /home/your_account/your_workdir/:$PATH
– your_code
运行并行程序(1)
• 确认自己的并行环境 • which mpirun
– /usr/bin/mpirun则是lam/mpi
– /usr/local/mpich-1.2.5.2/bin/mpirun则是mpich
曙光集群
• 曙光集群是使用千兆网络(千兆交换机)或者myrinet、 infiniband等高速网络将节点机网络连接,进行高性能计算 • 使用百兆网络连接,进行网络管理监控 • 一个节点就是一台机器,N台机器通过连接高速网、安装系 统(系统的一致性,即系统配置必须一致)、调试并行环境、 安装应用软件来进行计算 • 曙光集群可扩展性强,如果用户购买的CPU数量不能满足需 要,可以无限制的增加、扩展节点个数来增加CPU数量 • 曙光集群的易管理性:DCMS、DCMM、Mterm、DCIS等监控管 理软件,协助管理集群系统
新曙光集群系统(Pluto)简明用户手册
![新曙光集群系统(Pluto)简明用户手册](https://img.taocdn.com/s3/m/210fa61dbb68a98270fefa0e.png)
曙光集群系统(Pluto)简明用户手册(第2版)1.系统介绍曙光集群系统(命名为Pluto)共有172个计算节点(140个刀片节点,16个MIC节点,16个GPU节点),5个登录节点。
集群系统所有登录节点和计算节点的操作系统均为64位Redhat7.2。
系统采用Intel Omni-Path高速计算网络,曙光Parastor200全局并行存储系统。
全系统峰值性能为211.2Tflop/s。
计算节点的硬件配置如下:●所有刀片计算节点、MIC计算节点、GPU计算节点均配置2颗Intel E5-2680 v3处理器,每个处理器12核,每节点共24核;64 GB DDR4 ECC 2133MHz内存。
●每台MIC计算节点配置1块Intel Xeon Phi 5110P加速卡(1.011TFlops)。
●每台GPU计算节点配置1块NVIDIA TESLA K80 GPGPU加速卡(2.911TFlops)。
2.系统登录及文件传输2.1.系统登录首先使用Xshell、SecureCRT等软件登录到前端机(IP:218.249.35.43)。
登陆进前端机后,再用命令ssh 帐号@pluto登录到新曙光(pluto)系统。
2.2.文件拷贝用scp命令在前端机与新曙光(pluto)之间完成文件拷贝,新老曙光系统间的文件拷贝同样用scp命令。
3.程序编译运行环境集群系统部署的编译器既包含Linux操作系统自带的GNU c/c++/fortran(版本4.8.5)编译器,也提供了Intel/MPI多个版本的c/c++/fortran的编译器,以及支持NVIDIA GPU 程序编译的CUDA toolkit。
此外,集群系统还部署了Mvapich2/OpenMPI/IntelMPI等多个版本的MPI 库,可以支持OpenMP和MPI两种并行方式。
3.1.环境变量设置方法用户可以采用下面的方法来快速设置环境变量:方法一、运行脚本文件加载环境变量。
曙光集群简明使用手册共58页
![曙光集群简明使用手册共58页](https://img.taocdn.com/s3/m/1d0ab624182e453610661ed9ad51f01dc2815762.png)
谢谢!Байду номын сангаас
曙光集群简明使用手册
6、纪律是自由的第一条件。——黑格 尔 7、纪律是集体的面貌,集体的声音, 集体的 动作, 集体的 表情, 集体的 信念。 ——马 卡连柯
8、我们现在必须完全保持党的纪律, 否则一 切都会 陷入污 泥中。 ——马 克思 9、学校没有纪律便如磨坊没有水。— —夸美 纽斯
10、一个人应该:活泼而守纪律,天 真而不 幼稚, 勇敢而 鲁莽, 倔强而 有原则 ,热情 而不冲 动,乐 观而不 盲目。 ——马 克思
21、要知道对好事的称颂过于夸大,也会招来人们的反感轻蔑和嫉妒。——培根 22、业精于勤,荒于嬉;行成于思,毁于随。——韩愈
23、一切节省,归根到底都归结为时间的节省。——马克思 24、意志命运往往背道而驰,决心到最后会全部推倒。——莎士比亚
曙光I210G20使用文档
![曙光I210G20使用文档](https://img.taocdn.com/s3/m/34719a82a0116c175f0e48bf.png)
对于您在本产品之外使用本产品随机提供的软件,或在本产品上使用非随机软件或经曙光公司认证推荐使用的专用 软件之外的其他软件,曙光公司对其可靠性不做任何保证。
曙光公司已经对本手册进行了仔细的校勘和核对, 但不能保证本手册完全没有任何错误和疏漏。 为更好地提供服务, 曙光公司可能会对本手册中描述的产品之软件和硬件及本手册的内容随时进行改进或更改,恕不另行通知。如果您 在使用过程中发现本产品的实际情况与本手册有不一致之处,或您想得到最新的信息或有任何问题和想法,欢迎致 电 400-810-0466 或登录曙光公司服务网站 垂询。
电源相关的操作说明
iv
放在服务器外盖或金属表面上。 当设备仍然在防静电包中时,将它与服务器外部未上漆的金属表面接触至少 2 秒。这样可以释放防静电包和您身 体上的静电。 减少移动。移动会导致您身体周围的静电积累。 握住设备的边缘或框架,小心操作设备。 请勿触摸焊接点.引脚或裸露的电路。 请勿将设备放在其他人可以接触和损坏它的地方。 在触摸静电敏感元件或装置时,一定要采取适当的接地措施。 在寒冷的天气操作设备时应格外小心。供暖系统会降低室内湿度并增加静电。
防止静电释放的接地方法
接地的方法有几种。在取放或安装静电敏感部件时,您可以使用以下一种或多种接地方法: 您可以使用腕带,该腕带利用接地线与接地的工作区或计算机机箱相连。腕带必须能够灵活伸缩,而且接地线的 电阻至少为 1 兆欧姆的 10%。要达到接地目的,佩戴时请将腕带紧贴皮肤。 在立式工作区内,请使用脚跟带、脚趾带或靴带。当您站在导电地板或耗散静电的地板垫上时,请在双脚上系上 带子。 请使用导电的现场维修工具。 配合使用耗散静电的折叠工具垫和便携式现场维修工具包。
静电释放 防止静电释放
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 登录和文件传输登录方式为ssh,与telnet功能类似,推荐的登录工具为putty或者Secure Shell (/html/download/ser/20070917/35112.html,绿色版无需安装)在地址栏输入本集群的登录地址(node1对应的局域网IP),点击“打开”,就会出现登录窗口,输入用户名、密码即可。
文件传输为sftp,与传统ftp类似,但其协议更安全可靠,推荐工具为filezilla。
(https:///p/filezilla/download?filename=FileZilla_3.3.2_win32.zip,绿色版无需安装)输入登录地址222.222.21.29,输入用户名和密码,端口填22(本软件支持ftp,端口为21),点击快速连接,即可使用,操作办法与常用ftp工具类似。
2. 图形窗口支持Linux推荐使用vnc。
vnc可以将用户的操作状态保持在服务器端,即使断开连接也不会影响到正在进行的操作、计算等。
登录到linux服务器中,在命令行运行vncserver。
第一次运行时需要输入VNC登陆用的密码:根据提示输入新的vnc密码。
此密码与用户登录密码无关,将在登录vnc时需要。
此处提示的node1:2即为vnc成功打开的端口。
运行vncclient,输入登录服务器地址和端口号,点确定,输入前面设置的密码,即进入了图形窗口。
注意:1、在第一次启动了vncserver之后,vnc的连接一直可用,全部图形窗口保持在Linux 服务器上。
因此,只在每次服务器重新启动后运行一次vncserver即可,由于用户较多,请勿启动多个。
2、如果需要使用node2的图形界面,可执行ssh -X node2。
3. 作业提交3.1. Fluent3.1.1. 图形方式运行首先通过VNC登陆到图形界面,如果没有Terminal的话在桌面点击左键选择Xterm,输入以下命令即可运行:此处myhosts为用户指定的host文件,内容如下所示:node1node1node1node1node2node2node2node2-t8即指定8个核心参与计算,分别为node1上的4个核心和node2上的4个核心。
在图形界面下导入cas和data文件,修改和设置边界条件等并计算(和在windows下操作单机版Fluent相同,略):注:通过VNC使用图形界面方式运行fluent时,无需保持PC机与服务器的连接,只要vncserver没有重新启动,即可随时连接到原有的窗口。
3.1.2. 命令行方式运行建立script1文件:script1内容如下:(注:其中fl5m1.cas为cas文件名,根据实际进行修改;solve/iterate 25 表示迭代25步,也可根据需要修改步数。
)用命令行进行fluent计算:此处myhosts为用户指定的host文件,内容如下所示:node1node1node1node1node2node2node2node2-t8即指定8个核心参与计算,分别为node1上的4个核心和node2上的4个核心。
3.1.3. 作业调度方式运行注:PBS只持Fluent命令行运行方式的作业提交1.编译脚本script1,内容如下(与上面脚本运行方式相同):file/rcd fl5m1.cas.gzsolve/iterate 25/file/wcd fl5m1_final.datparallel/timer/usageexityes2.编辑pbs脚本fluent.pbs,内容如下:#!/bin/bash#PBS -N job1-8cpu#PBS -l nodes=1:ppn=8#PBS -j oeINPUTFILE=script1OUTPUTFILE=script1.logcd $PBS_O_WORKDIR## pib.dapl indicate using ib protocal and the udapl way. t8 indicates using# 8 processors#NP=`cat $PBS_NODEFILE | wc -l`datefluent 3d -t$NP -cnf=$PBS_NODEFILE -g -i $INPUT >& $OUTPUTdateexit 0提交作业:qsub fluent.pbs用qstat -a和pbsnodes -a以及top命令查看作业是否正常排队运行。
注:红色字体部分需要根据实际情况改动,黑色字体为固定格式的内容。
3.1.4. 获取计算结果1.如果用图形界面的方式运行fluent,可以在菜单中选择选择保存dat文件到当前工作目录或其他某个目录下,然后用ftp软件将dat文件下载到终端pc机上,即可进行后处理。
2.如果用命令行的方式运行fluent,dat文件自动保存到当前目录,文件名由script1文件的内容决定(例如“file/wcd fl5m1_final.dat”则表示dat文件为fl5m1_final.dat),用软件将dat文件下载到终端pc机上,即可进行后处理。
3.2. Ansys作业3.2.1. 图形方式运行通过vnc登录以后,运行launcher121,即可进入ansys界面,选择相关的模块点击run 即可。
3.2.2. 命令行方式运行在命令行方式下,不能进行交互的图形操作,所有的命令需要通过命令流来实现。
假设写好的命令流文件为input.inp,运行方式如下:单节点:ansys121 -np 16 -i input.inp >& output.log &多节点运行:ansys121 -dis -machines node1:16:node2:16 -i input.inp >& output.log &3.2.3. 作业调度方式运行编写一个pbs脚本ansys.pbs如下所示:#PBS -j oe###################what you just need and could edit are between the two lines#######################PBS -N my_ansys_test#PBS -l nodes=1:ppn=16INPUTFILE=wing.inpOUTPUTFILE=wing.log###############################################theend##############################################cd $PBS_O_WORKDIRnp=1for NODE in `cat $PBS_NODEFILE`; dohost=$NODEif [ ! -z $lasthost ]; thenif [ $host = $lasthost ]; thennp=`expr $np + 1`elseif [ -z $mList ]; thenmList=$lasthost:$npelsemList=$mList:$lasthost:$npfififilasthost=$hostdoneif [ -z $mList ]; thenmList=$lasthost:$npelsemList=$mList:$lasthost:$npfiansys121 -dis -machines $mList -i $INPUTFILE -o $OUTPUTFILE写完以后提交方式与fluent相同,qsub ansys.pbs即可。
3.3. CFX作业3.3.1. 图形方式运行在图形窗口中运行cfx5即可。
3.3.2. 命令行方式运行CFX支持PVM和MPI两种方式的并行,通常MPI的性能更好一些,建议采用。
同时还有Local和Distributed两种运行模式,单机上建议采用Local模式,而跨节点时只能采用Distributed模式。
cfx5solve命令可直接进入求解模式。
cfx5solve -def Benchmark.def -par-dist 'node1*8'在本机上用8个核心并行cfx5solve -def Benchmark.def -par-dist 'node1*8,node2*8'采用2个节点各8个核心进行分布式并行计算3.3.3. 作业调度方式运行[test@node34 cfxbm]$ cat pbs_cfx.ib#!/bin/bash#PBS -N CFX_8cpu#PBS -l nodes=1:ppn=8INPUTFILE=Benchmark.defOUTPUTFILE=Benchmark.log############################################################## ########## You don't need to modify the lines below ######################################################################## PeHostfile2MachineFile(){cat $1 | while read line; do# echo $linehost=`echo $line`# add here code to map regular hostnames into ATM hostnamesif [ -z $mList ]; thenmList=$host"*1"elsemList=$mList,$host"*1"fiecho $mListdone}CFX_PBS_NODEFILE="/tmp/cfx_`whoami`_$PBS_JOBID"PeHostfile2MachineFile $PBS_NODEFILE | sed "s#bnode#node#g" >$CFX_PBS_NODEFILENPROCS=`wc -l $PBS_NODEFILE`cd $PBS_O_WORKDIRcfx5solve -def $INPUTFILE -par-dist `tail -n1 $CFX_PBS_NODEFILE`写完脚本就可以按如下方式提交作业:[test@node34 cfxbm]$ qsub cfx.pbs3.4. ABAQUS作业3.4.1. 图形方式运行在图形窗口中运行abaqus cae即可。