曙光集群用户使用手册
云南大学高性能计算中心曙光集群系统使用指南
云南大学高性能计算中心曙光集群系统使用指南1、使用SSH客户端软件用在高性能计算中心申请的用户名和密码登录到集群系统(Windows系统可使用SSHSecureShellClient-3.2.9软件包,下载地址/structure/download Linux系统可直接使用ssh命令登录)。
登录成功后你所在的节点是登录节点,系统会有一些通知信息显示,操作提示符是[username@node34 ~]$。
这个节点是作用户帐号管理,不要在上面运行程序。
2、编译与调试程序请用rsh转到相关作业区节点。
本集群系统共有32个计算节点(每个节点有4个CPU 8G 内存),分为4个作业区。
小作业区small包含4个节点(node1..node4),中型作业区medium包含8个节点(node5..node13),专用作业区long包含8个节点(node13..node20),大作业区large包含12个节点(node21..node32)。
每一个作业区的第一个节点该作业区的服务节点,small为node1,medium为node5,long为node13,large为node21。
例如从登录节点转到一号节点:[hbli@node34 ~]$rsh node1Last login: Mon Aug 28 15:33:16 from node34[hbli@node1 ~]$3、编译链接、运行用户程序串行程序可使用GCC或PGI编译器,并行程序可使用mpicc, mpiCC, mpif77,mpif90进行编译。
以下是一个c使用mpi的例子:/* hello.c *//* MPI sample c program *//* compile "with mpicc -o hello hello" *//* run with "mpirun -np 8 hello" *//* or submit with pbs script "qsub hello.pbs" *//* you can use "qstat" to dislay your job statusa */#include <stdio.h>#include "mpi.h"int main( argc, argv )int argc;char **argv;{int rank, size;MPI_Init( &argc, &argv );MPI_Comm_size( MPI_COMM_WORLD, &size );MPI_Comm_rank( MPI_COMM_WORLD, &rank );printf( "Hello world from process %d of %d\n", rank, size );MPI_Finalize();return 0;}可以用如下命令对上面的程序进行编译:$ [hbli@node1 sample]mpicc –o hello hello.c生成可运行的文件hello,用ls –l 命令可以看到生成的可执行文件:$ [hbli@node1 sample]ls –l-rwxrwxr-x 1 hbli hbli 507375 Oct 10 10:39 hello-rw-r--r-- 1 hbli hbli 532 Jun 20 08:01 hello.c这样就可运行hello 这个程序了。
曙光集群用户使用手册
1. 登录和文件传输登录方式为ssh,与telnet功能类似,推荐的登录工具为putty或者Secure Shell (/html/download/ser/20070917/35112.html,绿色版无需安装)在地址栏输入本集群的登录地址(node1对应的局域网IP),点击“打开”,就会出现登录窗口,输入用户名、密码即可。
文件传输为sftp,与传统ftp类似,但其协议更安全可靠,推荐工具为filezilla。
(https:///p/filezilla/download?filename=FileZilla_3.3.2_win32.zip,绿色版无需安装)输入登录地址222.222.21.29,输入用户名和密码,端口填22(本软件支持ftp,端口为21),点击快速连接,即可使用,操作办法与常用ftp工具类似。
2. 图形窗口支持Linux推荐使用vnc。
vnc可以将用户的操作状态保持在服务器端,即使断开连接也不会影响到正在进行的操作、计算等。
登录到linux服务器中,在命令行运行vncserver。
第一次运行时需要输入VNC登陆用的密码:根据提示输入新的vnc密码。
此密码与用户登录密码无关,将在登录vnc时需要。
此处提示的node1:2即为vnc成功打开的端口。
运行vncclient,输入登录服务器地址和端口号,点确定,输入前面设置的密码,即进入了图形窗口。
注意:1、在第一次启动了vncserver之后,vnc的连接一直可用,全部图形窗口保持在Linux 服务器上。
因此,只在每次服务器重新启动后运行一次vncserver即可,由于用户较多,请勿启动多个。
2、如果需要使用node2的图形界面,可执行ssh -X node2。
3. 作业提交3.1. Fluent3.1.1. 图形方式运行首先通过VNC登陆到图形界面,如果没有Terminal的话在桌面点击左键选择Xterm,输入以下命令即可运行:此处myhosts为用户指定的host文件,内容如下所示:node1node1node1node1node2node2node2node2-t8即指定8个核心参与计算,分别为node1上的4个核心和node2上的4个核心。
曙光IPMI系统管理平台用户使用指南(总10页)
曙光I P M I系统管理平台用户使用指南(总10页)-CAL-FENGHAI.-(YICAI)-Company One1-CAL-本页仅作为文档封面,使用请直接删除用户使用指南目录概述........................................................................................................................... 错误!未指定书签。
智能平台管理接口(IPMI)................................................................... 错误!未指定书签。
基板管理控制器(BMC)....................................................................... 错误!未指定书签。
IPMI的相关配置 ...................................................................................................... 错误!未指定书签。
获取/配置IP地址等信息........................................................................ 错误!未指定书签。
1.在BIOS下进行配置 ........................................................................ 错误!未指定书签。
2.用DOS工具进行获取/配置 ........................................................... 错误!未指定书签。
3.在windows操作系统下配置 ......................................................... 错误!未指定书签。
clusconf 用户手册
Clusconf-1.5.1用户手册曙光信息产业股份有限公司解决方案中心马少杰2013年3月目录第1章高性能集群三要素 (3)第2章clusconf功能介绍 (3)2.1 集群配置功能 (3)2.2 集群管理功能 (3)2.3 IPMI配置及管理功能 (4)第3章使用前要求 (4)第4章安装和配置 (4)4.1 安装clusconf (4)4.2 配置/etc/hosts文件 (4)4.3 配置nfs.cfg 文件 (6)4.4 配置ipmi.cfg文件 (7)第5章Clusconf使用帮助 (8)5.1 clusconf 使用选项 (8)5.2 配置操作(setting Operation) (10)5.3 管理操作(Managing Operation) (11)5.4 IPMI相关操作(IPMI Operation) (12)第6章环境变量说明: (14)第1章高性能集群三要素对于一个高性能集群,至少需要满足三个要求:1 全网全通,实现rsh或ssh的无密码访问2 统一的用户信息,可以通过同步用户信息来实现或配置NIS来实现。
3 统一的文件印象,可以通过nfs(或并行文件系统)来实现。
第2章clusconf功能介绍clusconf为一个设置集群并行环境的程序,能够完成Linux系统下的整个集群的配置、管理。
默认为根据/etc/hosts 表来认定集群中所有的节点,可以通过选项-p prefix和-n number 来自己定义集群中的节点包含功能:2.1 集群配置功能1.为某个用户设置ssh 无密码访问(--set-ssh|-ss)2.为所有用户设置rsh 无密码访问(--set-rsh|-sr)3.按照集群规范设置服务(--set-service|-sv)4.设置整个集群的nfs服务(--set-nfs|-sf)5.按照预定的流程一键配置集群(--set-all|-sa)2.2 集群管理功能1.测试全网是否完全通过(--test-net|-tn)2.显示集群信息(--sys-info|-si)3.显示整个集群的cpu负载(负载大于5%的进程) (--disp-cpu|-dc)4.同步整个集群的用户(--sync-user|-yu)5.添加一个用户到整个集群(--useradd|--adduser|-au|-ua username)6.删除一个用户到整个集群(--deluser|--uerdel|-du|-ud username)7.同步整个集群的时间(--sync-time|-yt)8.同步整个集群的某个文件(--sync-file|-yf file|files|path|paths)9.在整个集群上执行相同的命令(--sync-do|-yd command)2.3 IPMI配置及管理功能1.配置ipmi IP地址(--set-ipmi|-si)2.显示ipmi的IP地址及显示电源状态(--ipmi-info|-ii)3.IPMI远程开机(--ipmi-poweron|-in)4.IPMI 远程关机(--ipmi-poweroff|-if)5.IPMI 远程智能开机,可根据集群的角色自动规划开机顺序(--ipmi-ipoweron|-iin)6.IPMI 远程智能关机,可根据集群的角色自动规划开机顺序(--ipmi-ipoweroff|-iif)第3章使用前要求1 整个集群中所有节点操作系统安装好。
曙光天阔A840r-G用户手册V1.1
硬件及数据损坏负责; 8、 当服务器出现故障时,如果您不能确定故障的原因,请及时与曙光技术支持部门联系以
获得帮助; 9、 如主板 CMOS 电池失效,请使用与本机配备的电池相同型号的电池进行更换,替换下的
的稳定运行,并将可以延长服务器的使用寿命; 2、 请使用带接地保护的三芯电源线与插座,并使用220V 交流电,不正确的电源设置可能
会导致漏电、烧毁、爆炸甚至人身伤害; 3、 请不要在服务器正在运行时插拔背板连线或是移动服务器,否则将可能造成服务器当机
或是部件损坏; 4、 请尽量避免频繁重启或开关机,以延长服务器的使用寿命; 5、 请用户及时备份重要数据,曙光信息产业有限公司不为任何情况导致的数据丢失负责; 6、 请使用正版操作系统及软件,并进行正确配置。曙光信息产业有限公司对由于操作系统
声明及注意事项
感谢您选用曙光服务器!
曙光服务器将给您带来强大的应用支持和全新的性能体验。为了您能够更安全、方便的 使用曙光服务器,在使用之前,请详细阅读本节所提示的信息。
曙光服务器在设计和制造过程中均遵循了严格的标准,以保证您所使用的服务器拥有卓 越的品质和完美的“SUMA”特性。但是服务器属于精密电子设备,在使用过程中仍然可能因 为各种原因而导致异常,所以请务必明确以下事项: 1、 请将服务器放置在阴凉、干燥、通风、洁净、无强磁场的环境中使用,这有助于服务器
电池请妥善回收处理。 曙光信息产业有限公司保留对以上条款的解释权。
再次感谢您选用曙光服务器!
-3-
曙光天阔 A840r-G 服务器用户手册 V1.1
目录
第一章 系统简介 ........................
曙光DS800-G25磁盘阵列用户手册V1.1
本手册的用途在于帮助您正确地使用曙光公司服务器产品(以下称“本产品”),在安装和第一次使用本产品前,请您务必先仔细阅读随机配送的所有资料,特别是本手册中所提及的注意事项。这会有助于您更好和安全地使用本产品。请妥善保管本手册,以便日后参阅。
本手册的描述并不代表对本产品规格和软硬件配置的任何说明。有关本产品的实际规格和配置,请查阅相关协议、装箱单、产品规格配置描述文件,或向产品的销售商咨询。
商标和版权
“SUGON”及图标是曙光信息产业股份有限公司的商标或注册商标。
“曙光”及图标是曙光信息产业股份有限公司的商标或注册商标,文中“曙光信息产业股份有限公司”简称“曙光公司”。
“Intel”、“Xeon”图标是Intel公司的注册商标。
“Microsoft”、“Windows”、“Windows Server”及“Windows Server System”是微软公司的商标或注册商标。
上面未列明的本手册提及的其他产品、标志和商标名称也可能是其他公司的商标或注册商标,并由其各自公司、其他性质的机构或个人拥有。
在本用户手册中描述的随机软件,是基于最终用户许可协议的条款和条件提供的,只能按照该最终用户许可协议的规定使用和复制。
版权所有©2013曙光信息产业股份有限公司,所有权利保留。
本手册受到著作权法律法规保护,未经曙光信息产业股份有限公司事先书面授权,任何人士不得以任何方式对本手册的全部或任何部分进行复制、抄录、删减或将其编译为机读格式,以任何形式在可检索系统中存储,在有线或无线网络中传输,或以任何形式翻译为任何文字。
对于您在本产品之外使用本产品随机提供的软件,或在本产品上使用非随机软件或经曙光公司认证推荐使用的专用软件之外的其他软件,曙光公司对其可靠性不做任何保证。
曙光曙光服务器gridview3.2普通用户手册
Gridview3.2普通用户用户手册DAWNING INFORMATION INDUSTRY CO.,LTD.声明本手册的用途在于帮助您正确地使用曙光公司服务器产品(以下称“本产品”),在安装和第一次使用本产品前,请您务必先仔细阅读随机配送的所有资料,特别是本手册中所提及的注意事项。
这会有助于您更好和安全地使用本产品。
请妥善保管本手册,以便日后参阅。
本手册的描述并不代表对本产品规格和软硬件配置的任何说明。
有关本产品的实际规格和配置,请查阅相关协议、装箱单、产品规格配置描述文件,或向产品的销售商咨询。
如您不正确地或未按本手册的指示和要求安装、使用或保管本产品,或让非曙光公司授权的技术人员修理、变更本产品,曙光公司将不对由此导致的损害承担任何责任。
本手册中所提供照片、图形、图表和插图,仅用于解释和说明目的,可能与实际产品有些差别,另外,产品实际规格和配置可能会根据需要不时变更,因此与本手册内容有所不同。
请以实际产品为准。
本手册中所提及的非曙光公司网站信息,是为了方便起见而提供,此类网站中的信息不是曙光公司产品资料的一部分,也不是曙光公司服务的一部分,曙光公司对这些网站及信息的准确性和可用性不做任何保证。
使用此类网站带来的风险将由您自行承担。
本手册不用于表明曙光公司对其产品和服务做了任何保证,无论是明示的还是默示的,包括(但不限于)本手册中推荐使用产品的适用性、安全性、适销性和适合某特定用途的保证。
对本产品及相关服务的保证和保修承诺,应按可适用的协议或产品标准保修服务条款和条件执行。
在法律法规的最大允许范围内,曙光公司对于您的使用或不能使用本产品而发生的任何损害(包括,但不限于直接或间接的个人损害、商业利润的损失、业务中断、商业信息的遗失或任何其他损失),不负任何赔偿责任。
对于您在本产品之外使用本产品随机提供的软件,或在本产品上使用非随机软件或经曙光公司认证推荐使用的专用软件之外的其他软件,曙光公司对其可靠性不做任何保证。
曙光I840-G10服务器用户手册
本手册中所提及的非曙光公司网站信息,是为了方便起见而提供,此类网站中的信息不是曙光公司产品资料的一部 分,也不是曙光公司服务的一部分,曙光公司对这些网站及信息的准确性和可用性不做任何保证。使用此类网站带 来的风险将由您自行承担。
声明4: 注意: 为减少人身伤害.火灾或设备损坏的危险,为机架供电的交流电源分支电路不得超载。请向制定设备布线和安装要求 的电气机构咨询。
声明5: 注意: 请使用调节式不间断电源 (UPS),以免服务器受到电源波动和临时断电的影响。此设备可防止硬件因电涌和电压峰 值的影响而受损,并且可在电源出现故障时使系统保持正常工作状态。
手册版本 V1.0
版权所有©2012 曙光信息产业股份有限公司
v
天阔 I840-G10 服务器用户手册
·在将静电敏感部件运抵不受静电影响的工作区之前,请将它们放在各自的包装中进行保管。 ·将设备从包中取出,不要放下,直接安装到服务器中。如果需要放下设备,请将它放回防静电包中。请勿将设备放 在服务器外盖或金属表面上。 ·当设备仍然在防静电包中时,将它与服务器外部未上漆的金属表面接触至少2秒。这样可以释放防静电包和您身体 上的静电。 ·减少移动。移动会导致您身体周围的静电积累。 ·握住设备的边缘或框架,小心操作设备。 ·请勿触摸焊接点.引脚或裸露的电路。 ·请勿将设备放在其他人可以接触和损坏它的地方。 ·在触摸静电敏感元件或装置时,一定要采取适当的接地措施。 ·在寒冷的天气操作设备时应格外小心。供暖系统会降低室内湿度并增加静电。
防止静电释放的接地方法 接地的方法有几种。在取放或安装静电敏感部件时,您可以使用以下一种或多种接地方法: ·您可以使用腕带,该腕带利用接地线与接地的工作区或计算机机箱相连。腕带必须能够灵活伸缩,而且接地线的 电阻至少为1兆欧姆10%。要达到接地目的,佩戴时请将腕带紧贴皮肤。 ·在立式工作区内,请使用脚跟带.脚趾带或靴带。当您站在导电地板或耗散静电的地板垫上时,请在双脚上系上带 子。 ·请使用导电的现场维修工具。 ·配合使用耗散静电的折叠工具垫和便携式现场维修工具包。
QBD-CB-UMD-201803280018 曙光天阔I620-G30用户手册V1.3(2)
商标和版权
“SUGON”及图标是曙光信息产业股份有限公司的商标或注册商标。 “中科曙光”及图标是曙光信息产业股份有限公司的商标或注册商标,文中“曙光信息产业股份有限公司”简称“曙 光公司”。 “Intel”、“Xeon”图标是 Intel 公司的注册商标。 “Microsoft”、“Windows”、“Windows Server”及“Windows Server System”是微软公司的商标或注册商标。 上面未列明的本手册提及的其他产品、标志和商标名称也可能是其他公司的商标或注册商标,并由其各自公司、其 他性质的机构或个人拥有。 在本用户手册中描述的随机软件,是基于最终用户许可协议的条款和条件提供的,只能按照该最终用户许可协议的 规定使用和复制。 版权所有©2013 曙光信息产业股份有限公司,所有权利保留。 本手册受到著作权法律法规保护,未经曙光信息产业股份有限公司事先书面授权,任何人士不得以任何方式对本手 册的全部或任何部分进行复制、抄录、删减或将其编译为机读格式,以任何形式在可检索系统中存储,在有线或无 线网络中传输,或以任何形式翻译为任何文字。
声明 4: 【注意】
为减少人身伤害、火灾设备损坏的危险,为机架供电的交流电源分支电路不得超载。请向制定设备布线和安装要 求的电气机构咨询。
声明 5: 【注意】
请使用调节式不间断电源(UPS),以免服务器受到电源波动和临时断电的影响。此设备可防止硬件因电涌和电压 峰值的影响而受损,并且可在电源出现故障时使系统保持正常工作状态。
服务器的连接处。
危险警告声明vii
目录
声明........................................................................................................................................ii 商标和版权.......................................................................................................................... iii 电源相关的操作说明...........................................................................................................iv 危险警告声明.......................................................................................................................vi 目录.................................................................................................................................... viii 插图目录...............................................................................................................................xi 表格目录..............................................................................................................................xv 1 产品简介........................................................................................................................... 1
曙光MPI用户手册(TC1700&TC4000L)
曙光MPI用户手册(TC1700 & TC4000L)曙光信息产业有限公司2003-9目录MPI的使用 (1)1.MPI简介 (1)2.MPI的程序设计 (1)2.1 MPI的基本功能 (1)2.2 MPI的几个重要元素 (2)2.3 消息 (2)2.4 point-to-point通信 (3)2.5 集群通信 (5)3. MPI应用程序的编译 (6)3.1 环境设置 (6)3.2 make (6)3.3 mpif77和mpicc (7)4. MPI应用程序的运行 (8)5. 常见问题分析 (8)附录MPI函数简表 (9)MPI的使用1.MPI简介MPI(M essage P assing I nterface)是消息传递接口的标准,当前通用的是MPI1.2规范。
不久前制定的MPI2.0规范除支持消息传递外,还支持MPI的I/O规范和进程管理规范。
MPI正成为并行程序设计事实上的工业标准。
MPICH含三层结构,最上层是MPI的API,基本是点到点通信和点到点通信基础上构造的集群通信(Collective Communication);中间层是ADI层(Abstract Device Interface),其中device可以简单地理解为某一种底层通信库,ADI就是对各种不同的底层通信库的不同接口的统一标准;最下层是具体的底层通信库,例如工作站机群上的p4通信库。
MPICH在不同平台上的实现都是根据不同的device(即平台或底层通信)实现不同的ADI 接口,这种实现机制的好处有:将与device有关和无关的代码分开,减小实现难度;利于MPI的不断升级;提高MPI的性能。
2.MPI的程序设计2.1 MPI的基本功能MPI1.2标准中没有对如何产生多个MPI进程作标准性规定,而把这一工作交给了具体的实现。
但是它有如下众所周知的假设:静态加载,即所有进程在加载完以后就全部确定,直至整个程序结束才终止,在程序正常运行期间没有进程的创建和结束。
集群及其使用说明
浙江大学大气污染控制实验室集群使用1系统概况计算系统共有6台曙光I620-G10。
每台计算节点配置Intel E5-2650处理管理登入存储节点为曙光I620-G10,节点配置Intel E5-2609处理器,16G工作站为曙光W580I,节点配置Intel E5-2609处理器,12G 1333MHz2集群配置3 节点配置及IP4. 账号管理该集群中有两个用户组,即apclab与visitor组,本实验组人员归apclab组管理,外来游客归visitor组管理。
(1)创建用户(apclab组)[root@node1 home]# clusconf -au test1REMOTE_SH using ssh/scpOperation is done in following hosts:node1 node2 node3 node4 node5 node6 node7node3: ssh: connect to host node3 port 22: No route to hostpdsh@node1: node3: ssh exited with exit code 255Now add user: test1 on the Whole cluster5.. 4.. 3.. 2.. 1..Input the Home directory for user:test1[/public/home/test1]: /public/home/apclab /test1Input the Group Name for user:test1[users]: apclabInput the uid for user:test1[504]:Changing password for user test1.New password:Retype new password:passwd: all authentication tokens updated successfully.Now Synchronize user and group on the Whole cluster5.. 4.. 3.. 2.. 1..========node1=================node2=================node3=================node4=================node5=================node6=================node7=========adduser test1 on the whole cluster successfully!初始密码:apclab;123(2)创建用户(visitor组)[root@node1 home]# clusconf -au guest1REMOTE_SH using ssh/scpOperation is done in following hosts:node1 node2 node3 node4 node5 node6 node7node3: ssh: connect to host node3 port 22: No route to hostpdsh@node1: node3: ssh exited with exit code 255Now add user: guest1 on the Whole cluster5.. 4.. 3.. 2.. 1..Input the Home directory for user:guest1[/public/home/guest1]: /public/home/visitor/guest1 Input the Group Name for user:guest1[users]: visitorInput the uid for user:guest1[505]:Changing password for user guest1.New password:BAD PASSWORD: it does not contain enough DIFFERENT charactersBAD PASSWORD: is a palindromeRetype new password:passwd: all authentication tokens updated successfully.Now Synchronize user and group on the Whole cluster5.. 4.. 3.. 2.. 1..========node1=================node2=================node3=================node4=================node5=================node6=================node7=========adduser guest1 on the whole cluster successfully!初始密码:111111(3)删除用户[root@node1 home]# clusconf -du test2REMOTE_SH using ssh/scpOperation is done in following hosts:node1 node2 node3 node4 node5 node6 node7node3: ssh: connect to host node3 port 22: No route to hostpdsh@node1: node3: ssh exited with exit code 255Now del user: test2 on the Whole cluster5.. 4.. 3.. 2.. 1../public/home/test2Do you want to delete Home path: /public/home/test2 for test2(n/y)[n]: y(删去家目录,节省空间)Now Synchronize user and group on the Whole cluster5.. 4.. 3.. 2.. 1..========node1=================node2=================node3=================node4=================node5=================node6=================node7=========deluser test2 on the whole cluster successfully!(4)apclab组的共享目录(/public/home/apclab/test1)/public/home/apclab/test1,目前所设置的权限为只读,设置方法:[root@node1 apclab]# chmod 750 /public/home/apclab/test1 -R如果设置的权限为可读可写,设置方法:[root@node1 apclab]# chmod 770 /public/home/apclab/test1 –R5.存储使用管理目前分别有两个存储资源,即/dev/sdb,/dev/sdc分别挂在/public,/data; /public目录通过NFS方式映射给node2~7节点使用;/data通过NFS方式映射给com-gpu节点使用。
曙光Cloudview云计算操作系统COC_v1.5.2-用户手册
COC中面向管理员的管理虚拟数据中心,按照服务等级将物理资源进行划分,并池化为虚拟资源;
COC中管理员可以看到用户的虚拟数据中心的统计信息;
CSP中面向用户的用户虚拟数据中心,为用户提供对虚拟机或细粒度的虚拟CPU、虚拟内存、虚拟网卡、虚拟存储以及IP等资源的管理视图。
图21系统登录界面
系统管理员登录默认用户名为:admin,初始密码为:888888。
系统管理员使用初始用户名、密码成功登录后,在系统主界面右上角点击“修改密码”按钮,可执行修改密码操作。
图22修改密码按钮
系统管理员在主界面右上角点击系统管理下“关于Cloudview”,可查看系统版本信息。
图23版本信息
本手册中所提及的非曙光公司网站信息,是为了方便起见而提供,此类网站中的信息不是曙光公司产品资料的一部分,也不是曙光公司服务的一部分,曙Байду номын сангаас公司对这些网站及信息的准确性和可用性不做任何保证。使用此类网站带来的风险将由您自行承担。
本手册不用于表明曙光公司对其产品和服务做了任何保证,无论是明示的还是默示的,包括(但不限于)本手册中推荐使用产品的适用性.安全性.适销性和适合某特定用途的保证。对本产品及相关服务的保证和保修承诺,应按可适用的协议或产品标准保修服务条款和条件执行。在法律法规的最大允许范围内,曙光公司对于您的使用或不能使用本产品而发生的任何损害(包括,但不限于直接或间接的个人损害.商业利润的损失.业务中断.商业信息的遗失或任何其他损失),不负任何赔偿责任。
对于您在本产品之外使用本产品随机提供的软件,或在本产品上使用非随机软件或经曙光公司认证推荐使用的专用软件之外的其他软件,曙光公司对其可靠性不做任何保证。
曙光集群用户使用手册
1. 登录和文件传输登录方式为ssh,与telnet功能类似,推荐的登录工具为putty或者Secure Shell (,绿色版无需安装)在地址栏输入本集群的登录地址(node1对应的局域网IP),点击“打开”,就会出现登录窗口,输入用户名、密码即可。
文件传输为sftp,与传统ftp类似,但其协议更安全可靠,推荐工具为。
(,绿色版无需安装)输入登录地址222.222.21.29,输入用户名和密码,端口填22(本软件支持ftp,端口为21),点击快速连接,即可使用,操作办法与常用ftp工具类似。
2. 图形窗口支持Linux推荐使用vnc。
vnc可以将用户的操作状态保持在服务器端,即使断开连接也不会影响到正在进行的操作、计算等。
登录到linux服务器中,在命令行运行vncserver。
第一次运行时需要输入VNC登陆用的密码:根据提示输入新的vnc密码。
此密码与用户登录密码无关,将在登录vnc时需要。
此处提示的node1:2即为vnc成功打开的端口。
运行vncclient,输入登录服务器地址和端口号,点确定,输入前面设置的密码,即进入了图形窗口。
注意:1、在第一次启动了vncserver之后,vnc的连接一直可用,全部图形窗口保持在Linux 服务器上。
因此,只在每次服务器重新启动后运行一次vncserver即可,由于用户较多,请勿启动多个。
2、如果需要使用node2的图形界面,可执行ssh -X node2。
3. 作业提交3.1. Fluent3.1.1. 图形方式运行首先通过VNC登陆到图形界面,如果没有Terminal的话在桌面点击左键选择Xterm,输入以下命令即可运行:此处myhosts为用户指定的host文件,内容如下所示:node1node1node1node1node2node2node2node2-t8即指定8个核心参与计算,分别为node1上的4个核心和node2上的4个核心。
在图形界面下导入cas和data文件,修改和设置边界条件等并计算(和在windows下操作单机版Fluent相同,略):注:通过VNC使用图形界面方式运行fluent时,无需保持PC机与服务器的连接,只要vncserver没有重新启动,即可随时连接到原有的窗口。
曙光DS6310系列磁盘阵列用户快速使用指南
曙光 DS6310 系列磁盘阵列用户快速 使用指南 V1.0
曙光信息产业(北京)有限公司
1
目录
1 磁盘阵列快速安装..........................................................................................................................4
3.2 阵列加电 ...............................................................................................................................58 3.3 使用 CLI 配置磁盘阵列 .......................................................................................................59
4 单独使用磁盘扩展柜 JB6310/6312EE........................................................................................63
曙光集群简明使用手册
技术支持中心
2018/9/5
曙光集群系统使用和管理
1/56
目录
一、曙光集群的概念
二、曙光集群系统整体架构
三、曙光集群的使用
远程登录系统
上传下载数据
Linux常用5 曙光集群系统使用和管理 2/56
一、曙光集群的概念
2018/9/5
安装和运行程序
2018/9/5
曙光集群系统使用和管理
2018/9/5
曙光集群系统使用和管理
19/56
Putty简介
完全免费;
在Windows 9x/NT/2000/Win7下运行的都非常好;
全面支持ssh1和ssh2;
绿色软件,无需安装,解压后即可使用;
体积很小,仅364KB (0.54 beta版本); 操作简单,所有的操作都在一个控制面板中实现。
2018/9/5
曙光集群系统使用和管理
24/56
VNC连接Linux远程桌面
关闭VNC远程桌面:
[dawn@node110 ~]$ vncserver -kill :1 Killing Xvnc process ID 22016
重新打开VNC远程桌面:
[dawn@node110 ~]$ vncserver New 'X' desktop is node110:1
32/56
查询Linux命令使用方法:man
man是“manual”的简写,可查询Linux常用命令的手册。 格式:man [关键字]
2018/9/5
曙光集群系统使用和管理
33/56
显示文件列表:ls
ls是“list”的简写,用来显示指定目录下的内容。 格式:ls [参数] [路径或文件名]
曙光集群系统及其使用
曙光信息产业股份有限公司 技术支持中心 赖雍兵 laiyb@
提
纲
一、曙光集群的概念
二、曙光集群系统整体架构
三、曙光集群日常使用、管理和维护
一、曙光集群的概念点)按
某种结构连接起来,在并行化设计及可视化人机交互集成
三、曙光集群的日常管理与维护
日常使用过程中需要注意的事项
1. 环境卫生:做好防尘,不得将计算机安置于粉尘高 的环境中 2. 环境要求:环境温度20℃~25℃,湿度保持在40% ~70%,清洁度要求机房尘埃颗粒直径小于0.5μm 等 3. 电源要求:配备UPS,对集群进行电源保护 4. 散热的要求:空调气流需根据热气流流动方向冷却 5. 不能频繁的开关机,关机使用系统命令,不得通过 断电关机 6. 在硬盘写入数据过程中不可断电 7. 若有磁盘阵列,开机需先开盘阵,再开机器,关机 后再关盘阵
– export PATH= /home/your_account/your_workdir/:$PATH
– your_code
运行并行程序(1)
• 确认自己的并行环境 • which mpirun
– /usr/bin/mpirun则是lam/mpi
– /usr/local/mpich-1.2.5.2/bin/mpirun则是mpich
曙光集群
• 曙光集群是使用千兆网络(千兆交换机)或者myrinet、 infiniband等高速网络将节点机网络连接,进行高性能计算 • 使用百兆网络连接,进行网络管理监控 • 一个节点就是一台机器,N台机器通过连接高速网、安装系 统(系统的一致性,即系统配置必须一致)、调试并行环境、 安装应用软件来进行计算 • 曙光集群可扩展性强,如果用户购买的CPU数量不能满足需 要,可以无限制的增加、扩展节点个数来增加CPU数量 • 曙光集群的易管理性:DCMS、DCMM、Mterm、DCIS等监控管 理软件,协助管理集群系统
曙光DS8系列磁盘阵列用户手册V1.0
曙光DS8340 系列磁盘阵列®用户手册V1.0声明●本手册所含内容若有任何改动,恕不另行通知。
●在法律法规的最大允许范围内,曙光信息产业有限公司除就本手册和产品应负的瑕疵担保责任外,无论明示或默示,不作其他任何担保,包括(但不限于)本手册中推荐使用产品的适用性和安全性、产品的适销性和适合某特定用途的担保。
●在法律法规的最大允许范围内,曙光信息产业有限公司对于您的使用或不能使用本产品而发生的任何损害(包括,但不限于直接或间接的个人损害、商业利润的损失、业务中断、商业信息的遗失或任何其他损失),不负任何赔偿责任。
●对于在非曙光存储系统上使用曙光存储管理软件,曙光信息产业有限公司对其使用的可靠性或带来的损失概不负责。
注意:使用存储设备之前,请先阅读用户手册。
安全警告和注意事项一、安全警告本手册是供有安装和配置存储设备经验的专业技术人员或用户使用。
1、避免受伤为了避免安装、搬运或拆卸存储设备时人员受伤,请用户尽量避免接触机箱上比较尖锐的地方,注意小心轻放。
2、系统供电①系统电源接通和断开存储设备后部的电源按钮并不能完全断开存储设备系统内部的交流电源。
任何时候在执行本手册中的相关拆装设置操作之前,必须将电源线插头从交流电源插座中拔下。
否则,有可能会造成人员受伤或设备损坏。
②电源的危险状况电源内始终存在危险的电压、电流。
在电源中没有任何用户可维修的零件;维修必须由专业的技术人员来进行。
③设备和电缆的危险状况电源线、电话线和通信电缆可能存在危险的电气状况。
在拆开机箱之前,按电源按钮关闭存储设备,从交流电源、通信系统、网络设备上拔下电源线。
否则,有可能造成人员受伤或设备损坏。
二、注意事项1、静电放电(ESD)和ESD保护所有操作必须在静电放电(ESD)工作台上执行,因为存储设备的部件对静电非常敏感。
如果没有所要求的工作环境,可通过下列方法减小静电放电(ESD)的危害:①戴上防静电腕带,将其连至存储设备的金属机箱表面。
曙光高性能集群系统使用及管理-201408
解决方案中心 2014 年 8 月
目录
集群系统的登录方式
程序编译与作业提交 使用 Gridview和ClusPortal 提交和管理作业 集群系统的管理与维护
命令行终端登录
Windows 用户可以用SSH Secure Shell Client,Xshell, PuTTY,SecureCRT 等 SSH客户端软件登录。 推荐使用SSH Secure Shell Client
简单脚本提交示例:
$ vim test.pbs $ qsub test.pbs
PBS 作业提交步骤
准备:编写描述改作业的脚本,包括作业名,需要的资源等。 提交:使用qsub命令将该作业提交给PBS服务器
排队:服务器将该任务排入适当的队列
调度:服务器检查各工作节点的状态是否符合该作业的要求,并进 行调度。 执行:当条件满足时,作业被发给相应的执行服务器执行。程序运 行时执行服务器会收集程序的标准输出和标准错误流,等程序结束 时,将这些信息返回给用户。 查询和调整:当作业在运行时,用户可以使用qstat进行状态查询。 用户发现作业提交错误时,可以使用qdel删除正在运行的作业。 查看结果:使用文本编辑软件vi或者系统命令cat, less等查看输出及 错误信息显示。
Windows 用户推荐使用RealVNC软件,登录时输入集群 登录节点IP地址加VNC会话号即可:
$ vncviewer [登录节点IP地址]:[session number]
Linux 用户可直接在命令行终端中执行 vncviewer 命令
Gridview Web 登录
普通用户可通过Web方式登入曙光GridView集群管理系统, 进行查看、监控、和使用等操作。 在浏览器中输入以下URL即可出现登录界面:ห้องสมุดไป่ตู้
曙光集群简明使用手册共58页
谢谢!Байду номын сангаас
曙光集群简明使用手册
6、纪律是自由的第一条件。——黑格 尔 7、纪律是集体的面貌,集体的声音, 集体的 动作, 集体的 表情, 集体的 信念。 ——马 卡连柯
8、我们现在必须完全保持党的纪律, 否则一 切都会 陷入污 泥中。 ——马 克思 9、学校没有纪律便如磨坊没有水。— —夸美 纽斯
10、一个人应该:活泼而守纪律,天 真而不 幼稚, 勇敢而 鲁莽, 倔强而 有原则 ,热情 而不冲 动,乐 观而不 盲目。 ——马 克思
21、要知道对好事的称颂过于夸大,也会招来人们的反感轻蔑和嫉妒。——培根 22、业精于勤,荒于嬉;行成于思,毁于随。——韩愈
23、一切节省,归根到底都归结为时间的节省。——马克思 24、意志命运往往背道而驰,决心到最后会全部推倒。——莎士比亚
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.登录和文件传输登录方式为ssh,与telnet功能类似,推荐的登录工具为putty或者Secure Shell (,绿色版无需安装)在地址栏输入本集群的登录地址(node1对应的局域网IP),点击“打开”,就会出现登录窗口,输入用户名、密码即可。
文件传输为sftp,与传统ftp类似,但其协议更安全可靠,推荐工具为filezilla。
(,绿色版无需安装)输入登录地址,输入用户名和密码,端口填22(本软件支持ftp,端口为21),点击快速连接,即可使用,操作办法与常用ftp工具类似。
2.图形窗口支持Linux推荐使用vnc。
vnc可以将用户的操作状态保持在服务器端,即使断开连接也不会影响到正在进行的操作、计算等。
登录到linux服务器中,在命令行运行vncserver。
第一次运行时需要输入VNC登陆用的密码:根据提示输入新的vnc密码。
此密码与用户登录密码无关,将在登录vnc时需要。
此处提示的node1:2即为vnc成功打开的端口。
运行vncclient,输入登录服务器地址和端口号,点确定,输入前面设置的密码,即进入了图形窗口。
注意:1、在第一次启动了vncserver之后,vnc的连接一直可用,全部图形窗口保持在Linux 服务器上。
因此,只在每次服务器重新启动后运行一次vncserver即可,由于用户较多,请勿启动多个。
2、如果需要使用node2的图形界面,可执行ssh -X node2。
3.作业提交3.1.Fluent3.1.1.图形方式运行首先通过VNC登陆到图形界面,如果没有Terminal的话在桌面点击左键选择Xterm,输入以下命令即可运行:此处myhosts为用户指定的host文件,内容如下所示:node1node1node1node1node2node2node2node2-t8即指定8个核心参与计算,分别为node1上的4个核心和node2上的4个核心。
在图形界面下导入cas和data文件,修改和设置边界条件等并计算 (和在windows下操作单机版Fluent相同,略):注:通过VNC使用图形界面方式运行fluent时,无需保持PC机与服务器的连接,只要vncserver没有重新启动,即可随时连接到原有的窗口。
3.1.2.命令行方式运行建立script1文件:script1内容如下:(注:其中为cas文件名,根据实际进行修改;solve/iterate 25 表示迭代25步,也可根据需要修改步数。
)用命令行进行fluent计算:此处myhosts为用户指定的host文件,内容如下所示:node1node1node1node1node2node2node2node2-t8即指定8个核心参与计算,分别为node1上的4个核心和node2上的4个核心。
3.1.3.作业调度方式运行注:PBS只持Fluent命令行运行方式的作业提交1.编译脚本script1,内容如下(与上面脚本运行方式相同):file/rcd 25/file/wcdparallel/timer/usageexityes2.编辑pbs脚本,内容如下:#!/bin/bash#PBS -N job1-8cpu#PBS -l nodes=1:ppn=8#PBS -j oeINPUTFILE=script1OUTPUTFILE=cd $PBS_O_WORKDIR## indicate using ib protocal and the udapl way. t8 indicates using# 8 processors#NP=`cat $PBS_NODEFILE | wc -l`datefluent 3d -t$NP -cnf=$PBS_NODEFILE -g -i $INPUT >& $OUTPUTdateexit 0提交作业:qsub用qstat -a和pbsnodes -a以及top命令查看作业是否正常排队运行。
注:红色字体部分需要根据实际情况改动,黑色字体为固定格式的内容。
3.1.4.获取计算结果1.如果用图形界面的方式运行fluent,可以在菜单中选择选择保存dat文件到当前工作目录或其他某个目录下,然后用ftp软件将dat文件下载到终端pc机上,即可进行后处理。
2.如果用命令行的方式运行fluent, dat文件自动保存到当前目录,文件名由script1文件的内容决定(例如“file/wcd ”则表示dat文件为),用软件将dat文件下载到终端pc机上,即可进行后处理。
3.2.Ansys作业3.2.1.图形方式运行通过vnc登录以后,运行launcher121,即可进入ansys界面,选择相关的模块点击run 即可。
3.2.2.命令行方式运行在命令行方式下,不能进行交互的图形操作,所有的命令需要通过命令流来实现。
假设写好的命令流文件为,运行方式如下:单节点:ansys121 -np 16 -i >& &多节点运行:ansys121 -dis -machines node1:16:node2:16 -i >& &3.2.3.作业调度方式运行编写一个pbs脚本如下所示:#!/bin/bash#PBS -j oe###################what you just need and could edit are between the two lines#######################PBS -N my_ansys_test#PBS -l nodes=1:ppn=16INPUTFILE=OUTPUTFILE=###############################################theend##############################################cd $PBS_O_WORKDIRnp=1for NODE in `cat $PBS_NODEFILE`; dohost=$NODEif [ ! -z $lasthost ]; thenif [ $host = $lasthost ]; thennp=`expr $np + 1`elseif [ -z $mList ]; thenmList=$lasthost:$npelsemList=$mList:$lasthost:$npfinp=1fifilasthost=$hostdoneif [ -z $mList ]; thenmList=$lasthost:$npelsemList=$mList:$lasthost:$npfiansys121 -dis -machines $mList -i $INPUTFILE -o $OUTPUTFILE写完以后提交方式与fluent相同,qsub 即可。
3.3.CFX作业3.3.1.图形方式运行在图形窗口中运行cfx5即可。
3.3.2.命令行方式运行CFX支持PVM和MPI两种方式的并行,通常MPI的性能更好一些,建议采用。
同时还有Local和Distributed两种运行模式,单机上建议采用Local模式,而跨节点时只能采用Distributed模式。
cfx5solve命令可直接进入求解模式。
cfx5solve -def -par-dist 'node1*8'在本机上用8个核心并行cfx5solve -def -par-dist 'node1*8,node2*8'采用2个节点各8个核心进行分布式并行计算3.3.3.作业调度方式运行[test@node34 cfxbm]$ cat#!/bin/bash#PBS -N CFX_8cpu#PBS -l nodes=1:ppn=8INPUTFILE=OUTPUTFILE=######################################################################## You don't need to modify the lines below ########################################################################PeHostfile2MachineFile(){cat $1 | while read line; do# echo $linehost=`echo $line`# add here code to map regular hostnames into ATM hostnamesif [ -z $mList ]; thenmList=$host"*1"elsemList=$mList,$host"*1"fiecho $mListdone}CFX_PBS_NODEFILE="/tmp/cfx_`whoami`_$PBS_JOBID"PeHostfile2MachineFile $PBS_NODEFILE | sed "s#bnode#node#g" >$CFX_PBS_NODEFILENPROCS=`wc -l $PBS_NODEFILE`cd $PBS_O_WORKDIRcfx5solve -def $INPUTFILE -par-dist `tail -n1 $CFX_PBS_NODEFILE`写完脚本就可以按如下方式提交作业:[test@node34 cfxbm]$ qsub3.4.ABAQUS作业3.4.1.图形方式运行在图形窗口中运行abaqus cae即可。
3.4.2.命令行方式运行单节点运行:abaqus -j cpus=8跨节点运行:首先需要添加指定运行节点。
在工作目录进行以下操作:echo "mp_host_list=[[\‘node1\’,8],[\‘node2\’,8]]" >表示分别从node1、node2调用8个core来进行计算。
设置好了环境变量以后,通过abaqus -j cpus=16 int来运行。
3.4.3.作业调度方式运行[test@node34 cfxbm]$ cat#!/bin/bash#PBS -N abaqus_job#PBS -l nodes=2:ppn=8#PBS -j oe####change your input file and jobname here ####INPUTFILE=JOB=`echo $INPUTFILE |cut -d "." -f 1`cd ${PBS_O_WORKDIR}source /public/software/cpus=$(wc -l $PBS_NODEFILE | awk '{print $1}')mp_host_list="["for n in $(sort -u $PBS_NODEFILE)domp_host_list="${mp_host_list}['$n',$(grep -c $n $PBS_NODEFILE)],"donemp_host_list=$(echo ${mp_host_list} | sed -e "s/,$/]/")echo "mp_host_list=${mp_host_list}" >STARTTIME=`date`####the main execute commandabaqus job=${JOB} cpus=${cpus} mp_mode=mpi standard_parallel=all interactive ENDTIME=`date`echo "the job start at :${STARTTIME}"echo "the job end at :${ENDTIME}"3.5.Web提交使用IE打开并使用对应的用户名和密码登陆,点击作业调度-作业提交集群名称为唯一的选项Cluster_node。