浪潮培训教材

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

四:计算任务投放
❖ PBS基本组件
pbs command:用于提交、监视、修改和删除 作业。
pbs server: 提供基本的批处理服务,例如接 收/创建一个批处理作业,管理维护作业队列, 管理输出结果等。
Inspur group
二:登录、退出系统连接
1. 登录方式
SSH: 缺省提供,该登录方式有一定强度的加密安全保证 软件可以使用Putty等
2. 文件上传与下载
SFTP: 缺省提供,暂不提供FTP方式 软件可以使用SecureFX、WinSCP等
3. 登录系统后的必要操作
使用mail命令,检查系统发送给用户的通知和信息 在属主目录下使用命令 du -kh | sort -n ,查看异常或较大的文件,并做相 应的清理
5. 不能在属主目录(登陆目录)下存放任务临时文件,必须在工作目(lustre) 录中存放临时文件。
6. 不能在登陆节点上直接运行任务,只能在登陆节点做简单的 vi编辑、查看、 管理自己的数据以及程序。
7. 刀片节点单个任务不能超过24GB内存。大内存任务投放至fuque上。
Inspur group
软件信息 RedHat AS 5 update3 (内核2.6.18-128) Intel C++/Fortran 编译器/ Intel MKL数学核心库 Gaussian vasp Wien2k intel mpi 3.1 TSJM/PBS 浪潮天梭监管软件2.1
Inspur group
图例:
集群物理拓扑图
保存退出后 source ~/.bashrc
❖ 使用命令 du -kh | sort -n ,查看异常或较大的文件
Inspur group 2020/6/17
三:属主目录使用
1. 属主目录为登录后缺省进入的目录: /home/<研究室>/<yourid>
2. 属主目录用于系统存放管理用户的登陆和所使用软件配置文件,严禁用户随 意存放执行程序的临时文件和非相关的文件,避免占用和耗费宝贵的系统存储 资源,影响登陆连接服务。每次登陆后在属主目录下使用命令 du -kh | sort –n 主动检查。异常或较大的文件并作相应清理。 3. 属主目录可以安装个人所需软件,如果软件所占空间较大,请联系管理员, 修改属主目录文件配额。
二:登录、退出系统连接
❖ 登陆天梭集群系统
ssh -l (your count) 202.127.207.132
❖ 第一次登陆设置环境变量
vi ~/.bashrc
source /opt/intel/impi/3.1/bin64/mpivars.sh source /opt/intel/cce/10.1.021/bin/iccvars.sh source /opt/intel/fce/10.1.021/bin/ifortvars.sh source /opt/intel/mkl/10.2.2.025/tools/environment/mklvarsem64t.sh
Inspur group
四:计算任务投放
1.不论任务有多紧急,请务必先检测提交程序的正确性以及资源占用的合理适 度,通过小批量测试数据预估占用CPU、内存和存储资源,强烈建议进行代码 优化以减少CPU、内存、I/O资源占用,及时释放申请的内存,优化文件目录 读写访问等I/O功能,避免资源和计算时间的浪费。
集群的软硬件配置
管理节点 登录节点 I/O节点 网格节点 计算节点 胖节点
存储 管理网络 计算网络
操作系统 编译器/数学库
应用软件 MPI实现 作业调度 集群管理
硬件信息 NF5220*1 2*146G SAS raid1 NF5220*1 2*146G SAS raid1 NF5220*1 2*146G SAS raid1 NF5220*2 5*300G SAS raid5 NX7140N*112 64G SSD NF560D2*2 1*146G SAS AS400 8*1T raid5 (1 热备盘) H3C千兆以太网 Qlogic 9120
Inspur group
二:登录、退出系统连接
4. 长时间误操作,请结束访问,避免占用系统百度文库源 5. 结束系统访问必要操作
非停电、断网等意外设备故障导致,严禁在终端上直接关闭访问窗口或直 接关闭终端电源实现结束系统访问。
SSH访问必需主动使用exit命令一到多次确保最终结束连接。
Inspur group
2. 大规模资源占用(占用实际内存超过1/4)或紧急任务时务必先联系管理员协调。 3. 计算任务提交后,应注意定时查看自己任务状态,当需要杀死自己进程或删 除任务时,以用qdel命令, 如果无法删除必要时联系主机组协助。 4. 应及时清除临时文件和计算中程序设计生成的监控跟踪记录文件。临时性文 件存放不要超过三个月。重要数据应打包或再压缩存放。
Inspur group
内容提要
账号的申请和使用 登录、退出系统连接 属主目录使用 计算任务投放 存储空间使用 软件安装及使用规范 关机和启动 维护人员联系方式
Inspur group
一:账号的申请和使用
1. 严禁使用集群账号及计算、存储资源进行与账号所属项目无关的任何活动和行 为,违者必究并将视影响、损失轻重予以锁闭账号等处理。 2. 主机资源申请,联系系统管理员进行申请。管理员联系方式见本指南维护人员 联系方式。 3. 建议避免公用账号,避免项目移交的时候数据混乱。 4. 人员发生调动时,请调动人员做好数据移交,并及时通知管理员申请权限改动。 5. 临时用户项目结束或阶段性完成时,请及时通知管理员清理/锁闭/注销临时账 号及项目组成员账号。 6. 注销账号时请整理好用此账号建立的所有数据,做好移交及备份清理工作,并 至少提前一天通知管理员。 7. 数据和程序(非公用程序)文件一律存放于自己的属主目录下,计算临时文件 存放于工作目录下(lustre),计算临时文件不得存放于自己的属主目录下。 8. 个人账号只限个人使用,严禁将帐号和密码泄露给外单位和项目组外人员,公 共组账号由管理员负责控制和使用分发。 9. 密码应定期(三个月)更换,建议8位以上并注意加强密码复杂度。
相关文档
最新文档