GPU提交作业方法详细介绍-1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目前GPU平台提供以下两种使用方式,禁止直接在登录节点上运行程序。
1. 任务提交方式:qsub
提交作业例子:
$qsub mpi.pbs
作业提交例子脚本mpi.pbs:
#!/bin/bash
#PBS -N test (作业名,限15 个字符,首字符为字母,无空格) #PBS -l nodes=2:ppn=8 (请求N 个节点,每个节点M 个处理器)
#PBS -l walltime=07:30:00 (估计最大运算时间为1000 小时,若没有设置这项,系统为自动按所在队列默认walltime 处理)
#PBS -j oe (将标准输出信息与标准错误信息合并输出到文件) (#PBS –q XXX)
#PBS –m e (发送邮件给用户,n 不发送邮件;a 当作业被批处理系统中断时,发送邮件;b 当作业开始执行时,发送邮件;e 当作业执行结束时,发送邮件)
#PBS –M XXXX@ (申明邮箱地址)
cd $PBS_O_WORKDIR (进入作业调度目录)
MPI_HOME=/state/partition1/soft/compiler/mvapich2/1.2p1/gcc.pgf90
NSLOTS=`cat ${PBS_NODEFILE} | wc -l` (计算申请到的cpu数目)
time -p ${MPI_HOME}/bin/mpirun_rsh -ssh -np ${NSLOTS} -hostfile ${PBS_NODEFILE} ./XXX chn >&out.dat (程序运行部分,XXX为程序名,chn为输入数据,out.dat为输出数据)exit 0 (退出)
2. 直接使用命令行方式登录计算节点提交作业。
方法:
首先通过ssh登录
进去后先查看哪些计算节点是空闲的,有2种方法:
1. 输入pestat命令
看到所有计算节点状况,其中状态为“free”的就是空闲计算节点。
2. 进入ganglia网页查看:/ganglia/
网页下方各节点状况图中,白色图的、名字以compute开头的节点属于空闲计算节点。
注意:
提供给用户使用的30个计算节点是从compute-0-19到compute-0-48。选择空闲计算节点的顺序应该从标号由大到小的顺序选,如compute-0-37到compute-0-48空闲时,应先选compute-0-48,其次compute-0-47这样。
输入: ssh 空闲计算节点
即可登录到相应的空闲计算节点。
如:$ssh compute-0-43
compute-0-43是空闲计算节点名