GPU提交作业方法详细介绍-1

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

目前GPU平台提供以下两种使用方式,禁止直接在登录节点上运行程序。

1. 任务提交方式:qsub

提交作业例子:

$qsub mpi.pbs

作业提交例子脚本mpi.pbs:

#!/bin/bash

#PBS -N test (作业名,限15 个字符,首字符为字母,无空格) #PBS -l nodes=2:ppn=8 (请求N 个节点,每个节点M 个处理器)

#PBS -l walltime=07:30:00 (估计最大运算时间为1000 小时,若没有设置这项,系统为自动按所在队列默认walltime 处理)

#PBS -j oe (将标准输出信息与标准错误信息合并输出到文件) (#PBS –q XXX)

#PBS –m e (发送邮件给用户,n 不发送邮件;a 当作业被批处理系统中断时,发送邮件;b 当作业开始执行时,发送邮件;e 当作业执行结束时,发送邮件)

#PBS –M XXXX@ (申明邮箱地址)

cd $PBS_O_WORKDIR (进入作业调度目录)

MPI_HOME=/state/partition1/soft/compiler/mvapich2/1.2p1/gcc.pgf90

NSLOTS=`cat ${PBS_NODEFILE} | wc -l` (计算申请到的cpu数目)

time -p ${MPI_HOME}/bin/mpirun_rsh -ssh -np ${NSLOTS} -hostfile ${PBS_NODEFILE} ./XXX chn >&out.dat (程序运行部分,XXX为程序名,chn为输入数据,out.dat为输出数据)exit 0 (退出)

2. 直接使用命令行方式登录计算节点提交作业。

方法:

首先通过ssh登录

进去后先查看哪些计算节点是空闲的,有2种方法:

1. 输入pestat命令

看到所有计算节点状况,其中状态为“free”的就是空闲计算节点。

2. 进入ganglia网页查看:/ganglia/

网页下方各节点状况图中,白色图的、名字以compute开头的节点属于空闲计算节点。

注意:

提供给用户使用的30个计算节点是从compute-0-19到compute-0-48。选择空闲计算节点的顺序应该从标号由大到小的顺序选,如compute-0-37到compute-0-48空闲时,应先选compute-0-48,其次compute-0-47这样。

输入: ssh 空闲计算节点

即可登录到相应的空闲计算节点。

如:$ssh compute-0-43

compute-0-43是空闲计算节点名

相关文档
最新文档