作业调度系统常用命令

Download Report

Transcript 作业调度系统常用命令

作业调度系统常用命令
bsub 直接提交作业

bsub –n z –q QUEUENAME –i inputfile –o
outputfile COMMAND
其中z代表了提交作业需要的cpu数,–q指定作业
提交到的队列,如果不采用–q选项,系统把作业
提交到默认作业队列(作业队列详细介绍请看下
一节)。inputfile 代表程序需要读入的文件名(
例如 namelist等),outputfile 代表一个文件,
作业提交后标准输出的信息将会保存到这个文件
中。COMMAND是用户要运行的程序
bsub 直接提交作业



串行程序
COMMAND可以直接使用用户的程序名
例如,对一个串行作业mytest, 提交方式为:
bsub –n 1 –q QS_Norm –o mytest.out
./mytest
bsub 直接提交作业




并行作业
COMMAND为“–a intelmpi mpirun.lsf 程序名”
因为并行作业必须用到intelmpi库,所以提交的时
候必须使用–a intelmpi mpirun.lsf
例:使用12个cpu的并行作业mytest,提交方式为
:
bsub –n 12 –q QN_Norm –o mytest.out –a
intelmpi mpirun.lsf ./mytest
bsub 使用脚本提交作业

bsub 命令可以使用输入脚本多次提交具有相同
参数的作业:
#BSUB –n Z
#BSUB –q QUEUENAME
#BSUB –o %J.out
#BSUB –e %J.err
COMMAND


提交 bsub < 脚本
更多脚本例子,参照计算平台网站上的作业提交
文档
bsub


混合方式
bsub –m “n1” < 脚本名 指定机器提交作业
bhosts显示各节点作业相关情况


Bhosts
bhosts <hostname>
bjobs查看作业






bjobs –w
bjobs –r 显示正在运行的作业
bjobs –a 显示正在运行的和最近完成的作业
bjobs -p 显示等待运行的作业和等待原因
bjobs –s 显示正在挂起的作业和挂起的原因
bjobs -l 显示该作业的所有信息
bhist


bhist 显示最近完成作业或正在运行作业的
历史情况
bhist <jobid>
bkill 删除不需要的作业


bkill <jobid>
bkill –r <jobid>
bswitch 更改作业队列


如果作业提交一直pend,可以更改作业队
列
bswitch -q 目标队列 jobid
bpeek 监视作业运行状态


bpeek 当作业正在运行时显示它的标准输
出,监视作业运行
bpeek <jobid>
bacct



作业统计
bacct -b -u 账号 -C 2012/05/02,2013/04/0
bacct -l 122211