24小时热门版块排行榜    

CyRhmU.jpeg
南方科技大学公共卫生及应急管理学院2026级博士研究生招生报考通知(长期有效)
查看: 1613  |  回复: 3

sureserver

铜虫 (初入文坛)

[交流] 集群中几个常用的命令(跟用户培训时用的文档)已有2人参与

查看状态qstat
语法:
qstat        [-f][-W        site_specific] [job_identifier... | destination...]
qstat        -Q [-f][-W site_specific] [destination...]
qstat        -B [-f] [-W site_specific] [server_name...]
参数:
destination可以为pool,@server,pool@server
作用:
查看作业、结点池和批处理服务器的状态。命令格式一可以输出所指定作业ID或者结点池中所有作业的状态,命令格式二可以输出每个结点池的状态信息,命令格式三可以输出服务器的状态。          
举例:
1.        显示已经配置的所有结点池状态信息。
qstat -q
2.        显示已经提交的作业状态信息
qstat -a
3.        显示指定作业的所有状态信息
$ qstat -f 23.console     
mtime = Sun Apr 28 19:54:48 2002
Output_Path = console:/home/zhangxq/cpi.o23
Priority = 0
qtime = Sun Apr 28 19:54:48 2002
Rerunable = True
Resource_List.cput = 00:00:59
Resource_List.nodect = 2
Resource_List.nodes = 2:ppn=1
Variable_List = LJRS_O_HOME=/home/zhangxq,LJRS_O_LANG=en_US
   ……
4.        显示服务器的状态
$qstat –B
Server    Max Tot Que Run Hld Wat Trn Ext Status
console    0   0    0   0    0    0   0    0  Active
        查询作业qselect
语法:
qselect [-a [op]date_time] [-A account_string]        [-h old_list] [-l resource_list] [-N name] [-p [op]priority] [-q        destination] [-r y|n]        [-s states]
[-u user_list]
参数:
op表示某一个作业属性值和选项参数值之间的关系。如
.eq. (等于)
.ne. (不等于)
.ge.  (大于或等于)
.gt.  (大于)
.le.  (小于)
        其它参数含义见qsub命令。
作用:
列出符合选项要求的作业ID。这些作业来自于单个服务器。如果没有任何选项,该命令则列出该用户被授权的服务器上的所有作业。对那些普通用户来说,该命令只显示该用户所提交的作业。
举例:
1.        查询用户所提交的作业
$ qsub -q long cpi.ljrs
28.console
$ qselect
25.console
28.console     
2.        查询指定结点池中的作业
$ qstat
Job id      Name    User     TimeUse  S    Pool
25.console  cpi      zhangxq   0        Q   dque
29.console  cpi      zhangxq   0        R   long
$ qselect -P dque
25.console   
3.        查询指定主机上的作业
$ qstat
Job id       Name    User      TimeUse   S    Pool
25.console   cpi       zhangxq   0         Q    dque
29.console   cpi       zhangxq   0         R    long
$ qselect -P @console
25.console
29.console
4.4.        挂起作业qhold
语法:
qhold [-h hold_list] job_identifier …  
作用:
挂起批处理作业。 挂起有三种类型:普通用户级‘u’、管理员级(操作员级)‘o’、系统级‘s’,缺省值为不挂起‘n’。用户只能在用户级别挂起自己提交的作业,操作员可以在用户级和操作员级挂起任何作业,系统管理员可以在任何级别上挂起任何作业。
在执行该命令时,如果作业在运行结点池里排队,那么作业将直接被挂起;如果作业处于运行状态,为了中断作业的执行,必须采取其他办法。如果被挂起作业的主机系统支持一致点检查或者重新启动,则挂起正在运行作业将引发以下操作:首先检查作业的一致性,然后释放该作业所占用的资源,最后该作业位于执行结点池中,处于挂起状态;如果被挂起作业的主机系统不支持一致点检查或者重新启动,则仅设置指定的挂起作业类型,而实际上并不能挂起,除非调用qrerun命令重新运行该作业时,该挂起请求才生效。
举例:
1.        使用普通用户身份挂起作业
$ qhold -h u 25.console $ qstat
Job id      Name   User     TimeUse    S    Pool
25.console   cpi   zhangxq  0          H    dque
2.        以操作员身份挂起作业
$ qhold -h o 25
qhold: Unauthorized Request  25.console
$ su root
$ qhold -h o 25
$ qstat
Job id      Name   User     TimeUse   S     Pool
25.console  cpi    zhangxq   0        H     dque     
4.5.        释放作业qrls
语法:
qrls [-h hold_list] job_identifier ...
作用:
释放被挂起的批处理作业。由于作业的挂起有三种类型:USER、OPERATOR和SYSTEM。所以,要释放不同类型的作业挂起,用户就必须具有相应的权限。缺省为USER级
举例:
释放在普通用户和操作员级被挂起的作业。
$ qstat
Job id       Name    User       TimeUse  S   Pool
25.console   cpi     zhangxq    0        H   dque
$ qrls -h uo 25
$ qstat
Job id       Name    User       TimeUse  S   Pool
25.console   cpi     zhangxq    0        Q   dque   
4.6.        重新运行作业qrerun
语法:
qrerun job_identifier        ...
作用:
重新运行所指定的作业。
举例:
如果作业允许别重新执行(缺省值是可以重新运行)。ROOT用户运行该命令,可以终止本次运行,把该作业放入其原来所在的结点池中,重新运行。
$ qrerun 27
qrerun: Unauthorized Request  27.console
$ su – root
$ qstat
Job id       Name    User     TimeUse  S    Pool
25.console   cpi      zhangxq   0        Q    dque
27.console   cpi      zhangxq   0        R    dque
$ qrerun 27
$ qstat
Job id       Name    User      TimeUse   S   Pool
25.console   cpi     zhangxq   0         Q   dque
27.console   cpi     zhangxq   0         R   dque  
4.7.        更改作业属性qalter
语法:
qalter [-a date_time] [-A account_string]  [-e  path] [-h hold_list] [-j join] [-k keep]  [-l resource_list] [-m mail_options]  [-M user_list]  [-N name] [-n cpu|mem|syn [-L v1,[v2,[v3,[v4]]]]]  [-o path]  [-p priority] [-r c] [-u user_list] job_identifier...
参数:
        各参数的含义见qsub命令。
作用:
更改批处理作业的属性。主要修改所指定作业ID的相关属性(选项表中所列出的属性)。
举例:
1.        更改批处理作业的运行时间属性。
$ qalter -a 0309251000 23.console
2.        更改给用户发送邮件的时间为作业中止和运行结束时
$ qalter –m ae 23.console   
4.8.        删除作业qdel
语法:
qdel [-W delay|force] job_identifier ...
参数:
   -W 当指定delay 时,表示在删除作业前需要等待的时间(秒)
                当指定force时,强制删除该作业。
作用:
删除批处理作业。按照命令行中所指定的作业ID的顺序来删除作业。
举例:
$ qstat
Job id       Name    User     TimeUse  S   Pool
22.console   cpi     zhangxq  0        Q   long
$ qdel 22
$ qstat
4.9.        给作业发送消息qmsg
语法:
qmsg [-E] [-O] message_string        job_identifier ...
参数:
        -E 将消息串写入错误输出文件
        -O将消息串写入输出文件
作用:
给批处理作业发送消息。该命令通过给作业的所有者(批处理服务器)发送消息,从而把消息写入作业的输出文件,也就是说,该命令并不是直接把消息写入作业的输出文件。
举例:
给正在运行的作业发送消息,该消息被写入所指定作业的错误输出文件中。
$ qstat
Job id        Name    User       TimeUse   S    Pool
25.console    cpi     zhangxq    0         Q    dque
26.console    cpi     zhangxq    0         R    dque
$ qmsg “The job is running” 26
$ more cpi.e26
The job is running
4.10.        在结点池之间移动作业qmove
语法:
qmove        destination job_identifier ...
参数:
destination可以为结点池名
作用:
把批处理作业移到其他结点池中去运行。即把作业从所在的结点池中删除,并放在其他结点池中。
举例:
$ qstat
Job id         Name     User      TimeUse  S   Pool
22.console      cpi     zhangxq   0        Q   dque
$ qmove long 22
$ qstat
Job id         Name     User     TimeUse  S    Pool
22.console     cpi      zhangxq  0        Q    long      
4.11.        给作业发送信号qsig
语法:
qsig [-s signal] job_identifier ... 参数:
参数signal可以为信号名称,如SIGKILL,KILL,SIGNULL或者无符号整数,如9、0。 作用:
给正在运行的批处理作业发送信号。如果不指定-S选项,则发送“SIGTERM”信号。如果有下列原因之一,如用户无权给作业发送信号、作业未处于运行状态和该信号请求对作业所运行的系统无效,则拒绝执行该命令请求。 举例:
杀掉作业
$qsig –s 9 jobid”
回复此楼
newlenovonewworld
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

rainywrn

金虫 (正式写手)


小木虫(金币+0.5):给个红包,谢谢回帖
计算,水涨船高,以后都是cluster了,收了先
吼吼吼
2楼2011-12-31 19:03:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wuy069

铁杆木虫 (正式写手)


小木虫(金币+0.5):给个红包,谢谢回帖
这个是torque的,有没有sge的
3楼2011-12-31 20:09:05
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sureserver

铜虫 (初入文坛)

引用回帖:
: Originally posted by wuy069 at 2011-12-31 20:09:05:
这个是torque的,有没有sge的

SGE的有,呵呵,后期吧,最近在写文档,要给用户培训。
newlenovonewworld
4楼2012-01-01 11:41:30
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 sureserver 的主题更新
普通表情 高级回复(可上传附件)
信息提示
请填处理意见