| 查看: 1613 | 回复: 3 | ||||
sureserver铜虫 (初入文坛)
|
[交流]
集群中几个常用的命令(跟用户培训时用的文档)已有2人参与
|
|
查看状态qstat 语法: qstat [-f][-W site_specific] [job_identifier... | destination...] qstat -Q [-f][-W site_specific] [destination...] qstat -B [-f] [-W site_specific] [server_name...] 参数: destination可以为pool,@server,pool@server 作用: 查看作业、结点池和批处理服务器的状态。命令格式一可以输出所指定作业ID或者结点池中所有作业的状态,命令格式二可以输出每个结点池的状态信息,命令格式三可以输出服务器的状态。 举例: 1. 显示已经配置的所有结点池状态信息。 qstat -q 2. 显示已经提交的作业状态信息 qstat -a 3. 显示指定作业的所有状态信息 $ qstat -f 23.console mtime = Sun Apr 28 19:54:48 2002 Output_Path = console:/home/zhangxq/cpi.o23 Priority = 0 qtime = Sun Apr 28 19:54:48 2002 Rerunable = True Resource_List.cput = 00:00:59 Resource_List.nodect = 2 Resource_List.nodes = 2:ppn=1 Variable_List = LJRS_O_HOME=/home/zhangxq,LJRS_O_LANG=en_US …… 4. 显示服务器的状态 $qstat –B Server Max Tot Que Run Hld Wat Trn Ext Status console 0 0 0 0 0 0 0 0 Active 查询作业qselect 语法: qselect [-a [op]date_time] [-A account_string] [-h old_list] [-l resource_list] [-N name] [-p [op]priority] [-q destination] [-r y|n] [-s states] [-u user_list] 参数: op表示某一个作业属性值和选项参数值之间的关系。如 .eq. (等于) .ne. (不等于) .ge. (大于或等于) .gt. (大于) .le. (小于) 其它参数含义见qsub命令。 作用: 列出符合选项要求的作业ID。这些作业来自于单个服务器。如果没有任何选项,该命令则列出该用户被授权的服务器上的所有作业。对那些普通用户来说,该命令只显示该用户所提交的作业。 举例: 1. 查询用户所提交的作业 $ qsub -q long cpi.ljrs 28.console $ qselect 25.console 28.console 2. 查询指定结点池中的作业 $ qstat Job id Name User TimeUse S Pool 25.console cpi zhangxq 0 Q dque 29.console cpi zhangxq 0 R long $ qselect -P dque 25.console 3. 查询指定主机上的作业 $ qstat Job id Name User TimeUse S Pool 25.console cpi zhangxq 0 Q dque 29.console cpi zhangxq 0 R long $ qselect -P @console 25.console 29.console 4.4. 挂起作业qhold 语法: qhold [-h hold_list] job_identifier … 作用: 挂起批处理作业。 挂起有三种类型:普通用户级‘u’、管理员级(操作员级)‘o’、系统级‘s’,缺省值为不挂起‘n’。用户只能在用户级别挂起自己提交的作业,操作员可以在用户级和操作员级挂起任何作业,系统管理员可以在任何级别上挂起任何作业。 在执行该命令时,如果作业在运行结点池里排队,那么作业将直接被挂起;如果作业处于运行状态,为了中断作业的执行,必须采取其他办法。如果被挂起作业的主机系统支持一致点检查或者重新启动,则挂起正在运行作业将引发以下操作:首先检查作业的一致性,然后释放该作业所占用的资源,最后该作业位于执行结点池中,处于挂起状态;如果被挂起作业的主机系统不支持一致点检查或者重新启动,则仅设置指定的挂起作业类型,而实际上并不能挂起,除非调用qrerun命令重新运行该作业时,该挂起请求才生效。 举例: 1. 使用普通用户身份挂起作业 $ qhold -h u 25.console $ qstat Job id Name User TimeUse S Pool 25.console cpi zhangxq 0 H dque 2. 以操作员身份挂起作业 $ qhold -h o 25 qhold: Unauthorized Request 25.console $ su root $ qhold -h o 25 $ qstat Job id Name User TimeUse S Pool 25.console cpi zhangxq 0 H dque 4.5. 释放作业qrls 语法: qrls [-h hold_list] job_identifier ... 作用: 释放被挂起的批处理作业。由于作业的挂起有三种类型:USER、OPERATOR和SYSTEM。所以,要释放不同类型的作业挂起,用户就必须具有相应的权限。缺省为USER级 举例: 释放在普通用户和操作员级被挂起的作业。 $ qstat Job id Name User TimeUse S Pool 25.console cpi zhangxq 0 H dque $ qrls -h uo 25 $ qstat Job id Name User TimeUse S Pool 25.console cpi zhangxq 0 Q dque 4.6. 重新运行作业qrerun 语法: qrerun job_identifier ... 作用: 重新运行所指定的作业。 举例: 如果作业允许别重新执行(缺省值是可以重新运行)。ROOT用户运行该命令,可以终止本次运行,把该作业放入其原来所在的结点池中,重新运行。 $ qrerun 27 qrerun: Unauthorized Request 27.console $ su – root $ qstat Job id Name User TimeUse S Pool 25.console cpi zhangxq 0 Q dque 27.console cpi zhangxq 0 R dque $ qrerun 27 $ qstat Job id Name User TimeUse S Pool 25.console cpi zhangxq 0 Q dque 27.console cpi zhangxq 0 R dque 4.7. 更改作业属性qalter 语法: qalter [-a date_time] [-A account_string] [-e path] [-h hold_list] [-j join] [-k keep] [-l resource_list] [-m mail_options] [-M user_list] [-N name] [-n cpu|mem|syn [-L v1,[v2,[v3,[v4]]]]] [-o path] [-p priority] [-r c] [-u user_list] job_identifier... 参数: 各参数的含义见qsub命令。 作用: 更改批处理作业的属性。主要修改所指定作业ID的相关属性(选项表中所列出的属性)。 举例: 1. 更改批处理作业的运行时间属性。 $ qalter -a 0309251000 23.console 2. 更改给用户发送邮件的时间为作业中止和运行结束时 $ qalter –m ae 23.console 4.8. 删除作业qdel 语法: qdel [-W delay|force] job_identifier ... 参数: -W 当指定delay 时,表示在删除作业前需要等待的时间(秒) 当指定force时,强制删除该作业。 作用: 删除批处理作业。按照命令行中所指定的作业ID的顺序来删除作业。 举例: $ qstat Job id Name User TimeUse S Pool 22.console cpi zhangxq 0 Q long $ qdel 22 $ qstat 4.9. 给作业发送消息qmsg 语法: qmsg [-E] [-O] message_string job_identifier ... 参数: -E 将消息串写入错误输出文件 -O将消息串写入输出文件 作用: 给批处理作业发送消息。该命令通过给作业的所有者(批处理服务器)发送消息,从而把消息写入作业的输出文件,也就是说,该命令并不是直接把消息写入作业的输出文件。 举例: 给正在运行的作业发送消息,该消息被写入所指定作业的错误输出文件中。 $ qstat Job id Name User TimeUse S Pool 25.console cpi zhangxq 0 Q dque 26.console cpi zhangxq 0 R dque $ qmsg “The job is running” 26 $ more cpi.e26 The job is running 4.10. 在结点池之间移动作业qmove 语法: qmove destination job_identifier ... 参数: destination可以为结点池名 作用: 把批处理作业移到其他结点池中去运行。即把作业从所在的结点池中删除,并放在其他结点池中。 举例: $ qstat Job id Name User TimeUse S Pool 22.console cpi zhangxq 0 Q dque $ qmove long 22 $ qstat Job id Name User TimeUse S Pool 22.console cpi zhangxq 0 Q long 4.11. 给作业发送信号qsig 语法: qsig [-s signal] job_identifier ... 参数: 参数signal可以为信号名称,如SIGKILL,KILL,SIGNULL或者无符号整数,如9、0。 作用: 给正在运行的批处理作业发送信号。如果不指定-S选项,则发送“SIGTERM”信号。如果有下列原因之一,如用户无权给作业发送信号、作业未处于运行状态和该信号请求对作业所运行的系统无效,则拒绝执行该命令请求。 举例: 杀掉作业 $qsig –s 9 jobid” |
» 收录本帖的淘帖专辑推荐
计算 |
» 猜你喜欢
超导转变温度NaN
已经有4人回复
华南师范大学先进光电子研究院电子纸团队诚聘2026级博士研究生
已经有0人回复
物理化学论文润色/翻译怎么收费?
已经有143人回复
QE利用声子计算的一系列lambda和Tc如何选
已经有8人回复
理论计算合作
已经有2人回复
小木虫的论文辅导靠谱吗?有没有用过的同学?
已经有1人回复
QE计算声子ph.out的Γ点出现虚频(-30cm-1)vasp计算没有
已经有0人回复
40-50万/年,中国散裂中子源诚聘计算模拟方向博士后
已经有81人回复
2026博士申请—化学能源方向,本人熟练分子动力学模拟的使用
已经有4人回复
书籍求助:汽车市场营销理论与实务(电子版)——章小平
已经有0人回复
» 本主题相关价值贴推荐,对您同样有帮助:
集群上面的节点需要定时间的重启吗?
已经有18人回复
怎样把windows操作系统的MS连接到linux系统的服务器进行计算?
已经有21人回复
计算集群里什么命令查看所有计算机呢???
已经有5人回复
比较常用的Linux命令
已经有16人回复
【分享】window命令大全【已搜索无重复】
已经有12人回复

rainywrn
金虫 (正式写手)
- 应助: 5 (幼儿园)
- 金币: 1398.1
- 红花: 17
- 帖子: 780
- 在线: 182.3小时
- 虫号: 852396
- 注册: 2009-09-20
- 性别: GG
- 专业: 化学动力学

2楼2011-12-31 19:03:50
wuy069
铁杆木虫 (正式写手)
- 应助: 20 (小学生)
- 金币: 7921.9
- 散金: 15
- 红花: 10
- 帖子: 506
- 在线: 549.1小时
- 虫号: 760723
- 注册: 2009-04-30
- 性别: GG
- 专业: 理论和计算化学
3楼2011-12-31 20:09:05
sureserver
铜虫 (初入文坛)
- 应助: 1 (幼儿园)
- 金币: 72.6
- 帖子: 50
- 在线: 11.9小时
- 虫号: 1558012
- 注册: 2011-12-31
- 性别: GG
- 专业: 计算机应用技术

4楼2012-01-01 11:41:30














回复此楼