24小时热门版块排行榜    

CyRhmU.jpeg
南方科技大学公共卫生及应急管理学院2026级博士研究生招生报考通知(长期有效)
查看: 311  |  回复: 2
当前主题已经存档。
【有奖交流】积极回复本帖子,参与交流,就有机会分得作者 hzfish 的 20 个金币

hzfish

金虫 (正式写手)

[交流] 【求助】如何用torque实现集群的列队管理???

如何用torque实现集群的列队管理???

条件:集群已建好;用CASTEP计算;有个12个CPU的LICENSE。
计算任务:提交四个作业,每个作业用4个CPU计算。

查看作业情况:在MS的客户端四个作业的运行状态都显示为running;进入服务器管理节点,用qstat -n查看作业,四个作业的运行状态都显示为R;进入每计算节点查看实际只有三个作业在运行,一个作业表面上在运行,但CPU使用率为零。


按已知条件,在MS的客户端应该三个作业的运行状态显示为running,一个作业的运行状态显示为queued;进入服务器管理节点,用qstat -n查看作业应该三个作业运行状态显示为R;用qstat -i查看应该有一个作业在列队等待。


问题:怎么样设置才能让计算作业列队进行,也就是当作业使用的CPU的数目超过了LICENSE规定的数目时,超过部分的作业的运行状态为queued,而不是running。
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hzfish

金虫 (正式写手)

没有使用集群吗???
2楼2010-04-01 09:14:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

g_xq96

银虫 (小有名气)

我也使用集群!

我现在只有账户和密码,还不知道集群上怎么使用MS。希望能向楼主学习!
QQ:705357207
山路十八弯http://blog.sina.com.cn/u/1589327057
3楼2010-04-01 10:23:52
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 hzfish 的主题更新
普通表情 高级回复(可上传附件)
信息提示
请填处理意见