24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1957  |  回复: 6

yoyoiceman

新虫 (初入文坛)

[交流] torque服务节点无法给计算节点分配任务,导致作业一直处于Q状态已有5人参与

08/10/2012 17:55:02  S    enqueuing into batch, state 1 hop 1
08/10/2012 17:55:02  S    Job Queued at request of gu@cluster.hpc.org, owner = gu@cluster.hpc.org, job
                          name = GzzTest, queue = batch
08/10/2012 17:55:02  A    queue=batch
08/10/2012 17:55:07  S    Job Run at request of root@cluster.hpc.org
08/10/2012 17:55:07  S    send of job to compute-0-1.local failed error = 15010
08/10/2012 17:55:07  S    unable to run job, MOM rejected/rc=-1
08/10/2012 17:55:07  S    unable to run job, send to MOM '3232236285' failed
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

suntao1982

木虫 (著名写手)

小木虫

★ ★
小木虫: 金币+0.5, 给个红包,谢谢回帖
csgt0: 金币+1, 欢迎交流 2012-12-18 10:39:49
batch 默认好像只是使用一个节点吧,你的是否是并行作业
做中国人的化学!!!!
2楼2012-12-18 09:25:35
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zzr0427

新虫 (初入文坛)


小木虫: 金币+0.5, 给个红包,谢谢回帖
我也遇到了相关的问题,求大神指导啊
3楼2013-03-30 10:10:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sureserver

铜虫 (初入文坛)


csgt0: 金币+1, 欢迎交流 2013-07-17 15:12:14
Q状态,有几个原因,一个, 我经常碰见有客户在节点跑作业,一般只能通过主节点来提交作业!!


Q的话,检查下NIS用户的SSH是否正常
newlenovonewworld
4楼2013-07-17 14:41:48
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

quelover

新虫 (初入文坛)


小木虫: 金币+0.5, 给个红包,谢谢回帖
楼主的问题解决了没啊 求指点
5楼2014-06-04 11:28:48
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

quelover

新虫 (初入文坛)


小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
3楼: Originally posted by zzr0427 at 2013-03-30 10:10:53
我也遇到了相关的问题,求大神指导啊

你的问题解决了吗??求助啊
6楼2014-06-05 20:32:04
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xiubuzhe

捐助贵宾 (初入文坛)

和尚



小木虫: 金币+0.5, 给个红包,谢谢回帖
Q状态,检查一下磁盘空间是否满了,查看一下compute-0-0节点是否可以免密码登录,查看pbs各个服务是否正常运行,查看mom日志和其他守护进程的日志。还有一些其他的检查,有点想不起来了。
7楼2014-07-30 21:11:20
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 yoyoiceman 的主题更新
普通表情 高级回复(可上传附件)
信息提示
请填处理意见