24小时热门版块排行榜    

查看: 794  |  回复: 7

lbbz323

铁杆木虫 (著名写手)

[交流] 集群计算问题——down 已有2人参与

集群计算不知道什么原因掉了。
compute-0-7.local
load_one: down
Last heartbeat 0 days, 1:01:33 ago
查看了输入和产生的输出文件,都是好的,没有发现warning, error。
并且已经将输入文件的数据读完,进入到第一个数据的整理中。。。,之后就停了;再次提交同个任务,还是出现了同样的死机。
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wangxn06

金虫 (正式写手)

★ ★ ★
小木虫: 金币+0.5, 给个红包,谢谢回帖
cenwanglai: 金币+2, 谢谢参与~ 2012-06-12 22:09:27
我也遇到过某个节点down掉的情况,必须重新启动这个节点吧
2楼2012-06-12 09:09:27
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lbbz323

铁杆木虫 (著名写手)

引用回帖:
2楼: Originally posted by wangxn06 at 2012-06-12 09:09:27
我也遇到过某个节点down掉的情况,必须重新启动这个节点吧

是啊,只有重新启动了。
可是这是为什么呢?
3楼2012-06-12 11:25:52
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wangxn06

金虫 (正式写手)


小木虫: 金币+0.5, 给个红包,谢谢回帖
值得把这个问题搞明白,但我觉得和台式机会死机一样吧
4楼2012-06-12 13:10:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lbbz323

铁杆木虫 (著名写手)

引用回帖:
4楼: Originally posted by wangxn06 at 2012-06-12 13:10:11
值得把这个问题搞明白,但我觉得和台式机会死机一样吧

搞清楚了,那计算的输入设置就要调整,一次算完多好啊。

[ Last edited by lbbz323 on 2012-6-13 at 00:42 ]
5楼2012-06-13 00:37:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wangxn06

金虫 (正式写手)


小木虫: 金币+0.5, 给个红包,谢谢回帖
你知道原因了?说说怎么解决的
6楼2012-06-13 08:04:18
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lipeng87

木虫 (小有名气)

★ ★
小木虫: 金币+0.5, 给个红包,谢谢回帖
dbb627: 金币+1, 欢迎交流 2012-08-04 22:35:47
是内存耗尽了,之后pbs就认为机器死机了,但个别情况可以ping通
不抛弃,不放弃
7楼2012-08-04 09:07:27
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lbbz323

铁杆木虫 (著名写手)

引用回帖:
7楼: Originally posted by lipeng87 at 2012-08-04 09:07:27
是内存耗尽了,之后pbs就认为机器死机了,但个别情况可以ping通

嗯,是这个原因。
谢谢。
8楼2012-08-05 22:11:09
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 lbbz323 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见