24小时热门版块排行榜    

CyRhmU.jpeg
查看: 2474  |  回复: 9

zuocuiping

木虫 (职业作家)

[交流] 天津超算老是出现错误已有2人参与

我在天津超算计算
计算不能正常结束
老是在slurm-2598756.out文件里出现
yhrun: error: cn2455: task 0: Bus error
yhrun: First task exited 60s ago
yhrun: tasks 1-47: running
yhrun: task 0: exited abnormally
yhrun: Terminating job step 2598756.0
slurmd[cn2455]: *** STEP 2598756.0 KILLED AT 2015-08-26T15:20:18 WITH SIGNAL 9 ***
yhrun: Job step aborted: Waiting up to 2 seconds for job step to finish.
slurmd[cn2455]: *** STEP 2598756.0 KILLED AT 2015-08-26T15:20:18 WITH SIGNAL 9 ***
yhrun: error: cn3058: tasks 24-35: Killed
请问软件安装问题还是我的设置问题呢?
谢谢
有没有遇到过的
请指点一下
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zuocuiping

木虫 (职业作家)

我用的是vasp软件计算的
2楼2015-08-26 16:39:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

liqizuiyang

木虫 (著名写手)

运行参数里加 -x cn2455。节点抽了,经常的事。
3楼2015-08-26 16:51:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zuocuiping

木虫 (职业作家)

引用回帖:
3楼: Originally posted by liqizuiyang at 2015-08-26 16:51:50
运行参数里加 -x cn2455。节点抽了,经常的事。

您好
这个在哪里加呢?
是脚本里还是哪个文件里
谢谢指导一下
4楼2015-08-26 16:55:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

liqizuiyang

木虫 (著名写手)


小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
4楼: Originally posted by zuocuiping at 2015-08-26 16:55:11
您好
这个在哪里加呢?
是脚本里还是哪个文件里
谢谢指导一下...

脚本里加到yhrun后面。
5楼2015-08-26 17:15:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zuocuiping

木虫 (职业作家)

引用回帖:
5楼: Originally posted by liqizuiyang at 2015-08-26 17:15:34
脚本里加到yhrun后面。...

好的
谢谢
试试看看
6楼2015-08-26 17:53:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zuocuiping

木虫 (职业作家)

引用回帖:
5楼: Originally posted by liqizuiyang at 2015-08-26 17:15:34
脚本里加到yhrun后面。...

您好
我用了
还是不行
现在的结果又变了
yhrun: error: cn2887: task 0: Bus error
yhrun: First task exited 60s ago
yhrun: tasks 1-47: running
yhrun: task 0: exited abnormally
yhrun: Terminating job step 2603566.0
slurmd[cn2887]: *** STEP 2603566.0 KILLED AT 2015-08-26T21:29:25 WITH SIGNAL 9 ***
yhrun: Job step aborted: Waiting up to 2 seconds for job step to finish.
slurmd[cn2887]: *** STEP 2603566.0 KILLED AT 2015-08-26T21:29:25 WITH SIGNAL 9 ***
yhrun: error: cn2890: tasks 36-47: Killed
这个怎么办
我事先并不值得用哪个节点哦
谢谢
7楼2015-08-26 21:21:51
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

liqizuiyang

木虫 (著名写手)


小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
7楼: Originally posted by zuocuiping at 2015-08-26 21:21:51
您好
我用了
还是不行
现在的结果又变了
yhrun: error: cn2887: task 0: Bus error
yhrun: First task exited 60s ago
yhrun: tasks 1-47: running
yhrun: task 0: exited abnormally
yhrun: Terminating  ...

这个没办法,过段时间再提交吧。
8楼2015-08-26 22:28:09
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zuocuiping

木虫 (职业作家)

引用回帖:
8楼: Originally posted by liqizuiyang at 2015-08-26 22:28:09
这个没办法,过段时间再提交吧。...

好的
是集群的问题
管理员重新弄了一下
这个问题解决了
新的问题又出现了
搞得投有点砸掉
谢谢你
9楼2015-08-27 09:55:37
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

emilyoyang

木虫 (正式写手)


小木虫: 金币+0.5, 给个红包,谢谢回帖
把这这个出问题的节点避开就行了。
的确天河经常这样 稳定的很差(但速度很快),不适合跑长时间作业
10楼2015-08-29 08:44:02
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 zuocuiping 的主题更新
普通表情 高级回复(可上传附件)
信息提示
请填处理意见