24小时热门版块排行榜    

查看: 247  |  回复: 0

aylixmut

铜虫 (小有名气)

[求助] 2U服务器串行可以,并行出错怎办啊,谢谢

编译器 intel
并行环境 intel mpi
作业管理系统PBS
编译过程都没问题,测试用硅 小系统,并行,串行都可以,
可是大系统,比如 40个原子运行到一段时间,就是exit,然后提示
rank 0 in job 18  localhost.localdomain_54190   caused collective abort of all ranks
exit status of rank 0: killed by signal 9
top 观察是一个节点先退出,然后剩下三个运行一会儿也退出了。
该怎办,并行环境设置是一头雾水,不知道设置过什么。
谢谢!
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 aylixmut 的主题更新
信息提示
请填处理意见