24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1644  |  回复: 2

snow0804

金虫 (小有名气)

[求助] 集群并行的问题

大家好我现在有个问题请教大家,现在很急,我自己做了一个小的集群出现了如下问题, 操作软件为vasp,
当我用单机跑的时候是正常的,  同时在联机并行运算的时候,5个原子的计算中小的截断能事可以计算的, 在675 以下.  但是当截断能大于675的时候就会出现这些错误:
[proxy:0:0@node002] HYD_pmcd_pmip_control_cmd_cb (./pm/pmiserv/pmip_cb.c:886): assert (!closed) failed
[proxy:0:0@node002] HYDT_dmxu_poll_wait_for_event (./tools/demux/demux_poll.c:77): callback returned error status
[proxy:0:0@node002] main (./pm/pmiserv/pmip.c:206): demux engine error waiting for event
[mpiexec@node002] HYDT_bscu_wait_for_completion (./tools/bootstrap/utils/bscu_wait.c:76): one of the processes terminated badly; aborting
[mpiexec@node002] HYDT_bsci_wait_for_completion (./tools/bootstrap/src/bsci_wait.c:23): launcher returned error waiting for completion
[mpiexec@node002] HYD_pmci_wait_for_completion (./pm/pmiserv/pmiserv_pmci.c:217): launcher returned error waiting for completion
[mpiexec@node002] main (./ui/mpich/mpiexec.c:331): process manager error waiting for completion
有人遇到同样的问题么?
我用的是mpich3.0.4
torque
maui
nis
nfs
ssh
做的集群, 希望大家能够给于帮助,谢谢大家了
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

snow0804

金虫 (小有名气)

问题,解决了
2楼2014-07-09 09:11:20
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wz19860913

银虫 (小有名气)

引用回帖:
2楼: Originally posted by snow0804 at 2014-07-09 09:11:20
问题,解决了

怎么解决的?
3楼2022-10-14 21:42:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 snow0804 的主题更新
信息提示
请填处理意见