| 查看: 3151 | 回复: 5 | ||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | ||
04nylxb木虫 (正式写手)
|
[求助]
vasp跨节点运行出错,mpiexec_node-1 (handle_stdin_input 1089)
|
|
|
最近在集群上编译带CNEB的vasp5.2,并行vasp编译成功,在单个节点(每个节点八核)上运行 $ mpirun -np 8 vasp 时候,top下,发现确实出现八个vasp进程。 但是,跨节点的时候,确出错了,出错信息如下: running on 15 nodes distr: one band on 1 nodes, 15 groups vasp.5.2.12 11Nov11 complex POSCAR found : 1 types and 2 ions ----------------------------------------------------------------------------- | | | W W AA RRRRR N N II N N GGGG !!! | | W W A A R R NN N II NN N G G !!! | | W W A A R R N N N II N N N G !!! | | W WW W AAAAAA RRRRR N N N II N N N G GGG ! | | WW WW A A R R N NN II N NN G G | | W W A A R R N N II N N GGGG !!! | | | | For optimal performance we recommend that you set | | NPAR = approx SQRT( number of cores) | | This will greatly improve the performance of VASP for DFT. | | The default NPAR=number of cores might be grossly inefficient | | on modern multi-core architectures or massively parallel machines. | | Unfortunately you need to use the default for hybrid, GW and RPA | | calculations. | | | ----------------------------------------------------------------------------- LDA part: xc-table for Pade appr. of Perdew found WAVECAR, reading the header number of bands has changed, file: 12 present: 15 trying to continue reading WAVECAR, but it might fail POSCAR, INCAR and KPOINTS ok, starting setup WARNING: small aliasing (wrap around) errors must be expected FFT: planning ...( 1 ) reading WAVECAR random initialization beyond band 13 the WAVECAR file was read sucessfully initial charge from wavefunction entering main loop N E dE d eps ncg rms rms(c) mpiexec_node-1 (handle_stdin_input 1089): stdin problem; if pgm is run in background, redirect from /dev/null mpiexec_node-1 (handle_stdin_input 1090): e.g.: mpiexec -n 4 a.out < /dev/null & rank 14 in job 14 node-1_49061 caused collective abort of all ranks exit status of rank 14: killed by signal 11 rank 13 in job 14 node-1_49061 caused collective abort of all ranks exit status of rank 13: killed by signal 9 rank 9 in job 14 node-1_49061 caused collective abort of all ranks exit status of rank 9: killed by signal 11 rank 8 in job 14 node-1_49061 caused collective abort of all ranks exit status of rank 8: killed by signal 11 rank 4 in job 14 node-1_49061 caused collective abort of all ranks exit status of rank 4: killed by signal 11 rank 3 in job 14 node-1_49061 caused collective abort of all ranks exit status of rank 3: killed by signal 9 rank 2 in job 14 node-1_49061 caused collective abort of all ranks exit status of rank 2: killed by signal 9 rank 1 in job 14 node-1_49061 caused collective abort of all ranks exit status of rank 1: killed by signal 11 rank 0 in job 14 node-1_49061 caused collective abort of all ranks 其中node-1是我的控制节点。进程数为12以下的时候都运行正常 $ mpirun -machinefile ~/machinefile -np 12 vasp > 5out 其中,mpich2,我用cpi测试,各个节点都OK的,并且能够跑上百个核。 求高人指点,为什么vasp跨节点的时候出现这样的错误?该如何解决?非常感谢啊。 另,想问下,编译的时候,make makeparam,生成的这个makeparam是干嘛用的? |
» 猜你喜欢
Bioresource Technology期刊,第一次返修的时候被退回好几次了
已经有6人回复
2025冷门绝学什么时候出结果
已经有4人回复
真诚求助:手里的省社科项目结项要求主持人一篇中文核心,有什么渠道能发核心吗
已经有8人回复
寻求一种能扛住强氧化性腐蚀性的容器密封件
已经有5人回复
论文投稿,期刊推荐
已经有6人回复
请问哪里可以有青B申请的本子可以借鉴一下。
已经有4人回复
孩子确诊有中度注意力缺陷
已经有14人回复
请问下大家为什么这个铃木偶联几乎不反应呢
已经有5人回复
请问有评职称,把科研教学业绩算分排序的高校吗
已经有5人回复
天津工业大学郑柳春团队欢迎化学化工、高分子化学或有机合成方向的博士生和硕士生加入
已经有4人回复
» 本主题相关价值贴推荐,对您同样有帮助:
vasp并行测试时出错。
已经有7人回复
vasp 并行运算出错
已经有7人回复
【求助】安装vasp出错 make: *** [fftmpi_map.o] 错误 1【已解决】
已经有6人回复
【求助】VASP5.2 编译出错make: *** [vasp] 错误 1,请大家帮忙分析分析,谢谢
已经有7人回复
【求助】vasp运行出错 大家帮忙看看
已经有18人回复
【求助】VASP编译出错
已经有5人回复
【求助】vasp运行问题
已经有7人回复

uuv2010
荣誉版主 (职业作家)
- 1ST强帖: 6
- 应助: 160 (高中生)
- 贵宾: 3.14
- 金币: 3679.7
- 散金: 5802
- 红花: 79
- 沙发: 35
- 帖子: 4560
- 在线: 915.2小时
- 虫号: 966216
- 注册: 2010-03-09
- 性别: GG
- 专业: 凝聚态物性 II :电子结构
- 管辖: 第一性原理
4楼2012-01-09 10:07:28
uuv2010
荣誉版主 (职业作家)
- 1ST强帖: 6
- 应助: 160 (高中生)
- 贵宾: 3.14
- 金币: 3679.7
- 散金: 5802
- 红花: 79
- 沙发: 35
- 帖子: 4560
- 在线: 915.2小时
- 虫号: 966216
- 注册: 2010-03-09
- 性别: GG
- 专业: 凝聚态物性 II :电子结构
- 管辖: 第一性原理
6楼2012-01-09 22:21:18













回复此楼