24小时热门版块排行榜    

查看: 1159  |  回复: 6
当前主题已经存档。
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

miracle3130

铁杆木虫 (小有名气)

[交流] 【求助成功】VASP并行不了了,望大家帮助!

VASP的并行版本计算,交换机重启了一下,开机后发现所有结点都挂上去了,但是运行VASP作计算时出错,出错信息如下:

Error reading item 'IMAGES' from file INCAR.
Error reading item 'IMAGES' from file INCAR.
Error reading item 'IMAGES' from file INCAR.
Error reading item 'IMAGES' from file INCAR.
Error reading item 'IMAGES' from file INCAR.
Error reading item 'IMAGES' from file INCAR.
Error reading item 'IMAGES' from file INCAR.
Error reading item 'IMAGES' from file INCAR.
Error reading item 'IMAGES' from file INCAR.
Error reading item 'IMAGES' from file INCAR.
Error reading item 'IMAGES' from file INCAR.
Error reading item 'IMAGES' from file INCAR.
Error reading item 'IMAGES' from file INCAR.
Error reading item 'IMAGES' from file INCAR.
Error reading item 'IMAGES' from file INCAR.
rank 6 in job 8  node01_33013   caused collective abort of all ranks
  exit status of rank 6: killed by signal 9
rank 5 in job 8  node01_33013   caused collective abort of all ranks
  exit status of rank 5: return code 0
Error reading item 'IMAGES' from file INCAR.
Error reading item 'IMAGES' from file INCAR.
rank 4 in job 8  node01_33013   caused collective abort of all ranks
  exit status of rank 4: return code 0
rank 15 in job 8  node01_33013   caused collective abort of all ranks
  exit status of rank 15: return code 0
rank 13 in job 8  node01_33013   caused collective abort of all ranks
  exit status of rank 13: return code 0
rank 12 in job 8  node01_33013   caused collective abort of all ranks
  exit status of rank 12: return code 0
rank 19 in job 8  node01_33013   caused collective abort of all ranks
  exit status of rank 19: return code 0
rank 18 in job 8  node01_33013   caused collective abort of all ranks
  exit status of rank 18: return code 0
rank 17 in job 8  node01_33013   caused collective abort of all ranks
  exit status of rank 17: return code 0
rank 16 in job 8  node01_33013   caused collective abort of all ranks
  exit status of rank 16: return code 0
rank 11 in job 8  node01_33013   caused collective abort of all ranks
  exit status of rank 11: killed by signal 9
rank 9 in job 8  node01_33013   caused collective abort of all ranks
  exit status of rank 9: killed by signal 9
rank 8 in job 8  node01_33013   caused collective abort of all ranks
  exit status of rank 8: killed by signal 9
rank 0 in job 8  node01_33013   caused collective abort of all ranks
  exit status of rank 0: return code 0


该如何设置解决?(本人对集群并行什么的知之甚少,望大家把办法说得详细点,谢谢!)

[ Last edited by wuli8 on 2009-6-5 at 20:52 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

miracle3130

铁杆木虫 (小有名气)

引用回帖:
Originally posted by wuli8 at 2009-4-24 21:23:
楼主能不能把你的并行版的编译步骤共享一下,谢谢

说实话这个并行版的我从没编译过,之前是请别人编译好了的.所以目前碰到这类问题时就有点手足无措了!
6楼2009-04-25 08:14:49
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 7 个回答

quantumfang

至尊木虫 (职业作家)

小木虫中医研究院院长

★ ★
miracle3130(金币+1,VIP+0): 4-24 19:10
miracle3130(金币+1,VIP+0): 4-25 14:23
idear::
可能是网络文件系统如nfs出错,某些节点不能访问INCAR所在文件系统
2楼2009-04-24 18:28:54
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

miracle3130

铁杆木虫 (小有名气)

引用回帖:
Originally posted by quantumfang at 2009-4-24 18:28:
idear::
可能是网络文件系统如nfs出错,某些节点不能访问INCAR所在文件系统

该如何去解决呢?
3楼2009-04-24 19:11:18
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wangle_xq

银虫 (小有名气)

★ ★ ★
miracle3130(金币+2,VIP+0): 4-24 21:02
miracle3130(金币+1,VIP+0): 4-25 14:23
只能一个一个的查。

先看看你设定计算的节点中有哪个是不能远程登录的。然后看看不能登录的原因是什么;

如果节点可以登录,在通过节点登录nfs中的任意一个文件,如果不能读取,说明nfs加载有问题,有需要要重新挂在nfs。


NFS卷的加载方法与普通文件系统的加载方式是一样的。使用下面的句法调用mount:
# mount –t nfs nfs_volume local_dir options
nfs_volume是以remote_host:remote_dir形式给出。由于这个表示法对NFS文件系统来说是唯一的,你可以省略-t nfs选项。

在加载一个NFS卷时,你可以指定许多别的选项。这些选项可以在命令行上在-o开关后面给出,或者在/etc/fstab该卷条目的选项字段内给出。在这两种情况下,多个选项是用逗号彼此分开的。在命令行上的选项总是覆盖fstab文件中给出的选项。

nfs也是在每次启动的时候自动加载的。在/etc/fstab中的一个样本条目可以是
# volume         mount point     type options

news:/usr/spool/news /usr/spool/news   nfs   timeo=14,intr
网络日志 http://blog.163.com/wangle_xq/ 关注计算材料科学的应用,以及相关的计算机技术。文章以转贴为主,少量原创。欢迎参观
4楼2009-04-24 20:09:46
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见