24小时热门版块排行榜    

查看: 2709  |  回复: 16
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

lascqy

银虫 (小有名气)

[交流] 【求助】vasp5.2异常退出的问题 已有9人参与

刚刚用上VASP,遇到一个特别奇怪的问题,请教高手~
最近在搭建平台过程中,遇到这样的问题
环境:red hat enterprise 5.4
          intel C++ and fortran compiler:11.1.069
          intel MKL:10.2.4.032
          MPI:intel MPI3.2.011
BLAS、LAPACK、FFT3D均采用intel MKL中的
出现这样的错误:当INCAR中精度采用Medium的话,采用14个核以下
mpiexec -n 14 ./vasp
就可以正常计算
当15个核以上,就会出现类似以下错误
rank 2 in job 1 node1_55228 caused collective abort of all ranks
exit status of rank 2: killed by signal 9
当精度调至Accurate时,无论使用多少个核均会退出。
开始以为是MPI的问题,后来发现,当不使用MPI运行,直接运行
./vasp
如果是Medium就可以正常计算,但如果是Accurate精度就会报
segmentation fault
退出

后来经过进一步研究发现,同样的编译和输入文件,在vasp4.6中,各种设置均可以完美运行,在5.2中就出现以上错误,难道是vasp5.2有什么设置不同?
望高手或者有遇见相同情况的给点建议

PS:貌似调节MPI_BLOCK的值会略有不同,但还是会报错~
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lascqy

银虫 (小有名气)

引用回帖:
Originally posted by bluewhale at 2010-04-16 22:10:41:
用低一点版本编译试一下,我们的集群一直用v9的intel compiler编译似乎没有什么问题。
另检查一下用户配置是否正确,直接用ssh在各可能用到的节点试一下,有时系统换硬盘什么的可户忘了更新known_hosts, 尽管登录 ...

恩,我换低版本的试试
ssh肯定是没问题的,全部都通过无密码访问的方式配置,NFS共享一个用户目录,所以所有节点互访无问题的,另外忘了说明,好像我自己写的文件有点奇怪,明明是1个group,20个节点,而vasp运行开始的提示却是
1node , 20group
不知道这个是不是反应了一些错误,难道是输入文件的问题??
5楼2010-04-17 21:20:14
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lascqy

银虫 (小有名气)

引用回帖:
Originally posted by bluewhale at 2010-04-18 00:06:27:
将你的提交脚本粘上来看一看!
我们的4.6和5.2都很正常。

如下,如果方便的话你能不能提供一个你能用较大体系的计算文件我试试,这样就知道是不是输入文件的问题了,谢了
INCAR
SYSTEM=Snv
CUTOFF=340
ISTART=0;
ICHARG=2
ISMEAR=1;
SIGMA=0.2
NSW=100;
IBRION=2
ISIF=3
POTIM=0.2
EDIFF=5E-6;
EDIFFG=5E-5
PREC=Accurate
LREAL=.FALSE.
GGA=PE

KPOINTS
Automatic mesh
0
Monkhorst-Pack
2  2  4
0  0  0

POSCAR
Snv
1.0
11.660000000000000       0.000000000000000       0.000000000000000
0.000000000000000      11.660000000000000       0.000000000000000
0.000000000000000       0.000000000000000       6.360000000000000
31
  Direct
  -0.0000000000000000  -0.0000000000000000   0.0000000000000000
   0.2500000000000000   0.2500000000000000   0.2500000000000000
  -0.0000000000000000   0.2500000000000000   0.1250000000000000
   0.2500000000000000  -0.0000000000000000   0.3750000000000000
   0.5000000000000000  -0.0000000000000000   0.0000000000000000
   0.7500000000000000   0.2500000000000000   0.2500000000000000
   0.5000000000000000   0.2500000000000000   0.1250000000000000
   0.7500000000000000  -0.0000000000000000   0.3750000000000000
  -0.0000000000000000   0.5000000000000000   0.0000000000000000
   0.2500000000000000   0.7500000000000000   0.2500000000000000
  -0.0000000000000000   0.7500000000000000   0.1250000000000000
   0.2500000000000000   0.5000000000000000   0.3750000000000000
   0.5000000000000000   0.5000000000000000   0.0000000000000000
   0.7500000000000000   0.7500000000000000   0.2500000000000000
   0.5000000000000000   0.7500000000000000   0.1250000000000000
   0.7500000000000000   0.5000000000000000   0.3750000000000000
  -0.0000000000000000  -0.0000000000000000   0.5000000000000000
   0.2500000000000000   0.2500000000000000   0.7500000000000000
  -0.0000000000000000   0.2500000000000000   0.6250000000000000
   0.2500000000000000  -0.0000000000000000   0.8750000000000000
   0.5000000000000000  -0.0000000000000000   0.5000000000000000
   0.7500000000000000   0.2500000000000000   0.7500000000000000
   0.5000000000000000   0.2500000000000000   0.6250000000000000
   0.7500000000000000  -0.0000000000000000   0.8750000000000000
  -0.0000000000000000   0.5000000000000000   0.5000000000000000
   0.2500000000000000   0.7500000000000000   0.7500000000000000
  -0.0000000000000000   0.7500000000000000   0.6250000000000000
   0.2500000000000000   0.5000000000000000   0.8750000000000000
   0.7500000000000000   0.7500000000000000   0.7500000000000000
   0.5000000000000000   0.7500000000000000   0.6250000000000000
   0.7500000000000000   0.5000000000000000   0.8750000000000000

POTCAR为vasp自带的Sn赝势文件
8楼2010-04-18 19:08:30
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lascqy

银虫 (小有名气)

或者在FFLAGS加上-heap-arrays,将数组输出到堆就好了
15楼2010-05-17 23:33:10
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 lascqy 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见