24小时热门版块排行榜    

查看: 2695  |  回复: 16
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

lascqy

银虫 (小有名气)

[交流] 【求助】vasp5.2异常退出的问题 已有9人参与

刚刚用上VASP,遇到一个特别奇怪的问题,请教高手~
最近在搭建平台过程中,遇到这样的问题
环境:red hat enterprise 5.4
          intel C++ and fortran compiler:11.1.069
          intel MKL:10.2.4.032
          MPI:intel MPI3.2.011
BLAS、LAPACK、FFT3D均采用intel MKL中的
出现这样的错误:当INCAR中精度采用Medium的话,采用14个核以下
mpiexec -n 14 ./vasp
就可以正常计算
当15个核以上,就会出现类似以下错误
rank 2 in job 1 node1_55228 caused collective abort of all ranks
exit status of rank 2: killed by signal 9
当精度调至Accurate时,无论使用多少个核均会退出。
开始以为是MPI的问题,后来发现,当不使用MPI运行,直接运行
./vasp
如果是Medium就可以正常计算,但如果是Accurate精度就会报
segmentation fault
退出

后来经过进一步研究发现,同样的编译和输入文件,在vasp4.6中,各种设置均可以完美运行,在5.2中就出现以上错误,难道是vasp5.2有什么设置不同?
望高手或者有遇见相同情况的给点建议

PS:貌似调节MPI_BLOCK的值会略有不同,但还是会报错~
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lascqy

银虫 (小有名气)

引用回帖:
Originally posted by bluewhale at 2010-04-18 00:06:27:
将你的提交脚本粘上来看一看!
我们的4.6和5.2都很正常。

如下,如果方便的话你能不能提供一个你能用较大体系的计算文件我试试,这样就知道是不是输入文件的问题了,谢了
INCAR
SYSTEM=Snv
CUTOFF=340
ISTART=0;
ICHARG=2
ISMEAR=1;
SIGMA=0.2
NSW=100;
IBRION=2
ISIF=3
POTIM=0.2
EDIFF=5E-6;
EDIFFG=5E-5
PREC=Accurate
LREAL=.FALSE.
GGA=PE

KPOINTS
Automatic mesh
0
Monkhorst-Pack
2  2  4
0  0  0

POSCAR
Snv
1.0
11.660000000000000       0.000000000000000       0.000000000000000
0.000000000000000      11.660000000000000       0.000000000000000
0.000000000000000       0.000000000000000       6.360000000000000
31
  Direct
  -0.0000000000000000  -0.0000000000000000   0.0000000000000000
   0.2500000000000000   0.2500000000000000   0.2500000000000000
  -0.0000000000000000   0.2500000000000000   0.1250000000000000
   0.2500000000000000  -0.0000000000000000   0.3750000000000000
   0.5000000000000000  -0.0000000000000000   0.0000000000000000
   0.7500000000000000   0.2500000000000000   0.2500000000000000
   0.5000000000000000   0.2500000000000000   0.1250000000000000
   0.7500000000000000  -0.0000000000000000   0.3750000000000000
  -0.0000000000000000   0.5000000000000000   0.0000000000000000
   0.2500000000000000   0.7500000000000000   0.2500000000000000
  -0.0000000000000000   0.7500000000000000   0.1250000000000000
   0.2500000000000000   0.5000000000000000   0.3750000000000000
   0.5000000000000000   0.5000000000000000   0.0000000000000000
   0.7500000000000000   0.7500000000000000   0.2500000000000000
   0.5000000000000000   0.7500000000000000   0.1250000000000000
   0.7500000000000000   0.5000000000000000   0.3750000000000000
  -0.0000000000000000  -0.0000000000000000   0.5000000000000000
   0.2500000000000000   0.2500000000000000   0.7500000000000000
  -0.0000000000000000   0.2500000000000000   0.6250000000000000
   0.2500000000000000  -0.0000000000000000   0.8750000000000000
   0.5000000000000000  -0.0000000000000000   0.5000000000000000
   0.7500000000000000   0.2500000000000000   0.7500000000000000
   0.5000000000000000   0.2500000000000000   0.6250000000000000
   0.7500000000000000  -0.0000000000000000   0.8750000000000000
  -0.0000000000000000   0.5000000000000000   0.5000000000000000
   0.2500000000000000   0.7500000000000000   0.7500000000000000
  -0.0000000000000000   0.7500000000000000   0.6250000000000000
   0.2500000000000000   0.5000000000000000   0.8750000000000000
   0.7500000000000000   0.7500000000000000   0.7500000000000000
   0.5000000000000000   0.7500000000000000   0.6250000000000000
   0.7500000000000000   0.5000000000000000   0.8750000000000000

POTCAR为vasp自带的Sn赝势文件
8楼2010-04-18 19:08:30
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 17 个回答

y1ding

铁杆木虫 (著名写手)

★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
gavinliu7390(金币+1):谢谢参与! 2010-04-14 07:55
引用回帖:
Originally posted by lascqy at 2010-04-13 23:28:18:
刚刚用上VASP,遇到一个特别奇怪的问题,请教高手~
最近在搭建平台过程中,遇到这样的问题
环境:red hat enterprise 5.4
          intel C++ and fortran compiler:11.1.069
          intel MKL:10.2.4.032 ...

我们也遇到这个情况。而且比你的还要复杂,编译出来的vasp5,有的账号能算,有的账号就出现类似于你的错误。而vasp4则没有问题。
似乎和用户的某些设置有关。但是不知道什么原因。
2楼2010-04-13 23:59:01
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lxbyf

铁虫 (初入文坛)


小木虫(金币+0.5):给个红包,谢谢回帖交流
恩,我这里也遇到这样的情况,貌似跟用户有点关系,之前我的账号算4.6都好好的,编译了5.2就出现这样的情况,而其他人就可以算,最后只好重建一个新账号来用5.2算,就没有问题了,求解答~~~
3楼2010-04-16 21:03:15
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bluewhale

铁杆木虫 (正式写手)

★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
gavinliu7390(金币+2):谢谢交流! 2010-04-17 10:18
用低一点版本编译试一下,我们的集群一直用v9的intel compiler编译似乎没有什么问题。
另检查一下用户配置是否正确,直接用ssh在各可能用到的节点试一下,有时系统换硬盘什么的可户忘了更新known_hosts, 尽管登录时有提示,但很多人根本不看管理员给出信息。

[ Last edited by bluewhale on 2010-4-16 at 22:18 ]
4楼2010-04-16 22:10:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见