24小时热门版块排行榜    

查看: 2685  |  回复: 16

lascqy

银虫 (小有名气)

[交流] 【求助】vasp5.2异常退出的问题 已有9人参与

刚刚用上VASP,遇到一个特别奇怪的问题,请教高手~
最近在搭建平台过程中,遇到这样的问题
环境:red hat enterprise 5.4
          intel C++ and fortran compiler:11.1.069
          intel MKL:10.2.4.032
          MPI:intel MPI3.2.011
BLAS、LAPACK、FFT3D均采用intel MKL中的
出现这样的错误:当INCAR中精度采用Medium的话,采用14个核以下
mpiexec -n 14 ./vasp
就可以正常计算
当15个核以上,就会出现类似以下错误
rank 2 in job 1 node1_55228 caused collective abort of all ranks
exit status of rank 2: killed by signal 9
当精度调至Accurate时,无论使用多少个核均会退出。
开始以为是MPI的问题,后来发现,当不使用MPI运行,直接运行
./vasp
如果是Medium就可以正常计算,但如果是Accurate精度就会报
segmentation fault
退出

后来经过进一步研究发现,同样的编译和输入文件,在vasp4.6中,各种设置均可以完美运行,在5.2中就出现以上错误,难道是vasp5.2有什么设置不同?
望高手或者有遇见相同情况的给点建议

PS:貌似调节MPI_BLOCK的值会略有不同,但还是会报错~
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

y1ding

铁杆木虫 (著名写手)

★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
gavinliu7390(金币+1):谢谢参与! 2010-04-14 07:55
引用回帖:
Originally posted by lascqy at 2010-04-13 23:28:18:
刚刚用上VASP,遇到一个特别奇怪的问题,请教高手~
最近在搭建平台过程中,遇到这样的问题
环境:red hat enterprise 5.4
          intel C++ and fortran compiler:11.1.069
          intel MKL:10.2.4.032 ...

我们也遇到这个情况。而且比你的还要复杂,编译出来的vasp5,有的账号能算,有的账号就出现类似于你的错误。而vasp4则没有问题。
似乎和用户的某些设置有关。但是不知道什么原因。
2楼2010-04-13 23:59:01
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lxbyf

铁虫 (初入文坛)


小木虫(金币+0.5):给个红包,谢谢回帖交流
恩,我这里也遇到这样的情况,貌似跟用户有点关系,之前我的账号算4.6都好好的,编译了5.2就出现这样的情况,而其他人就可以算,最后只好重建一个新账号来用5.2算,就没有问题了,求解答~~~
3楼2010-04-16 21:03:15
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bluewhale

铁杆木虫 (正式写手)

★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
gavinliu7390(金币+2):谢谢交流! 2010-04-17 10:18
用低一点版本编译试一下,我们的集群一直用v9的intel compiler编译似乎没有什么问题。
另检查一下用户配置是否正确,直接用ssh在各可能用到的节点试一下,有时系统换硬盘什么的可户忘了更新known_hosts, 尽管登录时有提示,但很多人根本不看管理员给出信息。

[ Last edited by bluewhale on 2010-4-16 at 22:18 ]
4楼2010-04-16 22:10:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lascqy

银虫 (小有名气)

引用回帖:
Originally posted by bluewhale at 2010-04-16 22:10:41:
用低一点版本编译试一下,我们的集群一直用v9的intel compiler编译似乎没有什么问题。
另检查一下用户配置是否正确,直接用ssh在各可能用到的节点试一下,有时系统换硬盘什么的可户忘了更新known_hosts, 尽管登录 ...

恩,我换低版本的试试
ssh肯定是没问题的,全部都通过无密码访问的方式配置,NFS共享一个用户目录,所以所有节点互访无问题的,另外忘了说明,好像我自己写的文件有点奇怪,明明是1个group,20个节点,而vasp运行开始的提示却是
1node , 20group
不知道这个是不是反应了一些错误,难道是输入文件的问题??
5楼2010-04-17 21:20:14
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zzy870720z

荣誉版主 (文坛精英)

优秀版主优秀版主优秀版主优秀版主


小木虫(金币+0.5):给个红包,谢谢回帖交流
还没用上5.2, 不知道怎么样呢?
博学、审问、慎思、明辨、笃学
6楼2010-04-17 21:25:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bluewhale

铁杆木虫 (正式写手)


gavinliu7390(金币+1):谢谢参与! 2010-04-18 09:27
将你的提交脚本粘上来看一看!
我们的4.6和5.2都很正常。
7楼2010-04-18 00:06:27
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lascqy

银虫 (小有名气)

引用回帖:
Originally posted by bluewhale at 2010-04-18 00:06:27:
将你的提交脚本粘上来看一看!
我们的4.6和5.2都很正常。

如下,如果方便的话你能不能提供一个你能用较大体系的计算文件我试试,这样就知道是不是输入文件的问题了,谢了
INCAR
SYSTEM=Snv
CUTOFF=340
ISTART=0;
ICHARG=2
ISMEAR=1;
SIGMA=0.2
NSW=100;
IBRION=2
ISIF=3
POTIM=0.2
EDIFF=5E-6;
EDIFFG=5E-5
PREC=Accurate
LREAL=.FALSE.
GGA=PE

KPOINTS
Automatic mesh
0
Monkhorst-Pack
2  2  4
0  0  0

POSCAR
Snv
1.0
11.660000000000000       0.000000000000000       0.000000000000000
0.000000000000000      11.660000000000000       0.000000000000000
0.000000000000000       0.000000000000000       6.360000000000000
31
  Direct
  -0.0000000000000000  -0.0000000000000000   0.0000000000000000
   0.2500000000000000   0.2500000000000000   0.2500000000000000
  -0.0000000000000000   0.2500000000000000   0.1250000000000000
   0.2500000000000000  -0.0000000000000000   0.3750000000000000
   0.5000000000000000  -0.0000000000000000   0.0000000000000000
   0.7500000000000000   0.2500000000000000   0.2500000000000000
   0.5000000000000000   0.2500000000000000   0.1250000000000000
   0.7500000000000000  -0.0000000000000000   0.3750000000000000
  -0.0000000000000000   0.5000000000000000   0.0000000000000000
   0.2500000000000000   0.7500000000000000   0.2500000000000000
  -0.0000000000000000   0.7500000000000000   0.1250000000000000
   0.2500000000000000   0.5000000000000000   0.3750000000000000
   0.5000000000000000   0.5000000000000000   0.0000000000000000
   0.7500000000000000   0.7500000000000000   0.2500000000000000
   0.5000000000000000   0.7500000000000000   0.1250000000000000
   0.7500000000000000   0.5000000000000000   0.3750000000000000
  -0.0000000000000000  -0.0000000000000000   0.5000000000000000
   0.2500000000000000   0.2500000000000000   0.7500000000000000
  -0.0000000000000000   0.2500000000000000   0.6250000000000000
   0.2500000000000000  -0.0000000000000000   0.8750000000000000
   0.5000000000000000  -0.0000000000000000   0.5000000000000000
   0.7500000000000000   0.2500000000000000   0.7500000000000000
   0.5000000000000000   0.2500000000000000   0.6250000000000000
   0.7500000000000000  -0.0000000000000000   0.8750000000000000
  -0.0000000000000000   0.5000000000000000   0.5000000000000000
   0.2500000000000000   0.7500000000000000   0.7500000000000000
  -0.0000000000000000   0.7500000000000000   0.6250000000000000
   0.2500000000000000   0.5000000000000000   0.8750000000000000
   0.7500000000000000   0.7500000000000000   0.7500000000000000
   0.5000000000000000   0.7500000000000000   0.6250000000000000
   0.7500000000000000   0.5000000000000000   0.8750000000000000

POTCAR为vasp自带的Sn赝势文件
8楼2010-04-18 19:08:30
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wangzg9292

木虫 (正式写手)


小木虫(金币+0.5):给个红包,谢谢回帖交流
偶也遇到这个问题了,用其他版本没问题,
vasp.5.2.2 15Apr09 complex
POSCAR found :  1 types and    1 ions
LDA part: xc-table for Pade appr. of Perdew
POSCAR, INCAR and KPOINTS ok, starting setup
WARNING: small aliasing (wrap around) errors must be expected
FFT: planning ...(           1 )
reading WAVECAR
forrtl: severe (174): SIGSEGV, segmentation fault occurred
Image              PC                Routine            Line        Source            
libblas.so.3       00002AAAAAB0C902  Unknown               Unknown  Unknown
vasp               0000000000A5A26A  Unknown               Unknown  Unknown
vasp               0000000000A725FC  Unknown               Unknown  Unknown
vasp               0000000000537E8D  Unknown               Unknown  Unknown
vasp               000000000041D6BB  Unknown               Unknown  Unknown
vasp               00000000004048DC  Unknown               Unknown  Unknown
libc.so.6          0000003D93A1D8A4  Unknown               Unknown  Unknown
vasp               00000000004047E9  Unknown               Unknown  Unknown
这与赝势有关吗?
9楼2010-05-17 16:06:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zzy870720z

荣誉版主 (文坛精英)

优秀版主优秀版主优秀版主优秀版主


小木虫(金币+0.5):给个红包,谢谢回帖交流
不知道是不是内存问题, segmentation fault 有可能是内存溢出了
和赝势应该关系不大
博学、审问、慎思、明辨、笃学
10楼2010-05-17 17:01:09
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 lascqy 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见