24小时热门版块排行榜    

查看: 2769  |  回复: 16
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

lascqy

银虫 (小有名气)

[交流] 【求助】vasp5.2异常退出的问题 已有9人参与

刚刚用上VASP,遇到一个特别奇怪的问题,请教高手~
最近在搭建平台过程中,遇到这样的问题
环境:red hat enterprise 5.4
          intel C++ and fortran compiler:11.1.069
          intel MKL:10.2.4.032
          MPI:intel MPI3.2.011
BLAS、LAPACK、FFT3D均采用intel MKL中的
出现这样的错误:当INCAR中精度采用Medium的话,采用14个核以下
mpiexec -n 14 ./vasp
就可以正常计算
当15个核以上,就会出现类似以下错误
rank 2 in job 1 node1_55228 caused collective abort of all ranks
exit status of rank 2: killed by signal 9
当精度调至Accurate时,无论使用多少个核均会退出。
开始以为是MPI的问题,后来发现,当不使用MPI运行,直接运行
./vasp
如果是Medium就可以正常计算,但如果是Accurate精度就会报
segmentation fault
退出

后来经过进一步研究发现,同样的编译和输入文件,在vasp4.6中,各种设置均可以完美运行,在5.2中就出现以上错误,难道是vasp5.2有什么设置不同?
望高手或者有遇见相同情况的给点建议

PS:貌似调节MPI_BLOCK的值会略有不同,但还是会报错~
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wangzg9292

木虫 (正式写手)


小木虫(金币+0.5):给个红包,谢谢回帖交流
偶也遇到这个问题了,用其他版本没问题,
vasp.5.2.2 15Apr09 complex
POSCAR found :  1 types and    1 ions
LDA part: xc-table for Pade appr. of Perdew
POSCAR, INCAR and KPOINTS ok, starting setup
WARNING: small aliasing (wrap around) errors must be expected
FFT: planning ...(           1 )
reading WAVECAR
forrtl: severe (174): SIGSEGV, segmentation fault occurred
Image              PC                Routine            Line        Source            
libblas.so.3       00002AAAAAB0C902  Unknown               Unknown  Unknown
vasp               0000000000A5A26A  Unknown               Unknown  Unknown
vasp               0000000000A725FC  Unknown               Unknown  Unknown
vasp               0000000000537E8D  Unknown               Unknown  Unknown
vasp               000000000041D6BB  Unknown               Unknown  Unknown
vasp               00000000004048DC  Unknown               Unknown  Unknown
libc.so.6          0000003D93A1D8A4  Unknown               Unknown  Unknown
vasp               00000000004047E9  Unknown               Unknown  Unknown
这与赝势有关吗?
9楼2010-05-17 16:06:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 17 个回答

y1ding

铁杆木虫 (著名写手)

★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
gavinliu7390(金币+1):谢谢参与! 2010-04-14 07:55
引用回帖:
Originally posted by lascqy at 2010-04-13 23:28:18:
刚刚用上VASP,遇到一个特别奇怪的问题,请教高手~
最近在搭建平台过程中,遇到这样的问题
环境:red hat enterprise 5.4
          intel C++ and fortran compiler:11.1.069
          intel MKL:10.2.4.032 ...

我们也遇到这个情况。而且比你的还要复杂,编译出来的vasp5,有的账号能算,有的账号就出现类似于你的错误。而vasp4则没有问题。
似乎和用户的某些设置有关。但是不知道什么原因。
2楼2010-04-13 23:59:01
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lxbyf

铁虫 (初入文坛)


小木虫(金币+0.5):给个红包,谢谢回帖交流
恩,我这里也遇到这样的情况,貌似跟用户有点关系,之前我的账号算4.6都好好的,编译了5.2就出现这样的情况,而其他人就可以算,最后只好重建一个新账号来用5.2算,就没有问题了,求解答~~~
3楼2010-04-16 21:03:15
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bluewhale

铁杆木虫 (正式写手)

★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
gavinliu7390(金币+2):谢谢交流! 2010-04-17 10:18
用低一点版本编译试一下,我们的集群一直用v9的intel compiler编译似乎没有什么问题。
另检查一下用户配置是否正确,直接用ssh在各可能用到的节点试一下,有时系统换硬盘什么的可户忘了更新known_hosts, 尽管登录时有提示,但很多人根本不看管理员给出信息。

[ Last edited by bluewhale on 2010-4-16 at 22:18 ]
4楼2010-04-16 22:10:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见