24小时热门版块排行榜    

查看: 2076  |  回复: 9
本帖产生 1 个 1ST强帖 ,点击这里进行查看

zhang668

木虫 (正式写手)

[求助] 同个任务同样的节点数VASP4.6能算,而VASP5.2不能

对24个原子的体系的结构优化任务,256个节点,VASP4.6可以计算,但VASP5.2(自旋轨道耦合版本)计算得到段错误提示:
forrtl: severe (174): SIGSEGV, segmentation fault occurred。
用ulimit -a查了下stack size:无限制。

以前小体系的时候测试过,发现两个版本计算效率挺接近的,这次体系增大,同时增大节点数,发现很大差异,基本上VASP5.2很容易出现段错误提示。
看到wuli8版主的段错误一个贴,最终解决是在FLAG的选项中加入: -heap-arrays  64,而我的VASP5.2版本原来编译时候已经加入了这项:
FFLAGS =  -FR -lowercase -assume byterecl -heap-arrays 64 -I/opt/intel/mkl/10.2.1.017/include/fftw
其它编译参数:
FC=mpiifort

CPP    = $(CPP_) -DMPI  -DHOST=\"LinuxIFC\" -DIFC \
     -Dkind8 -DCACHE_SIZE=4000 -DPGF90 -Davoidalloc \
     -DMPI_BLOCK=8000  -DRPROMU_DGEMV  -DRACCMU_DGEMV

SCA=-L/opt/intel/mkl/10.2.1.017/lib/em64t -lmkl_scalapack_lp64 -lmkl_blacs_intelmpi_lp64

请教各位,编译有没问题,以前曾用这个VASP5.2计算过10个原子的自选轨道耦合,一直挺顺利的。最近计算20原子的体系,总是出现问题。请大家帮忙看下是什么问题?

[ Last edited by zhang668 on 2011-6-15 at 22:22 ]
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cavediger

金虫 (正式写手)

【答案】应助回帖

★ ★ ★ ★ ★
youzhizhe(金币+5): 谢谢交流。 2011-06-16 09:50:48
youzhizhe(1ST强帖+1): 谢谢交流。 2011-06-16 09:51:16
zhang668(金币+3): 非常感谢详细指导 2011-06-16 15:00:22
引用回帖:
Originally posted by zhang668 at 2011-06-15 22:17:42:
对24个原子的体系的结构优化任务,256个节点,VASP4.6可以计算,但VASP5.2(自旋轨道耦合版本)计算得到段错误提示:
forrtl: severe (174): SIGSEGV, segmentation fault occurred。
用ulimit -a查了下stack s ...

1.查一查下OUTCAR里最后几行的提示,是否进入了主循环计算?
2.-heap-arrays  64 只是解决栈溢出问题,你只有那么点原子,考虑自旋也也不会产生此问题;
3.检查一下你的编译器的版本,INTEL 10.xxx编译器本身有bug,会遇到一下意想不到的问题;
4.FC=mpiifort,这个是自己该的还是自动生成的?一般MPI编译后,会建立个mpif90到ifort连接,即便并行编译,FC=mpif90 或 ifort都可以;
5.你在做测试吗?这么小的体系还用那么多个节点,并行效率很差,时间都浪费在CPU之间的通讯上了。你可以减少节点测试一下,或者串行试一下看看是否还有这个问题。
我们都老得太快,却聪明得太迟。当我一路跌跌撞撞登上山巅,蓦然发现,本来就有一条笔直的路,直达山顶....
2楼2011-06-16 06:24:08
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhang668

木虫 (正式写手)

引用回帖:
Originally posted by cavediger at 2011-06-16 06:24:08:
1.查一查下OUTCAR里最后几行的提示,是否进入了主循环计算?
2.-heap-arrays  64 只是解决栈溢出问题,你只有那么点原子,考虑自旋也也不会产生此问题;
3.检查一下你的编译器的版本,INTEL 10.xxx编译器本身 ...

OUTCAR最后行没进入主循环就停了,如下:
----------------------------------------- Iteration    1(   1)  ---------------------------------------

我重新用少节点测试了下,发现32和64节点时,VASP5.2仍然出现段错误问题,而VASP4.6可以计算。 不知道是否跟5.2的自旋轨道耦合版本有关。
3楼2011-06-16 15:25:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhang668

木虫 (正式写手)

FC=mpiifort是我自己改的,并行环境为Intel公司的MPI 3.2.
4楼2011-06-16 15:29:18
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cavediger

金虫 (正式写手)

★ ★
gzqdyouxia(金币+2): 谢谢指教 2011-06-17 09:35:07
引用回帖:
Originally posted by zhang668 at 2011-06-16 15:25:45:
OUTCAR最后行没进入主循环就停了,如下:
----------------------------------------- Iteration    1(   1)  ---------------------------------------

我重新用少节点测试了下,发现32和64节点时,VASP5 ...

k点取得很多吗?cutoff很高吗?以前用4.6时遇到过类似问题,当计算包含30多个重金属原子的体系时,如果k点多、cutoff高时会出现你所遇到的情况,-heap也不行,后来也懒得研究就改用了pgi,编译出来的vasp就没再遇到这种问题了。不过你的4.6没问题,5.2却不行,很让人不理解,确认编译环境一样吗?
我们都老得太快,却聪明得太迟。当我一路跌跌撞撞登上山巅,蓦然发现,本来就有一条笔直的路,直达山顶....
5楼2011-06-16 17:45:47
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

pandora_oo

银虫 (初入文坛)

【答案】应助回帖


gzqdyouxia(金币+1): 谢谢交流 2011-06-17 09:35:17
zhang668(金币+2): 2011-06-19 23:26:27
NPAR = sqrt
6楼2011-06-16 17:50:42
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhang668

木虫 (正式写手)

引用回帖:
Originally posted by cavediger at 2011-06-16 17:45:47:
k点取得很多吗?cutoff很高吗?以前用4.6时遇到过类似问题,当计算包含30多个重金属原子的体系时,如果k点多、cutoff高时会出现你所遇到的情况,-heap也不行,后来也懒得研究就改用了pgi,编译出来的vasp就没再 ...

k点不多。是这样的,我的4.6版本是直接拷过来的程序,就是在集群下编译的。
5.2旋轨耦合版本是我自己编译的。
这是5.2 makefile:
FC=ifort
# fortran linker
FCL=$(FC)


#-----------------------------------------------------------------------
# whereis CPP ?? (I need CPP, can't use gcc with proper options)
# that's the location of gcc for SUSE 5.3
#
#  CPP_   =  /usr/lib/gcc-lib/i486-linux/2.7.2/cpp -P -C
#
# that's probably the right line for some Red Hat distribution:
#
#  CPP_   =  /usr/lib/gcc-lib/i386-redhat-linux/2.7.2.3/cpp -P -C
#
#  SUSE X.X, maybe some Red Hat distributions:

CPP_ =  ./preprocess <$*.F | /usr/bin/cpp -P -C -traditional >$*$(SUFFIX)

#-----------------------------------------------------------------------
# possible options for CPP:
# NGXhalf             charge density   reduced in X direction
# wNGXhalf            gamma point only reduced in X direction
# avoidalloc          avoid ALLOCATE if possible
# PGF90               work around some for some PGF90 / IFC bugs
# CACHE_SIZE          1000 for PII,PIII, 5000 for Athlon, 8000-12000 P4, PD
# RPROMU_DGEMV        use DGEMV instead of DGEMM in RPRO (depends on used BLAS)
# RACCMU_DGEMV        use DGEMV instead of DGEMM in RACC (depends on used BLAS)
#-----------------------------------------------------------------------

CPP     = $(CPP_)  -DHOST=\"LinuxIFC\" \
          -Dkind8 -DCACHE_SIZE=12000 -DPGF90 -Davoidalloc \
#          -DRPROMU_DGEMV  -DRACCMU_DGEMV

#-----------------------------------------------------------------------
# general fortran flags  (there must a trailing blank on this line)
# byterecl is strictly required for ifc, since otherwise
# the WAVECAR file becomes huge
#-----------------------------------------------------------------------

FFLAGS =  -FR -lowercase -assume byterecl -heap-arrays 64 -I/opt/intel/mkl/10.2.1.017/include/fftw

#-----------------------------------------------------------------------
# optimization
# we have tested whether higher optimisation improves performance
# -axK  SSE1 optimization,  but also generate code executable on all mach.
#       xK improves performance somewhat on XP, and a is required in order
#       to run the code on older Athlons as well
# -xW   SSE2 optimization
# -axW  SSE2 optimization,  but also generate code executable on all mach.
# -tpp6 P3 optimization
# -tpp7 P4 optimization
#-----------------------------------------------------------------------

# ifc.9.1, ifc.10.1 recommended
OFLAG=-O3

OFLAG_HIGH = $(OFLAG)
OBJ_HIGH =
OBJ_NOOPT =
DEBUG  = -FR -O0
INLINE = $(OFLAG)

#-----------------------------------------------------------------------
# the following lines specify the position of BLAS  and LAPACK
# VASP works fastest with the libgoto library
# so that's what we recommend
#-----------------------------------------------------------------------

# mkl.10.0
# set -DRPROMU_DGEMV  -DRACCMU_DGEMV in the CPP lines
BLAS=-L/opt/intel/mkl/10.2.1.017/lib/em64t -lmkl_intel_lp64 -lmkl_sequential -lpthread -lmkl_core

# even faster for VASP Kazushige Goto's BLAS
# http://www.cs.utexas.edu/users/kgoto/signup_first.html
# parallel goto version requires sometimes -libverbs
#BLAS=  /opt/libs/libgoto/libgoto.so

# LAPACK, simplest use vasp.5.lib/lapack_double
#LAPACK= ../vasp.5.lib/lapack_double.o

# use the mkl Intel lapack
LAPACK=-L/opt/intel/mkl/10.2.1.017/lib/em64t -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lpthread

#-----------------------------------------------------------------------

#LIB  = -L../vasp.5.lib -ldmy \
     ../vasp.5.lib/linpack_double.o $(LAPACK) \
     $(BLAS)

# options for linking, nothing is required (usually)
LINK    =

#-----------------------------------------------------------------------
# fft libraries:
# VASP.5.2 can use fftw.3.1.X (http://www.fftw.org)
# since this version is faster on P4 machines, we recommend to use it
#-----------------------------------------------------------------------

#FFT3D   = fft3dfurth.o fft3dlib.o

# alternatively: fftw.3.1.X is slighly faster and should be used if available
#FFT3D   = fftw3d.o fft3dlib.o   /opt/libs/fftw-3.1.2/lib/libfftw3.a


#=======================================================================
# MPI section, uncomment the following lines until
#    general  rules and compile lines
# presently we recommend OPENMPI, since it seems to offer better
# performance than lam or mpich
#
# !!! Please do not send me any queries on how to install MPI, I will
# certainly not answer them !!!!
#=======================================================================
#-----------------------------------------------------------------------
# fortran linker for mpi
#-----------------------------------------------------------------------

FC=mpiifort
FCL=$(FC)

#-----------------------------------------------------------------------
# additional options for CPP in parallel version (see also above):
# NGZhalf               charge density   reduced in Z direction
# wNGZhalf              gamma point only reduced in Z direction
# scaLAPACK             use scaLAPACK (usually slower on 100 Mbit Net)
#-----------------------------------------------------------------------

CPP    = $(CPP_) -DMPI  -DHOST=\"LinuxIFC\" -DIFC \
     -Dkind8 -DCACHE_SIZE=4000 -DPGF90 -Davoidalloc \
     -DMPI_BLOCK=8000  -DRPROMU_DGEMV  -DRACCMU_DGEMV

#-----------------------------------------------------------------------
# location of SCALAPACK
# if you do not use SCALAPACK simply leave that section commented out
#-----------------------------------------------------------------------

#BLACS=$(HOME)/archives/SCALAPACK/BLACS/
#SCA_=$(HOME)/archives/SCALAPACK/SCALAPACK

#SCA= $(SCA_)/libscalapack.a  \
# $(BLACS)/LIB/blacsF77init_MPI-LINUX-0.a $(BLACS)/LIB/blacs_MPI-LINUX-0.a $(BLACS)/LIB/blacsF77init_MPI-LINUX-0.a

SCA=-L/opt/intel/mkl/10.2.1.017/lib/em64t -lmkl_scalapack_lp64 -lmkl_blacs_intelmpi_lp64

#-----------------------------------------------------------------------
# libraries for mpi
#-----------------------------------------------------------------------

LIB     = -L../vasp.5.lib -ldmy  \
      ../vasp.5.lib/linpack_double.o $(LAPACK) \
      $(SCA) $(BLAS)

# FFT: fftmpi.o with fft3dlib of Juergen Furthmueller
#FFT3D   = fftmpi.o fftmpi_map.o fft3dfurth.o fft3dlib.o

# alternatively: fftw.3.1.X is slighly faster and should be used if available
FFT3D   = fftmpiw.o fftmpi_map.o fftw3d.o fft3dlib.o  /gpfssan1/apps/fftw32/lib/libfftw3f.a
7楼2011-06-18 13:27:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

tuhaidan

银虫 (小有名气)

引用回帖:
2楼: Originally posted by cavediger at 2011-06-16 06:24:08:
1.查一查下OUTCAR里最后几行的提示,是否进入了主循环计算?
2.-heap-arrays  64 只是解决栈溢出问题,你只有那么点原子,考虑自旋也也不会产生此问题;
3.检查一下你的编译器的版本,INTEL 10.xxx编译器本身有 ...

你好,我现在就是遇见这个问题,我做的单原子测试检验赝势的好坏,按照侯博士手册上面的例子,一个k点,内存够,堆栈也是unlimited,难道会是编译问题吗?
8楼2011-11-01 17:18:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhang668

木虫 (正式写手)

用vasp自带的FFT库
9楼2011-11-02 23:29:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hnuzhoulin

金虫 (小有名气)

不知道怎么搞
留名期待高人
10楼2011-11-03 18:15:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 zhang668 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[精细化工] 同一个反应相同的反应条件,是不是反应结果相差不大? +6 青霉素 2024-11-11 6/300 2024-11-16 13:35 by linjunc
[教师之家] 我感觉当老师好累啊。。 +18 fairy1122 2024-11-15 19/950 2024-11-16 12:58 by goldbridge
[基金申请] 博后资助名单出来了 +13 Shxjjxjkx 2024-11-14 15/750 2024-11-16 11:12 by kudofaye
[论文投稿] 论文返修状态变成了awaiting AE recommendation 10+4 猪小耍 2024-11-13 15/750 2024-11-16 09:24 by guxue
[论文投稿] 国内期刊审稿人数量 +4 新时代核动力驴 2024-11-13 6/300 2024-11-16 08:24 by pityzhou
[教师之家] 北大教授何怀宏曾如此描述他的同行 +13 zju2000 2024-11-09 13/650 2024-11-16 07:45 by 080520dxf
[教师之家] 这种人痛苦吗 +12 2671 2024-11-12 14/700 2024-11-15 22:15 by 仇恨毁灭财富
[论文投稿] chemical science和advanced science哪个好一点 +6 yly150 2024-11-12 6/300 2024-11-15 21:06 by hcj9909053
[考博] 中南大学 粉末冶金国家重点实验室 陈超教授课题组拟招收 1~2位博士研究生通知 +7 中南大学-金属材 2024-11-14 18/900 2024-11-15 20:22 by 中南大学-金属材
[论文投稿] 核心期刊那个阶段最难 +4 公共茅斯 2024-11-11 4/200 2024-11-15 16:44 by sugarmei
[基金申请] 变性人申请基金咋算性别? +21 leicahfs 2024-11-11 21/1050 2024-11-15 14:54 by 跳鱼拨刺
[基金申请] 去年七月底入站的还能申请下一批吗? +4 brightwo 2024-11-14 4/200 2024-11-15 14:18 by gazi1111
[硕博家园] reject后小感 +6 sioc-sunj 2024-11-14 8/400 2024-11-15 11:50 by 畅21
[硕博家园] 研究生的生活该是什么样 +4 lqy0719 2024-11-14 4/200 2024-11-14 16:45 by 阿荣喝酒
[有机交流] 同一个反应回流情况不同 20+3 1853846 2024-11-12 3/150 2024-11-14 15:42 by 太阳谷
[基金申请] 第76批博士后面上大概什么时间公示 +6 探际者 2024-11-11 7/350 2024-11-14 10:06 by Foxicut88
[基金申请] 浙江省青基怎么看A还是B? +8 ToallGoof 2024-11-11 14/700 2024-11-13 09:11 by Praybest
[硕博家园] 如何看清华北大硕博的毕业论文 +6 2025lucky 2024-11-10 6/300 2024-11-12 22:46 by 楚扬长流
[论文投稿] 投稿求助 40+3 liukun11 2024-11-12 4/200 2024-11-12 19:13 by liukun11
[硕博家园] 同步辐射 +4 小张要加油努力 2024-11-10 7/350 2024-11-11 13:47 by mpdfwxgui
信息提示
请填处理意见