24小时热门版块排行榜    

查看: 2107  |  回复: 9
本帖产生 1 个 1ST强帖 ,点击这里进行查看

zhang668

木虫 (正式写手)

[求助] 同个任务同样的节点数VASP4.6能算,而VASP5.2不能

对24个原子的体系的结构优化任务,256个节点,VASP4.6可以计算,但VASP5.2(自旋轨道耦合版本)计算得到段错误提示:
forrtl: severe (174): SIGSEGV, segmentation fault occurred。
用ulimit -a查了下stack size:无限制。

以前小体系的时候测试过,发现两个版本计算效率挺接近的,这次体系增大,同时增大节点数,发现很大差异,基本上VASP5.2很容易出现段错误提示。
看到wuli8版主的段错误一个贴,最终解决是在FLAG的选项中加入: -heap-arrays  64,而我的VASP5.2版本原来编译时候已经加入了这项:
FFLAGS =  -FR -lowercase -assume byterecl -heap-arrays 64 -I/opt/intel/mkl/10.2.1.017/include/fftw
其它编译参数:
FC=mpiifort

CPP    = $(CPP_) -DMPI  -DHOST=\"LinuxIFC\" -DIFC \
     -Dkind8 -DCACHE_SIZE=4000 -DPGF90 -Davoidalloc \
     -DMPI_BLOCK=8000  -DRPROMU_DGEMV  -DRACCMU_DGEMV

SCA=-L/opt/intel/mkl/10.2.1.017/lib/em64t -lmkl_scalapack_lp64 -lmkl_blacs_intelmpi_lp64

请教各位,编译有没问题,以前曾用这个VASP5.2计算过10个原子的自选轨道耦合,一直挺顺利的。最近计算20原子的体系,总是出现问题。请大家帮忙看下是什么问题?

[ Last edited by zhang668 on 2011-6-15 at 22:22 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cavediger

金虫 (正式写手)

【答案】应助回帖

★ ★ ★ ★ ★
youzhizhe(金币+5): 谢谢交流。 2011-06-16 09:50:48
youzhizhe(1ST强帖+1): 谢谢交流。 2011-06-16 09:51:16
zhang668(金币+3): 非常感谢详细指导 2011-06-16 15:00:22
引用回帖:
Originally posted by zhang668 at 2011-06-15 22:17:42:
对24个原子的体系的结构优化任务,256个节点,VASP4.6可以计算,但VASP5.2(自旋轨道耦合版本)计算得到段错误提示:
forrtl: severe (174): SIGSEGV, segmentation fault occurred。
用ulimit -a查了下stack s ...

1.查一查下OUTCAR里最后几行的提示,是否进入了主循环计算?
2.-heap-arrays  64 只是解决栈溢出问题,你只有那么点原子,考虑自旋也也不会产生此问题;
3.检查一下你的编译器的版本,INTEL 10.xxx编译器本身有bug,会遇到一下意想不到的问题;
4.FC=mpiifort,这个是自己该的还是自动生成的?一般MPI编译后,会建立个mpif90到ifort连接,即便并行编译,FC=mpif90 或 ifort都可以;
5.你在做测试吗?这么小的体系还用那么多个节点,并行效率很差,时间都浪费在CPU之间的通讯上了。你可以减少节点测试一下,或者串行试一下看看是否还有这个问题。
我们都老得太快,却聪明得太迟。当我一路跌跌撞撞登上山巅,蓦然发现,本来就有一条笔直的路,直达山顶....
2楼2011-06-16 06:24:08
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhang668

木虫 (正式写手)

引用回帖:
Originally posted by cavediger at 2011-06-16 06:24:08:
1.查一查下OUTCAR里最后几行的提示,是否进入了主循环计算?
2.-heap-arrays  64 只是解决栈溢出问题,你只有那么点原子,考虑自旋也也不会产生此问题;
3.检查一下你的编译器的版本,INTEL 10.xxx编译器本身 ...

OUTCAR最后行没进入主循环就停了,如下:
----------------------------------------- Iteration    1(   1)  ---------------------------------------

我重新用少节点测试了下,发现32和64节点时,VASP5.2仍然出现段错误问题,而VASP4.6可以计算。 不知道是否跟5.2的自旋轨道耦合版本有关。
3楼2011-06-16 15:25:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhang668

木虫 (正式写手)

FC=mpiifort是我自己改的,并行环境为Intel公司的MPI 3.2.
4楼2011-06-16 15:29:18
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cavediger

金虫 (正式写手)

★ ★
gzqdyouxia(金币+2): 谢谢指教 2011-06-17 09:35:07
引用回帖:
Originally posted by zhang668 at 2011-06-16 15:25:45:
OUTCAR最后行没进入主循环就停了,如下:
----------------------------------------- Iteration    1(   1)  ---------------------------------------

我重新用少节点测试了下,发现32和64节点时,VASP5 ...

k点取得很多吗?cutoff很高吗?以前用4.6时遇到过类似问题,当计算包含30多个重金属原子的体系时,如果k点多、cutoff高时会出现你所遇到的情况,-heap也不行,后来也懒得研究就改用了pgi,编译出来的vasp就没再遇到这种问题了。不过你的4.6没问题,5.2却不行,很让人不理解,确认编译环境一样吗?
我们都老得太快,却聪明得太迟。当我一路跌跌撞撞登上山巅,蓦然发现,本来就有一条笔直的路,直达山顶....
5楼2011-06-16 17:45:47
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

pandora_oo

银虫 (初入文坛)

【答案】应助回帖


gzqdyouxia(金币+1): 谢谢交流 2011-06-17 09:35:17
zhang668(金币+2): 2011-06-19 23:26:27
NPAR = sqrt
6楼2011-06-16 17:50:42
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhang668

木虫 (正式写手)

引用回帖:
Originally posted by cavediger at 2011-06-16 17:45:47:
k点取得很多吗?cutoff很高吗?以前用4.6时遇到过类似问题,当计算包含30多个重金属原子的体系时,如果k点多、cutoff高时会出现你所遇到的情况,-heap也不行,后来也懒得研究就改用了pgi,编译出来的vasp就没再 ...

k点不多。是这样的,我的4.6版本是直接拷过来的程序,就是在集群下编译的。
5.2旋轨耦合版本是我自己编译的。
这是5.2 makefile:
FC=ifort
# fortran linker
FCL=$(FC)


#-----------------------------------------------------------------------
# whereis CPP ?? (I need CPP, can't use gcc with proper options)
# that's the location of gcc for SUSE 5.3
#
#  CPP_   =  /usr/lib/gcc-lib/i486-linux/2.7.2/cpp -P -C
#
# that's probably the right line for some Red Hat distribution:
#
#  CPP_   =  /usr/lib/gcc-lib/i386-redhat-linux/2.7.2.3/cpp -P -C
#
#  SUSE X.X, maybe some Red Hat distributions:

CPP_ =  ./preprocess <$*.F | /usr/bin/cpp -P -C -traditional >$*$(SUFFIX)

#-----------------------------------------------------------------------
# possible options for CPP:
# NGXhalf             charge density   reduced in X direction
# wNGXhalf            gamma point only reduced in X direction
# avoidalloc          avoid ALLOCATE if possible
# PGF90               work around some for some PGF90 / IFC bugs
# CACHE_SIZE          1000 for PII,PIII, 5000 for Athlon, 8000-12000 P4, PD
# RPROMU_DGEMV        use DGEMV instead of DGEMM in RPRO (depends on used BLAS)
# RACCMU_DGEMV        use DGEMV instead of DGEMM in RACC (depends on used BLAS)
#-----------------------------------------------------------------------

CPP     = $(CPP_)  -DHOST=\"LinuxIFC\" \
          -Dkind8 -DCACHE_SIZE=12000 -DPGF90 -Davoidalloc \
#          -DRPROMU_DGEMV  -DRACCMU_DGEMV

#-----------------------------------------------------------------------
# general fortran flags  (there must a trailing blank on this line)
# byterecl is strictly required for ifc, since otherwise
# the WAVECAR file becomes huge
#-----------------------------------------------------------------------

FFLAGS =  -FR -lowercase -assume byterecl -heap-arrays 64 -I/opt/intel/mkl/10.2.1.017/include/fftw

#-----------------------------------------------------------------------
# optimization
# we have tested whether higher optimisation improves performance
# -axK  SSE1 optimization,  but also generate code executable on all mach.
#       xK improves performance somewhat on XP, and a is required in order
#       to run the code on older Athlons as well
# -xW   SSE2 optimization
# -axW  SSE2 optimization,  but also generate code executable on all mach.
# -tpp6 P3 optimization
# -tpp7 P4 optimization
#-----------------------------------------------------------------------

# ifc.9.1, ifc.10.1 recommended
OFLAG=-O3

OFLAG_HIGH = $(OFLAG)
OBJ_HIGH =
OBJ_NOOPT =
DEBUG  = -FR -O0
INLINE = $(OFLAG)

#-----------------------------------------------------------------------
# the following lines specify the position of BLAS  and LAPACK
# VASP works fastest with the libgoto library
# so that's what we recommend
#-----------------------------------------------------------------------

# mkl.10.0
# set -DRPROMU_DGEMV  -DRACCMU_DGEMV in the CPP lines
BLAS=-L/opt/intel/mkl/10.2.1.017/lib/em64t -lmkl_intel_lp64 -lmkl_sequential -lpthread -lmkl_core

# even faster for VASP Kazushige Goto's BLAS
# http://www.cs.utexas.edu/users/kgoto/signup_first.html
# parallel goto version requires sometimes -libverbs
#BLAS=  /opt/libs/libgoto/libgoto.so

# LAPACK, simplest use vasp.5.lib/lapack_double
#LAPACK= ../vasp.5.lib/lapack_double.o

# use the mkl Intel lapack
LAPACK=-L/opt/intel/mkl/10.2.1.017/lib/em64t -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lpthread

#-----------------------------------------------------------------------

#LIB  = -L../vasp.5.lib -ldmy \
     ../vasp.5.lib/linpack_double.o $(LAPACK) \
     $(BLAS)

# options for linking, nothing is required (usually)
LINK    =

#-----------------------------------------------------------------------
# fft libraries:
# VASP.5.2 can use fftw.3.1.X (http://www.fftw.org)
# since this version is faster on P4 machines, we recommend to use it
#-----------------------------------------------------------------------

#FFT3D   = fft3dfurth.o fft3dlib.o

# alternatively: fftw.3.1.X is slighly faster and should be used if available
#FFT3D   = fftw3d.o fft3dlib.o   /opt/libs/fftw-3.1.2/lib/libfftw3.a


#=======================================================================
# MPI section, uncomment the following lines until
#    general  rules and compile lines
# presently we recommend OPENMPI, since it seems to offer better
# performance than lam or mpich
#
# !!! Please do not send me any queries on how to install MPI, I will
# certainly not answer them !!!!
#=======================================================================
#-----------------------------------------------------------------------
# fortran linker for mpi
#-----------------------------------------------------------------------

FC=mpiifort
FCL=$(FC)

#-----------------------------------------------------------------------
# additional options for CPP in parallel version (see also above):
# NGZhalf               charge density   reduced in Z direction
# wNGZhalf              gamma point only reduced in Z direction
# scaLAPACK             use scaLAPACK (usually slower on 100 Mbit Net)
#-----------------------------------------------------------------------

CPP    = $(CPP_) -DMPI  -DHOST=\"LinuxIFC\" -DIFC \
     -Dkind8 -DCACHE_SIZE=4000 -DPGF90 -Davoidalloc \
     -DMPI_BLOCK=8000  -DRPROMU_DGEMV  -DRACCMU_DGEMV

#-----------------------------------------------------------------------
# location of SCALAPACK
# if you do not use SCALAPACK simply leave that section commented out
#-----------------------------------------------------------------------

#BLACS=$(HOME)/archives/SCALAPACK/BLACS/
#SCA_=$(HOME)/archives/SCALAPACK/SCALAPACK

#SCA= $(SCA_)/libscalapack.a  \
# $(BLACS)/LIB/blacsF77init_MPI-LINUX-0.a $(BLACS)/LIB/blacs_MPI-LINUX-0.a $(BLACS)/LIB/blacsF77init_MPI-LINUX-0.a

SCA=-L/opt/intel/mkl/10.2.1.017/lib/em64t -lmkl_scalapack_lp64 -lmkl_blacs_intelmpi_lp64

#-----------------------------------------------------------------------
# libraries for mpi
#-----------------------------------------------------------------------

LIB     = -L../vasp.5.lib -ldmy  \
      ../vasp.5.lib/linpack_double.o $(LAPACK) \
      $(SCA) $(BLAS)

# FFT: fftmpi.o with fft3dlib of Juergen Furthmueller
#FFT3D   = fftmpi.o fftmpi_map.o fft3dfurth.o fft3dlib.o

# alternatively: fftw.3.1.X is slighly faster and should be used if available
FFT3D   = fftmpiw.o fftmpi_map.o fftw3d.o fft3dlib.o  /gpfssan1/apps/fftw32/lib/libfftw3f.a
7楼2011-06-18 13:27:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

tuhaidan

银虫 (小有名气)

引用回帖:
2楼: Originally posted by cavediger at 2011-06-16 06:24:08:
1.查一查下OUTCAR里最后几行的提示,是否进入了主循环计算?
2.-heap-arrays  64 只是解决栈溢出问题,你只有那么点原子,考虑自旋也也不会产生此问题;
3.检查一下你的编译器的版本,INTEL 10.xxx编译器本身有 ...

你好,我现在就是遇见这个问题,我做的单原子测试检验赝势的好坏,按照侯博士手册上面的例子,一个k点,内存够,堆栈也是unlimited,难道会是编译问题吗?
8楼2011-11-01 17:18:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhang668

木虫 (正式写手)

用vasp自带的FFT库
9楼2011-11-02 23:29:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hnuzhoulin

金虫 (小有名气)

不知道怎么搞
留名期待高人
10楼2011-11-03 18:15:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 zhang668 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[找工作] 柔引引进博士硕士。 +20 大发财树 2024-12-18 20/1000 2024-12-23 08:20 by AJN168
[硕博家园] 只想摆烂 +3 s150535912 2024-12-23 3/150 2024-12-23 08:11 by 天崖明月
[考博] 申博的科研计划书怎么写? +6 爱喝风的龙卷茶 2024-12-19 11/550 2024-12-23 07:55 by vincent_hpax
[硕博家园] 柔性引进硕博人才 +7 大发财树 2024-12-20 7/350 2024-12-23 02:32 by upceric
[硕博家园] 寻45-50的博士教授 +9 大发财树 2024-12-22 9/450 2024-12-23 00:24 by 雪径踏青
[考博] 2025申博求助 +7 125814 2024-12-22 7/350 2024-12-22 17:07 by 毕生所学
[有机交流] 装柱干法上样 +4 刘松垚 2024-12-20 4/200 2024-12-22 14:24 by 88817753
[论文投稿] 投稿意见求助,没弄清回答的方向 8+4 moonlig 2024-12-18 4/200 2024-12-22 08:51 by steven_198377
[硕博家园] 博一 +10 幽皮皮皮 2024-12-17 16/800 2024-12-22 07:37 by Ermito
[论文投稿] 投稿期刊 5+4 王丽媛西西西 2024-12-17 7/350 2024-12-22 04:44 by yudaoqian88
[考博] 华南理工大学 “新能源交叉创新团队--主动安全”课题组招收海外联合培养博士生 +4 hubble 2024-12-20 5/250 2024-12-21 16:16 by 那片叶落
[考博] 求老师哦! +4 景小凯 2024-12-20 4/200 2024-12-21 12:09 by ujschem
[有机交流] 工艺需求,付费 +4 想当然灬 2024-12-17 6/300 2024-12-21 06:23 by a893069456
[有机交流] 请问液溴开封后没有密封,放一年会变质吗? +9 rommel1975 2024-12-16 9/450 2024-12-20 11:01 by 2005127239
[教师之家] 某老师在组会上总是针对我带的学生怎么办? +15 lice_1987 2024-12-17 23/1150 2024-12-20 04:50 by 胖胖的大海
[教师之家] 删了哦 (EPI+-1)(金币-50) +5 原因在哪里 2024-12-18 6/300 2024-12-19 12:25 by keikofans
[论文投稿] 论文投稿 +4 @星尘@ 2024-12-17 6/300 2024-12-19 09:39 by YXLSYJK
[有机交流] 核磁氢谱分析 +3 然虫 2024-12-16 4/200 2024-12-18 15:52 by 小肉干
[职场人生] 网络游戏有意义吗 +3 神明.斯派克. 2024-12-16 3/150 2024-12-17 22:13 by zyqchem
[公派出国] 意大利帕多瓦大学招收CSC博士生--光电催化材料在新能源及可持续绿色化学方向 +3 huangyuxing2 2024-12-16 3/150 2024-12-17 18:25 by zhizhan127
信息提示
请填处理意见