24小时热门版块排行榜    

查看: 376  |  回复: 0

xmc212

木虫 (正式写手)

[求助] 为什么我编译的vasp单核运行的时候占据3-4个核

为什么我编译的vasp单核运行的时候占据3-4个核,速度是却一个核的速度?谢谢!

至强4核双路CPU。若8核心并行时,出现8个vasp,每个占据1个核,总速度慢到原来的数分之一。
ifort11.1
mkl10.2.5.035

makefile如下:
.SUFFIXES: .inc .f .f90 .F

SUFFIX=.f90

CPP_ =  ./preprocess <$*.F | /usr/bin/cpp -P -C -traditional >$*$(SUFFIX)

CPP_=fpp -f_com=no -free -w0 $*.F $*$(SUFFIX)

FFLAGS =  -FR -names lowercase -assume byterecl

OFLAG=-O2  

OFLAG_HIGH = $(OFLAG)
OBJ_HIGH =
OBJ_NOOPT =
DEBUG  = -FR -O0
INLINE = $(OFLAG)

MKL_PATH=/opt/intel/mkl/10.2.5.035/lib/em64t

MKL_FFTW_PATH=/opt/intel/mkl/10.2.5.035/interfaces/fftw3xf

BLAS= -Wl,--start-group $(MKL_PATH)/libmkl_intel_lp64.a $(MKL_PATH)/libmkl_intel_thread.a $(MKL_PATH)/libmkl_core.a -Wl,--end-group -lguide ${MKL_PATH}/libiomp5.a

LAPACK= $(MKL_PATH)/libmkl_intel_lp64.a

LINK =

FC=/home/user/bin/openmpi1.4.2/bin/mpif90
FCL=$(FC)


CPP    = $(CPP_) -DMPI  -DHOST=\"LinuxIFC\" -DIFC \
     -DCACHE_SIZE=4000 -DPGF90 -Davoidalloc -DNGZhalf \
     -DMPI_BLOCK=8000 -Duse_collective -DscaLAPACK

BLACS=${MKL_PATH}/libmkl_blacs_openmpi_lp64.a
SCA=${MKL_PATH}/libmkl_scalapack_lp64.a $(BLACS)

LIB     = -L../vasp.5.lib -ldmy  \
      ../vasp.5.lib/linpack_double.o \
      $(SCA) $(LAPACK) $(BLAS)

FFT3D   = fftmpiw.o fftmpi_map.o  fftw3d.o  fft3dlib.o   $(MKL_FFTW_PATH)/libfftw3xf_intel.a
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

智能机器人

Robot (super robot)

我们都爱小木虫

找到一些相关的精华帖子,希望有用哦~

科研从小木虫开始,人人为我,我为人人
相关版块跳转 我要订阅楼主 xmc212 的主题更新
信息提示
请填处理意见