24小时热门版块排行榜    

CyRhmU.jpeg
查看: 2118  |  回复: 6

卡开发发

专家顾问 (著名写手)

Ab Initio Amateur

[求助] mpiifort+mkl编译ELK运行问题求助已有1人参与

本人编译ELK,采用的是mpiifort(v11)+mkl(v10.2),编译过程没什么问题。问题在于运行过程,我尝试运行了test-001下面例子,计算得到的能量似乎和程序得到的能量有很大差异,如果不采用mkl而采用内置的lib就没有这个问题,但核心利用效率很低(程序如不考虑mkl_thread会按照k并行,如果采用mkl_thread则可以提升效率)。

另外,vasp采用mkl有时也会出现“正能值”的问题。这两个问题是否同一原因导致?(测试下来SIESTA并没有这样的问题)。

对于这些问题有什么解决方案?产生这些问题的原因是什么?从这个问题看,如果是自己写程序该注意些什么?
回复此楼
不一定挂在论坛,计算问题问题欢迎留言。
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

KalaShayminS

铁杆木虫 (著名写手)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
卡开发发: 金币+30, ★★★★★最佳答案, ELK下zfftifc_fftw.f90和mkl的选项两者似乎不能同时使用,MKL10有时候确实很不稳定。 2014-09-12 13:58:32
不同版本的MKL的参数会发生一定变化,程序并未修改,这导致有的时候有隐蔽的错误发生——或者对于某些体系有错误发生(内存用量达到一定程度的时候)。
如果算出来和样例不对就肯定有问题,可以尝试换默认LAPACK/BLAS, ATLAS, GotoBLAS等等看看结果有无变化。
2楼2014-09-12 03:01:08
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

卡开发发

专家顾问 (著名写手)

Ab Initio Amateur

★ ★ ★ ★ ★
fzx2008: 金币+5, 谢谢补充 2014-09-12 14:40:02
问题已经解决, zfftifc_fftw.f90用mkl编译会出问题,不采用mkl即可。

非k点并行fft_lib用-lfftw3和-lfftw3_threads即可,编译前做如下设置(参照官网以12核心为例):
export OMP_NUM_THREADS=4
export OMP_NESTED=true
export OMP_DYNAMIC=false
export MKL_NUM_THREADS=8
export MKL_DYNAMIC=true
这样即便gamma点也可以并行。
不一定挂在论坛,计算问题问题欢迎留言。
3楼2014-09-12 13:55:02
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

卡开发发

专家顾问 (著名写手)

Ab Initio Amateur

忘说了,计算节点运行的时候也要设置环境
export OMP_NUM_THREADS=4
export OMP_NESTED=true
export OMP_DYNAMIC=false
export MKL_NUM_THREADS=8
export MKL_DYNAMIC=true
不一定挂在论坛,计算问题问题欢迎留言。
4楼2014-09-12 13:57:05
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

锐利的碎片

木虫 (正式写手)

star watcher

mkl编译要用zfftifc…mkl.f90

[ 发自手机版 http://muchong.com/3g ]
5楼2014-09-12 16:28:26
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

卡开发发

专家顾问 (著名写手)

Ab Initio Amateur

引用回帖:
5楼: Originally posted by 锐利的碎片 at 2014-09-12 16:28:26
mkl编译要用zfftifc…mkl.f90

用了,但是这样会报错,如果用的fftw3的话还是要fftw结尾的。
不一定挂在论坛,计算问题问题欢迎留言。
6楼2014-09-12 17:03:49
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

迟晨御龙

金虫 (小有名气)

引用回帖:
3楼: Originally posted by 卡开发发 at 2014-09-12 13:55:02
问题已经解决, zfftifc_fftw.f90用mkl编译会出问题,不采用mkl即可。

非k点并行fft_lib用-lfftw3和-lfftw3_threads即可,编译前做如下设置(参照官网以12核心为例):
export OMP_NUM_THREADS=4
export OMP_N ...

如果14核,应该做怎样的调整?

发自小木虫Android客户端
7楼2018-12-15 06:09:35
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 卡开发发 的主题更新
信息提示
请填处理意见