24小时热门版块排行榜    

查看: 3911  |  回复: 12

nkleof

银虫 (正式写手)

[交流] 【求助】vasp的计算时间含义

优化一个结构,发现每个离子步的计算有两个计算时间数据,一个是cpu time,一个是real time,而且两个数据有时候差别较大。
我的理解是cpu time是vasp100%利用cpu运算的时间,real time是整个作业所耗的时间,包含数据读取写入或者并行节点间的等待时间等等。cpu time和real time的比值表示并行计算效率。
那么从下面的优化时间数据来看,对于同一个体系结构,进行优化的中间各步的计算效率差别会比较大,这是为什么?各步的内存占用应该是差不多的啊,为什么有的效率高,有的效率低?影响计算效率的关键因素是什么呢?
     LOOP+:  cpu time31435.63: real time49241.05
     LOOP+:  cpu time17906.79: real time18247.08
     LOOP+:  cpu time17024.20: real time27126.50
                                  ~~~~~~              ~~~~~~
     LOOP+:  cpu time15354.10: real time18461.83
     LOOP+:  cpu time17565.64: real time19907.05
     LOOP+:  cpu time15009.27: real time15473.92
     LOOP+:  cpu time16362.70: real time27032.38
     LOOP+:  cpu time20439.95: real time24267.30
     LOOP+:  cpu time 7985.91: real time 8122.31
                                  ~~~~~                ~~~~~~
     LOOP+:  cpu time16603.43: real time16930.20
     LOOP+:  cpu time14694.33: real time14986.32
     LOOP+:  cpu time14642.99: real time35428.18
                                 ~~~~~~               ~~~~~~
     LOOP+:  cpu time14783.55: real time15176.58

[ Last edited by mazuju028 on 2010-9-27 at 15:05 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
nkleof(金币+1):谢谢参与
aylayl08(金币-1):禁止无意义回帖获取金币,扣回所得 2010-09-29 15:20:05
2楼2010-09-28 10:19:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dxcharlary

专家顾问 (职业作家)

★ ★
nkleof(金币+1):谢谢参与
aylayl08(金币+1):谢谢指点 2010-09-28 16:42:22
决定每步优化时间的是scf循环的次数,对于不同的结构,scf循环的次数显然是不同的。
3楼2010-09-28 10:44:55
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

nkleof

银虫 (正式写手)


aylayl08(金币+1):感谢发问讨论 2010-09-28 16:42:42
引用回帖:
Originally posted by dxcharlary at 2010-09-28 10:44:55:
决定每步优化时间的是scf循环的次数,对于不同的结构,scf循环的次数显然是不同的。

这个是可以理解的。但是问题是为什么不同的中间结构的优化过程中,vasp利用cpu计算的效率会有很大的差别?有的情况下几乎所有时间vasp都在进行运算,而有的情况下似乎vasp程序没有利用cpu,而是空闲等待,导致real time远大于cpu time,这是如何产生的?
4楼2010-09-28 11:21:10
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dxcharlary

专家顾问 (职业作家)


aylayl08(金币+1):感谢提示 2010-09-29 12:27:02
nkleof(金币+4):谢谢讨论! 2010-09-29 18:55:55
引用回帖:
Originally posted by nkleof at 2010-09-28 11:21:10:

这个是可以理解的。但是问题是为什么不同的中间结构的优化过程中,vasp利用cpu计算的效率会有很大的差别?有的情况下几乎所有时间vasp都在进行运算,而有的情况下似乎vasp程序没有利用cpu,而是空闲等待,导致r ...

注意一下NPAR&LPLANE的参数,我怀疑会出现你说的远大于的情况是因为CPU没有被平均分配的原因。
5楼2010-09-29 11:09:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sunyang1988

至尊木虫 (著名写手)

★ ★
nkleof(金币+1):谢谢参与
aylayl08(金币+1):谢谢讨论 2010-09-29 15:20:30
赞同楼上的说法,并行计算要要给每个cpu分配任务,但它们并不是同时完成的。这样就会出现很多cpu在等最慢的那一个的情况
心之所向无惧无悔
6楼2010-09-29 14:42:44
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

nkleof

银虫 (正式写手)

引用回帖:
Originally posted by dxcharlary at 2010-09-29 11:09:03:


注意一下NPAR&LPLANE的参数,我怀疑会出现你说的远大于的情况是因为CPU没有被平均分配的原因。

请问在节点间通讯很快的情况下,NPAR和LPLANE怎么设置比较好?NPAR=NODE总数,LPLANE=TRUE,这样行么?
7楼2010-09-29 18:57:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dxcharlary

专家顾问 (职业作家)

★ ★
aylayl08(金币+2):感谢讨论 2010-09-29 19:10:14
引用回帖:
Originally posted by nkleof at 2010-09-29 18:57:19:

请问在节点间通讯很快的情况下,NPAR和LPLANE怎么设置比较好?NPAR=NODE总数,LPLANE=TRUE,这样行么?

应该没问题,但是注意你处理的能带数目尽可能的是你node的倍数。
说实话,我以前是用pwscf的,pwscf的并行方式好像和vasp的不太一样,pwscf要求k点的设置是node的倍数,因为pwscf是按K点的个数并行的。所以这个问题我也不是很清楚。不过我确实没遇到过你说的那种远大于的情况,一般real time会大一点,但是不会大太多,我是没遇到过超过10%的情况。也有可能是我一般算的体系都比较小。

[ Last edited by dxcharlary on 2010-9-29 at 19:09 ]
8楼2010-09-29 19:03:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

calos818

木虫 (著名写手)

新人菜鸟


nkleof(金币+1):谢谢参与
引用回帖:
Originally posted by nkleof at 2010-09-29 18:57:19:

请问在节点间通讯很快的情况下,NPAR和LPLANE怎么设置比较好?NPAR=NODE总数,LPLANE=TRUE,这样行么?

您好,如果 一个刀片上8个cpu核心,请问你这里的NPAR该如何设置?
9楼2010-10-05 08:14:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

nkleof

银虫 (正式写手)


zxzj05(金币+1):奖励一下 2010-10-05 17:04:11
引用回帖:
Originally posted by calos818 at 2010-10-05 08:14:32:

您好,如果 一个刀片上8个cpu核心,请问你这里的NPAR该如何设置?

我觉得和你的任务提交脚本里面(比如PBS脚本)的“node= ” 的数目有关吧,“node= ”的数目就是我们认为的一共有多少个并行单元,如果一个刀片8个cpu核心,而“node=8”的话,那么NPAR可以设置1~8,根据能带数,如果能带数多的话,设为NPAR=4~8也许会比较好。
只是我的想法,不一定对。
10楼2010-10-05 09:58:05
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 nkleof 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见