24小时热门版块排行榜    

查看: 1509  |  回复: 11
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

cqb3172

铁虫 (初入文坛)

[交流] 【求助】vasp的编译及运行效率问题 已有7人参与

新配的cpu为xeon E5620的服务器
双cpu,每个cpu4核可以8个线程。

软件环境:全为最新版的免费非商业intel fortran编译器和mkl,并行使用openmpi 1.43

现在的问题是,我编译后,单机并行测试同一批作业

采用mpirun -np 8, 某个作业计算时间为7分多钟
但采用mpirun -np 16的话,其计算时间竟然为14分钟。
目前正在测试mpirun -np 4的计算所需时间

问题:
mpirun时,对于每一台server,np的最大值到底为哪个?
cpu数量*core的数量?也就是8
cpu数量*线程数量?也就是16

另外machinefile里面应该写slots=多少?

还有就是根据以上情况,是否也有可能是我编译或者设置哪里有问题?
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wyxhenu

新虫 (小有名气)


小木虫(金币+0.5):给个红包,谢谢回帖交流
引用回帖:
Originally posted by cqb3172 at 2011-03-01 13:13:23:
新配的cpu为xeon E5620的服务器
双cpu,每个cpu4核可以8个线程。

软件环境:全为最新版的免费非商业intel fortran编译器和mkl,并行使用openmpi 1.43

现在的问题是,我编译后,单机并行测试同一批作业

...

我编译VASP也是遇到了同样的问题,曙光的机器。
目前在千兆网络下似乎不太可能并行效率很高,除非采用万兆。

同一个节点上的并行效率可以材料share memory 解决,这样效率会高点。
8楼2011-03-01 17:35:57
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wyxhenu

新虫 (小有名气)


小木虫(金币+0.5):给个红包,谢谢回帖交流
引用回帖:
Originally posted by wyxhenu at 2011-03-01 17:35:57:
我编译VASP也是遇到了同样的问题,曙光的机器。
目前在千兆网络下似乎不太可能并行效率很高,除非采用万兆。

同一个节点上的并行效率可以材料share memory 解决,这样效率会高点。

在编译并行的f90的时候  加上的这个参数

当时是曙光的工程师作的
10楼2011-03-02 11:21:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 cqb3172 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见