24小时热门版块排行榜    

查看: 1498  |  回复: 11

cqb3172

铁虫 (初入文坛)

[交流] 【求助】vasp的编译及运行效率问题 已有7人参与

新配的cpu为xeon E5620的服务器
双cpu,每个cpu4核可以8个线程。

软件环境:全为最新版的免费非商业intel fortran编译器和mkl,并行使用openmpi 1.43

现在的问题是,我编译后,单机并行测试同一批作业

采用mpirun -np 8, 某个作业计算时间为7分多钟
但采用mpirun -np 16的话,其计算时间竟然为14分钟。
目前正在测试mpirun -np 4的计算所需时间

问题:
mpirun时,对于每一台server,np的最大值到底为哪个?
cpu数量*core的数量?也就是8
cpu数量*线程数量?也就是16

另外machinefile里面应该写slots=多少?

还有就是根据以上情况,是否也有可能是我编译或者设置哪里有问题?
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zzy870720z

荣誉版主 (文坛精英)

优秀版主优秀版主优秀版主优秀版主

★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
bingmou(金币+1): 感谢回答 2011-03-01 14:55:18
建议关闭超线程,应该是超线程技术做的怪,开机BIOS里修改关闭超线程
博学、审问、慎思、明辨、笃学
2楼2011-03-01 14:10:01
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cqb3172

铁虫 (初入文坛)

多谢建议!我会设置看看

另外mpirun -np 4的结果也已经出来,时间竟然仅为5分钟

火大了,头晕了,豁出去了,立马开始mpirun -np 1和mpirun -np 2测试
3楼2011-03-01 14:28:54
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

锐利的碎片

木虫 (正式写手)

star watcher

★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
bingmou(金币+1): 感谢交流 2011-03-01 14:55:36
环境变量加上
export OMP_NUM_THREADS=1
4楼2011-03-01 14:42:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cqb3172

铁虫 (初入文坛)

引用回帖:
Originally posted by 锐利的碎片 at 2011-03-01 14:42:53:
环境变量加上
export OMP_NUM_THREADS=1

这个加了
5楼2011-03-01 14:55:16
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lzl8181

铁杆木虫 (著名写手)

单身浏览汉


小木虫(金币+0.5):给个红包,谢谢回帖交流
楼主,我下载的非商业intel fortran编译器在安装过程中需要上网得到安装密码,但取得密码后却提示密码不正确,这是咋回事儿?你遇到过吗?
版权乜有,盗用不究!
6楼2011-03-01 14:56:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cqb3172

铁虫 (初入文坛)

★ ★
zzy870720z(金币+2): 谢谢提供方法 2011-03-01 15:53:57
引用回帖:
Originally posted by lzl8181 at 2011-03-01 14:56:00:
楼主,我下载的非商业intel fortran编译器在安装过程中需要上网得到安装密码,但取得密码后却提示密码不正确,这是咋回事儿?你遇到过吗?

没碰到你这情况

流程:
1,你填写邮箱下载时,会给你个序列号,同时会email给你一个license文件。
2,安装时,激活有两个办法:
a,用序列号在它提示的网站得到解锁码;
b,直接把license文件的完整路径填上去。
7楼2011-03-01 15:20:43
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wyxhenu

新虫 (小有名气)


小木虫(金币+0.5):给个红包,谢谢回帖交流
引用回帖:
Originally posted by cqb3172 at 2011-03-01 13:13:23:
新配的cpu为xeon E5620的服务器
双cpu,每个cpu4核可以8个线程。

软件环境:全为最新版的免费非商业intel fortran编译器和mkl,并行使用openmpi 1.43

现在的问题是,我编译后,单机并行测试同一批作业

...

我编译VASP也是遇到了同样的问题,曙光的机器。
目前在千兆网络下似乎不太可能并行效率很高,除非采用万兆。

同一个节点上的并行效率可以材料share memory 解决,这样效率会高点。
8楼2011-03-01 17:35:57
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cqb3172

铁虫 (初入文坛)

引用回帖:
Originally posted by wyxhenu at 2011-03-01 17:35:57:
我编译VASP也是遇到了同样的问题,曙光的机器。
目前在千兆网络下似乎不太可能并行效率很高,除非采用万兆。

同一个节点上的并行效率可以材料share memory 解决,这样效率会高点。

你好,请问能否详细说明下”share memory“呢?将非常感谢……
9楼2011-03-01 18:00:31
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wyxhenu

新虫 (小有名气)


小木虫(金币+0.5):给个红包,谢谢回帖交流
引用回帖:
Originally posted by wyxhenu at 2011-03-01 17:35:57:
我编译VASP也是遇到了同样的问题,曙光的机器。
目前在千兆网络下似乎不太可能并行效率很高,除非采用万兆。

同一个节点上的并行效率可以材料share memory 解决,这样效率会高点。

在编译并行的f90的时候  加上的这个参数

当时是曙光的工程师作的
10楼2011-03-02 11:21:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 cqb3172 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见