24小时热门版块排行榜    

查看: 1492  |  回复: 4
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

xk6891

至尊木虫 (著名写手)

[交流] CPMD跨节点测试讨论 已有3人参与

由于计算体系比较大,进行了一次跨节点测试,结果如下:
_________________________________________________________________________________
Package         :CPMD-3.13.2
Atoms           :28
Steps           :100
cpu name        : Intel(R) Xeon(R) CPU           E5620  @ 2.40GHz
cpu MHz                : 1600.000
cache size        : 12288 KB
Task            :Molecular Dynamics(By xk6891 @9.10.2011)
Processors      CPU_total Time      Elapsed_total Time      Peak Memory      CPU_step Time        CPU/Elapsed_total            
(node*pro)            (s)                    (s)                     (Mb)                (s)                    (%)
   1*1(1)           370.50               387.55                256.6             7.6315               95.60
   1*2(2)           171.49               179.12                133.5             3.5349               95.74
   1*3(3)           164.16               170.10                  93.9             3.3532               96.51
   1*4(4)           113.98               118.80                  72.6             2.3430               95.94
   1*5(5)           127.91               132.26                  61.0             2.6110               96.71
   1*6(6)             95.05               100.11                  51.3             1.9683               94.95
   1*7(7)           108.05               112.10                  45.6             2.2114               96.39
   1*8(8)             93.11               100.63                  42.3             1.9781               92.53
   3*4(12)           54.30               206.41                  31.7             4.0891               26.31
   2*8(16)           63.88               272.85                  27.6             5.3826               23.41
   3*8(24)           32.05               281.70                  22.3             5.5381               11.38
_______________________________________________________________________________
这里的CPU time和Elapsed time来自每次计算后的Time中的值,应当分别代表是CPU计算时间和总的消耗时间吧。后面三个的跨节点运算效率极低,这是为什么呢?节点间的通信效率太低,还是脚本写的问题?
回复此楼
人生自古多险阻,勤者自得天酬助。试问否泰何所依,枯藤老枝待新抽。临渊踌躇终迈步,振翅鹏起云霄冲。似是前程甚堪忧,他日振臂揽苍穹。
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gzgzgz

铜虫 (小有名气)

★ ★
小木虫(金币+0.5):给个红包,谢谢回帖
ghcacj(金币+1): 谢谢 2011-09-19 15:05:26
引用回帖:
1楼: Originally posted by xk6891 at 2011-09-12 18:57:02:
由于计算体系比较大,进行了一次跨节点测试,结果如下:
_________________________________________________________________________________
Package         :CPMD-3.13.2
Atoms           :28
Steps     ...

可能2,3节点有其他大通信量的程序在运行,占用带宽。算东西,其实就4个字:自私,独裁。
4楼2011-09-19 14:37:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 5 个回答

ChemiAndy

木虫 (正式写手)


★ ★ ★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖
ghcacj(金币+4): 谢谢 2011-09-16 13:10:51
用了11个核,跨了3个节点?

跨节点主要是通信效率低吧。Wei老师那一台深腾好像节点间通信有问题。不像是千兆网。所以要尽量用一个节点,8个核,我觉得跑100个原子的体系,平均2-3天应该能跑一个皮秒。跑20个皮秒的话,一个月左右。

要更快的话,看能不能用上海的超算中心。至少32个核跑。基本上一个星期能跑一个20皮秒左右的结果出来。时间耗不起啊。
2楼2011-09-16 06:37:59
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xk6891

至尊木虫 (著名写手)

引用回帖:
2楼: Originally posted by ChemiAndy at 2011-09-16 06:37:59:
用了11个核,跨了3个节点?

跨节点主要是通信效率低吧。Wei老师那一台深腾好像节点间通信有问题。不像是千兆网。所以要尽量用一个节点,8个核,我觉得跑100个原子的体系,平均2-3天应该能跑一个皮秒。跑20个皮 ...

3*4(12)   代表3个节点,每个节点上4个核,共用12个核
师兄,确实跨节点效率太低了。不过服务器上也就这么多资源,也需要给别人留些资源。
现在跑的体系小,过一段我测试一个大的,试一试。
人生自古多险阻,勤者自得天酬助。试问否泰何所依,枯藤老枝待新抽。临渊踌躇终迈步,振翅鹏起云霄冲。似是前程甚堪忧,他日振臂揽苍穹。
3楼2011-09-16 10:30:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yoghurt117

木虫 (正式写手)


小木虫: 金币+0.5, 给个红包,谢谢回帖
请教,楼主怎么测试的,我也想在我这测试一下,方便详细说明一下么,看看能不能跨节点并行。谢谢
I am 废Man! 把握住每一刻才是最重要的!
5楼2014-11-04 14:17:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见