24小时热门版块排行榜    

CyRhmU.jpeg
查看: 2759  |  回复: 11

txf8378

金虫 (小有名气)

[交流] 【求助】Lammps 多机并行的问题已有7人参与

前段时间用三台四核机组了个小集群跑lammps,三台机子可以实现无密码互登,运行mpdboot -n 3 mpd.hosts 后可以正常启动三台机器,lammps 编译的也是并行版本,运行 mpirun -np 12 lmp_g++ xx.out 可以看到三台机子共12核都在运转,可测试发现三台机子并行的计算速度还不如一台机子的速度快,应该是任务分配有问题,但不知道怎么真确分配任务,大侠抬抬手,困扰小弟多时了,泪崩
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
回帖支持 ( 显示支持度最高的前 50 名 )

txf8378

金虫 (小有名气)

Loop time of 365.007 on 4 procs for 500000 steps with 8141 atoms

Pair  time (%) = 212.308 (58.1655)
Neigh time (%) = 18.5539 (5.08316)
Comm  time (%) = 87.2606 (23.9066)
Outpt time (%) = 6.84316 (1.8748)
Other time (%) = 40.0412 (10.97)




Loop time of 471.359 on 8 procs for 500000 steps with 8141 atoms

Pair  time (%) = 107.436 (22.7928)
Neigh time (%) = 10.0425 (2.13055)
Comm  time (%) = 254.736 (54.0427)
Outpt time (%) = 9.67559 (2.0527)
Other time (%) = 89.4697 (18.9812)


Loop time of 626.302 on 12 procs for 500000 steps with 8141 atoms

Pair  time (%) = 73.9194 (11.8025)
Neigh time (%) = 6.12005 (0.977171)
Comm  time (%) = 418.673 (66.8484)
Outpt time (%) = 9.79431 (1.56383)
Other time (%) = 117.795 (18.8081)
5楼2010-03-25 14:40:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通回帖

老虎大王

木虫 (著名写手)

★ ★
lei0736(金币+2):谢谢 2010-03-19 20:52
这个可能是通讯方面的问题。你看看运行结果(log文件),有个时间使用的报告。
2楼2010-03-19 20:51:16
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

txf8378

金虫 (小有名气)

可是这个通信问题怎么解决啊,还有就是一定要做NFS吗
3楼2010-03-22 09:33:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

shrek826

金虫 (小有名气)

★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
ghcacj(金币+2):谢谢 2010-03-22 12:21
正如沙发所说的,你最好看看log文件最后的时间报告,再决定下一步怎么做
lammps计算一般来说瓶颈不在内存,而在通信
我们这边有人测试过,用10台单机还不如一台有IB高速模块的8核服务器
4楼2010-03-22 12:06:49
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hnuzhoulin

金虫 (小有名气)


小木虫(金币+0.5):给个红包,谢谢回帖交流
楼主啊,关于lammps的多级并行,

您有什么文档没?
我老是编译不了,老师出错
6楼2010-11-09 14:50:04
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xunbao15

木虫 (正式写手)

★ ★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
ghcacj(金币+3):谢谢 2010-11-13 12:03:36
记住一点,并行计算速度不是跟CPU个数成线性关系,不是CPU越多越好。通常在正式提交任务之前,你要测试出该工况的CPU个数最优值。很明显,由于你这个case的pair计算时间很少(势函数很简单,LJ吧?),而通讯的时间只是跟体系的大小有关,相对而言,你的通讯时间就较大了。如果你换个三体势试试,肯定能看到并行效果。
引用回帖:
Originally posted by txf8378 at 2010-03-25 14:40:38:
Loop time of 365.007 on 4 procs for 500000 steps with 8141 atoms

Pair  time (%) = 212.308 (58.1655)
Neigh time (%) = 18.5539 (5.08316)
Comm  time (%) = 87.2606 (23.9066)
Outpt time (%) = 6.84 ...

7楼2010-11-12 23:58:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bluewhale

铁杆木虫 (正式写手)


ghcacj(金币+1):谢谢 2010-11-13 12:03:47
你的体系有多大?
8楼2010-11-13 00:03:26
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xiaowu787

木虫 (正式写手)

★ ★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
ghcacj(金币+3):谢谢 2010-11-14 18:13:34
引用回帖:
Originally posted by txf8378 at 2010-03-25 14:40:38:
Loop time of 365.007 on 4 procs for 500000 steps with 8141 atoms

Pair  time (%) = 212.308 (58.1655)
Neigh time (%) = 18.5539 (5.08316)
Comm  time (%) = 87.2606 (23.9066)
Outpt time (%) = 6.84 ...

Comm  time (%) = 87.2606 (23.9066)

Comm  time (%) = 254.736 (54.0427)

Comm  time (%) = 418.673 (66.8484)

这一项就是通信时间(我的理解就是节点,核之间的数据交换),你的这一项线性增加,查查你的交换机。或者跑一个大的体系测试一下,看看结果怎么样?希望对你有帮助
9楼2010-11-14 15:36:28
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xk6891

至尊木虫 (著名写手)

★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
御剑江湖(金币+1): 谢谢 2011-04-13 23:19:24
http://www.mdbbs.org/thread-19233-1-1.html
会不会是分子模拟论坛上的这种情况呢,不理解服务器并行和单机并行的差别
人生自古多险阻,勤者自得天酬助。试问否泰何所依,枯藤老枝待新抽。临渊踌躇终迈步,振翅鹏起云霄冲。似是前程甚堪忧,他日振臂揽苍穹。
10楼2010-12-11 17:48:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 txf8378 的主题更新
普通表情 高级回复(可上传附件)
信息提示
请填处理意见