24小时热门版块排行榜    

CyRhmU.jpeg
查看: 2754  |  回复: 11
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

txf8378

金虫 (小有名气)

[交流] 【求助】Lammps 多机并行的问题已有7人参与

前段时间用三台四核机组了个小集群跑lammps,三台机子可以实现无密码互登,运行mpdboot -n 3 mpd.hosts 后可以正常启动三台机器,lammps 编译的也是并行版本,运行 mpirun -np 12 lmp_g++ xx.out 可以看到三台机子共12核都在运转,可测试发现三台机子并行的计算速度还不如一台机子的速度快,应该是任务分配有问题,但不知道怎么真确分配任务,大侠抬抬手,困扰小弟多时了,泪崩
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xunbao15

木虫 (正式写手)

★ ★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
ghcacj(金币+3):谢谢 2010-11-13 12:03:36
记住一点,并行计算速度不是跟CPU个数成线性关系,不是CPU越多越好。通常在正式提交任务之前,你要测试出该工况的CPU个数最优值。很明显,由于你这个case的pair计算时间很少(势函数很简单,LJ吧?),而通讯的时间只是跟体系的大小有关,相对而言,你的通讯时间就较大了。如果你换个三体势试试,肯定能看到并行效果。
引用回帖:
Originally posted by txf8378 at 2010-03-25 14:40:38:
Loop time of 365.007 on 4 procs for 500000 steps with 8141 atoms

Pair  time (%) = 212.308 (58.1655)
Neigh time (%) = 18.5539 (5.08316)
Comm  time (%) = 87.2606 (23.9066)
Outpt time (%) = 6.84 ...

7楼2010-11-12 23:58:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 12 个回答

老虎大王

木虫 (著名写手)

★ ★
lei0736(金币+2):谢谢 2010-03-19 20:52
这个可能是通讯方面的问题。你看看运行结果(log文件),有个时间使用的报告。
2楼2010-03-19 20:51:16
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

txf8378

金虫 (小有名气)

可是这个通信问题怎么解决啊,还有就是一定要做NFS吗
3楼2010-03-22 09:33:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

shrek826

金虫 (小有名气)

★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
ghcacj(金币+2):谢谢 2010-03-22 12:21
正如沙发所说的,你最好看看log文件最后的时间报告,再决定下一步怎么做
lammps计算一般来说瓶颈不在内存,而在通信
我们这边有人测试过,用10台单机还不如一台有IB高速模块的8核服务器
4楼2010-03-22 12:06:49
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复(可上传附件)
信息提示
请填处理意见