24小时热门版块排行榜    

CyRhmU.jpeg
查看: 2764  |  回复: 11
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

txf8378

金虫 (小有名气)

[交流] 【求助】Lammps 多机并行的问题已有7人参与

前段时间用三台四核机组了个小集群跑lammps,三台机子可以实现无密码互登,运行mpdboot -n 3 mpd.hosts 后可以正常启动三台机器,lammps 编译的也是并行版本,运行 mpirun -np 12 lmp_g++ xx.out 可以看到三台机子共12核都在运转,可测试发现三台机子并行的计算速度还不如一台机子的速度快,应该是任务分配有问题,但不知道怎么真确分配任务,大侠抬抬手,困扰小弟多时了,泪崩
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xiaowu787

木虫 (正式写手)

★ ★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
ghcacj(金币+3):谢谢 2010-11-14 18:13:34
引用回帖:
Originally posted by txf8378 at 2010-03-25 14:40:38:
Loop time of 365.007 on 4 procs for 500000 steps with 8141 atoms

Pair  time (%) = 212.308 (58.1655)
Neigh time (%) = 18.5539 (5.08316)
Comm  time (%) = 87.2606 (23.9066)
Outpt time (%) = 6.84 ...

Comm  time (%) = 87.2606 (23.9066)

Comm  time (%) = 254.736 (54.0427)

Comm  time (%) = 418.673 (66.8484)

这一项就是通信时间(我的理解就是节点,核之间的数据交换),你的这一项线性增加,查查你的交换机。或者跑一个大的体系测试一下,看看结果怎么样?希望对你有帮助
9楼2010-11-14 15:36:28
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 12 个回答

老虎大王

木虫 (著名写手)

★ ★
lei0736(金币+2):谢谢 2010-03-19 20:52
这个可能是通讯方面的问题。你看看运行结果(log文件),有个时间使用的报告。
2楼2010-03-19 20:51:16
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

txf8378

金虫 (小有名气)

可是这个通信问题怎么解决啊,还有就是一定要做NFS吗
3楼2010-03-22 09:33:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

shrek826

金虫 (小有名气)

★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
ghcacj(金币+2):谢谢 2010-03-22 12:21
正如沙发所说的,你最好看看log文件最后的时间报告,再决定下一步怎么做
lammps计算一般来说瓶颈不在内存,而在通信
我们这边有人测试过,用10台单机还不如一台有IB高速模块的8核服务器
4楼2010-03-22 12:06:49
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复(可上传附件)
信息提示
请填处理意见