| 查看: 456 | 回复: 7 | |||
| 当前主题已经存档。 | |||
| 【有奖交流】积极回复本帖子,参与交流,就有机会分得作者 glai8818 的 7 个金币 | |||
glai8818木虫 (著名写手)
|
[交流]
【讨论】并行计算与体系的大小
|
||
| 大家好,我在用gromacs做并行计算的时候,5000(大约)个原子以下的体系并行效率很高,四个核都100%运行,而对更大的体系,则效率很差,四个核都只占用70%,最后总的效率还不如单核计算的,而通常到中途计算就中断了。很奇怪啊,既然cpu没有完全占用,那么说明不是cpu的问题,是内存的原因吗?我的内存很大的啊,4G,困惑中...... |
» 猜你喜欢
酰胺脱乙酰基
已经有9人回复
有时候真觉得大城市人没有县城人甚至个体户幸福
已经有3人回复
CSC & MSCA 博洛尼亚大学能源材料课题组博士/博士后招生|MSCA经费充足、排名优
已经有5人回复
有70后还继续奋斗在职场上的吗?
已经有6人回复
博士延得我,科研能力直往上蹿
已经有7人回复
退学或坚持读
已经有27人回复
面上基金申报没有其他的参与者成吗
已经有5人回复
遇见不省心的家人很难过
已经有22人回复

tjpm
金虫 (正式写手)
- 1ST强帖: 1
- 应助: 0 (幼儿园)
- 金币: 1025.7
- 散金: 10
- 红花: 1
- 帖子: 367
- 在线: 19.3小时
- 虫号: 717334
- 注册: 2009-03-07
- 专业: 凝聚态物性 II :电子结构
2楼2009-07-25 21:36:47
glai8818
木虫 (著名写手)
- 应助: 11 (小学生)
- 金币: 4017.1
- 散金: 8024
- 红花: 7
- 帖子: 2579
- 在线: 1427.4小时
- 虫号: 344387
- 注册: 2007-04-13
- 性别: GG
- 专业: 化学动力学

3楼2009-07-25 21:43:26
tjpm
金虫 (正式写手)
- 1ST强帖: 1
- 应助: 0 (幼儿园)
- 金币: 1025.7
- 散金: 10
- 红花: 1
- 帖子: 367
- 在线: 19.3小时
- 虫号: 717334
- 注册: 2009-03-07
- 专业: 凝聚态物性 II :电子结构
4楼2009-07-25 21:53:50
glai8818
木虫 (著名写手)
- 应助: 11 (小学生)
- 金币: 4017.1
- 散金: 8024
- 红花: 7
- 帖子: 2579
- 在线: 1427.4小时
- 虫号: 344387
- 注册: 2007-04-13
- 性别: GG
- 专业: 化学动力学

5楼2009-07-25 22:06:22
glai8818
木虫 (著名写手)
- 应助: 11 (小学生)
- 金币: 4017.1
- 散金: 8024
- 红花: 7
- 帖子: 2579
- 在线: 1427.4小时
- 虫号: 344387
- 注册: 2007-04-13
- 性别: GG
- 专业: 化学动力学
★ ★
zeoliters(金币+2,VIP+0):谢谢分享! 9-5 12:54
zeoliters(金币+2,VIP+0):谢谢分享! 9-5 12:54
|
经过这几天试探,感觉应该是负载(不)平衡引起的, load balancing用掉的时间好像太高, 达30%, 负载平衡这一项高是由什么引起的?与体系的大小有什么联系?很奇怪这时候为什么cpu只运行70%左右?如何解决? 我以前没有试过并行,请问用过并行的朋友,这是以前版本就有,还是4.0版以后才有的,我的单核运行不管是什么版本都没有这一项,是不是3.3并行不会产生这个问题? 并行正常的情况: Average load imbalance: 3.4 % 并行不正常的情况: Average load imbalance: 29.2 % |

6楼2009-07-27 13:05:02
liuyalihd
铜虫 (小有名气)
- 应助: 0 (幼儿园)
- 金币: 117.7
- 散金: 577
- 帖子: 59
- 在线: 8.7小时
- 虫号: 531310
- 注册: 2008-03-23
- 专业: 计算机体系结构
7楼2009-09-05 16:59:19
★ ★
zeoliters(金币+2,VIP+0):谢谢回帖交流! 9-5 12:54
zeoliters(金币+2,VIP+0):谢谢回帖交流! 9-5 12:54
|
关于体系有个需要注意的问题是在做平行化处理的时候,程序对体系是否处理妥当,有可能体系太过于复杂,程序直接处理分给不同核的任务时难以简单分割,例如某些大分子之类,这样的话在各个核之间需要频繁通信来交换数据这样的话用于Load banlance的时间可想而知就多了,同样原子数如果处理小分子流体可能就会好很多。楼上提到的总线问题的却对i7之前的U来说是个问题,但是我觉得这个对于QM级别来说会非常突出,对于MD来说可能还可以,当然一家之言啦。Gromacs同样提供了程序参数来优化分割问题,看看manual吧,grompp方面。 |
8楼2009-09-05 17:26:03













回复此楼