24小时热门版块排行榜    

查看: 702  |  回复: 2

fencal

新虫 (初入文坛)

[求助] MS6.0 Dmol3 CPU效率波动问题

新搭建的集群:
Rocks 6.1 , 12个节点, 每个节点双路12核(E5-2620),24G DDR3 1333内存. Redhat 6.3,每节点连接到同一个infiniband交换机和一个千兆交换机。
安装materials studio 6.0.

问题:

91个原子氨基酸多肽,Dmol3优化,CPU效率平稳,在95%以上,偶尔掉到50%,瞬间恢复。内存使用在18G左右
391个原子蛋白链段,Dmol3优化,CPU效率波动明显且有规律,间隔半分钟左右12个dmol进程掉到0.x%,或者 一半进程掉到0.x%,一会儿又恢复到9x%. 内存占用22G左右。

试过在另外一台老的集群上算同样的model, 该集群没用Rocks, MS版本为5.5,4个节点,每节点8核,16G内存,千兆网络。算同样的model,不管是大的还是小的model,效率平稳在99~100%。

尝试过的解决方法:

换装MS5.5, 没解决;
用一个节点算,依然波动,但波动幅度减小,排除网络通信的原因;
MPI的问题,换了MS5.5, MS5.5用的Hpmpi, MS6.0是intelMPI, 但是问题依旧;

初步认为是内存的问题,
但是老集群上也是每核配2G内存,大model内存占用在15G左右,CPU效率依然稳定。

大家看看是什么原因呢?

ps,图上两边的是算的大model的CPU效率,中间是小model的CPU效率

ganglia监控.jpg
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

害羞的双眼皮

木虫 (著名写手)

科研服务者

捧一下人气
做事要老实,为人要厚道
2楼2013-04-28 21:03:39
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

fencal

新虫 (初入文坛)

谢谢
没人回答吗
3楼2013-04-29 15:06:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 fencal 的主题更新
信息提示
请填处理意见