24小时热门版块排行榜    

查看: 706  |  回复: 2
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

fencal

新虫 (初入文坛)

[求助] MS6.0 Dmol3 CPU效率波动问题

新搭建的集群:
Rocks 6.1 , 12个节点, 每个节点双路12核(E5-2620),24G DDR3 1333内存. Redhat 6.3,每节点连接到同一个infiniband交换机和一个千兆交换机。
安装materials studio 6.0.

问题:

91个原子氨基酸多肽,Dmol3优化,CPU效率平稳,在95%以上,偶尔掉到50%,瞬间恢复。内存使用在18G左右
391个原子蛋白链段,Dmol3优化,CPU效率波动明显且有规律,间隔半分钟左右12个dmol进程掉到0.x%,或者 一半进程掉到0.x%,一会儿又恢复到9x%. 内存占用22G左右。

试过在另外一台老的集群上算同样的model, 该集群没用Rocks, MS版本为5.5,4个节点,每节点8核,16G内存,千兆网络。算同样的model,不管是大的还是小的model,效率平稳在99~100%。

尝试过的解决方法:

换装MS5.5, 没解决;
用一个节点算,依然波动,但波动幅度减小,排除网络通信的原因;
MPI的问题,换了MS5.5, MS5.5用的Hpmpi, MS6.0是intelMPI, 但是问题依旧;

初步认为是内存的问题,
但是老集群上也是每核配2G内存,大model内存占用在15G左右,CPU效率依然稳定。

大家看看是什么原因呢?

ps,图上两边的是算的大model的CPU效率,中间是小model的CPU效率

ganglia监控.jpg
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

fencal

新虫 (初入文坛)

谢谢
没人回答吗
3楼2013-04-29 15:06:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 3 个回答
信息提示
请填处理意见