24小时热门版块排行榜    

CyRhmU.jpeg
查看: 3999  |  回复: 17

lbh_xt

新虫 (小有名气)

[求助] LAMMPS并行计算的问题(cpu——time关系)

刚买了个服务器,6核4线程的,安装好并行版lammps后运行如下:
mpirun -np 1 ./lmp mpirun -np 2 ./lmp mpirun -np 3 ./lmp ...
我们进行了测试了time  —— cpu的数目关系,如上传图片


(1)怎么发现24个cpu全用上,计算所用的时间和2个cpu 的一样,这是什么原因啊。
(2)随着cpu从1到24变化,时间time会出现波动,一会大一会小的。测试结果是随机的还是差不多都一样呢?请问正常的情况应该是什么样子呢?
(3)有朋友说是因为体系大小的原因,请问一下用过lammps并行版的牛人们,你们是怎么测试和分配的呢?
(4)有没有好的软件专门进行并行测试的?(我感觉是不是因为计算机并行没有装好)

cpu-time.jpg
回复此楼
安静
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

043114076

木虫 (正式写手)

【答案】应助回帖

★ ★ ★ ★
感谢参与,应助指数 +1
jiaoyixiong: 金币+2, 鼓励交流 2012-11-20 09:53:31
lbh_xt: 金币+2, ★★★很有帮助, 谢谢高手指点哈 2012-11-21 13:49:03
对于科学计算来说多线程用不着,要关闭掉。
另外你的时间单位是什么?
2楼2012-11-20 08:55:31
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lbh_xt

新虫 (小有名气)

引用回帖:
2楼: Originally posted by 043114076 at 2012-11-20 08:55:31
对于科学计算来说多线程用不着,要关闭掉。
另外你的时间单位是什么?

单位是秒,我只是写了个小程序用并行版的测试一下。

我不是很懂这些,请问多线程不是也有那么多cpu吗,我的同学的服务器也是这个样子的,如果不用多线程的话,那么就只能有六个核算了嘛?
安静
3楼2012-11-20 09:41:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

jiaoyixiong

荣誉版主 (职业作家)

【答案】应助回帖

★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
chaizhm: 金币+3, 谢谢~ 2012-11-20 22:00:26
lbh_xt: 金币+3, ★★★很有帮助, 谢谢高手指点 2012-11-21 13:46:56
写个小程序就想比较计算速度,有点儿不太合适吧。
如果你一个体系很小的体系,用太多的CPU,反而浪费很多时间在信息的传递上,
并行计算的优势是大体系分块算。
我也坐过类似的测试:
4楼2012-11-20 09:57:56
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

043114076

木虫 (正式写手)

【答案】应助回帖

★ ★ ★ ★
chaizhm: 金币+2, 谢谢~ 2012-11-20 22:00:34
lbh_xt: 金币+2, ★★★很有帮助, 谢谢高手指点 2012-11-21 13:46:42
引用回帖:
3楼: Originally posted by lbh_xt at 2012-11-20 09:41:19
单位是秒,我只是写了个小程序用并行版的测试一下。

我不是很懂这些,请问多线程不是也有那么多cpu吗,我的同学的服务器也是这个样子的,如果不用多线程的话,那么就只能有六个核算了嘛?...

参考这个回帖
http://muchong.com/bbs/viewthread.php?tid=2309639&page=1#pid1464069
你的测试样本确实太小了。
5楼2012-11-20 14:24:39
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

风间的记忆

铁杆木虫 (著名写手)

【答案】应助回帖

★ ★ ★
感谢参与,应助指数 +1
chaizhm: 金币+1, 谢谢~ 2012-11-20 22:00:42
lbh_xt: 金币+2, ★★★很有帮助, 谢谢高手指点 2012-11-21 13:46:23
如上所言
的确和测试样本大小有关
而且超线程必须关掉
九州浩淼,任其东西,明日何在,但随我意。
6楼2012-11-20 15:31:56
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lbh_xt

新虫 (小有名气)

引用回帖:
4楼: Originally posted by jiaoyixiong at 2012-11-20 09:57:56
写个小程序就想比较计算速度,有点儿不太合适吧。
如果你一个体系很小的体系,用太多的CPU,反而浪费很多时间在信息的传递上,
并行计算的优势是大体系分块算。
我也坐过类似的测试:4b/86/1108016_1353376719_4 ...

我算了下例子中的原子数差不多有5120个,请问我该用多大的体系去评估他的效率呢?
安静
7楼2012-11-21 13:41:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lbh_xt

新虫 (小有名气)

引用回帖:
6楼: Originally posted by 风间的记忆 at 2012-11-20 15:31:56
如上所言
的确和测试样本大小有关
而且超线程必须关掉

请问怎么关掉多余的超线程啊,如果这样的话,那多线程岂不是多余了?
安静
8楼2012-11-21 13:47:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

风间的记忆

铁杆木虫 (著名写手)

★ ★
zh1987hs: 金币+2, 谢谢 2012-11-23 12:53:17
引用回帖:
8楼: Originally posted by lbh_xt at 2012-11-21 13:47:50
请问怎么关掉多余的超线程啊,如果这样的话,那多线程岂不是多余了?...

超线程在BIOS里关
超线程对于CPU利用低的程序是适合的
但科学计算一般CPU都要用满的
所以不适合

» 本帖已获得的红花(最新10朵)

九州浩淼,任其东西,明日何在,但随我意。
9楼2012-11-21 14:03:37
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

jiaoyixiong

荣誉版主 (职业作家)

★ ★
zh1987hs: 金币+2, 谢谢 2012-11-23 12:53:23
引用回帖:
7楼: Originally posted by lbh_xt at 2012-11-21 13:41:24
我算了下例子中的原子数差不多有5120个,请问我该用多大的体系去评估他的效率呢?...

我测试的模拟体系大约有20万个原子,你的模拟体系太小了
10楼2012-11-21 14:10:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 lbh_xt 的主题更新
信息提示
请填处理意见