24小时热门版块排行榜    

查看: 1470  |  回复: 12

yiding08

新虫 (初入文坛)

[求助] MS并行计算求助 已有2人参与

最近一直在研究如何在集群上安装MS,并实现跨节点的并行计算,我们的集群每个节点是8个核,我暂时连接了两个节点,共16个核,提交一个16核任务是没有问题的,但是先提交一个8核的任务,然后再提交一个8核的,第二次提交的不会提交到第二个节点上,而是在第一个节点上,然后top命令显示有16个进程,每个占cpu50%左右,这是什么原因呢?可不可以让后来提交的任务不再占用已经提交任务的资源呢。我是通过windows下的MS往集群上提交的任务。本人新手,还请大家多多指教。
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

rx93hughes

铜虫 (小有名气)

【答案】应助回帖


感谢参与,应助指数 +1
liliangfang: 金币+1, 谢谢交流 2015-02-09 07:49:22
你的cpu是intel还是amd
intel的话去bios关掉超线程(Hyper-Threading),我估计你交16核心的任务node2也没运行,因为HT开了之后8核会虚拟成16核,也可以用pbsnodes命令查看单个节点可用核心数判断。
如果是amd就当我没说吧
2楼2015-02-08 23:34:54
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yiding08

新虫 (初入文坛)

引用回帖:
2楼: Originally posted by rx93hughes at 2015-02-08 23:34:54
你的cpu是intel还是amd
intel的话去bios关掉超线程(Hyper-Threading),我估计你交16核心的任务node2也没运行,因为HT开了之后8核会虚拟成16核,也可以用pbsnodes命令查看单个节点可用核心数判断。
如果是amd就当 ...

多谢回复。
是intel的,提交16核心任务的时候,两个节点上cpu和内存都是有占用的,应该是运行的。没有开超线程。
3楼2015-02-09 09:11:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yiding08

新虫 (初入文坛)

昨晚通过更改machines.LINUX文件里面的内容,把两个节点顺序颠倒过来,再提交一个8核任务,就可以提交到另一个节点了,大家有没有别的办法啊,这种操作也太不智能了。
4楼2015-02-09 09:19:05
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ultrahpc

新虫 (初入文坛)

引用回帖:
4楼: Originally posted by yiding08 at 2015-02-09 09:19:05
昨晚通过更改machines.LINUX文件里面的内容,把两个节点顺序颠倒过来,再提交一个8核任务,就可以提交到另一个节点了,大家有没有别的办法啊,这种操作也太不智能了。

用的什么作业调度软件
5楼2015-02-15 19:11:49
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

njuedu007

禁虫 (著名写手)

★ ★ ★ ★
franch: 金币+2, 谢谢回帖交流。。。。 2015-02-17 16:54:45
yiding08: 金币+2, 有帮助 2015-03-11 20:02:55
本帖内容被屏蔽

6楼2015-02-15 19:34:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yiding08

新虫 (初入文坛)

引用回帖:
5楼: Originally posted by ultrahpc at 2015-02-15 19:11:49
用的什么作业调度软件...

是用自己电脑上安装的MS往集群上提交的
7楼2015-02-16 20:39:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yiding08

新虫 (初入文坛)

引用回帖:
6楼: Originally posted by njuedu007 at 2015-02-15 19:34:41
如果是ms自己调度作业排队,那么关掉超线程(bios),如果是pbs调度作业排队,或者关掉超线程或者设置pbs的超线程不可用就好了

是MS自己调度的,没有开超线程啊,每一个节点就是8个核的。我在管理节点上安装好MS后,在machines.LINUX文件里添加了使用的两个计算节点的名字,然后改了总的核心数为16。这样的操作本身有没有问题呢?
8楼2015-02-16 20:48:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yiding08

新虫 (初入文坛)

这里是楼主。
本人新手,刚接触集群管理,你们说的调度软件的事,我不确定该怎么回答,操作系统安装的是ROCKS 6.0,有一个管理节点,然后有十个计算节点,这些已经都安装好了,里面好像有个叫SGE的管理软件。我是在自己的电脑上和集群的管理节点上都装了MS,用的自己电脑上的MS提交的任务。按照教程安装好MS,添加了一个18888的网关,在machines.LINUX写了两个计算节点的名字,改了总的核心数。差不多就做了这些,有什么地方有问题呢?还请高手指点。
9楼2015-02-16 21:04:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

njuedu007

禁虫 (著名写手)

★ ★
franch: 金币+2, 谢谢回帖交流。。。。 2015-02-17 16:54:53
本帖内容被屏蔽

10楼2015-02-16 21:10:16
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 yiding08 的主题更新
信息提示
请填处理意见