24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1322  |  回复: 4

rdw00

木虫 (著名写手)

[求助] 关于 MS 5.5并行的问题

先描述下我现在的状态:
在machine文件写下host列表之后,我能够在服务器上命令行模式提交多节点并行,在windows下不能实现多节点并行。还存在一个问题就是,我在linux上使用排队模式提交的话,计算任务并不在排队系统分配的节点上运行,而是在machine文件中最开始的几个节点上并行。
现在想解决两个问题:
1. windows下提交任务实现多节点并行
2. 排队模式下实现多节点,排队分配的节点就要是计算节点。
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

huangzc

金虫 (正式写手)

我也遇到了这样的问题,请教高手!
2楼2012-04-06 08:33:35
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

huweny87

木虫 (小有名气)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
rdw00: 金币+10, 有帮助 2012-04-06 11:25:20
fzx2008: 金币+2, 谢谢指教 2012-04-06 11:25:25
rdw00: 金币+10, ★★★★★最佳答案, 四楼的看了,很好。谢谢 2012-04-10 13:26:26
可能是没有修改MS服务器网关的cpu总数目以及采用的排队系统,最简单的做法,浏览器打开http://host-ip:18888, 在网关上选择"gateway data",然后左下角点击edit后编辑,如果遇到需要登录则使用gatekeeper用户名,默认密码可以翻一下安装手册. 结束以后win下客户端要在server console里刷新一下服务器信息
少年心事当拏雲,谁念幽寒坐呜呃?
3楼2012-04-06 09:26:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

rdw00

木虫 (著名写手)

引用回帖:
3楼: Originally posted by huweny87 at 2012-04-06 09:26:33:
可能是没有修改MS服务器网关的cpu总数目以及采用的排队系统,最简单的做法,浏览器打开http://host-ip:18888, 在网关上选择"gateway data",然后左下角点击edit后编辑,如果遇到需要登录则使用gatekeep ...

gatekeeper的默认密码是什么?我还真找不到了。另外,我的机群能够使用排队模式,在windows下可以正常使用,cpu数目也是200,就是不能多节点并行。在linux下,就不能使用了,怪……期望解答,谢谢
4楼2012-04-06 11:24:02
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

huweny87

木虫 (小有名气)

★ ★ ★ ★ ★
fzx2008: 金币+5, 谢谢详文分析~ 2012-04-08 10:56:00
引用回帖:
4楼: Originally posted by rdw00 at 2012-04-06 11:24:02:
gatekeeper的默认密码是什么?我还真找不到了。另外,我的机群能够使用排队模式,在windows下可以正常使用,cpu数目也是200,就是不能多节点并行。在linux下,就不能使用了,怪……期望解答,谢谢

根据我先前的尝试,所谓linux下提交到排队模式下似乎不需要qsub .....这样的命令,MS自己有类似RunDMol3.sh的程序,可以将并行任务提交到排队系统以及MS网关,我提交之后可以同时在网关和队列查询到此任务。
但是我的任务根本没有跑起来,不知道是否与我的网关被我加密了有关,我也没花时间去琢磨。
你说的windows下不能跨节点情况还有一个可能性就是排队系统配置不合适,例如sge(Sun Grid Engine)就有一种资源分配方式,是以"$pe_slots"标示的,就是所有进程必须被提交到同一个节点上,以应对有些不能跨节点并行的程序。
我是通过在网关上查询通过windows提交的任务的sge.sh文件,知道其使用了我排队系统中一个叫"make"的并行环境,我就通过修改make的"allocation rule"来更换资源分配方式。
区别是否是排队系统配置问题的方法很简单,提交任务以后,如果直接报错,那就是ms的问题,如果一直排队直到被分配资源那可能就是排队系统的配置了。
如果不是排队系统的配置问题,那我也不大清楚可能是哪里出了问题,或许你应该看看是否安装ms时使用了cluster选项。
As the gatekeeper user, by default, has no password, this gives a potentially large number of users access to a wide range of ways in which to modify gateway behavior and data.
少年心事当拏雲,谁念幽寒坐呜呃?
5楼2012-04-08 08:46:46
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 rdw00 的主题更新
信息提示
请填处理意见