24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1090  |  回复: 6
【奖励】 本帖被评价3次,作者wuli8增加金币 3
当前主题已经存档。
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

[资源] 【转帖】如何配置MS4.x的Cluster并行计算

如何配置MS4.x的Cluster并行计算  
以2节点配置为例。
1,安装Centos 3.8 或 RHEL4.0 或其他linux
其中nfs rexec, rlogin, rsh 必装,若不清楚的话选择Everything

2, 二节点上都建立 msi 用户如 msi  (名字自己定), 注意两个节点上的msi用户对应的密码,GID要相同,否则无法节点间并行,并一般会提示 permission denied.  两个用户的shell 最好都用 csh

3, 在两个节点上建立文件:/etc/hosts 和 /etc/hosts.equiv 如果已经有这两个文件则修改即可。如下
/etc/hosts:
127.0.0.1 node1 localhost.localdomain localhost (该行对有些软件的并行会出问题,所以可以注释掉或删除)
192.168.0.1   node1   (IP自定义即可)
192.168.0.2   node2
/etc/hosts.equiv:
localhost (该行对有些软件的并行会出问题,所以可以注释掉或删除)
node1
node2

4,node1上建立nfs服务,并发布共享目录:
   (1)编辑或建立文件 /etc/exports 内容如下:
     /home/msi  *(rw, no_root_squash, sync)
   (2)发布共享目录
     运行: exportfs -rv
   (3)编辑或建立文件 /home/msi/.rhosts 内容如下:
    node1
    node2

5, node2节点上修改 /etc/fstab 在最后加入:
  node1:/home/msi /home/msi nfs defaults 0 0
注:以上系统文件操作都在root用户下进行。

6,node1上安装ms4.2, 注:使用msi用户安装,不要用root安装,否则启动ms网关时会提示无法启动进程。 (我们通过nfs同时共享了软件,所以,node2上可不装ms4.2) 到安装盘linux的文件目录下运行: ./install --type cluster
(我的node1就是主节点。软件直接安装在msi用户主目录下
一路下去,在选择 hpmpi是否使用ssh时,选择否,让它默认使用rsh,否则后面配置ssh比较麻烦,对一般用户来说用不着的。同时自动让ms启动网关服务,最后安装程序还有提示如何将ms服务加到系统服务中,使得机子重启后ms可以自动启动. 这个请自行配置。

7,编辑 /home/msi/你的安装目录/share/data/machine.LINUX,输入:
(删除或注释掉原来的 localhost 行。)
node1:2
node2:2   (进行计算机节点设置和每个节点的CPU数设置。“2"指CPU线程数。即单科CPU 4 核的话就设置为4,而不是1)

8,检查node1 和 node2 中的, nfs, rexec, rlogin, rsh 服务是否开启。若未开启则手动使用service命令开启这些服务。如果不知道怎么手动开启。可用下面的方法:
root下运行 setup-》选择 system service --> 看看这四项是否打上星号。没有的话用空格键选上。 -->OK--> 重启机子。(此时重启对于node2也完成了下面第9步挂载nfs目录的操作,所以可以跳过9)

9,在node2 中, root用户下,mount nfs 服务目录:
#mount node1:/home/msi

10, 你现在应该可以往node1 上提交任务,进行cluster并行计算了。若windows下的MS建立网关时识别两个节点的CPU进程总数不对的话,检查一下文件 /home/msi/安装目录/Gateway/root_default/dsd/conf/gw-info.sbd 文件里有一个地方设置CPU总数的,看看是不是不对。

11, 有可能需要启动 lic_server 方法如下:
编辑或修改: node1 上 /home/msi/.cshrc 文件加入下面两行:
source /home/msi/软件安装目录/Licensepack/etc/lp_cshrc
lp_server -s
保存即可

12,对于大于2个节点以上的,其他node3,node4,。。。节点同node2配置即可。

注:如果你现在还分不清楚root和一般用户,则建议先学习linux系统。

http://www.sciencenet.cn/m/user_content.aspx?id=33755
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

fegg7502(金币+1,VIP+0):thank you very much! 9-27 17:12
引用回帖:
Originally posted by Bronco101 at 2009-9-18 15:49:
请问在windows下可以实现并行运算么?

不行吧。
为什么抱着windows不放。
windows下的效率太低。
学学Linux吧
4楼2009-09-18 16:09:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 7 个回答

weiliu6762

铜虫 (小有名气)


如果我能理解lz说的就好了,我的梦想就是自己安装linux版本的MS,现在还在努力学习中!
2楼2009-06-23 13:41:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Bronco101

银虫 (小有名气)


请问在windows下可以实现并行运算么?
3楼2009-09-18 15:49:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ljf7768

木虫 (初入文坛)


★★★★★ 五星级,优秀推荐

大哥呀,这个问题困扰我老长时间了,给我们装机器的公司的小伙子不会弄,就糊弄我们说只能ms只能用一个节点,终于找到正解了,我明天就试试。谢谢啊!有问题我再问你啊,行不?
6楼2009-09-26 21:31:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
☆ 无星级 ★ 一星级 ★★★ 三星级 ★★★★★ 五星级
普通表情 高级回复(可上传附件)
信息提示
请填处理意见