24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1749  |  回复: 10
当前主题已经存档。

rainbot

银虫 (小有名气)

[交流] [求助]有成功安装MS4.2-linux_cluster的虫友吗

希望分享经验

[ Last edited by rainbot on 2008-5-19 at 08:26 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

imation

铁杆木虫 (正式写手)

我也在装,是软件
你是要组机器吗?

感觉这方面的问题基本没人回答,咱们一起解决问题吧
2楼2008-05-16 15:29:55
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhengjinde

木虫 (正式写手)

我装了几次,都没成功,都是出现一样的问题,作业可以交到主机上,但是不能交到节点上计算,也就是说无法实现并行.如果有人装成功了,不妨把经验传上来,说说安装的linux版本及操作.期待高手解决
3楼2008-05-16 16:58:39
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

rainbot

银虫 (小有名气)

引用回帖:
Originally posted by imation at 2008-5-16 15:29:
我也在装,是软件
你是要组机器吗?

感觉这方面的问题基本没人回答,咱们一起解决问题吧

同感, 是不是因为我这样的问题太弱了, 高手们都不屑呀,呵呵,
4楼2008-05-16 17:13:27
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

rainbot

银虫 (小有名气)

引用回帖:
Originally posted by zhengjinde at 2008-5-16 16:58:
我装了几次,都没成功,都是出现一样的问题,作业可以交到主机上,但是不能交到节点上计算,也就是说无法实现并行.如果有人装成功了,不妨把经验传上来,说说安装的linux版本及操作.期待高手解决

你装的是版上的4.2 吗,

不能并行是不是 license的问题呀.
5楼2008-05-16 17:15:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhengjinde

木虫 (正式写手)

★ ★
lei0736(金币+2,VIP+0):谢谢
应该不是lic问题,因为我交过作业超过八个进程的,照样计算得好好的
强烈建议版主将此问题置顶,解决了这个问题大家的计算效率可以提高很多.还可以省钱,一举两得!

[ Last edited by zhengjinde on 2008-5-16 at 17:36 ]
6楼2008-05-16 17:34:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sandf

木虫 (正式写手)

★ ★ ★ ★ ★ ★
lei0736(金币+6,VIP+0):谢谢
其实这方面的资料很多,我把我配置4.0的给分享一下。4.2应该差不多。
以2节点配置为例。
1,安装Centos 3.8 或 RHEL4.0 或其他linux
其中nfs rexec, rlogin, rsh 必装,若不清楚的话选择Everything

2, 二节点上都建立 msi 用户如 msi  (名字自己定), 注意两个节点上的msi用户对应的密码,GID要相同,否则无法节点间并行,并一般会提示 permission denied.  两个用户的shell 最好都用 csh

3, 在两个节点上建立文件:/etc/hosts 和 /etc/hosts.equiv 如果已经有这两个文件则修改即可。如下
/etc/hosts:
127.0.0.1 node1 localhost.localdomain localhost (该行对有些软件的并行会出问题,所以可以注释掉或删除)
192.168.0.1   node1   (IP自定义即可)
192.168.0.2   node2
/etc/hosts.equiv:
localhost (该行对有些软件的并行会出问题,所以可以注释掉或删除)
node1
node2

4,node1上建立nfs服务,并发布共享目录:
  (1)编辑或建立文件 /etc/exports 内容如下:
     /home/msi  *(rw, no_root_squash, sync)
   (2)发布共享目录
     运行: exportfs -rv
   (3)编辑或建立文件 /home/msi/.rhosts 内容如下:
    node1
      node2

5, node2节点上修改 /etc/fstab 在最后加入:
  node1:/home/msi /home/msi nfs defaults 0 0
注:以上系统文件操作都在root用户下进行

6,node1上安装ms4.2, 注:使用msi用户安装,不要用root安装,否则启动ms网关时会提示无法启动进程。 (我们通过nfs同时共享了软件,所以,node2上可不装ms4.2) 到安装盘linux的文件目录下运行: ./install --type cluster
(我的node1就是主节点。软件直接安装在msi用户主目录下
一路下去,在选择 hpmpi是否使用ssh时,选择否,让它默认使用rsh,否则后面配置ssh比较麻烦,对一般用户来说用不着的。同时自动让ms启动网关服务,最后安装程序还有提示如何将ms服务加到系统服务中,使得机子重启后ms可以自动启动. 这个请自行配置。

7,编辑 /home/msi/你的安装目录/share/data/machine.LINUX,输入:
(删除或注释掉原来的 localhost 行。)
node1:2
node2:2   (进行计算机节点设置和每个节点的CPU数设置。“2"指CPU线程数。即单科CPU 4 核的话就设置为4,而不是1)

8,检查node1 和 node2 中的, nfs, rexec, rlogin, rsh 服务是否开启。若未开启则手动使用service命令开启这些服务。如果不知道怎么手动开启。可用下面的方法:
root下运行 setup-》选择 system service --> 看看这四项是否打上星号。没有的话用空格键选上。 -->OK--> 重启机子。(此时重启对于node2也完成了下面第9步挂载nfs目录的操作,所以可以跳过9)

9,在node2 中, root用户下,mount nfs 服务目录:
#mount node1:/home/msi

10, 你现在应该可以往node1 上提交任务,进行cluster并行计算了。若windows下的MS建立网关时识别两个节点的CPU进程总数不对的话,检查一下文件 /home/msi/安装目录/Gateway/root_default/dsd/conf/gw-info.sbd 文件里有一个地方设置CPU总数的,看看是不是不对。

11, 有可能需要启动 lic_server 方法如下:
编辑或修改: node1 上 /home/msi/.cshrc 文件加入下面两行:
source /home/msi/软件安装目录/Licensepack/etc/lp_cshrc
lp_server -s
保存即可

12,对于大于2个节点以上的,其他node3,node4,。。。节点同node2配置即可。

注:如果你现在还分不清楚root和一般用户,则建议先学习linux系统。

[ Last edited by sandf on 2008-5-16 at 21:44 ]
努力呀努力,不要成为奴隶。
7楼2008-05-16 19:19:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhengjinde

木虫 (正式写手)

楼上的高手,我有一个疑问,不是说只要主机上安装msi,节占是不要安装的吗?
你上头的说明文件中好像都是将ms软件安装在node1上?楼让的意思是不是说要在节点上安装ms软件?
我安装过一次,用最新版本的RHELS5的,发现其共享目录是/home/install

[ Last edited by zhengjinde on 2008-5-16 at 20:10 ]
8楼2008-05-16 20:07:10
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sandf

木虫 (正式写手)

★ ★
lei0736(金币+2,VIP+0):谢谢
引用回帖:
Originally posted by zhengjinde at 2008-5-16 20:07:
楼上的高手,我有一个疑问,不是说只要主机上安装msi,节占是不要安装的吗?
你上头的说明文件中好像都是将ms软件安装在node1上?楼让的意思是不是说要在节点上安装ms软件?
我安装过一次,用最新版本的RHELS5的,发现其 ...

上面没说清楚,我的node1就是主节点。软件直接安装在msi用户目录下,然后通过nfs共享整个用户目录/home/msi 达到软件和数据节点间共享的目的。虽然这在安全性上是不太好的,但对于我们只是做做计算的来说完全没问题的,没必要因为安全性的问题把共享搞得太复杂。
所以你说的 /home/install 我不是很确定是什么东西。
努力呀努力,不要成为奴隶。
9楼2008-05-16 21:25:30
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

rainbot

银虫 (小有名气)

谢谢 8楼, sandf同学的详细讲解, 多多指教
10楼2008-05-19 08:30:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 rainbot 的主题更新
普通表情 高级回复(可上传附件)
信息提示
请填处理意见