24小时热门版块排行榜    

查看: 487  |  回复: 5
当前主题已经存档。
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

raul0716

[交流] 【求助】cluster 安装MS4.2后,其他节点之间不能并行

linux集群上面安装MS4.2后,
使用Discover模块计算,
不管选择多少CPU,只能在第一个节点上面进行并行计算。
其他节点上面CPU利用率一直是0.

不知道是什么原因,
希望高手能帮忙!

下面是我计算完了的.out文件。

-------------------------------------------------------------
ERROR: ld.so: object 'libmpi_cpu.so' from LD_PRELOAD cannot be preloaded: ignored.
ERROR: ld.so: object 'libmpi_cpu.so' from LD_PRELOAD cannot be preloaded: ignored.
ERROR: ld.so: object 'libmpi
---------------------------------------------------------------
Checked out license feature: MS_discover [for Unavailable] (2 copies)
---------------------------------------------------------------

randomSeed is set to 844934

Line   7:BTCL> autoEcho off

INPUT FILES
___________

File Type                Name
---------                ----

Forcefield                /home/wit/Accelrys/MaterialsStudio42/Discover/../Data/Discover/res/pcff.frc
Molecular data                heptane.mdf
Coordinate                heptane.car


MOLECULAR TOPOLOGY
__________________

Number of molecules:                     1
Number of residues:                     1
Number of atoms:                    23
Number of atom types:                     5
Number of bonds:                    22
Number of consolidated angles:            42
Number of consolidated torsions:    54
Number of bond_bond_1_3s:            54
Number of angle-angles:                    84

FORCEFIELD OPTIONS
__________________

Filename                  : pcff.frc
Definition name                  : cff91
Version                          : 3.1
Last modification date          : 4/1/96
# of automatic parameters : 0

NONBOND ENERGY CUTOFFS
______________________

                Cutoff (A)        Spline Width (A)        Buffer Width (A)

vdW                  9.50                     1.00                     0.50
Coulomb                  9.50                     1.00                     0.50

Summation method for vdW        : Group based
Summation method for Coulomb        : Group based
Dielectric                        : 1.00

MOLECULAR DYNAMICS
__________________

Ensemble           :       NVT

Temperature        :    298.00 K
Control Method     :   Nose, Q =     52567.20 kcal/mol*fs^2

Timestep           :      1.00 fs
Duration           :1000000.00 fs
Integration Method : Velocity Verlet

Initial Velocities :   Random Velocities from Boltzmann distribution
Initial Temp.      :    298.00 K


Dynamics Summary
________________

                            Initial        Final      Average    Std. Dev.
                            -------        -----      -------    ---------  

Tot. energy (kcal/mol)       18.839       25.570       23.242        4.776
Pot. energy (kcal/mol)        0.194        7.164        6.432        3.383
Kin. energy (kcal/mol)       18.645       18.406       16.810        3.123
Temperature (K)             298.000      294.176      268.669       49.918

Time used by 1000000 steps is 0 hours 6 mins 58.40 secs (0.000 secs per step)


Total time used by DISCOVER: 6 mins 59.83 secs (419.83 secs)

Completion date: Fri Nov 28 12:10:22 2008
Exiting Discover: status OK.
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhengjinde

木虫 (正式写手)

印像中discover是不能并行了,你用其它模块试下,就可以确定是不是没安装好
4楼2008-12-03 09:30:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 6 个回答

raul0716

★ ★ ★ ★
zdhlover(金币+4,VIP+0):非常感谢,写的很详细,欢迎常来
这是我安装MS4.2的步骤!


以2节点配置为例。
1,安装Centos 3.8 或 RHEL4.0 或其他linux
其中nfs rexec, rlogin, rsh 必装,若不清楚的话选择Everything

2, 二节点上都建立 msi 用户如 msi  (名字自己定), 注意两个节点上的msi用户对应的密码,GID要相同,否则无法节点间并行,并一般会提示 permission denied.  两个用户的shell 最好都用 csh

3, 在两个节点上建立文件:/etc/hosts 和 /etc/hosts.equiv 如果已经有这两个文件则修改即可。如下
/etc/hosts:
127.0.0.1 node1 localhost.localdomain localhost (该行对有些软件的并行会出问题,所以可以注释掉或删除)
192.168.0.1   node1   (IP自定义即可)
192.168.0.2   node2
/etc/hosts.equiv:
localhost (该行对有些软件的并行会出问题,所以可以注释掉或删除)
node1
node2

4,node1上建立nfs服务,并发布共享目录:
  (1)编辑或建立文件 /etc/exports 内容如下:
     /home/msi  *(rw, no_root_squash, sync)
   (2)发布共享目录
     运行: exportfs -rv
   (3)编辑或建立文件 /home/msi/.rhosts 内容如下:
    node1
      node2

5, node2节点上修改 /etc/fstab 在最后加入:
  node1:/home/msi /home/msi nfs defaults 0 0
注:以上系统文件操作都在root用户下进行。

6,node1上安装ms4.2, 注:使用msi用户安装,不要用root安装,否则启动ms网关时会提示无法启动进程。 (我们通过nfs同时共享了软件,所以,node2上可不装ms4.2) 到安装盘linux的文件目录下运行: ./install --type cluster
(我的node1就是主节点。软件直接安装在msi用户主目录下
一路下去,在选择 hpmpi是否使用ssh时,选择否,让它默认使用rsh,否则后面配置ssh比较麻烦,对一般用户来说用不着的。同时自动让ms启动网关服务,最后安装程序还有提示如何将ms服务加到系统服务中,使得机子重启后ms可以自动启动. 这个请自行配置。

7,编辑 /home/msi/你的安装目录/share/data/machine.LINUX,输入:
(删除或注释掉原来的 localhost 行。)
node1:2
node2:2   (进行计算机节点设置和每个节点的CPU数设置。“2"指CPU线程数。即单科CPU 4 核的话就设置为4,而不是1)

8,检查node1 和 node2 中的, nfs, rexec, rlogin, rsh 服务是否开启。若未开启则手动使用service命令开启这些服务。如果不知道怎么手动开启。可用下面的方法:
root下运行 setup-》选择 system service --> 看看这四项是否打上星号。没有的话用空格键选上。 -->OK--> 重启机子。(此时重启对于node2也完成了下面第9步挂载nfs目录的操作,所以可以跳过9)

9,在node2 中, root用户下,mount nfs 服务目录:
#mount node1:/home/msi

10, 你现在应该可以往node1 上提交任务,进行cluster并行计算了。若windows下的MS建立网关时识别两个节点的CPU进程总数不对的话,检查一下文件 /home/msi/安装目录/Gateway/root_default/dsd/conf/gw-info.sbd 文件里有一个地方设置CPU总数的,看看是不是不对。

11, 有可能需要启动 lic_server 方法如下:
编辑或修改: node1 上 /home/msi/.cshrc 文件加入下面两行:
source /home/msi/软件安装目录/Licensepack/etc/lp_cshrc
lp_server -s
保存即可

12,对于大于2个节点以上的,其他node3,node4,。。。节点同node2配置即可。

[ Last edited by raul0716 on 2008-12-3 at 09:22 ]
2楼2008-11-28 12:32:57
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

raul0716

disover 可以并行吧 !
5楼2008-12-03 15:37:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见