24小时热门版块排行榜    

查看: 2834  |  回复: 22
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

lbambool

木虫 (著名写手)

[交流] 【求助】MS在LINUX下的安装问题 已有3人参与

手边有四台四核8G内存的 PC,操作系统是centos 4.7,update后版本为4.8,RSH和SSH免认证登录配置没有问题。

该 组机器用于MS的并行计算,用了大概4年左右,以前使用一直没有什么问题,前段发现并行有问题,想重新配置一下,顺便升级一下版本。先试了一下MS4.4,按帮助里说的先加上了glibc-2.3.4-2.41 (32-bit and 64-bit)、hpmpi-2.02.05.01-20070708r.x86_64、libgcc-3.4.6-10 (32-bit and 64-bit)、compat-libstdc++-33-3.2.3-47.3 (32-bit and 64-bit)等补丁和HPMPI,然后切换到msi用户.Install --type cluster,安装路径为/home/msi/ms44,所有模块全部安装,临时文件夹设在用户目录下的tmp里,tmp文件夹各机独立,使用命令mount -o sync,hard 主节点:/home/msi/ms44 /home/msi/ms44将MS44共享给其他计算节点。修改machines.LINUX,加上其他计算节点名和CPU数,修改Gateway/root_default/dsd/conf/gw-info.sbd和gwparams.cfg中CPU总数,安装licenses,启动网关,所有安装过程都正常,未有出错提示,但提交任务时发现单机可以四核计算,并行总是出错,提示网关超时,原因未明。
更换4.2和4.0的版本也是一样的问题,提交多机并行任务就提示网关超时后退出。
今天把原来所以安装全清理后重新安装MS4.0,发现了一个新的问题,用dmol3可以多机并行计算,没有任何错误,但用castep却无法计算,提交任务就失败退出,出错信息如下,请帮忙分析一下原因。
Label "calculate_ELF" not in keyword list
Trapped SIGINT or SIGTERM. Exiting...
Trapped SIGINT or SIGTERM. Exiting...
Trapped SIGINT or SIGTERM. Exiting...
expr: syntax error
expr: syntax error
/home/msi/ms40/Gateway/root_default/dsd/../../../share/bin/create_appfile.sh: line 74: [: =: unary operator expected
expr: syntax error
expr: syntax error
MPI Application rank 0 exited before MPI_Finalize() with status 1
回复此楼
Θ抚琴闹市外,独闲山水间Θ
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lbambool

木虫 (著名写手)

★ ★
ice_rain(金币+2,VIP+0):奖励讨论 1-20 22:47
问题解决了!
错在这里,在mount 的时候,我从帮助文件里直接复制了
mount -o sync,hard 节点名:/home/msi/Accelrys /home/msi/Accelrys
而我在翻以前的笔记时发现我用的是
mount -t nfs  主节点名:/home/msi/Accelrys /home/msi/Accelrys
参数不一样,按以前的操作方法做一下后发现问题解决,可以并行计算了。
查了一下
-t
指定档案系统的型态,通常不必指定。mount 会自动选择正确的型态。
-o sync
在同步模式下执行。
-o async
打开非同步模式,所有的档案读写动作都会用非同步模式执行。

不知道我出错是因为-t 和-o参数的不同引起的,还是命令里少了NFS引起的,以后再试一下看到底是哪的错。
感谢前面几位朋友的关注。

[ Last edited by lbambool on 2010-1-20 at 18:57 ]
Θ抚琴闹市外,独闲山水间Θ
16楼2010-01-20 18:55:56
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 23 个回答

lbambool

木虫 (著名写手)

★ ★
fegg7502(金币+2,VIP+0):thank you very much! 1-17 17:57
现在怀疑几个方面的问题:
1.licenses的问题,但换过几个都没有解决问题,相同的lic在windows下可用。
2.网络问题,交换机,网线都更换过,网卡和网卡驱动未换
3.操作系统版本问题,MS44里写明支持Red Hat Enterprise Linux AS, ES, and WS - 4.6 and 4.7、Red Hat Enterprise Linux - 5.1 and 5.2,我用的是CENTOS4.7和RHEL的4.7应该是一样的,但更新后变成4.8,会不会是这个问题?更换MS版本后与MS支持列表里的操作系统也不完全相符,这可能是一个原因。
大家觉得还有什么可能的原因帮我想一想啦,金币不够我再追加。
Θ抚琴闹市外,独闲山水间Θ
2楼2010-01-15 13:58:26
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lbambool

木虫 (著名写手)

还是没有人回答呀,郁闷
Θ抚琴闹市外,独闲山水间Θ
3楼2010-01-15 18:16:47
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lbambool

木虫 (著名写手)

又沉了,看的人多回的人少呀。不解决问题,随便说几句也好呀,说不定就可以解决问题呢。
Θ抚琴闹市外,独闲山水间Θ
4楼2010-01-15 22:05:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见