24小时热门版块排行榜    

查看: 739  |  回复: 3
当前主题已经存档。
【有奖交流】积极回复本帖子,参与交流,就有机会分得作者 TYHB 的 2 个金币
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

TYHB

捐助贵宾 (小有名气)

[交流] 【求助】MS 在Linux集群上多级运算出错 高手们来帮助解决下吧

在Rocks Clusters5.2 上建立了 一个3节点的集群
但是 运行Discover 时不能多机并行计算  下面为运行的过程:
[msi@cluster bin]$ ls
APPFILE            run                 SiO2_surf2.car  SiO2_surf2.out
discovery.exe      RunDiscover.Readme  SiO2_surf2.inp
discovery_mpi.exe  RunDiscover.sh      SiO2_surf2.mdf
[msi@cluster bin]$ ./RunDiscover.sh -np 20 SiO2_surf2.inp
/opt/hpmpi/bin/mpirun -e MPI_REMSH=/usr/bin/ssh -cpu_bind=v -prot -f APPFILE
executing parallel Discover on 20 processors
mpirun: hostname: localhost, ip returned: 127.0.0.1
mpirun: hostname: compute-0-0, ip returned: 10.255.255.254
mpirun: hostname: compute-0-1, ip returned: 10.255.255.253
mpirun: hostname: compute-0-2, ip returned: 10.255.255.252
mpirun: Can't talk to a remote host with IP 127.0.0.1
mpirun: Change hostname or check IP configuration
Discover has completed

请各位高手指点迷津
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

TYHB

捐助贵宾 (小有名气)

这个  我试了  可是不管呀
3楼2009-07-17 18:19:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 4 个回答

fuzp

铁杆木虫 (正式写手)

★ ★
wuchenwf(金币+2,VIP+0):谢谢回帖交流 7-16 22:25
你把machines.LINUX和hosts.equiv里127.0.0.1那行注释掉看看。10.255.255.254和127.0.0.1是同一个节点吧。
2楼2009-07-16 00:24:02
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

fuzp

铁杆木虫 (正式写手)

★ ★
fegg7502(金币+2,VIP+0):thank you very much! 7-19 20:48
你的hpmpi是用rsh还是ssh来实现无密码登录的?你设置一下,使得rsh 127.0.0.1或ssh 127.0.0.1不需要密码登录了就可以了。
4楼2009-07-18 02:17:07
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见