| 查看: 1924 | 回复: 4 | ||
04nylxb木虫 (正式写手)
|
[求助]
集群mpich2调试出问题mpdboot -n 无法启动
|
|
在集群搭建的时候,用的是mpich2-1.4.1p1,ssh nfs nis都已经OK,现在卡在mpi的调试上,一直无法启动跨节点的mpi,总是出现以下的错误,请问有解决方法不?都按照集群mpi进行配置了(mpd.hosts .mpd.hosts .mpd.conf mpd.conf,然后都是600的权限),还是不行,是否需要重装mpich? [root@node-1 ~]# mpdboot -n 4 -f mpd.hosts Traceback (most recent call last): File "/usr/local/bin/mpdboot", line 482, in ? mpdboot() File "/usr/local/bin/mpdboot", line 234, in mpdboot (k,v) = kv.split('=',1) ValueError: need more than 1 value to unpack 或者是这样的错误 [lixb@node-1 ~]$ mpdboot -n 2 -f mpd.hosts unable to open (or read) hostsfile mpd.hosts |
» 猜你喜欢
国内青年破解费曼难题,从分子层面阐释液体蒸发(气液相变)微观过程
已经有5人回复
研究发现一个新的临界系数,独立于临界压缩因子
已经有7人回复
物理化学论文润色/翻译怎么收费?
已经有224人回复
200年来人们一直无法破解的难题: 气液临界点状态方程
已经有7人回复
关于引力延迟下双星系统角动量不守恒的疑惑---求高手解答!
已经有10人回复
已知面上挂了,小学校实验方向无平台,感觉太难了
已经有26人回复
求助各位大佬,球球了,在这科萨头
已经有0人回复
七嗪类物质合成求助
已经有0人回复
» 本主题相关价值贴推荐,对您同样有帮助:
联合培养同一个导师问题
已经有15人回复
对审稿人提出的问题实在无法回答,能不能删掉那部分内容?
已经有14人回复
柱前衍生化色谱柱维护以及冲洗问题
已经有5人回复
matlab调试问题
已经有3人回复
G09集群计算结果的chk文件转换问题
已经有7人回复
mpich2杀进程的问题
已经有4人回复
请教ORCA的并行及集群上的脚本文件
已经有14人回复
【心得】针对“Word无法启动转换器mswrd632.wpc”的解决方法
已经有3人回复
【转帖】973计划重大科学问题导向项目“人工合成细胞工厂”启动
已经有4人回复
【交流】各位虫友,油泵启动不了大概是怎么回事啊
已经有11人回复
【求助】关于单机2cpu8核的mpich2设置问题!
已经有5人回复
【求助】安装mpich2时出现问题!
已经有6人回复
【求助】MS4.4在REDHAT5.0集群上安装出错,附步骤,望高手指正
已经有16人回复
【原创】Ubuntu 9.04下MPICH2集群搭建
已经有8人回复

bluewhale
铁杆木虫 (正式写手)
- 应助: 58 (初中生)
- 金币: 8438.3
- 散金: 50
- 红花: 10
- 帖子: 890
- 在线: 362.2小时
- 虫号: 278289
- 注册: 2006-09-10
- 专业: 凝聚态物性I:结构、力学和
2楼2012-01-06 20:02:48
04nylxb
木虫 (正式写手)
- 应助: 33 (小学生)
- 金币: 2321.9
- 散金: 46
- 红花: 4
- 帖子: 824
- 在线: 262.6小时
- 虫号: 817223
- 注册: 2009-07-28
- 性别: GG
- 专业: 工程热物理相关交叉领域
|
你好,非常感谢啊。 我直接运行mpirun的时候出现了这样的问题:请问有遇到过吗?谢谢啊 [lixb@node-1 ~]$ mpirun -machinefile /usr/local/mpich2-1.4.1p1/bin/nodes.LINUX -np 16 ./hellocluster >out1 -------------------------------------------------------------------------- Open RTE detected a parse error in the hostfile: /usr/local/mpich2-1.4.1p1/bin/nodes.LINUX It occured on line number 2 on token 5: node-2 -------------------------------------------------------------------------- [node-1:25170] [[64214,0],0] ORTE_ERROR_LOG: Error in file base/ras_base_allocate.c at line 236 [node-1:25170] [[64214,0],0] ORTE_ERROR_LOG: Error in file base/plm_base_launch_support.c at line 72 [node-1:25170] [[64214,0],0] ORTE_ERROR_LOG: Error in file plm_rsh_module.c at line 990 -------------------------------------------------------------------------- A daemon (pid unknown) died unexpectedly on signal 1 while attempting to launch so we are aborting. There may be more information reported by the environment (see above). This may be because the daemon was unable to find all the needed shared libraries on the remote node. You may set your LD_LIBRARY_PATH to have the location of the shared libraries on the remote nodes and this will automatically be forwarded to the remote nodes. -------------------------------------------------------------------------- -------------------------------------------------------------------------- mpirun noticed that the job aborted, but has no info as to the process that caused that situation. -------------------------------------------------------------------------- mpirun: clean termination accomplished |

3楼2012-01-06 22:42:44
arsc
金虫 (小有名气)
- 应助: 32 (小学生)
- 金币: 1088.6
- 散金: 38
- 红花: 4
- 帖子: 251
- 在线: 200.4小时
- 虫号: 1565508
- 注册: 2012-01-05
- 专业: 理论和计算化学
4楼2012-05-24 11:38:32
gmy1990
荣誉版主 (著名写手)
- QC强帖: 1
- 应助: 163 (高中生)
- 贵宾: 0.782
- 金币: 13422.7
- 散金: 526
- 红花: 42
- 沙发: 4
- 帖子: 1627
- 在线: 1019.7小时
- 虫号: 745920
- 注册: 2009-04-11
- 专业: 理论和计算化学
- 管辖: 量子化学
5楼2012-05-24 16:00:43













回复此楼
,相对还是安装起来比较方便)