| 查看: 1779 | 回复: 4 | ||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | ||
04nylxb木虫 (正式写手)
|
[求助]
集群mpich2调试出问题mpdboot -n 无法启动
|
|
|
在集群搭建的时候,用的是mpich2-1.4.1p1,ssh nfs nis都已经OK,现在卡在mpi的调试上,一直无法启动跨节点的mpi,总是出现以下的错误,请问有解决方法不?都按照集群mpi进行配置了(mpd.hosts .mpd.hosts .mpd.conf mpd.conf,然后都是600的权限),还是不行,是否需要重装mpich? [root@node-1 ~]# mpdboot -n 4 -f mpd.hosts Traceback (most recent call last): File "/usr/local/bin/mpdboot", line 482, in ? mpdboot() File "/usr/local/bin/mpdboot", line 234, in mpdboot (k,v) = kv.split('=',1) ValueError: need more than 1 value to unpack 或者是这样的错误 [lixb@node-1 ~]$ mpdboot -n 2 -f mpd.hosts unable to open (or read) hostsfile mpd.hosts |
» 猜你喜欢
华南师范大学广州市光谱分析与功能探针重点实验室诚招青年英才和博士后岗位研究人员
已经有11人回复
华南师范大学广州市光谱分析与功能探针重点实验室诚招青年英才和博士后岗位研究人员
已经有10人回复
物理化学论文润色/翻译怎么收费?
已经有139人回复
夏威夷大学生物胶体与界面实验室诚招全奖博士生和博士后
已经有1人回复
200年来人们一直无法破解的难题: 气液临界点状态方程
已经有7人回复
关于引力延迟下双星系统角动量不守恒的疑惑---求高手解答!
已经有10人回复
求助立方晶体In(OH)3的CIF卡片
已经有2人回复
求标准卡片Cu0.4In0.4Zn1.2S2 PDF#32-0340
已经有2人回复
量子点电致发光器件(QLED):蓝光量子点(QDs)和纳米氧化锌电子传输材料
已经有0人回复
需要一个圆偏振光诱导化学反应,请问使用圆偏振光作为光源,应该需要哪些设备搭建
已经有0人回复
» 本主题相关价值贴推荐,对您同样有帮助:
联合培养同一个导师问题
已经有15人回复
对审稿人提出的问题实在无法回答,能不能删掉那部分内容?
已经有14人回复
柱前衍生化色谱柱维护以及冲洗问题
已经有5人回复
matlab调试问题
已经有3人回复
G09集群计算结果的chk文件转换问题
已经有7人回复
mpich2杀进程的问题
已经有4人回复
请教ORCA的并行及集群上的脚本文件
已经有14人回复
【心得】针对“Word无法启动转换器mswrd632.wpc”的解决方法
已经有3人回复
【转帖】973计划重大科学问题导向项目“人工合成细胞工厂”启动
已经有4人回复
【交流】各位虫友,油泵启动不了大概是怎么回事啊
已经有11人回复
【求助】关于单机2cpu8核的mpich2设置问题!
已经有5人回复
【求助】安装mpich2时出现问题!
已经有6人回复
【求助】MS4.4在REDHAT5.0集群上安装出错,附步骤,望高手指正
已经有16人回复
【原创】Ubuntu 9.04下MPICH2集群搭建
已经有8人回复

04nylxb
木虫 (正式写手)
- 应助: 33 (小学生)
- 金币: 2321.9
- 散金: 46
- 红花: 4
- 帖子: 824
- 在线: 262.6小时
- 虫号: 817223
- 注册: 2009-07-28
- 性别: GG
- 专业: 工程热物理相关交叉领域
|
你好,非常感谢啊。 我直接运行mpirun的时候出现了这样的问题:请问有遇到过吗?谢谢啊 [lixb@node-1 ~]$ mpirun -machinefile /usr/local/mpich2-1.4.1p1/bin/nodes.LINUX -np 16 ./hellocluster >out1 -------------------------------------------------------------------------- Open RTE detected a parse error in the hostfile: /usr/local/mpich2-1.4.1p1/bin/nodes.LINUX It occured on line number 2 on token 5: node-2 -------------------------------------------------------------------------- [node-1:25170] [[64214,0],0] ORTE_ERROR_LOG: Error in file base/ras_base_allocate.c at line 236 [node-1:25170] [[64214,0],0] ORTE_ERROR_LOG: Error in file base/plm_base_launch_support.c at line 72 [node-1:25170] [[64214,0],0] ORTE_ERROR_LOG: Error in file plm_rsh_module.c at line 990 -------------------------------------------------------------------------- A daemon (pid unknown) died unexpectedly on signal 1 while attempting to launch so we are aborting. There may be more information reported by the environment (see above). This may be because the daemon was unable to find all the needed shared libraries on the remote node. You may set your LD_LIBRARY_PATH to have the location of the shared libraries on the remote nodes and this will automatically be forwarded to the remote nodes. -------------------------------------------------------------------------- -------------------------------------------------------------------------- mpirun noticed that the job aborted, but has no info as to the process that caused that situation. -------------------------------------------------------------------------- mpirun: clean termination accomplished |

3楼2012-01-06 22:42:44













回复此楼