| 查看: 1769 | 回复: 4 | ||
04nylxb木虫 (正式写手)
|
[求助]
集群mpich2调试出问题mpdboot -n 无法启动
|
|
在集群搭建的时候,用的是mpich2-1.4.1p1,ssh nfs nis都已经OK,现在卡在mpi的调试上,一直无法启动跨节点的mpi,总是出现以下的错误,请问有解决方法不?都按照集群mpi进行配置了(mpd.hosts .mpd.hosts .mpd.conf mpd.conf,然后都是600的权限),还是不行,是否需要重装mpich? [root@node-1 ~]# mpdboot -n 4 -f mpd.hosts Traceback (most recent call last): File "/usr/local/bin/mpdboot", line 482, in ? mpdboot() File "/usr/local/bin/mpdboot", line 234, in mpdboot (k,v) = kv.split('=',1) ValueError: need more than 1 value to unpack 或者是这样的错误 [lixb@node-1 ~]$ mpdboot -n 2 -f mpd.hosts unable to open (or read) hostsfile mpd.hosts |
» 猜你喜欢
求助火焰封管的时候管子炸了
已经有1人回复
PbS量子点如何确定浓度
已经有11人回复
物理化学论文润色/翻译怎么收费?
已经有216人回复
夏威夷大学生物胶体与界面实验室诚招全奖博士生和博士后
已经有1人回复
求助立方晶体In(OH)3的CIF卡片
已经有2人回复
大湾区大学刘天辉课题组招收2026级博士生(与中山大学物理学院联合培养)
已经有22人回复
PbS量子点紫外吸收
已经有0人回复
比利时鲁汶大学与国家留学基金委共同资助博士研究生CSC-KU Leuven PhD Scholarship
已经有0人回复
请问四氢呋喃溶解的聚合物用甲醇沉淀时,如何使沉淀过程加速?
已经有2人回复
» 本主题相关价值贴推荐,对您同样有帮助:
联合培养同一个导师问题
已经有15人回复
对审稿人提出的问题实在无法回答,能不能删掉那部分内容?
已经有14人回复
柱前衍生化色谱柱维护以及冲洗问题
已经有5人回复
matlab调试问题
已经有3人回复
G09集群计算结果的chk文件转换问题
已经有7人回复
mpich2杀进程的问题
已经有4人回复
请教ORCA的并行及集群上的脚本文件
已经有14人回复
【心得】针对“Word无法启动转换器mswrd632.wpc”的解决方法
已经有3人回复
【转帖】973计划重大科学问题导向项目“人工合成细胞工厂”启动
已经有4人回复
【交流】各位虫友,油泵启动不了大概是怎么回事啊
已经有11人回复
【求助】关于单机2cpu8核的mpich2设置问题!
已经有5人回复
【求助】安装mpich2时出现问题!
已经有6人回复
【求助】MS4.4在REDHAT5.0集群上安装出错,附步骤,望高手指正
已经有16人回复
【原创】Ubuntu 9.04下MPICH2集群搭建
已经有8人回复

bluewhale
铁杆木虫 (正式写手)
- 应助: 58 (初中生)
- 金币: 8438.3
- 散金: 50
- 红花: 10
- 帖子: 890
- 在线: 362.2小时
- 虫号: 278289
- 注册: 2006-09-10
- 专业: 凝聚态物性I:结构、力学和
2楼2012-01-06 20:02:48
04nylxb
木虫 (正式写手)
- 应助: 33 (小学生)
- 金币: 2321.9
- 散金: 46
- 红花: 4
- 帖子: 824
- 在线: 262.6小时
- 虫号: 817223
- 注册: 2009-07-28
- 性别: GG
- 专业: 工程热物理相关交叉领域
|
你好,非常感谢啊。 我直接运行mpirun的时候出现了这样的问题:请问有遇到过吗?谢谢啊 [lixb@node-1 ~]$ mpirun -machinefile /usr/local/mpich2-1.4.1p1/bin/nodes.LINUX -np 16 ./hellocluster >out1 -------------------------------------------------------------------------- Open RTE detected a parse error in the hostfile: /usr/local/mpich2-1.4.1p1/bin/nodes.LINUX It occured on line number 2 on token 5: node-2 -------------------------------------------------------------------------- [node-1:25170] [[64214,0],0] ORTE_ERROR_LOG: Error in file base/ras_base_allocate.c at line 236 [node-1:25170] [[64214,0],0] ORTE_ERROR_LOG: Error in file base/plm_base_launch_support.c at line 72 [node-1:25170] [[64214,0],0] ORTE_ERROR_LOG: Error in file plm_rsh_module.c at line 990 -------------------------------------------------------------------------- A daemon (pid unknown) died unexpectedly on signal 1 while attempting to launch so we are aborting. There may be more information reported by the environment (see above). This may be because the daemon was unable to find all the needed shared libraries on the remote node. You may set your LD_LIBRARY_PATH to have the location of the shared libraries on the remote nodes and this will automatically be forwarded to the remote nodes. -------------------------------------------------------------------------- -------------------------------------------------------------------------- mpirun noticed that the job aborted, but has no info as to the process that caused that situation. -------------------------------------------------------------------------- mpirun: clean termination accomplished |

3楼2012-01-06 22:42:44
arsc
金虫 (小有名气)
- 应助: 32 (小学生)
- 金币: 1088.6
- 散金: 38
- 红花: 4
- 帖子: 251
- 在线: 200.4小时
- 虫号: 1565508
- 注册: 2012-01-05
- 专业: 理论和计算化学
4楼2012-05-24 11:38:32
gmy1990
荣誉版主 (著名写手)
- QC强帖: 1
- 应助: 163 (高中生)
- 贵宾: 0.782
- 金币: 13422.7
- 散金: 526
- 红花: 42
- 沙发: 4
- 帖子: 1627
- 在线: 1019.7小时
- 虫号: 745920
- 注册: 2009-04-11
- 专业: 理论和计算化学
- 管辖: 量子化学
5楼2012-05-24 16:00:43













回复此楼
,相对还是安装起来比较方便)