24小时热门版块排行榜    

北京石油化工学院2026年研究生招生接收调剂公告
查看: 2005  |  回复: 4

04nylxb

木虫 (正式写手)

[求助] 集群mpich2调试出问题mpdboot -n 无法启动

在集群搭建的时候,用的是mpich2-1.4.1p1,ssh nfs nis都已经OK,现在卡在mpi的调试上,一直无法启动跨节点的mpi,总是出现以下的错误,请问有解决方法不?都按照集群mpi进行配置了(mpd.hosts .mpd.hosts .mpd.conf  mpd.conf,然后都是600的权限),还是不行,是否需要重装mpich?
[root@node-1 ~]# mpdboot -n 4 -f mpd.hosts
Traceback (most recent call last):
  File "/usr/local/bin/mpdboot", line 482, in ?
    mpdboot()
  File "/usr/local/bin/mpdboot", line 234, in mpdboot
    (k,v) = kv.split('=',1)
ValueError: need more than 1 value to unpack

或者是这样的错误
[lixb@node-1 ~]$ mpdboot -n 2 -f mpd.hosts
unable to open (or read) hostsfile mpd.hosts
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

集中精力发文章
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bluewhale

铁杆木虫 (正式写手)

【答案】应助回帖

★ ★
感谢参与,应助指数 +1
gmy1990(金币+2): 2012-01-06 21:46:57
04nylxb(金币+5): ★★★很有帮助 谢谢啊 2012-01-06 22:38:47
我记得mpich2 1.4 根本不需要boot和exit daemon这二步了。我们天天在集群上运行,好像没有任何问题。Version 1.2是需要的。
2楼2012-01-06 20:02:48
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

04nylxb

木虫 (正式写手)

引用回帖:
2楼: Originally posted by bluewhale at 2012-01-06 20:02:48:
我记得mpich2 1.4 根本不需要boot和exit daemon这二步了。我们天天在集群上运行,好像没有任何问题。Version 1.2是需要的。

你好,非常感谢啊。
我直接运行mpirun的时候出现了这样的问题:请问有遇到过吗?谢谢啊
[lixb@node-1 ~]$ mpirun -machinefile /usr/local/mpich2-1.4.1p1/bin/nodes.LINUX -np 16 ./hellocluster >out1
--------------------------------------------------------------------------
Open RTE detected a parse error in the hostfile:
    /usr/local/mpich2-1.4.1p1/bin/nodes.LINUX
It occured on line number 2 on token 5:
    node-2
--------------------------------------------------------------------------
[node-1:25170] [[64214,0],0] ORTE_ERROR_LOG: Error in file base/ras_base_allocate.c at line 236
[node-1:25170] [[64214,0],0] ORTE_ERROR_LOG: Error in file base/plm_base_launch_support.c at line 72
[node-1:25170] [[64214,0],0] ORTE_ERROR_LOG: Error in file plm_rsh_module.c at line 990
--------------------------------------------------------------------------
A daemon (pid unknown) died unexpectedly on signal 1  while attempting to
launch so we are aborting.

There may be more information reported by the environment (see above).

This may be because the daemon was unable to find all the needed shared
libraries on the remote node. You may set your LD_LIBRARY_PATH to have the
location of the shared libraries on the remote nodes and this will
automatically be forwarded to the remote nodes.
--------------------------------------------------------------------------
--------------------------------------------------------------------------
mpirun noticed that the job aborted, but has no info as to the process
that caused that situation.
--------------------------------------------------------------------------
mpirun: clean termination accomplished
集中精力发文章
3楼2012-01-06 22:42:44
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

arsc

金虫 (小有名气)

【答案】应助回帖

★ ★ ★
04nylxb: 金币+3, ★★★很有帮助, 嗯,是的,我现在用的就是hydra了,呵呵 2012-05-25 19:38:51
我放棄了使用MPICH2,現在改用OPEN MPI,簡單方便得多‧MPICH2官方網站上面的FAQ說MPD已經不用了,因為太多問題,現在新版的MPICH2 已改用另一個PROCESS MANAGER
4楼2012-05-24 11:38:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gmy1990

荣誉版主 (著名写手)

优秀版主优秀版主

【答案】应助回帖

★ ★ ★ ★ ★
04nylxb: 金币+5, ★★★很有帮助, 非常感谢,我现在用hydra了,就不用每次都启动mpd了,呵呵。 2012-05-25 19:37:47
引用回帖:
3楼: Originally posted by 04nylxb at 2012-01-06 22:42:44:
你好,非常感谢啊。
我直接运行mpirun的时候出现了这样的问题:请问有遇到过吗?谢谢啊
$ mpirun -machinefile /usr/local/mpich2-1.4.1p1/bin/nodes.LINUX -np 16 ./hellocluster >out1
------------------

确定下跨节点访问是否需要密码?
mpdtrace运行试试看有没启用mpd,检查你的mpd.hosts文件是否有误.
实在不行就重装(解决不了时,我就重装,相对还是安装起来比较方便)
5楼2012-05-24 16:00:43
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 04nylxb 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 0856调剂 +6 曲听筠 2026-03-30 6/300 2026-03-31 09:44 by Jaylen.
[考研] 291求调剂 +12 Y-cap 2026-03-29 15/750 2026-03-31 09:25 by Huaxue_Wang
[考研] 08工科,295,接受跨专业调剂 +5 lmnlzy 2026-03-30 5/250 2026-03-31 09:20 by LZL-hynu
[考研] 311求调剂一志愿合肥工业大学 +5 秋二十二 2026-03-30 5/250 2026-03-31 06:55 by 无际的草原
[考研] 福建理工大学材料学院先进合金团队招收考研调剂学生 +3 大华金商都 2026-03-30 4/200 2026-03-31 01:04 by 方英俊602
[考研] 求调剂,一志愿 南京航空航天大学 ,080500材料科学与工程学硕,总分289分 +9 @taotao 2026-03-29 9/450 2026-03-30 22:29 by 我是小康
[考研] 288资源与环境专硕求调剂,不限专业,有学上就行 +11 lllllos 2026-03-30 11/550 2026-03-30 21:19 by 研究僧导导
[考研] 一志愿华东师范大学有机化学专业,初试351分,复试被刷求调剂! +7 真名有冰 2026-03-29 8/400 2026-03-30 21:08 by maaj02
[考研] 085600 286分 材料求调剂 +11 麻辣鱿鱼 2026-03-27 12/600 2026-03-30 19:33 by Wang200018
[考研] 328求调剂 +8 嗯滴的基本都 2026-03-27 8/400 2026-03-30 17:20 by Wang200018
[考研] 342求调剂 +4 加油a李zs 2026-03-26 4/200 2026-03-30 16:39 by 晶体之美
[考研] 0703 化学 求调剂,一志愿山东大学 342 分 +7 Shern—- 2026-03-28 7/350 2026-03-30 16:31 by nothing投稿中
[考研] 320分,材料与化工专业,求调剂 +9 一定上岸aaa 2026-03-27 13/650 2026-03-28 15:00 by 神马都不懂
[考研] 085701环境工程,267求调剂 +16 minht 2026-03-26 16/800 2026-03-28 12:16 by zllcz
[考研] 330一志愿中国海洋大学 化学工程 085602 有读博意愿 求调剂 +3 wywy.. 2026-03-27 4/200 2026-03-28 03:32 by fmesaito
[考研] 一志愿郑大085600,310分求调剂 +5 李潇可 2026-03-26 5/250 2026-03-27 11:14 by 不吃魚的貓
[论文投稿] Journal of Mechanical Science and Technology +3 Russ_ss 2026-03-25 5/250 2026-03-27 10:49 by 陆小果画大饼
[考研] 081200-11408-276学硕求调剂 +4 崔wj 2026-03-26 4/200 2026-03-27 08:04 by chemisry
[考研] 336材料求调剂 +7 陈滢莹 2026-03-26 9/450 2026-03-27 00:20 by wxiongid
[考研] 环境专硕324分求调剂推荐 +5 轩小宁—— 2026-03-26 5/250 2026-03-26 12:05 by i_cooler
信息提示
请填处理意见