24小时热门版块排行榜    

查看: 3278  |  回复: 9

Prettyswan

木虫 (小有名气)

[交流] 【求助】如何使用openmpi在多节点并行计算?已有3人参与

集群上使用的是openmpi,PBS有点问题,所以我一直用命令“mpirun -np 8 vasp”提交任务。不知道如何使用命令进行多节点的并行计算(把一个任务分配到多个节点上)。
在《并行计算导论》上查到关于mpich的使用:
引用回帖:
5. 运行MPICH程序
多机环境中运行MPICH程序与单机环境类似,可以用mpirun来进行。运行程序前先创建一个machinefile文件,其中列出要使用的结点机名,然后用命令“mpirun -machinefile 文件名 ...”来在指定的结点上运行程序。例如,假设用户登录在结点node2上,文件mfile中包含下述内容:
node3
node4
则命令:
mpirun -machinefile mfile -np 3 cpi
将用node2,node3 和node4来运行程序cpi,每个结点一个进程,这是因为默认情况下mpirun总是将当前结点添加到程序的结点机列表中。如果不希望使用当前结点(node2),可以加上-nolocal选项:
mpirun -nolocal -machinefile mfile -np 3 cpi
选项-np给出的进程数与-machinefile给出的文件中的结点机数不一定要相等。如果进程数少于结点机数,则程序只使用其中的一部分结点。如果进程数多于结点机数,则一些结点上会运行多于一个进程。

我参考着使用了一下
CODE:
[zhuqx_hp@node3 Se]$ nohup /home/software/openmpi-1.2.2-intel9/bin/mpirun -machiefile INCAR KPOINTS POTCAR POSCAR -np 8 /home/bin/vasp.openmpi >out

结果报错了
引用回帖:
--------------------------------------------------------------------------
Open RTE detected a parse error in the hostfile:
    INCAR
It occured on line number 1 on token 3.
--------------------------------------------------------------------------
[node3:26677] [0,0,0] ORTE_ERROR_LOG: Error in file rmgr_urm.c at line 358
[node3:26677] mpirun: spawn failed with errno=-1

machinefile:
引用回帖:
node2
node4
node5
node6
node7

请教了。谢谢

[ Last edited by Prettyswan on 2010-7-7 at 15:38 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

beyondstar

木虫 (正式写手)


lvjian8596(金币+1):感谢交流! 2010-07-07 22:16:45
并行命令
mpirun -n 8 -machinefile -mf vasp>log&
其中mf
node01
node02
........
........

node08
node08
2楼2010-07-07 18:44:42
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

goldenfisher

金虫 (著名写手)

★ ★
lvjian8596(金币+1):感谢交流! 2010-07-07 22:53:44
zzy870720z(金币+1):谢谢指点 2010-07-08 10:05:19
在-machinefile后面还要加上你命名的各个节点的文件。记住,-machinefile是一个命令,而后面跟上的才是其对应的节点。
比如命名文件为mf,其中内容为上面所说的内容,则运行
mpirun -n 8 -machinefile mf vasp即可
3楼2010-07-07 22:41:35
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Prettyswan

木虫 (小有名气)

引用回帖:
Originally posted by goldenfisher at 2010-07-07 22:41:35:
在-machinefile后面还要加上你命名的各个节点的文件。记住,-machinefile是一个命令,而后面跟上的才是其对应的节点。
比如命名文件为mf,其中内容为上面所说的内容,则运行
mpirun -n 8 -machinefile mf vasp即可

官方指南中写道:
引用回帖:
SYNOPSIS
       Single Process Multiple Data (SPMD) Model:

       mpirun [ options ] [ ]

       Multiple Instruction Multiple Data (MIMD) Model:

       mpirun [ global_options ]
              [ local_options1 ] [ ] :
              [ local_options2 ] [ ] :
              ... :
              [ local_optionsN ] [ ]

       Note  that in both models, invoking mpirun via an absolute path name is
       equivalent to specifying the --prefix option with a value equiva-
       lent  to  the  directory where mpirun resides, minus its last subdirec-
       tory.  For example:

           % /usr/local/bin/mpirun ...

       is equivalent to

           % mpirun --prefix /usr/local

QUICK SUMMARY
       If you are simply looking for how to run an MPI application, you proba-
       bly want to use a command line of the following form:

           % mpirun [ -np X ] [ --hostfile ]  

       This  will  run X copies of in your current run-time environ-
       ment (if running under a supported resource manager, Open MPI's  mpirun
       will  usually  automatically  use  the  corresponding  resource manager
       process starter, as opposed to, for example, rsh or ssh, which  require
       the  use  of a hostfile, or will default to running all X copies on the
       localhost), scheduling (by default) in a  round-robin  fashion  by  CPU
       slot.  See the rest of this page for more details.

我仿照着写了
CODE:
[zhuqx_hp@node2 Se]$ nohup /home/software/openmpi-1.2.2-intel9/bin/mpirun  -np 8 -hostfile mfile /home/bin/vasp.openmpi >out &

结果还是报错:
引用回帖:
--------------------------------------------------------------------------
Failed to find the following executable:

Host:       node2
Executable: mfile

Cannot continue.
--------------------------------------------------------------------------

[ Last edited by Prettyswan on 2010-7-8 at 11:16 ]
4楼2010-07-08 10:16:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

goldenfisher

金虫 (著名写手)

★ ★
zzy870720z(金币+2):谢谢指点 2010-07-08 17:18:55
节点的名称有可能不一样,你的集群的各个节点你要确认是以node命名的吗?
我们的就不是,是以compute-1命名的。
你的情况是找不到分节点,估计你的命名有问题
5楼2010-07-08 17:05:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Prettyswan

木虫 (小有名气)

引用回帖:
Originally posted by goldenfisher at 2010-07-08 17:05:40:
节点的名称有可能不一样,你的集群的各个节点你要确认是以node命名的吗?
我们的就不是,是以compute-1命名的。
你的情况是找不到分节点,估计你的命名有问题

我们的集群确实是node命名的。
6楼2010-07-16 21:50:05
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

beyondstar

木虫 (正式写手)


zzy870720z(金币+1):谢谢提示 2010-07-17 08:47:28
你的节点名不对,字面上看,是不是node02
7楼2010-07-17 08:43:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Prettyswan

木虫 (小有名气)

引用回帖:
Originally posted by beyondstar at 2010-07-17 08:43:13:
你的节点名不对,字面上看,是不是node02

我切换节点的时候都是用 rsh node2
8楼2010-07-17 09:35:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

beyondstar

木虫 (正式写手)


gavinliu7390(金币+1): 2010-07-17 12:00:08
-hostfile 去掉试试
9楼2010-07-17 10:37:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

风间的记忆

铁杆木虫 (著名写手)


zzy870720z(金币+1):谢谢建议 2010-08-11 10:33:33
好吧

我说实话

你基本的MPIRUN的命令都不对~~~~~

1)咨询你们的系统管理员

2)使用说明上已经表述的很清楚,option很多,自己仔细看。肯定可以看明白的

[ Last edited by 风间的记忆 on 2010-8-11 at 09:51 ]
九州浩淼,任其东西,明日何在,但随我意。
10楼2010-08-11 09:43:29
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 Prettyswan 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[高分子] 寻找聚酯反应釜 +3 茕茕恭煮 2024-06-15 5/250 2024-06-18 11:44 by 茕茕恭煮
[基金申请] 我标书代码变了 +50 学员NHuqdk 2024-06-16 67/3350 2024-06-18 11:19 by 学员NHuqdk
[论文投稿] 最近写了一篇控制优化领域的文章,可以投哪里啊?有没有水一些的期刊推荐 +8 香瓜木香 2024-06-12 14/700 2024-06-18 11:16 by 晓目崇
[基金申请] F口信息学部拿面上,大概需要什么样的成果 +7 _奋黎_ 2024-06-16 12/600 2024-06-18 07:41 by ld_cauchy
[硕博家园] 硕博巨婴,也许才刚刚开始 +33 SNaiL1995 2024-06-12 85/4250 2024-06-18 00:06 by 博士求上上岸
[考博] 2025考博 +7 自强不息a?a 2024-06-15 12/600 2024-06-17 22:51 by 自强不息a?a
[基金申请] 化学会年会改成一年开一次了? +7 babu2015 2024-06-12 15/750 2024-06-17 20:28 by 落笔画枫
[考博] 这个博士要读吗 +9 Sea Breeze 2024-06-16 17/850 2024-06-17 19:50 by zeolitess
[基金申请] 面青地会评时间 +8 tanjydd 2024-06-15 8/400 2024-06-17 17:08 by 小龙虾2008
[有机交流] 苯酚和炔醇反应,mitsunobu反应 5+3 TONGMEIMEI 2024-06-12 9/450 2024-06-17 15:00 by dschong
[教师之家] 饶议:什么制度能保障大学普通教师不用为领导拎包,不用看领导脸色 +10 zju2000 2024-06-12 16/800 2024-06-17 14:54 by 大天尊
[教师之家] 请问事业编制和年薪制冲突吗? +10 ZHONGWU_U 2024-06-14 10/500 2024-06-17 14:44 by 周周520
[教师之家] 每次骚扰女学生的都是院系领导,而不是普通教师,小编们要注意措辞正确 +9 zju2000 2024-06-15 11/550 2024-06-16 14:49 by appleapple2
[基金申请] 博后基金,博管会会提前知道消息吗? +4 yuyiang 2024-06-13 4/200 2024-06-16 11:40 by yangyuzhong4
[基金申请] 博士后创新人才支持计划公示 +9 aishida144 2024-06-14 15/750 2024-06-16 09:52 by msjy
[基金申请] 为什么我的博后基金还在流动站审核中?不会是学院给我卡了吧? +14 王凯12 2024-06-13 26/1300 2024-06-15 15:22 by 好人与坏人
[基金申请] 博后基金,以往的结果点不开,怎么回事呢?最后一次机会了,两次都没中前面。 +7 kyukitu 2024-06-14 13/650 2024-06-15 06:46 by 我是王小帅
[基金申请] 工材E口JQ有消息了吗 +4 babyduck 2024-06-11 4/200 2024-06-14 17:23 by firepick
[有机交流] ππ堆积会发生在有机溶剂中吗 5+3 zibuyu0420 2024-06-13 4/200 2024-06-14 14:17 by 小肉干
[有机交流] 原料反应完了,怎么知道是产物还是中间体 +6 小胡在努力 2024-06-11 8/400 2024-06-13 13:33 by 091602
信息提示
请填处理意见