24小时热门版块排行榜    

CyRhmU.jpeg
南方科技大学公共卫生及应急管理学院2026级博士研究生招生报考通知(长期有效)
查看: 2831  |  回复: 25

sxjsn1

金虫 (小有名气)


[交流] 【求助】vasp无法并行计算

输入mpirun -np2 vasp时出现这个错误
/usr/local/bin/mpdroot: open failed for root's mpd conf filempiexec_laoshan.daoren (__init__ 1208): forked process failed; status=255
在论坛上看见同样几个帖子 可惜都答的不清楚  求高手解答  装vasp我断断续续都花了几个月了 真崩溃阿
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

» 抢金币啦!回帖就可以得到:

查看全部散金贴

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lightgjx

木虫 (正式写手)



zzy870720z(金币+1):鼓励交流 2010-11-30 10:08:07
sxjsn1(金币+2): 2010-11-30 11:12:03
引用回帖:
Originally posted by sxjsn1 at 2010-11-29 22:05:31:
输入mpirun -np2 vasp时出现这个错误
/usr/local/bin/mpdroot: open failed for root's mpd conf filempiexec_laoshan.daoren (__init__ 1208): forked process failed; status=255
在论坛上看见同样几个帖子  ...

在保证mpi安装正确的基础上:
执行:mpd&
2楼2010-11-30 09:51:46
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sxjsn1

金虫 (小有名气)


引用回帖:
Originally posted by lightgjx at 2010-11-30 09:51:46:


在保证mpi安装正确的基础上:
执行:mpd&

[root@laoshan Fe-bulk]# mpirun -np 2 vasp
vasp.5.2.2 15Apr09 complex
POSCAR found :  1 types and    1 ions
LDA part: xc-table for Pade appr. of Perdew
vasp.5.2.2 15Apr09 complex
POSCAR found :  1 types and    1 ions
LDA part: xc-table for Pade appr. of Perdew
POSCAR, INCAR and KPOINTS ok, starting setup
POSCAR, INCAR and KPOINTS ok, starting setup
这样的话是不是编译成功了呢? 我看别人上面有一句
running on 4 nodes
我的上面怎么没有这一句阿?
3楼2010-11-30 11:27:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

夕阳西下

金虫 (著名写手)



zzy870720z(金币+1):谢谢交流 2010-11-30 12:17:54
sxjsn1(金币+2): 2010-11-30 15:25:55
[quote]Originally posted by sxjsn1 at 2010-11-30 11:27:32:

[root@laoshan Fe-bulk]# mpirun -np 2 vasp
vasp.5.2.2 15Apr09 complex
POSCAR found :  1 types and    1 ions
LDA part: xc-table for Pade appr. of Perdew
vasp.5.2.2 15Apr09 complex
POSCA ... [/quo
应该算是成功了,否则也不会运行啊。mpirun -np 2 vasp -mpi>out试试。
4楼2010-11-30 11:51:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sunyang1988(金币+1):谢谢指点 2010-12-02 15:15:55
引用回帖:
Originally posted by sxjsn1 at 2010-11-30 11:27:32:

[root@laoshan Fe-bulk]# mpirun -np 2 vasp
vasp.5.2.2 15Apr09 complex
POSCAR found :  1 types and    1 ions
LDA part: xc-table for Pade appr. of Perdew
vasp.5.2.2 15Apr09 complex
POSCA ...

别人是跨节点吧,用了4个节点,你就一台机器
5楼2010-11-30 12:18:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sxjsn1

金虫 (小有名气)


引用回帖:
Originally posted by 夕阳西下 at 2010-11-30 11:51:22:
[quote]Originally posted by sxjsn1 at 2010-11-30 11:27:32:

[root@laoshan Fe-bulk]# mpirun -np 2 vasp
vasp.5.2.2 15Apr09 complex
POSCAR found :  1 types and    1 ions
LDA part: xc-t ...

崩溃了 早上还能运算  下午开机后用mpirun -np 2 vasp就不行了
mpdroot: perror msg: Connection refused
mpdroot: cannot connect to local mpd at: /tmp/mpd2.console_root
    probable cause:  no mpd daemon on this machine
    possible cause:  unix socket /tmp/mpd2.console_root has been removed
mpiexec_laoshan.daoren (__init__ 1208): forked process failed; status=255
这是啥意思阿?
6楼2010-11-30 14:56:04
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sxjsn1

金虫 (小有名气)


补充一下,我的/tmp里有mpd2.console_root这个文件
7楼2010-11-30 14:57:21
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sxjsn1

金虫 (小有名气)


引用回帖:
Originally posted by zzy870720z at 2010-11-30 12:18:45:


别人是跨节点吧,用了4个节点,你就一台机器

不是啊,我们实验室有个工作站,单机4核的
8楼2010-11-30 14:58:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sxjsn1(金币+1):呵呵 谢谢你回答问题 2010-11-30 15:10:15
sunyang1988(金币+1):谢谢交流 2010-12-02 15:16:09
引用回帖:
Originally posted by sxjsn1 at 2010-11-30 14:58:24:

不是啊,我们实验室有个工作站,单机4核的

不好意思,我说错了,那是四核,呵呵
你提交的是2核的任务
9楼2010-11-30 15:00:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sxjsn1

金虫 (小有名气)


引用回帖:
Originally posted by zzy870720z at 2010-11-30 15:00:25:


不好意思,我说错了,那是四核,呵呵
你提交的是2核的任务

是我没说清楚,我在4核的机子上运行mpirun -np 4 vasp
出现一行
running on 4 nodes
而在我的双核机子上运行mpirun -np 2 vasp
应该有一行
running on 2 nodes吧 但是没有
10楼2010-11-30 15:04:04
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lightgjx

木虫 (正式写手)



sxjsn1(金币+1): 2010-11-30 15:27:38
sunyang1988(金币+1):谢谢交流 2010-12-02 15:16:32
引用回帖:
Originally posted by sxjsn1 at 2010-11-30 11:27:32:

[root@laoshan Fe-bulk]# mpirun -np 2 vasp
vasp.5.2.2 15Apr09 complex
POSCAR found :  1 types and    1 ions
LDA part: xc-table for Pade appr. of Perdew
vasp.5.2.2 15Apr09 complex
POSCA ...

看样子有问题,感觉应该是你的并行没有编译好
11楼2010-11-30 15:24:01
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sxjsn1

金虫 (小有名气)


引用回帖:
Originally posted by 夕阳西下 at 2010-11-30 11:51:22:
[quote]Originally posted by sxjsn1 at 2010-11-30 11:27:32:

[root@laoshan Fe-bulk]# mpirun -np 2 vasp
vasp.5.2.2 15Apr09 complex
POSCAR found :  1 types and    1 ions
LDA part: xc-t ...

我用mpirun -np 2 vasp -mpi>out了 没反应阿
[root@laoshan Fe-bulk]# mpirun -np 2 vasp -mpi>out
[root@laoshan Fe-bulk]#
请问下一步怎么办?
12楼2010-11-30 15:27:08
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sxjsn1

金虫 (小有名气)


引用回帖:
Originally posted by lightgjx at 2010-11-30 15:24:01:

看样子有问题,感觉应该是你的并行没有编译好

您是说mpi编译还是vasp编译有问题阿? 我也感觉不对 哎
13楼2010-11-30 15:28:29
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sxjsn1

金虫 (小有名气)


还有个有趣的问题
我刚刚出现这个问题
mpdroot: perror msg: Connection refused
mpdroot: cannot connect to local mpd at: /tmp/mpd2.console_root
    probable cause:  no mpd daemon on this machine
    possible cause:  unix socket /tmp/mpd2.console_root has been removed
mpiexec_laoshan.daoren (__init__ 1208): forked process failed; status=255
我查了一下,有人告诉我打开另一个终端 然后输入mpd 不要关闭这个终端
再回到第一个终端 执行 mpirun -np 2 vasp就行了
我试了下 还真行  这是什么原因阿?
14楼2010-11-30 15:33:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lightgjx

木虫 (正式写手)



ym23(金币+1):谢谢参与帮助 2010-11-30 20:43:07
引用回帖:
Originally posted by sxjsn1 at 2010-11-30 15:28:29:

您是说mpi编译还是vasp编译有问题阿? 我也感觉不对 哎

感觉是mpi编译有问题,应该根本就没有并行,你还是再看看网上说的并行安装步骤吧。也许是哪里出了问题,很难说
15楼2010-11-30 16:17:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dirtor

木虫 (正式写手)



ym23(金币+1):谢谢参与帮助 2010-11-30 20:43:15
没见你执行mpdboot的步骤
16楼2010-11-30 17:13:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sxjsn1

金虫 (小有名气)


引用回帖:
Originally posted by dirtor at 2010-11-30 17:13:32:
没见你执行mpdboot的步骤

执行mpdboot? 是不是创建个mpd.conf 里面设置个MPD_SECRET=******之类的?
如果不是,mpdboot怎么执行?
17楼2010-11-30 20:59:04
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dirtor

木虫 (正式写手)


★ ★
ym23(金币+2):感谢答疑 2010-11-30 22:15:18
sxjsn1(金币+2): 2010-12-01 09:32:55
引用回帖:
Originally posted by sxjsn1 at 2010-11-30 20:59:04:

执行mpdboot? 是不是创建个mpd.conf 里面设置个MPD_SECRET=******之类的?
如果不是,mpdboot怎么执行?

引用回帖:
有人告诉我打开另一个终端 然后输入mpd 不要关闭这个终端  

好像你用的是mpich2
mpd就是执行了本地守护进程,
退出终端仍然存在的话运行mpd &就可以了

如果使用节点的话,需要设置.mpd.conf
并使用mpd.hosts文件来启动文件中各节点上的mpd:
mpdboot –n -f mpd.hosts

详细设置搜一下mpich2使用方法。
18楼2010-11-30 21:57:49
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sxjsn1

金虫 (小有名气)


引用回帖:
Originally posted by dirtor at 2010-11-30 21:57:49:



好像你用的是mpich2
mpd就是执行了本地守护进程,
退出终端仍然存在的话运行mpd &就可以了

如果使用节点的话,需要设置.mpd.conf
并使用mpd.hosts文件来启动文件中各节点上的mpd:
mpdboot –n  ...

谢谢您的帮助 我想问一下,我的单机双核的不用使用节点吧  我对这方面是个小白。。。
我运行mpd对不对啊? 还有 像我前面说的, 没有runningon 2 nodes这行,我那算不算已经并行运算了啊?
19楼2010-12-01 09:32:49
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sxjsn1

金虫 (小有名气)


补充一下 我的是mpich2
20楼2010-12-01 09:33:26
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dirtor

木虫 (正式写手)



ellsaking(金币+1):感谢回答 2010-12-01 14:43:47
sxjsn1(金币+2):最后的2金币了 非常感谢~~~ 2010-12-01 15:47:32
引用回帖:
Originally posted by sxjsn1 at 2010-12-01 09:32:49:

谢谢您的帮助 我想问一下,我的单机双核的不用使用节点吧  我对这方面是个小白。。。
我运行mpd对不对啊? 还有 像我前面说的, 没有runningon 2 nodes这行,我那算不算已经并行运算了啊?

mpd &就可以了
运行中,直接top看一下有没有两个vasp的进程最直接了。
21楼2010-12-01 13:53:27
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sxjsn1

金虫 (小有名气)


引用回帖:
Originally posted by dirtor at 2010-12-01 13:53:27:


mpd &就可以了
运行中,直接top看一下有没有两个vasp的进程最直接了。

看了下 有两个vasp进程  用vasp命令的话就一个进程
确定并行了马? 还是不太保险 哈哈
非常感谢哈
22楼2010-12-01 15:46:39
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
sunyang1988(金币+1):谢谢交流 2010-12-01 23:22:00
引用回帖:
Originally posted by sxjsn1 at 2010-12-01 15:46:39:

看了下 有两个vasp进程  用vasp命令的话就一个进程
确定并行了马? 还是不太保险 哈哈
非常感谢哈

两个进程的话,应该是并行了~~
23楼2010-12-01 15:48:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sxjsn1

金虫 (小有名气)


引用回帖:
Originally posted by ellsaking at 2010-12-01 15:48:38:

两个进程的话,应该是并行了~~

每个结果出现2次,感觉像每个核独立计算同一个东西,两核之间不通信似的,不像2个核合作运行。。。
24楼2010-12-01 15:50:49
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dirtor

木虫 (正式写手)


★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
ellsaking(金币+1):好主意 2010-12-01 23:08:00
sxjsn1(金币+3): 2010-12-02 15:14:42
引用回帖:
Originally posted by sxjsn1 at 2010-12-01 15:50:49:

每个结果出现2次,感觉像每个核独立计算同一个东西,两核之间不通信似的,不像2个核合作运行。。。

kill其中一个进程,如果是并行,另一个也会终止。
25楼2010-12-01 22:17:28
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sxjsn1

金虫 (小有名气)


引用回帖:
Originally posted by dirtor at 2010-12-01 22:17:28:



kill其中一个进程,如果是并行,另一个也会终止。

呃 悲剧发生了 kill掉一个 另一个继续运行。。。
26楼2010-12-02 15:13:09
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 sxjsn1 的主题更新
普通表情 高级回复(可上传附件)
信息提示
请填处理意见