24小时热门版块排行榜    

查看: 957  |  回复: 3

aylixmut

铜虫 (小有名气)

[求助] 集群上计算任务刚开始跑就kill退出是啥回事啊

前一段时间都计算好好的。
提示错误是:
Tue Jul 31 16:36:12 CST 2012
running on    8 nodes
distr:  one band on    1 nodes,    8 groups
vasp.5.2.12 26May11 complex
POSCAR found type information on POSCAR  Fe F
POSCAR found :  2 types and      24 ions
LDA part: xc-table for Pade appr. of Perdew
POSCAR, INCAR and KPOINTS ok, starting setup
FFT: planning ...(           1 )
WAVECAR not read
WARNING: random wavefunctions but no delay for mixing, default for NELMDL
entering main loop
       N       E                     dE             d eps       ncg     rms          rms(c)
mpiexec: Warning: tasks 0-7 died with signal 11 (Segmentation fault).
Tue Jul 31 16:36:22 CST 2012
我反复检查了输入文件,在单机上运行是可以,不知道这是系统的原因,还是vasp输入文件的原因。帮忙看看啊!有点莫名其妙哦!
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

04nylxb

木虫 (正式写手)

【答案】应助回帖

★ ★
感谢参与,应助指数 +1
franch: 金币+2, 谢谢回帖交流。 2012-08-01 22:57:42
明显mpi有问题啊,不是提示了吗?
先测试下mpi跨节点是否OK了
集中精力发文章
2楼2012-08-01 21:47:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

aylixmut

铜虫 (小有名气)

引用回帖:
2楼: Originally posted by 04nylxb at 2012-08-01 21:47:33
明显mpi有问题啊,不是提示了吗?
先测试下mpi跨节点是否OK了

谢谢回复,具体怎么跨节点测试呢?
网络上查,mpiexec提示错误,不一定就是mpi 错误,可能是输入文件错误哦。
3楼2012-08-02 08:43:20
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

04nylxb

木虫 (正式写手)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★
franch: 金币+2, 谢谢回帖交流。 2012-08-02 23:39:33
aylixmut: 金币+5, 有帮助 2012-08-10 10:06:38
引用回帖:
3楼: Originally posted by aylixmut at 2012-08-02 08:43:20
谢谢回复,具体怎么跨节点测试呢?
网络上查,mpiexec提示错误,不一定就是mpi 错误,可能是输入文件错误哦。...

………………
mpi都没测试过
mpiexec -np xx(想要测试几个节点,就把节点乘以核数) 后面放mpi编程的程序(mpich2有自带的example,先编译,成可执行文件,再跑就好了)
集中精力发文章
4楼2012-08-02 22:48:35
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 aylixmut 的主题更新
信息提示
请填处理意见