24小时热门版块排行榜    

CyRhmU.jpeg
查看: 906  |  回复: 8

huangyc

木虫 (正式写手)

[交流] 【求助】并行错误?

大家好
我的任务提交后,一个离子步下来出现如下错误:
1 F= -.25714837E+03 E0= -.25714532E+03  d E =-.257148E+03
rank 1 in job 1  localhost.localdomain_43175   caused collective abort of all ranks
  exit status of rank 1: killed by signal 11
rank 0 in job 1  localhost.localdomain_43175   caused collective abort of all ranks
  exit status of rank 0: killed by signal 9
google了一下,我没能解决。自己这方面水平不高,特请教版内各位如何解决,谢谢
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lono75

铁杆木虫 (著名写手)

★ ★
zzy870720z(金币+2):谢谢提示 2010-08-14 21:39:14
huangyc(金币+3):xiexie 2010-08-15 09:15:42
检查一下你的
1)MPI
2)fft3d
是否编译及设置正确
由天命,成人事!
2楼2010-08-14 18:45:15
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

huangyc

木虫 (正式写手)

引用回帖:
Originally posted by lono75 at 2010-08-14 18:45:15:
检查一下你的
1)MPI
2)fft3d
是否编译及设置正确

这个机器我一直没动过,前几天还能用,MPI和fft3d以及编译、环境等我都未动(如何检查?),而且调用别人的vasp也不行,而别人的帐号则可以正常使用
我新增一个用户,错误依旧

祝福舟曲!
3楼2010-08-15 09:15:09
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gleerat

木虫 (正式写手)

huangyc(金币+3):xiexie 2010-08-16 14:20:46
引用回帖:
Originally posted by huangyc at 2010-08-15 09:15:09:


这个机器我一直没动过,前几天还能用,MPI和fft3d以及编译、环境等我都未动(如何检查?),而且调用别人的vasp也不行,而别人的帐号则可以正常使用
我新增一个用户,错误依旧

祝福舟曲!

我以前也遇到过类似的问题,我们集群上的VASP我一直没动,之前别人用的时候没听说有什么毛病,到我的时候就出错了,后来有网友说是数学库、环境变量估计丢失了,我自己又重新设置了一次就好了。你可以试试,你的可执行文件应该没问题。
明察、慎思、笃行
4楼2010-08-15 10:49:57
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lono75

铁杆木虫 (著名写手)


zzy870720z(金币+1):谢谢提示 2010-08-15 12:50:36
huangyc(金币+2):再谢 2010-08-16 14:22:29
引用回帖:
Originally posted by huangyc at 2010-08-15 09:15:09:


这个机器我一直没动过,前几天还能用,MPI和fft3d以及编译、环境等我都未动(如何检查?),而且调用别人的vasp也不行,而别人的帐号则可以正常使用
我新增一个用户,错误依旧

祝福舟曲!

复制别的用户下的
/home/other usrname/.bashrc and .bash_profile
到你的用户名下
/home/your usrname
由天命,成人事!
5楼2010-08-15 11:04:09
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

huangyc

木虫 (正式写手)

引用回帖:
Originally posted by gleerat at 2010-08-15 10:49:57:

我以前也遇到过类似的问题,我们集群上的VASP我一直没动,之前别人用的时候没听说有什么毛病,到我的时候就出错了,后来有网友说是数学库、环境变量估计丢失了,我自己又重新设置了一次就好了。你可以试试,你的 ...

你讲的重新设置是什么意思?环境变量即是bashrc,bash_profile吧,数学库呢,不是在编译的时候指定了嘛,如何重新设置?

谢谢
6楼2010-08-16 14:22:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

huangyc

木虫 (正式写手)

引用回帖:
Originally posted by lono75 at 2010-08-15 11:04:09:

复制别的用户下的
/home/other usrname/.bashrc and .bash_profile
到你的用户名下
/home/your usrname

我试过了,还是不行。很怪,我是root用户交的作业,新增一个也不行,错误依旧
7楼2010-08-16 14:23:28
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gleerat

木虫 (正式写手)


zzy870720z(金币+1):谢谢交流 2010-08-16 17:27:18
huangyc(金币+2): 2010-08-17 10:28:35
引用回帖:
Originally posted by huangyc at 2010-08-16 14:22:12:


你讲的重新设置是什么意思?环境变量即是bashrc,bash_profile吧,数学库呢,不是在编译的时候指定了嘛,如何重新设置?

谢谢

是数学库和并行库的环境变量。我安装的时候是新建ld.so.conf文件的,没有设置.bashrc。你应该看看或者试试更新这两个文件中的一个。
不过,在我印象中,.bashrc好像应该是root账户下的。不知道对低权限账户的影响如何。

[ Last edited by gleerat on 2010-8-16 at 15:24 ]
明察、慎思、笃行
8楼2010-08-16 15:23:15
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

huangyc

木虫 (正式写手)

网上看到一些类似错误的原因,除正常可以想象的原因(如上述各位所说),也有是无法理解的,比如我这个
我把NSW改小或者改变IBRION即可正常并行
各位若有知道可以的原因,请告诉大家,谢过
9楼2010-08-17 10:28:01
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 huangyc 的主题更新
普通表情 高级回复(可上传附件)
信息提示
请填处理意见