24小时热门版块排行榜    

查看: 3471  |  回复: 25
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

weiyidan

新虫 (小有名气)

[求助] HSE天河2号运算出错,卡在了entering main looping 已有3人参与

在天河2号计算HSE出现错误,版本为5.3.2,用96核计算32个原子,错误如下
entering main loop
       N       E                     dE             d eps       ncg     rms          ort
yhrun: Job step aborted: Waiting up to 2 seconds for job step to finish.
yhrun: got SIGCONT
slurmd[cn10454]: *** STEP 3817928.0 CANCELLED AT 2016-12-10T15:14:10 ***
slurmd[cn10454]: *** JOB 3817928 CANCELLED AT 2016-12-10T15:14:10 ***
yhrun: forcing job termination
forrtl: error (78): process killed (SIGTERM)
Image              PC                Routine            Line        Source            
vasp               0000000000B72CE9  Unknown               Unknown  Unknown
vasp               0000000000B715BE  Unknown               Unknown  Unknown
vasp               0000000000B18C22  Unknown               Unknown  Unknown
vasp               0000000000AC65C3  Unknown               Unknown  Unknown
vasp               0000000000ACC269  Unknown               Unknown  Unknown
libpthread.so.0    000000392220F710  Unknown               Unknown  Unknown
vasp               00000000007A7AAE  Unknown               Unknown  Unknown
vasp               00000000007A0051  Unknown               Unknown  Unknown
vasp               00000000008B1ACC  Unknown               Unknown  Unknown
vasp               00000000008C3F38  Unknown               Unknown  Unknown
vasp               0000000000440BD3  Unknown               Unknown  Unknown
forrtl: error (78): process killed (SIGTERM)
Image              PC                Routine            Line        Source            
vasp               0000000000B72CE9  Unknown               Unknown  Unknown
vasp               0000000000B715BE  Unknown               Unknown  Unknown
vasp               0000000000B18C22  Unknown               Unknown  Unknown
vasp               0000000000AC65C3  Unknown               Unknown  Unknown
vasp               0000000000ACC269  Unknown               Unknown  Unknown
libpthread.so.0    000000392220F710  Unknown               Unknown  Unknown
vasp               00000000007A7AAE  Unknown               Unknown  Unknown
vasp               00000000007A0051  Unknown               Unknown  Unknown
vasp               00000000008B1ACC  Unknown               Unknown  Unknown
vasp               00000000008C3F38  Unknown               Unknown  Unknown
vasp               0000000000440BD3  Unknown               Unknown  Unknown
vasp               000000000041A2A6  Unknown               Unknown  Unknown
libc.so.6          0000003921A1ED1D  Unknown               Unknown  Unknown
vasp               000000000041A199  Unknown               Unknown  Unknown
forrtl: error (78): process killed (SIGTERM)
Image              PC                Routine            Line        Source            
vasp               0000000000B72CE9  Unknown               Unknown  Unknown
vasp               0000000000B715BE  Unknown               Unknown  Unknown
vasp               0000000000B18C22  Unknown               Unknown  Unknown
vasp               0000000000AC65C3  Unknown               Unknown  Unknown
vasp               0000000000ACC269  Unknown               Unknown  Unknown
libpthread.so.0    000000392220F710  Unknown               Unknown  Unknown
vasp               00000000007A7AAE  Unknown               Unknown  Unknown
vasp               00000000007A0051  Unknown               Unknown  Unknown
vasp               00000000008B1ACC  Unknown               Unknown  Unknown
vasp               00000000008C3F38  Unknown               Unknown  Unknown
vasp               0000000000440BD3  Unknown               Unknown  Unknown
forrtl: error (78): process killed (SIGTERM)
Image              PC                Routine            Line        Source            
vasp               0000000000B72CE9  Unknown               Unknown  Unknown
vasp               0000000000B715BE  Unknown               Unknown  Unknown
vasp               0000000000B18C22  Unknown               Unknown  Unknown
vasp               0000000000AC65C3  Unknown               Unknown  Unknown
vasp               0000000000ACC269  Unknown               Unknown  Unknown
libpthread.so.0    000000392220F710  Unknown               Unknown  Unknown
vasp               0000000000551745  Unknown               Unknown  Unknown
vasp               00000000007A0179  Unknown               Unknown  Unknown
vasp               00000000008B1ACC  Unknown               Unknown  Unknown
vasp               00000000008C3F38  Unknown               Unknown  Unknown
vasp               0000000000440BD3  Unknown               Unknown  Unknown
vasp               000000000041A2A6  Unknown               Unknown  Unknown
libc.so.6          0000003921A1ED1D  Unknown               Unknown  Unknown
vasp               000000000041A199  Unknown               Unknown  Unknown
vasp               000000000041A2A6  Unknown               Unknown  Unknown
libc.so.6          0000003921A1ED1D  Unknown               Unknown  Unknown
vasp               000000000041A199  Unknown               Unknown  Unknown
vasp               000000000041A2A6  Unknown               Unknown  Unknown
libc.so.6          0000003921A1ED1D  Unknown               Unknown  Unknown
vasp               000000000041A199  Unknown               Unknown  Unknown
yhrun: error: cn10455: task 1: Exited with exit code 1

INCAR如下

SYSTEM = Si-Diamond
ISTART = 1
ICHARG = 2
EDIFF = 0.00001
EDIFFG = -0.001
ENCUT = 550
ENAUG = 800
LREAL = .TRUE.
LWAVE = .TRUE.
LCHARG = .TRUE.
NELM = 200
NSW = 0
IBRION = -1
LMAXMIX = 4
ISMEAR = 0
SIGMA = 0.1
NSIM = 4
IALGO = 48
ISYM = 0
LHFCALC = .TRUE.
HFSCREEN = 0.2
ALGO = Damped
TIME = 0.4
ENCUTFOCK = L
AEXX = 0.25
ISIF = 2
LORBIT = 11


另外谁有模拟硅能带的好方法吗,麻烦给我推荐下
回复此楼

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

漫天飘雪

版主 (知名作家)

认真做事,踏实做人

引用回帖:
14楼: Originally posted by obaica at 2016-12-10 22:02:57
开什么玩笑…  一个HSE06让管理员开放管理员内存权限。

明明是参数和节点cpu设置不合理...

我有说让他减少精度算,另外参数和节点我也有提示,让他自己选择就可以了。再说让管理开个权限也不是啥大问题,我们组的服务器我就包可以的,怎么说也是上百核的小超算
http://blog.sciencenet.cn/u/pfliu89
15楼2016-12-10 22:15:59
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 26 个回答

weiyidan

新虫 (小有名气)

本人已经计算过2个原子的原胞,并没有提示错误
2楼2016-12-10 16:57:35
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

漫天飘雪

版主 (知名作家)

认真做事,踏实做人

应该内存不够用了吧
http://blog.sciencenet.cn/u/pfliu89
4楼2016-12-10 17:24:42
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

y1ding

铁杆木虫 (著名写手)

【答案】应助回帖

★ ★
感谢参与,应助指数 +1
weiyidan(漫天飘雪代发): 金币+2, 谢谢交流 2016-12-10 20:34:50
内存不够
天河一个节点才64G内存
你要加节点内存
5楼2016-12-10 17:58:59
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见