24小时热门版块排行榜    

CyRhmU.jpeg
查看: 3240  |  回复: 15

thelrgbird

金虫 (小有名气)

[求助] 算DOS时出错

请求各位高手帮助:
本人在计算DOS的时候出错,而且出错出的很让人恼火……
其中的log文件时这样的:

Job started at:  Tue Oct 4 19:50:21 CST 2011
yhrun: error: cn180: task 12: Killed
yhrun: error: cn179: task 0: Killed
yhrun: error: cn179: task 11: Killed
yhrun: error: cn181: task 24: Killed
yhrun: error: cn180: task 23: Killed
yhrun: error: cn181: task 35: Killed
yhrun: error: cn180: task 22: Killed
yhrun: error: cn179: task 10: Killed
yhrun: error: cn179: task 1: Killed
yhrun: error: cn181: task 25: Killed
yhrun: error: cn180: task 13: Killed
yhrun: error: cn179: task 8: Killed
yhrun: error: cn181: task 34: Killed
yhrun: error: cn180: task 21: Killed
yhrun: error: cn179: task 2: Killed
yhrun: error: cn181: task 28: Killed
yhrun: error: cn180: task 15: Killed
yhrun: error: cn181: task 27: Killed
yhrun: error: cn179: task 3: Killed
yhrun: error: cn180: task 17: Killed
yhrun: error: cn181: task 29: Killed
yhrun: error: cn179: task 4: Killed
yhrun: error: cn180: task 18: Killed
yhrun: error: cn179: task 5: Killed
yhrun: error: cn181: task 30: Killed
yhrun: First task exited 60s ago
yhrun: tasks 6-7,9,14,16,19-20,26,31-33: running
yhrun: tasks 0-5,8,10-13,15,17-18,21-25,27-30,34-35: exited abnormally
yhrun: Terminating job step 22332.0
yhrun: Job step aborted: Waiting up to 2 seconds for job step to finish.
slurmd[cn179]: *** STEP 22332.0 KILLED AT 2011-10-04T19:51:53 WITH SIGNAL 9 ***
slurmd[cn179]: *** STEP 22332.0 KILLED AT 2011-10-04T19:51:53 WITH SIGNAL 9 ***
slurmd[cn181]: *** STEP 22332.0 KILLED AT 2011-10-04T19:51:53 WITH SIGNAL 9 ***
slurmd[cn181]: *** STEP 22332.0 KILLED AT 2011-10-04T19:51:53 WITH SIGNAL 9 ***
slurmd[cn180]: *** STEP 22332.0 KILLED AT 2011-10-04T19:51:53 WITH SIGNAL 9 ***
slurmd[cn180]: *** STEP 22332.0 KILLED AT 2011-10-04T19:51:53 WITH SIGNAL 9 ***
Job finished at:  Tue Oct 4 19:51:54 CST 2011

我用的是天河1A大系统机型运算的,不知道有没有人在这上面进行计算也出现了类似的错误,很郁闷阿……

我的KPOINTS 设为15 * 15 * 15的
INCAR为:

SYSTEM=Ni2P
  Startparameter for this run:
    NWRITE =      2    write-flag & timer
    PREC   =   high
    ISTART =      1    job   : 0-new  1-cont  2-samecut
    ICHARG =      11   charge: 1-file 2-atom 10-const
    ISPIN  =      2    spin polarized calculation?
    INIWAV =      1    electr: 0-lowe 1-rand  2-diag
    VOSKOWN =     0    pp: 0-PBE 1-PW91

  Electronic Relaxation 1
    ENCUT  =     400   run the run_encut.sh, found a good velue
    NELM   =     200;   NELMIN= 8; NELMDL= 8     # of ELM steps
    EDIFF  =  1E-05   stopping-criterion for ELM
    LREAL  =      A    real-space projection

  Ionic relaxation
    NFREE  =      10
    IWAVPR =     11    prediction:  0-non 1-charg 2-wave 3-comb
    LCORR  =      T    Harris-Foulkes like correction to forces
    POTIM  =   0.50    time-step for ionic-motion
    NBLOCK =      1

  DOS related values:
    ISMEAR =     1;   SIGMA  =   0.20  broadening in eV -4-tet -1-fermi 0-gau    s
    EMIN   = -10.00;   EMAX   =  10.00     NEDOS = 3000

  Electronic relaxation 2 (details)
    IALGO  =     48    algorithm
    ALGO   =     Fast
    LDIAG  =      T    sub-space diagonalisation

  Parallelisation Sets:
     LPLANE =     .F
     NPAR   =     36
     NSIM   =     4

  Write flags
    LWAVE  =      .F
    LCHARG =      .F
    LAECHG =      .F
    LELF   =      .F
    LORBIT =      11

麻烦大家看一下,错误在哪里呢?
另:我用同样的INCAR以及KPOINTS算的其他的此体系的近似体系都是没有错误的,然而就是这个出现了错误,在此任务计算之前,已经做过了结构优化以及静态计算,全部都算完了,没有什么问题……
再另:天河一号的工作人员告诉我是这些所涉及的节点可能出现了问题,但是,我算的时候提交过好多别的节点了,也都出错了,难道我提交的几乎所有的节点都坏了吗……郁闷阿……

我的脚本是:
#! /bin/bash

export LD_LIBRARY_PATH=/vol-th/lib:/vol-th/lib/mklem64t/:$LD_LIBRARY_PATH

echo "Job started at: " `date`
yhrun -p TH_NET -n 36 ./vasp > ./out
echo "Job finished at: " `date`


所产生的out文件是:

running on   36 nodes
distr:  one band on    1 nodes,   36 groups
vasp.4.6.36 17Feb09 complex
POSCAR found :  2 types and   71 ions
LDA part: xc-table for Pade appr. of Perdew
WARNING: stress and forces are not correct
POSCAR, INCAR and KPOINTS ok, starting setup
回复此楼

» 收录本帖的淘帖专辑推荐

vasp编译问题集锦

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

uuv2010

荣誉版主 (职业作家)

优秀版主

【答案】应助回帖


zzy870720z(金币+1): 鼓励交流 2011-10-07 10:59:37
thelrgbird(金币+1): 谢谢交流~ 虽然还是没有解决问题…… 2011-10-09 10:39:04
设置没问题,可能是服务器出问题了,让管理员检查一下服务器吧
2楼2011-10-06 11:38:59
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

thelrgbird

金虫 (小有名气)

引用回帖:
2楼: Originally posted by uuv2010 at 2011-10-06 11:38:59:
设置没问题,可能是服务器出问题了,让管理员检查一下服务器吧

我觉得也是服务器的问题…… 但是天河一号那么大的组织不会那么多节点都出错了吧…… 哎…… 虽然我抱有的怀疑与你是相同的……
3楼2011-10-06 15:28:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

liuhuimeiwoo

金虫 (小有名气)

【答案】应助回帖


zzy870720z(金币+1): 鼓励交流 2011-10-07 10:59:44
我不知道错在哪里 但是仅仅对你的ISMEAR感到疑惑 为什么还是1呢 不应该是-5?
paper我要好多好的的paper
4楼2011-10-06 20:24:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

thelrgbird

金虫 (小有名气)

引用回帖:
4楼: Originally posted by liuhuimeiwoo at 2011-10-06 20:24:40:
我不知道错在哪里 但是仅仅对你的ISMEAR感到疑惑 为什么还是1呢 不应该是-5?

手册上说,算金属体系的推荐使用1或2,算绝缘体、半导体的推荐使用-5,所以这样
5楼2011-10-06 21:11:57
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

liuhuimeiwoo

金虫 (小有名气)

【答案】应助回帖


uuv2010(金币+1): 多谢提示 2011-10-23 16:38:26
你取那么大的拖尾宽度 会不准的
paper我要好多好的的paper
6楼2011-10-07 08:55:39
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

thelrgbird

金虫 (小有名气)

引用回帖:
6楼: Originally posted by liuhuimeiwoo at 2011-10-07 08:55:39:
你取那么大的拖尾宽度 会不准的

拖尾宽度?这是什么啊?不好意思啊,我刚刚入门,对这些不大了解……求指教
7楼2011-10-07 14:08:59
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

liuhuimeiwoo

金虫 (小有名气)

【答案】应助回帖


uuv2010(金币+1): 多谢提示 2011-10-08 13:06:14
thelrgbird(金币+4): 谢谢交流~ 虽然还是没有解决问题…… 2011-10-09 10:38:56
SIGMA  =   0.20  
这个SIGMA差不多可以理解为值取得越大 误差就越大
paper我要好多好的的paper
8楼2011-10-07 19:53:47
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

thelrgbird

金虫 (小有名气)

引用回帖:
8楼: Originally posted by liuhuimeiwoo at 2011-10-07 19:53:47:
SIGMA  =   0.20  
这个SIGMA差不多可以理解为值取得越大 误差就越大

这个值也是手册里面推荐的值啊…… 那应该怎么筛选sigma值呢?我记得侯老师有sigma值的筛选过程,但是其中的熵值是越小越好吧,但是面对正值的最小值和负值的最大值中该作何取舍呢?是绝对值最小的吗?
9楼2011-10-08 00:00:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hnuzhoulin

金虫 (小有名气)


uuv2010(金币+1): 欢迎参加交流 2011-10-22 20:43:57
诶,作为一个也用天河算vasp的人,我跟你说,这是天河服务器网络问题。
10楼2011-10-21 20:42:05
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 thelrgbird 的主题更新
信息提示
请填处理意见