24小时热门版块排行榜    

查看: 2618  |  回复: 17

Prettyswan

木虫 (小有名气)


[交流] 【求助成功】如何处理算不动的情况

我计算BaFe2As2体系的掺杂的结构驰豫,80个原子,5×5×5的kmesh,结果算不动了。由于以前算过CaFe2As2的80个原子的掺杂,结构跟这个是一样的、参数也一样,就直接拿过来用了,本来以为没有问题的但是发现算不动了(集群仍然会失去响应,并且把进程杀死)。我top了一下
引用回帖:
top - 20:33:26 up 28 days,  4:15,  1 user,  load average: 1.62, 1.14, 1.04
Tasks:  83 total,   6 running,  76 sleeping,   0 stopped,   1 zombie
Cpu(s): 77.3% us, 22.5% sy,  0.0% ni,  0.0% id,  0.0% wa,  0.0% hi,  0.2% si
Mem:   4040672k total,  3542632k used,   498040k free,    15588k buffers
Swap:  2096472k total,    69036k used,  2027436k free,    41792k cached

我以为是内存不够了(占用了将近90%),根据说明书的《6.68   Not enough memory, what to do》修改了INCAR
引用回帖:
System = BaFe2As2 afm1-DopSe:3.125%
PREC = Accurate
ISPIN = 2
MAGMOM = 16*0 16*3 16*-3 32*0
ISMEAR = 1
SIGMA = 0.20
ISTART = 0
EDIFF = 1E-5
EDIFFG = -1E-3
ICHARG = 2
ENCUT = 310
NSW = 60
IBRION = 2
ISIF = 3 #Full relaxtion
POTIM = 0.2
LORBIT = 11

LREAL = Auto
LPLANE = .TRUE.
LSCALU = .FALSE.
LCHARG = .FALSE. #连同的LWAVE和ISYM都是根据说明书上的设置的
LWAVE = .FALSE.
ISYM = 0
NPAR = 1
NSIM = 4

结果发现还是不行,却好像不是内存不够,但是集群仍然会失去响应,并且把进程杀死
引用回帖:
top - 20:58:46 up 28 days,  4:40,  1 user,  load average: 4.42, 8.11, 6.55
Tasks:  83 total,   6 running,  76 sleeping,   0 stopped,   1 zombie
Cpu(s): 83.1% us, 16.8% sy,  0.0% ni,  0.0% id,  0.0% wa,  0.0% hi,  0.1% si
Mem:   4040672k total,  2679192k used,  1361480k free,     3856k buffers
Swap:  2096472k total,   109684k used,  1986788k free,    41344k cached

请问大家是如何应对算不动的情况的呢?kpoints
引用回帖:
Automatic generation
0
Monhkorst-Pack
5 5 5
0.0 0.0 0.0

poscar
引用回帖:
System = BaFe2As2 dopGe 3.125%
   1.00000000000000
       5.615874999999996       0.000000000000002      12.942809999999996
      -5.615874999999998       0.000000000000000      12.942809999999996
       0.000000000000001     -11.142509999999998       0.000000000000002
   16   32   1   31
Direct
     -0.0000000000000000   0.2499999999999999  -0.0000000000000000
     -0.0000000000000000   0.2499999999999999   0.4999999999999999
      0.0000000000000000   0.7499999999999998  -0.0000000000000000
      0.0000000000000000   0.7499999999999998   0.4999999999999999
      0.4999999999999999   0.2499999999999999   0.0000000000000000
      0.4999999999999999   0.2500000000000000   0.4999999999999999
      0.4999999999999999   0.7499999999999999  -0.0000000000000000
      0.4999999999999998   0.7499999999999998   0.4999999999999999
      0.2499999999999999  -0.0000000000000000   0.2499999999999999
      0.2500000000000000  -0.0000000000000000   0.7499999999999999
      0.2499999999999999   0.4999999999999999   0.2499999999999999
      0.2499999999999999   0.4999999999999999   0.7499999999999999
      0.7499999999999999  -0.0000000000000000   0.2499999999999999
      0.7499999999999999   0.0000000000000001   0.7499999999999998
      0.7499999999999999   0.4999999999999998   0.2499999999999999
      0.7500000000000001   0.5000000000000001   0.7499999999999998
      0.0000000000000001   0.0000000000000000   0.1249999999999999
      0.0000000000000000   0.0000000000000000   0.6249999999999998
      0.0000000000000000   0.4999999999999999   0.1249999999999999
      0.0000000000000000   0.4999999999999998   0.6249999999999998
      0.5000000000000000  -0.0000000000000000   0.1249999999999999
      0.5000000000000000  -0.0000000000000001   0.6249999999999998
      0.4999999999999999   0.4999999999999999   0.1249999999999999
      0.0000000000000000  -0.0000000000000000   0.3749999999999999
     -0.0000000000000000   0.0000000000000000   0.8749999999999999
      0.0000000000000000   0.4999999999999999   0.3749999999999999
     -0.0000000000000000   0.4999999999999999   0.8749999999999999
      0.4999999999999999  -0.0000000000000000   0.3749999999999999
      0.4999999999999999  -0.0000000000000001   0.8749999999999998
      0.4999999999999998   0.4999999999999998   0.3749999999999999
      0.4999999999999999   0.4999999999999997   0.8749999999999998
      0.2499999999999999   0.2500000000000000   0.3749999999999999 #-3
      0.2500000000000000   0.2499999999999999   0.8749999999999997 #-3
      0.2500000000000000   0.7499999999999998   0.3749999999999999 #-3
      0.2500000000000000   0.7499999999999998   0.8749999999999997 #-3
      0.7499999999999999   0.2500000000000000   0.3749999999999999 #-3
      0.7499999999999999   0.2500000000000000   0.8750000000000000 #-3
      0.7499999999999998   0.7499999999999998   0.3749999999999999 #-3
      0.7499999999999999   0.7499999999999999   0.8750000000000000 #-3
      0.2500000000000000   0.2499999999999999   0.1249999999999999 #-3
      0.2499999999999999   0.2499999999999999   0.6249999999999998 #-3
      0.2499999999999999   0.7499999999999998   0.1249999999999999 #-3
      0.2499999999999999   0.7499999999999998   0.6249999999999998 #-3
      0.7499999999999998   0.2499999999999999   0.1249999999999999 #-3
      0.7499999999999999   0.2499999999999998   0.6249999999999998 #-3
      0.7500000000000000   0.7499999999999999   0.1249999999999999 #-3
      0.7499999999999999   0.7499999999999999   0.6249999999999998 #-3
      0.4999999999999999   0.4999999999999999   0.6249999999999998 #dopSe
      0.1770334988832470   0.4270334988832471  -0.0000000000000001
      0.1770334988832470   0.4270334988832472   0.4999999999999999
      0.1770334988832470   0.9270334988832469  -0.0000000000000001
      0.1770334988832471   0.9270334988832470   0.4999999999999999
      0.6770334988832470   0.4270334988832472  -0.0000000000000001
      0.6770334988832469   0.4270334988832471   0.4999999999999999
      0.6770334988832470   0.9270334988832470  -0.0000000000000001
      0.6770334988832468   0.9270334988832469   0.4999999999999999
      0.3229665011167530   0.0729665011167528  -0.0000000000000001
      0.3229665011167529   0.0729665011167528   0.4999999999999998
      0.3229665011167529   0.5729665011167526  -0.0000000000000001
      0.3229665011167529   0.5729665011167525   0.4999999999999998
      0.8229665011167527   0.0729665011167527  -0.0000000000000001
      0.8229665011167527   0.0729665011167527   0.4999999999999998
      0.8229665011167529   0.5729665011167527  -0.0000000000000001
      0.8229665011167527   0.5729665011167527   0.4999999999999998
      0.4270334988832472   0.1770334988832471   0.2500000000000000
      0.4270334988832472   0.1770334988832470   0.7499999999999999
      0.4270334988832472   0.6770334988832469   0.2500000000000000
      0.4270334988832471   0.6770334988832469   0.7499999999999999
      0.9270334988832472   0.1770334988832470   0.2500000000000000
      0.9270334988832470   0.1770334988832471   0.7500000000000000
      0.9270334988832472   0.6770334988832469   0.2500000000000000
      0.9270334988832472   0.6770334988832469   0.7500000000000000
      0.0729665011167528   0.3229665011167529   0.2500000000000001
      0.0729665011167528   0.3229665011167529   0.7500000000000000
      0.0729665011167527   0.8229665011167527   0.2500000000000001
      0.0729665011167527   0.8229665011167527   0.7500000000000000
      0.5729665011167527   0.3229665011167529   0.2500000000000001
      0.5729665011167527   0.3229665011167529   0.7500000000000001
      0.5729665011167527   0.8229665011167527   0.2500000000000001
      0.5729665011167529   0.8229665011167527   0.7500000000000001

[ Last edited by Prettyswan on 2010-11-16 at 17:45 ]
回复此楼

» 本帖已获得的红花(最新10朵)

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

» 抢金币啦!回帖就可以得到:

查看全部散金贴

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hedaors

禁虫 (正式写手)


★ ★
cenwanglai(金币+2):谢谢回复! 2010-11-10 23:08:21
Prettyswan(金币+2): 2010-11-11 15:06:46
Ba 的原子要比 Ca 的多很多,内存就可能不够。
这个在要求精度不变的情况下,只能牺牲速度,你用的是几个核心?你只用一个核心提交任务试试,应该没问题。
2楼2010-11-10 22:55:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bingmou

金虫 (著名写手)



sunyang1988(金币+1):谢谢交流 2010-11-10 23:50:22
Prettyswan(金币+1): 2010-11-11 15:08:09
对于80个原子这么多的体系,我的建议是K点取为1 1 1就可以了
3楼2010-11-10 23:42:35
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Prettyswan

木虫 (小有名气)


引用回帖:
Originally posted by bingmou at 2010-11-10 23:42:35:
对于80个原子这么多的体系,我的建议是K点取为1 1 1就可以了

对于Monhkorst-Pack来说,它的最小k点为4,我使用3 3 3的kmesh都会提示出错。要想使用1 1 1就不能使用Monhkorst-Pack,要使用Gamma了。
4楼2010-11-11 08:21:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Prettyswan

木虫 (小有名气)


引用回帖:
Originally posted by hedaors at 2010-11-10 22:55:58:
Ba 的原子要比 Ca 的多很多,内存就可能不够。
这个在要求精度不变的情况下,只能牺牲速度,你用的是几个核心?你只用一个核心提交任务试试,应该没问题。

我使用的集群是四核的,我使用了4个进程。
5楼2010-11-11 08:21:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Prettyswan

木虫 (小有名气)


引用回帖:
Originally posted by hedaors at 2010-11-10 22:55:58:
Ba 的原子要比 Ca 的多很多,内存就可能不够。
这个在要求精度不变的情况下,只能牺牲速度,你用的是几个核心?你只用一个核心提交任务试试,应该没问题。

我使用两个进程提交任务,提示虚拟内存不足;使用了一个进程进行计算,发现计算会很快退出并提示段错误,不管是并行(使用IFC)还是串行(使用gfortran)
引用回帖:
running on    1 nodes
distr:  one band on    1 nodes,    1 groups
vasp.4.6.28 25Jul05 complex
POSCAR found :  4 types and   80 ions
LDA part: xc-table for Pade appr. of Perdew
POSCAR, INCAR and KPOINTS ok, starting setup
WARNING: wrap around errors must be expected
[node11:02919] *** Process received signal ***
[node11:02919] Signal: Segmentation fault (11)
[node11:02919] Signal code: Address not mapped (1)
[node11:02919] Failing at address: 0x351761ab8
[node11:02919] [ 0] /lib64/tls/libpthread.so.0 [0x317210c430]
[node11:02919] [ 1] /home/software/openmpi-1.2.2-intel9/lib/libopen-pal.so.0 [0x2a966ea7f0]
[node11:02919] [ 2] /home/software/openmpi-1.2.2-intel9/lib/libopen-pal.so.0(_int_malloc+0x627) [0x2a966ea07f]
[node11:02919] [ 3] /home/software/openmpi-1.2.2-intel9/lib/libopen-pal.so.0(malloc+0x67) [0x2a966e93bf]
[node11:02919] [ 4] /home/bin/vasp.openmpi(for_allocate+0x89) [0x699c01]
[node11:02919] [ 5] /home/bin/vasp.openmpi(wave_mp_allocw_+0x2c7) [0x4a9977]
[node11:02919] [ 6] /home/bin/vasp.openmpi(MAIN__+0x1504d) [0x428b8d]
[node11:02919] [ 7] /home/bin/vasp.openmpi(main+0x32) [0x413b2a]
[node11:02919] [ 8] /lib64/tls/libc.so.6(__libc_start_main+0xdb) [0x317161c3fb]
[node11:02919] [ 9] /home/bin/vasp.openmpi [0x413a6a]
[node11:02919] *** End of error message ***
mpirun noticed that job rank 0 with PID 2919 on node node11 exited on signal 11 (Segmentation fault).

6楼2010-11-11 08:59:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

calos818

木虫 (著名写手)



youzhizhe(金币+1):谢谢交流. 2010-11-11 09:59:07
Prettyswan(金币+1): 2010-11-11 15:07:06
机器能力有限,减少K点
7楼2010-11-11 09:42:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

harrymia

禁虫 (小有名气)


youzhizhe(金币+1):谢谢交流。 2010-11-11 09:59:24
本帖内容被屏蔽

8楼2010-11-11 09:47:20
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

youzhizhe(金币+1):谢谢交流。 2010-11-11 11:06:30
Prettyswan(金币+2): 2010-11-11 15:08:36
此体系是金属性的,即使是80个原子以上的超原胞,用单k点是不足的。最好是增加使用的cpu个数或节点数。
9楼2010-11-11 10:08:47
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Prettyswan

木虫 (小有名气)


引用回帖:
Originally posted by harrymia at 2010-11-11 09:47:20:




最小不是4吧,我算的128个原子的体系,用的3 3 3的没有出错啊。

Monhkorst-Pack的不可约的k点最小值是4,但是由于布里渊区的不同kmesh的最小值会有所不同。我这个最小的kmesh是4 4 4(这个时候才有12个不可约k点),用3 3 3的kmesh报错了。
10楼2010-11-11 11:08:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bingmou

金虫 (著名写手)


Prettyswan(金币+2): 2010-11-11 15:07:17
引用回帖:
Originally posted by Prettyswan at 2010-11-11 11:08:17:

Monhkorst-Pack的不可约的k点最小值是4,但是由于布里渊区的不同kmesh的最小值会有所不同。我这个最小的kmesh是4 4 4(这个时候才有12个不可约k点),用3 3 3的kmesh报错了。

我大体系常年用的都是MP 1 1 1也不见报错,而且其实就是Gamma点而已。
不过你这个体系是金属性,不是半导体,的确不能缩小为1 1 1.
4核太少了,这么大的我一般都是2nodes,16CPUs
11楼2010-11-11 11:16:10
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Prettyswan

木虫 (小有名气)


引用回帖:
Originally posted by calos818 at 2010-11-11 09:42:53:
机器能力有限,减少K点

根据
引用回帖:
Originally posted by hedaors at 2010-11-10 22:55:58:
Ba 的原子要比 Ca 的多很多,内存就可能不够。
这个在要求精度不变的情况下,只能牺牲速度,你用的是几个核心?你只用一个核心提交任务试试,应该没问题。

的启示,我减小了kmesh为4 4 4,encut为300,但是集群现在的提示变成了forrtl: severe (41): insufficient virtual memory,看来这个任务真的没法在现有的环境下计算了。
12楼2010-11-11 11:27:31
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Prettyswan

木虫 (小有名气)


引用回帖:
Originally posted by bingmou at 2010-11-11 11:16:10:

我大体系常年用的都是MP 1 1 1也不见报错,而且其实就是Gamma点而已。
不过你这个体系是金属性,不是半导体,的确不能缩小为1 1 1.
4核太少了,这么大的我一般都是2nodes,16CPUs

我减小了kmesh为4 4 4,encut为300,但是集群现在的提示变成了forrtl: severe (41): insufficient virtual memory,看来这个任务真的没法在现有的环境下计算了。
我现在的集群是每个节点四核(4  Intel(R) Xeon(R) CPU  5130  @ 2.00GHz),4GB内存,确实太小了。

[ Last edited by Prettyswan on 2010-11-11 at 11:34 ]
13楼2010-11-11 11:32:39
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bingmou

金虫 (著名写手)


Prettyswan(金币+2): 2010-11-11 15:07:26
算金属比算半导体和绝缘体要难得多
14楼2010-11-11 13:55:59
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gleerat

木虫 (正式写手)



小木虫(金币+0.5):给个红包,谢谢回帖交流
引用回帖:
Originally posted by bingmou at 2010-11-11 13:55:59:
算金属比算半导体和绝缘体要难得多

既然计算金属的话用的资源要求很多,那么在资源不够用的话,能不能限制计算的占用的资源(不仅仅是减少并行的进程数)以达到减慢速度而继续计算呢?(比如说限制内存的使用量等)。
15楼2010-11-13 17:30:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bingmou

金虫 (著名写手)


★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
sunyang1988(金币+1):谢谢交流 2010-11-13 23:50:52
不能,你能睡觉的时候今天睡下半身明天睡上半身吗?这些计算数据是要一起计算的
16楼2010-11-13 19:39:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

anatta1

铁杆木虫 (正式写手)



小木虫: 金币+0.5, 给个红包,谢谢回帖
送红花一朵
l楼主优化得到的BaFe2As2的磁矩是多大???
17楼2013-11-17 21:59:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

anatta1

铁杆木虫 (正式写手)



小木虫: 金币+0.5, 给个红包,谢谢回帖
楼主优化BaFe2As2时候得到的Fe的磁矩多大?
18楼2013-11-17 22:01:10
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 Prettyswan 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见