【求助】vasp运行过程中如何查看计算是否停止
如题,在vasp运行过程中,比如正在做优化,用bjobs显示任务正在running,可是有时会因为某些原因实际已经停止计算了,比如优化时如果已经跑过NSW步还没没有收敛的话就会停止计算,可是bjobs还是会显示running,请问在哪个文件中可以看出实际还在不在计算
[ Last edited by wuchenwf on 2009-6-21 at 21:07 ]
返回小木虫查看更多
今日热帖
如题,在vasp运行过程中,比如正在做优化,用bjobs显示任务正在running,可是有时会因为某些原因实际已经停止计算了,比如优化时如果已经跑过NSW步还没没有收敛的话就会停止计算,可是bjobs还是会显示running,请问在哪个文件中可以看出实际还在不在计算
[ Last edited by wuchenwf on 2009-6-21 at 21:07 ]
返回小木虫查看更多
隔断时间看看OSZICAR,看看不是在继续优化。这是一个笨办法。
top看时间是否还在继续
多谢指教,top查看这后发现我的用户名对应的time显示的是0:00,是不是意味着我的计算就停止了,可为什么上面的cpu显示为%0.3,这是什么意思,如果还占用cpu的话,那不是还在计算吗,不懂耶
一般是直接等到运行计算的节点上,使用Top命令,若cpu有使用,并且显示项为VASP,则说明计算仍在进行。。。
即使计算停止,cpu可能还不会显示为0(由于其他一些系统文件运行,不过占用量十分小),主要就看后面的运行项是不是vasp。。。
你看VASP进程的时间,如果不变,那就僵尸了......
你再VI一下输出文件,看有没有变化...
如果没变化就kill掉,重新提交作业,如果仍是这样,考虑如下两个问题。
系统进程也要占用CPU
---------------
1.如果系统不稳定,可能硬件有问题,多处在内存上,尤其多根内存时
2.如硬件没问题,查是否VASP编译优化过度了
我不知道你说的“直接等到运行计算的节点上,使用Top命令”是怎么用的,我是在任一路径下直接使用top命令,得到的结果我拷了部分放在下面,可否就这个例子说明下,给我科普下吧,呵呵
PID USER PRI NI SIZE RSS SHARE STAT %CPU %MEM TIME CPU COMMAND
13 root 15 0 0 0 0 SW 0.7 0.0 240:22 1 kscand/Normal
18635 root 15 0 0 0 0 SW 0.3 0.0 28:55 2 nfsd
18636 root 15 0 0 0 0 SW 0.3 0.0 27:45 0 nfsd
23022 root 0 -20 784 572 440 S < 0.1 0.0 30:47 2 lim
7446 gaoqiang 15 0 1944 1884 1560 S 0.1 0.0 0:00 0 sshd
7626 gaoqiang 15 0 1076 1076 792 R 0.1 0.0 0:00 3 top
1 root 15 0 104 80 56 S 0.0 0.0 1:40 1 init
2 root RT 0 0 0 0 SW 0.0 0.0 0:00 0 migration/0
3 root RT 0 0 0 0 SW 0.0 0.0 0:00 1 migration/1
4 root RT 0 0 0 0 SW 0.0 0.0 0:00 2 migration/2
5 root RT 0 0 0 0 SW 0.0 0.0 0:00 3 migration/3
6 root 15 0 0 0 0 SW 0.0 0.0 0:22 0 keventd
7 root 34 19 0 0 0 SWN 0.0 0.0 0:27 0 ksoftirqd_CPU0
8 root 34 19 0 0 0 SWN 0.0 0.0 0:02 1 ksoftirqd_CPU1
9 root 34 19 0 0 0 SWN 0.0 0.0 0:01 2 ksoftirqd_CPU2
10 root 34 19 0 0 0 SWN 0.0 0.0 0:02 3 ksoftirqd_CPU3
15 root 15 0 0 0 0 SW 0.0 0.0 0:04 1 bdflush
11 root 15 0 0 0 0 SW 0.0 0.0 103:53 2 kswapd
12 root 15 0 0 0 0 SW 0.0 0.0 0:34 3 kscand/DMA
14 root 16 0 0 0 0 SW 0.0 0.0 340:19 0 kscand/HighMem
16 root 15 0 0 0 0 SW 0.0 0.0 1:34 2 kupdated
17 root 24 0 0 0 0 SW 0.0 0.0 0:00 0 mdrecoveryd
26 root 15 0 0 0 0 SW 0.0 0.0 3:46 2 kjournald
84 root 25 0 0 0 0 SW 0.0 0.0 0:00 1 khubd
701 root 15 0 0 0 0 SW 0.0 0.0 4:33 1 kjournald
704 root 15 0 0 0 0 SW 0.0 0.0 16:07 3 kjournald
1585 root 15 0 308 304 232 S 0.0 0.0 0:20 0 syslogd
1589 root 15 0 52 4 0 S 0.0 0.0 0:00 2 klogd
1626 rpcuser 15 0 80 0 0 SW 0.0 0.0 0:00 3 rpc.statd
1687 root 15 0 0 0 0 SW 0.0 0.0 14:15 1 rpciod
1688 root 24 0 0 0 0 SW 0.0 0.0 0:00 2 lockd
1730 root 25 0,
多谢hakuna的指导,说的很清楚了,我现在想问的是你说的优化过度指的是什么,如果出现这种情况我要怎么改呢,这个是INCAR的设置问题吗