24小时热门版块排行榜    

查看: 1740  |  回复: 25

yjcmwgk

禁虫 (文坛精英)

密度泛函·小卒

优秀版主

[交流] 【求助】向各位高手请教一个奇怪的问题 已有10人参与

各位高手你们好:

我有一台服务器,完全归我用,别人肯定不会给我的数据造成破坏,不论是计算文件还是tmp文件。
但是我现在计算一个com文件,屡次出现这种情况:没有任何错误提示,在完全正常的运行情况下,突然自己断掉。
看看log文件的结尾,是很正常的运行状态
看看top,Gauss进程却已经消失
近来多次出现这种情况。如果是硬盘不足,或者scf不收敛,那肯定有错误提示啊。现在却一点错误提示都没有。

比如这次:这是一个td计算
文件最后出现了这样的字符
CISAX:  IP=  8 NPass=   1 NMax=  42.
CISAX will form  42 AO SS matrices at one time.
NMat= 42 NSing= 42.
这些字符是很正常的,高斯告诉我即将进行下一次迭代,然后,任务就断掉了。
诡异的很……请问各位高手,这会是什么问题呢?怎么解决呢?

电脑:8核心16G内存500G硬盘塔式服务器
系统:CentOS 4.0
软件:Gaussian03 D01版。为高斯专门建了一个用户,安装在这个用户中的软件只有高斯

大家觉得会是什么原因呢?谁帮我解决这个问题,我甘愿赠送一千金币给他。

非常感谢大家!谢谢

[ Last edited by yjcmwgk on 2010-6-23 at 15:49 ]
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

snoopyzhao

至尊木虫 (职业作家)


小木虫(金币+0.5):给个红包,谢谢回帖交流
你的任务是怎么交上去的啊?被系统杀掉的?
2楼2010-06-23 15:59:30
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

snoopyzhao

至尊木虫 (职业作家)


小木虫(金币+0.5):给个红包,谢谢回帖交流
不涉及保密的话,把输入文件贴上来测试一下吧。我的硬件环境与你差不多,呵呵……
3楼2010-06-23 16:00:27
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yjcmwgk

禁虫 (文坛精英)

密度泛函·小卒

优秀版主

引用回帖:
Originally posted by snoopyzhao at 2010-06-23 16:00:27:
不涉及保密的话,把输入文件贴上来测试一下吧。我的硬件环境与你差不多,呵呵……

额……如果我想保密,snoopyzhao大侠您会不会你鄙视我……
4楼2010-06-23 16:02:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

snoopyzhao

至尊木虫 (职业作家)


小木虫(金币+0.5):给个红包,谢谢回帖交流
引用回帖:
Originally posted by yjcmwgk at 2010-06-23 16:02:58:

额……如果我想保密,snoopyzhao大侠您会不会你鄙视我……

这很正常,因为 gaussian 输入文件中的确有太多的信息了,呵呵……
5楼2010-06-23 16:03:51
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

snoopyzhao

至尊木虫 (职业作家)

★ ★ ★ ★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
yjcmwgk(金币+5):非常感谢您!! 2010-06-23 16:08:54
你这样吧,登录到工作站后,开 screen,然后在 screen 环境下运行你的任务,不要交到后台。ctrl + a + d 退出 screen。退出登录。如果发现问题,登录,screen -r 恢复上次的 screen,看看有没有提示。
6楼2010-06-23 16:05:56
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yjcmwgk

禁虫 (文坛精英)

密度泛函·小卒

优秀版主

引用回帖:
Originally posted by snoopyzhao at 2010-06-23 15:59:30:
你的任务是怎么交上去的啊?被系统杀掉的?

我能提供给snoopyzhao大侠的信息是
我通过in文件来进行批处理提交任务(我毕竟太懒了,呵呵,自己专用的机器,居然还要批命令,我师兄嘲笑了我n次了)
我出现这种问题总是发生在用in文件提交批命令的时候
如果不用这种批命令提交方式的话,倒是没遇到过这种问题

这次出现问题的in文件内容如下
nohup g03 AAAA-td.com AAAA-td.log
rm /tmp/*.*
nohup g03 AAAB-td.com AAAB-td.log
rm /tmp/*.*
nohup g03 AABB-freq.com AABB-freq.log
rm /tmp/*.*

第二个计算任务(就是那个AAAB)莫名其妙的断掉之后,第三个任务随即开始了正常的运行……然后正常结束了

我提交批命令的方式是sh xxx.in &

非常感谢snoopyzhao

[ Last edited by yjcmwgk on 2010-6-23 at 16:10 ]
7楼2010-06-23 16:06:31
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

snoopyzhao

至尊木虫 (职业作家)

★ ★ ★ ★
yjcmwgk(金币+4):谢谢……会不会是nohup缓冲池的问题…… 2010-06-23 16:11:54
我一般借助于 screen 进行批处理,这样不需要 nohup....
8楼2010-06-23 16:09:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

snoopyzhao

至尊木虫 (职业作家)

★ ★ ★
yjcmwgk(金币+3):呵呵,那谢谢赵先生啦。我也开始接触screen吧,嗯,向赵先生学习! 2010-06-23 16:21:03
俺就没有用过 nohup,所以不清楚,俺最喜欢 screen 了
9楼2010-06-23 16:19:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

snoopyzhao

至尊木虫 (职业作家)

★ ★ ★ ★ ★
yjcmwgk(金币+5):谢谢 2010-06-23 16:27:05
如果你习惯了用 nohup,可以再仔细看一下 nohup 的 man page,当然,不同的 shell 可能会有不同的实现……

这里从网上搜了一个,你可以看看,对你有没有帮助:

nohup

No Hang Up. Run a command immune to hangups, runs the given command with hangup signals ignored, so that the command can continue running in the background after you log out.

SYNTAX
      nohup Command [Arg]...

`nohup' increases the scheduling priority of COMMAND by 5, this gives a slightly lower priority.

If standard output is a terminal, it and standard error are redirected so that they are appended to the file `nohup.out'; if that cannot be written to, they are appended to the file `$HOME/nohup.out'. If that cannot be written to, the command is not run.

If `nohup' creates either `nohup.out' or `$HOME/nohup.out', it creates it with no "group" or "other" access permissions. It does not change the permissions if the output file already existed.

`nohup' does not automatically put the command it runs in the background; you must do that explicitly, by ending the command line with an `&'.
10楼2010-06-23 16:24:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 yjcmwgk 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见