24小时热门版块排行榜    

Znn3bq.jpeg
查看: 2010  |  回复: 25
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

yjcmwgk

禁虫 (文坛精英)

密度泛函·小卒

优秀版主

[交流] 【求助】向各位高手请教一个奇怪的问题 已有10人参与

各位高手你们好:

我有一台服务器,完全归我用,别人肯定不会给我的数据造成破坏,不论是计算文件还是tmp文件。
但是我现在计算一个com文件,屡次出现这种情况:没有任何错误提示,在完全正常的运行情况下,突然自己断掉。
看看log文件的结尾,是很正常的运行状态
看看top,Gauss进程却已经消失
近来多次出现这种情况。如果是硬盘不足,或者scf不收敛,那肯定有错误提示啊。现在却一点错误提示都没有。

比如这次:这是一个td计算
文件最后出现了这样的字符
CISAX:  IP=  8 NPass=   1 NMax=  42.
CISAX will form  42 AO SS matrices at one time.
NMat= 42 NSing= 42.
这些字符是很正常的,高斯告诉我即将进行下一次迭代,然后,任务就断掉了。
诡异的很……请问各位高手,这会是什么问题呢?怎么解决呢?

电脑:8核心16G内存500G硬盘塔式服务器
系统:CentOS 4.0
软件:Gaussian03 D01版。为高斯专门建了一个用户,安装在这个用户中的软件只有高斯

大家觉得会是什么原因呢?谁帮我解决这个问题,我甘愿赠送一千金币给他。

非常感谢大家!谢谢

[ Last edited by yjcmwgk on 2010-6-23 at 15:49 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yjcmwgk

禁虫 (文坛精英)

密度泛函·小卒

优秀版主

引用回帖:
Originally posted by snoopyzhao at 2010-06-23 15:59:30:
你的任务是怎么交上去的啊?被系统杀掉的?

我能提供给snoopyzhao大侠的信息是
我通过in文件来进行批处理提交任务(我毕竟太懒了,呵呵,自己专用的机器,居然还要批命令,我师兄嘲笑了我n次了)
我出现这种问题总是发生在用in文件提交批命令的时候
如果不用这种批命令提交方式的话,倒是没遇到过这种问题

这次出现问题的in文件内容如下
nohup g03 AAAA-td.com AAAA-td.log
rm /tmp/*.*
nohup g03 AAAB-td.com AAAB-td.log
rm /tmp/*.*
nohup g03 AABB-freq.com AABB-freq.log
rm /tmp/*.*

第二个计算任务(就是那个AAAB)莫名其妙的断掉之后,第三个任务随即开始了正常的运行……然后正常结束了

我提交批命令的方式是sh xxx.in &

非常感谢snoopyzhao

[ Last edited by yjcmwgk on 2010-6-23 at 16:10 ]
7楼2010-06-23 16:06:31
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 26 个回答

snoopyzhao

至尊木虫 (职业作家)


小木虫(金币+0.5):给个红包,谢谢回帖交流
你的任务是怎么交上去的啊?被系统杀掉的?
2楼2010-06-23 15:59:30
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

snoopyzhao

至尊木虫 (职业作家)


小木虫(金币+0.5):给个红包,谢谢回帖交流
不涉及保密的话,把输入文件贴上来测试一下吧。我的硬件环境与你差不多,呵呵……
3楼2010-06-23 16:00:27
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yjcmwgk

禁虫 (文坛精英)

密度泛函·小卒

优秀版主

引用回帖:
Originally posted by snoopyzhao at 2010-06-23 16:00:27:
不涉及保密的话,把输入文件贴上来测试一下吧。我的硬件环境与你差不多,呵呵……

额……如果我想保密,snoopyzhao大侠您会不会你鄙视我……
4楼2010-06-23 16:02:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见