24小时热门版块排行榜    

查看: 2431  |  回复: 6

tuxiong_1986

新虫 (初入文坛)

[求助] 求大神帮忙,高斯09 “open-new-file”错误已有2人参与

各路大神,我使用相同的高斯GJF计算文件,相同的LSF文件向超算的计算节点提交高斯任务,甚至能看到是在超算的相同节点上计算的,但是会有一部分任务(出现概率大约为30%)的log文件停止在“open-new-file”,然后就结束了。过会使用相同的GJF文件和LSF文件提交,又可以正常完成计算了,有没有大神知道是为什么?

我的Log文件的最后几行如下:
******************************************
Gaussian 09:  ES64L-G09RevD.01 24-Apr-2013
                 3-Jun-2014
******************************************
%NProcShared=4
Will use up to    4 processors via shared memory.
%LindaWorker=echo,
%mem=4096MB
%chk=gaussian_check_file.chk
fname=/home-gg/Soft/Gaussian.D01.Linda/g09/scratch/Gau-18216.rwf fd = -1

open-new-file

跪求各位大神
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhficcas

银虫 (正式写手)

【答案】应助回帖

★ ★ ★
感谢参与,应助指数 +1
zhou2009: 金币+3 2014-06-03 18:26:24
系统的问题, 再次提交就可以了,也有可能是输出文件的位置不同引起的, 放在默认的目录下试一试。
2楼2014-06-03 18:07:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

liuhaixx

新虫 (小有名气)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
gkf高: 金币+2 2014-06-04 09:32:40
tuxiong_1986: 金币+5, ★★★★★最佳答案 2014-06-04 18:10:34
小shen同志,注意下并行文件系统的bug,这应该不是g09的问题:
同路径,同文件名的文件,NFS共享大并发下更新可能存在延迟,你读取的可能是旧的文件。

目前的解决办法,最好是避免使用相同路径和文件名的文件。期待超算停机维护,哈哈哈~
3楼2014-06-04 09:24:26
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

tuxiong_1986

新虫 (初入文坛)

引用回帖:
3楼: Originally posted by liuhaixx at 2014-06-04 09:24:26
小shen同志,注意下并行文件系统的bug,这应该不是g09的问题:
同路径,同文件名的文件,NFS共享大并发下更新可能存在延迟,你读取的可能是旧的文件。

目前的解决办法,最好是避免使用相同路径和文件名的文件。 ...

嘿嘿,都知道我是小shen同志了啊,这个问题太恼人了。
我的路径每次都是不一样的,但是高斯的log文件和lsf文件的文件名是相同的,你的意思是我应该每次把log和lsf系统的文件名换一下??
4楼2014-06-04 09:36:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

tuxiong_1986

新虫 (初入文坛)

引用回帖:
2楼: Originally posted by zhficcas at 2014-06-03 18:07:32
系统的问题, 再次提交就可以了,也有可能是输出文件的位置不同引起的, 放在默认的目录下试一试。

但是我的程序有要求每次都在不同的路径下
5楼2014-06-04 09:38:43
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

tuxiong_1986

新虫 (初入文坛)

引用回帖:
3楼: Originally posted by liuhaixx at 2014-06-04 09:24:26
小shen同志,注意下并行文件系统的bug,这应该不是g09的问题:
同路径,同文件名的文件,NFS共享大并发下更新可能存在延迟,你读取的可能是旧的文件。

目前的解决办法,最好是避免使用相同路径和文件名的文件。 ...

你所说的可能是正解,小木虫大神就是多!!
6楼2014-06-04 10:00:35
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

liuhaixx

新虫 (小有名气)

引用回帖:
6楼: Originally posted by tuxiong_1986 at 2014-06-04 10:00:35
你所说的可能是正解,小木虫大神就是多!!...

那有没有解决问题哈。。。lsf文件应该不至于,这个归lsf platform管。log文件,你如果要读取里面的信息,可能会读到旧的文件内容,然后去取scratch目录里面旧的临时rwf文件导致不存在
7楼2014-06-05 17:17:57
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 tuxiong_1986 的主题更新
信息提示
请填处理意见