24小时热门版块排行榜    

查看: 2867  |  回复: 6

luckwan16

木虫 (小有名气)

[求助] PBS 排队系统一直不能运行,求助! 已有2人参与

老板在集群上开了一个账户给我,但是提交PBS脚本后,qstat状态一直显示为C,cpu运行时间也全部为0。通过查看邮件报错信息,显示为An error has occurred processing your job, see below.
Post job file processing error; job 1608 on host compute-0-4/2Unknown resource type  REJHOST=compute-0-4.local MSG=invalid home directory '/export/home/wj' specified, errno=2 (No such file or directory).
请问有人遇到同样的问题吗?求问怎么解决?谢谢
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wyding

木虫 (正式写手)

你这是执行文件找不到!

发自小木虫IOS客户端

» 本帖已获得的红花(最新10朵)

向强者看齐,即使高度不够也是昂首挺胸!
2楼2016-09-06 14:57:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

匿名

用户注销 (小有名气)

感谢参与,应助指数 +1
本帖仅楼主可见
3楼2016-09-06 14:59:20
已阅   申请计算强帖   回复此楼   编辑   查看我的主页

luckwan16

木虫 (小有名气)

送红花一朵
引用回帖:
2楼: Originally posted by wyding at 2016-09-06 14:57:12
你这是执行文件找不到!

请问PBS需要什么执行文件吗?或者麻烦告诉我一下具体的错误?困扰在这好几天了,谢谢
4楼2016-09-06 16:08:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xyan42

新虫 (初入文坛)

【答案】应助回帖

★ ★ ★ ★ ★
感谢参与,应助指数 +1
luckwan16: 金币+5, ★★★★★最佳答案 2016-09-06 18:48:51
账户没同步到所有计算节点?
到管理节点上用root账户执行了rocks sync users; rocks sync config
然后再试试
5楼2016-09-06 16:56:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

luckwan16

木虫 (小有名气)

引用回帖:
5楼: Originally posted by xyan42 at 2016-09-06 16:56:33
账户没同步到所有计算节点?
到管理节点上用root账户执行了rocks sync users; rocks sync config
然后再试试

好的,让我联系老板试下,多谢指点
6楼2016-09-06 18:49:29
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangchi99

新虫 (初入文坛)

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
小红豆: 金币+20, 鼓励 2018-07-23 15:38:51
尽管帖子已经过去很多时间了。但是作为一名以前用过PBS的人员来说,经历并感受到了很多非IT专业人员使用PBS等队列系统遇到问题时的无助。下面将分享一下楼主的问题和可能的原因,以及遇到这类问题如何解决。楼主收到的PBS邮件提示在compute-0-4.local这台机器上面,没有找到/export/home/wj这个目录。通过PBS集群的基本构造,楼主所在的集群使用了一个NFS系统,然后所有节点都挂载该目录来共享用户主目录、程序文件和数据文件。那么出现这种错误的原因是,在compute-0-4.local这台机器上面,没有执行NFS文件目录的挂载,将/export/home/目录挂载后,应该可以执行了。或者说不会报这个错误了。

PBS提交任务出现问题的解决思路。当我们使用qsub jobfile提交作业之后,会返回一个作业ID。通过这个作业ID,我们可以查询这个作业的运行情况。
1.执行qstat jobid查看作业基本状态,如果作业很快从Q->R->C状态,即作业很快结束。则执行如下命令
2.执行qstat -f jobid查看作业运行的详细信息,其中包括,输出文件,错误文件,以及提示信息,通过查看这些信息,我们可以找到具体的原因。
3.通过第2步中找到的具体报错信息,来对症下药,解决问题。很多时候,PBS作业提交出现问题,都不是PBS本身的问题,可能是软件环境配置问题、文件系统问题、作业脚本本身问题等。
7楼2018-07-23 10:03:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 luckwan16 的主题更新
信息提示
请填处理意见