24小时热门版块排行榜    

查看: 3047  |  回复: 16
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

zhangguangping

木虫 (著名写手)

[交流] 关于Troque提交任务需要用qrun才能运行的讨论 已有6人参与

Troque+Maui,一直用的很好,今天突然发现有的账户提交任务后,一直在排队,其实对那个账户来说是有资源可利用的。非得需要用qrun命令才能运行。我到小木虫上搜索了一下,发现也有相同的帖子,但是均未给出解决办法:
http://muchong.com/bbs/viewthread.php?tid=1799745
http://muchong.com/bbs/viewthread.php?tid=1272931
http://muchong.com/bbs/viewthread.php?tid=2717220

咱们板块的高手能不能给出解决办法呢?
回复此楼

» 收录本帖的淘帖专辑推荐

第一性原理

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

弘德明志博学笃行
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

引用回帖:
2楼: Originally posted by 风间的记忆 at 2012-03-16 09:21:55:
我猜测啊
虽然我们是GE
大部分可能是资源虽然是空闲的
但有垃圾信息
比如内存和CPU被占用了
调度系统认为资源条件不够
QRUN是强制运行
即使开始运行
效率也不会高
清理垃圾试试
也可以重启。。。。
如 ...

有这些可能。另外您说的最后一句程序写的不好,是指的上一次在该节点运行的程序写的不好吧?他们运行过后,没有做收尾工作,留下一些垃圾,导致调度系统认为条件不合适呢。
看来Troque调度系统检查的东西挺多,并不是说只要有资源,就可以往上提交。可能需要检查cup负载,内存等情况。

谢谢您的提醒!
弘德明志博学笃行
3楼2012-03-16 10:11:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

引用回帖:
5楼: Originally posted by ifmc1234 at 2012-04-03 21:37:01:
可有下文?有人几天前问起,没查出原因。不知道你们现在可有办法解决?

现在这个问题,在我这边越来越突出了。刚刚对新买的机器调试好之后,从来没发现这类问题。我把我们的旧机器一起追加到一起后,这个问题就开始了。尤其是整个服务器从来没关过。还有就是任务拥挤的时候,这个问题更是常常出现。我的猜测是:
1.可能通讯有问题,这个要求管理节点内存大点。我们管理节点是8GB的内存,4核,原来以为能够非常胜任这个管理任务。但是我经常发现内存被占满。
2.有可能是管理软件发现虽然计算节点核有空闲,但是内存等其他因素不合适。
3.可能是torque的一个缺点吧。

目前不知道怎么解决。并且我发现torque的mail-list中对于新版本反应这个问题的也不在少数。关键是我只能收这个list的邮件,不能给他们发送。老说我的邮件被拒绝。

但是,我们这边所谓的“堵塞”的任务,等上一阵子,自己会上去的。我估计我们的情况属于第2中猜测情况吧。

[ Last edited by zhangguangping on 2012-4-3 at 22:37 ]
弘德明志博学笃行
6楼2012-04-03 22:36:29
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

引用回帖:
7楼: Originally posted by xztjhs at 2012-04-04 14:26:40:
建议qmgr -c "p s",然后把配置信息发出来看一下。

你说的这种情况个人认为有以下几种可能:

1、CPU未使用完,但是在资源池中的节点已被使用完,即资源不足、

2、存在死掉的任务未删除。

3 ...

首先我觉得qmgr -c "p s"给出的信息应该不足以提供解决该问题的信息。我用的是Troque-2.4.6+maui-3.3.1

不过我还是把我的配置贴一下吧。静听高手指点!

#
# Create queues and set their attributes.
#
#
# Create and define queue AMBER
#
create queue AMBER
set queue AMBER queue_type = Execution
set queue AMBER resources_default.neednodes = amber
set queue AMBER acl_group_enable = True
set queue AMBER acl_groups = amber
set queue AMBER acl_group_sloppy = True
set queue AMBER enabled = True
set queue AMBER started = True
#
# Create and define queue MOLPRO
#
create queue MOLPRO
set queue MOLPRO queue_type = Execution
set queue MOLPRO resources_default.neednodes = molpro
set queue MOLPRO acl_group_enable = True
set queue MOLPRO acl_groups = molpro
set queue MOLPRO acl_group_sloppy = True
set queue MOLPRO enabled = True
set queue MOLPRO started = True
#
# Create and define queue TRANSIESTA
#
create queue TRANSIESTA
set queue TRANSIESTA queue_type = Execution
set queue TRANSIESTA resources_default.neednodes = transiesta
set queue TRANSIESTA acl_group_enable = True
set queue TRANSIESTA acl_groups = transiesta
set queue TRANSIESTA acl_group_sloppy = True
set queue TRANSIESTA enabled = True
set queue TRANSIESTA started = True
#
# Create and define queue OTHERS
#
create queue OTHERS
set queue OTHERS queue_type = Execution
set queue OTHERS resources_default.neednodes = others
set queue OTHERS acl_group_enable = True
set queue OTHERS acl_groups = others
set queue OTHERS acl_group_sloppy = True
set queue OTHERS enabled = True
set queue OTHERS started = True
#
# Create and define queue SIESTA
#
create queue SIESTA
set queue SIESTA queue_type = Execution
set queue SIESTA resources_default.neednodes = siesta
set queue SIESTA acl_group_enable = True
set queue SIESTA acl_groups = siesta
set queue SIESTA acl_group_sloppy = True
set queue SIESTA enabled = True
set queue SIESTA started = True
#
# Create and define queue GAUSSLAB206
#
create queue GAUSSLAB206
set queue GAUSSLAB206 queue_type = Execution
set queue GAUSSLAB206 resources_default.neednodes = gausslab206
set queue GAUSSLAB206 acl_group_enable = True
set queue GAUSSLAB206 acl_groups = gausslab206
set queue GAUSSLAB206 acl_group_sloppy = True
set queue GAUSSLAB206 enabled = True
set queue GAUSSLAB206 started = True
#
# Create and define queue GAUSSIAN
#
create queue GAUSSIAN
set queue GAUSSIAN queue_type = Execution
set queue GAUSSIAN resources_default.neednodes = gaussian
set queue GAUSSIAN acl_group_enable = True
set queue GAUSSIAN acl_groups = gaussian
set queue GAUSSIAN acl_group_sloppy = True
set queue GAUSSIAN enabled = True
set queue GAUSSIAN started = True
#
# Create and define queue DALTON
#
create queue DALTON
set queue DALTON queue_type = Execution
set queue DALTON resources_default.neednodes = dalton
set queue DALTON acl_group_enable = True
set queue DALTON acl_groups = dalton
set queue DALTON acl_group_sloppy = True
set queue DALTON enabled = True
set queue DALTON started = True
#
# Set server attributes.
#
set server scheduling = True
set server acl_hosts = node00
set server managers = zhanggp@node00
set server operators = zhanggp@node00
set server default_queue = NONE
set server log_events = 511
set server mail_from = adm
set server scheduler_iteration = 600
set server node_check_rate = 150
set server tcp_timeout = 6
set server mom_job_sync = True
set server keep_completed = 300
set server next_job_number = 2438
弘德明志博学笃行
8楼2012-04-04 15:52:44
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

内容已删除
弘德明志博学笃行
12楼2013-03-29 21:36:21
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

引用回帖:
15楼: Originally posted by zzr0427 at 2013-04-17 22:50:59
老师,我想请教您一下,我的Torque用的是4.1的版本,我提交到队列里的任务一直处在Q的状态,只有手动qrun才会执行,我觉得应该是任务调度有问题。pbs_sched处在执行的状态,但就是不调度,我想请教您一下,这可能是 ...

我一直用的maui和torque的组合。只有torque我还没有试过。即使他们两个的组合,有时候也会出现你的这个问题。我觉得你可以去尝试一下,他们是不是匹配。
弘德明志博学笃行
16楼2013-04-18 09:23:54
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 zhangguangping 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见