24小时热门版块排行榜    

CyRhmU.jpeg
查看: 2873  |  回复: 11

huangyc

木虫 (正式写手)

[求助] torque如何限制用户使用过多资源

用户目前提交任务,谁先提交就先执行,若是一次性提交很多任务,别人只能等这些任务结束后才能被执行。往往是一个用户一次性提交很多,计算节点被占满,别人只能干等了
网上查了下,说是改/usr/local/maui/maui.cfg文件,然后改成USERCFG[DEFAULT]        MAXJOB=3 MAXNODE=2 (最多3个作业,使用2节点)。我改后, /etc/init.d/maui.d restart。还是按照提交任务时间先后来执行
请问,到底该如何解决
谢谢

[ Last edited by huangyc on 2012-4-12 at 17:43 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
zzy870720z: 金币+2, 谢谢指教 2012-04-13 09:10:32
huangyc: 金币+10, ★★★很有帮助, xiexie 2012-04-13 21:53:39
这样来设置:
USERCFG[abc]        MAXJOB=3 MAXNODE=2
abc指的是用户名
弘德明志博学笃行
2楼2012-04-12 20:03:59
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)


zzy870720z: 金币+1, 谢谢补充 2012-04-13 09:10:45
另外,对于maui的重新启动问题。我安装完毕了maui后/etc/init.d/下面没有maui.d文件。所以检查你的是不是有。如果没有的话,这样重启:
ps -A |grep maui
结果会出来这个maui的进程ID
kill ID
然后启动maui
/usr/local/software/maui-3.3.1/sbin/maui
这样启动起来。
弘德明志博学笃行
3楼2012-04-12 20:06:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

huangyc

木虫 (正式写手)

maui我加入到自启动里了。

下午我把default改过成用户名了,不过现在还不知道是否已生效。因为用户的很多任务已经在计算了

我用/etc/init.d/maui.d restart命令先关后开,都OK

再等等看吧,有问题再来请教
4楼2012-04-12 21:18:20
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

huangyc

木虫 (正式写手)

仔细看了下进程,发现pbs_sched和maui都在,应该是pbs_sched在分发作业,所以改maui不管用。现在把pbs_sched服务给关了,再看看是否起作用
5楼2012-04-13 21:53:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hnuzhoulin

金虫 (小有名气)

★ ★
cenwanglai: 金币+2, 谢谢提供帮助~ 2012-04-14 19:55:28
maui里面做限制比较好一些,当然在torque里面也是可以做一些限制的,但是torque里面是针对队列来的,没有办法专门针对某一个账户。
写一点,仅供参考:
qmgr -c "set queue test max_user_run = 7"
这样就限定这个队列的每个用户最多只能提交7个任务,还可以限制每次最多可以使用多少个cpu多少个核。
set queue test resources_max.ncpus = 1
set queue test resources_max.nodes = 1
6楼2012-04-14 16:47:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hnuzhoulin

金虫 (小有名气)


cenwanglai: 金币+1, ~~ 2012-04-14 19:55:37
当然如果迂回一点也可以限制某一个人的,那就是为他单独建一个队列,然后队列设置为 acl_user_enable=True

再  acl_users=yonghuming   来限制交到某一个队列的用户
7楼2012-04-14 16:49:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

04nylxb

木虫 (正式写手)


zhangguangping: 金币+1, 谢谢。但是我觉得还是maui里里面的限制更加针对。当然torque里面可以先进行规则性的限制,然后对于特殊情况由maui负责。 2012-04-16 20:36:13
赞,我是通过torque的队列来限制的,限制整个队列最多递交的作业数,和group里面的用户最多提交任务数
max_queuable
max_running
max_user_queuable
max_user_run
集中精力发文章
8楼2012-04-16 13:26:43
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wjcaiyf

新虫 (初入文坛)

set queue test resources_max.ncpus = 1这条命令不起作用啊,怎么回事?
9楼2014-05-01 17:25:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

leiboy

铁虫 (初入文坛)

引用回帖:
9楼: Originally posted by wjcaiyf at 2014-05-01 17:25:13
set queue test resources_max.ncpus = 1这条命令不起作用啊,怎么回事?

我也遇到了相同的问题 ,请问你解决了吗?
10楼2015-10-25 00:00:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 huangyc 的主题更新
信息提示
请填处理意见