| 查看: 2109 | 回复: 14 | |||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | |||
suntao1982木虫 (著名写手)
小木虫
|
[求助]
torque + maui 的设置问题
|
||
|
最近做了一个集群,想使用torque和maui对集群进行管理,安装正常,但是在作业调度时出现问题。共有两个节点,在var/spool/torque/server-priv/nodes node11 np=2 node12 np=2 maui.cfg设置如下 NODEALLOCATIONPOLICY MINRESOURCE JOBNODEMATCHPOLICY EXACTNODE ENABLEMUITINODEJOBS TRUE ENABLEMULTIREQJOBS TRUE 提交作业,作业脚本为 #!/bin/bash #PBS -N test1 #PBS -l nodes=2:ppn=1 #PBS -l mem=64MB #PBS -l pmem=16MB #PBS -j oe #PBS -q students 提交作业后发现 tsun@node10:~> qstat -n node10: Req'd Req'd Elap Job ID Username Queue Jobname SessID NDS TSK Memory Time S Time -------------------- -------- -------- ---------------- ------ ----- --- ------ ----- - ----- 369.node10 tsun students test1 4565 2 2 64mb 24:00 R -- node12/1+node12/0 作业竟然在一个节点上运行, 修改脚本为 #!/bin/bash #PBS -N test1 #PBS -l nodes=1:ppn=1 #PBS -l mem=64MB #PBS -l pmem=16MB #PBS -j oe #PBS -q students 提交两个作业后发现 tsun@node10:~> qstat -n node10: Req'd Req'd Elap Job ID Username Queue Jobname SessID NDS TSK Memory Time S Time -------------------- -------- -------- ---------------- ------ ----- --- ------ ----- - ----- 370.node10 tsun students test2 4637 1 1 -- 24:00 R -- node12/0 371.node10 tsun students test2 4638 1 1 -- 24:00 R -- node12/1 发现两个作业都在node12节点上。安装道理第一作业应该在node11和node12上各有一个作业,后面也是node11和node12上各有一个作业,应该是maui设置的原因。请问各位应该怎么设置呢?非常感谢你的帮助! |
» 猜你喜欢
华南师范大学广州市光谱分析与功能探针重点实验室诚招青年英才和博士后岗位研究人员
已经有11人回复
华南师范大学广州市光谱分析与功能探针重点实验室诚招青年英才和博士后岗位研究人员
已经有10人回复
物理化学论文润色/翻译怎么收费?
已经有147人回复
PbS量子点如何确定浓度
已经有11人回复
大湾区大学刘天辉课题组招收2026级博士生(与中山大学物理学院联合培养)
已经有22人回复
PbS量子点紫外吸收
已经有0人回复
求标准卡片Cu0.4In0.4Zn1.2S2 PDF#32-0340
已经有2人回复
比利时鲁汶大学与国家留学基金委共同资助博士研究生CSC-KU Leuven PhD Scholarship
已经有0人回复
量子点电致发光器件(QLED):蓝光量子点(QDs)和纳米氧化锌电子传输材料
已经有0人回复
七嗪类物质合成求助
已经有0人回复
需要一个圆偏振光诱导化学反应,请问使用圆偏振光作为光源,应该需要哪些设备搭建
已经有0人回复

zhangguangping
木虫 (著名写手)
- 应助: 71 (初中生)
- 贵宾: 0.031
- 金币: 1973.1
- 散金: 9059
- 红花: 79
- 帖子: 2681
- 在线: 2128.8小时
- 虫号: 529624
- 注册: 2008-03-20
- 性别: GG
- 专业: 原子和分子物理
|
我也是新手,刚刚开始玩这个。对于你的问题,我也碰到过。不过我是这样解决的。 对于你的第一个问题,我使用的是指定节点的办法,对于你的这个情况就是: #PBS -l nodes=node11:ppn=1+node12:ppn=1 这样自然的会每一个节点上出一个核来完成你的任务。 第二个问题,你得到的结果是可以理解的。你提交了两个1核的任务,torque自然的会把任务按照顺序提交到node12上去。因为node12上面有2个核,提交一个任务之后还有一个空余,所以第二个任务还要到node12上去。我也不清楚为什么先要提交到最后一个列出的节点上去。反正我们的集群也是这样子,有任务先从最后一个节点开始算起。最后才能排到node1.可能改变一下计算节点的列表顺序是不是就可以改变这个地方。 另外你说的对于Macui的设置,都是在那个文件里面设置的啊?能不能给给出相对路径啊? 谢谢。 |

13楼2012-01-03 22:04:36
abbott
金虫 (著名写手)
不要用QQ问我东西
- 应助: 16 (小学生)
- 金币: 1071.6
- 散金: 2787
- 红花: 10
- 帖子: 1015
- 在线: 105.2小时
- 虫号: 452267
- 注册: 2007-11-05
- 性别: GG
- 专业: 计算机硬件技术

2楼2011-10-24 07:45:25
abdoman
木虫 (著名写手)
- 应助: 56 (初中生)
- 金币: 5369.5
- 散金: 918
- 红花: 3
- 沙发: 1
- 帖子: 1321
- 在线: 451.5小时
- 虫号: 301521
- 注册: 2006-12-01
- 性别: GG
- 专业: 理论和计算化学
【答案】应助回帖
★ ★ ★ ★ ★
suntao1982(金币+2): 这个也没有问题,就是这样设置的。 2011-10-24 18:30:05
小红豆(金币+5): 谢谢,辛苦了 2011-10-30 10:38:02
suntao1982(金币+2): 这个也没有问题,就是这样设置的。 2011-10-24 18:30:05
小红豆(金币+5): 谢谢,辛苦了 2011-10-30 10:38:02
|
1. 感觉你这个是pbs 的问题: 你的第二个任务为什么会投到node12上面? 因为集群认为你的node12 还有资源,所以把第二个任务投给了node12. 你的maui 指定了是下面这个没? # Resource Manager Definition #RMCFG[YOURservername] TYPE=PBS 你试试 node=2:ppn=2 看看情况怎么样! |

3楼2011-10-24 10:03:46
4楼2011-10-24 21:34:06













回复此楼