| 查看: 1521 | 回复: 4 | |||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | |||
[求助]
Torque+Maui集群资源管理问题 已有1人参与
|
|||
| 本人在管理一个20台服务器的小型计算机机群,最近在安装Torque+Maui来更好的分配计算资源,但是现在遇到一个问题,就是我们的机器有一部分机器是GPU+CPU的机器,另一部分是只有CPU的机器,而我们算的任务也有用GPU计算的任务,也有用CPU计算的任务,所以我想把这些机器分成两个组,Group1是GPU机器,Group2是CPU机器,投任务的时候可以用命令指定是投在Group1上还是投在Group2上,不知道这样是不是可以实现?不知道Torque可不可以分配GPU资源?求大神帮助! |
» 猜你喜欢
桂林理工大学物理学专业招收调剂
已经有18人回复
VASP 的一组 GPU / CPU 基准测试记录
已经有0人回复
物理学I论文润色/翻译怎么收费?
已经有109人回复
津理工大学晶体材料全国重点实验室刘红军教授课题组招收博士生一名
已经有0人回复
【原创讨论】从电子约束到物质编辑:一套可迭代的环形磁场科技树
已经有0人回复
【方案分享】单环磁场+轴心控制+偏转导出电子束约束系统(可行性实验)
已经有6人回复
【修正版】单环用磁约束低速电子实验方案(简化版)
已经有0人回复
桂林理工大学物理学专业招收调剂,还有三个名额!!!
已经有22人回复
考博自荐
已经有1人回复
山东大学第二批博士研究生招生
已经有0人回复
» 本主题相关价值贴推荐,对您同样有帮助:
Linux集群rocks的安装和SGE管理调度MS5.5作业
已经有16人回复
遇到实验室有些同学不按章程用集群怎么办?
已经有41人回复
|
说的很对啊,是可以定义节点机的属性,然后投任务的时候指定类型投任务,可是会出现你说的一个卡跑多个任务的情况。我现在有一个想法解决这个问题不知道可行不,就是我还用Torque+Maui,然后我在server上配置各个计算节点的时候我把每一台GPU的机子都指定两次,比如像下面这样,在配置文件nodes里面这样写,node116和gnode001指的是同一台节点机,只不过起了两个名字罢了,为cpu个数指定4,属性为cpu;为gpu个数指定1,属性为gpu。投任务的时候指定节点机类型就行了。 node116 np=4 cpu gnode001 np=1 gpu 不知道这样为同一节点机指定两次可以不,我试了一下貌似有点儿问题! |
3楼2016-10-11 12:15:37
【答案】应助回帖
★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
吴丰旭: 金币+20, ★★★很有帮助 2016-10-11 12:16:12
感谢参与,应助指数 +1
吴丰旭: 金币+20, ★★★很有帮助 2016-10-11 12:16:12
|
抛砖引玉下。 maui不支持GPU调度,torque是支持的,maui+torque不支持。 所以,可以只用torque而不是maui+torque,当然这样就会降低CPU节点的管理能力了。 也可以仍然用maui+torque,你分配gpu相关的任务时指定用gpu这一类型的节点,但gpu是没法合理调度的,会出现一片卡上跑多个任务的情况(通过卡的设置可规避这一问题,但会造成提交的任务失败)。 |
2楼2016-10-11 08:57:28
4楼2016-10-12 08:58:31
sbkk
铁杆木虫 (著名写手)
- 应助: 1 (幼儿园)
- 金币: 9938.8
- 散金: 45
- 红花: 4
- 帖子: 1187
- 在线: 374.6小时
- 虫号: 1192095
- 注册: 2011-01-18
- 性别: GG
- 专业: 化学反应工程

5楼2018-10-20 19:33:14













回复此楼
