| 查看: 1436 | 回复: 4 | |||
[求助]
Torque+Maui集群资源管理问题 已有1人参与
|
| 本人在管理一个20台服务器的小型计算机机群,最近在安装Torque+Maui来更好的分配计算资源,但是现在遇到一个问题,就是我们的机器有一部分机器是GPU+CPU的机器,另一部分是只有CPU的机器,而我们算的任务也有用GPU计算的任务,也有用CPU计算的任务,所以我想把这些机器分成两个组,Group1是GPU机器,Group2是CPU机器,投任务的时候可以用命令指定是投在Group1上还是投在Group2上,不知道这样是不是可以实现?不知道Torque可不可以分配GPU资源?求大神帮助! |
» 猜你喜欢
求标准粉末衍射卡号 ICDD 01-076-1802
已经有0人回复
新西兰Robinson研究所招收全奖PhD
已经有0人回复
物理学I论文润色/翻译怎么收费?
已经有178人回复
石墨烯转移--二氧化硅衬底石墨烯
已经有0人回复
笼目材料中量子自旋液体基态的证据
已经有0人回复
数学教学论硕士可以读数学物理博士吗?
已经有0人回复
德国亥姆霍兹Hereon中心汉堡分部招镁合金腐蚀裂变SCC课题方向2026公派博士生
已经有4人回复
澳门大学 应用物理及材料工程研究院 潘晖教授课题组诚招博士后
已经有11人回复
求助NH4V4O10晶体的CIF文件
已经有0人回复
» 本主题相关价值贴推荐,对您同样有帮助:
Linux集群rocks的安装和SGE管理调度MS5.5作业
已经有16人回复
遇到实验室有些同学不按章程用集群怎么办?
已经有41人回复
【答案】应助回帖
★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
吴丰旭: 金币+20, ★★★很有帮助 2016-10-11 12:16:12
感谢参与,应助指数 +1
吴丰旭: 金币+20, ★★★很有帮助 2016-10-11 12:16:12
|
抛砖引玉下。 maui不支持GPU调度,torque是支持的,maui+torque不支持。 所以,可以只用torque而不是maui+torque,当然这样就会降低CPU节点的管理能力了。 也可以仍然用maui+torque,你分配gpu相关的任务时指定用gpu这一类型的节点,但gpu是没法合理调度的,会出现一片卡上跑多个任务的情况(通过卡的设置可规避这一问题,但会造成提交的任务失败)。 |
2楼2016-10-11 08:57:28
|
说的很对啊,是可以定义节点机的属性,然后投任务的时候指定类型投任务,可是会出现你说的一个卡跑多个任务的情况。我现在有一个想法解决这个问题不知道可行不,就是我还用Torque+Maui,然后我在server上配置各个计算节点的时候我把每一台GPU的机子都指定两次,比如像下面这样,在配置文件nodes里面这样写,node116和gnode001指的是同一台节点机,只不过起了两个名字罢了,为cpu个数指定4,属性为cpu;为gpu个数指定1,属性为gpu。投任务的时候指定节点机类型就行了。 node116 np=4 cpu gnode001 np=1 gpu 不知道这样为同一节点机指定两次可以不,我试了一下貌似有点儿问题! |
3楼2016-10-11 12:15:37
4楼2016-10-12 08:58:31
sbkk
铁杆木虫 (著名写手)
- 应助: 1 (幼儿园)
- 金币: 9938.8
- 散金: 45
- 红花: 4
- 帖子: 1187
- 在线: 374.6小时
- 虫号: 1192095
- 注册: 2011-01-18
- 性别: GG
- 专业: 化学反应工程

5楼2018-10-20 19:33:14












回复此楼