| 查看: 1480 | 回复: 4 | |||
[求助]
Torque+Maui集群资源管理问题 已有1人参与
|
| 本人在管理一个20台服务器的小型计算机机群,最近在安装Torque+Maui来更好的分配计算资源,但是现在遇到一个问题,就是我们的机器有一部分机器是GPU+CPU的机器,另一部分是只有CPU的机器,而我们算的任务也有用GPU计算的任务,也有用CPU计算的任务,所以我想把这些机器分成两个组,Group1是GPU机器,Group2是CPU机器,投任务的时候可以用命令指定是投在Group1上还是投在Group2上,不知道这样是不是可以实现?不知道Torque可不可以分配GPU资源?求大神帮助! |
» 猜你喜欢
基元I理论下三大核心空间现象精准推导与细节解析
已经有0人回复
基于基元 I 统一理论的反重力理论推导
已经有0人回复
物理学I论文润色/翻译怎么收费?
已经有125人回复
基于基元I统一理论的量子力学本源推导
已经有1人回复
推荐一款可以AI辅助写作的Latex编辑器SmartLatexEditor,超级好用,AI润色,全免费
已经有20人回复
【EI|Scopus 双检索】第六届智能机器人系统国际会议(ISoIRS 2026)
已经有0人回复
2026年第四届电动车与车辆工程国际会议(CEVVE 2026)
已经有0人回复
» 本主题相关价值贴推荐,对您同样有帮助:
Linux集群rocks的安装和SGE管理调度MS5.5作业
已经有16人回复
遇到实验室有些同学不按章程用集群怎么办?
已经有41人回复
【答案】应助回帖
★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
吴丰旭: 金币+20, ★★★很有帮助 2016-10-11 12:16:12
感谢参与,应助指数 +1
吴丰旭: 金币+20, ★★★很有帮助 2016-10-11 12:16:12
|
抛砖引玉下。 maui不支持GPU调度,torque是支持的,maui+torque不支持。 所以,可以只用torque而不是maui+torque,当然这样就会降低CPU节点的管理能力了。 也可以仍然用maui+torque,你分配gpu相关的任务时指定用gpu这一类型的节点,但gpu是没法合理调度的,会出现一片卡上跑多个任务的情况(通过卡的设置可规避这一问题,但会造成提交的任务失败)。 |
2楼2016-10-11 08:57:28
|
说的很对啊,是可以定义节点机的属性,然后投任务的时候指定类型投任务,可是会出现你说的一个卡跑多个任务的情况。我现在有一个想法解决这个问题不知道可行不,就是我还用Torque+Maui,然后我在server上配置各个计算节点的时候我把每一台GPU的机子都指定两次,比如像下面这样,在配置文件nodes里面这样写,node116和gnode001指的是同一台节点机,只不过起了两个名字罢了,为cpu个数指定4,属性为cpu;为gpu个数指定1,属性为gpu。投任务的时候指定节点机类型就行了。 node116 np=4 cpu gnode001 np=1 gpu 不知道这样为同一节点机指定两次可以不,我试了一下貌似有点儿问题! |
3楼2016-10-11 12:15:37
4楼2016-10-12 08:58:31
sbkk
铁杆木虫 (著名写手)
- 应助: 1 (幼儿园)
- 金币: 9938.8
- 散金: 45
- 红花: 4
- 帖子: 1187
- 在线: 374.6小时
- 虫号: 1192095
- 注册: 2011-01-18
- 性别: GG
- 专业: 化学反应工程

5楼2018-10-20 19:33:14













回复此楼