| 查看: 1159 | 回复: 1 | ||
| 【悬赏金币】回答本帖问题,作者aweiaaaa将赠送您 100 个金币 | ||
aweiaaaa铁虫 (小有名气)
|
[求助]
想了解一下集群里面的一些概念比如说节点CPU啥的 已有1人参与
|
|
|
cpu 节点(node)核 wallclock 和time use的区别及联系 发自小木虫IOS客户端 |
» 猜你喜欢
香港科技大学(广州)诚招电催化方向博士生(2026秋入学)
已经有0人回复
求助Cu2+1O的CIF文件(PDF: 05-0667)
已经有1人回复
物理化学论文润色/翻译怎么收费?
已经有68人回复
KAUST(阿卜杜拉国王科技大学)MXene 器件方向博士后招聘
已经有0人回复
沙特阿拉伯阿卜杜拉国王科技大学(KAUST)电池方向博士后招聘
已经有0人回复
福州大学新能源材料与工程研究院招收2026年入学博士
已经有0人回复
海南师范大学2026年博士研究生招收 (在职想提升学历人员可报考) 申请考核制
已经有0人回复
锂离子电池循环寿命衰减过快,求机理分析与改进思路
已经有2人回复
求博导收留
已经有5人回复
九江学院2026年最新高层次人才招聘公告
已经有0人回复
CSC & MSCA 博洛尼亚大学能源材料课题组博士/博士后招生|MSCA经费充足、排名优
已经有0人回复
paramecium86
版主 (著名写手)
- QC强帖: 5
- 应助: 587 (博士)
- 贵宾: 0.01
- 金币: 26356.1
- 红花: 348
- 帖子: 2024
- 在线: 1441.6小时
- 虫号: 2466443
- 注册: 2013-05-16
- 性别: GG
- 专业: 理论和计算化学
- 管辖: 量子化学
【答案】应助回帖
★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
zhou2009: 金币+10 2021-03-04 09:04:27
感谢参与,应助指数 +1
zhou2009: 金币+10 2021-03-04 09:04:27
|
简单的理解的话 大致可以认为一个集群(cluster)是一个无数服务器并联在一起并统一管理的一个系统。 其中每一个服务器都可以叫做一个节点(node),不同的服务器还有不同的功能比如用来负责让用户登陆并使用的(登陆节点)还有用来处理计算任务用的节点(计算节点)等等。 而且一般的集群因为很多人使用。不能让所有人都随意登陆到某一个节点让跑任务。所以还需要有作业系统。比如说 slurm 或者pbs什么的。一般的用户通过设置提交任务的脚本来告诉作业系统你要提交的任务和一些节点的设置。 一般来说无论用的哪种作业系统都可以设置如下的内容: 你可以设置你需要调用多少cpu来计算你的任务 这里的cpu指的就是核心数目。比如一个节点是 双e5 2698v4 有44核心,那你就可以调用44核心 你可以设置你需要调用几个node,也就是几个服务器来同时帮算一个任务。当然有的程序可以调用多node,有的程序就只能在单独一个node内运行 有的超算你还需要设置分区(Partition)。有的超算为了便于管理以及任务处理的效率会把不同的节点分别再归类到不同分区。不同分区内的节点可以调用不同数量的核心数目,不同的内存数目,不同的最大运行时间等等。 当然除此之外还可以设置很多了。可以去你们超算看说明。或者作业系统的帮助文档。 wallclock time指的就是实际运行时间了。比如1点开始算 2点算完 那walclock时间就是 1小时。 并行同时用多个核心运行的任务,还会统计出cpu time, 也就是调用cpu的时间 这里面还得乘以核心数目。比如你调用100核心 一点开始算 2点算完 那cpu 时间是 100小时。 统计这个就是为了告诉你实际用掉了多少计算资源,可以帮你判定这个任务到底的计算成本是多少。(另一方面也是方便收钱,所谓“核时”) |
2楼2021-03-03 19:07:51













回复此楼