24小时热门版块排行榜    

CyRhmU.jpeg
查看: 2480  |  回复: 9
当前主题已经存档。
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

huangyc

木虫 (正式写手)

[交流] 【求助】如何跨节点并行

RT。每个节点8CPU,若想跨节点并行,如一次使用16CPU,如何实现,谢谢

写脚本的话请详细点告诉我,我Linux基础不好
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dirtor

木虫 (正式写手)


zeoliters(金币+1,VIP+0):感谢回复! 5-29 17:52
引用回帖:
Originally posted by huangyc at 2009-4-30 08:55:
LS说的的确是一种好方法,可以提高效率。我这里一般是做批处理,但不知道装Torque后可不可以实现跨节点并行

Torque可以实现
machinefile文件写起来也简单,如一次使用16个节点内容可以写
node1_hostname:8
node2_hostname:8


执行mpirun -machinefile machinefile文件名 -n Nprocess ur_program即可

[ Last edited by dirtor on 2009-4-30 at 09:35 ]
6楼2009-04-30 09:33:35
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 10 个回答

frank178

金虫 (正式写手)

★ ★
mingdong(金币+2,VIP+0):谢谢 4-29 07:30
这个啊,强烈建议楼主安装torque,相关的帖子到处都是。   如果要直接交互提交跨节点的任务,还要自己写machinefile等,一般都只是在集群刚刚构建好的时候,做调试用的。
2楼2009-04-28 16:22:06
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

huangyc

木虫 (正式写手)

谢谢LS!

我们的节点都是分配下来的,不用排队管理软件,我也没有管理权限。这是否意味这能写machinefile等呢?这个东西怎么写啊,谢谢
3楼2009-04-28 17:59:42
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

frank178

金虫 (正式写手)

★ ★
mingdong(金币+2,VIP+0):谢谢! 4-30 06:47
抱歉,真的既不清楚了  好像是就是执行计算任务的计算机的名称各一行吧   就算是分配下来给你专用的,也还是装管理软件比较好。 我专用的一台工作站我也装了Torque,这样子可以一次性提交好多任务,过几天再看就是了,效率提高很多
4楼2009-04-29 16:21:57
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复(可上传附件)
信息提示
请填处理意见