24小时热门版块排行榜    

查看: 1730  |  回复: 5

沐心精灵

木虫 (正式写手)

[求助] 求助:Rocks 6.1集群搭建不能跨节点并行 已有2人参与

有没有大神知道用Rocks 6.1搭建集群时不能跨节点并行的原因啊?
集群由4台服务器组成,其中一个为前端节点,剩下的为计算节点。安装按照Rocks 6.1手册,并结合网上的一些教程,镜像全部为Rocks官方的。安装完前端节点和计算节点后,在、share/apps目录下安装了OpenMP(不用自带的)和intel Fortran,并设置环境变量等,同步到计算节点,并source环境变量。
按照上面的安装,CFD程序(自己的,包括CFL3D)可以编译,由SGE可提交至计算节点正常并行计算。但是问题是,当并行线程数超过某个计算节点的总线程数时,qstat给的结果是分配到两台节点上,但是到分配的节点top时发现,其实只在一个节点上并行而已。
例如,用64个线程运行程序,用命令qsub -pe mpich 64 RUN_Script在前端节点提交,刚好分配到了两台计算节点(总线程数分别为24和40),如下所示:
[user01@cluster src]$ qstat -f
queuename                      qtype resv/used/tot. load_avg arch          states
---------------------------------------------------------------------------------
all.q@compute-0-15.local       BIP   0/40/40        0.00     linux-x64     
    129 0.55500 RUN_Script user01       r     02/14/2014 09:28:38    40        
---------------------------------------------------------------------------------
all.q@compute-0-4.local        BIP   0/24/24        0.07     linux-x64     
    129 0.55500 RUN_Script user01       r     02/14/2014 09:28:38    24
但是ssh到compute-0-15和compute-0-4上top看时,只有一个节点上有程序运行。我的任务脚本文件 RUN_Script内容如下:
#!/bin/bash
#
#$ -cwd
#$ -j y
#$ -S /bin/bash
#
mpirun -machinefile $TMPDIR/machines -np $NSLOTS \
/home/user01/AxisJet/src/JET
集群内的计算节点和前端节点可以无密码ssh登录。搞了几天,实在是不知道问题何在啊!求虫友们指点啊,问题能解决,再追加赏币啊!
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bluewhale

铁杆木虫 (正式写手)

【答案】应助回帖

感谢参与,应助指数 +1
查看一下$TMPDIR/machines是否你希望的东西?
用which mpirun查看是用的哪一个mpirun?
2楼2015-03-03 08:49:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

沐心精灵

木虫 (正式写手)

引用回帖:
2楼: Originally posted by bluewhale at 2015-03-03 08:49:00
查看一下$TMPDIR/machines是否你希望的东西?
用which mpirun查看是用的哪一个mpirun?

$TMPDIR/machines是SGE定义的,这个文件似乎找不到。mpirun指向我自己安装的openmpi-1.4.5版本的。现在是普通方法(不通过SGE)是可以跨机计算了,但是用qsub只能提交到一台机子上(实际运行),但是qstat -f的结果还是分配多个节点。
3楼2015-03-03 12:01:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bluewhale

铁杆木虫 (正式写手)

引用回帖:
3楼: Originally posted by 沐心精灵 at 2015-03-03 12:01:25
$TMPDIR/machines是SGE定义的,这个文件似乎找不到。mpirun指向我自己安装的openmpi-1.4.5版本的。现在是普通方法(不通过SGE)是可以跨机计算了,但是用qsub只能提交到一台机子上(实际运行),但是qstat -f的结果 ...

qstat -n查看节点信息。
4楼2015-03-03 15:26:02
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

kka

金虫 (初入文坛)

【答案】应助回帖

查看下SGE配置的文件,看看用户组允许使用的节点
5楼2015-10-26 14:05:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

狻猊-狴犴

新虫 (初入文坛)

我也遇到同样的问题了。请问您最后解决这个问题了吗?谢谢您~期待您的回复
6楼2018-07-07 19:15:59
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 沐心精灵 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[文学芳草园] 伙伴们,祝我生日快乐吧 +17 myrtle 2026-03-10 26/1300 2026-03-16 18:32 by 青橙Ln
[考研] 化学调剂0703 +8 啊我我的 2026-03-11 8/400 2026-03-16 17:23 by 我的船我的海
[考研] 化学工程321分求调剂 +9 大米饭! 2026-03-15 9/450 2026-03-16 16:41 by 我的船我的海
[考研] 0703一志愿211 285分求调剂 +5 ly3471z 2026-03-13 5/250 2026-03-16 16:16 by 哦哦123
[考研] 283求调剂 +10 小楼。 2026-03-12 14/700 2026-03-16 16:08 by 13811244083
[基金申请] 国自科面上基金字体 +5 iwuli 2026-03-12 6/300 2026-03-16 13:13 by Kamiu_MK
[考研] 材料专硕326求调剂 +4 墨煜姒莘 2026-03-15 4/200 2026-03-15 11:02 by dyw
[考研] 267一志愿南京工业大学0817化工求调剂 +5 SUICHILD 2026-03-12 5/250 2026-03-14 14:53 by jean5056
[考研] 云南财经大学信息学院计算机学硕专硕学位点 +3 zjptai 2026-03-10 5/250 2026-03-14 01:23 by 飞行琦
[基金申请] 有必要更换申报口吗 20+3 fannyamoy 2026-03-11 3/150 2026-03-14 00:52 by zhanghaozhu
[考研] 307求调剂 +7 超级伊昂大王 2026-03-10 7/350 2026-03-14 00:49 by JourneyLucky
[考研] 一志愿湖师大化学289求调剂 +6 XMCMM3.14159 2026-03-10 6/300 2026-03-14 00:28 by JourneyLucky
[考研] 材料与化工求调剂一志愿 985 总分 295 +8 dream…… 2026-03-12 8/400 2026-03-13 22:17 by 星空星月
[考研] 308求调剂 +5 是Lupa啊 2026-03-11 5/250 2026-03-13 22:13 by JourneyLucky
[考研] 【考研调剂求收留】 +3 Ceciilia 2026-03-11 3/150 2026-03-13 20:18 by JourneyLucky
[考研] 0703化学求调剂 +7 绿豆芹菜汤 2026-03-12 7/350 2026-03-13 17:25 by njzyff
[考研] 考研调剂 +4 芬达46 2026-03-12 4/200 2026-03-13 16:04 by ruiyingmiao
[考研] 274求调剂 +3 S.H1 2026-03-12 3/150 2026-03-13 15:15 by JourneyLucky
[论文投稿] 投稿问题 5+4 星光灿烂xt 2026-03-12 6/300 2026-03-13 14:17 by god_tian
[考研] 270求调剂 085600材料与化工专硕 +3 YXCT 2026-03-11 3/150 2026-03-13 10:13 by houyaoxu
信息提示
请填处理意见