| 查看: 1637 | 回复: 5 | ||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | ||
沐心精灵木虫 (正式写手)
|
[求助]
求助:Rocks 6.1集群搭建不能跨节点并行已有2人参与
|
|
|
有没有大神知道用Rocks 6.1搭建集群时不能跨节点并行的原因啊? 集群由4台服务器组成,其中一个为前端节点,剩下的为计算节点。安装按照Rocks 6.1手册,并结合网上的一些教程,镜像全部为Rocks官方的。安装完前端节点和计算节点后,在、share/apps目录下安装了OpenMP(不用自带的)和intel Fortran,并设置环境变量等,同步到计算节点,并source环境变量。 按照上面的安装,CFD程序(自己的,包括CFL3D)可以编译,由SGE可提交至计算节点正常并行计算。但是问题是,当并行线程数超过某个计算节点的总线程数时,qstat给的结果是分配到两台节点上,但是到分配的节点top时发现,其实只在一个节点上并行而已。 例如,用64个线程运行程序,用命令qsub -pe mpich 64 RUN_Script在前端节点提交,刚好分配到了两台计算节点(总线程数分别为24和40),如下所示: [user01@cluster src]$ qstat -f queuename qtype resv/used/tot. load_avg arch states --------------------------------------------------------------------------------- all.q@compute-0-15.local BIP 0/40/40 0.00 linux-x64 129 0.55500 RUN_Script user01 r 02/14/2014 09:28:38 40 --------------------------------------------------------------------------------- all.q@compute-0-4.local BIP 0/24/24 0.07 linux-x64 129 0.55500 RUN_Script user01 r 02/14/2014 09:28:38 24 但是ssh到compute-0-15和compute-0-4上top看时,只有一个节点上有程序运行。我的任务脚本文件 RUN_Script内容如下: #!/bin/bash # #$ -cwd #$ -j y #$ -S /bin/bash # mpirun -machinefile $TMPDIR/machines -np $NSLOTS \ /home/user01/AxisJet/src/JET 集群内的计算节点和前端节点可以无密码ssh登录。搞了几天,实在是不知道问题何在啊!求虫友们指点啊,问题能解决,再追加赏币啊! |
» 猜你喜欢
博士读完未来一定会好吗
已经有28人回复
博士申请都是内定的吗?
已经有4人回复
之前让一硕士生水了7个发明专利,现在这7个获批发明专利的维护费可从哪儿支出哈?
已经有3人回复
到新单位后,换了新的研究方向,没有团队,持续积累2区以上论文,能申请到面上吗
已经有12人回复
投稿精细化工
已经有4人回复
高职单位投计算机相关的北核或SCI四区期刊推荐,求支招!
已经有4人回复
导师想让我从独立一作变成了共一第一
已经有9人回复
读博
已经有4人回复
JMPT 期刊投稿流程
已经有4人回复
心脉受损
已经有5人回复
» 本主题相关价值贴推荐,对您同样有帮助:
Linux集群增加新用户的问题
已经有6人回复
Gaussian 软件的并行效率
已经有8人回复
关于linux下的任务管理软件比如PBS
已经有10人回复
集群和进程的问题
已经有3人回复
简单的vasp几个节点并行问题,求大神帮助!!!!!!!!!!!!!!!!
已经有3人回复
Linux下MS5.5安装成功,但只能在管理节点运行,无法在计算节点并行运行
已经有5人回复
2台服务器如何连接,并行计算?
已经有18人回复
vasp 集群并行出错
已经有7人回复
求教:ssh 登录集群某节点时不能进入home目录
已经有9人回复
关于 MS 5.5并行的问题
已经有4人回复
千兆网vasp跨节点并行慢的很,正常吗?
已经有12人回复
集群上的用户管理
已经有34人回复
vasp跨节点运行出错,mpiexec_node-1 (handle_stdin_input 1089)
已经有5人回复
集群mpich2调试出问题mpdboot -n 无法启动
已经有4人回复
集群中几个常用的命令(跟用户培训时用的文档)
已经有3人回复
【求助】mpi不并行。。。
已经有6人回复
【求助】vasp并行安装mpich2的错误
已经有10人回复
【求助】集群节点之间运行问题
已经有13人回复
【求助】集群,如何设置某个节点用多个CPU?
已经有5人回复
5楼2015-10-26 14:05:32












回复此楼