| 查看: 1622 | 回复: 5 | ||
沐心精灵木虫 (正式写手)
|
[求助]
求助:Rocks 6.1集群搭建不能跨节点并行已有2人参与
|
|
有没有大神知道用Rocks 6.1搭建集群时不能跨节点并行的原因啊? 集群由4台服务器组成,其中一个为前端节点,剩下的为计算节点。安装按照Rocks 6.1手册,并结合网上的一些教程,镜像全部为Rocks官方的。安装完前端节点和计算节点后,在、share/apps目录下安装了OpenMP(不用自带的)和intel Fortran,并设置环境变量等,同步到计算节点,并source环境变量。 按照上面的安装,CFD程序(自己的,包括CFL3D)可以编译,由SGE可提交至计算节点正常并行计算。但是问题是,当并行线程数超过某个计算节点的总线程数时,qstat给的结果是分配到两台节点上,但是到分配的节点top时发现,其实只在一个节点上并行而已。 例如,用64个线程运行程序,用命令qsub -pe mpich 64 RUN_Script在前端节点提交,刚好分配到了两台计算节点(总线程数分别为24和40),如下所示: [user01@cluster src]$ qstat -f queuename qtype resv/used/tot. load_avg arch states --------------------------------------------------------------------------------- all.q@compute-0-15.local BIP 0/40/40 0.00 linux-x64 129 0.55500 RUN_Script user01 r 02/14/2014 09:28:38 40 --------------------------------------------------------------------------------- all.q@compute-0-4.local BIP 0/24/24 0.07 linux-x64 129 0.55500 RUN_Script user01 r 02/14/2014 09:28:38 24 但是ssh到compute-0-15和compute-0-4上top看时,只有一个节点上有程序运行。我的任务脚本文件 RUN_Script内容如下: #!/bin/bash # #$ -cwd #$ -j y #$ -S /bin/bash # mpirun -machinefile $TMPDIR/machines -np $NSLOTS \ /home/user01/AxisJet/src/JET 集群内的计算节点和前端节点可以无密码ssh登录。搞了几天,实在是不知道问题何在啊!求虫友们指点啊,问题能解决,再追加赏币啊! |
» 猜你喜欢
请问有评职称,把科研教学业绩算分排序的高校吗
已经有6人回复
2025冷门绝学什么时候出结果
已经有6人回复
Bioresource Technology期刊,第一次返修的时候被退回好几次了
已经有7人回复
真诚求助:手里的省社科项目结项要求主持人一篇中文核心,有什么渠道能发核心吗
已经有8人回复
寻求一种能扛住强氧化性腐蚀性的容器密封件
已经有5人回复
请问哪里可以有青B申请的本子可以借鉴一下。
已经有4人回复
请问下大家为什么这个铃木偶联几乎不反应呢
已经有5人回复
天津工业大学郑柳春团队欢迎化学化工、高分子化学或有机合成方向的博士生和硕士生加入
已经有4人回复
康复大学泰山学者周祺惠团队招收博士研究生
已经有6人回复
AI论文写作工具:是科研加速器还是学术作弊器?
已经有3人回复
» 本主题相关价值贴推荐,对您同样有帮助:
Linux集群增加新用户的问题
已经有6人回复
Gaussian 软件的并行效率
已经有8人回复
关于linux下的任务管理软件比如PBS
已经有10人回复
集群和进程的问题
已经有3人回复
简单的vasp几个节点并行问题,求大神帮助!!!!!!!!!!!!!!!!
已经有3人回复
Linux下MS5.5安装成功,但只能在管理节点运行,无法在计算节点并行运行
已经有5人回复
2台服务器如何连接,并行计算?
已经有18人回复
vasp 集群并行出错
已经有7人回复
求教:ssh 登录集群某节点时不能进入home目录
已经有9人回复
关于 MS 5.5并行的问题
已经有4人回复
千兆网vasp跨节点并行慢的很,正常吗?
已经有12人回复
集群上的用户管理
已经有34人回复
vasp跨节点运行出错,mpiexec_node-1 (handle_stdin_input 1089)
已经有5人回复
集群mpich2调试出问题mpdboot -n 无法启动
已经有4人回复
集群中几个常用的命令(跟用户培训时用的文档)
已经有3人回复
【求助】mpi不并行。。。
已经有6人回复
【求助】vasp并行安装mpich2的错误
已经有10人回复
【求助】集群节点之间运行问题
已经有13人回复
【求助】集群,如何设置某个节点用多个CPU?
已经有5人回复
bluewhale
铁杆木虫 (正式写手)
- 应助: 58 (初中生)
- 金币: 8438.3
- 散金: 50
- 红花: 10
- 帖子: 890
- 在线: 362.2小时
- 虫号: 278289
- 注册: 2006-09-10
- 专业: 凝聚态物性I:结构、力学和
2楼2015-03-03 08:49:00
沐心精灵
木虫 (正式写手)
- 应助: 0 (幼儿园)
- 金币: 1360.4
- 散金: 20
- 红花: 1
- 帖子: 835
- 在线: 122.7小时
- 虫号: 1381766
- 注册: 2011-08-27
- 专业: 力学中的基本问题和方法
3楼2015-03-03 12:01:25
bluewhale
铁杆木虫 (正式写手)
- 应助: 58 (初中生)
- 金币: 8438.3
- 散金: 50
- 红花: 10
- 帖子: 890
- 在线: 362.2小时
- 虫号: 278289
- 注册: 2006-09-10
- 专业: 凝聚态物性I:结构、力学和
4楼2015-03-03 15:26:02
5楼2015-10-26 14:05:32
6楼2018-07-07 19:15:59













回复此楼