24小时热门版块排行榜    

北京石油化工学院2025年硕士研究生招生接受调剂公告
查看: 1859  |  回复: 7

ride138

新虫 (初入文坛)

[求助] CENTOS上安装Torque4.0.3找不到计算节点

给老板五台服务器弄成一个集群,打算用网上说的Torque+maui弄一个。
安装就是按照《曙光机群配置笔记》里说的配置,除了NFS、QUOTOA和NIS没弄以外,SSH和MPI都配置好了。
我在两台笔记本hp6531s 和hp4436s上测试,6531是服务节点,4436是计算节点。版本是torque4.0.3和maui3.3.1
配置过程如下:
####################
5.Torque 和 maui 的安装
5.1Torquer 在管理节点 node00 上的安装
使用 root 权限
tar zxvf torque-2.4.6.tar.gz
cd torque-2.4.6
./configure -prefix=/usr/local/software/torque-2.4.6 -with-rcp=scp
make
make install
安装完毕,但是需要
make packages
产生到计算节点安装的文件,其中产生的几个 sh 文件中最重要的是
torque-package-mom-linux-x86_64.sh 和 torque-package-clients-linux-x86_64.sh
5.2Torque 在管理节点上的配置
5.2.1
在/etc/profilie 中追加
export TORQUE=/usr/local/software/torque-2.4.6
export MAUI=/usr/local/software/maui-3.3.1
if [ "`id -u`" -eq 0 ]; then
PATH=$PATH:$TORQUE/bin:$TORQUE/sbin:$MAUI/bin:$MAUI/sbin
else
PATH=$PATH:$TORQUE/bin:$MAUI/bin
fi
这样使得 Torque 成为每一个用户的默认配置
其中/usr/local/software/ maui-3.3.1 是下面将要装的 maui 的安装目录
5.2.2
source /etc/profile
使环境变量生效
5.2.3
为 torque 设置一个管理员,必须是普通的账户
在编译安装 Torque 的目录里面执行:
./torque.setup test
这样 test 就成了 Torque 的管理员,如果不设置管理员,没法运行 torque
5.2.4
在/var/spool/torque/server_priv/nodes 中添加计算节点的机器名,
其中 np 表示节点上可用的处
理单元数,类似:
node01
np=12
node02 np=12
node03 np=12
node04 np=12
node05 np=12
node06 np=12
node07 np=12
node08 np=12
node09 np=12
node10 np=12
node11 np=12
node12 np=12
5.2.5 创建作业队列
设置默认队列为 lab206
依次在命令行输入
qmgr -c "set server scheduling=true"
确定服务器使用排队策略
qmgr -c "create queue lab206 queue_type=execution"
创建队列 lab206
qmgr -c "set queue lab206 started=true"
使 lab206 队列中的任务可以执行
qmgr -c "set queue lab206 enabled=true"
使 lab206 队列能够接受新的任务
qmgr -c " set server default_queue= lab206 "
使 lab206 队列成为服务器的默认队列
如果不设置默认队列可以用:
qmgr -c " set server default_queue= NONE "
5.2.6
设定 pbs_mom 服务器:/var/spool/torque/server_name 为 node00
5.2.7
设定 mom config:/var/spool/torque/mom_priv/config 为 node00
(新建立文件)
5.2.8
启用 mom:
pbs_mom
5.2.9
重新 pbs 服务器:
qterm -t quick
pbs_server
5.2.10
检验配置参数
查看队列
qstat -q
该选项能看到刚刚创建的队列,应该是一个空队列,因为没有任务提交
查看服务节点配置
qmgr -c 'p s'
查看计算节点
pbsnodes -a
看到 nodes 文件里面写的节点的信息,但都处于 down 的状态,因为还没有配置计算节点。
5.3 Torque 在计算节点上的配置
5.3.1
在/etc/profilie 中追加
export TORQUE=/usr/local/software/torque-2.4.6
if [ "`id -u`" -eq 0 ]; then
PATH=$PATH:$TORQUE/bin:$TORQUE/sbin
else
PATH=$PATH:$TORQUE/bin
fi
5.3.2
source /etc/profile
使环境变量生效
5.4 在管理节点上安装 maui
5.4.1 安装
tar zxvf maui-3.3.1.tar.gz
cd maui-3.3.1
./configure -prefix=/usr/local/software/maui-3.3.1 -with-pbs=/usr/local/software/torque-2.4.6
make
make install
5.4.2 配置
修改/usr/local/maui/maui.cfg 文件
ADMIN1 root
5.4.3 启动 maui:
source /etc/profile 使刚才的设置重新生效
maui
maui 只需在服务节点上安装,计算节点上不必安装
5.5 计算节点上安装 torque
利用刚才生成的那两个重要的 sh 文件,
将这两个文件拷贝到 /home 下,然后,到各个计算节点上执行
torque-package-clients-linux-x86_64.sh --install
torque-package-mom-linux-x86_64.sh --install
5.6 计算节点上的配置
在各个计算节点创建文件/var/spool/torque/mom_priv/config,内容如下:
$pbsserver node00
$logevent 255
$usecp
node00: /home /home
并且在各个计算节点上将
/usr/local/software/torque-2.4.6/sbin/pbs_mom
写入/etc/init.d/after.local (新建)
并且修改权限 chmod 755 /etc/init.d/after.local
然后运行
/usr/local/software/torque-2.4.6/sbin/pbs_mom
这个时候到 node00 上运行 pbsnodes
就会看到所有的机器都启动了
这个时候回到 node00 上将下列内容添加到/etc/init.d/after.local
/usr/local/software/torque-2.4.6/sbin/pbs_server
/usr/local/software/maui-3.3.1/sbin/maui
chmod 755 /etc/init.d/after.local
########################


现在问题来了,
但是按照《曙》一文配置好了以后,pbsnodes命令显示计算节点stat:down。但是ssh可以无密码链接,也能ping通。
我又在计算节点上重新整体安装了torque以后,只启动pbs_mom,按照《曙》一文配置以后pbsnodes依然找不到计算节点。
并且主机上的提交的任务,没有进行排序,而是直接被挂了起来,qstat -a 显示 stat: Q。必须qrun强制执行才能跑,不能进行排队。这是因为还需要进行额外设置吗?
已经被折磨了一星期了,求解啊!
回复此楼

» 收录本帖的淘帖专辑推荐

宝贝

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
ride138: 金币+10, 有帮助, 虽然没有解决,但还是非常感谢你 2012-05-31 11:01:48
在管理节点检查:
ps -A |grep pbs
看是否能够出来一个pbs_server的进程
ps -A |grep maui
看是否能够出来一个maui的进程

然后到计算节点
ps -A |grep pbs
看能否出来一个叫pbs_mom的进程

如果都有的话,在你安装都没有出错的前提下,那应该就是Torque和Maui没有交流。不清楚是不是这两个版本匹配不好。
弘德明志博学笃行
2楼2012-05-30 11:13:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ride138

新虫 (初入文坛)

引用回帖:
2楼: Originally posted by zhangguangping at 2012-05-30 11:13:13
在管理节点检查:
ps -A |grep pbs
看是否能够出来一个pbs_server的进程
ps -A |grep maui
看是否能够出来一个maui的进程

然后到计算节点
ps -A |grep pbs
看能否出来一个叫pbs_mom的进程

如果都有的话 ...

请问你说的maui的原因指的是不能排队的原因,还是找不到计算节点的原因?现在maui确实有问题,我想make uninstall 卸载都卸载不了
3楼2012-05-30 12:19:18
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ride138

新虫 (初入文坛)

补充说明:
我把服务节点也设定为计算节点,pbsnodes显示只有服务节点上的计算节点可用,别的电脑上的计算节点都是stat : down
4楼2012-05-30 13:20:52
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

nanoseer

金虫 (小有名气)


fegg7502: 金币+1, 鼓励交流 2013-01-30 08:53:31
这说明计算节点和主节点之间通讯有问题
5楼2013-01-29 16:24:16
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zzr0427

新虫 (初入文坛)

内容已删除
6楼2013-03-29 16:08:28
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yaozhq

金虫 (小有名气)


csgt0: 金币+1, 谢谢 2013-10-22 09:25:40
引用回帖:
4楼: Originally posted by ride138 at 2012-05-30 13:20:52
补充说明:
我把服务节点也设定为计算节点,pbsnodes显示只有服务节点上的计算节点可用,别的电脑上的计算节点都是stat : down

首先确定所有机器的防火墙都是关闭的 很重要!!
如果感觉不安全 等调试好之后把相关端口加进许可列表
还有没有看到你配置HOSTS文件(/etc/hosts)例如
192.168.1.10  node001
192.168.1.11  node002
192.168.1.12  node003
192.168.1.13  node004
这样保证了机器间通过名字可以互相访问 可以ping node001或者ssh node001
7楼2013-10-19 13:57:18
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

maoshanjun

新虫 (正式写手)

楼主是怎么解决问题的?我也碰到了同样的问题
8楼2014-08-08 19:15:14
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 ride138 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 273求调剂 +3 玉珏Yj 2025-04-06 3/150 2025-04-06 17:01 by 诗与自由
[考研] 273分求调剂 +5 一只下猫 2025-04-06 5/250 2025-04-06 12:38 by 黑!在干嘛
[教师之家] 2025中科院分区神刊 +3 jurkat.1640 2025-04-03 4/200 2025-04-06 10:30 by nono2009
[考研] 一志愿合肥工业大学085701环境工程279求调剂 +9 柠七七七 2025-04-04 9/450 2025-04-06 07:54 by simons1972
[考研] 电子信息招调剂生 +3 源源233 2025-04-05 5/250 2025-04-05 15:44 by 源源233
[考研] 302求调剂 +7 想要上学??? 2025-04-05 7/350 2025-04-05 10:10 by siwuhen
[考研] 想上学 +3 上学啦! 2025-04-05 3/150 2025-04-05 09:49 by 木卜心
[考研] 材料与化工085600求调剂 +10 cs0106 2025-04-04 10/500 2025-04-04 22:49 by 诗与自由
[考研] 一志愿郑州大学材料与化工总分262求调剂 +6 agyhg 2025-04-04 6/300 2025-04-04 21:55 by 诗与自由
[考研] 调剂 +4 旧梦倪妮 2025-04-04 4/200 2025-04-04 21:32 by Ade.
[考研] 313求调剂 +9 Pj. 2025-04-01 9/450 2025-04-04 14:06 by 诗与自由
[考研] 282求调剂 +3 非月不非 2025-04-04 3/150 2025-04-04 10:29 by 来看流星雨10
[考研] 0817化工学硕263求调剂 +19 咕噜咕噜I 2025-04-02 21/1050 2025-04-04 08:41 by cp872168381
[考研] 考研调剂 +9 小阿泰a 2025-04-03 9/450 2025-04-03 20:51 by Ade.
[考研] 292求调剂 +4 2025417 2025-04-03 4/200 2025-04-03 18:01 by mg1014
[考研] 总分375材料求调剂 +6 Zcq清 2025-03-31 6/300 2025-04-02 23:43 by microscopy
[考研] 复试调剂 +5 基态基态 2025-04-01 5/250 2025-04-02 14:54 by 江苏海洋大学招�
[考研] 一志愿东南大学材料学硕,初试342分求调剂 +7 好想读研啊啊 2025-04-01 7/350 2025-04-02 09:00 by bingyu0729
[考研] 理学化学调剂 +6 孜孜不辍 2025-03-31 9/450 2025-04-01 10:47 by xhai2011
[考研] 080500材料科学工程复试调剂 +7 骆小咪 2025-03-31 7/350 2025-03-31 20:13 by panzt
信息提示
请填处理意见
婵犵數濮伴崹鐓庘枖濞戞氨鐭撻柣鎴eГ閸庡﹥銇勯弽銊х煁閻庢凹鍓熼弻娑㈠箛閳轰礁顬堝銈忕秶閹凤拷婵犵數濮伴崹鐓庘枖濞戞氨鐭撻柣鎴eГ閸庡﹥銇勯弽銊х煁閻庢凹鍓熼弻娑㈠箛閳轰礁顬堝銈忕秶閹凤拷
婵犵數濮伴崹鐓庘枖濞戞氨鐭撻柣鎴eГ閸庡﹥銇勯弽銊х煁閻庢凹鍓熼弻娑㈠箛閳轰礁顬堝銈忕秶閹凤拷婵犵數鍋涢悺銊у垝瀹€鍕剶闁绘挸鏀绘惔顭戞晪闁逞屽墴楠炲棗顓兼径瀣闂佽法鍣﹂幏锟�闂傚倷绀侀崥瀣磿閹惰棄搴婇柤鑹扮堪娴滃綊鏌涢妷锝呭缂佸墎鍋熼埀顒€绠嶉崕閬嶆偋韫囨拹锝夋晸閿燂拷 & 闂備浇宕垫慨鎾敄閸涙潙鐤い鎰剁稻濞呯娀鐓崶銊р槈缂佺姳鍗抽弻娑㈠Ψ閹存繂鏆熸い銏犳嚇濮婃椽骞愭惔鈥虫灆闂佺懓鍤栭幏锟�闂佽娴烽弫濠氬磻婵犲洤绐楅柡鍥╁枔閳瑰秴鈹戦悩鍙夋悙缂佺姰鍎查妵鍕箛閸撲胶锛熷銈呯箻娴滃爼寮婚悢鍝勬瀳濠㈣泛顑呴锟�
闂傚倷绀侀幗婊堝窗鎼粹垾娑樜旀担鐟板伎闂佺粯姊婚崢褏鎲撮敃鍌涚厱妞ゆ劧绲块惌宀€绱掔€h埖瀚�闂傚倷绀侀幗婊堝窗鎼粹垾娑樜旀担鐟板伎闂佺粯姊婚崢褏鎲撮敃鍌涚厱妞ゆ劧绲块惌宀€绱掔€h埖瀚�
闂傚倷绀侀幗婊堝窗鎼粹垾娑樜旀担鐟板伎闂佺粯姊婚崢褏鎲撮敃鍌涚厱妞ゆ劧绲块惌宀€绱掔€h埖瀚�婵犵數鍋涢悺銊у垝瀹€鍕剶闁绘挸鏀绘惔顭戞晪闁逞屽墴楠炲棗顓兼径瀣闂佽法鍣﹂幏锟�闂傚倷绀侀幗婊堝窗鎼粹垾娑樜旀担鐟板伎闂佺粯姊婚崢褏鎲撮敃鍌涚厱妞ゆ劧绲块惌宀€绱掔€n亷韬柡灞剧☉閳瑰啴宕归纰辨綂婵$偑鍊栧ú鈺呭箯閿燂拷闂佽娴烽弫濠氬磻婵犲洤绐楅柡鍥╁枔閳瑰秴鈹戦悩鍙夋悙缂佺姰鍎查妵鍕箛閸撲胶锛熷銈呯箻娴滃爼寮婚悢鍝勬瀳濠㈣泛顑呴锟�(婵犵數濮伴崹鐓庘枖濞戞◤娲晝閸屾碍鐎梺缁樺姉閸庛倝寮查浣瑰弿婵妫楁晶顖涚箾閸涱厾鐒搁柡灞剧洴瀵剛鎮伴垾鍏呭闂佹儳娴氶崑鍕焵椤戞儳鈧洟婀侀梺鎸庣箓缁绘垹鈧熬鎷�)
闂備浇顕х€涒晠宕樻繝姘挃闁告洦鍋撻懓鍧楁煙閸撲焦娅曠€规挷绶氶弻銈夋嚌閺夎法鍘悷婊冨簻閹凤拷闂備浇顕х€涒晠宕樻繝姘挃闁告洦鍋撻懓鍧楁煙閸撲焦娅曠€规挷绶氶弻銈夋嚌閺夎法鍘悷婊冨簻閹凤拷
闂備浇顕х€涒晠宕樻繝姘挃闁告洦鍋撻懓鍧楁煙閸撲焦娅曠€规挷绶氶弻銈夋嚌閺夎法鍘悷婊冨簻閹凤拷婵犵數鍋涢悺銊у垝瀹€鍕剶闁绘挸鏀绘惔顭戞晪闁逞屽墴楠炲棗顓兼径瀣闂佽法鍣﹂幏锟�闂佽娴烽弫濠氬磻婵犲洤绐楅柡鍥╁枔閳瑰秴鈹戦悩鍙夋悙缂佺姰鍎查妵鍕箛閸撲胶锛熷銈呯箻娴滃爼寮婚悢鍝勬瀳濠㈣泛顑呴锟�婵犵數鍋涢悺銊у垝鐏炶娇娑樷堪閸♀晜姣庨梻鍌欑閹碱偊鎮ч崘顔肩;闁瑰墽绮悡娑㈡煕鐏炲墽鈯曠紒璺哄级閵囧嫰骞掗弬鎸庣亪閻庢鍠氶弫濠氥€佸☉姗嗘僵妞ゆ巻鍋撶憸鐗堢懇閺岋綁鎮╅崘鎻捫侀梺鐟板殩閹凤拷
闂備浇宕垫慨鎶芥嚄閸洖纾块柕鍫濐槸閸戠娀鏌涢幇銊︽珕缂傚秴娲弻娑樷槈閸楃偛瀛i梺鎼炲€ч幏锟�闂備浇宕垫慨鎶芥嚄閸洖纾块柕鍫濐槸閸戠娀鏌涢幇銊︽珕缂傚秴娲弻娑樷槈閸楃偛瀛i梺鎼炲€ч幏锟�
闂備浇宕垫慨鎶芥嚄閸洖纾块柕鍫濐槸閸戠娀鏌涢幇銊︽珕缂傚秴娲弻娑樷槈閸楃偛瀛i梺鎼炲€ч幏锟�婵犵數鍋涢悺銊у垝瀹€鍕剶闁绘挸鏀绘惔顭戞晪闁逞屽墴楠炲棗顓兼径瀣闂佽法鍣﹂幏锟�闂佽娴烽弫濠氬磻婵犲洤绐楅柡鍥╁枔閳瑰秴鈹戦悩鍙夋悙缂佺姰鍎查妵鍕箛閸撲胶锛熷銈呯箻娴滃爼寮婚悢鍝勬瀳濠㈣泛顑呴锟�濠电姷鏁搁崕鎴犵礊閳ь剚銇勯弴鍡楀閸欏繘鏌i幇顔煎妺闁搞倐鍋撳┑鐐舵彧缁蹭粙骞楀⿰鍫熷仭閹兼番鍔嶉悡銉︾箾閹寸們鍦偓姘嵆閺屾稑螣缁嬪簱鍋撳Δ鍛鐟滅増甯楅崑锟犳煟濡も偓閻楀棝鎯冩导瀛樼厽闁绘ê寮剁粊顐︽煙閸戙倖瀚�
闂備焦鐪归崺鍕垂娴煎瓨鍋嬮柟閭﹀枤閻牊銇勯幇鍓佺暠缂佺媭鍨辩换娑㈠箣閻忔椿浜幃鐢告晸閿燂拷闂備焦鐪归崺鍕垂娴煎瓨鍋嬮柟閭﹀枤閻牊銇勯幇鍓佺暠缂佺媭鍨辩换娑㈠箣閻忔椿浜幃鐢告晸閿燂拷