| 查看: 1351 | 回复: 13 | |||
| 本帖产生 1 个 计算强帖 ,点击这里进行查看 | |||
xiaowu787木虫 (正式写手)
|
[交流]
【讨论】PC-cluster的管理已有3人参与
|
||
|
PC-cluster的管理 实验室有几台计算机并行计算,一旦一台死机重启后,mpi,pbs就无法提交任务,出现这种情况一般怎么解决?谢谢 |
» 猜你喜欢
求2026年在台湾举行的物理和材料领域国际学术会议信息
已经有0人回复
求国际会议网站
已经有1人回复
物理学I论文润色/翻译怎么收费?
已经有101人回复
求取一些关于纳米材料和纳米技术相关的英文PPT。
已经有0人回复
【复旦大学】二维材料方向招收2026年博士研究生1名
已经有0人回复
北京纳米能源与系统研究所 王中林院士/曹南颖研究员课题组2026级硕/博/博后招生
已经有10人回复
荷兰Utrecht University超快太赫兹光谱王海教授课题招收2026 CSC博士生
已经有19人回复
反铁磁体中的磁性切换:两种不同的机制已成功可视化
已经有0人回复
26申博推荐:南京航空航天大学国际前沿院光学方向招收博士生!
已经有0人回复
求标准粉末衍射卡号 ICDD 01-076-1802
已经有0人回复
» 本主题相关价值贴推荐,对您同样有帮助:
请问MS-linux-cluster安装之后无法并行的问题?
已经有5人回复
服务器上计算,图形界面及图像处理问题思考
已经有19人回复
09年晶体牛人名家实验室链接介绍(回帖有金币)
已经有161人回复
abbott
金虫 (著名写手)
不要用QQ问我东西
- 计算强帖: 1
- 应助: 16 (小学生)
- 金币: 1071.6
- 散金: 2787
- 红花: 10
- 帖子: 1015
- 在线: 105.2小时
- 虫号: 452267
- 注册: 2007-11-05
- 性别: GG
- 专业: 计算机硬件技术

2楼2010-07-16 23:19:42
xiaowu787
木虫 (正式写手)
- 应助: 1 (幼儿园)
- 金币: 1411.9
- 散金: 95
- 红花: 1
- 帖子: 550
- 在线: 430.1小时
- 虫号: 326816
- 注册: 2007-03-18
- 性别: GG
3楼2010-07-17 10:03:52
onesupeng
金虫 (职业作家)
- 计算强帖: 13
- 应助: 256 (大学生)
- 贵宾: 1.36
- 金币: 2336.2
- 散金: 9212
- 红花: 92
- 帖子: 4583
- 在线: 1303.8小时
- 虫号: 394701
- 注册: 2007-06-07
- 专业: 流体力学
★ ★ ★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
fegg7502(金币+4, 计算强帖+1):多谢参与 2010-07-19 18:23:04
小木虫(金币+0.5):给个红包,谢谢回帖交流
fegg7502(金币+4, 计算强帖+1):多谢参与 2010-07-19 18:23:04
|
其实可能是你的pbs装的不是很好。可以重新启动pbs。用以下这种方法启动,可不影响正在运行的作业: 在/etc/init.d/做了个pbs_sched的文件,并chmod 777 pbs_sched。运行: /sbin/service pbs_sched restart qterm -t quick /usr/local/sbin/pbs_server 三个命令。其中/etc/init.d/pbs_sched的内容为(针对你的具体情况,更改相应路径) #!/bin/sh # # pbs_sched This script will start and stop the PBS Scheduler # # chkconfig: 345 95 5 # description: PBS is a batch versatile batch system for SMPs and clusters # # Source the library functions . /etc/rc.d/init.d/functions PBS_DAEMON=/usr/local/sbin/pbs_sched export PBS_DAEMON if [ -f /etc/sysconfig/pbs_sched ];then . /etc/sysconfig/pbs_sched fi # let see how we were called case "$1" in start) echo -n "Starting TORQUE Scheduler: " daemon $PBS_DAEMON RET=$? touch /var/lock/subsys/pbs_sched echo ;; stop) echo -n "Shutting down TORQUE Scheduler: " killproc pbs_sched RET=$? rm -f /var/lock/subsys/pbs_sched echo ;; status) status pbs_sched RET=$? ;; restart) $0 stop $0 start ;; reload) echo -n "Reloading pbs_sched: " killproc pbs_sched -HUP RET=$? echo ;; *) echo "Usage: pbs_sched {start|stop|restart|status}" exit 1 esac exit $RET |

4楼2010-07-18 14:13:48
xiaowu787
木虫 (正式写手)
- 应助: 1 (幼儿园)
- 金币: 1411.9
- 散金: 95
- 红花: 1
- 帖子: 550
- 在线: 430.1小时
- 虫号: 326816
- 注册: 2007-03-18
- 性别: GG
|
[root@manage sbin]# service pbs_sched restart Shutting down TORQUE Scheduler: [确定] Starting TORQUE Scheduler: [确定] [root@manage sbin]# qterm -t quick [root@manage sbin]# cd usr/local/sbin/ [root@manage sbin]# pbs_server [root@manage sbin]# 按您说的操作了一遍,过程如上,不知有没有错误的地方,但是还是不能mpi. 谢谢,我想再问一下,一台机子已经重启了,mpi不能用了,该怎么恢复mpi? [ Last edited by xiaowu787 on 2010-7-19 at 18:37 ] |
5楼2010-07-19 18:14:12
onesupeng
金虫 (职业作家)
- 计算强帖: 13
- 应助: 256 (大学生)
- 贵宾: 1.36
- 金币: 2336.2
- 散金: 9212
- 红花: 92
- 帖子: 4583
- 在线: 1303.8小时
- 虫号: 394701
- 注册: 2007-06-07
- 专业: 流体力学

6楼2010-07-19 20:59:56
xiaowu787
木虫 (正式写手)
- 应助: 1 (幼儿园)
- 金币: 1411.9
- 散金: 95
- 红花: 1
- 帖子: 550
- 在线: 430.1小时
- 虫号: 326816
- 注册: 2007-03-18
- 性别: GG
7楼2010-07-19 21:04:05
onesupeng
金虫 (职业作家)
- 计算强帖: 13
- 应助: 256 (大学生)
- 贵宾: 1.36
- 金币: 2336.2
- 散金: 9212
- 红花: 92
- 帖子: 4583
- 在线: 1303.8小时
- 虫号: 394701
- 注册: 2007-06-07
- 专业: 流体力学

8楼2010-07-19 21:47:28
xiaowu787
木虫 (正式写手)
- 应助: 1 (幼儿园)
- 金币: 1411.9
- 散金: 95
- 红花: 1
- 帖子: 550
- 在线: 430.1小时
- 虫号: 326816
- 注册: 2007-03-18
- 性别: GG
9楼2010-07-19 22:20:24
onesupeng
金虫 (职业作家)
- 计算强帖: 13
- 应助: 256 (大学生)
- 贵宾: 1.36
- 金币: 2336.2
- 散金: 9212
- 红花: 92
- 帖子: 4583
- 在线: 1303.8小时
- 虫号: 394701
- 注册: 2007-06-07
- 专业: 流体力学

10楼2010-07-19 22:23:00













回复此楼