24小时热门版块排行榜    

查看: 1192  |  回复: 4
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

xrhinoceros

金虫 (小有名气)

[求助] mpich2杀进程的问题

不知道各位大侠有没有遇到这样的情况,自己搭建的小型cluster,用mpich2做并行环境,然后并行vasp,如果想杀死作业,在一台机器上killall -9 vasp之后,有时候其他结点的相关进程也会终止,这是我们想要的情况。可有些时候,其他节点的vasp进程还在,要一台机器一台机器的去杀!

请问这是为什么?有什么解决的办法没有?
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dxcharlary

专家顾问 (职业作家)

★ ★
youzhizhe(金币+2): 谢谢交流。 2011-08-17 15:12:50
很少情况下会出现这个问题,不是很经常。好像是系统bug。估计是linux系统本身的稳定性问题。这个东西在系统过忙运行程序较多时,比较容易出现。而且我感觉貌似可视化的Xterm比文字界面的ssh更容易出现这种问题。
另外mpiboot之后,mpich本身会建一个python进程,那个进程不能动,一旦kill后果很严重。

» 本帖已获得的红花(最新10朵)

4楼2011-08-17 12:00:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 5 个回答

jjf_sxnu

铜虫 (正式写手)

【答案】应助回帖

★ ★ ★
franch(金币+3): 谢谢回帖交流 2011-08-15 23:46:32
xrhinoceros(金币+2): 2011-08-16 02:27:17
首先你的节点文件可能导致你在一台节点上运行了多个Vasp任务(如你启用8个进程,提供了8个节点,则在每台机子上只启动一个进程,如果你的计算机是多核的,则还可以有为其它任务提供CPU。),你用killall命令则会杀死所用名为vasp的进程,如果此时,在某一节点机上运行了多个任务,就都杀死了。你可以在启动任务的时候记录任务号来精确杀死一个任务,另外就是自己保证在每个节点上只运行一个相关任务。最好的办法是结合PBS系统。
2楼2011-08-15 23:32:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xrhinoceros

金虫 (小有名气)

我现在装了slurm作业管理器,然后scancel jobid的时候,还是存在这个问题,只在第一个结点作业消失,其他节点作业还在。
3楼2011-08-16 02:27:52
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xrhinoceros

金虫 (小有名气)

送鲜花一朵
引用回帖:
4楼: Originally posted by dxcharlary at 2011-08-17 12:00:11:
很少情况下会出现这个问题,不是很经常。好像是系统bug。估计是linux系统本身的稳定性问题。这个东西在系统过忙运行程序较多时,比较容易出现。而且我感觉貌似可视化的Xterm比文字界面的ssh更容易出现这种问题。
...

谢谢,这个我知道,我发现问题现在可以简化成这个样子的了。

我用slurm作业管理系统,用mpich2并行时提交的作业cancel的时候,只有第一个结点作业被取消,其他结点作业还在运行(消耗cpu)

如果用openmpi并行,则没有这个问题。估计还是mpich2的问题
5楼2011-08-18 01:43:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 085601专硕,总分342求调剂,地区不限 +4 share_joy 2026-03-16 4/200 2026-03-17 21:32 by hmn_wj
[考研] 326求调剂 +5 上岸的小葡 2026-03-15 6/300 2026-03-17 17:26 by ruiyingmiao
[考博] 26申博 +4 八旬速览 2026-03-16 4/200 2026-03-17 13:00 by 轻松不少随
[考研] 302求调剂 +4 小贾同学123 2026-03-15 8/400 2026-03-17 10:33 by 小贾同学123
[考研] 材料与化工304求B区调剂 +7 邱gl 2026-03-11 8/400 2026-03-17 09:36 by 努力学习赚彩礼
[基金申请] 国自科面上基金字体 +6 iwuli 2026-03-12 7/350 2026-03-16 21:18 by sculhf
[考研] 085600材料与化工 求调剂 +13 enenenhui 2026-03-13 14/700 2026-03-16 15:19 by 了了了了。。
[考研] 285求调剂 +6 ytter 2026-03-12 6/300 2026-03-16 15:05 by njzyff
[考研] 265求调剂 +4 威化饼07 2026-03-12 4/200 2026-03-14 17:23 by userper
[考研] 308 085701 四六级已过求调剂 +7 温乔乔乔乔 2026-03-12 14/700 2026-03-14 10:49 by JourneyLucky
[考研] 0703化学调剂 +4 快乐的香蕉 2026-03-11 4/200 2026-03-13 22:41 by JourneyLucky
[考研] 材料工程调剂 +9 咪咪空空 2026-03-12 9/450 2026-03-13 22:05 by 星空星月
[考研] 26调剂/材料/英一数二/总分289/已过A区线 +6 步川酷紫123 2026-03-13 6/300 2026-03-13 21:59 by 星空星月
[考研] 333求调剂 +3 球球古力 2026-03-11 3/150 2026-03-13 21:27 by JourneyLucky
[考研] 329求调剂 +3 miaodesi 2026-03-12 4/200 2026-03-13 20:53 by 18595523086
[考研] 281求调剂 +9 Koxui 2026-03-12 11/550 2026-03-13 20:50 by Koxui
[考研] 求b区学校调剂 +3 周56 2026-03-11 3/150 2026-03-13 16:20 by JourneyLucky
[考研] 求调剂 +7 18880831720 2026-03-11 7/350 2026-03-13 16:10 by JourneyLucky
[考研] 307求调剂 +5 超级伊昂大王 2026-03-12 5/250 2026-03-13 15:56 by 棒棒球手
[考研] 321求调剂(食品/专硕) +3 xc321 2026-03-12 6/300 2026-03-13 08:45 by xc321
信息提示
请填处理意见