24小时热门版块排行榜    

查看: 1188  |  回复: 4

xrhinoceros

金虫 (小有名气)

[求助] mpich2杀进程的问题

不知道各位大侠有没有遇到这样的情况,自己搭建的小型cluster,用mpich2做并行环境,然后并行vasp,如果想杀死作业,在一台机器上killall -9 vasp之后,有时候其他结点的相关进程也会终止,这是我们想要的情况。可有些时候,其他节点的vasp进程还在,要一台机器一台机器的去杀!

请问这是为什么?有什么解决的办法没有?
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

jjf_sxnu

铜虫 (正式写手)

【答案】应助回帖

★ ★ ★
franch(金币+3): 谢谢回帖交流 2011-08-15 23:46:32
xrhinoceros(金币+2): 2011-08-16 02:27:17
首先你的节点文件可能导致你在一台节点上运行了多个Vasp任务(如你启用8个进程,提供了8个节点,则在每台机子上只启动一个进程,如果你的计算机是多核的,则还可以有为其它任务提供CPU。),你用killall命令则会杀死所用名为vasp的进程,如果此时,在某一节点机上运行了多个任务,就都杀死了。你可以在启动任务的时候记录任务号来精确杀死一个任务,另外就是自己保证在每个节点上只运行一个相关任务。最好的办法是结合PBS系统。
2楼2011-08-15 23:32:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xrhinoceros

金虫 (小有名气)

我现在装了slurm作业管理器,然后scancel jobid的时候,还是存在这个问题,只在第一个结点作业消失,其他节点作业还在。
3楼2011-08-16 02:27:52
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dxcharlary

专家顾问 (职业作家)

★ ★
youzhizhe(金币+2): 谢谢交流。 2011-08-17 15:12:50
很少情况下会出现这个问题,不是很经常。好像是系统bug。估计是linux系统本身的稳定性问题。这个东西在系统过忙运行程序较多时,比较容易出现。而且我感觉貌似可视化的Xterm比文字界面的ssh更容易出现这种问题。
另外mpiboot之后,mpich本身会建一个python进程,那个进程不能动,一旦kill后果很严重。

» 本帖已获得的红花(最新10朵)

4楼2011-08-17 12:00:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xrhinoceros

金虫 (小有名气)

送鲜花一朵
引用回帖:
4楼: Originally posted by dxcharlary at 2011-08-17 12:00:11:
很少情况下会出现这个问题,不是很经常。好像是系统bug。估计是linux系统本身的稳定性问题。这个东西在系统过忙运行程序较多时,比较容易出现。而且我感觉貌似可视化的Xterm比文字界面的ssh更容易出现这种问题。
...

谢谢,这个我知道,我发现问题现在可以简化成这个样子的了。

我用slurm作业管理系统,用mpich2并行时提交的作业cancel的时候,只有第一个结点作业被取消,其他结点作业还在运行(消耗cpu)

如果用openmpi并行,则没有这个问题。估计还是mpich2的问题
5楼2011-08-18 01:43:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 xrhinoceros 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 070303 总分349求调剂 +3 LJY9966 2026-03-15 5/250 2026-03-16 14:24 by xwxstudy
[考研] 327求调剂 +6 拾光任染 2026-03-15 11/550 2026-03-15 22:47 by 拾光任染
[考博] 欢迎申博同学联系 +3 天道酬勤2026686 2026-03-10 7/350 2026-03-15 19:03 by 天道酬勤2026686
[考研] 274求调剂 +4 时间点 2026-03-13 4/200 2026-03-15 15:29 by Rambo13
[考研] 294求调剂 +3 Zys010410@ 2026-03-13 4/200 2026-03-15 10:59 by zhq0425
[考研] 材料工程327求调剂 +3 xiaohe12w 2026-03-11 3/150 2026-03-14 20:20 by ms629
[考研] 255求调剂 +3 李嘉慧, 2026-03-12 4/200 2026-03-14 16:58 by 有只狸奴
[考研] 308 085701 四六级已过求调剂 +7 温乔乔乔乔 2026-03-12 14/700 2026-03-14 10:49 by JourneyLucky
[考研] 307求调剂 +7 超级伊昂大王 2026-03-10 7/350 2026-03-14 00:49 by JourneyLucky
[考研] 311求调剂 +8 zchqwer 2026-03-10 8/400 2026-03-14 00:01 by JourneyLucky
[考研] 279求调剂 +3 抓着星星的女孩 2026-03-10 3/150 2026-03-13 23:47 by userper
[考研] 341求调剂 +4 番茄头--- 2026-03-10 4/200 2026-03-13 23:12 by JourneyLucky
[考研] 341求调剂 +3 番茄头--- 2026-03-10 3/150 2026-03-13 23:07 by JourneyLucky
[考研] 308求调剂 +5 是Lupa啊 2026-03-11 5/250 2026-03-13 22:13 by JourneyLucky
[考研] 310求调剂 +3 【上上签】 2026-03-11 3/150 2026-03-13 16:16 by JourneyLucky
[考研] 求调剂 +3 程雨杭 2026-03-12 3/150 2026-03-13 15:06 by JourneyLucky
[考研] 土木第一志愿276求调剂,科研和技能十分丰富,求新兴方向的导师收留 +3 土木小天才 2026-03-12 3/150 2026-03-13 15:01 by JourneyLucky
[考研] 274求调剂0856材料化工 +12 z2839474511 2026-03-11 13/650 2026-03-13 10:39 by peike
[考研] 296求调剂 +3 大口吃饭 身体健 2026-03-13 3/150 2026-03-13 10:31 by 学员8dgXkO
[考研] 321求调剂(食品/专硕) +3 xc321 2026-03-12 6/300 2026-03-13 08:45 by xc321
信息提示
请填处理意见