24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1086  |  回复: 4
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

xrhinoceros

金虫 (小有名气)

[求助] mpich2杀进程的问题

不知道各位大侠有没有遇到这样的情况,自己搭建的小型cluster,用mpich2做并行环境,然后并行vasp,如果想杀死作业,在一台机器上killall -9 vasp之后,有时候其他结点的相关进程也会终止,这是我们想要的情况。可有些时候,其他节点的vasp进程还在,要一台机器一台机器的去杀!

请问这是为什么?有什么解决的办法没有?
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dxcharlary

专家顾问 (职业作家)

★ ★
youzhizhe(金币+2): 谢谢交流。 2011-08-17 15:12:50
很少情况下会出现这个问题,不是很经常。好像是系统bug。估计是linux系统本身的稳定性问题。这个东西在系统过忙运行程序较多时,比较容易出现。而且我感觉貌似可视化的Xterm比文字界面的ssh更容易出现这种问题。
另外mpiboot之后,mpich本身会建一个python进程,那个进程不能动,一旦kill后果很严重。

» 本帖已获得的红花(最新10朵)

4楼2011-08-17 12:00:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 xrhinoceros 的主题更新
信息提示
请填处理意见