24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1090  |  回复: 4
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

xrhinoceros

金虫 (小有名气)

[求助] mpich2杀进程的问题

不知道各位大侠有没有遇到这样的情况,自己搭建的小型cluster,用mpich2做并行环境,然后并行vasp,如果想杀死作业,在一台机器上killall -9 vasp之后,有时候其他结点的相关进程也会终止,这是我们想要的情况。可有些时候,其他节点的vasp进程还在,要一台机器一台机器的去杀!

请问这是为什么?有什么解决的办法没有?
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

jjf_sxnu

铜虫 (正式写手)

【答案】应助回帖

★ ★ ★
franch(金币+3): 谢谢回帖交流 2011-08-15 23:46:32
xrhinoceros(金币+2): 2011-08-16 02:27:17
首先你的节点文件可能导致你在一台节点上运行了多个Vasp任务(如你启用8个进程,提供了8个节点,则在每台机子上只启动一个进程,如果你的计算机是多核的,则还可以有为其它任务提供CPU。),你用killall命令则会杀死所用名为vasp的进程,如果此时,在某一节点机上运行了多个任务,就都杀死了。你可以在启动任务的时候记录任务号来精确杀死一个任务,另外就是自己保证在每个节点上只运行一个相关任务。最好的办法是结合PBS系统。
2楼2011-08-15 23:32:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 xrhinoceros 的主题更新
信息提示
请填处理意见