| 查看: 1088 | 回复: 4 | ||||
xrhinoceros金虫 (小有名气)
|
[求助]
mpich2杀进程的问题
|
|
不知道各位大侠有没有遇到这样的情况,自己搭建的小型cluster,用mpich2做并行环境,然后并行vasp,如果想杀死作业,在一台机器上killall -9 vasp之后,有时候其他结点的相关进程也会终止,这是我们想要的情况。可有些时候,其他节点的vasp进程还在,要一台机器一台机器的去杀! 请问这是为什么?有什么解决的办法没有? |
» 猜你喜欢
2025冷门绝学什么时候出结果
已经有3人回复
天津工业大学郑柳春团队欢迎化学化工、高分子化学或有机合成方向的博士生和硕士生加入
已经有4人回复
康复大学泰山学者周祺惠团队招收博士研究生
已经有6人回复
AI论文写作工具:是科研加速器还是学术作弊器?
已经有3人回复
孩子确诊有中度注意力缺陷
已经有6人回复
2026博士申请-功能高分子,水凝胶方向
已经有6人回复
论文投稿,期刊推荐
已经有4人回复
硕士和导师闹得不愉快
已经有13人回复
请问2026国家基金面上项目会启动申2停1吗
已经有5人回复
同一篇文章,用不同账号投稿对编辑决定是否送审有没有影响?
已经有3人回复
» 本主题相关价值贴推荐,对您同样有帮助:
合成 6 ,6’双溴甲基- 2 ,2’连吡啶的提纯问题
已经有6人回复
【求助】关于单机2cpu8核的mpich2设置问题!
已经有5人回复
【求助】安装mpich2时出现问题!
已经有6人回复
【求助】跑vasp时, mpich2运行有时有问题
已经有6人回复
【求助】程序出错
已经有4人回复
【原创】Ubuntu 9.04下MPICH2集群搭建
已经有8人回复
【答案】应助回帖
★ ★ ★
franch(金币+3): 谢谢回帖交流 2011-08-15 23:46:32
xrhinoceros(金币+2): 2011-08-16 02:27:17
franch(金币+3): 谢谢回帖交流 2011-08-15 23:46:32
xrhinoceros(金币+2): 2011-08-16 02:27:17
| 首先你的节点文件可能导致你在一台节点上运行了多个Vasp任务(如你启用8个进程,提供了8个节点,则在每台机子上只启动一个进程,如果你的计算机是多核的,则还可以有为其它任务提供CPU。),你用killall命令则会杀死所用名为vasp的进程,如果此时,在某一节点机上运行了多个任务,就都杀死了。你可以在启动任务的时候记录任务号来精确杀死一个任务,另外就是自己保证在每个节点上只运行一个相关任务。最好的办法是结合PBS系统。 |
2楼2011-08-15 23:32:11
xrhinoceros
金虫 (小有名气)
- 应助: 1 (幼儿园)
- 金币: 944
- 散金: 1626
- 红花: 4
- 帖子: 118
- 在线: 43.2小时
- 虫号: 443652
- 注册: 2007-10-27
- 性别: GG
- 专业: 凝聚态物性 II :电子结构
3楼2011-08-16 02:27:52
dxcharlary
专家顾问 (职业作家)
-

专家经验: +83 - 1ST强帖: 2
- 应助: 251 (大学生)
- 金币: 10398.6
- 散金: 155
- 红花: 65
- 帖子: 3137
- 在线: 757.1小时
- 虫号: 936718
- 注册: 2010-01-04
- 专业: 凝聚态物性I:结构、力学和
- 管辖: 第一性原理
★ ★
youzhizhe(金币+2): 谢谢交流。 2011-08-17 15:12:50
youzhizhe(金币+2): 谢谢交流。 2011-08-17 15:12:50
|
很少情况下会出现这个问题,不是很经常。好像是系统bug。估计是linux系统本身的稳定性问题。这个东西在系统过忙运行程序较多时,比较容易出现。而且我感觉貌似可视化的Xterm比文字界面的ssh更容易出现这种问题。 另外mpiboot之后,mpich本身会建一个python进程,那个进程不能动,一旦kill后果很严重。 |
» 本帖已获得的红花(最新10朵)
4楼2011-08-17 12:00:11
xrhinoceros
金虫 (小有名气)
- 应助: 1 (幼儿园)
- 金币: 944
- 散金: 1626
- 红花: 4
- 帖子: 118
- 在线: 43.2小时
- 虫号: 443652
- 注册: 2007-10-27
- 性别: GG
- 专业: 凝聚态物性 II :电子结构
5楼2011-08-18 01:43:12













回复此楼
xrhinoceros