24小时热门版块排行榜    

查看: 3535  |  回复: 12

nkleof

银虫 (正式写手)

[求助] torque里修改stack size 已有3人参与

在一台服务器上装了torque,本机作为server也作为计算节点,但是在提交vasp计算任务时,总会遇到
mpirun noticed that process rank 14 with PID 80004 on node silverstar exited on signal 11 (Segmentation fault).
这个问题以前的解决方法是在.bashrc里面添加一行
ulimit -s unlimited
这样的话,在本机直接用mpirun运行vasp就没有报错,但是现在用torque提交计算后在任务日志里就出现这样一行
/home/lxm/.bashrc: line 17: ulimit: stack size: cannot modify limit: Operation not permitted
所以应该是由torque提交的任务还是受内存限制,不能继续运行。
请教这个问题有什么解决办法?
回复此楼

» 猜你喜欢

已阅   关注TA 给TA发消息 送TA红花 TA的回帖

y1ding

铁杆木虫 (著名写手)

【答案】应助回帖

★ ★
感谢参与,应助指数 +1
nkleof: 金币+2, 有帮助 2018-01-16 08:56:00
pbsdsh -u ulimit -s unlimited
2楼2018-01-13 18:47:56
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

nkleof

银虫 (正式写手)

引用回帖:
2楼: Originally posted by y1ding at 2018-01-13 18:47:56
pbsdsh -u ulimit -s unlimited

谢谢回复,我在pbs脚本里面加上这一行以后,出现这个错误:
PBS: ulimit: No such file or directory
pbsdsh(): task 0 exit status 254
然后vasp还是报错退出,请帮忙看看是什么原因。
3楼2018-01-16 08:55:39
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

lyl453433939

金虫 (正式写手)

高性能设备软硬件集成商

【答案】应助回帖


nkleof: 金币+1 2018-01-20 20:09:30
pbs只是作业管理系统,你如果有错误,肯定是执行程序的过程中出错,你可以先在终端执行下,有错误的地方研究下,往往是库路径的不同导致的。/home/lxm/.bashrc: line 17: ulimit: stack size: cannot modify limit: Operation not permitted,权限错误,说明这一行你普通用户执行是有错误的。
4楼2018-01-18 09:03:10
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

xiangpan2015

金虫 (正式写手)

楼主知道torque软件提高任务优先级的命令吗?
5楼2018-01-18 18:39:27
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

nkleof

银虫 (正式写手)

引用回帖:
4楼: Originally posted by lyl453433939 at 2018-01-18 09:03:10
pbs只是作业管理系统,你如果有错误,肯定是执行程序的过程中出错,你可以先在终端执行下,有错误的地方研究下,往往是库路径的不同导致的。/home/lxm/.bashrc: line 17: ulimit: stack size: cannot modify limit: ...

谢谢回复,这一行在普通用户的bashrc文件里面执行起来是没有问题的,也能解决vasp程序报的错,但是在pbs里面就无法执行,有权限问题,所以我觉得要是能让pbs解决这个权限问题就应该没问题了。
6楼2018-01-20 20:11:29
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

nkleof

银虫 (正式写手)

引用回帖:
5楼: Originally posted by xiangpan2015 at 2018-01-18 18:39:27
楼主知道torque软件提高任务优先级的命令吗?

抱歉,我现在只使用torque的默认排队设置,所以不了解提高任务优先级的命令。
7楼2018-01-20 20:12:21
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

lyl453433939

金虫 (正式写手)

高性能设备软硬件集成商

【答案】应助回帖


nkleof: 金币+1 2018-01-23 16:45:11
/home/lxm/.bashrc: line 17: ulimit: stack size: cannot modify limit: Operation not permitted,普通用户没有这个权限的话,可以直用root将limit -s unlimited加在/etc/profile最后面,执行的时候在pbs中加上source  /etc/profile就可以了
8楼2018-01-22 11:34:13
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

nkleof

银虫 (正式写手)

引用回帖:
8楼: Originally posted by lyl453433939 at 2018-01-22 11:34:13
/home/lxm/.bashrc: line 17: ulimit: stack size: cannot modify limit: Operation not permitted,普通用户没有这个权限的话,可以直用root将limit -s unlimited加在/etc/profile最后面,执行的时候在pbs中加上so ...

谢谢回复,试了一下还是不行,

/etc/profile: line 78: ulimit: stack size: cannot modify limit: Operation not permitted

感觉这个问题是卡在了pbs_mom的堆栈限制,因为pbs_mom的堆栈大小是12288,所以当pbs脚本里面试图修改堆栈大小为unlimited时,超出了pbs_mom的限制,所以就报错Operation not permitted
9楼2018-01-23 16:47:20
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

lyl453433939

金虫 (正式写手)

高性能设备软硬件集成商

引用回帖:
9楼: Originally posted by nkleof at 2018-01-23 16:47:20
谢谢回复,试了一下还是不行,

/etc/profile: line 78: ulimit: stack size: cannot modify limit: Operation not permitted

感觉这个问题是卡在了pbs_mom的堆栈限制,因为pbs_mom的堆栈大小是12288,所以当 ...

你这句命令在终端能执行不?感觉就是命令和权限的问题,关于这个限制,你得查下普通用户是怎么转接的,毕竟你root都是可以顺利执行的
10楼2018-01-23 17:55:18
已阅   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 nkleof 的主题更新
信息提示
请填处理意见