服务器集群,怎样使用srun 直接执行程序
使用的实验室的服务器,使用sinfo 命令查看可用计算节点的信息,如图所示。
请问怎样使用srun 执行程序呢?
我看srun 命令的使用规则是:srun -n 2 -n 24 -p debug program.exe < input > output
请问具体用在我这里srun的执行命令是什么的:
不太理解,求大神指点,感激不尽~
捕获.PNG 返回小木虫查看更多
今日热帖
使用的实验室的服务器,使用sinfo 命令查看可用计算节点的信息,如图所示。
请问怎样使用srun 执行程序呢?
我看srun 命令的使用规则是:srun -n 2 -n 24 -p debug program.exe < input > output
请问具体用在我这里srun的执行命令是什么的:
不太理解,求大神指点,感激不尽~
捕获.PNG 返回小木虫查看更多
我刚才直接计算了一个程序:surn ../ pw.x <in> out ,没有用并行,显示报错:
srun: error: task launch for 2732.0 failed on node cn 243: job credential expired
srun: error: application launch failed: job step to complete
surn: job step aborted: waiting up to 32 seconds for job step to finish
srun: error: timed out waiting for job step to complete
我不知道 pw.x 是什么,以其它科学计算软件举例吧。
srun -p sci -N 1 -n 20 -J cal_vasp /opt/software/vasp5.4.1/vasp_std > out.log
-p sci 意思是把 任务提交到 sci 分区,我看你的截图,你可用的分区有 normal,128G, 64G ,所以 你可以把 sci 换成这三个中的任何一个。 -p sci 也可以不写,那么默认会把任务提交到 normal 分区,因为 normal 带的那个 * 表示它是默认的分区。
-N 1 意思是申请用一个节点计算你的任务。
-n 20 意思是在你申请的那个节点上并行运算20个核心。
-J cal_vasp 是给这个任务起的一个名字,方便查看用的。
/opt/software/vasp5.4.1/vasp_std 是 vasp_std 可执行文件的绝对路径
> out.log 意思是把输出到屏幕的信息输出到 out.log 文件,
谢谢~