当前位置: 首页 > 程序语言 >服务器集群,怎样使用srun 直接执行程序

服务器集群,怎样使用srun 直接执行程序

作者 mamixian
来源: 小木虫 150 3 举报帖子
+关注

使用的实验室的服务器,使用sinfo 命令查看可用计算节点的信息,如图所示。
请问怎样使用srun 执行程序呢?
我看srun 命令的使用规则是:srun -n 2 -n 24 -p debug program.exe < input > output
请问具体用在我这里srun的执行命令是什么的:
不太理解,求大神指点,感激不尽~
服务器集群,怎样使用srun 直接执行程序
捕获.PNG 返回小木虫查看更多

今日热帖
  • 精华评论
  • mamixian

    我刚才直接计算了一个程序:surn ../ pw.x <in> out ,没有用并行,显示报错:

    srun: error: task launch for 2732.0 failed on node cn 243:  job credential expired
    srun: error:  application launch failed: job step to complete
    surn: job step aborted: waiting up to 32 seconds for job step to finish
    srun: error: timed out waiting for job step to complete

  • gsdgh

    我不知道 pw.x 是什么,以其它科学计算软件举例吧。
    srun -p sci -N 1 -n 20  -J cal_vasp  /opt/software/vasp5.4.1/vasp_std > out.log
    -p sci  意思是把 任务提交到 sci 分区,我看你的截图,你可用的分区有 normal,128G, 64G ,所以 你可以把 sci 换成这三个中的任何一个。 -p sci 也可以不写,那么默认会把任务提交到 normal 分区,因为 normal 带的那个 * 表示它是默认的分区。
    -N 1 意思是申请用一个节点计算你的任务。
    -n 20 意思是在你申请的那个节点上并行运算20个核心。
    -J cal_vasp  是给这个任务起的一个名字,方便查看用的。
    /opt/software/vasp5.4.1/vasp_std  是 vasp_std 可执行文件的绝对路径
    > out.log  意思是把输出到屏幕的信息输出到 out.log 文件,

  • mamixian

    引用回帖:
    3楼: Originally posted by gsdgh at 2019-09-03 20:00:36
    我不知道 pw.x 是什么,以其它科学计算软件举例吧。
    srun -p sci -N 1 -n 20  -J cal_vasp  /opt/software/vasp5.4.1/vasp_std > out.log
    -p sci  意思是把 任务提交到 sci 分区,我看你的截图,你可用的分 ...

    谢谢~

猜你喜欢
下载小木虫APP
与700万科研达人随时交流
  • 二维码
  • IOS
  • 安卓