24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1746  |  回复: 11
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

xiongxiong5712

新虫 (小有名气)

[求助] 提交siesta任务计算失败

请教siesta的output文件提示这个是什么意思:

p0_17810:  p4_error: Child process exited while making connection to remote process on c0108: 0
p0_17810: (6.070312) net_send: could not write to fd=4, errno = 32
回复此楼

» 收录本帖的淘帖专辑推荐

siesta问题

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xiongxiong5712

新虫 (小有名气)

引用回帖:
4楼: Originally posted by zhangguangping at 2012-06-07 10:18:13
那就把你提交任务的脚本拿出来看一下吧。...

[lxiong@console LV30-k1]$ vi pbssiesta






















#!/bin/bash
#PBS -l nodes=1:ppn=4
#PBS -N Si3N4
#PBS -l walltime=480:00:00   
#PBS -l cput=480:00:00
#PBS -q students
cd $PBS_O_WORKDIR
echo `cat $PBS_NODEFILE`
NPROCS=`wc -l < $PBS_NODEFILE`
echo This job has allocated $NPROCS nodes
mpirun -machinefile  $PBS_NODEFILE -np $NPROCS /export/software/siesta-3.0-rc2/O
bj/siesta < in.fdf|tee output
~   
~   
~   
~
~
~   
~   
~   
~
"pbssiesta" [readonly] 11L, 341C                              11,1          All
#!/bin/bash
#PBS -l nodes=1:ppn=4
#PBS -N Si3N4
#PBS -l walltime=480:00:00
#PBS -l cput=480:00:00
#PBS -q students
cd $PBS_O_WORKDIR
echo `cat $PBS_NODEFILE`
NPROCS=`wc -l < $PBS_NODEFILE`
echo This job has allocated $NPROCS nodes
mpirun -machinefile  $PBS_NODEFILE -np $NPROCS /export/software/siesta-3.0-rc2/Obj/siesta < in.fdf|tee output
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
[lxiong@console LV30-k1]$ qsub pbssiesta
4896.console
立即查看:
[lxiong@console LV30-k1]$ qstat
Job id                    Name             User            Time Use S Queue
------------------------- ---------------- --------------- -------- - -----
4896.console               Si3N4            lxiong                 0 R students      
再次查看已经停止计算了:
[lxiong@console LV30-k1]$ qstat
Job id                    Name             User            Time Use S Queue
------------------------- ---------------- --------------- -------- - -----
4896.console               Si3N4            lxiong          00:00:00 C students
5楼2012-06-08 09:14:08
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 12 个回答

zhangguangping

木虫 (著名写手)

【答案】应助回帖

★ ★
感谢参与,应助指数 +1
fzx2008: 金币+2, 谢谢指教 2012-06-06 23:55:21
你是不是跨节点运行了?

你的节点和节点靠什么物理链接呢?

估计你的这个节点间的链接有问题了,有可能堵塞了。

如果你这个并行网络不是很好的话,尽量用节点内部并行。
弘德明志博学笃行
2楼2012-06-06 23:24:02
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xiongxiong5712

新虫 (小有名气)

引用回帖:
2楼: Originally posted by zhangguangping at 2012-06-06 23:24:02
你是不是跨节点运行了?

你的节点和节点靠什么物理链接呢?

估计你的这个节点间的链接有问题了,有可能堵塞了。

如果你这个并行网络不是很好的话,尽量用节点内部并行。

谢谢您的回复。我是在主节点提交任务的。不懂您说的“节点和节点靠什么物理链接”是什么意思?但是在分节点提交也不行
3楼2012-06-07 10:09:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

【答案】应助回帖

引用回帖:
3楼: Originally posted by xiongxiong5712 at 2012-06-07 10:09:36
谢谢您的回复。我是在主节点提交任务的。不懂您说的“节点和节点靠什么物理链接”是什么意思?但是在分节点提交也不行...

那就把你提交任务的脚本拿出来看一下吧。
弘德明志博学笃行
4楼2012-06-07 10:18:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见