24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1732  |  回复: 11

xiongxiong5712

新虫 (小有名气)

[求助] 提交siesta任务计算失败

请教siesta的output文件提示这个是什么意思:

p0_17810:  p4_error: Child process exited while making connection to remote process on c0108: 0
p0_17810: (6.070312) net_send: could not write to fd=4, errno = 32
回复此楼

» 收录本帖的淘帖专辑推荐

siesta问题

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

【答案】应助回帖

★ ★
感谢参与,应助指数 +1
fzx2008: 金币+2, 谢谢指教 2012-06-06 23:55:21
你是不是跨节点运行了?

你的节点和节点靠什么物理链接呢?

估计你的这个节点间的链接有问题了,有可能堵塞了。

如果你这个并行网络不是很好的话,尽量用节点内部并行。
弘德明志博学笃行
2楼2012-06-06 23:24:02
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xiongxiong5712

新虫 (小有名气)

引用回帖:
2楼: Originally posted by zhangguangping at 2012-06-06 23:24:02
你是不是跨节点运行了?

你的节点和节点靠什么物理链接呢?

估计你的这个节点间的链接有问题了,有可能堵塞了。

如果你这个并行网络不是很好的话,尽量用节点内部并行。

谢谢您的回复。我是在主节点提交任务的。不懂您说的“节点和节点靠什么物理链接”是什么意思?但是在分节点提交也不行
3楼2012-06-07 10:09:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

【答案】应助回帖

引用回帖:
3楼: Originally posted by xiongxiong5712 at 2012-06-07 10:09:36
谢谢您的回复。我是在主节点提交任务的。不懂您说的“节点和节点靠什么物理链接”是什么意思?但是在分节点提交也不行...

那就把你提交任务的脚本拿出来看一下吧。
弘德明志博学笃行
4楼2012-06-07 10:18:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xiongxiong5712

新虫 (小有名气)

引用回帖:
4楼: Originally posted by zhangguangping at 2012-06-07 10:18:13
那就把你提交任务的脚本拿出来看一下吧。...

[lxiong@console LV30-k1]$ vi pbssiesta






















#!/bin/bash
#PBS -l nodes=1:ppn=4
#PBS -N Si3N4
#PBS -l walltime=480:00:00   
#PBS -l cput=480:00:00
#PBS -q students
cd $PBS_O_WORKDIR
echo `cat $PBS_NODEFILE`
NPROCS=`wc -l < $PBS_NODEFILE`
echo This job has allocated $NPROCS nodes
mpirun -machinefile  $PBS_NODEFILE -np $NPROCS /export/software/siesta-3.0-rc2/O
bj/siesta < in.fdf|tee output
~   
~   
~   
~
~
~   
~   
~   
~
"pbssiesta" [readonly] 11L, 341C                              11,1          All
#!/bin/bash
#PBS -l nodes=1:ppn=4
#PBS -N Si3N4
#PBS -l walltime=480:00:00
#PBS -l cput=480:00:00
#PBS -q students
cd $PBS_O_WORKDIR
echo `cat $PBS_NODEFILE`
NPROCS=`wc -l < $PBS_NODEFILE`
echo This job has allocated $NPROCS nodes
mpirun -machinefile  $PBS_NODEFILE -np $NPROCS /export/software/siesta-3.0-rc2/Obj/siesta < in.fdf|tee output
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
[lxiong@console LV30-k1]$ qsub pbssiesta
4896.console
立即查看:
[lxiong@console LV30-k1]$ qstat
Job id                    Name             User            Time Use S Queue
------------------------- ---------------- --------------- -------- - -----
4896.console               Si3N4            lxiong                 0 R students      
再次查看已经停止计算了:
[lxiong@console LV30-k1]$ qstat
Job id                    Name             User            Time Use S Queue
------------------------- ---------------- --------------- -------- - -----
4896.console               Si3N4            lxiong          00:00:00 C students
5楼2012-06-08 09:14:08
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

【答案】应助回帖


liliangfang: 金币+1, 谢谢提示 2012-06-08 16:45:14
引用回帖:
5楼: Originally posted by xiongxiong5712 at 2012-06-08 09:14:08
$ vi pbssiesta






















#!/bin/bash
#PBS -l nodes=1:ppn=4
#PBS -N Si3N4
#PBS -l walltime=480:00:00   
#PBS -l cput=480:00:00
#PBS -q students
cd $PBS_O_WORK ...

看来不是你的脚本的问题。
我想问一下,是不是你这个mpi版本是mpich啊?你以前能运行的siesta程序是用这个mpich执行的吗?我估计你的这个mpich安装完毕后,就没有成功并行过。也就是说你的mpich没有安装好。你需要重新安装。另外你的免密码登录用是rsh还是ssh,如果是ssh的话,在安装mpich的时候是不是在配置的时候要指定-rsh=/usr/bin/ssh
弘德明志博学笃行
6楼2012-06-08 10:20:28
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xiongxiong5712

新虫 (小有名气)

引用回帖:
6楼: Originally posted by zhangguangping at 2012-06-08 10:20:28
看来不是你的脚本的问题。
我想问一下,是不是你这个mpi版本是mpich啊?你以前能运行的siesta程序是用这个mpich执行的吗?我估计你的这个mpich安装完毕后,就没有成功并行过。也就是说你的mpich没有安装好。你需要 ...

我们这里有个学生用siesta,也就是说他成功计算过了,我以前没用过这个服务器,我把在别的服务器上计算成功的fdf文件拿到这个服务器上也不能成功,说明不是我的fdf文件的问题。
另外,我的免密码登陆用的是rsh。
7楼2012-06-08 11:05:09
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

【答案】应助回帖


sunyang1988: 金币+1, 谢谢提示 2012-06-08 18:38:29
引用回帖:
7楼: Originally posted by xiongxiong5712 at 2012-06-08 11:05:09
我们这里有个学生用siesta,也就是说他成功计算过了,我以前没用过这个服务器,我把在别的服务器上计算成功的fdf文件拿到这个服务器上也不能成功,说明不是我的fdf文件的问题。
另外,我的免密码登陆用的是rsh。...

那你咨询一下那个学生在这个服务器上运行的命令什么,还有你们的环境变量一样吗?
弘德明志博学笃行
8楼2012-06-08 11:33:18
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xiongxiong5712

新虫 (小有名气)

引用回帖:
8楼: Originally posted by zhangguangping at 2012-06-08 11:33:18
那你咨询一下那个学生在这个服务器上运行的命令什么,还有你们的环境变量一样吗?...

我就是按照他说的办法运行命令的。不好意思请教一下环境变量是什么?我们都在同一个服务器上用同一个软件计算,除了fdf文件不一样,还有什么能不一样吗?
9楼2012-06-08 11:50:49
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

【答案】应助回帖


liliangfang: 金币+1, 谢谢交流 2012-06-08 16:45:26
引用回帖:
9楼: Originally posted by xiongxiong5712 at 2012-06-08 11:50:49
我就是按照他说的办法运行命令的。不好意思请教一下环境变量是什么?我们都在同一个服务器上用同一个软件计算,除了fdf文件不一样,还有什么能不一样吗?...

环境变量就是在你家目录下面的一个隐藏文件一般是~/.bashrc文件中设置的一些计算环境。
弘德明志博学笃行
10楼2012-06-08 14:23:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 xiongxiong5712 的主题更新
信息提示
请填处理意见