24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1752  |  回复: 11
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

xiongxiong5712

新虫 (小有名气)

[求助] 提交siesta任务计算失败

请教siesta的output文件提示这个是什么意思:

p0_17810:  p4_error: Child process exited while making connection to remote process on c0108: 0
p0_17810: (6.070312) net_send: could not write to fd=4, errno = 32
回复此楼

» 收录本帖的淘帖专辑推荐

siesta问题

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

【答案】应助回帖

★ ★
感谢参与,应助指数 +1
fzx2008: 金币+2, 谢谢指教 2012-06-06 23:55:21
你是不是跨节点运行了?

你的节点和节点靠什么物理链接呢?

估计你的这个节点间的链接有问题了,有可能堵塞了。

如果你这个并行网络不是很好的话,尽量用节点内部并行。
弘德明志博学笃行
2楼2012-06-06 23:24:02
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

【答案】应助回帖

引用回帖:
3楼: Originally posted by xiongxiong5712 at 2012-06-07 10:09:36
谢谢您的回复。我是在主节点提交任务的。不懂您说的“节点和节点靠什么物理链接”是什么意思?但是在分节点提交也不行...

那就把你提交任务的脚本拿出来看一下吧。
弘德明志博学笃行
4楼2012-06-07 10:18:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

【答案】应助回帖


liliangfang: 金币+1, 谢谢提示 2012-06-08 16:45:14
引用回帖:
5楼: Originally posted by xiongxiong5712 at 2012-06-08 09:14:08
$ vi pbssiesta






















#!/bin/bash
#PBS -l nodes=1:ppn=4
#PBS -N Si3N4
#PBS -l walltime=480:00:00   
#PBS -l cput=480:00:00
#PBS -q students
cd $PBS_O_WORK ...

看来不是你的脚本的问题。
我想问一下,是不是你这个mpi版本是mpich啊?你以前能运行的siesta程序是用这个mpich执行的吗?我估计你的这个mpich安装完毕后,就没有成功并行过。也就是说你的mpich没有安装好。你需要重新安装。另外你的免密码登录用是rsh还是ssh,如果是ssh的话,在安装mpich的时候是不是在配置的时候要指定-rsh=/usr/bin/ssh
弘德明志博学笃行
6楼2012-06-08 10:20:28
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

【答案】应助回帖


sunyang1988: 金币+1, 谢谢提示 2012-06-08 18:38:29
引用回帖:
7楼: Originally posted by xiongxiong5712 at 2012-06-08 11:05:09
我们这里有个学生用siesta,也就是说他成功计算过了,我以前没用过这个服务器,我把在别的服务器上计算成功的fdf文件拿到这个服务器上也不能成功,说明不是我的fdf文件的问题。
另外,我的免密码登陆用的是rsh。...

那你咨询一下那个学生在这个服务器上运行的命令什么,还有你们的环境变量一样吗?
弘德明志博学笃行
8楼2012-06-08 11:33:18
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

【答案】应助回帖


liliangfang: 金币+1, 谢谢交流 2012-06-08 16:45:26
引用回帖:
9楼: Originally posted by xiongxiong5712 at 2012-06-08 11:50:49
我就是按照他说的办法运行命令的。不好意思请教一下环境变量是什么?我们都在同一个服务器上用同一个软件计算,除了fdf文件不一样,还有什么能不一样吗?...

环境变量就是在你家目录下面的一个隐藏文件一般是~/.bashrc文件中设置的一些计算环境。
弘德明志博学笃行
10楼2012-06-08 14:23:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

【答案】应助回帖

★ ★ ★ ★
liliangfang: 金币+1, 谢谢交流 2012-06-09 20:41:44
xiongxiong5712: 金币+3, ★★★★★最佳答案, 非常感谢您的答复 2012-06-10 21:10:45
引用回帖:
11楼: Originally posted by xiongxiong5712 at 2012-06-09 15:39:11
那这个环境变量不是大家共用的吗?应该一样啊。再说说我的e文件内容:/export/software/siesta-3.0-rc2/Obj/siesta: error while loading shared libraries: libmkl.so: cannot open shared object file: No such  ...

从你的出错信息文件中显示的是,你的siesta可执行文件不能加载libmkl.so文件。我现在不了解你们的软件部署方案,所以不大好说。你最好找你们的集群管理员解决该问题。这个问题应该很好解决。你首先需要检查一下你的mkl环境变量设置好了没有。其次确认一下你的计算出错节点上有没有安装mkl?估计你的那个错误是由这个问题导致的。
弘德明志博学笃行
12楼2012-06-09 16:01:10
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 xiongxiong5712 的主题更新
信息提示
请填处理意见