24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1756  |  回复: 11
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

xiongxiong5712

新虫 (小有名气)

[求助] 提交siesta任务计算失败

请教siesta的output文件提示这个是什么意思:

p0_17810:  p4_error: Child process exited while making connection to remote process on c0108: 0
p0_17810: (6.070312) net_send: could not write to fd=4, errno = 32
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

【答案】应助回帖

★ ★ ★ ★
liliangfang: 金币+1, 谢谢交流 2012-06-09 20:41:44
xiongxiong5712: 金币+3, ★★★★★最佳答案, 非常感谢您的答复 2012-06-10 21:10:45
引用回帖:
11楼: Originally posted by xiongxiong5712 at 2012-06-09 15:39:11
那这个环境变量不是大家共用的吗?应该一样啊。再说说我的e文件内容:/export/software/siesta-3.0-rc2/Obj/siesta: error while loading shared libraries: libmkl.so: cannot open shared object file: No such  ...

从你的出错信息文件中显示的是,你的siesta可执行文件不能加载libmkl.so文件。我现在不了解你们的软件部署方案,所以不大好说。你最好找你们的集群管理员解决该问题。这个问题应该很好解决。你首先需要检查一下你的mkl环境变量设置好了没有。其次确认一下你的计算出错节点上有没有安装mkl?估计你的那个错误是由这个问题导致的。
弘德明志博学笃行
12楼2012-06-09 16:01:10
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 12 个回答

zhangguangping

木虫 (著名写手)

【答案】应助回帖

★ ★
感谢参与,应助指数 +1
fzx2008: 金币+2, 谢谢指教 2012-06-06 23:55:21
你是不是跨节点运行了?

你的节点和节点靠什么物理链接呢?

估计你的这个节点间的链接有问题了,有可能堵塞了。

如果你这个并行网络不是很好的话,尽量用节点内部并行。
弘德明志博学笃行
2楼2012-06-06 23:24:02
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xiongxiong5712

新虫 (小有名气)

引用回帖:
2楼: Originally posted by zhangguangping at 2012-06-06 23:24:02
你是不是跨节点运行了?

你的节点和节点靠什么物理链接呢?

估计你的这个节点间的链接有问题了,有可能堵塞了。

如果你这个并行网络不是很好的话,尽量用节点内部并行。

谢谢您的回复。我是在主节点提交任务的。不懂您说的“节点和节点靠什么物理链接”是什么意思?但是在分节点提交也不行
3楼2012-06-07 10:09:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangguangping

木虫 (著名写手)

【答案】应助回帖

引用回帖:
3楼: Originally posted by xiongxiong5712 at 2012-06-07 10:09:36
谢谢您的回复。我是在主节点提交任务的。不懂您说的“节点和节点靠什么物理链接”是什么意思?但是在分节点提交也不行...

那就把你提交任务的脚本拿出来看一下吧。
弘德明志博学笃行
4楼2012-06-07 10:18:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见