24小时热门版块排行榜    

查看: 1085  |  回复: 13
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

xiaowu787

木虫 (正式写手)

[交流] 【求助】集群节点之间运行问题 已有5人参与

1. 在一个新建的所谓的GPU集群,做试运算时发现,在一个节点上可以MPI并行。在其他节点上出现Floating point exception
,运行的程序和命令都一样。
2. 用MPI提交任务时,任务也提交不到其他节点上。
请教怎么解决这个问题?

[ Last edited by xiaowu787 on 2010-7-6 at 23:01 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

neoxie

金虫 (小有名气)

★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
mingdong(金币+1):感谢交流! 2010-07-19 21:46:13
引用回帖:
Originally posted by buxiudehun at 2010-07-16 10:57:24:

那应该是直接在服务节点运行了,搞不好会弄得服务器重启,不建议这样做

但我想不出lz这种情况为什么会报错
等高手吧
14楼2010-07-17 18:10:16
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 14 个回答

neoxie

金虫 (小有名气)


小木虫(金币+0.5):给个红包,谢谢回帖交流
你是说Gpu集群?用mpi?
2楼2010-07-10 21:04:49
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

buxiudehun

木虫 (小有名气)

★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
fegg7502(金币+2):多谢参与 2010-07-15 00:53:15
不明白什么事GPU集群? 或许你可以说的更详细一点。我只是用过现成的集群做计算。
有如下建议:
首先是运行最简单的调试程序,比如pi.c的程序,看是否能够运行。
任务提交不到其他节点上,显然是集群的mpi没有装好,或者没有配置好。
先尝试两台机器的运算
希望能够对你有所帮助
如果实在搞不定,你们学校肯定会有专门管理并行机群的老师,去请教他们更直接和有效
3楼2010-07-10 21:35:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

baitao-1987

金虫 (正式写手)


小木虫(金币+0.5):给个红包,谢谢回帖交流
还不怎么懂~加油楼主
长风破浪会有时,直挂云帆济沧海~
4楼2010-07-11 12:35:55
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见