24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1751  |  回复: 16
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

田山东

捐助贵宾 (著名写手)

[求助] 并行计算没有输出?怎么回事

家好。感谢论坛上的各位好友对我的帮助。

昨天并行运算弄好了,速度确实快了很多,以前要30小时算完的程序,现在10小时左右就可以了。但是计算完成之后,我发现输出文件没有数据。这是怎么回事呢?

串行 计算的时候我都是把输出输出到一个文件下,改成并行计算了,语句没有修改,是不是并行情况下要对输出语句修改一下啊?

  

谢谢!
回复此楼
everythinghasitsseason.enjoyyourlife.
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

libralibra

至尊木虫 (著名写手)

骠骑将军

【答案】应助回帖

★ ★ ★ ★ ★
感谢参与,应助指数 +1
田山东: 金币+5, ★★★很有帮助, 谢谢你了。我再摸索下 2012-08-28 17:01:33
并行之前将数据broadcast到每个core,分别计算
你要写文件之前,需要将数据重新collect到同一个core来写文件,因为每个core的运算不可能同时结束,所以需要synchronization
如果涉及文件读写,基本框架是:

master读文件
broadcast/划分数据给children
所有children并行运算
collect数据到master(同步)
master写文件
matlab/VB/python/c++/Java写程序请发QQ邮件:790404545@qq.com
2楼2012-08-28 15:36:16
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

libralibra

至尊木虫 (著名写手)

骠骑将军

★ ★
xzhdty: 金币+2, 谢谢骠骑将军 2012-08-28 19:10:28
引用回帖:
4楼: Originally posted by 田山东 at 2012-08-28 17:03:17
可以给个实例吗?或者推荐一本书也行啊、谢谢...

4年前搞过的MPI,早都不知道哪儿去了
可以看看这个c的例子,很简单,但是基本的步骤都有

http://hi.baidu.com/xukeke2600/b ... 5e4a47f2de32fe.html
matlab/VB/python/c++/Java写程序请发QQ邮件:790404545@qq.com
5楼2012-08-28 17:25:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

libralibra

至尊木虫 (著名写手)

骠骑将军

引用回帖:
6楼: Originally posted by 田山东 at 2012-08-29 08:00:42
很奇怪,小体系并行运算就可以得到结果,大体系反而不行了。纠结!!还是串行吧,尽管并行运算可以提高速度很多...

那问题应该出在大体系的代码流程,仔细debug一下
matlab/VB/python/c++/Java写程序请发QQ邮件:790404545@qq.com
7楼2012-08-29 16:52:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

libralibra

至尊木虫 (著名写手)

骠骑将军

在中间部分加一些同步,print出数据看看到底在哪里出了问题
大体系有没有内存溢出或者其他问题等等,debug只能一点点试
matlab/VB/python/c++/Java写程序请发QQ邮件:790404545@qq.com
9楼2012-08-29 17:52:37
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

libralibra

至尊木虫 (著名写手)

骠骑将军

可能跟你分发数据的代码有关系
matlab/VB/python/c++/Java写程序请发QQ邮件:790404545@qq.com
12楼2012-08-29 19:51:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

libralibra

至尊木虫 (著名写手)

骠骑将军

引用回帖:
13楼: Originally posted by 田山东 at 2012-08-29 20:43:24
我想应该是这样的。我的代码没有进行分发操作,直接在原先串行的基础上加了几个并行需要的调用命令。
如果进行分发代码的话还要根据你给我的那个例子还有你前面讲的进行吗?...

MPI并行的大框架就是

读数据
分发数据 (前面2不不是必须,也可以根据core id号去读取自己需要的那部分数据,反正就是每个core只拿到自己运算需要的数据)
然后运算(如果运算过程有不能并行的部分,需要gather到一个core,计算完不能并行的部分后,继续分发数据,进行后面的运算)
最后输出之前gather数据写出结果(或者每个core独立写自己的那部分数据)

所以数据是否需要分发,跟你的运算过程与数据存放方式有关.中间需要gather同步几次,看运算过程有几个不能并行的阶段
matlab/VB/python/c++/Java写程序请发QQ邮件:790404545@qq.com
14楼2012-08-31 18:22:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

libralibra

至尊木虫 (著名写手)

骠骑将军

引用回帖:
15楼: Originally posted by 田山东 at 2012-09-01 21:20:49
我发现我的问题是这样的:串行运行的时候,单个程序会产生一个很大的数组,大约60G,服务器总内存只有120G,所以一个程序产生的数组占内存占到了49%左右,我这个服务器最多只能运行两个程序。并行运算之后,比如我 ...

按理说数据分配给6个节点,每个节点可以拿到1/6来计算,也就是光数组分配需要10G内存,
不过如果这些节点在计算过程中还有临时变量等大数组,内存使用可能会高于10G,至于会多多少,要看你具体的运算过程
matlab/VB/python/c++/Java写程序请发QQ邮件:790404545@qq.com
16楼2012-09-03 21:48:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 田山东 的主题更新
信息提示
请填处理意见