| 查看: 614 | 回复: 7 | |||
[交流]
并行程序调用BLAS库时出现的问题~不知道有没有人遇到过 已有2人参与
|
|
我调用了BLAS库中的矩阵相乘函数zgemm,但实际上只是想实现向量乘以矩阵的功能,在串行情况下测试的时候,将矩阵的规模缩减一半,计算时间也会缩减一半,但是在MPI并行情况下,矩阵的规模缩减了一半,计算时间并没有减一半。我觉得没有内存读取上的问题,不知道是什么原因,求帮忙~ PS. 听说BLAS库的函数是可以并行计算的,就是说在串行的情况下调用了zgemm,但是内部可能会启动并行计算,有选项可以控制这个,不知道有没有大神知道这个问题,我搜了一下,也没有找到有关的资料,求解答~ |
» 猜你喜欢
Sci. Bull. 悲剧经验
已经有4人回复
找博士生导师
已经有7人回复
上海大学实验技术岗位非升即走
已经有11人回复
评审有感
已经有15人回复
26/27申博自荐-锂/钠电池方向
已经有4人回复
同样的基金本子,换个专家直接从C变A!
已经有3人回复
别被青基扩招骗了!26年科研内卷才刚刚开始
已经有4人回复
26/27博士推荐
已经有4人回复
2026博士还有哪些学校有名额
已经有8人回复
云南大学材料与能源学院解琳课题组钙钛矿博士招生
已经有4人回复
2楼2016-01-10 16:28:27

3楼2016-01-11 22:22:03

4楼2016-01-12 13:52:12
5楼2016-01-13 14:06:21
|
我用的是串行的blas 函数,如果是mkl和gotoblas2的话,有可能会启动多线程,这是我刚刚查到的,如果并行调用的话,启动多线程可能会导致并行效率不高,也只是我的想法,不知道有没有人曾经有过类似的经验 发自小木虫IOS客户端 |
6楼2016-01-13 14:08:59
7楼2016-01-13 14:12:37
8楼2016-01-13 14:14:53












回复此楼
30