24小时热门版块排行榜    

Znn3bq.jpeg
查看: 614  |  回复: 7

sisilucy

新虫 (初入文坛)

[交流] 并行程序调用BLAS库时出现的问题~不知道有没有人遇到过 已有2人参与

我调用了BLAS库中的矩阵相乘函数zgemm,但实际上只是想实现向量乘以矩阵的功能,在串行情况下测试的时候,将矩阵的规模缩减一半,计算时间也会缩减一半,但是在MPI并行情况下,矩阵的规模缩减了一半,计算时间并没有减一半。我觉得没有内存读取上的问题,不知道是什么原因,求帮忙~
PS. 听说BLAS库的函数是可以并行计算的,就是说在串行的情况下调用了zgemm,但是内部可能会启动并行计算,有选项可以控制这个,不知道有没有大神知道这个问题,我搜了一下,也没有找到有关的资料,求解答~
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sisilucy

新虫 (初入文坛)

2楼2016-01-10 16:28:27
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

fmying

银虫 (小有名气)


小木虫: 金币+0.5, 给个红包,谢谢回帖
如果只是矩阵和向量的相乘的话,用ZGEMV就可以了。
另外,你在MPI并行的时候是如何处理数据的?能否给出代码看看?
BLAS可以并行不假,但是你是否用了并行的BLAS?如果用的是串行的BLAS,那么就不会自己偷偷并行。
我自己似乎没有遇到过你说的这类问题。
上善若水
3楼2016-01-11 22:22:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Carpathia

银虫 (小有名气)


小木虫: 金币+0.5, 给个红包,谢谢回帖
你说没有减少一半,在并行时,时间没有减少一半是完全可能的,加速比不会是理想情况
追求理想的道路上东张西望
4楼2016-01-12 13:52:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sisilucy

新虫 (初入文坛)

引用回帖:
3楼: Originally posted by fmying at 2016-01-11 22:22:03
如果只是矩阵和向量的相乘的话,用ZGEMV就可以了。
另外,你在MPI并行的时候是如何处理数据的?能否给出代码看看?
BLAS可以并行不假,但是你是否用了并行的BLAS?如果用的是串行的BLAS,那么就不会自己偷偷并行。 ...

我是想算向量和矩阵相乘,向量有一个共轭的步骤,所以用的是矩阵和矩阵相乘

发自小木虫IOS客户端
5楼2016-01-13 14:06:21
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sisilucy

新虫 (初入文坛)

引用回帖:
3楼: Originally posted by fmying at 2016-01-11 22:22:03
如果只是矩阵和向量的相乘的话,用ZGEMV就可以了。
另外,你在MPI并行的时候是如何处理数据的?能否给出代码看看?
BLAS可以并行不假,但是你是否用了并行的BLAS?如果用的是串行的BLAS,那么就不会自己偷偷并行。 ...

我用的是串行的blas 函数,如果是mkl和gotoblas2的话,有可能会启动多线程,这是我刚刚查到的,如果并行调用的话,启动多线程可能会导致并行效率不高,也只是我的想法,不知道有没有人曾经有过类似的经验

发自小木虫IOS客户端
6楼2016-01-13 14:08:59
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sisilucy

新虫 (初入文坛)

引用回帖:
4楼: Originally posted by Carpathia at 2016-01-12 13:52:12
你说没有减少一半,在并行时,时间没有减少一半是完全可能的,加速比不会是理想情况

我也是这样想的,但是并行效率只有70%,只是很简单的过程,只有向量和矩阵相乘,向量和向量相乘,我觉得有点不正常

发自小木虫IOS客户端
7楼2016-01-13 14:12:37
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sisilucy

新虫 (初入文坛)

引用回帖:
3楼: Originally posted by fmying at 2016-01-11 22:22:03
如果只是矩阵和向量的相乘的话,用ZGEMV就可以了。
另外,你在MPI并行的时候是如何处理数据的?能否给出代码看看?
BLAS可以并行不假,但是你是否用了并行的BLAS?如果用的是串行的BLAS,那么就不会自己偷偷并行。 ...

关于数据处理,我直接从文件中读取到数组中,就直接调用blas函数了,没有什么特别的

发自小木虫IOS客户端
8楼2016-01-13 14:14:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 sisilucy 的主题更新
普通表情 高级回复 (可上传附件)
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考博] 找博士生导师 +6 小代想上岸 2026-05-15 7/350 2026-05-19 10:22 by free_fisher
[基金申请] 评审有感 +10 popular289 2026-05-18 15/750 2026-05-19 09:18 by jurkat.1640
[基金申请] 别被青基扩招骗了!26年科研内卷才刚刚开始 +3 国自然国社科中 2026-05-14 4/200 2026-05-19 08:48 by archvillain
[考博] 26/27博士推荐 +4 1木头人13949 2026-05-13 4/200 2026-05-19 08:29 by zhyzzh
[基金申请] 面上本子正文33页,违规吗?会被低分嘛? +8 1234567wang 2026-05-17 10/500 2026-05-18 18:52 by zzahkj
[基金申请] 今年审到国自然15份,谈谈感受 +16 国自然国社科中 2026-05-17 16/800 2026-05-18 14:58 by gy116024
[硕博家园] 我在等一个没有答案的答案 +3 Love_MH 2026-05-17 3/150 2026-05-18 02:22 by 竹林孤影
[文学芳草园] 半夜喝咖啡 +3 myrtle 2026-05-15 5/250 2026-05-18 01:03 by 小沈2018
[找工作] 售SCI一区T0P文章,我:8.O.5.5.1.O.5.4,科目齐全,可+急 +5 l7k6xnh0yc 2026-05-14 5/250 2026-05-17 19:39 by Equinoxhua
[考博] 光量子物理方向 博士招生 1人(2026.09) +3 sandyworld 2026-05-15 4/200 2026-05-17 14:38 by sandyworld
[考研] 售SCI一区T0P文章,我:8.O.5.5.1.O.5.4,科目齐全,可+急 +4 l7k6xnh0yc 2026-05-14 8/400 2026-05-17 07:26 by 11n4dfd8yn
[公派出国] 售SCI一区T0P文章,我:8.O.5.5.1.O.5.4,科目齐全,可+急 +6 l7k6xnh0yc 2026-05-14 6/300 2026-05-17 07:16 by 11n4dfd8yn
[考博] 售SCI一区T0P文章,我:8.O.5.5.1.O.5.4,科目齐全,可+急 +6 l7k6xnh0yc 2026-05-14 6/300 2026-05-17 07:11 by 11n4dfd8yn
[硕博家园] 售SCI一区T0P文章,我:8.O.5.5.1.O.5.4,科目齐全,可+急 +3 ky2p12rrjj 2026-05-15 3/150 2026-05-17 00:45 by ue3ir18jc3
[公派出国] 售SCI一区T0P文章,我:8.O.5.5.1.O.5.4,科目齐全,可+急 +3 x0mp7owy2b 2026-05-15 4/200 2026-05-17 00:35 by ue3ir18jc3
[考研] 售SCI一区T0P文章,我:8.O.5.5.1.O.5.4,科目齐全,可+急 +4 x0mp7owy2b 2026-05-15 4/200 2026-05-17 00:25 by ue3ir18jc3
[有机交流] 求有机合成大神指点三硫酸乙烯酯(CAS:2793408-99-6)的合成路线 30+3 Leekmid 2026-05-13 10/500 2026-05-16 16:37 by czyzsu
[有机交流] 如何实现卤原子转化 +3 BT20230424 2026-05-15 5/250 2026-05-16 16:20 by czyzsu
[硕博家园] 售SCI一区T0P文章,我:8.O.5.5.1.O.5.4,科目齐全,可+急 +3 k37jurhrau 2026-05-16 3/150 2026-05-16 13:57 by vcdazktkjx
[考博] 材料类只有一篇综述能申博么 +4 乐逍遥谷 2026-05-13 4/200 2026-05-14 12:05 by zhyzzh
信息提示
请填处理意见