| 查看: 595 | 回复: 7 | |||
[交流]
并行程序调用BLAS库时出现的问题~不知道有没有人遇到过 已有2人参与
|
|
我调用了BLAS库中的矩阵相乘函数zgemm,但实际上只是想实现向量乘以矩阵的功能,在串行情况下测试的时候,将矩阵的规模缩减一半,计算时间也会缩减一半,但是在MPI并行情况下,矩阵的规模缩减了一半,计算时间并没有减一半。我觉得没有内存读取上的问题,不知道是什么原因,求帮忙~ PS. 听说BLAS库的函数是可以并行计算的,就是说在串行的情况下调用了zgemm,但是内部可能会启动并行计算,有选项可以控制这个,不知道有没有大神知道这个问题,我搜了一下,也没有找到有关的资料,求解答~ |
» 猜你喜欢
材料考研调剂
已经有3人回复
材料调剂
已经有12人回复
英一数一408,总分284,二战真诚求调剂
已经有14人回复
085410 一志愿211 22408分数359求调剂
已经有4人回复
271求调剂
已经有19人回复
385分 生物学(071000)求调剂
已经有3人回复
一志愿安徽大学计算机科学与技术学硕,331分求调剂
已经有3人回复
318求调剂,计算材料方向
已经有8人回复
291求调剂
已经有25人回复
一志愿北京科技大学085601材料工程英一数二初试总分335求调剂
已经有6人回复
2楼2016-01-10 16:28:27

3楼2016-01-11 22:22:03

4楼2016-01-12 13:52:12
5楼2016-01-13 14:06:21
|
我用的是串行的blas 函数,如果是mkl和gotoblas2的话,有可能会启动多线程,这是我刚刚查到的,如果并行调用的话,启动多线程可能会导致并行效率不高,也只是我的想法,不知道有没有人曾经有过类似的经验 发自小木虫IOS客户端 |
6楼2016-01-13 14:08:59
7楼2016-01-13 14:12:37
8楼2016-01-13 14:14:53














回复此楼