| 查看: 1232 | 回复: 3 | ||
swordshadow金虫 (初入文坛)
|
[求助]
Openmp效率的问题
|
|
硬件环境: 2台集成的 IBM X5800(2台四路服务器构成一个节点,不知道内部怎么实现的,但进系统就自动识别为一台机器了),共8个CPU, 80核160线程。 软件环境: Red Hat Enterprise Linux 6 g++/icpc 用很简单的代码测试Openmp, 结果比较奇怪,谁能帮我解释一下原因? 情况: 1)1、2、4、8 、12线程运行基本正常,使用top查看CPU 使用分别为100%、200%、399%、799%、1199%。 2)16线程以上开始效率急剧下降 ![]() ,16线程CPU 使用率大约1499%,32线程2999%,64线程仅为4999%左右。使用intel vtune分析发现,64线程时有10多个线程创建后只运行过libgomp.so.1.0.0,其余时间空闲。问题: 1)是不是我的程序并行有问题?有什么问题?怎么解决? 2)如果不是,是否系统和物流架构问题?怎么解决? 以下是主要代码: #define N 256 int numThread=64; double singlesum() { int i,j,k,l; double sum=0; for (i=0;i<=N;i++) { for (j=0;j<=N;j++) { for (k=0;k<=N;k++) { for (l=0;l<=N;l++) { sum+=sin(i+j+k+l)*cos(i+j+k+l); } } } } sum=sum/N/N/N/N; return sum; } void mainsum() { int i; double sum=0; srand(1); #pragma omp parallel for reduction(+:sum) for (i=0;i<=N;i++) { sum+=singlesum(); cout<<"step: "< cout<<"sum is: "< int main() { mainsum(); return 0; } |
» 猜你喜欢
求标准粉末衍射卡号 ICDD 01-076-1802
已经有0人回复
新西兰Robinson研究所招收全奖PhD
已经有0人回复
物理学I论文润色/翻译怎么收费?
已经有249人回复
石墨烯转移--二氧化硅衬底石墨烯
已经有0人回复
笼目材料中量子自旋液体基态的证据
已经有0人回复
数学教学论硕士可以读数学物理博士吗?
已经有0人回复
德国亥姆霍兹Hereon中心汉堡分部招镁合金腐蚀裂变SCC课题方向2026公派博士生
已经有4人回复
澳门大学 应用物理及材料工程研究院 潘晖教授课题组诚招博士后
已经有11人回复
求助NH4V4O10晶体的CIF文件
已经有0人回复
英国全奖博士招聘-深度学习与量子物理
已经有0人回复
间接带隙半导体有效质量求助
已经有0人回复
» 本主题相关价值贴推荐,对您同样有帮助:
缩短OFRTRAN运行时间的问题
已经有6人回复
多核和应用性能的关系
已经有6人回复
32-bit Windows系统的elk-openmp并行版
已经有24人回复
在没有安装openmp库的计算机上能不能使用openmp?
已经有8人回复
分子動力學以OPENMP平行化時編譯問題
已经有5人回复
【讨论】锂电池首次效率问题
已经有9人回复
【讨论】大家对未来GPU在monte carlo中的应用持有什么样的态度(CUDA)?
已经有15人回复
【分享】elk-1.1.4
已经有9人回复
【求助】两台电脑并行问题
已经有5人回复
swordshadow
金虫 (初入文坛)
- 应助: 1 (幼儿园)
- 金币: 862.1
- 红花: 1
- 帖子: 44
- 在线: 46.4小时
- 虫号: 1272383
- 注册: 2011-04-21
- 专业: 凝聚态物性 II :电子结构
2楼2012-05-12 00:14:33
swordshadow
金虫 (初入文坛)
- 应助: 1 (幼儿园)
- 金币: 862.1
- 红花: 1
- 帖子: 44
- 在线: 46.4小时
- 虫号: 1272383
- 注册: 2011-04-21
- 专业: 凝聚态物性 II :电子结构
3楼2012-05-12 15:43:05
4楼2012-05-14 21:16:43












回复此楼