| 查看: 1197 | 回复: 3 | ||
swordshadow金虫 (初入文坛)
|
[求助]
Openmp效率的问题
|
|
硬件环境: 2台集成的 IBM X5800(2台四路服务器构成一个节点,不知道内部怎么实现的,但进系统就自动识别为一台机器了),共8个CPU, 80核160线程。 软件环境: Red Hat Enterprise Linux 6 g++/icpc 用很简单的代码测试Openmp, 结果比较奇怪,谁能帮我解释一下原因? 情况: 1)1、2、4、8 、12线程运行基本正常,使用top查看CPU 使用分别为100%、200%、399%、799%、1199%。 2)16线程以上开始效率急剧下降 ![]() ,16线程CPU 使用率大约1499%,32线程2999%,64线程仅为4999%左右。使用intel vtune分析发现,64线程时有10多个线程创建后只运行过libgomp.so.1.0.0,其余时间空闲。问题: 1)是不是我的程序并行有问题?有什么问题?怎么解决? 2)如果不是,是否系统和物流架构问题?怎么解决? 以下是主要代码: #define N 256 int numThread=64; double singlesum() { int i,j,k,l; double sum=0; for (i=0;i<=N;i++) { for (j=0;j<=N;j++) { for (k=0;k<=N;k++) { for (l=0;l<=N;l++) { sum+=sin(i+j+k+l)*cos(i+j+k+l); } } } } sum=sum/N/N/N/N; return sum; } void mainsum() { int i; double sum=0; srand(1); #pragma omp parallel for reduction(+:sum) for (i=0;i<=N;i++) { sum+=singlesum(); cout<<"step: "< cout<<"sum is: "< int main() { mainsum(); return 0; } |
» 猜你喜欢
第一性原理计算方向2026级博士申请 PRB*1,四级484
已经有1人回复
求助VISSIM破解版软件
已经有0人回复
物理学I论文润色/翻译怎么收费?
已经有196人回复
求2026年在台湾举行的物理和材料领域国际学术会议信息
已经有0人回复
求国际会议网站
已经有1人回复
求取一些关于纳米材料和纳米技术相关的英文PPT。
已经有0人回复
【复旦大学】二维材料方向招收2026年博士研究生1名
已经有0人回复
北京纳米能源与系统研究所 王中林院士/曹南颖研究员课题组2026级硕/博/博后招生
已经有10人回复
荷兰Utrecht University超快太赫兹光谱王海教授课题招收2026 CSC博士生
已经有16人回复
反铁磁体中的磁性切换:两种不同的机制已成功可视化
已经有0人回复
» 本主题相关价值贴推荐,对您同样有帮助:
缩短OFRTRAN运行时间的问题
已经有6人回复
多核和应用性能的关系
已经有6人回复
32-bit Windows系统的elk-openmp并行版
已经有24人回复
在没有安装openmp库的计算机上能不能使用openmp?
已经有8人回复
分子動力學以OPENMP平行化時編譯問題
已经有5人回复
【讨论】锂电池首次效率问题
已经有9人回复
【讨论】大家对未来GPU在monte carlo中的应用持有什么样的态度(CUDA)?
已经有15人回复
【分享】elk-1.1.4
已经有9人回复
【求助】两台电脑并行问题
已经有5人回复
swordshadow
金虫 (初入文坛)
- 应助: 1 (幼儿园)
- 金币: 862.1
- 红花: 1
- 帖子: 44
- 在线: 46.4小时
- 虫号: 1272383
- 注册: 2011-04-21
- 专业: 凝聚态物性 II :电子结构
2楼2012-05-12 00:14:33
swordshadow
金虫 (初入文坛)
- 应助: 1 (幼儿园)
- 金币: 862.1
- 红花: 1
- 帖子: 44
- 在线: 46.4小时
- 虫号: 1272383
- 注册: 2011-04-21
- 专业: 凝聚态物性 II :电子结构
3楼2012-05-12 15:43:05
4楼2012-05-14 21:16:43














回复此楼