| 查看: 1242 | 回复: 3 | |||
swordshadow金虫 (初入文坛)
|
[求助]
Openmp效率的问题
|
|
硬件环境: 2台集成的 IBM X5800(2台四路服务器构成一个节点,不知道内部怎么实现的,但进系统就自动识别为一台机器了),共8个CPU, 80核160线程。 软件环境: Red Hat Enterprise Linux 6 g++/icpc 用很简单的代码测试Openmp, 结果比较奇怪,谁能帮我解释一下原因? 情况: 1)1、2、4、8 、12线程运行基本正常,使用top查看CPU 使用分别为100%、200%、399%、799%、1199%。 2)16线程以上开始效率急剧下降 ![]() ,16线程CPU 使用率大约1499%,32线程2999%,64线程仅为4999%左右。使用intel vtune分析发现,64线程时有10多个线程创建后只运行过libgomp.so.1.0.0,其余时间空闲。问题: 1)是不是我的程序并行有问题?有什么问题?怎么解决? 2)如果不是,是否系统和物流架构问题?怎么解决? 以下是主要代码: #define N 256 int numThread=64; double singlesum() { int i,j,k,l; double sum=0; for (i=0;i<=N;i++) { for (j=0;j<=N;j++) { for (k=0;k<=N;k++) { for (l=0;l<=N;l++) { sum+=sin(i+j+k+l)*cos(i+j+k+l); } } } } sum=sum/N/N/N/N; return sum; } void mainsum() { int i; double sum=0; srand(1); #pragma omp parallel for reduction(+:sum) for (i=0;i<=N;i++) { sum+=singlesum(); cout<<"step: "< cout<<"sum is: "< int main() { mainsum(); return 0; } |
» 猜你喜欢
投稿chemical physical letters不送审?
已经有2人回复
南开大学物理学院张书辉副教授招收凝聚态物理理论方向博士生、硕士生
已经有22人回复
物理学I论文润色/翻译怎么收费?
已经有287人回复
杂志要求提供official language-editing certificate
已经有4人回复
深圳大学2026年秋博士招生-物理学-活性胶体方向-高永祥课题组
已经有16人回复
论物质与能量的统一模型及物理现象解释
已经有0人回复
基于基元I统一理论的数学相关应用推导
已经有0人回复
基元I统一理论:宇宙本质、层级演化与修炼文明的本源规律
已经有1人回复
基元I理论下三大核心空间现象精准推导与细节解析
已经有0人回复
基于基元 I 统一理论的反重力理论推导
已经有0人回复
基于基元I统一理论的量子力学本源推导
已经有1人回复
» 本主题相关价值贴推荐,对您同样有帮助:
缩短OFRTRAN运行时间的问题
已经有6人回复
多核和应用性能的关系
已经有6人回复
32-bit Windows系统的elk-openmp并行版
已经有24人回复
在没有安装openmp库的计算机上能不能使用openmp?
已经有8人回复
分子動力學以OPENMP平行化時編譯問題
已经有5人回复
【讨论】锂电池首次效率问题
已经有9人回复
【讨论】大家对未来GPU在monte carlo中的应用持有什么样的态度(CUDA)?
已经有15人回复
【分享】elk-1.1.4
已经有9人回复
【求助】两台电脑并行问题
已经有5人回复
swordshadow
金虫 (初入文坛)
- 应助: 1 (幼儿园)
- 金币: 862.1
- 红花: 1
- 帖子: 44
- 在线: 46.4小时
- 虫号: 1272383
- 注册: 2011-04-21
- 专业: 凝聚态物性 II :电子结构
2楼2012-05-12 00:14:33
swordshadow
金虫 (初入文坛)
- 应助: 1 (幼儿园)
- 金币: 862.1
- 红花: 1
- 帖子: 44
- 在线: 46.4小时
- 虫号: 1272383
- 注册: 2011-04-21
- 专业: 凝聚态物性 II :电子结构
3楼2012-05-12 15:43:05
4楼2012-05-14 21:16:43














回复此楼