| 查看: 2688 | 回复: 2 | ||
| 【奖励】 本帖被评价1次,作者onesupeng增加金币 0.8 个 | ||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | ||
[资源]
【原创】并行平台构建与管理[8]:并行测试 GotoBLAS+hpl测试之L.dat各行意义及其设置
|
||
|
HPL.dat文件见附件 下面说说每行的意思和设置方法 1、2行,这个是说明性语句,不用更改。 3、4行,指定输出方式,加入4行选择file输出,则3表示输出文件名,这个名字可以根据你自己的习惯更改。比如,你测试16节点,为了区分其他测试,可以改为16nodes.out等等。 5、6行,5行相当于说你要测试的矩阵个数,第6行则是矩阵规模,第六行设置的数字必须不小于5行的大小。第6行的设置原则是:N^2*64=节点内存*节点数*8,N=0.8~0.9N。举个例子,我每节点有2G内存,4节点,N的算法为:N^2*64=1024*1024*1024*2*4*8,-〉N=32000~33000,再*0.8~0.9即可。按照经验,在0.9左右效果会更好。 7、8行设置矩阵分块方法。第7行是指分块方法的种数,第八行是指分块的大小,根据经验,对于GotoBLAS在AMD4000+上,用196,232,256效果比较好,当然其他也有一些说法,不过本人觉得经验性比较强,所以多试试总会有很好的结论。 9行是HPL 1.0a的新增项,是选择处理器阵列是按列的排列方式还是按行的排列方式。 10~12行说明二维处理器网格(P×Q)。二维处理器网格(P×Q)的要遵循以下几个要求:P×Q=进程数。这是HPL的硬性规定;P×Q=系统CPU数=进程数。一般来说一个进程对于一个CPU可以得到最佳性能。对于Intel Xeon来说,关闭超线程可以提高HPL性能;P≤Q,这是一个测试经验值,一般来说,P的值尽量取得小一点,因为列向通信量(通信次数和通信数据量)要远大于横向通信.等等这些,需要测试者多摸索。 后面的可以不用修改。 13行说明阈值。 第14~21行指明L分解的方式。 附件: HPLinpack benchmark input file Innovative Computing Laboratory, University of Tennessee HPL.out output file name (if any) 6 device out (6=stdout,7=stderr,file) 4 # of problems sizes (N) 10000 10000 10000 10000 Ns 4 # of NBs 1 2 3 4 NBs 0 PMAP process mapping (0=Row-,1=Column-major) 3 # of process grids (P x Q) 1 1 1 Ps 1 1 1 Qs 16.0 threshold 3 # of panel fact 0 1 2 PFACTs (0=left, 1=Crout, 2=Right) 2 # of recursive stopping criterium 2 4 NBMINs (>= 1) 1 # of panels in recursion 2 NDIVs 3 # of recursive panel fact. 0 1 2 RFACTs (0=left, 1=Crout, 2=Right) 1 # of broadcast 0 BCASTs (0=1rg,1=1rM,2=2rg,3=2rM,4=Lng,5=LnM) 1 # of lookahead depth 0 DEPTHs (>=0) 2 SWAP (0=bin-exch,1=long,2=mix) 64 swapping threshold 0 L1 in (0=transposed,1=no-transposed) form 0 U in (0=transposed,1=no-transposed) form 1 Equilibration (0=no,1=yes) 8 memory alignment in double (> 0) |
» 猜你喜欢
求2026年在台湾举行的物理和材料领域国际学术会议信息
已经有0人回复
求国际会议网站
已经有1人回复
物理学I论文润色/翻译怎么收费?
已经有99人回复
求取一些关于纳米材料和纳米技术相关的英文PPT。
已经有0人回复
【复旦大学】二维材料方向招收2026年博士研究生1名
已经有0人回复
北京纳米能源与系统研究所 王中林院士/曹南颖研究员课题组2026级硕/博/博后招生
已经有10人回复
荷兰Utrecht University超快太赫兹光谱王海教授课题招收2026 CSC博士生
已经有19人回复
反铁磁体中的磁性切换:两种不同的机制已成功可视化
已经有0人回复
26申博推荐:南京航空航天大学国际前沿院光学方向招收博士生!
已经有0人回复
求标准粉末衍射卡号 ICDD 01-076-1802
已经有0人回复
» 本主题相关价值贴推荐,对您同样有帮助:
【求助】“脉冲交流直流并联叠加测试的方法”怎么翻译
已经有2人回复
紫外可见光吸收谱中吸收波峰波谷相对值的意义是什么?
已经有6人回复
CSC一定要英语水平测试成绩吗
已经有4人回复
FLUENT读取并行case自动删除文件
已经有3人回复
远程登录linux系统如何实现fluent并行计算?
已经有6人回复
cnki 里面的成果数据库的意义
已经有3人回复
vasp并行测试时出错。
已经有7人回复
cp2k并行编译出错
已经有3人回复
【求助】转晶后精制的意义何在?
已经有4人回复
【通告】化学区近期将严厉打击纯表、无意义顶贴行为
已经有3人回复
【原创】并行平台构建与管理汇总
已经有4人回复
【原创】并行平台构建与管理[10]:强行删除pbs作业方式
已经有5人回复
【原创】并行平台构建与管理[1]:资金预算与配置
已经有3人回复
【讨论】湍流扩散系数的物理意义
已经有4人回复
【求助】重组人蛋白抗体如何检测和检测意义
已经有3人回复
3楼2013-02-18 00:16:15
2楼2013-02-17 23:35:37













回复此楼
