24小时热门版块排行榜    

CyRhmU.jpeg
查看: 2531  |  回复: 36

Ireson

银虫 (正式写手)

引用回帖:
9楼: Originally posted by wmy8802217 at 2016-02-28 10:36:08
话说你有试过多GPU么。。。为什么我超过两个就跪了

我们就买了一颗K40,所以用一个。

发自小木虫Android客户端
11楼2016-02-28 12:51:31
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Ireson

银虫 (正式写手)

引用回帖:
6楼: Originally posted by ultraq at 2016-02-28 08:21:18
闻到土豪的味道,k40c

只有一颗

发自小木虫Android客户端
12楼2016-02-28 12:52:14
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Ireson

银虫 (正式写手)

引用回帖:
7楼: Originally posted by haizhiwuyu at 2016-02-28 08:53:29
我也尝试过,感觉影响因素很多,算例不同利用率确实不同,与内存使用率也没有必然关系。

还没用到90呢。一直以为是软件编译的问题,试了很多种还是这样,你们可以用GPU+多线程cpu运行吗?

发自小木虫Android客户端
13楼2016-02-28 12:55:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Ireson

银虫 (正式写手)

引用回帖:
9楼: Originally posted by wmy8802217 at 2016-02-28 10:36:08
话说你有试过多GPU么。。。为什么我超过两个就跪了

你试过gpu+cpu多线程计算吗?我就只能带一个cpu线程,多个cpu线程调用不起来。

发自小木虫Android客户端
14楼2016-02-28 12:58:18
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Ireson

银虫 (正式写手)

引用回帖:
9楼: Originally posted by wmy8802217 at 2016-02-28 10:36:08
话说你有试过多GPU么。。。为什么我超过两个就跪了

你使用mps的指令调用的吗?类似于mpiexec.hydra -n 8 vasp_gpu

发自小木虫Android客户端
15楼2016-02-28 13:02:52
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

haizhiwuyu

铁杆木虫 (著名写手)

★ ★ ★ ★ ★ ★
小木虫: 金币+0.5, 给个红包,谢谢回帖
Ireson: 金币+5 2016-02-28 13:57:51
引用回帖:
13楼: Originally posted by Ireson at 2016-02-28 12:55:32
还没用到90呢。一直以为是软件编译的问题,试了很多种还是这样,你们可以用GPU+多线程cpu运行吗?
...

使用mpirun  -np 2 vasp_gpu
运行时,我的机子是用了两个cpu和两个显卡

发自小木虫IOS客户端
问世间是否此山最高,或另有高处比天高!
16楼2016-02-28 13:39:23
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Ireson

银虫 (正式写手)

引用回帖:
16楼: Originally posted by haizhiwuyu at 2016-02-28 13:39:23
使用mpirun  -np 2 vasp_gpu
运行时,我的机子是用了两个cpu和两个显卡
...

那是因为一颗GPU带一个CPU socket, 所以运行的时候会自动带一个线程的CPU.
请看下面这段,节选自上文中提到的那个博客
I have only performed single-node benchmarks so far, so the focus is comparing the speed when running with CPUs only vs. CPUs+GPUs. The K40 node has 2 GPUs and 2 CPU sockets, with 1 GPU attached to each socket, so the comparison is 16 cores vs (any number of cores) and 2 GPUs. Typically, I found that using 8 MPI ranks (i.e. 8 out of 16 cores on a Triolith node) sharing 2 GPUs using MPS was the fastest combination for regular DFT jobs.
这个老师确是实现了gpu加多个cpu线程的运行,而且还比较了速度.你们安装的时候考虑过吗?
17楼2016-02-28 13:57:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
★ ★ ★ ★ ★ ★ ★ ★ ★
Ireson: 金币+3 2016-02-28 15:22:45
Ireson: 金币+3 2016-02-28 15:22:46
Ireson: 金币+3 2016-02-28 15:22:47
18楼2016-02-28 14:02:08
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

laozhu5572

木虫 (文坛精英)

★ ★ ★
Ireson: 金币+3 2016-02-28 15:22:56
帮顶!
19楼2016-02-28 14:47:09
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

匿名

用户注销 (正式写手)

★ ★ ★ ★ ★ ★
小木虫: 金币+0.5, 给个红包,谢谢回帖
Ireson: 金币+5 2016-02-28 15:28:53
本帖仅楼主可见
20楼2016-02-28 15:02:24
已阅   申请1ST强帖   回复此楼   编辑   查看我的主页
相关版块跳转 我要订阅楼主 Ireson 的主题更新
普通表情 高级回复(可上传附件)
信息提示
请填处理意见