24小时热门版块排行榜    

查看: 1629  |  回复: 24

goldenfisher

金虫 (著名写手)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
pariah: 金币+5 2012-04-07 09:39:34
fzx2008: 金币+2, 专家考核, 谢谢指教 2012-04-07 10:12:09
这是计算资源不足的明显表现。
如果你多用核,应该就会很快跳过。
11楼2012-04-06 23:18:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

souledge

专家顾问 (著名写手)

★ ★
fzx2008: 金币+2, 专家考核, 谢谢回帖交流! 2012-04-07 10:12:23
引用回帖:
11楼: Originally posted by goldenfisher at 2012-04-06 23:18:34:
这是计算资源不足的明显表现。
如果你多用核,应该就会很快跳过。

不过一般计算资源不足不是容易卡在
“Starting wfc are xxxx randomized atomic wfcs”
这里么~
LZ的体系并不大,卡在Dense grid xxxx G-vectors这里,怎么看也不像是计算资源不足的样子,毕竟都使用了6个核心计算了……并且就算计算机也被别人同时用着,按照Linux的CPU分配,跑上几个小时以上这一步也应该过去了吧……
思想重于技巧,内涵重于表象
12楼2012-04-07 01:20:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

goldenfisher

金虫 (著名写手)

【答案】应助回帖

★ ★
fzx2008: 金币+2, 专家考核, 谢谢回帖交流! 2012-04-07 10:12:38
引用回帖:
12楼: Originally posted by souledge at 2012-04-07 01:20:36:
不过一般计算资源不足不是容易卡在
“Starting wfc are xxxx randomized atomic wfcs”
这里么~
LZ的体系并不大,卡在Dense grid xxxx G-vectors这里,怎么看也不像是计算资源不足的样子,毕竟都使用了6个核心 ...

卡在“Dense grid xxxx G-vectors”正式由于计算资源不足的表现,那是因为使用的k点太多所致。你单机算一个例子,如果你使用很密的k点,也很容易导致这个问题。何况楼主的体系,对单机而言,体系不算小,电子数目也不少。
还有一个问题,lz使用的是USPP的赝势,却没有定义ecutrho. ecutrho默认是ecutwfc的四倍。而且体系中有Ba这个元素,ecutwfc=40貌似有些小。最好做一个测试。
13楼2012-04-07 02:19:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

pariah

铜虫 (小有名气)

引用回帖:
13楼: Originally posted by goldenfisher at 2012-04-07 02:19:32:
卡在“Dense grid xxxx G-vectors”正式由于计算资源不足的表现,那是因为使用的k点太多所致。你单机算一个例子,如果你使用很密的k点,也很容易导致这个问题。何况楼主的体系,对单机而言,体系不算小,电子数目 ...

我单机是48个核心的,我奇怪的是他并没有占有内存,而是一味的占用了6个cpu,所以我觉得并不是时间长了就会过去的。
14楼2012-04-07 09:06:06
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

pariah

铜虫 (小有名气)

引用回帖:
10楼: Originally posted by souledge at 2012-04-06 16:54:17:
可以在编译时使用内部库:
--with-internal-blas
--with-internal-lapack
PWscf自带了这些线性数学库,并且这两个库的质量还很不错。经常用这两个库编译静态的VASP,测试与使用动态MKL连接的VASP计算速度没有 ...

那请问如果我中间换成ifort,mpich2用不用重新编译?export FC=ifort一下?这个有必要吗?
15楼2012-04-07 09:07:28
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

souledge

专家顾问 (著名写手)


fzx2008: 金币+1, 专家考核, 谢谢回帖交流! 2012-04-07 10:13:02
引用回帖:
15楼: Originally posted by pariah at 2012-04-07 09:07:28:
那请问如果我中间换成ifort,mpich2用不用重新编译?export FC=ifort一下?这个有必要吗?

不清楚MPICH的挂载ifort的方式,反正编译一下也就是十分钟的事~编译的时候configure FC=ifort就可以指定了。直接F90=ifort不知道管不管用~
思想重于技巧,内涵重于表象
16楼2012-04-07 09:53:16
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

souledge

专家顾问 (著名写手)

★ ★
fzx2008: 金币+2, 专家考核, 谢谢指教 2012-04-07 10:13:40
引用回帖:
13楼: Originally posted by goldenfisher at 2012-04-07 02:19:32:
卡在“Dense grid xxxx G-vectors”正式由于计算资源不足的表现,那是因为使用的k点太多所致。你单机算一个例子,如果你使用很密的k点,也很容易导致这个问题。何况楼主的体系,对单机而言,体系不算小,电子数目 ...

用台机(一直都用台机,老板到现在不批钱至少买个高端台机)算过60来个原子体系的,用7x7x7的K点,USPP赝势,45Ry+450Ry,0.01Ry的MP Smearing,耗费内存10GB左右,使用六个核心,卡在开始生成波函的地方十几分钟以上才开始进入SCF步~不过限制G向量网格时真没碰到问题~
原子中有Ti和W,都是考虑了半芯态生成的~整个电子数目还是非常多的~
这个过程有点类似VASP中,如果是在FFT planing那里挂的,可能就是编译问题多点;如果是reading WAVCAR挂的,可能是编译问题,也可能是资源问题了,要看具体情况了~
个人理解~
思想重于技巧,内涵重于表象
17楼2012-04-07 09:58:48
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

pariah

铜虫 (小有名气)

引用回帖:
16楼: Originally posted by souledge at 2012-04-07 09:53:16:
不清楚MPICH的挂载ifort的方式,反正编译一下也就是十分钟的事~编译的时候configure FC=ifort就可以指定了。直接F90=ifort不知道管不管用~

还是喜欢直接 yum install~~ 0 0 汗 呵呵
18楼2012-04-07 10:18:48
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

souledge

专家顾问 (著名写手)

引用回帖:
18楼: Originally posted by pariah at 2012-04-07 10:18:48:
还是喜欢直接 yum install~~ 0 0 汗 呵呵

用的什么系统?我这里有静态编译好的PGI版的pw.x,如果你的系统内核不是太老或者太新的,应该可以能直接运行试一下~
思想重于技巧,内涵重于表象
19楼2012-04-07 10:44:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

goldenfisher

金虫 (著名写手)

引用回帖:
17楼: Originally posted by souledge at 2012-04-07 09:58:48:
用台机(一直都用台机,老板到现在不批钱至少买个高端台机)算过60来个原子体系的,用7x7x7的K点,USPP赝势,45Ry+450Ry,0.01Ry的MP Smearing,耗费内存10GB左右,使用六个核心,卡在开始生成波函的地方 ...

好吧,你如果要这么说我就无语了。K点生成后那个地方,对数据交换、CPU和内存要求很高。不同的机器,配置是不同的。你的60个原子的体系,我不知道是何种体系,K点还可以这么密,我非常佩服!60个原子的体系,如果还包括重元素,我即使用天河也要算一天。
呵呵,Dense这个地方,数据通信最重要,因为要分配计算节点。
20楼2012-04-07 11:29:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 pariah 的主题更新
信息提示
请填处理意见