24小时热门版块排行榜    

查看: 5693  |  回复: 23
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

kelvinpolyu

铜虫 (初入文坛)

[求助] 请问96G的内存, 12核, 2.66GHz 的电脑配置, CASTEP能计算最多的原子数 ?

请问96G的内存, 12核, 2.66GHz 的电脑配置, CASTEP 能计算最多的原子数 ?计算时间? 谢谢
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

souledge

专家顾问 (著名写手)

★ ★ ★
uuv2010(金币+1): 欢迎参加讨论 2011-12-15 13:13:28
fzx2008(金币+2): 谢谢指教 2011-12-15 13:25:13
引用回帖:
14楼: Originally posted by sunboyccc at 2011-12-14 22:05:44:
呵呵,我只是就“单机计算”说一说,并且不同的软件(或相同软件不同版本)或不同系统情况又不同啦,没有涉及小型机多节点计算。
我的感觉:单机、windows系统的情况下,同样是四核或六核CPU,主频越高、性能越 ...

这就是说得单机计算啊……只不过在CASTEP和VASP中都是使用node来表示一个并行进程,而在PWscf、Abinit中则是使用Processor来表示的而已~
尽管软件之间的设计各有不同,但是总的来说对内存的使用规则是一定的,那就是分node(或者processor)并行,并且在node数足够多时为减少对同一个内存有过多进程进行读写,再分组成为不同池的方法。
而作为一个DFT软件,其内存的占用仅仅与K点和K点需要展开的平面波数密切相关。当然,可能还需要点其他的开销,这些开销在K点和平面波面前就几乎可以忽略了,下面是典型的平面波赝势方法的内存开销结构:
CODE:
     Largest allocated arrays     est. size (Mb)     dimensions
        Kohn-Sham Wavefunctions         1.34 Mb     (   4004,  22)
        NL pseudopotentials             1.47 Mb     (   4004,  24)
        Each V/rho on FFT grid          1.19 Mb     (  77760)
        Each G-vector array             0.24 Mb     (  32031)
        G-vector shells                 0.01 Mb     (   1535)
     Largest temporary arrays     est. size (Mb)     dimensions
        Auxiliary wavefunctions         5.38 Mb     (   4004,  88)
        Each subspace H/S matrix        0.12 Mb     (     88,  88)
        Each matrix      0.01 Mb     (     24,  22)
        Arrays for rho mixing           9.49 Mb     (  77760,   8)

     Initial potential from superposition of free atoms

     starting charge   34.99996, renormalised to   36.00000
     Starting wfc are   26 atomic wfcs

     total cpu time spent up to now is     84.16 secs
     per-process dynamical memory:    22.7 Mb

所以,对于给定的系统,其内存需求是有上限的,并不是说随便给个体系,只要加足够多的内存,就能足够的快一样(当然,很多不懂系统的人,总以为对于只使用2GB内存的前提下,8GB内存会比4GB内存快)。
所以,如果一定要说同核前提下,高频的CPU会使用更多内存,那就只有可能是使用过程中程序根据CPU速度自动判断了分组情况,增加了内存池的数目而已。这个信息在castep输出文件中,完全不算后话。
至于在Windows下和*nix下的速度问题。以CASTEP来说,给出了三种(5.5开始大概是四种)运行模式,其中不使用任何硬盘空间作为缓存的为speed方式。但是就是这个方式,在Windows下运行时,如果内存不是非常多,并且使用的比较古老的对内存管理比较失败的系统(比如XP),那系统就不会完全把程序请求的空间分配在物理内存中,而是选择了一部分放在虚拟内存中。对程序本身来说,这两个部分没有区别,但是从实际来说,这跟选择default甚至memory方法运行本质上区别不大,于是速度变慢。而在*nix下,则是严格先分配物理内存,只有不足时才会分配到swap空间,所以*nix下时,swap空间一般都一直是0%的占用率。
另外,Windows的shell和kernel直接一体化的设计,在图形方面响应很好,但是在分配计算工作时就非常痛苦,所以如果用Windows版的Abinit时,如果使用所有核心计算,系统会卡顿得非常严重,不管CPU是不是很牛X,但是同样的计算在Linux下就流畅得多。
DFT及DFT软件的计算机使用本身是有些不确定性,但是这些不确定性都是在一定的理论范围内的,不至于像LS所说的那样悬忽。
最后,不得不说,支持“内存决定能否计算,CPU决定计算时间”的说法,这个从DFT程序的设计来说是完全合理的论断。
思想重于技巧,内涵重于表象
15楼2011-12-15 01:23:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 24 个回答

avast2009

荣誉版主 (职业作家)

努力、勤奋!

优秀版主优秀版主优秀版主优秀版主优秀版主

【答案】应助回帖


zzy870720z(金币+1): 鼓励交流经验,但下次希望注意说话方式,呵呵 2011-11-03 20:19:03
靠,这配置应该很猛了
我4核,8G跑80多个原子要三天,感觉你这个应该能算更多原子吧
2楼2011-11-03 09:22:09
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

香水百合519

铁虫 (小有名气)

【答案】应助回帖


zzy870720z(金币+1): 鼓励交流 2011-11-03 20:19:17
这个配置算 肯定很快了 不过castep自身算不了太多原子 与电脑配置没多大关系吧
3楼2011-11-03 10:43:06
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

renmingjun

银虫 (小有名气)

引用回帖:
2楼: Originally posted by avast2009 at 2011-11-03 09:22:09:
靠,这配置应该很猛了
我4核,8G跑80多个原子要三天,感觉你这个应该能算更多原子吧

您好!我是一个新手,以前没怎么接触过MS,老板想搞计算,主要做燃料电池催化剂,计算内容为过渡金属催化剂的DOS,也有可能应用DMOL3进行小分子催化分解的相关计算,不知道要怎么样的配置才能合适啊?
4楼2011-11-03 11:21:18
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见