24小时热门版块排行榜    

查看: 1459  |  回复: 5
当前主题已经存档。

imation

铁杆木虫 (正式写手)

[交流] castep多核运算的问题

大家好,我有一台服务器,cpu为至强clovertown双路四核,每个核心频率是2ghz,内存667,4条,单条1g,操作系统装过2003中文版,sp1和sp2,也装过英文版sp1,2008英文版sp1
我尝试着运行tutorial里面的co分子adsorption在pb表面,一个核心运行很正常,1个小时就有结果,可是8个核心就总是失败,出现的问题也是千奇百怪:
1)进程castep,共八个,可是运行一会儿以后,自动减少到5个,有一次甚至减少到1个,内存无释放,有时任务失败,有时一直运算,但结果遥遥无期
2)cpu利用率在开始计算时为满负荷,经过1到5分钟,降到1~3%,内存没有释放,过10分钟左右,任务失败
3)尝试改变核心数目,发现1到3个都可以正常运行得到结果,超过3个就失败
4)还有n多错误,其中出现最多一个(每次都是在第一个点时出现),代码如下:

*Warning* max. SCF cycles performed but system has not reached the groundstate.
  
Current total energy, E     =  -5951.893478460     eV
Current free energy (E-TS)  =  -5951.990514506     eV
(energies not corrected for finite basis set)

NB est. 0K energy (E-0.5TS)      =  -5951.941996483     eV

  ****************************************************************************
  Warning: electronic minimisation did not converge when finding ground state.
  ****************************************************************************

Writing model to 1.check
Error in geom_get_forces - electronic_minimisation of current_cell failed
Error in geom_get_forces - electronic_minimisation of current_cell failed
Error in geom_get_forces - electronic_minimisation of current_cell failed
Error in geom_get_forces - electronic_minimisation of current_cell failed
[1] MPI Abort by user Aborting program !
[1] Aborting program!
[2] MPI Abort by user Aborting program !
[2] Aborting program!
[0] MPI Abort by user Aborting program !
[0] Aborting program!
forrtl: severe (47): write to READONLY file, unit 60, file D:\PROGRA~1\Accelrys\MATERI~1.1\Gateway\root_default\dsd\jobs\4GLA1\killfile
Image              PC        Routine            Line        Source            
castepexe_mpi.exe  00AB6CC2  Unknown               Unknown  Unknown
castepexe_mpi.exe  00AB3F50  Unknown               Unknown  Unknown
castepexe_mpi.exe  00A42B9E  Unknown               Unknown  Unknown
castepexe_mpi.exe  00A427BB  Unknown               Unknown  Unknown
castepexe_mpi.exe  00A246D1  Unknown               Unknown  Unknown
castepexe_mpi.exe  009F8E7B  Unknown               Unknown  Unknown
castepexe_mpi.exe  009F8EAF  Unknown               Unknown  Unknown
castepexe_mpi.exe  004FB352  Unknown               Unknown  Unknown
castepexe_mpi.exe  004E5281  Unknown               Unknown  Unknown
castepexe_mpi.exe  004DC8D0  Unknown               Unknown  Unknown
castepexe_mpi.exe  00402353  Unknown               Unknown  Unknown
castepexe_mpi.exe  00ABE578  Unknown               Unknown  Unknown
castepexe_mpi.exe  00A904BB  Unknown               Unknown  Unknown
kernel32.dll       7C82F23B  Unknown               Unknown  Unknown

我尝试增加maximum iterations到1000,Max SCF cycles到5000,八核并行运算,算了2天半,正常,我stop运算,在输出中发现还是有些错误:
WARNING - user ionic constraints and symmetry specified
        - symmetry has precedence over constraints
        - may lead to a conflict?

HINT    - if convergence fails try switching symmetry OFF






BFGS: Warning - trial step suggests complex energy landscape
                 in which simple line minimization will fail.
  
               - This is usually an indication that the forces/streses
                 are not accurate enough. Consider increasing the cutoff
                 energy and/or the electronic convergence tolerance.
  
               - Proceeding with a bisection search to find root instead.




Warning: There are no empty bands for at least one kpoint and spin; this may
          slow the convergence and/or lead to an inaccurate groundstate.
          If this warning persists, you should consider increasing nextra_bands
          and/or reducing smearing_width in the param file.
          Recommend using nextra_bands of 14 to 29.  




BFGS: Warning - Repeated consecutive reset of inverse Hessian
BFGS:           without satisfying convergence criteria which
BFGS:           looks like BFGS has run out of search directions.
BFGS: Warning - Lets try allowing some uphill steps and see if
BFGS:           we can get around this barrier.
BFGS: Warning - It is possible that the system may now converge to
BFGS:           a stationary point OTHER than the desired minimum.
BFGS: Hint    - this may be an indication that either:
BFGS:           a) you are using a poor guess at geom_frequency_est
BFGS:           and/or geom_modulus_est, or
BFGS:           b) you are using unrealistic convergence criteria.
BFGS:           Suggest therefore that you consider changing them!


等等,就不一一列出了
我的问题是,为何单核1个小时就能算出来的project,多核要么不能运算,要么运算起来比单核还要慢得多?是不是多核并行处理的时候数据交换有问题啊?

谢谢,不知道描叙清楚了没有
回复此楼

» 猜你喜欢

» 本主题相关商家推荐: (我也要在这里推广)

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

carlon

金虫 (小有名气)

★ ★
csfn(金币+2,VIP+0):感谢积极的交流 :-) 欢迎常来
多个cpu运行的话,容易出错。只要其中一个进程出错,计算就不会有结果
此时其他进程仍在运行,这可能就是为什么1个cpu1个小时算完,多cpu运行算很久没有结果的原因。
另外,在多个cpu运行过程中,上面还有很多warning信息
1。HINT    - if convergence fails try switching symmetry OFF
这里可能是限制对称性,导致不好收敛,或者给原子设置了constrain,有时候收敛困难,可以在计算的时候去掉symmetry,试试看。
2。BFGS: Warning - trial step suggests complex energy landscape
                 in which simple line minimization will fail.
平面波cutoff设置可能过小。
3。empty band空带数不足,如果体系是金属性的话,不容易收敛。
2楼2007-12-07 21:25:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

imation

铁杆木虫 (正式写手)

呵呵,这儿高手挺多的,而且很热心

谢谢carlon,我对量子力学不熟悉,我自己主要用discover模块,这个castep程序是帮师兄做的,因为是新机器,一直没发现这个问题,所以出现问题以后,让服务器提供商来搞了几次都没成功

以后多多向大家请教
3楼2007-12-07 22:26:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cometring

木虫 (著名写手)

爱你就等于爱自己

这里确实高手很多
与超版斗,其乐无穷;与斑竹斗,其乐无穷;与虫子斗,其乐无穷。
4楼2007-12-08 14:48:52
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

fah

铁杆木虫 (著名写手)

以后要多学习啊
5楼2007-12-09 10:02:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

kuner

铁虫 (正式写手)

我也有这样的问题,单核比多核还快
6楼2008-10-19 00:23:30
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 imation 的主题更新
普通表情 高级回复 (可上传附件)
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[基金申请] 请教下大家 2026年国家基金申请是双盲审吗? +3 lishucheng1 2026-03-22 5/250 2026-03-24 08:22 by gltch
[考研] 291求调剂 +8 hhhhxn.. 2026-03-23 8/400 2026-03-23 23:15 by peike
[考研] 一志愿重庆大学085700资源与环境,总分308求调剂 +7 墨墨漠 2026-03-23 8/400 2026-03-23 20:36 by Creta
[考研] 一志愿武理材料工程348求调剂 +6  ̄^ ̄゜汗 2026-03-19 9/450 2026-03-23 19:53 by pswait
[考研] 接收2026硕士调剂(学硕+专硕) +4 allen-yin 2026-03-23 6/300 2026-03-23 15:04 by 汪!?!
[考研] 287求调剂 +8 晨昏线与星海 2026-03-19 9/450 2026-03-22 17:01 by i_cooler
[考研] 生物学调剂 +5 Surekei 2026-03-21 5/250 2026-03-22 14:39 by tcx007
[考研] 材料学硕301分求调剂 +7 Liyouyumairs 2026-03-21 7/350 2026-03-21 22:31 by peike
[考研] 一志愿东华大学控制学硕320求调剂 +3 Grand777 2026-03-21 3/150 2026-03-21 19:23 by 简之-
[考研] 一志愿深大,0703化学,总分302,求调剂 +4 七月-七七 2026-03-21 4/200 2026-03-21 18:20 by 学员8dgXkO
[考研] 268求调剂 +9 简单点0 2026-03-17 9/450 2026-03-21 15:37 by lature00
[考研] 085601调剂 358分 +3 zzzzggh 2026-03-20 4/200 2026-03-21 10:21 by luoyongfeng
[考研] 085700资源与环境308求调剂 +12 墨墨漠 2026-03-18 13/650 2026-03-21 01:42 by JourneyLucky
[考研] 290求调剂 +7 ^O^乜 2026-03-19 7/350 2026-03-20 21:43 by JourneyLucky
[考研] 一志愿西南交通 专硕 材料355 本科双非 求调剂 +5 西南交通专材355 2026-03-19 5/250 2026-03-20 21:10 by JourneyLucky
[考研] 一志愿吉林大学材料学硕321求调剂 +11 Ymlll 2026-03-18 15/750 2026-03-20 19:40 by 丁丁*
[考研] 086500 325 求调剂 +3 领带小熊 2026-03-19 3/150 2026-03-20 18:38 by 尽舜尧1
[考研] 广西大学家禽遗传育种课题组2026年硕士招生(接收计算机专业调剂) +3 123阿标 2026-03-17 3/150 2026-03-20 15:58 by 飞行琦
[考博] 申博26年 +3 八6八68 2026-03-19 3/150 2026-03-19 19:43 by nxgogo
[考研] 0703化学调剂 +3 妮妮ninicgb 2026-03-17 3/150 2026-03-18 10:29 by macy2011
信息提示
请填处理意见