| 查看: 2943 | 回复: 7 | |||||
xiaoxuan1111铁杆木虫 (正式写手)
|
[求助]
集群下Castep多CPU计算出现问题 已有1人参与
|
|
我用的是学校的集群,利用castep进行几何优化,pbs文件如下 #!/bin/sh #PBS -N pppa #PBS -l nodes=1:ppn=8 #PBS -o /home/lgx2015/out #PBS -e /home/lgx2015/err #PBS -m bae cd /home/lgx2015/aa5 /home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/bin/RunCASTEP.sh Cs2NaYF6 这样是可以运行的,大概一个小时就能得到结果,但是这样是单核计算,因为我还有更复杂的计算,单核有点慢,所以想多核运行。 我把它改成多核的话,就是把上面的pbs文件最后一行改为/home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/bin/RunCASTEP.sh -np 8 Cs2NaYF6 只是加了-np 8 任务提交上去后,发现集群倒是分配了相应的节点和CPU,但是实际上并不进行运算 请问这种情况,问题出在哪里呢? 学校的集群并没有安装materials studio,我是在自己的用户目录下安装的 就是说我可以单核运行castep,多核就不行了,这个怎么办呢,是哪里设置有问题吗 这些修改操作我都完成了,修改Accelrys/MaterialsStudio7.0/share/data下的machines.LINUX, 写上各节点的机器名:CPU数。 修改Accelrys/MaterialsStudio7.0/etc/Gateway/root_default/dsd/conf文件夹里面两个文件里的CPU数为各节点CPU总数。 |
» 收录本帖的淘帖专辑推荐
xuexijisuan | 可能会用到的 |
» 猜你喜欢
复试调剂,一志愿郑州大学材料与化工289分
已经有23人回复
化学工程与技术专业一志愿哈工程 291分B区 国家级大创负责人 有一作论文
已经有6人回复
材料调剂
已经有10人回复
314求调剂
已经有12人回复
调剂 化学 307
已经有8人回复
一志愿211 0703化学 346分求调剂
已经有11人回复
086003调剂求助
已经有14人回复
085400 328分 求调剂
已经有5人回复
083200 初试305分 求调剂
已经有9人回复
284求调剂
已经有3人回复
» 本主题相关价值贴推荐,对您同样有帮助:
Castep多CPU计算的问题解决了,又遇到了不能多节点计算的问题
已经有7人回复
ion set Q at origin recip failure to write recip Q0错误解决方法
已经有3人回复
castep计算总是出错,算了半个月了,天天出错
已经有12人回复
Fedora 16下MS5.5分子力学模块运行不正常
已经有1人回复

devinhu
木虫 (小有名气)
- 应助: 37 (小学生)
- 金币: 2459.6
- 红花: 20
- 帖子: 160
- 在线: 210小时
- 虫号: 1408034
- 注册: 2011-09-19
- 性别: GG
- 专业: 理论和计算化学
【答案】应助回帖
★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
xiaoxuan1111: 金币+10, ★★★很有帮助, 非常感谢,还是有点问题 2015-08-07 22:04:59
xiaoxuan1111: 金币+40, ★★★很有帮助, 非常感谢,搞了一上午,问题解决了 2015-08-08 12:36:29
感谢参与,应助指数 +1
xiaoxuan1111: 金币+10, ★★★很有帮助, 非常感谢,还是有点问题 2015-08-07 22:04:59
xiaoxuan1111: 金币+40, ★★★很有帮助, 非常感谢,搞了一上午,问题解决了 2015-08-08 12:36:29
|
#!/bin/bash #PBS -N test1 #PBS -r n #PBS -j oe #PBS -l walltime=72:00:00 #PBS -l nodes=4:ppn=8 #PBS -q normal project_name=CO_1 # change name here!!! EXE=castepexe.exe ########################################################## # The following should be no need to # change any of these settings for normal use. ########################################################## # go to work dir cd $PBS_O_WORKDIR # setup mpd env (Of course use some other secret word than "dfadfs" ![]() if [ ! -f ~/.mpd.conf ]; then /bin/echo "secretword=dfadfs" >> ~/.mpd.conf /bin/chmod 600 ~/.mpd.conf fi # setup Nums of Processor NP=`cat $PBS_NODEFILE|wc -l` echo "Numbers of Processors: $NP" echo "---------------------------" echo `date` cat $PBS_NODEFILE | uniq # setup mpi env (em64t) #export OMP_NUM_THREADS=1 #export P4_GLOBMEMSIZE=1073741824 export I_MPI_PIN_DOMAIN=auto export MPD_CON_EXT=$PBS_JOBID # setup accelrys env source /data/apps/accelrys/ms60.sh mpirun -r ssh -genv I_MPI_FABRICS shm:dapl -n $NP $MS_INSTALL_ROOT/bin/$EXE $project_name rm -f *.pid echo `date` >> $HOME/finish echo `pwd` >> $HOME/finish exit 0 其中ms60.sh内容是 #!/bin/bash # Parallel Environment Setting for Materials Studio 6.0 export MS_INSTALL_ROOT=/data/apps/accelrys/MaterialsStudio6.0 export MSI_LIC_PACK_DIR=/data/apps/accelrys/LicensePack export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$MSI_LIC_PACK_DIR/linux/lib:$MS_INSTALL_ROOT/lib export PATH=$PATH:$MS_INSTALL_ROOT/etc/CASTEP/bin/:$MS_INSTALL_ROOT/etc/DMol3/bin/::$MS_INSTALL_ROOT/etc/GULP/bin export Castep_DATA=$MS_INSTALL_ROOT/share/Resources/Quantum/Castep export Castep_TMP=/tmp export DMOL3_DATA=$MS_INSTALL_ROOT/share/Resources/Quantum/DMol3 export DMOL_TMP=/tmp export TMPDIR=$Castep_TMP . $MSI_LIC_PACK_DIR/etc/lp_profile eval `$MS_INSTALL_ROOT/share/license/data/lic_setup.sh $MS_INSTALL_ROOT -s sh` 注,我们的计算节点是通过IB网通信的,如果不是则直接mpirun -np $NP 你可以直接source /home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/etc/lp_profile mpirun /home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/bin/castepexe.exe Cs2NaYF6 试试 |
2楼2015-08-07 21:03:50
devinhu
木虫 (小有名气)
- 应助: 37 (小学生)
- 金币: 2459.6
- 红花: 20
- 帖子: 160
- 在线: 210小时
- 虫号: 1408034
- 注册: 2011-09-19
- 性别: GG
- 专业: 理论和计算化学
3楼2015-08-07 21:04:29
devinhu
木虫 (小有名气)
- 应助: 37 (小学生)
- 金币: 2459.6
- 红花: 20
- 帖子: 160
- 在线: 210小时
- 虫号: 1408034
- 注册: 2011-09-19
- 性别: GG
- 专业: 理论和计算化学
4楼2015-08-07 21:10:12
xiaoxuan1111
铁杆木虫 (正式写手)
- 应助: 2 (幼儿园)
- 金币: 5648.8
- 散金: 20
- 红花: 3
- 帖子: 418
- 在线: 948.2小时
- 虫号: 1547569
- 注册: 2011-12-22
- 性别: GG
- 专业: 热物性与热物理测试技术
|
谢谢你,但还是有问题。 你给的这个 source/home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/etc/lp_profile mpirun/home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/bin/castepexe.exe Cs2NaYF6 一些路径有点儿错误,我找到了我所安装的软件的lp_profile、mpirun和castepexe.exe分别所在的位置,改过来后还是不能多CPU运行 其实我很怀疑是我软件安装后的设置有问题,我把/home/lgx2015/Accelrys/MaterialsStudio7.0/share/data下的machines.LINUX中的node1改成我的登陆节点名的话,是可以多CPU运行的,但集群管理员说这样做就指定了节点,是被禁止的,集群要自动分配节点,让我找一下软件的设置问题。 就是说,我不指定节点而由集群自动分配节点的话,只能单CPU运行,指定节点倒是可以多CPU运行,但会被管理员禁止。 你给我的这个pbs脚本好长啊,我试试我可不可以用…… |

5楼2015-08-07 22:20:40
devinhu
木虫 (小有名气)
- 应助: 37 (小学生)
- 金币: 2459.6
- 红花: 20
- 帖子: 160
- 在线: 210小时
- 虫号: 1408034
- 注册: 2011-09-19
- 性别: GG
- 专业: 理论和计算化学
6楼2015-08-07 23:04:17
devinhu
木虫 (小有名气)
- 应助: 37 (小学生)
- 金币: 2459.6
- 红花: 20
- 帖子: 160
- 在线: 210小时
- 虫号: 1408034
- 注册: 2011-09-19
- 性别: GG
- 专业: 理论和计算化学
7楼2015-08-07 23:05:16
xiaoxuan1111
铁杆木虫 (正式写手)
- 应助: 2 (幼儿园)
- 金币: 5648.8
- 散金: 20
- 红花: 3
- 帖子: 418
- 在线: 948.2小时
- 虫号: 1547569
- 注册: 2011-12-22
- 性别: GG
- 专业: 热物性与热物理测试技术

8楼2015-08-08 12:42:32













回复此楼
