24小时热门版块排行榜    

北京石油化工学院2026年研究生招生接收调剂公告
查看: 2927  |  回复: 7

xiaoxuan1111

铁杆木虫 (正式写手)

[求助] 集群下Castep多CPU计算出现问题 已有1人参与

我用的是学校的集群,利用castep进行几何优化,pbs文件如下
#!/bin/sh
#PBS -N pppa
#PBS -l nodes=1:ppn=8
#PBS -o /home/lgx2015/out
#PBS -e /home/lgx2015/err
#PBS -m bae
cd /home/lgx2015/aa5
/home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/bin/RunCASTEP.sh Cs2NaYF6

这样是可以运行的,大概一个小时就能得到结果,但是这样是单核计算,因为我还有更复杂的计算,单核有点慢,所以想多核运行。
我把它改成多核的话,就是把上面的pbs文件最后一行改为/home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/bin/RunCASTEP.sh -np 8 Cs2NaYF6
只是加了-np 8
任务提交上去后,发现集群倒是分配了相应的节点和CPU,但是实际上并不进行运算
请问这种情况,问题出在哪里呢?
学校的集群并没有安装materials studio,我是在自己的用户目录下安装的
就是说我可以单核运行castep,多核就不行了,这个怎么办呢,是哪里设置有问题吗
这些修改操作我都完成了,修改Accelrys/MaterialsStudio7.0/share/data下的machines.LINUX,  写上各节点的机器名:CPU数。
修改Accelrys/MaterialsStudio7.0/etc/Gateway/root_default/dsd/conf文件夹里面两个文件里的CPU数为各节点CPU总数。
回复此楼
你想要什么,如何得到想要的,现在应该怎么做?
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

devinhu

木虫 (小有名气)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
xiaoxuan1111: 金币+10, ★★★很有帮助, 非常感谢,还是有点问题 2015-08-07 22:04:59
xiaoxuan1111: 金币+40, ★★★很有帮助, 非常感谢,搞了一上午,问题解决了 2015-08-08 12:36:29
#!/bin/bash
#PBS -N test1
#PBS -r n
#PBS -j oe
#PBS -l walltime=72:00:00
#PBS -l nodes=4:ppn=8
#PBS -q normal

project_name=CO_1    # change name here!!!
EXE=castepexe.exe



##########################################################
# The following should be no need to
#       change any of these settings for normal use.
##########################################################

# go to work dir
cd $PBS_O_WORKDIR
# setup mpd env (Of course use some other secret word than "dfadfs"
if [ ! -f ~/.mpd.conf ]; then
/bin/echo "secretword=dfadfs" >> ~/.mpd.conf
/bin/chmod 600 ~/.mpd.conf
fi
# setup Nums of Processor
NP=`cat $PBS_NODEFILE|wc -l`
echo "Numbers of Processors:  $NP"
echo "---------------------------"
echo `date`
cat $PBS_NODEFILE | uniq

# setup mpi env (em64t)
#export OMP_NUM_THREADS=1
#export P4_GLOBMEMSIZE=1073741824
export I_MPI_PIN_DOMAIN=auto
export MPD_CON_EXT=$PBS_JOBID

# setup accelrys env
source /data/apps/accelrys/ms60.sh

mpirun -r ssh -genv I_MPI_FABRICS shm:dapl -n $NP  $MS_INSTALL_ROOT/bin/$EXE $project_name
rm -f *.pid

echo `date` >> $HOME/finish
echo `pwd` >>  $HOME/finish

exit 0

其中ms60.sh内容是
#!/bin/bash
# Parallel Environment Setting for Materials Studio 6.0

export MS_INSTALL_ROOT=/data/apps/accelrys/MaterialsStudio6.0
export MSI_LIC_PACK_DIR=/data/apps/accelrys/LicensePack
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$MSI_LIC_PACK_DIR/linux/lib:$MS_INSTALL_ROOT/lib
export PATH=$PATH:$MS_INSTALL_ROOT/etc/CASTEP/bin/:$MS_INSTALL_ROOT/etc/DMol3/bin/::$MS_INSTALL_ROOT/etc/GULP/bin

export Castep_DATA=$MS_INSTALL_ROOT/share/Resources/Quantum/Castep
export Castep_TMP=/tmp
export DMOL3_DATA=$MS_INSTALL_ROOT/share/Resources/Quantum/DMol3
export DMOL_TMP=/tmp
export TMPDIR=$Castep_TMP

. $MSI_LIC_PACK_DIR/etc/lp_profile
eval `$MS_INSTALL_ROOT/share/license/data/lic_setup.sh $MS_INSTALL_ROOT -s sh`

注,我们的计算节点是通过IB网通信的,如果不是则直接mpirun -np $NP

你可以直接source /home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/etc/lp_profile
mpirun /home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/bin/castepexe.exe   Cs2NaYF6 试试
2楼2015-08-07 21:03:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

devinhu

木虫 (小有名气)

引用回帖:
2楼: Originally posted by devinhu at 2015-08-07 21:03:50
#!/bin/bash
#PBS -N test1
#PBS -r n
#PBS -j oe
#PBS -l walltime=72:00:00
#PBS -l nodes=4:ppn=8
#PBS -q normal

project_name=CO_1    # change name here!!!
EXE=castepexe.exe



####### ...

忘记说明了,上面是我们的torque的脚本,,仅供参考
3楼2015-08-07 21:04:29
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

devinhu

木虫 (小有名气)

引用回帖:
2楼: Originally posted by devinhu at 2015-08-07 21:03:50
#!/bin/bash
#PBS -N test1
#PBS -r n
#PBS -j oe
#PBS -l walltime=72:00:00
#PBS -l nodes=4:ppn=8
#PBS -q normal

project_name=CO_1    # change name here!!!
EXE=castepexe.exe



####### ...

mpirun 后面少了 -np 8
如果显示没有mpirun 那么换成绝对路径/home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/bin/mpirun
另外,如果是直接用torque脚本的话conf等那些东西是不需要动就可以的
4楼2015-08-07 21:10:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xiaoxuan1111

铁杆木虫 (正式写手)

引用回帖:
2楼: Originally posted by devinhu at 2015-08-07 21:03:50
#!/bin/bash
#PBS -N test1
#PBS -r n
#PBS -j oe
#PBS -l walltime=72:00:00
#PBS -l nodes=4:ppn=8
#PBS -q normal

project_name=CO_1    # change name here!!!
EXE=castepexe.exe



####### ...

谢谢你,但还是有问题。
你给的这个
source/home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/etc/lp_profile
mpirun/home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/bin/castepexe.exe   Cs2NaYF6
一些路径有点儿错误,我找到了我所安装的软件的lp_profile、mpirun和castepexe.exe分别所在的位置,改过来后还是不能多CPU运行
其实我很怀疑是我软件安装后的设置有问题,我把/home/lgx2015/Accelrys/MaterialsStudio7.0/share/data下的machines.LINUX中的node1改成我的登陆节点名的话,是可以多CPU运行的,但集群管理员说这样做就指定了节点,是被禁止的,集群要自动分配节点,让我找一下软件的设置问题。
就是说,我不指定节点而由集群自动分配节点的话,只能单CPU运行,指定节点倒是可以多CPU运行,但会被管理员禁止。
你给我的这个pbs脚本好长啊,我试试我可不可以用……
你想要什么,如何得到想要的,现在应该怎么做?
5楼2015-08-07 22:20:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

devinhu

木虫 (小有名气)

引用回帖:
5楼: Originally posted by xiaoxuan1111 at 2015-08-07 22:20:40
谢谢你,但还是有问题。
你给的这个
source/home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/etc/lp_profile
mpirun/home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/bin/castepexe.exe   Cs2NaYF6 ...

节点指定是通过torque里面有个类似有machines.LINUX的文件控制的,。。所以这个文件可以不用动
一开始的回答有问题。。我后面补充了
/home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/bin/mpirun -np 8  /home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/bin/castepexe.exe   Cs2NaYF6
如果出错了,记得把出错信息贴出来,,例如/home/lgx2015/err和/home/lgx2015/out文件
6楼2015-08-07 23:04:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

devinhu

木虫 (小有名气)

引用回帖:
5楼: Originally posted by xiaoxuan1111 at 2015-08-07 22:20:40
谢谢你,但还是有问题。
你给的这个
source/home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/etc/lp_profile
mpirun/home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/bin/castepexe.exe   Cs2NaYF6 ...

你可以参照我的pbs脚本,,但是注意改路径
7楼2015-08-07 23:05:16
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xiaoxuan1111

铁杆木虫 (正式写手)

引用回帖:
2楼: Originally posted by devinhu at 2015-08-07 21:03:50
#!/bin/bash
#PBS -N test1
#PBS -r n
#PBS -j oe
#PBS -l walltime=72:00:00
#PBS -l nodes=4:ppn=8
#PBS -q normal

project_name=CO_1    # change name here!!!
EXE=castepexe.exe



####### ...

我今天上午又试着弄了一下,最后终于弄好了。
我的PBS脚本是没问题的,问题出在当时安装软件时我按照一些教程的说法把machines.LINUX文件给改动了。
我现在把它改成
localhost:24
localhost:24
localhost:24
就没问题了,可以多CPU运行,而且不是在我的登陆节点上,由集群自动分配节点。
仍然非常感谢你的帮助,小木虫上总是有很多热心的人,金币全给你吧
你想要什么,如何得到想要的,现在应该怎么做?
8楼2015-08-08 12:42:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 xiaoxuan1111 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 081700学硕,323分,一志愿中国海洋大学求调剂学校 +18 披星河 2026-04-04 18/900 2026-04-07 14:42 by rl1980
[考研] 336材料与化工085600求调剂 +10 水星记infp 2026-04-05 13/650 2026-04-07 14:41 by 猪会飞
[考研] 0854求调剂 +9 亨氏番茄沙司 2026-04-06 10/500 2026-04-07 14:37 by shdgaomin
[考研] 材料调剂 +14 一样YWY 2026-04-01 14/700 2026-04-07 13:18 by guanxin1001
[考研] 复试调剂 +5 asdasdassda 2026-04-05 5/250 2026-04-06 09:32 by dongzh2009
[考研] 化学调剂 +17 艾志恒 2026-04-03 18/900 2026-04-06 07:10 by jj987
[考研] 调剂 +3 李广火 2026-04-05 3/150 2026-04-05 18:57 by 蓝云思雨
[考研] 313求调剂 +5 海日海日 2026-04-04 5/250 2026-04-05 15:52 by jndximd
[考研] 272求调剂 +4 电气李 2026-04-05 4/200 2026-04-05 10:41 by lbsjt
[考研] 考研调剂 +11 小sun要好运 2026-04-04 11/550 2026-04-05 08:02 by qlm5820
[考研] 085400电子信息319求调剂(接受跨专业调剂) +5 星星不眨眼喽 2026-04-03 6/300 2026-04-04 21:50 by hemengdong
[考研] 298求调剂 +5 zzz,,r 2026-04-02 8/400 2026-04-04 19:55 by 蓝云思雨
[考研] 考研调剂 +5 小sun要好运 2026-04-03 5/250 2026-04-03 21:43 by 啵啵啵0119
[考研] 考研调剂 +8 不爱喝饮料 2026-04-03 8/400 2026-04-03 16:40 by Mistake-J
[考研] 一志愿北京交通大学材料工程总分358 +4 cs0106 2026-04-03 4/200 2026-04-03 13:41 by 百灵童888
[考研] 321求调剂 +17 y-yh 2026-04-01 20/1000 2026-04-03 12:57 by y-yh
[考研] 考研调剂 +3 李木子0120 2026-04-02 5/250 2026-04-02 21:45 by dongzh2009
[考研] 材料调剂 +12 一样YWY 2026-04-01 12/600 2026-04-02 09:15 by olim
[考研] 食品学硕362求调剂 +3 xuanxianxian 2026-04-01 3/150 2026-04-01 21:05 by 啊李999
[考研] 267求调剂 +13 uiybh 2026-03-31 13/650 2026-04-01 10:25 by 探123
信息提示
请填处理意见