24小时热门版块排行榜    

查看: 1622  |  回复: 7
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

xiaoxuan1111

铁杆木虫 (正式写手)

[求助] Castep多CPU计算的问题解决了,又遇到了不能多节点计算的问题 已有1人参与

我在上个帖子中求助了castep多CPU计算的问题http://muchong.com/bbs/viewthread.php?tid=9251122
后来发现是Accelrys/MaterialsStudio7.0/share/data下的machines.LINUX文件不对,于是把它改成了原来的内容,即localhost,就可以多CPU计算了,而且由集群自动分配节点。
可是当我把节点数改为2时,又遇到了新的问题,任务的PBS文件基本不变,还是这样:
#!/bin/sh
#PBS -N pppa
#PBS -l nodes=2:ppn=8
#PBS -o /home/lgx2015/out
#PBS -e /home/lgx2015/err
#PBS -m bae
cd /home/lgx2015/aa5
/home/lgx2015/Accelrys/MaterialsStudio7.0/etc/CASTEP/bin/RunCASTEP.sh -np 16 Cs2NaYF6

不论我把#PBS -l nodes=2这句里的节点数设为多少,集群倒是可以为我分配相应的节点数,但是程序实际只用到了一个节点,而且这个节点上用到的核数等于“RunCASTEP.sh -np”命令后面的数字,而其他节点实际都没用到。集群管理员说一个节点只能跑8个核,我跑更多个核是不允许的,让我再改一下设置。
我试了两天了,也没有弄好。
如果修改machines.LINUX文件的话,改成指定节点
cnode01:8
cnode02:8
cnode03:8
是可以实际做到多节点多核运行的,但是集群管理员不允许我指定节点来运行,只能由集群自动分配节点。
请问我改怎样设置,才能既让集群自动分配节点,又能多节点并行呢?问题出在哪里呢
回复此楼

» 收录本帖的淘帖专辑推荐

晶体结构分析

» 猜你喜欢

你想要什么,如何得到想要的,现在应该怎么做?
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

devinhu

木虫 (小有名气)

你 cat  /proc/net/dev看看
7楼2015-08-12 17:42:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 8 个回答

devinhu

木虫 (小有名气)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
xiaoxuan1111: 金币+50, ★★★★★最佳答案, 非常感谢,搞定了 2015-08-12 15:36:50
肯定不允许你使用MS他那个指定节点跑作业啊。一定得通过torque那套来分配,就如我上一个帖子回你那样。不过你们的管理员也是,这些东西应该他提供的。。
2楼2015-08-12 11:01:02
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xiaoxuan1111

铁杆木虫 (正式写手)

引用回帖:
2楼: Originally posted by devinhu at 2015-08-12 11:01:02
肯定不允许你使用MS他那个指定节点跑作业啊。一定得通过torque那套来分配,就如我上一个帖子回你那样。不过你们的管理员也是,这些东西应该他提供的。。

非常感谢。我尝试了好多次,最后彻底放弃用runCASTEP.sh来并行计算。你给我的脚本里面是用castepexe.exe来计算的,我就在这个脚本的基础上改了改路径,设置环境变量的ms70.sh也按你给的改好了,折腾了好久,最后终于可以在集群自动分配节点的前提下多节点并行了。你的脚本有点长,一些句子不太懂,我就去掉了一些,也没影响运行。
现在我的脚本是这样的:
#!/bin/sh
#PBS -N msi
#PBS -l nodes=2:ppn=8
#PBS -l walltime=400:00:00
#PBS -j oe

cd $PBS_O_WORKDIR
NP=`cat $PBS_NODEFILE|wc -l`
source /home/lgx2015/Accelrys/ms70.sh
mpirun -np $NP /home/lgx2015/Accelrys/MaterialsStudio7.0/bin/castepexe.exe Cs2NaYF6 Cs2NaYF6_PhonDOS Cs2NaYF6_PhonDisp
如果我想几何优化后继续进行声子计算,像上面这样直接把任务名列在后面可以吗?
我现在正在试,程序正在几何优化,还没到声子计算,不知道几何优化完会不会继续运行
你想要什么,如何得到想要的,现在应该怎么做?
3楼2015-08-12 15:36:14
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xiaoxuan1111

铁杆木虫 (正式写手)

引用回帖:
2楼: Originally posted by devinhu at 2015-08-12 11:01:02
肯定不允许你使用MS他那个指定节点跑作业啊。一定得通过torque那套来分配,就如我上一个帖子回你那样。不过你们的管理员也是,这些东西应该他提供的。。

忘了说了,还要把用到的赝势文件拷到.cell和.param所在的文件夹里。
以前用runCASTEP.sh不需要。
你想要什么,如何得到想要的,现在应该怎么做?
4楼2015-08-12 15:39:15
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见