24小时热门版块排行榜    

查看: 1211  |  回复: 4

juchen

金虫 (小有名气)

[求助] MedeA如何多节点并行计算

最近在用Molecule Dynamics模拟材料的相变过程,一个结构有60个原子,每个任务3000个离子步,
实验室的机器一共10个节点,每个8个CPU,
现在已经提交的任务,都是用单节点算的,太费时间了,3个任务算了一周都没算完。想求助于用MedeA的同学,如何多节点并行计算?
我试着将TaskServer/ServerAdmin里面的Parallel Machines改为:Bnode1:0 Bnode3:8 Bnode4:8,提交任务后发现还是在3号节点的8个CPU上计算,

想请教一下,是不是还有别的地方要修改?
非常感谢!
回复此楼

» 收录本帖的淘帖专辑推荐

第一性原理

» 猜你喜欢

» 本主题相关商家推荐: (我也要在这里推广)

» 本主题相关价值贴推荐,对您同样有帮助:

Everypointwillfinallybeconnected
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

babaleo

木虫 (正式写手)

【答案】应助回帖

★ ★
zzy870720z(金币+2): 谢谢指点 2011-11-06 10:12:59
juchen(金币+10): 谢谢指点~我试下~ 2011-11-06 14:57:18
引用回帖:
1楼: Originally posted by juchen at 2011-11-05 21:15:12:
最近在用Molecule Dynamics模拟材料的相变过程,一个结构有60个原子,每个任务3000个离子步,
实验室的机器一共10个节点,每个8个CPU,
现在已经提交的任务,都是用单节点算的,太费时间了,3个任务算了一周都没 ...

"Queqe Type" 改成"mpi"了吗? 另外,测试时, 可以把 "Save files temporarily"选上, 然后查看TASK 目录里有没有"mpi.tcl" 文件, 没有的话, 说明并行没设置上.
2楼2011-11-06 09:01:09
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

juchen

金虫 (小有名气)

引用回帖:
2楼: Originally posted by babaleo at 2011-11-06 09:01:09:
"Queqe Type" 改成"mpi"了吗? 另外,测试时, 可以把 "Save files temporarily"选上, 然后查看TASK 目录里有没有"mpi.tcl" 文件, 没有的话, 说明并行没设置上.

Queue Type是mpi,然后把"Save files queue temporarily"选上了,我看了TASK目录里面,mpi.host 是
bnode1:0
bnode9:8
bnode10:8
但是还是只在9号节点上运行,没有“mpi.tcl”文件啊……能否请教下怎么讲并行设置上
Everypointwillfinallybeconnected
3楼2011-11-07 11:40:01
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

babaleo

木虫 (正式写手)

【答案】应助回帖

★ ★
juchen(金币+10): Number of paraller CPU's和N processors都忘改了!十分感谢! 2011-11-08 10:41:38
fzx2008(金币+2): 谢谢指导 2011-11-08 16:21:53
Task 目录里面应该有以下文件:
Listing of Directory /Tasks/task00504/
Pattern
Sort by Modify Date or Name or Size

Up to parent directory
CHG                  0 bytes  Nov  5, 2011 09:50:20 PM
CHGCAR               0 bytes  Nov  5, 2011 09:50:20 PM
CONTCAR           9092 bytes  Nov  7, 2011 08:18:48 PM
DOSCAR             167 bytes  Nov  5, 2011 09:50:21 PM
EIGENVAL           187 bytes  Nov  5, 2011 09:50:21 PM
IBZKPT            1857 bytes  Nov  5, 2011 09:50:21 PM
INCAR              690 bytes  Nov  5, 2011 09:50:19 PM
KPOINTS             55 bytes  Nov  5, 2011 09:50:19 PM
mdlicense.txt       41 bytes  Nov  5, 2011 09:50:19 PM
mpi                419 bytes  Nov  5, 2011 09:50:19 PM
OSZICAR          24282 bytes  Nov  7, 2011 08:55:58 PM
OUTCAR         7134928 bytes  Nov  7, 2011 08:58:19 PM
PCDAT              234 bytes  Nov  5, 2011 09:50:21 PM
POSCAR            3502 bytes  Nov  5, 2011 09:50:19 PM
POTCAR          434306 bytes  Nov  5, 2011 09:50:19 PM
script            2768 bytes  Nov  5, 2011 09:50:19 PM
state.dat          168 bytes  Nov  5, 2011 09:50:19 PM
VASP.out         28543 bytes  Nov  7, 2011 08:55:58 PM
vasprun.xml     468718 bytes  Nov  7, 2011 08:58:19 PM
WAVECAR              0 bytes  Nov  5, 2011 09:50:20 PM
XDATCAR          94465 bytes  Nov  7, 2011 08:18:48 PM
打开名为"mpi"的文件,应该有以下内容:
#!/bin/bash
cd /(用户)/MD/2.0/TaskServer/Tasks/task00504
export PATH="/(用户)/MD/Linux-x86_64/IntelMPI/bin:$PATH"
export LD_LIBRARY_PATH="/(用户)/MD/Linux-x86_64/IntelMPI/lib:/(用户)/MD/2.0/TaskServer/Tools/vasp4.6.36/Linux-x86_64:/home/bli/MD/Linux-x86_64/IntelMKL/lib:$LD_LIBRARY_PATH"
/(用户)/MD/Linux-x86_64/IntelMPI/bin/mpirun -n 8 /(用户)/MD/2.0/TaskServer/Tools/vasp4.6.36/Linux-x86_64/vasp_parallel

因为MEDEA 用自己的库文件和并行软件, 如果集群已经建好的话 (NFS 或mpich/mpi.hosts, 确信每个节点都可以SSH不需密码, 等等),应该能行.
你把"Number of Parallel CPU's" 设置成你的CPU总数了吗?, 运行时选择CPU数多于一个节点时,其他节点不启动吗?
4楼2011-11-08 10:27:14
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
5楼2012-05-18 08:14:31
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 juchen 的主题更新
信息提示
请填处理意见