24小时热门版块排行榜    

CyRhmU.jpeg
查看: 3585  |  回复: 17

iamikaruk

木虫 (著名写手)

引用回帖:
9楼: Originally posted by souledge at 2012-02-09 16:11:49:
直到上个月才借了个26个node的超级古老集群以普通用户权限使用的路过~根本没有机会玩mpi的连接~

一般集群都会给你配置好,只要用任务提交系统就可以了吧
[img]http://osu.ppy.sh/stat2/iamikaruk-0.png[/img]
11楼2012-02-09 21:01:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

souledge

专家顾问 (著名写手)

liliangfang(金币+2): 多谢指教 2012-02-12 16:31:40
引用回帖:
11楼: Originally posted by iamikaruk at 2012-02-09 21:01:22:
一般集群都会给你配置好,只要用任务提交系统就可以了吧

问题就是没配置好,使用的古老四年前的Fedora系统,2007年的gfortran,MPICH2 1.2……
结果就是编译PWscf虽然能通过,但是运行ph.x就会直接iotk错误……
编译的elk暂时没有问题~
无法编译VASP~
只能编译Abinit 6.1左右时间的版本~并且还得自己修改点Abinit的源代码,否则无法通过编译~
于是自己只能用自己的限制账户在自己的目录下尝试安装PGI编译器和新版本的mpich2,并且屏蔽掉非用户目录中的公用mpi,然后想办法试试能否把nodes串起来~反正是各种错误~相当崩溃……
思想重于技巧,内涵重于表象
12楼2012-02-09 22:21:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

iamikaruk

木虫 (著名写手)

引用回帖:
12楼: Originally posted by souledge at 2012-02-09 22:21:38:
问题就是没配置好,使用的古老四年前的Fedora系统,2007年的gfortran,MPICH2 1.2……
结果就是编译PWscf虽然能通过,但是运行ph.x就会直接iotk错误……
编译的elk暂时没有问题~
无法编译VASP~
只能编译Ab ...

那么老的系统,就算能够跑起来也是投入/产出不成比例啊
[img]http://osu.ppy.sh/stat2/iamikaruk-0.png[/img]
13楼2012-02-10 08:54:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

souledge

专家顾问 (著名写手)

引用回帖:
13楼: Originally posted by iamikaruk at 2012-02-10 08:54:53:
那么老的系统,就算能够跑起来也是投入/产出不成比例啊

没别的办法,总比我自己的一台1090T要快吧……
思想重于技巧,内涵重于表象
14楼2012-02-10 10:39:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

shelay

木虫 (正式写手)

引用回帖:
10楼: Originally posted by lianghust at 2012-02-09 20:08:45:
configure的时候加: --disable-openib

我试试
15楼2012-02-12 14:01:20
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

shelay

木虫 (正式写手)

引用回帖:
10楼: Originally posted by lianghust at 2012-02-09 20:08:45:
configure的时候加: --disable-openib

你好,我按照你的建议在configure的时候加入--disable-openib-rdmacm,安装后没有出现CMA: unable to get RDMA device list提示了,但是其它还在:[686,1],0]: A high-performance Open MPI point-to-point messaging module
was unable to find any relevant network interfaces:

Module: OpenFabrics (openib)
  Host: localhost.localdomain

Another transport will be used instead, although this may result in
lower performance.
--------------------------------------------------------------------------
Hello, world, I am            2  of            4
Hello, world, I am            0  of            4
Hello, world, I am            3  of            4
Hello, world, I am            1  of            4
[localhost.localdomain:02654] 3 more processes have sent help message help-mpi-btl-base.txt / btl:no-nics
[localhost.localdomain:02654] Set MCA parameter "orte_base_help_aggregate" to 0 to see all help / error messages
请问怎么解决阿?
16楼2012-02-12 14:27:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lianghust

铁杆木虫 (正式写手)

liliangfang(金币+1): 多谢指教 2012-02-12 16:32:03
引用回帖:
16楼: Originally posted by shelay at 2012-02-12 14:27:50:
你好,我按照你的建议在configure的时候加入--disable-openib-rdmacm,安装后没有出现CMA: unable to get RDMA device list提示了,但是其它还在:[686,1],0]: A high-performance Open MPI point-to-point mess ...

你加--disable-openib试试,或者在运行的时候加参数走以太网:

mpirun -np 16 -machinefile ma  --mca btl self,tcp  yourprogram
17楼2012-02-12 14:48:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dxf_dxf_dxf

银虫 (小有名气)

引用回帖:
17楼: Originally posted by lianghust at 2012-02-12 14:48:12:
你加--disable-openib试试,或者在运行的时候加参数走以太网:

mpirun -np 16 -machinefile ma  --mca btl self,tcp  yourprogram

请问能否详细解释一下“--mca btl self,tcp”这个选项的意思?
我在使用intel mpi时,user guide提到要选择网络类型,包括sock(TCP、以太网、套接字)shm(仅共享内存,无套接字)ssm(TCP+共享内存,对通过“以太网”进行连接的SMP群集)、RDMA(通过制定的DAPL)、RDSSM
我想知道,在openmpi里面如何选择相应的网络结构?
如何知道我的网络结构支持以上哪些?
以上这些结构的性能好坏排序?
如果我的网络不支持rdma和rdssm,是因为硬件原因还是软件原因?在我没有管理员权限的情况下,能否通过安装软件来使我的网络支持rdma和rdssm?
rdma和rdssm的性能比ssm要好么?好多少?
18楼2012-04-23 14:15:42
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 shelay 的主题更新
信息提示
请填处理意见