| 查看: 941 | 回复: 5 | ||
| 【奖励】 本帖被评价4次,作者wuli8增加金币 4 个 | ||
| 当前主题已经存档。 | ||
[资源]
【转帖】MPICH2简单的安装配置总结
|
||
|
MPICH2是MPI(Message-Passing Interface)的一个应用实现,支持最新的MPI-2接口标准,是用于并行运算的工具,在程序设计语言上支持C/C++和Fortran。最近因为有项目需要的计算量比较大,所以就学习使用了MPICH2,在此根据网络上查询的相关信息和我自己的实际使用经历,分别总结一下MPICH2在windows和linux下基本的安装使用方法。 软件下载 MPICH2的主页是http://www-unix.mcs.anl.gov/mpi/mpich2/index.htm,在这个页面上就能找到各平台最新版本MPICH2的下载地址,其中还包括源代码,我在开始作这个项目的时候最新版本是windows版mpich2-1.0.5p2,源代码mpich2-1.0.5p4。我们的项目是一个CentOS版linux下的程序,所以最终是要在linux下运行的,但是又舍不得windows,于是就打算可能的话就在windows下写程序,用MinGW加windows版的MPICH2编译调试,通过后再到wmware虚拟机组成的简单集群作测试。所以,为避免不必要的麻烦,就要统一一下windows和linux下的MPICH2版本,而且不打算用最新的,因此决定用mpich2-1.0.5版。但是,如果在主页上找的话是没有以前旧版本下载的链接的(至少我没找到),只有最新版本的http和ftp下载。这难不住我等有心之人,既然提供了ftp下载,那咱就直接到他ftp服务器上找,最新源代码链接的地址是ftp://ftp.mcs.anl.gov/pub/mpi/mpich2-1.0.5p4.tar.gz,把后面文件名去掉就应该是文件的ftp存放路径,把这个路径直接写到浏览器地址栏里回车(偶用的是FireFox2),就能看到他们服务器上这个目录的文件列表,里面就有1.0.5版的windows安装文件和源代码包,分别为ftp://ftp.mcs.anl.gov/pub/mpi/mpich2-1.0.5-win32-ia32.msi 和 ftp://ftp.mcs.anl.gov/pub/mpi/mpich2-1.0.5.tar.gz 。msi文件不用多说,这是windows下安装用的,源代码包我们拿来在linux下用。 文档下载 还是主页上就有MPICH2的安装和使用指南文档,主要有三个,分别是User's Guide,Installer's Guide和Windows Developer's Guide,都down下来看看很有用的说。具体开发用的有关MPI标准的文档在MPI论坛的网站里都有,地址是http://www.mpi-forum.org/,我觉得最有用的是MPI-2: Extensions to the Message-Passing Interface。 Windows下的安装配置 我用的参与计算的系统都是WindowsXP Pro SP2,安装的过程没什么太特别的,一般就是默认就可以,只是其中有个地方要填一个什么passphrase,上面提示说所有系统都要用相同的passphrase,照做就是了,在所有参与计算的结点机器上都填一样的passphrase就好了。另外就是需要.net framework 2的运行环境。 默认安装的位置是C:\Program Files\MPICH2,下面的bin目录下是系统配置运行需要的程序,为了方便在控制台使用,可以把C:\Program Files\MPICH2\bin加到系统的PATH变量中去。Include是头文件,开发的时候用,lib是链接程序的时候用的库文件。Jumpshot下有个pdf的文档,干什么用的可以看看这个文档,我没仔细看,感觉我暂时还用不上。Examples下面是一个样本程序,就是一个用MPI计算圆周率的程序,分别有C,C++和Fortran版,C/C++的应该可以用VS2003以上版本打开。同时,安装程序还会自动向系统注册一个服务MPICH2 Process Manager,我们从控制面板-管理工具-服务里就能找到,这是管理运行MPI程序的一个服务,安装好后就是自动启动的,所以一般也就不用动它。 安装完毕后开始菜单-程序中就添加了一个MPICH2目录,其中就有上面提到的Jumpshot,另外wmpiconfig.exe是用来配置运行环境的,我在网上有找到的说明都是以前旧版本的,和现在的差别比较大,感觉这新版本用的不爽,没搞明白这个程序该咋用,不过好像默认状态下不改什么就能正常使用,所以也就不管它了。wmpiregister.exe则是用来注册用户的,使用MPI之前需要在这个程序里注册一个系统里已经存在的用户,而且这个用户必需拥有管理员权限,拥有运行我们安装了的MPI系统的能力。比如我就在所有参与运算的机器上添加了一个管理员mpi,密码也是mpi。 接下来,我们就可以开始试着运行一下MPI的程序了。就用examples目录下面的那个计算圆周率的程序。如果要多机并行计算的话,就需要在所有机器上的相同位置放置要运行的程序,我的情况就是在所有机器的C盘下建了一个mpiexe的目录,并把cpi.exe拷到所有机器的这个目录下。然后,在其中的某台机器上进入控制台(运行MPI程序其实也可以用开始菜单的MPICH2下的wmpiexec.exe,这是个gui程序,但是我觉得用的不爽,不如直接在控制台下敲命令来得灵活),敲下命令mpiexec -hosts 2 192.168.10.142 192.168.0.23 c:\mpiexe\cpi.exe。mpiexec是安装目录下bin目录里的一个程序,在本文的例子中就是C:\Program Files\MPICH2\bin\mpiexec.exe,因为刚才说了,我把这个地址加入到PATH里了,所以可以在任何地方直接执行,它是用来启动MPI程序的,-hosts参数说明是启动多台机器并行运算,后面跟着的2就是说要在两台机器上执行程序,再后面的就是那两台机器的ip地址,其中第一个就是我启动程序的机器,当然,这个地方也可以写机器名,只要它的机器名能被正常的解析就可以,最后面的就是要运行的程序,也就是刚才提到的所有机器都要在相同位置放置的那个MPI程序。如果只是在本机运行,则命令为mpiexec –n 2 cpi.exe,-n表示是在本地运行,后面的2表示启动的进程数。程序运行后就会提示让你输入一个数字intervals,这个数字影响计算的精度,值越大精度越高,当然计算时间就越长了,然后程序会打印出计算的结果和花费的时间。 比如,我使用单机单进程运行,intervals设为99999999,耗时1.253849秒,而用两台机器双进程则只有0.628954秒,明显快很多,并行运算还是很有效果的。不过,如果我们把intervals改为9999,单机运行只用了0.000279秒,而两台机器却花了0.001548秒,这是因为并行运算过程中,参与运算的机器需要通过网络传递一些消息,如果计算量不大的话,花在了这上面的时间影响会比较明显,因而反不如单机版的来得快。 到现在我们的MPI运行环境就基本安装好了,当然,MPI还有很多其他的命令参数,只不过最常用估计也就这两条了,其他的用得着的时候就去查上面提到的文档,里面有比较详细的介绍。另外,如果按照以上的介绍进行安装配置,在运行多机并行MPI程序的时候却出现连接错误的话,八成是因为网络的问题,看看你的防火墙是不是开着,打开相应的端口,或者干脆关掉防火墙就好了。 Linux下的安装配置和单机运行 Linux下的操作要相对来说麻烦一点,这个麻烦从安装开始,呵呵。我用的系统是CentOS4.4,装在VMware Workstation里的,一共装了两个虚拟机,环境基本上完全一样。为运行MPI在两台虚拟机都创建了一个用户mpi,密码也是mpi,home路径也都是/home/mpi,然后继续都创建了一个目录/home/mpi/mpich2用来作MPI运行环境的安装路径,一个/home/mpi/mpich2/src来存放编译用的源代码。然后将源代码包mpich2-1.0.5.tar.gz下载到两台机器上,都解压缩到/home/mpi/mpich2/src中,然后到/home/mpi/mpich2/src下,指定安装路径, ./configure -prefix=/home/mpi/mpich2 make make install 几分钟后安装完毕。需要提一下的是,我曾经试着用root用户来安装MPICH2,但是安装后好重启系统就出了问题,所以建议还是另外建个用户来装吧(ubuntu干脆就把root给禁了,不让你直接用root)。 安装后/home/mpi/mpich2下多出来一些目录和文件,要比windows多,lib是库文件,include是头文件,bin还是程序文件,所以还是要写到环境变量里,可以用命令export PATH /home/mpi/mpich2/bin:$PATH,但我是用root用户直接在/etc/profile最后面加了这么一句export PATH=/home/mpi/mpich2/bin:$PATH,一劳永逸。 MPI应用一个管理器来管理运行MPI程序,这个管理器就是mpd,但是在正式开始运行mpd前还需要一个基于安全考虑的配置文件,.mpd.conf,这个文件是要放在运行程序的用户的home目录下,本例子中就是/home/mpi/.mpd.conf,而且这个文件只能由这个用户读写,创建文件的命令是, cd $HOME touch .mpd.conf chmod 600 .mpd.conf 然后在文件中写入这么一行,secretword=***,***在参与计算的计算机上必需完全一致。如果是root用户的话,这个文件应该是/etc/mpf.conf。 然后,我们就可以启动mpd管理器了,直接在控制台下使用mpd命令,或者是mpd &,让mpd在后台运行,若关闭启动的mpd,只需要命令mpdallexit即可。在启动mpd之后就可以运行MPI应用程序了,执行命令与windows下类似,如我们仍然是测试一下examples里的cpi程序可以这样来作, cd ~/mpich2/examples mpiexec -n 1 ./ cpi 参数含义同windows下的单机运行命令。另外,启动mpd后还可以用命令mpdtrace来察看当前运行的mpd情况。 SSH配置和多机并行 MPI的多机并行是用mpdboot来管理启动的,是由参与计算的其中一台机器通过mpdboot同时启动其他机器上的mpd管理器并运行相应MPI程序的,所以,需要赋予运行mpdboot的机器执行其他机器上程序的能力。MPICH2支持通过ssh和rsh来做到这一点,其中ssh是默认的,而且其安全性也优于rsh,因此,我在项目中是用的ssh。 首先,我们需要修改所有机器上的/etc/hosts文件,在里面添加上参与计算的机器名和ip地址,比如本文中有两台机器参加的例子里,hosts文件应当为: 127.0.0.1 localhost.localdomain localhost 192.168.10.142 node0 192.168.10.23 node1 这里的意思是说,主机名为node0的机器ip地址为192.168.10.142,主机名为node1的机器ip地址为192.168.10.23。 当然,其实这一步也可以跳过,因为我们也可以在操作过程中直接使用ip地址,只不过那样不太方便。另外就是,有些机器默认情况下第一行可能包括本机的主机名,比如在ip为192.168.10.142的node0上,hosts文件第一行是 127.0.0.1 localhost.localdomain localhost node0 这样可能会使得mpdboot工作不正常,所以还是最好给成上面的那种形式。 第二步是创建ssh密钥,命令行下: #ssh-keygen -t rsa -t rsa指的是密钥类型,具体请察看ssh相关资料,这里不多说。这样就在当前用户的home目录下生成了一个.ssh目录,本文中的就是/home/mpi/.ssh。 第三步,将/home/mpi/.ssh下的id_rsa.pub文件拷贝改名为authorized_keys,即 #cp id_rsa.pub authorized_keys 第四步,在其他所有机器上进行以下操作。 #ssh-keygen -t rsa 生成.ssh文件夹 #scp node0的IP:/home/mpi/.ssh/* ~/.ssh 拷贝node0上的.ssh文件夹覆盖本地的 第五步,在所有机器上建立与自己和所有其他机器的信任连接。 对每个节点执行: #ssh node0 #ssh node1 根据提示键入yes即可。然后就可以在不需要用户名密码的情况下通过ssh登陆其他机器了,比如在node0上#ssh node1, 就可以直接进入node1。 接下来,在启动mpdboot的机器上创建一个参与计算的host列表文件,如文件mpd.hosts,每行是一个主机名,创建过程如 #cd ~ #touch mpd.hosts #vi mpd.hosts nod0 node1 现在,就可以启动运算集群了 #mpdboot -n 2 -f mpd.hosts -n表示要启动的机器个数,一般是不大于mpd.hosts文件中的机器数,比如本文中的例子就是两台机器。这样,列表中的机器就会启动其本机上的mpd管理器。 然后,就可以开始运行MPI程序,进行运算了,同windows下一样,程序需要放在每台机器上的相同位置(如果用NFS就只需在一台机器上放置程序,其他机器作映射就行),比如都是程序/home/mpi/mpich2/examples/cpi,在运行mpdboot 的结点机器上: #mpiexec -n 2 /home/mpi/mpich2/examples/cpi -n表示要启动的进程个数,一般是不大于mpd.hosts文件中的机器数(或者cpu核心数?偶用的机器就是双核的了,所以单机的时候双进程比单进程效率好很多,但是三进程就不行)。 Mpd在运行过程中,可以通过mpdtrace显示参与计算的机器名,mpdtrace –l则是显示机器名以及其端口。 |
» 猜你喜欢
有时候真觉得大城市人没有县城人甚至个体户幸福
已经有4人回复
酰胺脱乙酰基
已经有9人回复
CSC & MSCA 博洛尼亚大学能源材料课题组博士/博士后招生|MSCA经费充足、排名优
已经有5人回复
有70后还继续奋斗在职场上的吗?
已经有6人回复
博士延得我,科研能力直往上蹿
已经有7人回复
退学或坚持读
已经有27人回复
面上基金申报没有其他的参与者成吗
已经有5人回复
遇见不省心的家人很难过
已经有22人回复
★ ★ ★ ★ ★
zxzj05(金币+5,VIP+0):3Q! ^_^ 多多支持! 5-26 11:26
zxzj05(金币+5,VIP+0):3Q! ^_^ 多多支持! 5-26 11:26
|
配置mpich2运行环境 前段时间帮同学在linux下配了一个集群环境,参考了一些网上的文章,就把过程写出来,做个参考吧。 其实在我们的环境下ssh已经是配置好的,但是我还是把网上看到的写下来,而且这个配置过程我试过,没有什么问题。 创建SSH信任连接 1、更改/etc/hosts文件 vim /etc/hosts 编辑为下面内容: 127.0.0.1 localhost.localdomain localhost 192.168.110.172 scc-m #node01的IP 192.168.110.172 node01 #node01的IP 192.168.110.173 node02 #node02的IP 2、在node01生成SSH秘钥对 ssh-keygen -t rsa 产生.ssh目录 ls -a 查看确认无误 3、生成authorized_keys文件 cd .ssh 进入.ssh目录 cp id_rsa.pub authorized_keys 4、建立本身的信任连接 cd .. 退出到/root目录下 ssh node01 按提示输入yes 5、设置node02 ssh-keygen -t rsa 生成.ssh目录 scp 192.168.110.172:/root/.ssh/* /root/.ssh 拷贝node01上的.ssh文件夹到本地并覆盖本地的该目录 scp 192.168.110.172:/etc/hosts /etc/hosts 拷贝node01上的hosts文件覆盖本地的hosts ssh node01 提示处输入yes 6、确认两台机器的信任连接已建立 在每个节点试验执行: ssh node01 ssh node02 如果有提示,在提示处输入yes回车,只要确定无需输入密码就能登陆即可 下面是安装mpich2的过程 二、安装MPICH2 1、到MPICH官方网站下载源代码包,解压缩 tar -zxvf mpich2-1.0.7.tar.gz 2、创建安装目录 mkdir /usr/MPICH-instsll 3、进入mpich2解压到的目录里 cd mpich2-1.0.7 4、下面就是编译安装软件的那三个基本步骤——检查配置、编译、安装,这次在./configure后还设置了安装目录 ./configure --prefix=/usr/MPICH-install 5、修改环境变量(编辑.bashrc文件) vim .bashrc 修改环境变量为(新增PATH一行): # .bashrc # User specific aliases and functions PATH="$PATH:/usr/MPICH-install/bin" #这个地方用自己的安装路径,我们是以普通用户的权限来安装的,所以路径不是这样。 alias rm='rm -i' alias cp='cp -i' alias mv='mv -i' # Source global definitions if [ -f /etc/bashrc ]; then . /etc/bashrc fi 6、测试环境变量设置,下面是我测试成功的屏显: [user@node01 ~]$ which mpd [user@node01 ~]$ which mpicc [user@node01 ~]$ which mpiexec [user@node01 ~]$ which mpirun 7、修改/etc/mpd.conf文件,内容为secretword=myword vim /etc/mpd.conf # 自己创建,并写入secretword=myword保存,由于我们没有root权限,所以我改在主目录下建立.mpd.conf文件并写入内容 设置文件读取权限和修改时间戳 chmod 600 /etc/mpd.conf touch /etc/mpd.conf # touch .mpd.conf,写入之后这一步可以省略 8、创建主机名称集合文件/root/mpd.hosts # 同样我们在主目录下创建该文件并写入内容 vim mpd.hosts 文件内容如下: node01 node02 三、测试 1、本地测试 启动: mpd & 观看启动机器: mpdtrace 退出: mpdallexit 2、运行集群系统 mpdboot -n 2 -f mpd.hosts 参数-n 2指定了要起动的机器个数,-f mpd.hosts指定了通过mpd.hosts运行 mpdtrace mpdallexit 3、测试运行MPICH的程序 mpdboot -n 2 -f mpd.hosts 启动这两台机器 mpiexec -n num /example/hello 用num指定使用的进程数 mpdallexit 四、查错 1、通过mpdcheck获得帮助信息 mpdcheck -pc 2、查错 mpdcheck -l 3、通过mpd.hosts文件查错 mpdcheck -f mpd.hosts 如果无错误 mpdcheck -f mpd.hosts -ssh 4、对任意两台机器进行查错 node01上: mpdcheck -s 返回主机名host和端口port node02上: mpdcheck -c host port 5、mpd查错 node01上: mpd -e & 返回使用的端口 node02上: mpd -h m1 -p echoed_port_m1 & |
2楼2009-05-25 21:38:59
3楼2009-05-25 21:44:11
4楼2009-05-26 11:26:30
5楼2009-05-26 15:38:26
6楼2009-08-07 15:12:55













回复此楼

