| 查看: 556 | 回复: 0 | ||
[资源]
【原创】并行平台构建与管理[2]:操作系统
|
|
3、操作系统的选择 这方面,可以向搞并行计算的人咨询。比如一般linux比windows高效,linux里面RH比FC更适于并行一些,RH系列各个版本的特点也不太一样。不过这不是最重要的,因为作为一般的不是太大的集群来说,系统的开销不算很严重。如果对于大型并行集群来说,这就值得考虑考虑了。 下面试我的配置和一些细节(注:这是四年前的产品): 硬件配置: 主板:升技KN9-S CPU:AMD3800+ 内存:KST 1G DDR533 * 2 显卡:蓝X550企业静音 机箱:ATX+鑫谷300W 网卡:主板集成网卡 交换机:思科WS-12960-48TT 操作系统:RHEL4.U4.X86_64(支持串口硬盘) 这样的机器一共买了16台,外买一个液晶显示器,一个USB刻录DVD光驱。总价9万4千左右,余下一部分可以用于购买交换机架子等等,预计10万。这一预算也是很合理,至于如何合理,后面算总费用自然得出结论。 4、操作系统的安装 我们不需要抱着USB光驱一台一台安装,也无须每台一个光驱。我们只要先安装一台,设置一些网络服务、做一个NFS服务器即可。下面具体介绍每一步操作。(参考http://ccid2404.blog.ccidnet.com) 在单台PC或者是服务器上安装LINUX是一件很轻松的事情。但是,要在多台PC或者是服务器上安装LINUX,如果再使用传统的光盘或者是镜像文件来进行逐个安装就显得比较笨拙,会消耗很多时间和精力。最近我用PXE进行了8台服务器的安装,现将整个安装过程详细介绍如下,希望能对将要进行此类安装的朋友有所帮助。 注意:本篇文章中#后面所跟内容为实际操作时输入的相关命令。 一、安装前的准备 将要安装的系统光盘或镜像文件:RHEL4.U4.X86_64 (其它版本的LINUX也可以) 硬件需求:将要安装系统的计算机需配置了带PXE功能的网卡(比较简单的方法就是看计算机BIOS中的启动选项里是否有通过LAN或者PXE启动这一项) 准备好一台已经安装了RHEL4.U4.X86_64 的计算机(我们给这台计算机取个名字叫服务器node01,也称为计算服务器节点,为了方便而这样取的)。这台计算机要装有dhcp包和tftp包。如果没有则需要进行安装(版本号不一定非得下面这个): #rpm -ivh tftp-server-0.39-0.EL3.1.c0.i386.rpm #rpm -ivh dhcp-3.0.1-10_EL3.i386.rpm 关闭服务器node01上的防火墙 #iptables –F 二、准备NFS服务器(在服务器node01上进行) 1、复制文件 (1)创建一个含有Red Hat Enterprise Linux安装文件的目录。我把这个目录命名为/mnt/net-install #mkdir /mnt/net-install (2)拷贝第一张安装光盘上的相关内容 插入第一张安装光盘到光驱 #mount /dev/cdrom /mnt/cdrom (or #mount –t iso9660 /dev/cdrom /mnt/cdrom)( 注:本人用括号里的,但是师兄用前面一个也可以,为了简单,推荐用前一个。) #cp -ar /mnt/cdrom/RedHat /mnt/net-install #cp –ar /mnt/cdrom/RedHat /mnt/ net-install/ && cp /mnt/cdrom/.discinfo /mnt/net-install/ #umount /dev/cdrom #eject 取出第一张光盘,放入第二张 #mount /dev/cdrom /mnt/cdrom #cp /mnt/cdrom/.discinfo /mnt/net-install #umount /dev/cdrom # eject 取出第二张光盘,放入第三张 #mount /dev/cdrom /mnt/cdrom #cp –ar /mnt/cdrom/RedHat /mnt/net-install #umount /dev/cdrom #eject 取出第三张光盘,放入第四张 #mount /dev/cdrom /mnt/cdrom #cp –ar /mnt/cdrom/RedHat /mnt/ net-install #umount /dev/cdrom #eject 取出第四张光盘,放入第五张 #mount /dev/cdrom /mnt/cdrom #cp –ar /mnt/cdrom/RedHat /mnt/ net-install #umount /dev/cdrom #eject 取出第五张光盘,放入第一张 #mount /dev/cdrom /mnt/cdrom #cp /mnt/cdrom/images/pxeboot/initrd.img ./ #cp /mnt/cdrom/images/pxeboot/vmlinuz ./(注:不是vmlinux) #umount /dev/cdrom #eject Cp *.msg /tftpboot/linux-install/ 2、配置NFS服务 (1) #vi /etc/exports 添加一行: =============+==========+===========+============+============ /mnt/inst *(ro,sync) =============+==========+===========+============+============ 保存退出。 (2)导出这个/mnt/inst这个共享目录 #exportfs –a (3)启动NFS服务 #service nfs restart 三、配置dhcp服务器和tftp服务器 1、配置dhcp服务器 #vi /etc/dhcpd.conf =============+==========+===========+============+============ ddns-update-style interim; ignore client-updates; default-lease-time 21600; max-lease-time 43200; option domain-name-servers 192.168.211.254 authourtative; subnet 192.168.211.0 netmask 255.255.255.0 { option routers 192.168.211.254; option subnet-mask 255.255.255.0; option broadcast-address 192.168.211.255 range 192.168.211.200 192.168.211.252; (我这里讲253作为交换机地址,254作为应用服务器地址,100-200作为以后扩展集群预留地址,100以下作为实验室弟兄们使用的预留地址) default-lease-time 21600; max-lease-time 43200; filename "/pxelinux.0"; (注:应为零而不是欧) } =============+==========+===========+============+============ 保存退出。 2、配置tftp服务器 #vi /etc/xinetd.d/tftp =============+==========+===========+============+============ service tftp { disable = no socket_type = dgram protocol = udp wait = yes user = root server = /usr/sbin/in.tftpd server_args = -u nobody -s /tftpboot per_source = 11 cps = 100 2 flags = IPv4 } =============+==========+===========+============+============ 保存退出。 3、启动dhcp服务和tftp服务 #service dhcpd restart #chkconfig dhcpd on #/sbin/chkconfig --level 345 xinetd on #/sbin/chkconfig --level 345 tftp on 该命令配置 tftp 和 xinetd 服务被立即启用,还把配置它们在运行级别3、4和5的引导期间启动。 四、配置支持PXE # mkdir /tftpboot # cp /usr/lib/syslinux/pxelinux.0 /tftpboot 把LINUX第一张安装光盘上/image/pxeboot/initr.img和vmlinux 以及isolinux/*.msg考到/tftpboot目录下 # cd /tftpboot # mkdir pxelinux.cfg #cd pxelinux.cfg # vi default =============+==========+===========+============+============ default prompt 1 timeout 30 display boot.msg F1 boot.msg F2 options.msg F3 general.msg F4 param.msg F5 rescue.msg F7 snake.msg label local localboot 0 label linux kernel vmlinuz append initrd=initrd.img devfs=nomount ramdisk_size=9216 label text kernel vmlinuz append initrd=initrd.img text devfs=nomount ramdisk_size=9216 label expert kernel vmlinuz append expert initrd=initrd.img devfs=nomount ramdisk_size=9216 label ks kernel vmlinuz append ks initrd=initrd.img devfs=nomount ramdisk_size=9216 label nofb kernel vmlinuz append initrd=initrd.img devfs=nomount nofb ramdisk_size=9216 label lowres kernel vmlinuz append initrd=initrd.img lowres devfs=nomount ramdisk_size=9216 kernel vmlinuz =============+==========+===========+============+============ 五、开始安装 用集线器或交换机将8台服务器连接起来。启动一台服务器,进入BIOS,设置通过LAN或PXE启动机器即可(这里设置两个地方,一个是boot里面,有个大概是from LAN的选项或者类似,另一个是在外围设备,比较难找,你看见一个代Lan的,把他启用,按F10确定即可)。其余机器也按此操作。需要注意的是,当安装完成后重启机器时要把BIOS里的启动选项改为硬盘启动。 这里可能会有这个问题,有可能会进入局域网其他人设置的网络安装,这样你只要多启动一两次即可进入自己的网络服务里面安装。另外,DHCP可能会影响子网以外的局域网内其他用户,建议使用完之后关闭这个服务,否则可能会引起公愤。 |
» 猜你喜欢
🌟 比利时新鲁汶大学(UCLouvain)诚邀CSC博士加入Pascal Gehring教授团队
已经有0人回复
第一性原理计算方向2026级博士申请 PRB*1,四级484
已经有1人回复
物理学I论文润色/翻译怎么收费?
已经有161人回复
求助VISSIM破解版软件
已经有0人回复
求2026年在台湾举行的物理和材料领域国际学术会议信息
已经有0人回复
求国际会议网站
已经有1人回复
求取一些关于纳米材料和纳米技术相关的英文PPT。
已经有0人回复
【复旦大学】二维材料方向招收2026年博士研究生1名
已经有0人回复
北京纳米能源与系统研究所 王中林院士/曹南颖研究员课题组2026级硕/博/博后招生
已经有10人回复
荷兰Utrecht University超快太赫兹光谱王海教授课题招收2026 CSC博士生
已经有0人回复
找到一些相关的精华帖子,希望有用哦~
上海高等研究院(筹)信息科学与技术研究部招聘启事
已经有8人回复
【原创】并行平台构建与管理汇总
已经有4人回复
【原创】并行平台构建与管理[10]:强行删除pbs作业方式
已经有5人回复
【原创】并行平台构建与管理[1]:资金预算与配置
已经有3人回复
科研从小木虫开始,人人为我,我为人人













回复此楼
点击这里搜索更多相关资源