24小时热门版块排行榜    

查看: 1247  |  回复: 4
本帖产生 1 个 计算强帖 ,点击这里进行查看

04nylxb

木虫 (正式写手)

[求助] 求助-关于集群共享存储文件系统挂载与集群优化

各位集群的同仁,我在集群搭建的时候(20个节点,其中node-1是控制节点,操作系统是Centos5)遇到一个共享存储配置方面的问题,特来寻求大家的帮助,不胜感激。问题如下:
原来20个节点,每个节点存储空间都很小,只有40G的硬盘空间,我们在配置的时候,用NFS共享了/home /opt /usr/loacl三个目录,
[root@node-20 /]# df -h
文件系统              容量  已用 可用 已用% 挂载点
/dev/sda1              38G  3.1G   33G   9% /
tmpfs                 3.9G     0  3.9G   0% /dev/shm
node-1:/opt            38G   33G  3.5G  91% /opt
node-1:/home           38G   33G  3.5G  91% /home
node-1:/usr/local      38G   33G  3.5G  91% /usr/local
后来集群增加了一个大的存储空间(20T),并且挂载在/mnt/leofs下,每个节点都挂载了。
[root@node-1 ~]# df -h
Filesystem            Size  Used Avail Use% Mounted on
/dev/sda1              38G   33G  3.5G  91% /
tmpfs                 3.9G     0  3.9G   0% /dev/shm
none                   20T   22G   20T   1% /mnt/leofs/
我们在每个用户下根目录下建立了一个data目录(/home/user/data),然后通过软连接到/mnt/leofs/user-data。
集群运转顺利,但是却不是最优的方案,存在数据传输慢的问题(除node-1外,计算节点都要先NFS回node-1,然后再由Node-1写数据到data,再软链接到共享存储),这样其它几个节点都没有利用上挂载的共享存储(挂在每个节点的/mnt/leofs下)。
因此,我们想重新配置下集群,方案如超算中心一样:将大容量的共享存储挂载在每个节点的/home目录下,这样/home都不需要NFS了,数据直接在共享存储里读写,能够大大提高运算速度,包括一些计算软件都可以安装在共享存储里了,就可以不用NFS了。因此想请教下大家:
1、大容量共享存储如何挂载到每个节点的/home上?我试了下,将共享存储从node-20的/mnt/leofs卸载,none就没了,这时候想重新挂载的时候,发现不知道该去哪里找这个存储文件了……试了下mount none /mnt/leofs,提示说找不到这个设备。(该如何将存储系统挂载上呢?)
文件系统              容量  已用 可用 已用% 挂载点
/dev/sda1              38G  3.1G   33G   9% /
tmpfs                 3.9G     0  3.9G   0% /dev/shm
node-1:/opt            38G   33G  3.5G  91% /opt
node-1:/home           38G   33G  3.5G  91% /home
node-1:/usr/local      38G   33G  3.5G  91% /usr/local
超算中心的共享存储挂载情况如下:
控制节点:
Filesystem            Size  Used Avail Use% Mounted on
/dev/sda3             271G  125G  133G  49% /
udev                   27G  164K   27G   1% /dev
/dev/sda1              99M   45M   50M  48% /boot
imd2@o2ib0:imd1@o2ib0:/lustre
                      106T   69T   32T  69% /home
计算节点:
Filesystem            Size  Used Avail Use% Mounted on
/dev/sda4             131G   13G  112G  11% /
udev                   32G  148K   32G   1% /dev
/dev/sda1              99M   32M   63M  34% /boot
imd2@o2ib0:imd1@o2ib0:/lustre
                      106T   69T   32T  69% /home
大家会发现他们是将共享存储挂载在/home下了,并且没有用到NFS。他们是如何将imd2@o2ib0:imd1@o2ib0:/lustre挂载到/home上呢?
2、将共享存储挂载到每个节点的/home后,是否要重新添加用户,生成用户的根目录?
非常感谢。
回复此楼
集中精力发文章
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
回帖置顶 ( 共有1个 )

zhangguangping

木虫 (著名写手)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
cenwanglai(金币+5, 计算强帖+1): 谢谢回复~ 2012-03-10 08:35:43
cenwanglai:编辑内容 2012-03-10 08:36
cenwanglai:编辑内容 2012-03-10 08:36
04nylxb(金币+15): ★★★很有帮助 收到,非常感谢 2012-03-10 20:24:11
04nylxb: 金币+8, ★★★很有帮助, 3q very much 2012-04-01 22:06:52
以讨论的态度试着回答一下,不知道你的问题我理解了多少。如果说的或者理解的不对,请指教!
下面说的还是使用NFS方法挂载的:
①关于怎么把大的存储空间(20T)挂载到每个节点的/home下,
首先,你的这个20T的存储空间应该也是委托在一个节点上吧?或者逻辑上它是一个节点,有自己的ip和目录。这样话,假如它的ip是10.10.10.10,并且假如这个20T所在的目录是/none,那么就在这个节点的/etc/exports文件中添加如下选项:
/none   10.10.10.0/255.255.255.0(rw,async,no_root_squash)
表示要把这个20T的空间共享出去。
chkconfig nfsserver on
/etc/init.d/nfsserver restart
chkconfig nfs on
然后再每一个计算节点挂载这个目录,并且挂载到/home下面,
mount 10.10.10.10:/none  /home
并且将上面这一行写到每一个计算节点的
/etc/init.d/after.local中去。最好不要写到
/etc/fstab
防止计算节点比控制节点开机快,挂载不上,开不开机。
chkconfig nfsserver on
/etc/init.d/nfsserver restart
chkconfig nfs on
这个时候每一个计算节点上的/home应该就被覆盖了。也就说原来计算节点上的/home就看不到了。所以最好起个别的名字。
②可以先挂载成别目录,然后将控制节点的/home内容拷贝到大硬盘,然后再将大硬盘的目录名字修改为/home重新挂载一次。

[ Last edited by cenwanglai on 2012-3-10 at 08:36 ]
弘德明志博学笃行
2楼2012-03-10 00:33:29
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通回帖

04nylxb

木虫 (正式写手)

引用回帖:
2楼: Originally posted by zhangguangping at 2012-03-10 00:33:29:
以讨论的态度试着回答一下,不知道你的问题我理解了多少。如果说的或者理解的不对,请指教!
下面说的还是使用NFS方法挂载的:
①关于怎么把大的存储空间(20T)挂载到每个节点的/home下,
首先,你的这个20T的 ...

非常感谢,那就是说我首先得咨询下平行提供方关于这个共享存储的信息:是块硬盘(貌似不是,我fdisk -l的时候每个节点都找不到它)还是节点(是否是共享存储节点),然后得知道下这个共享存储节点的Ip,登录后,编辑/etc/exports,作NFS的共享。
帮助非常大。
集中精力发文章
3楼2012-03-10 20:29:59
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hnuzhoulin

金虫 (小有名气)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
04nylxb: 金币+7, ★★★很有帮助, 非常感谢 2012-04-01 22:07:15
一楼的完全可以,
就是把20T的计算机当做NAS挂载到所有机器就ok啊
4楼2012-04-01 14:45:07
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xztjhs

铁虫 (小有名气)


zhangguangping: 金币+1, 感谢提供信息! 2012-04-04 15:49:40
leofs是初志的并行存储系统。

采用的是类似nfs的一个私有协议进行挂载。

imd2@o2ib0:imd1@o2ib0:/lustre  这种挂载方式初志在用,格外lustre也在用。

imd2代表的是节点名
@o2ib0代表使用ib0这个网络进行共享
/lustre代表的是存储一端的目录
非专业,更专注
5楼2012-04-04 14:48:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 04nylxb 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[找工作] 药学硕士找不到工作,打算去做科研助理了 +5 pom戴墨镜 2024-06-14 11/550 2024-06-17 17:16 by pom戴墨镜
[基金申请] 面青地会评时间 +8 tanjydd 2024-06-15 8/400 2024-06-17 17:08 by 小龙虾2008
[有机交流] 车间生产,真空度很高,温度很高,但减压蒸馏速度很慢。 10+12 召唤鬼泣lL 2024-06-13 38/1900 2024-06-17 16:46 by 科研虫子小助手
[教师之家] 请问事业编制和年薪制冲突吗? +10 ZHONGWU_U 2024-06-14 10/500 2024-06-17 14:44 by 周周520
[找工作] 初始合伙人来啦!(生物试剂耗材标准品) +10 欢快的小科研人 2024-06-15 19/950 2024-06-17 14:16 by 欢快的小科研人
[硕博家园] 博士毕业高校和就业的相关问题 +6 SCITOPPP 2024-06-14 10/500 2024-06-17 10:08 by SCITOPPP
[找工作] 应届大龄土博教职选择,石河子大学和广西大学 10+4 茅山老道士 2024-06-10 34/1700 2024-06-16 22:05 by yugege2009
[论文投稿] 二审返修送审10天了,原来一审的3个审稿人只有2个接受了审稿,会邀请新审稿人么? 50+3 huanpo116 2024-06-15 5/250 2024-06-16 10:27 by bobvan
[基金申请] 博士后创新人才支持计划公示 +9 aishida144 2024-06-14 15/750 2024-06-16 09:52 by msjy
[论文投稿] 投稿被一个审稿人恶意评审了怎么样? +5 1chen 2024-06-14 7/350 2024-06-15 23:15 by xy66xy
[基金申请] 博后基金,以往的结果点不开,怎么回事呢?最后一次机会了,两次都没中前面。 +7 kyukitu 2024-06-14 13/650 2024-06-15 06:46 by 我是王小帅
[基金申请] E12面上申请 +4 汉风之遗 2024-06-13 4/200 2024-06-14 15:28 by 天外飞去来
[考博] 申博找导师 +4 疏影横斜水清浅3 2024-06-13 6/300 2024-06-14 14:31 by zxl_1105
[基金申请] 国自然基金公布的时候基金号有吗 +8 潇洒怡惜 2024-06-13 11/550 2024-06-14 11:24 by JRfei
[基金申请] 75批博后基金 +10 kyukitu 2024-06-13 13/650 2024-06-14 10:31 by kyukitu
[硕博家园] 机械研究生如何拿到年薪40+w +13 阿巴阿巴哦哦 2024-06-11 15/750 2024-06-13 15:40 by 113745685
[论文投稿] with editor日期变更 +3 慎独的小花卷 2024-06-12 8/400 2024-06-13 11:00 by 慎独的小花卷
[论文投稿] 摩擦磨损论文投稿 +3 jmysan 2024-06-12 3/150 2024-06-13 08:36 by 莱茵润色
[基金申请] 博后特助这周出结果吗?往年都是啥时候啊? +13 jsqy 2024-06-12 17/850 2024-06-12 19:55 by Lynn212
[硕博家园] 申博 +3 悦悦小小鱼 2024-06-12 3/150 2024-06-12 15:11 by chen5805
信息提示
请填处理意见