| 查看: 2415 | 回复: 9 | |||
| 本帖产生 1 个 计算强帖 ,点击这里进行查看 | |||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | |||
[求助]
求教:ssh 登录集群某节点时不能进入home目录
|
|||
|
研究室的集群计算机其中两个节点ssh登录后,不能进入/home/目录 简单说一下集群的架构: hpcs01: 管理主机 ip: 192.168.1.1 hpcs02-hpcs40:为各个计算节点。IP:192.168.1.2-40 hpcs-fs:NFS server 文件服务器 IP:192.168.0.100 问题节点hpcs02和hpcs03 登录之后不能进入/home目录,reboot命令和手动重启之后也都不能解决问题! ls之后可以看到home但是红色显示并闪烁, cd /home提示No such file or directory。 查看/etc/auto.misc自动mount的设置文件后看到 home -rw,nfsvers=3,intr,wsize=8192,rsize=8192 192.168.2.100:/home (这里有点疑问,为什么是2.100?在其他4,5,6等节点下看这个文件,显示的也都不同192.168.x.100IP,x 是递增的) 登录节点hpcs02,ping 192.168.2.100 后出现Destination Host Unreachable错误提示 自己判断是否这个节点不能和文件服务器链接,导致mount失败,进而进入不了/home目录 (疑问?链接不到文件服务器,却可以从这个节点出发ssh登录其他节点,证明这个节点网络链接没有问题) 登录可以进入home的节点,ping 192.168.x。100就可以ping通。 求教高人有没有遇到类似问题或知道解决办法的? |
» 猜你喜欢
求国际会议网站
已经有1人回复
求取一些关于纳米材料和纳米技术相关的英文PPT。
已经有0人回复
物理学I论文润色/翻译怎么收费?
已经有269人回复
【复旦大学】二维材料方向招收2026年博士研究生1名
已经有0人回复
北京纳米能源与系统研究所 王中林院士/曹南颖研究员课题组2026级硕/博/博后招生
已经有10人回复
荷兰Utrecht University超快太赫兹光谱王海教授课题招收2026 CSC博士生
已经有21人回复
反铁磁体中的磁性切换:两种不同的机制已成功可视化
已经有0人回复
26申博推荐:南京航空航天大学国际前沿科学研究院光学方向招收博士生!
已经有0人回复
求标准粉末衍射卡号 ICDD 01-076-1802
已经有0人回复
» 本主题相关价值贴推荐,对您同样有帮助:
求教制作Ag nanoparticle的问题
已经有12人回复
遇到实验室有些同学不按章程用集群怎么办?
已经有41人回复
集群配置ssh,需要要给每个用户都单独配置吗?
已经有26人回复
高人求教 ,F-Cecure SSH Client 怎么样实现在非实验室的条件下远程登录?
已经有4人回复
求教:如何配置0.2M氢氧化钠甲醇溶液?
已经有7人回复
castep计算Fe2O3声子谱失败,原因求教~~
已经有10人回复
三大检索之一的ISTP(现已更名为CPCI-S/SSH)检索
已经有17人回复
【求助】用ssh从服务器传输文件时一下变得非常慢
已经有3人回复
【求助】集群,如何设置某个节点用多个CPU?
已经有5人回复
【答案】应助回帖
感谢参与,应助指数 +1
|
可能一:NFS网络中的某个地方端口坏了。 可能二:网络冲突,解释如下: 你所使用的NFS服务器可能有过专门的配置。 每台机器使用eth0网卡连接到NFS,这个时候NFS和每台计算节点之间都使用专门的一个网段。 这样的好处是带宽利用率高。 坏处就是如你现在知道的,02和03两台机器由于存储网存在冲突,导致了连接失败。如:针对02的NFS服务器为192.168.2.100,但是192.168.2网段又配给了eth1。 针对03的NFS服务器为192.168.3.100,但是192.168.3网段又配给了IB0. 如果出现这个情况,02和03的NFS网络不通就太正常了。 解决方法:联系存储厂家,确定具体配置方式,判断是否存在网络冲突。 |

7楼2012-04-22 21:37:09
zouming1979
捐助贵宾 (小有名气)
- 计算强帖: 1
- 应助: 13 (小学生)
- 金币: 5405.8
- 帖子: 83
- 在线: 54.5小时
- 虫号: 1733983
- 注册: 2012-04-03
- 性别: GG
- 专业: 计算机体系结构
2楼2012-04-19 21:08:18
|
先谢谢交流。 关于1,我也很不明白,进入节点ping 192.168.0.100不通,只有在管理主机才可以ping通。在各个节点查看自动mount的设置文件(/etc/auto.misc)里显示的IP:/home 各不相同,192.168.x.100.问了其他人说可能是文件服务器的镜像。现在我的有问题的两个节点02,03这个IP相同为192.168.2.100,并且都ping不通。我自己估计问题出在这里。 关于2,网络掩码都是255.255.255.0 。另外需要说明的是这个集群配置是专业人员做好的,之前没有这个问题,这几天突然发现的问题,有可能是连接文件服务器的接口坏掉了。 |
3楼2012-04-19 23:21:34
zouming1979
捐助贵宾 (小有名气)
- 计算强帖: 1
- 应助: 13 (小学生)
- 金币: 5405.8
- 帖子: 83
- 在线: 54.5小时
- 虫号: 1733983
- 注册: 2012-04-03
- 性别: GG
- 专业: 计算机体系结构
4楼2012-04-20 01:25:44













回复此楼