Linux主机安装UltraPath多路径重启后系统无法启动

[复制链接]
发表于 : 2019-6-30 15:00:22 最新回复:2019-06-30 15:00:22
996 0
风飘飘
风飘飘  新锐

问题描述

Linux主机设置LVM自动挂载,安装华为多路径( UltraPath)软件后重启系统,系统全部无法启动。 如图:

http://support.huawei.com/enterprise/product/images/3d86577fc0624e5f97ac53967bcda26e

告警信息

处理过程

   1.手动通过维护网口进入修复模式之后,注释掉自动挂载的本地LVM,如下图,系统启动成功。

http://support.huawei.com/enterprise/product/images/4a49a490a34c43c9af575ee9a7f14a2f

对比问题描述中的截图, 可以看出系统不能正常启动是因为用户设置了LVM自动挂载,而系统重启之后/dev/mapper/datavg01-data1设备无法找到。设置了自动挂载的LVM卷设备无法找到,导致系统进行fs check失败,从而系统无法正常启动。

2.由于系统在未安装多路径之前重启均正常, 所以在进入系统后,卸载多路径,打开/dev/mapper/datavg01-data1自动挂载,系统重启成功,所以初步分析问题与多路径有关。

根因

     HBA卡驱动经过多路径的调整,加载顺序就在系统本地磁盘驱动(megaraid_sas.ko)之前。这样在阵列有映射盘的情况下,本地磁盘盘符就会发生漂移 根据LVM的机制,即使发生盘符漂移也不会出现LVM逻辑卷找不到的情况(LVM就是为了解决系统盘符发生漂移),怀疑现场系统的LVM配置与默认的LVM配置有差异

经过对比干净的系统(RHEL5.8升级内核,2.6.18-308.8.2.el5),LVM默认配置(/etc/LVM/LVM.conf)中没有图1所示信息:

http://support.huawei.com/enterprise/product/images/a9ec290ae8924880a6d6156f13980e55

1 linux默认配置

   进一步和客户确认,客户确实对LVM默认配置(/etc/lvm/lvm.conf)做了改动(2),导致LVM无法扫描出漂移后盘符的卷信息。

http://support.huawei.com/enterprise/product/images/aaf0affe34b14989b84a8daf11db39c4

2 客户现场配置

        filter配置项是LVM过滤配置项,用来控制LVM的设备扫描范围,从上面的配置可以看出,当本地盘sdb盘符漂移到sdu后,LVM就扫描不到,所以造成在sdb上建立的逻辑卷发现不了,从而导致系统无法启动。为了验证LVM配置对系统的影响,修改filiter选项为系统默认(filter = [ a/.*/ ]),重启系统,选择多路径镜像进入系统,系统重启成功,所以可以确认对LVM配置的修改缩小了LVM扫描设备的范围,大大增加了系统在发生盘符漂移时找不到LVM逻辑卷的可能。

    故障发生的原因可以归结为如下: LVM默认配置被修改导致LVM扫盘范围只能在sdasde,而多路径做镜像脚本使HBA驱动加载先于本地盘驱动,导致本地盘盘符漂移(sdb变为sdu)。所以在sdb上创建的LVM逻辑卷不能发现,设置了自动挂载的LVM逻辑卷不能发现就会导致系统起来时fs check失败,从而系统不能启动

 

 


  • x
  • 常规:

点评 回复

没有个性哪里来的签名?
跳转到指定楼层
发表回复
您需要登录后才可以回帖 登录 | 注册

警告 内容安全提示:尊敬的用户您好,为了保障您、社区及第三方的合法权益,请勿发布可能给各方带来法律风险的内容,包括但不限于政治敏感内容,涉黄赌毒内容,泄露、侵犯他人商业秘密的内容,侵犯他人商标、版本、专利等知识产权的内容,侵犯个人隐私的内容等。也请勿向他人共享您的账号及密码,通过您的账号执行的所有操作,将视同您本人的行为,由您本人承担操作后果。详情请参看“隐私声明
如果附件按钮无法使用,请将Adobe Flash Player 更新到最新版本!
登录参与交流分享

登录参与交流分享

登录