HA告警,手动启动ha服务失败

[复制链接]
发表于 : 2019-11-25 20:17:32 最新回复:2019-11-25 20:17:32
136 0

HA告警,手动启动ha服务失败

【版本情况】:

FA6.5

【问题现象】:

ITAHA告警,登陆到虚拟机手动启动,报错“Failed: start HA failed.”,查看HA状态报错“Failed: /opt/HA/module/hacom/bin/ha.bin is not running. Get Ha Status Failed.

【排查步骤】:

1、检查ha日志/var/FusionAccess/HA/ha/runlog/ha.log,报错“Load harblocal config failed”,检查/opt/HA/local/haarb/conf/haarb_local.xml,内容已经变化

201659p6bzbh6j1hbhby6q.png

2、正常的haarb_local文件记录的是主备关系,如下图。将正常节点的文件通过scp -rp命令拷贝到该异常节点。

201659eejcizcj5pe1cl4q.png

3、重启ha服务,还是启动错误(正常操作上面两步就可以解决了,但是该虚拟机还存在空间使用100%的问题)。

4、使用df -i检查inode数,没有达到100%;使用df -h/tmp/var使用率都是100%

5、使用du -sh命令检查出占用空间的目录是/var/FusionAccess/HA/runlog/ha/runlog//var/FusionAccess/HA/scriptlog/ha/scriptlog

201700l5xdb45yna4zrszy.png

201700vr8xy9lgzlkk2tky.png

201700tnnip0jnimjimxz0.png

6、通过执行 echo > /var/FusionAccess/HA/runlog/ha/runlog/ha.log,和echo > /var/FusionAccess/HA/scriptlog/ha/scriptlog/ha.log将日志清空。

7、再检查/tmp目录,使用du -sh查看只有10M+,但是df -h使用率却是100%。使用lsof | grep -i delete,找出标记为delete状态但实际还占用空间的文件。结束该进程后,文件真正释放,/tmp空间占用率降为3%

8、再次重启ha服务,启动正常,告警消失。

【解决方法】:

参考分析过程,haarb_local.xml文件异常或空间不足都会导致ha服务异常。


来自群组: 云计算
  • x
  • 常规:

点评 回复

跳转到指定楼层
发表回复
您需要登录后才可以回帖 登录 | 注册

警告 内容安全提示:尊敬的用户您好,为了保障您、社区及第三方的合法权益,请勿发布可能给各方带来法律风险的内容,包括但不限于政治敏感内容,涉黄赌毒内容,泄露、侵犯他人商业秘密的内容,侵犯他人商标、版本、专利等知识产权的内容,侵犯个人隐私的内容等。也请勿向他人共享您的账号及密码,通过您的账号执行的所有操作,将视同您本人的行为,由您本人承担操作后果。详情请参看“隐私声明
如果附件按钮无法使用,请将Adobe Flash Player 更新到最新版本!
登录参与交流分享

登录参与交流分享

登录