FusionAccess 告警“HA主备间心跳故障”

agree 新人帖[复制链接]
发表于 : 2018-3-2 14:21:55 最新回复:2018-03-07 14:46:32
1623 3


【版本】FusionAccess R6C00

【问题现象】

FAPortal上上报“HA主备间心跳故障的告警

20180302142044640001.jpg

但是在告警IP的服务器上使用service ha status 检查ha状态全都正常

20180302142045453002.jpg

【排查过程】

检查告警服务器ha状态正常所以怀疑是误告警

登录数据库服务器使用gaussdba账户登录数据库实例FUSSIONACCESS

20180302142045573003.png

ita数据库中的tbl_alarminfo表中根据告警服务器IP和告警名称查询ita上报告警的记录。

SQL语句select * from tbl_alarminfo where cause like 'ha%' and DYNAMICINFO like '%.38.16.28%';

20180302142046394004.jpg

查询结果发现除了99.38.16.2899.38.16.29两台vLB服务器在上报HA主备心跳故障以外,另外一台服务器99.38.16.32也在上报这两台vLB服务器的告警。

FAPortal上排查发现,99.38.16.32这台服务器为备份服务器登录该服务器,使用startTools命令在status中显示对端ha异常。

20180302142046065005.png

【问题根因】

客户将一台vAG服务器克隆成虚拟机后作为BackupServer,而该虚拟机中原有的ha配置文件没有被清除且该服务器与其他虚拟机没有主备关系,所以会一直向ita上报HA主备心跳故障的告警。

【处理方法】

规避方法:在BackupServer服务器中卸载ha服务告警消除

20180302142047969006.png

建议:克隆出来的虚拟机可能存在未清除的配置文件且存储空间不足,建议客户按照正规流程参考产品文档,使用纯净的linux虚拟机重新搭建BackupServer

 


本帖最后由 李健_IT 于 2018-03-02 14:39 编辑

评分

参与人数 2E币 +20 收起 理由
孙文峰 孙文峰 + 10 赞一个
wangxm wangxm + 10 很给力!

查看全部评分

  • x
  • 常规:

点评 回复

跳转到指定楼层
wangxm
wangxm  导师 发表于 2018-3-2 14:37:46 已赞(0) 赞(0)

感谢楼主分享!!!
  • x
  • 常规:

点评 回复

yWX372203
yWX372203   发表于 2018-3-5 10:38:21 已赞(0) 赞(0)

666
  • x
  • 常规:

点评 回复

孙文峰
孙文峰  版主 发表于 2018-3-7 14:46:32 已赞(0) 赞(0)

:)666
  • x
  • 常规:

点评 回复

次元壁太厚,别找我
发表回复
您需要登录后才可以回帖 登录 | 注册

警告 内容安全提示:尊敬的用户您好,为了保障您、社区及第三方的合法权益,请勿发布可能给各方带来法律风险的内容,包括但不限于政治敏感内容,涉黄赌毒内容,泄露、侵犯他人商业秘密的内容,侵犯他人商标、版本、专利等知识产权的内容,侵犯个人隐私的内容等。也请勿向他人共享您的账号及密码,通过您的账号执行的所有操作,将视同您本人的行为,由您本人承担操作后果。详情请参看“隐私声明
如果附件按钮无法使用,请将Adobe Flash Player 更新到最新版本!
登录参与交流分享

登录参与交流分享

登录