MTU值设置问题导致数据库同步失败

[复制链接]
发表于 : 2019-5-9 17:36:50 最新回复:2019-05-09 17:44:54
559 1

MTU值设置问题导致数据库同步失败

【问题现象】:局点新创建的GaussDB组件,不配置HA本地数据库服务就正常,配置上HA之后数据库就无法启动。报错“postmaster.pid file does not exist after 15 seconds”

173554oz9lqlv7zs9evmyq.png

【问题分析】:

1、  检查/var/FusionAccess/GaussDB/gaussdb-2019-05-08_000000.log日志,提示“database system identifier differs between the primary and standby”,确认是主备数据不同步。

173554lgybwggmgpgubbws.png

2、  在异常的数据库服务器上执行 gs_ctl build,提示build failed

3、  检查主备节点的复制配置是否正确cat /opt/GaussDB/data/postgresql.conf | grep repl

173555o9g1l1n00gwnstbl.png

4、  在该异常节点上ssh -v <主节点IP> -p 11211ssh -v <主节点IP> -p 11212,确认到节点的复制端口都正常。

5、  在该异常节点上gsql -d postgres -h <主节点IP> -U fauser -P Cloud12#$,也能正常连接到主节点。

173555zhh3h893t62k50w0.png

6、  检查MAC地址冲突,分别在主备节点检测对端的IP地址,如在备节点上使用arping -f -D -I eth0 <主节点IP>检测主IP是否冲突(-D开启冲突检测模式,-I是由于该虚拟机有两块网卡,需要指定一个),未冲突(返回为空表示IP地址未占用,这里返回了一条记录,确认macip都是对的)。

173556ynall8lvak45nlw1.png

7、  检查网络有速率限制,在异常节点上创建一个500M的测试文件拷贝到主节点。速率由63KB/s降到0

173556kntmci1i3ize66ss.png173556uxb0psc6rybr88rk.png

8、  检测是否只有小包才能通过,ping -s 1472 <主节点IP>,不能ping通,ping -s 1400 <主节点IP>不能ping通,可以确认是中间设备MTU值较小导致。

 

【问题解决】:

1、  修改异常节点的网卡,vi /etc/sysconfig/network/ifcfg-eth0,执行service network restart,再使用ip addr检查修改结果。

173557gz98i8qh8v8nz4dd.png

173557ndhj9j2cnkkgc225.png173557q11fzv33nq1loowz.png

2、  切换到gaussdba账号执行build成功,服务启动正常。

173558hjfht3fofo332x7h.png

 


来自群组: 云计算
  • x
  • 常规:

点评 回复

跳转到指定楼层
社区管理员咕噜噜
社区管理员咕噜噜  管理员 发表于 2019-5-9 17:44:54 已赞(0) 赞(0)

谢谢案例分享!
  • x
  • 常规:

点评 回复

Come on!
发表回复
您需要登录后才可以回帖 登录 | 注册

警告 内容安全提示:尊敬的用户您好,为了保障您、社区及第三方的合法权益,请勿发布可能给各方带来法律风险的内容,包括但不限于政治敏感内容,涉黄赌毒内容,泄露、侵犯他人商业秘密的内容,侵犯他人商标、版本、专利等知识产权的内容,侵犯个人隐私的内容等。也请勿向他人共享您的账号及密码,通过您的账号执行的所有操作,将视同您本人的行为,由您本人承担操作后果。详情请参看“隐私声明
如果附件按钮无法使用,请将Adobe Flash Player 更新到最新版本!
登录参与交流分享

登录参与交流分享

登录