【运维小能手】以太网出现环路导致下挂业务中断

strive_fly
strive_fly  Diamond  (1)
5 years 8 months ago  View: 10779  Reply: 47
1F
故障描述 

X局本地网骨干层OSN3500设备组10G速率MSP环网,接入层Metro1000组155M速率PP环网。中心站A在MSP环上,接入点B、C、D、E等在PP环上。A局EGS单板到B、C、D、E等站点EFT单板以EOS方式,开通LAN业务。A局接路由器设备,B、C、D、E站接WLAN等无线上网设备,每站绑定4个2M时隙。某日,数据部门反馈B、C、D、E等站点WLAN业务无法使用,查询网管侧无任何告警。 

故障诊断 

由于多接入点同时出问题,怀疑以下原因: 
1、SDH关键节点及板件故障; 
2、中心站路由器设备故障; 
3、以太网出现环路。 

解决措施 

1、T2000检查OSN3500,Metro1000,没有硬件故障告警,没有业务故障告警,性能良好。 
2、数通工程师检查路由器,发现网络上形成以太网环路,形成网络风暴,阻塞数据业务,而且环路发生在路由器以下。 
3、各接入站点B、C、D、E检查本地硬件情况,没有发现传输侧有以太网端口环回。 
4、而在排查中发现,C站点设备变灰,无法正常登录,查看上下游网元ECC,发现彼此间互为相邻网元,也就是说明C站点已被甩出,上下游节点的光缆直接对接。 
5、查询C站点业务发现C站的业务路径还是存在的,也就是说,C站已经拆除,C站的上下业务却没有删除。 
6、因此,本该在C站上下的、给WLAN用的以太网业务,因为C站点拆除,业务没有删除,在SDH网络上又环回到了中心A局。对于本案例中的LAN业务来看,逻辑上就是一台交换机,而它的逻辑端口(VCTRUNK),被环回了,所以“这台交换机”上的业务都断了。 
7、将C站点设置为预配置,使用路径法将C站落地的以太网业务删除后故障排除 

预防、监控措施 

SDH支持以EOS方式建立LAN业务,这种LAN业务,在逻辑上就是交换机。如果绑定的2M被环回,“逻辑交换机”的端口“VCTRUNK”就被环回了,和物理交换机的物理环回结果一致,产生网络风暴,阻塞业务。

Rating
西之园兔有西之园兔有  + 188 Contributions    详细的案例,排版也很好看~!
strive_fly
strive_fly  Diamond 
5 years 8 months ago
2F
欢迎大家点评、交流。
wlx
wlx  Senior 
5 years 8 months ago
3F
传输网元退网引起的以太网业务环路影响业务,这个一般情况下确实不会想到。
学习了,感谢楼主分享。
Tina.hu
Tina.hu  Gold 
5 years 8 months ago
4F
感谢您的分享~~我们MSTP资料团队还最新出品了自媒体故障系列,也欢迎你查看哦:http://support.huawei.com/carrie ... 21427014/PBI1-16243 目前一共出品了8期。
demessie.kebede
demessie.kebede  Junior 
5 years 8 months ago
5F
strive fly animals i like it.
花不语
花不语  Platinum 
5 years 7 months ago
6F
我是来打酱油的
金色闪光
金色闪光  Platinum 
5 years 7 months ago
7F
顶一个!·
strive_fly
strive_fly  Diamond 
5 years 7 months ago
8F
谢谢支持!
sunshinzj
sunshinzj  Silver 
5 years 7 months ago
9F
案例描述清晰,有参考价值,感谢楼主分享!
1/5Page