Hola a todos, a continuación platicaremos de un caso más de un comportamiento anormal en un switch CE6870 el cual al recibir paquetes TC BPDU en alguno de sus puertos este presenta una alta tasa de ocupación. Pasemos a la información para revisar este problema.
Descripción del problema
El cliente reporto que la utilización del switch CE6870 se incrementa al 100% de forma aleatoria y se tienen paquetes perdidos.
Apr 1 2018 07:43:17+05:30 SYSCON_NETMAGIC_CORE_SWITCH %DEVM/4/hwIfMonitorOutputRateRising_active(l):CID=0x80fc0101-alarmID=0x081300af;Interface output flow bandwidth usage exceeded the trap threshold. (Interface=19, BandWidthUsage=100, TrapThreshold=90, InterfaceName=10GE1/0/15)
Apr 1 2018 07:43:19+05:30 SYSCON_NETMAGIC_CORE_SWITCH %DEVM/4/hwIfMonitorOutputRateRising_active(l):CID=0x80fc0101-alarmID=0x081300af;Interface output flow bandwidth usage exceeded the trap threshold. (Interface=17, BandWidthUsage=91, TrapThreshold=90, InterfaceName=10GE1/0/13)
Informacion de la alarma
Apr 1 2018 07:43:17+05:30 SYSCON_NETMAGIC_CORE_SWITCH %DEVM/4/hwIfMonitorOutputRateRising_active(l):CID=0x80fc0101-alarmID=0x081300af;Interface output flow bandwidth usage exceeded the trap threshold. (Interface=19, BandWidthUsage=100, TrapThreshold=90, InterfaceName=10GE1/0/15)
Apr 1 2018 07:43:19+05:30 SYSCON_NETMAGIC_CORE_SWITCH %DEVM/4/hwIfMonitorOutputRateRising_active(l):CID=0x80fc0101-alarmID=0x081300af;Interface output flow bandwidth usage exceeded the trap threshold. (Interface=17, BandWidthUsage=91, TrapThreshold=90, InterfaceName=10GE1/0/13)
Proceso de análisis y solución del problema
1. Al verificar la información de registro del switch, se encontraron muchos registros de TC protection records, lo que significa que el switch recibio muchos mensajes TC BPDU. Después de recibir el mensaje TC BPDU, la tabla de direcciones mac y la tabla arp se actualizarán. Después de actualizar la tabla de direcciones mac y la tabla arp, en consecuencia se enviara un mensaje de broadcast a todos los puertos aprender las direcciones mac y arp nuevamente, lo que provocará un aumento del tráfico en los puertos.
Apr 1 2018 06:59:45+05:30 SYSCON_NETMAGIC_CORE_SWITCH %MSTP/4/MSTPLOG_PROTC_GUARDED(l):CID=0x80542724;With the TC protection enabled, if TC BPDUs were received after the number of TC BPDUs received by an instance exceeded the threshold, these TC BPDUs were processed after the TC protection time expires. (ProcessID=0, InstanceID=1)
2.- Revisando el histórico de mensajes se observa un número considerable de mensajes: “bandwidth usage exceeded record” y este mensaje coincide en tiempo cuando se recibieron los mensajes TC BPDU.
Apr 1 2018 07:43:17+05:30 SYSCON_NETMAGIC_CORE_SWITCH %DEVM/4/hwIfMonitorOutputRateRising_active(l):CID=0x80fc0101-alarmID=0x081300af;Interface output flow bandwidth usage exceeded the trap threshold. (Interface=19, BandWidthUsage=100, TrapThreshold=90, InterfaceName=10GE1/0/15)
Apr 1 2018 07:43:19+05:30 SYSCON_NETMAGIC_CORE_SWITCH %DEVM/4/hwIfMonitorOutputRateRising_active(l):CID=0x80fc0101-alarmID=0x081300af;Interface output flow bandwidth usage exceeded the trap threshold. (Interface=17, BandWidthUsage=91, TrapThreshold=90, InterfaceName=10GE1/0/13)
3.- Después de deshabilitar en la configuracion la funcionalidad stp flush, la utilización de los puertos se mantuvo estable, el efecto de esta funcionalidad es que cuando se reciban los mensajes de TC BPDU las tablas de direcciones mac y arp no se actualizarán evitando de esta manera el incremento de utilización de los puertos.
<HUAWEI> system-view
[~HUAWEI] stp flush disable
Causa raíz del problema
Después de recibir el mensaje TC BPDU las tablas de direcciones mac y arp se actualizarán enviando un paquete broadcast a todos los puertos para volver a conocer las direcciones mac y arp lo cual provoca un aumento en la ocupación de los puertos.
Solución
Deshabilite la funcionalidad stp flush con el comando: stp flush disable, ahora cuando el switch reciba algún mensaje de TC BPDU las tablas de mac y arp no se actualizarán manteniendo las estabilidad del switch.
<HUAWEI> system-view
[~HUAWEI] stp flush disable
2. Utilice el comando display stp global para verificar que la funcionalidad TC BPDU este deshabilitada
<HUAWEI> display stp global
Protocol Status :Enabled
Bpdu-filter default :Disabled
Tc-protection :Enabled
Tc-protection threshold :1
Tc-protection interval :2s
Edged port default :Disabled
Pathcost-standard :Dot1T
Timer-factor :3
Transmit-limit :6
Bridge-diameter :7
CIST Global Information:
Mode :MSTP
CIST Bridge :32768.0019-7459-3301
Config Times :Hello 2s MaxAge 20s FwDly 15s MaxHop 20
Active Times :Hello 2s MaxAge 20s FwDly 15s MaxHop 20
CIST Root/ERPC :32768.0019-7459-3301 / 0 (This bridge is the root)
CIST RegRoot/IRPC :32768.0019-7459-3301 / 0 (This bridge is the root)
CIST RootPortId :0.0
BPDU-Protection :Disabled
TC or TCN received :9
TC count per hello :0
STP Converge Mode :Normal
Share region-configuration :Enabled
Time since last TC :0 days 1h:37m:17s
Number of TC :10
Last TC occurred :10GE4/0/12
Topo Change Flag :0
En conlusión al contar con este tipo de información nos ayuda a prevenir comportamientos no deseados en nuestros equipos, pero si el problema se presenta contamos con las herramientas para resolver la situación en un menor tiempo.
FIN
Comunidad Huawei Enterprise
https://forum.huawei.com/enterprise/es/forums
#ComunidadEnterprise
#OneHuawei