CloudEngine 12800---EVN arp-direct route

80 0 0 0

Descripcion del problema

Cliente tiene dos DC:    “home DC” – DC SPB y “guest DC” – MSK DC.

Cada DC tiene CSS de dos CE12808 en el core.

Entre DCs – red backbone, y el DCI configurado mediante EVN en modo Gateway activo.

Entre dos DCs configurados para el filtrado de MAC de VRRP.

Gateway para subredes internas -VRRP Virtual-IP a CE12808

 

En los dispositivos DC SPB (home) anuncian la subred backbone 10.245.8.128/25

En los dispositivos DC MSK (guest) anuncian la subred backbone solo rutas de host /32 mediante el uso de ARP-entradas (arp direct-route enable detect virtual-ip).  La subred total/25 que este DC no anuncia al backbone.

 

El cliente mueve pocas VM desde el SPB de DC (casa) a MSK DC (huésped), todas las rutas fueron automáticamente conmutadas, no ha ocurrido ningún problema.

 

Pero después de algún tiempo de trabajo el cliente encontró el problema: ARP-table en los dispositivos en DC MSK (huésped) actualización incorrecta. Esto lleva a la falta de disponibilidad de servidores. Detalles descritos a continuación. 

 

La pregunta principal es cómo proteger la red de tal comportamiento y permitir que los dispositivos restablezcan automáticamente el acceso a las VM migradas sin interrupción prolongada del servicio.


Análisis del problema

 

Aclaremos el proceso:

1.     Server1 migra a Server2 y funciona bien

2.     Reset ARP en el dispositivo CE6800-2 y luego los usuarios no pueden hacer telnet a Server2, porque no hay ARP en CE6800 2 el cual es necesario para la creación de ruta host en el elemento de red. Así que después de la operación de ping para activar el aprendizaje de ARP en el dispositivo CE6800-2 funciona bien.

 

La pregunta principal es cómo proteger la red de tal comportamiento y permitir que los dispositivos restablezcan automáticamente el acceso a las VM migradas sin interrupción prolongada del servicio.

 

3.     En estado normal, si no hay tráfico entre CE6800-2 y Server2 a lo largo del tiempo, ARP tiene un tiempo de envejecimiento ARP (20min), el switch activará la detección de envejecimiento ARP antes del tiempo de envejecimiento si no hay tráfico, por lo que ARP se mantendrá.

1.     Si restablece ARP en el dispositivo CE6800-2 en estado normal, Server2 no sabrá ARP eliminar en el switch, pero Server2 tiene el tiempo de envejecimiento de ARP, activará la detección de envejecimiento ARP antes del tiempo de envejecimiento, y si hay algún tráfico (por ejemplo, ping o algo de activación del tráfico), si también activará el aprendizaje ARP. Pero si no hay tráfico durante este tiempo en el servidor o en el lado del interruptor, puede tomar mucho tiempo (tiempo de envejecimiento) para el servidor para activar el aprendizaje ARP.

2.     Para la versión V2R3, tenemos el comando de arp smart-discovery enable, se utiliza para VM o Server detecte ARP activamente, cuando hay ARP. Pero no se recomienda utilizar en estado normal si la red es muy grande, ya que los paquetes ARP ocupan el rendimiento de la CPU.

3.     Creemos que VMor Server debe enviar los paquetes en estado normal, por ejemplo GARP.

4.     Si queremos reducir la interrupción prolongada del servicio en esta situación, el ping también es un buen camino para reducir el tiempo de interrupción del servicio durante el tiempo de migración. Sin embargo, después de ella, debe ser paso (a).


Root Cause

Reiniciar ARP en el dispositivo CE6800-2 en estado normal, Server2 sabrá eliminar ARP en el switch, pero Server2 tiene el tiempo de envejecimiento de ARP, desencadenará la detección de envejecimiento ARP antes del tiempo de envejecimiento, y si hay algún tráfico (por ejemplo, ping o algo de tráfico), también activará el aprendizaje ARP. Pero si no hay tráfico durante este tiempo en el servidor o en el lado del switch, puede tomar mucho tiempo (tiempo de envejecimiento) para el servidor activar el aprendizaje ARP.   Descripción de la Solución

La VM debe enviar paquetes (por ejemplo, GARP) para activar el aprendizaje de ARP, pero en la actualidad el servidor desencadenara ARP aprendizaje que es de acuerdo con la detección de envejecimiento ARP, por lo que tomará mucho tiempo para desencadenar el aprendizaje de ARP en el servidor. Por lo tanto, si el servidor reduce el temporizador GARP ayudará al aprendizaje del ARP al migrar VM

Ping es también una buena manera de reducir el tiempo de interrupción del servicio


  • x
  • convención:

Responder

Responder
Debe iniciar sesión para responder la publicación Inicio de sesión | Registrarse

Aviso: Para garantizar sus legítimos derechos e intereses, la comunidad y los terceros no publicarán contenido que pueda generar riesgos legales a las partes, por ejemplo, pornografía, contenido político, contenido sobre juego, consumo y tráfico de drogas, así como contenido que viole los derechos de propiedad intelectual de terceros, por ejemplo, secretos comerciales, marcas, derechos de autor, patentes y privacidad personal. No comparta su cuenta ni su contraseña con terceros. Todas las operaciones realizadas usando su cuenta se considerarán como sus acciones y todas las consecuencias que estas acciones generen serán responsabilidad suya. Para obtener información detallada, consulte la “ Política de privacidad.”
Si el botón para adjuntar no está disponible, actualice Adobe Flash Player con la versión más reciente

¡Ingresa y disfruta de todos los beneficios para los miembros!

Aterrizaje
Respuesta rápida Desplácese hasta arriba