Perdida de paquetes en tarjeta NIC de Servidor RH2288H V3

74 0 0 0

En la siguiente publicación se describen los pasos a seguir en caso de presentar perdida de paquetes en la tarjeta de red (NIC) de un servidor RH2288H V3


1. Descripción del problema

 

Producto: RH2288H V3

Descripción: NIC perdió paquetes en el servidor RH2288H V3.


094309avfgeeng2mgm2z2t.png?image.png 

Figura 1. Perdida de paquetes


2. Análisis del problema.


2.1. Síntoma del problema

RH2288H V3 ha perdido muchos paquetes en el puerto eth5.

 

2.2. Análisis del problema

 

2.2.1. Al verificar el registro de sel del servidor, podemos confirmar que el ECC del dispositivo de memoria DIMM010 ha ocurrido muchas veces y que el número de ocurrencias del CE ha excedido el umbral, haciendo que el servidor informe un error de configuración de memoria. Los registros con tiempos de ECC que exceden el umbral se registraron ya el 27 de mayo de 2017.

 094510vr00araz2aaqrahz.png?image.png

Figura 2. Registros sel (I)

 

Desde el 27 de diciembre de 2017, el servidor muestra una alarma que genera y luego borra 'Error de configuración, dimm es 0/1/0' en la interfaz BMC.

094547coqcwkovq7zq7zrd.png?image.png

Figura 3. Registros sel (II)

 

 

Esta alarma se generó por última vez el 10 de septiembre de 2018 y no se ha borrado.

 

 094605dji22au3a12dutds.png?image.png

Figura 4. Registros sel (III)

 

2.2.2. Verifique el registro FDM, muchos errores correctos en la memoria de 13:00 en 10 de octubre a 21:00 en 10 de octubre.

 

 095504y9o47tlzaqc31kpp.png?image.png

Figura 5. Logs de FDM

 

El registro de FDM antes del 10 de octubre no se registró, pero esta situación debería ser causada por demasiadas ocurrencias de CE que hacen que el registro de FDM se vacíe.

  

2.2.3. El valor de THR y MCP de la CPU es alto en el registro de interrupciones, los dos valores están estrechamente relacionados con la CPU y el módulo de memoria.

 095642e3uhzcnynx3cn2ht.png?image.png

  

2.2.4. Hay perdidas o caídas de paquetes de RX más obvias en el puerto de servicio ETH5.

 

 

 095712isbpk0fet8n8fnrk.png?image.png

Figura 6. Registros en puerto eth5

 

La probabilidad de pérdida de paquetes, que es aproximadamente uno de cada diez mil, ya es relativamente alta.

  

2.2.5. El error de memoria ECC desencadenaría una gran cantidad de interrupciones de THR y MCP en la CPU del servidor, causando un alto uso de SI. Como resultado, la pérdida de paquetes ocurre en la tarjeta NIC.

  

 

2.2.6. No se informa ningún error de ECC después del reemplazo de DIMM010, luego realice la prueba de ping durante unas horas, no se pierde ningún paquete en la tarjeta NIC.

 

 095725zo5o91g877vdiveh.png?image.png

Figura 7. Registros de sel sin errores

 

 

3. Conclusión

 

El error de memoria ECC desencadenaría una gran cantidad de interrupciones THR y MCP en la CPU del servidor, lo que provocaría un alto uso de SI. Como resultado, la pérdida de paquetes ocurre en la tarjeta NIC.

 

 

4. Solución

 

 Reemplace la memoria que ocurrió error ECC. También sugiera reemplazar la tarjeta NIC para que sea segura, si es posible.

  

5. Sugerencia


1. Realice una buena inspección diaria de rutina de los servidores. No mantengas alerta en los servidores.

 

2. Optimice el inventario de piezas de repuesto en el almacén y asegúrese de que haya suficientes piezas de repuesto cuando se necesite un reemplazo.



6. Temas relacionados


Asistente de configuración de Memorias DIMM en Servidores Huawei

Alarmas de DIMM en VMware vCenter Servidor Huawei


  • x
  • convención:

Responder

Responder
Debe iniciar sesión para responder la publicación Inicio de sesión | Registrarse

Aviso Aviso: Para garantizar sus legítimos derechos e intereses, la comunidad y los terceros no publicarán contenido que pueda generar riesgos legales a las partes, por ejemplo, pornografía, contenido político, contenido sobre juego, consumo y tráfico de drogas, así como contenido que viole los derechos de propiedad intelectual de terceros, por ejemplo, secretos comerciales, marcas, derechos de autor, patentes y privacidad personal. No comparta su cuenta ni su contraseña con terceros. Todas las operaciones realizadas usando su cuenta se considerarán como sus acciones y todas las consecuencias que estas acciones generen serán responsabilidad suya. Para obtener información detallada, consulte la “ Política de privacidad.”
Si el botón para adjuntar no está disponible, actualice Adobe Flash Player con la versión más reciente
¡Ingresa y disfruta de todos los beneficios para los miembros!

¡Ingresa y disfruta de todos los beneficios para los miembros!

Aterrizaje