Descripción del problema:
Un servidor 2288H V5 se descompone
•Análisis de problemas:
Según el SEL, se reporta un error incorregible para el SSD NVMe en el slot 11 a las 10:40
2. Un error incorregible para la unidad también se registra en el registro FDM a las 10:40.
[Número de registro de error de hardware]: 1 Tiempo: 2018-08-16 20:40
Recopilar: BIOS (SMI) Número de serie SMI: 232 Recopilar integridad: Validar (0X00)
CPU: 0(Socket: CPU1) Core: uncore Module: MCA Bank11(CHA G2) MCA Mode: CDC
----------------------- ----------------------- DE ERROR DE INFORME DE MCA
Tipo de error:Error no corregido-catastrófico/fatal
MCACODE: 0X110A (Error de jerarquía de caché: .Generic,CACHE, Level-2, número de error genérico, _ERR)
MSCODE: 0X000C ( TOR_TIMEOUT)
Mci_Status: Bit(58)ADDRValid Bit(59)MISCValid
Mci_Address: 0X83E00000(PCIe: (0X3A:0X3:0) [Disk11]) (Dirección física)
CHA G2 generó un evento eMCA
Primera fuente MCERR: CHA 2
Según el análisis anterior, el sistema se descompone porque el SSD NVMe en la ranura 11 es defectuoso.
•Conclusión y solución
Conclusión: El SSD NVMe en la ranura 11 es defectuoso.
Solución: Reemplace el SSD NVMe en la ranura 11.