Tarjeta controladora de discos no inicia en Servidor V5 Destacado

43 0 0 0

La siguiente publicación describe los pasos a seguir cuando hay un fallo de inicialización ocasional de la tarjeta controladora RAID SAS3508 LSI causando que el servidor V5 se encienda y apague repetidamente.

 

 

Descripción del problema

 

Durante la prueba de confiabilidad ORT a largo plazo de la tarjeta controladora RAID LSI SAS3508, la falla de inicialización puede ocurrir con poca probabilidad cuando el servidor se enciende y apaga repetidamente utilizando la fuente de alimentación de CA (simulando escenarios extremos). Cuando la tarjeta controladora RAID no se puede inicializar, el sistema operativo no se inicia.

 

Condiciones de activación:

1. El nodo de control utiliza la tarjeta controladora RAID LSI SAS3508.

2. La versión para PCB de la tarjeta controladora RAID LSI SAS3508 es .A.

3. La política de escritura actual de la tarjeta controladora RAID LSI SAS3508 es Write Back o Write Back con BBU.

4. Todo el chasis se enciende y luego se apaga, o se quita un nodo de cómputo y luego se inserta.

 

Síntoma de fallo:

El dispositivo de inicio no se encuentra durante el inicio del servidor y el sistema operativo no se inicia.

 

imgDownload?uuid=bef0da8bac9345508bffdbf


Método de identificación del problema:

 

1. Obtenga la dirección IP del iBMC del nodo de cómputo o el servidor 2288H V5 del documento de diseño de red, e inicie sesión en la WebUI. El nombre de usuario predeterminado es Administrator y la contraseña es Admin@9000.


imgDownload?uuid=1c3fbde25d65494489f8824 


2. Elija Information > System Info > Storage. Compruebe si el Tipo de la tarjeta controladora RAID es LSI SAS3508. Si es así, vaya al siguiente paso; Si no, este artículo no es aplicable.

 

imgDownload?uuid=17c08e4b47fa4d2bb1e7c45


3. Compruebe si la versión de PCB de la tarjeta controladora RAID es .A. Si es así, vaya al siguiente paso; Si no, este artículo no es aplicable.

 

imgDownload?uuid=2beea122d0a3431297e1132


4. Compruebe si la Política de escritura actual de la tarjeta controladora RAID es Write Back o Write Back con BBU. Si es así, este artículo es aplicable; Si no, este artículo no es aplicable.


imgDownload?uuid=1a44577240e5484ebca5119

 

Análisis de causa


Causa:

Existe un problema de coherencia en el conjunto de chips de la tarjeta controladora RAID LSI SAS3508. Cuando el servidor se enciende o apaga repetidamente usando la fuente de alimentación de CA, puede producirse un estado metaestable de señal con una probabilidad baja (0 o 1 al azar). Como resultado, el software RAID no ingresa al proceso de protección de apagado, y la inicialización falla.

En el firmware de la tarjeta controladora RAID LSI SAS3508, el modo BIOS predeterminado es Detener en caso de error (Stop on error). En este modo, cuando se produce un error o un cambio de configuración en el FW, el estado del controlador UEFI se establece en Not healthy durante el inicio. Para iniciar sesión en el sistema operativo, presione F11 durante el inicio del servidor y restaure el estado del controlador en la pantalla del Device Manager.

 

Conclusión y solución

 

NOTA:

Esta solución se aplica solo a los escenarios de NFV. Esta solución afecta al rendimiento. En otros escenarios, use esta solución basada en la evaluación del servicio real.

 

Método de rectificación:

 

Si ocurre la falla descrita en este caso, realice las siguientes operaciones para corregir la falla.

 

1. Inicie sesión en la pantalla del Device Manager de la tarjeta controladora RAID LSI SAS3508.

 

a. Inicie sesión en la WebUI de iBMC y elija Remote Console > Java Integrated Remote Console (Shared) para acceder al KVM.


imgDownload?uuid=3fb72148d7da482c92c8ee8

 

b. Reinicie el servidor en el KVM.


imgDownload?uuid=e80a58b3c8b64e9dbeaa895

 

c. Durante el inicio, presione F11 cuando se le solicite. Luego ingrese la contraseña.


imgDownload?uuid=4ad0d0a436da43d2bf47118

 

d. Ingrese la contraseña (la contraseña predeterminada es Admin@9000) y presione Enter. En la pantalla de administración, seleccione Device Manager.

 

imgDownload?uuid=72a0647c92d244078e6df19


2. En la pantalla Device Manager elija Some drivers are not healthy.

 

imgDownload?uuid=8226eac5aca44aa18b0bc78


3. En la pantalla Driver Health, seleccione Repair the whole platform.

 

imgDownload?uuid=5a074e6f55864a6ab744b7c


4. Aparece "Memory/battery problems were detected".

 

imgDownload?uuid=70ad7f1f15d0422988abcfb


5. Presione Enter.

 

imgDownload?uuid=fe7a1b9c58104d04a78bba9


6. Ingrese c y presione Enter dos veces. Si se muestra la siguiente pantalla, la configuración está completa.

 

imgDownload?uuid=cdb5d881654c423c81e232a


7. Utilice el KVM para reiniciar el servidor.

 

 

 

Solución:

Para los servidores V5 en la red en producción, el problema puede ocurrir en tres escenarios.

 

1. El sistema operativo se ha instalado en el servidor y se está ejecutando correctamente.

2. Se ha creado un grupo RAID en el servidor, pero el sistema operativo no está instalado.

3. No se crea ningún grupo RAID en el servidor.

 

 

Escenario 1: el sistema operativo se ha instalado en el servidor y se está ejecutando correctamente.

 

1. Obtener MegaRAID Storcli.

 

a. Inicie sesión en el sitio web de Broadcom y seleccione DESCARGAS> Software y herramientas de administración. La dirección es la siguiente:

https://www.broadcom.com/products/storage/raid-controllers/megaraid-9440-8i#downloads

 

imgDownload?uuid=f5e0218316224c03925085c


 

b. Descarga la última versión de MegaRAID Storcli.

 

imgDownload?uuid=a2e8bbeed8de46f7a40f596


c. Descomprima el paquete de herramientas descargado y use FileZilla o WinSCP para cargar el paquete de herramientas rpm desde el directorio de Linux al primer nodo de FusionSphere OpenStack.

 

imgDownload?uuid=939629e6a5cd49799c2e8ea

imgDownload?uuid=72d0f49bb2b8488da7bc2da

 

2. Inicie sesión en el nodo principal de FusionSphere OpenStack como usuario de fsp a través de SSH. La dirección IP del nodo principal es la dirección IP del proxy inverso de FusionSphere OpenStack. La contraseña predeterminada es Huawei@CLOUD8. Ejecute el comando su - root para cambiar al usuario root. La contraseña predeterminada es Huawei@CLOUD8!.

 

3. Ejecute el comando source set_env para importar variables de entorno.

Para V100R006C10SPCXXX, el resultado del comando es el siguiente:

 

Por favor, elija la variable de entorno que desea importar:

a. Variable de entorno openstack (Keystone v3)

b. variable de entorno cps

c. Variable de entorno de OpenStack Legacy (Keystone V

 

Por favor elija: [1 | 2 | 3]

Ingrese 1 y presione Enter. Introduzca la contraseña de OS_USERNAME. La contraseña predeterminada es FusionSphere123.

Ejecute el comando TMOUT=0 para desactivar el cierre de sesión en el tiempo de espera.

 

 4. Inicie sesión en FusionSphere y seleccione Summary para ver las direcciones IP de administración de los nodos de control.


imgDownload?uuid=1bbfdc091de54e34a79542e

 

5. Copie el paquete de herramientas Storcli en otros nodos cuyo modo de caché deba modificarse. (En el siguiente comando, XX.XX.XX.XX indica la dirección IP de administración del nodo de control que se modificará).

scp storcli-007.0504.0000.0000-1.noarch.rpm mailto: fsp@XX.XX.XX.XX:/home/fsp/

 

6. Inicie sesión en el nodo de control como usuario fsp y ejecute el comando su - root para cambiar al usuario root. La contraseña predeterminada es Huawei@CLOUD8!.

7. Vaya al directorio /home/fsp y ejecute el siguiente comando para instalar la herramienta Storcli:

rpm –ivh storcli-007.0504.0000.0000-1.noarch.rpm

 

imgDownload?uuid=269ae92f412a42ed9b6b977


8. Vaya al directorio /opt/MegaRAID/storcli, y verifique si el modo de caché del grupo RAID es RWBD o RAWBD. Si es así, vaya al siguiente paso.

 

imgDownload?uuid=da0e94d0a21d4df3b25437a


./storcli64 / c0 / vall show

 

imgDownload?uuid=81146acb0096465195b15cc


9. Ejecute el siguiente comando para cambiar el modo de caché del grupo RAID a RWTD:

./storcli64 / c0 / vall set wrcache = wt

 

imgDownload?uuid=a1db411d25584da78bebd1c


10. Ejecute el siguiente comando para verificar si el modo de caché es RWTD:

./storcli64 / c0 / vall show

 

imgDownload?uuid=2d0470b7b74c467695c3028


11. Vaya al directorio / home / fsp y ejecute los siguientes comandos para desinstalar y eliminar el paquete de herramientas:

rpm -e storcli-007.0504.0000.0000-1.noarch

rm storcli-007.0504.0000.0000-1.noarch.rpm

 

imgDownload?uuid=18db2c70cc4e41fbb8251d3

 

Escenario 2: se ha creado un grupo RAID en el servidor, pero el sistema operativo no está instalado.

 

1. Inicie sesión en la pantalla del Administrador de dispositivos de la tarjeta controladora RAID LSI SAS3508. Para más detalles, vea el paso 1 en "Método de rectificación".

2. Elija el Device Manager y presione Enter.

imgDownload?uuid=adff8e4c53aa4a898407206 


3. Elija la Utilidad de configuración Avago MegaRAID <SAS3508> y presione Enter.


imgDownload?uuid=85fc7ec79f014214b163057 


4. Elija Main Menu y presione Enter.

 

imgDownload?uuid=2f841d63e2d0499fa035ba5


5. Elija Virtual Drive Management y presione Enter.

 

imgDownload?uuid=520d288b6b3c4b729a0fb1a


6. Elija el disco virtual que se va a utilizar y presione Enter.

 

imgDownload?uuid=f3b630099b5e4574b51b4c6


7. Seleccione Advanced ... y presione Enter.

 

imgDownload?uuid=c34fab5d7bc5402aa9f641e


8. Elija la Default Write Cache Policy y presione Enter.

9. Seleccione Write Through y presione Enter.

 

imgDownload?uuid=235f738b9bb9404eb10c5e1


10. Seleccione Apply Changes y presione Enter. Se visualiza "The operation has been performed successfully".

 

imgDownload?uuid=3a583b8da7e64054a6236c2


11. Elija OK y presione Enter. La configuración está completa.

12. Utilice el KVM para forzar el reinicio del servidor.

 

 Escenario 3: no se crea ningún grupo RAID en el servidor.

 

1. Acceda a la pantalla del menú principal refiriéndose al paso 1 y al paso 2 en el escenario 2. Seleccione Configuration Management y presione Enter.


imgDownload?uuid=e3eb2759b0f048d2b3e7d32

 

2. Elija Create Virtual Drive y presione Enter.

 

imgDownload?uuid=79f23e862869421eaa9018d


3. Establezca la política de escritura para escribir. Write Policy – Write Through

 

imgDownload?uuid=7f1e90fb3b1144d1b7e39e9


4. Seleccione Save Configuration y presione Enter. Se muestra la pantalla de confirmación.


5. Seleccione Confirm y presione Enter.


6. Elija Yes y presione Enter. Se visualiza "The operation has been performed succesfully".


7. Elija OK y presione Enter. La configuración está completa.

 

8. Utilice el KVM para forzar el reinicio del servidor.

 

 


  • x
  • convención:

Responder

Responder
Debe iniciar sesión para responder la publicación Inicio de sesi | Registrarse

Aviso: Para garantizar sus legítimos derechos e intereses, la comunidad y los terceros no publicarán contenido que pueda generar riesgos legales a las partes, por ejemplo, pornografía, contenido político, contenido sobre juego, consumo y tráfico de drogas, así como contenido que viole los derechos de propiedad intelectual de terceros, por ejemplo, secretos comerciales, marcas, derechos de autor, patentes y privacidad personal. No comparta su cuenta ni su contraseña con terceros. Todas las operaciones realizadas usando su cuenta se considerarán como sus acciones y todas las consecuencias que estas acciones generen serán responsabilidad suya. Para obtener información detallada, consulte la “ Política de privacidad.”
Si el botón para adjuntar no está disponible, actualice Adobe Flash Player con la versión más reciente

¡Ingresa y disfruta de todos los beneficios para los miembros!

Aterrizaje
Respuesta rápida Desplácese hasta arriba