Diagnóstico de fallos de ruta de datos SAS en servidores que utilizan controladores de disco MegaRAID

Idioma:

En servidores x86 de Oracle que utilizan controladores de disco MegaRAID, pueden ocurrir errores de ruta de datos SCSi de conexión en serie (SAS).

Para clasificar y aislar un problema de ruta de datos en el controlador de disco SAS, la placa posterior del disco (DBP), el cable SAS, el expansor SAS o la unidad de disco duro (HDD), recopile y revise los eventos del log de eventos del controlador de disco. Clasifique y analice todos los eventos de fallo informados por el controlador de disco según la topología SAS del servidor.

Para clasificar un evento de controlador de disco MegaRAID, recopile y analice los logs de eventos del controlador de disco MegaRAID con el comando MegaCLI:

Por ejemplo, en la petición de datos root, escriba:

root# ./MegaCli64 adpeventlog getevents –f event.log aall
Success in AdpEventLog
Exit Code: 0x00

Notas - Use el nombre existente del log de eventos como el nombre para el log de eventos del controlador de disco. Esto genera un log de eventos del controlador MegaRAID con el nombre de archivo dado event.log.

Los siguientes códigos de error de SCSI pueden encontrarse en el log de eventos de fallos de ruta de datos SAS:

B/4B/05 :SERIOUS: DATA OFFSET ERROR

B/4B/03 :SERIOUS: ACK/NAK TIMEOUT

B/47/01 :SERIOUS: DATA PHASE CRC ERROR DETECTED

B/4B/00 :SERIOUS: DATA PHASE ERROR

Un fallo de comunicación entre el disco y el adaptador de bus de host causa estos errores. La presencia de estos errores, aun en un solo disco, significa que existe un problema de ruta de datos. Es posible que el controlador RAID, los cables SAS, el expansor SAS o las placas posteriores del disco causen la interrupción de la comunicación en la ruta entre el controlador RAID y los discos.

El personal del servicio de asistencia de Oracle puede encontrar más información sobre el diagnóstico y la clasificación de fallos de disco duro y ruta de datos SAS en servidores x86 en el sitio web My Oracle Support: https://support.oracle.com. Consulte el artículo de conocimientos con el ID de documento 2161195.1. Si hay varios problemas de disco simultáneos en un servidor Exadata, el personal del servicio de asistencia de Oracle puede consultar el artículo de conocimientos con el ID de documento 1370640.1.