En servidores x86 de Oracle que utilizan controladores de disco MegaRAID, pueden ocurrir errores de ruta de datos SCSi de conexión en serie (SAS).
Para clasificar y aislar un problema de ruta de datos en el controlador de disco SAS, la placa posterior del disco (DBP), el cable SAS, el expansor SAS o la unidad de disco duro (HDD), recopile y revise los eventos del log de eventos del controlador de disco. Clasifique y analice todos los eventos de fallo informados por el controlador de disco según la topología SAS del servidor.
Para clasificar un evento de controlador de disco MegaRAID, recopile y analice los logs de eventos del controlador de disco MegaRAID con el comando MegaCLI:
Por ejemplo, en la petición de datos root, escriba:
root# ./MegaCli64 adpeventlog getevents –f event.log aall Success in AdpEventLog Exit Code: 0x00
Los siguientes códigos de error de SCSI pueden encontrarse en el log de eventos de fallos de ruta de datos SAS:
B/4B/05 :SERIOUS: DATA OFFSET ERROR
B/4B/03 :SERIOUS: ACK/NAK TIMEOUT
B/47/01 :SERIOUS: DATA PHASE CRC ERROR DETECTED
B/4B/00 :SERIOUS: DATA PHASE ERROR
Un fallo de comunicación entre el disco y el adaptador de bus de host causa estos errores. La presencia de estos errores, aun en un solo disco, significa que existe un problema de ruta de datos. Es posible que el controlador RAID, los cables SAS, el expansor SAS o las placas posteriores del disco causen la interrupción de la comunicación en la ruta entre el controlador RAID y los discos.
El personal del servicio de asistencia de Oracle puede encontrar más información sobre el diagnóstico y la clasificación de fallos de disco duro y ruta de datos SAS en servidores x86 en el sitio web My Oracle Support: https://support.oracle.com. Consulte el artículo de conocimientos con el ID de documento 2161195.1. Si hay varios problemas de disco simultáneos en un servidor Exadata, el personal del servicio de asistencia de Oracle puede consultar el artículo de conocimientos con el ID de documento 1370640.1.