Go to main content
Notas del producto de Oracle® Server X5-2L, versión 1.7

Salir de la Vista de impresión

Actualización: Octubre de 2016
 
 

Diagnóstico de fallos de ruta de datos de SAS en servidores que usan controladores de disco MegaRAID

En servidores x86 de Oracle que usan controladores de disco MegaRAID, se pueden producir errores de ruta de datos de SCSI de conexión serie (SAS). Para identificar y aislar un problema de ruta de datos en el controlador de disco SAS, la placa posterior del disco (DBP), el cable SAS, el expansor SAS o la unidad de disco duro (HDD), recopile y revise los eventos en el log de eventos del controlador de disco. Clasifique y analice todos los eventos de fallo informados por el controlador de disco de acuerdo con la topología de SAS del servidor.

Para clasificar un evento del controlador de disco MegaRAID:

  • Recopile y analice los logs de eventos de controlador de disco MegaRAID, ya sea ejecutando la utilidad sundiag automatizada o mediante la ejecución manual de los comandos MegaCLI o StorCLI.

    • Para los servidores de celda de almacenamiento o base de datos de Oracle Exadata Database Machine, ejecute la utilidad sundiag.

    • Para Oracle Server X5-2/L, use el comando StorCLI (el comando StorCLI es compatible con versiones anteriores del comando MegaCLI).

Por ejemplo, recopile y analice manualmente el log de eventos del controlador mediante el comando MegaCLI. En el símbolo del sistema raíz, escriba:

root# ./MegaCli64 adpeventlog getevents –f event.log aall
Success in AdpEventLog
Exit Code: 0x00

Notas -  Use el nombre existente del log de eventos como nombre para el log de eventos del controlador de disco. Esto genera un log de eventos de controlador MegaRAID con el nombre de archivo event.log proporcionado.

Los siguientes errores de clave de información de estado de SCSI encontrados en el log de eventos, en la sección de fallos de ruta de datos de SAS, indican un fallo en la ruta de datos de SAS:

B/4B/05 :SERIOUS: DATA OFFSET ERROR
B/4B/03 :SERIOUS: ACK/NAK TIMEOUT
B/47/01 :SERIOUS: DATA PHASE CRC ERROR DETECTED
B/4B/00 :SERIOUS: DATA PHASE ERROR

Un fallo de comunicación entre el disco y el adaptador de bus de host provoca estos errores. La presencia de estos errores, incluso en un solo disco, significa que existe un problema con la ruta de datos. Es posible que el controlador RAID, los cables SAS, el expansor SAS o la placa posterior del disco estén provocando la interrupción de la comunicación en la ruta entre el controlador RAID y los discos.

El personal del servicio de asistencia de Oracle puede encontrar más información sobre el diagnóstico y la identificación de fallos ruta de datos de SAS y disco duro en servidores x86 en el sitio web My Oracle Support: https://support.oracle.com. Consulte el artículo de conocimientos con el ID de documento 2161195.1. Si existen varios problemas de disco simultáneos en un servidor Exadata, el personal del servicio de asistencia de Oracle puede consultar el artículo de conocimientos con el ID de documento 1370640.1.