Go to main content

Guía de administración de Oracle® ZFS Storage Appliance, versión OS8.8.x

Salir de la Vista de impresión

Actualización: Agosto de 2021
 
 

Prevención de situaciones de cerebro dividido

Un modo de fallo común en los sistemas en clusters es el que se conoce como cerebro dividido. En este estado, cada uno de los controladores en cluster actúa como si su par hubiera fallado e intenta tomar el control. La causa más común de esta condición es el fallo del medio de comunicación compartido entre los controladores. En Oracle ZFS Storage Appliance, el medio de comunicación compartido son los enlaces de E/S de cluster. Sin embargo, los enlaces de E/S de cluster de Oracle ZFS Storage Appliance tienen redundancia de enlaces incorporada. En los controladores ZS9-2, se requiere un solo enlace Ethernet de E/S de cluster para evitar que se dispare la toma de control. En los demás controladores, se requiere un solo enlace serie de E/S de cluster para evitar que se dispare la toma de control.

El software del dispositivo realiza un procedimiento de arbitraje para determinar cuál es el controlador que debe continuar con la toma de control.

La solución de agrupación en clusters de Oracle ZFS Storage Appliance se diseñó para garantizar que no haya un único punto de fallo y proteger tanto los datos como la disponibilidad contra fallos. Es posible evitar la mayoría de los fallos si se instala correctamente el hardware y se implementan las mejores prácticas de configuración y gestión de clusters. Verifique lo siguiente:

  • Todos los enlaces de E/S de cluster (dos para un controlador ZS9-2 y tres para los demás controladores) están conectados y funcionan como se muestra en Vista de configuración de clusters de la BUI y Comprobación de estado de enlaces de cluster (CLI).

  • Todos los cables de almacenamiento están conectados como se muestra en la documentación de configuración que se incluye con los dispositivos.

    Es particularmente importante que se detecten dos rutas a cada estante de discos (como se muestra en la siguiente figura) antes de pasar el cluster a producción y que estas rutas se encuentren disponibles en todo momento de allí en adelante, excepto en los cambios transitorios de cables para aumentar la capacidad o reemplazar componentes defectuosos. Utilice las alertas para supervisar el estado de los enlaces de interconexión del cluster y las rutas de los estantes de discos, y corregir con rapidez los posibles fallos. Garantizando la conectividad adecuada, se protege tanto la disponibilidad como la integridad de los datos si falla algún componente de hardware o software.

Figura 8  Dos rutas a cada estante de discos en un cluster

image:En esta figura, se muestra un 2 en la columna Rutas para los estantes de discos.

Temas relacionados