Un mode d'échec courant dans les systèmes clusterisés est le split-brain. Dans cette condition, chacun des contrôleurs clusterisés croit que son pair subit une défaillance et tente une reprise. La cause la plus fréquente de cette condition est la défaillance du moyen de communication partagé par les contrôleurs. Dans les appareils de la série Oracle ZFS Storage Appliance, les liaisons d'E/S de cluster sont le moyen de communication partagé. Toutefois, une redondance de liaison est associée aux liaisons d'E/S de cluster des appareils de la série Oracle ZFS Storage Appliance : pour les contrôleurs ZS9-2, une seule liaison Ethernet d'E/S de cluster est requise pour éviter le déclenchement de la reprise. Pour tous les autres contrôleurs, une seule liaison série d'E/S de cluster est requise pour éviter le déclenchement de la reprise.
Le logiciel de l'appareil exécute une procédure d'arbitrage afin de déterminer le contrôleur qui poursuivra la reprise.
La solution de clustering des appareils Oracle ZFS Storage Appliance a été conçue pour garantir l'absence de point de panne unique et protéger les données et la disponibilité contre toute panne éventuelle. La plupart des pannes peuvent être évitées en installant correctement le matériel et en suivant les meilleures pratiques de gestion et de configuration du cluster. Vérifiez les points suivants :
Toutes les liaisons d'E/S du cluster (deux pour un contrôleur ZS9-2, trois pour tous les autres contrôleurs) sont connectées et fonctionnelles, comme indiqué dans Vue de la BUI de configuration du cluster et Vérification du statut de liaison de cluster (CLI).
Le câblage du stockage respecte la documentation de configuration fournie avec vos appareils.
Il est particulièrement important que les deux chemins soient détectés vers chaque étagère de disques, comme illustré dans la figure suivante, avant et après la mise en production du cluster, exception faite des modifications temporaires de câblage pour prendre en charge les améliorations des fonctionnalités ou le remplacement des composants défectueux. Utilisez des alertes pour surveiller l'état des liaisons d'interconnexion du cluster et des chemins d'étagères de disques et corriger rapidement toute panne. En vous assurant du maintien de la connectivité, vous pourrez protéger à la fois la disponibilité et l'intégrité des données en cas de défaillance d'un composant matériel ou logiciel.
Figure 8 Deux chemins vers chaque étagère de disques dans un cluster
Rubriques connexes