Présentation de Sun Cluster pour SE Solaris

Séparation en cas d'échec

Une panne entraînant la partition du cluster (appelée split brain) est un des problèmes majeurs que peut rencontrer un cluster. Lorsque ce phénomène se produit, les noeuds ne peuvent pas tous communiquer, ainsi, des noeuds individuels ou des sous-ensembles de noeuds risquent de tenter de former des clusters individuels ou des sous-ensembles. Chaque sous-ensemble ou partitionnement peut « croire » qu'elle est la seule à être propriétaire des disques multihôtes et à en posséder l'accès. Les tentatives d'écriture des différents noeuds sur les disques peuvent entraîner une corruption des données.

La séparation en cas d'échec limite l'accès des noeuds aux disques multihôtes en les empêchant d'accéder aux disques. Lorsqu'un noeud quitte le cluster (parce qu'il a échoué ou a été partitionné), la séparation en cas d'échec assure qu'il ne peut plus accéder aux disques. Seuls les membres actuels des noeuds ont accès aux disques, garantissant ainsi l'intégrité des données.

Le système Sun Cluster utilise le mode de réservation des disques SCSI pour implémenter la séparation en cas d'échec. Grâce au système de réservation SCSI, les noeuds défaillants sont « isolés » à l'extérieur des disques multihôtes, pour les empêcher d'y accéder.

Lorsqu'un membre détecte qu'un autre noeud ne communique plus sur l'interconnexion du cluster, il lance une procédure de séparation en cas d'échec pour empêcher le noeud défaillant d'accéder aux disques partagés. Lors de la séparation en cas d'échec, le noeud séparé panique et un message de « conflit de réservation » s'affiche sur la console.