StorageTek Automated Cartridge System Library Software Installation, configuration et fonctionnement du cluster 8.3 en haute disponibilité Version 8.3 E54097-01 |
|
![]() Précédent |
![]() Suivant |
Ce chapitre explique comment configurer une stratégie de basculement optimale en cas de défaillance de la bibliothèque, comment ajuster l'intervalle pingpong pour éviter les basculements non souhaités et comment s'enregistrer pour la notification par e-mail des basculements.
L'agent ACSLS HA surveille en permanence la communication entre ACSLS et les bibliothèques connectées. Cette communication est cruciale pour le fonctionnement en continu d'ACSLS. Mais l'action à prendre (s'il faut en prendre une) dans le cas d'une défaillance de communication avec les bibliothèques dépend d'une stratégie qui est déterminée par l'administrateur local d'ACSLS HA.
Un tableau de stratégie, $ACS_HOME/acslsha/ha_acs_list.txt
, permet à l'administrateur local de définir l'action de basculement souhaitée pour tout ACS qui exige une récupération HA. Lors d'une défaillance de communication avec les bibliothèques, et selon l'instruction de l'administrateur, l'agent ACSLS HA bascule sur l'autre noeud s'il a la confirmation que la communication avec ACS fonctionne.
Dans des environnements à ACS multiples, il peut être souhaitable que le système ACSLS HA bascule lorsque la communication avec un seul ACS est défaillante. Mais comme n'importe quelle action de basculement interrompt la production sur toutes les bibliothèques connectées, l'administrateur peut préférer limiter l'action de basculement général à ou aux ACS les plus critiques du centre de données. Un enregistrement de stratégie est créé dans ha_acs_list.txt
pour chaque ACS qui requiert une action de basculement de cluster lorsque la communication avec les bibliothèques est perdue. Chaque enregistrement présente deux champs :
ACS Number Fail-over Action (true or false)
Le premier champ est l'ID ACS et le deuxième champ est la valeur boléenne de true ou false. La logique des réglages de la stratégie est la suivante :
Lorsque le deuxième champ est false, l'agent ACSLS HA n'initie pas de basculement de cluster vers l'autre noeud, même si la communication avec ACS est défaillante et qu'elle ne peut pas être restaurée.
Lorsque le deuxième champ est true, l'agent ACSLS HA active le basculement du cluster après que chaque tentative de rétablir la communication à partir du premier noeud a échoué. Le système bascule uniquement si le contact avec les bibliothèques a été confirmé sur l'autre noeud.
L'action par défaut est false
pour tout ACS qui n'est pas énuméré dans ce fichier.
Pour les bibliothèques avec Redundant Electronics (RE), l'agent ACSLS HA tente de passer la communication à l'autre chemin RE avant de recourir au basculement du cluster. Cette commutation par RE s'applique uniquement à une seule SL8500, une SL3000 ou une ancienne 9310 à double LMU. La commutation RE automatique n'est pas tentée sur une bibliothèque partitionnée.
Pingpong
_interval
de basculementL'intervallePingpong_interval
de Solaris Cluster est une propriété de temporisation qui prévient la répétition des basculements si une récupération complète ne peut pas être restaurée après le premier basculement du cluster.
Il s'agit d'une propriété personnalisable par l'utilisateur pour le groupe de ressources ACSLS. La valeur par défaut est réglée sur 20 minutes. Avec ce réglage, le premier basculement a lieu immédiatement lorsque l'agent ACSLS-HA requiert un basculement. Mais si la condition qui risque de déclencher un basculement n'est pas supprimée sur le nouveau noeud de cluster, le prochain basculement est retardé jusqu'à ce que l'intervalle pingpong défini expire. Ceci évite l'emballement inutile du contrôle entre un noeud de cluster et l'autre jusqu'à ce que le problème d'origine ait été résolu.
Pour ajuster le réglage de cette propriété, vous pouvez modifier le nombre par défaut défini dans le fichier $ACS_HOME/acslsha/pingpong_interval
. Ce nombre est exprimé en secondes.
Le réglage par défaut de 1200 secondes est un réglage raisonnable pour la plupart des configurations de bibliothèques moyennes à grandes. La valeur de temporisation optimale pour cette propriété dépend du nombre de LSM présents et des lecteurs de bande présents dans la configuration des bibliothèques. Des configurations de bibliothèques plus grandes ont besoin de plus de temps pour récupérer après un basculement ; ce nombre doit donc être réglé sur un intervalle plus long pour les systèmes dont la configuration comporte plus de dix LSM ou quarante unités, ou les deux.
Un réglage de 1800 (30 minutes) est recommandé pour une configuration de quarante LSM tandis qu'un réglage de 900 (15 minutes) est recommandé pour les bibliothèques plus petites dont la configuration comporte 1 à 4 LSM.
Après avoir modifié la propriété dans le fichier pingpong_interval
, il est nécessaire d'exécuter le script de démarrage d'ACSLS HA.
start_acslsha.sh -hlogical hostname
-gIPMP group
-z acslspool
Cette commande de démarrage peut être exécutée même si le système HA est déjà en cours d'exécution. Il enregistre le nouvel pingpong_interval
sans influer sur le fonctionnement normal de HA.
Les utilisateurs avec tâches administratives peuvent s'enregistrer pour une notification automatique par e-mail des évènements du système, y compris l'initialisation du système et les basculements du cluster ACSLS-HA.
Pour enregistrer ces évènements, les utilisateurs doivent ajouter leur adresse e-mail dans les fichiers respectifs dans le répertoire :
$ACS_HOME/data/external/email_notification/ boot_notification ha_failover_notification
Placer l'adresse e-mail de chaque destinataire prévu sur une seule ligne, sous les remarques en en-tête. Ensuite, à chaque fois que le système s'initialise ou que le cluster HA bascule en mode veille, chaque utilisateur enregistré est averti par e-mail.
Cette fonction part du principe que le service d'envoi d'e-mails a été activé sur le serveur ACSLS et que les restrictions du pare-feu du réseau autorisent la communication par e-mail depuis le centre de données.