8 Affinage des réglages dans ACSLS HA

Ce chapitre explique comment configurer une stratégie de basculement optimale dans un complexe de bibliothèques, comment ajuster l'intervalle pingpong par défaut pour éviter les basculements non souhaités et comment s'enregistrer pour la notification par e-mail des basculements.

Définition d'une stratégie de basculement pour les communications avec les bibliothèques

L'agent ACSLS HA surveille en permanence la communication entre ACSLS et les bibliothèques connectées. Cette communication est cruciale pour le fonctionnement en continu d'ACSLS. Mais l'action à prendre (s'il faut en prendre une) dans le cas d'une défaillance de communication avec les bibliothèques dépend d'une stratégie qui est déterminée par l'administrateur local d'ACSLS HA.

Un tableau de stratégie, $ACS_HOME/acslsha/ha_acs_list.txt, permet à l'administrateur local de définir l'action de basculement souhaitée pour tout ACS qui exige une récupération HA. Lors d'une défaillance de communication avec les bibliothèques, et selon l'instruction de l'administrateur, l'agent ACSLS HA bascule sur l'autre noeud s'il a la confirmation que la communication avec ACS fonctionne.

Dans des environnements à ACS multiples, il peut être souhaitable que le système ACSLS HA bascule lorsque la communication avec un seul ACS est défaillante. Néanmoins, comme n'importe quelle action de basculement interrompt la production sur toutes les bibliothèques connectées, l'administrateur peut préférer limiter l'action de basculement général à ou aux ACS les plus critiques du centre de données. Un enregistrement de stratégie est créé dans ha_acs_list.txt pour chaque ACS qui requiert une action de basculement de cluster lorsque la communication avec les bibliothèques est perdue. Chaque enregistrement présente deux champs :

ACS Number   Fail-over Action (true or false)

Le premier champ est l'ID ACS et le deuxième champ est la valeur boléenne de true ou false. La logique des réglages de la stratégie est la suivante :

  • Lorsque le deuxième champ est false, l'agent ACSLS HA n'initie pas de basculement de cluster vers l'autre noeud, même si la communication avec ACS est défaillante et qu'elle ne peut pas être restaurée.

  • Lorsque le deuxième champ est true, l'agent ACSLS HA active le basculement du cluster après que chaque tentative de rétablir la communication à partir du premier noeud a échoué. Le système bascule uniquement si le contact avec les bibliothèques a été confirmé sur l'autre noeud.

L'action par défaut est false pour tout ACS qui n'est pas énuméré dans ce fichier.

Bibliothèques avec Redundant Electronics (RE)

Pour les bibliothèques avec Redundant Electronics (RE), l'agent ACSLS HA tente de passer la communication à l'autre chemin RE avant de recourir au basculement du cluster. Cette commutation par RE s'applique uniquement à une seule SL8500, une SL3000 ou une ancienne 9310 à double LMU. La commutation RE automatique n'est pas tentée sur une bibliothèque partitionnée.

Réglage de l'intervalle Pingpong_interval de basculement

L'intervallePingpong_interval de Solaris Cluster est une propriété de temporisation qui prévient la répétition des basculements si une récupération complète ne peut pas être restaurée après le premier basculement du cluster.

Il s'agit d'une propriété personnalisable par l'utilisateur pour le groupe de ressources ACSLS. La valeur par défaut est réglée sur 20 minutes. Avec ce réglage, le premier basculement a lieu immédiatement lorsque l'agent ACSLS HA requiert un basculement. Mais si la condition qui risque de déclencher un basculement n'est pas supprimée sur le nouveau noeud de cluster, le prochain basculement est retardé jusqu'à ce que l'intervalle pingpong défini expire. Ceci évite l'emballement inutile du contrôle entre un noeud de cluster et l'autre jusqu'à ce que le problème d'origine ait été résolu.

Pour modifier le réglage par défaut de cette propriété, modifiez le nombre par défaut défini dans le fichier $ACS_HOME/acslsha/pingpong_interval. Ce nombre est exprimé en secondes.

Le réglage par défaut de 1200 secondes est un réglage raisonnable pour la plupart des configurations de bibliothèques moyennes à grandes. La valeur de temporisation optimale pour cette propriété dépend du nombre de LSM présents et des lecteurs de bande présents dans la configuration des bibliothèques. Des configurations de bibliothèques plus grandes ont besoin de plus de temps pour récupérer après un basculement ; ce nombre doit donc être réglé sur un intervalle plus long pour les systèmes dont la configuration comporte plus de dix LSM ou quarante unités, ou les deux.

Un réglage de 1800 (30 minutes) est recommandé pour une configuration de quarante LSM tandis qu'un réglage de 900 (15 minutes) est recommandé pour les bibliothèques plus petites dont la configuration comporte 1 à 4 LSM.

Les modifications apportées ici sont appliquées tant que vous ne reconfigurez pas ACSLS HA avec la commande acsAgt configure.

# cd /opt/ACSLSHA/util
# ./acsAgt configure

Cette commande peut être activée même si le groupe de ressources acsls-rg est déjà actif. Elle enregistre le nouveau paramètre par défaut sans influer sur le fonctionnement normal de HA.

Il est possible de modifier le paramètre pingpong_interval de manière dynamique à des fins de test à l'aide de acsAgt pingpong. La valeur définie avec cette commande reste appliquée jusqu'au redémarrage du groupe de ressources à l'aide de acsAgt configure.

Enregistrement pour la notification par e-mail des événements système

Les utilisateurs avec tâches administratives peuvent s'enregistrer pour une notification automatique par e-mail des évènements du système, y compris l'initialisation du système et les basculements du cluster ACSLS HA.

Pour enregistrer ces évènements, les utilisateurs doivent ajouter leur adresse e-mail dans les fichiers respectifs dans le répertoire :

$ACS_HOME/data/external/email_notification/
   boot_notification
   ha_failover_notification

Placer l'adresse e-mail de chaque destinataire prévu sur une seule ligne, sous les remarques en en-tête. Ensuite, à chaque fois que le système s'initialise ou que le cluster HA bascule en mode veille, chaque utilisateur enregistré est averti par e-mail.

Cette fonction part du principe que le service d'envoi d'e-mails a été activé sur le serveur ACSLS et que les restrictions du pare-feu du réseau autorisent la communication par e-mail depuis le centre de données.