Guide d'administration et de planification des services de données d'Oracle® Solaris Cluster

Quitter la vue de l'impression

Mis à jour : Septembre 2014
 
 

Surveillance des entités gérées par HAStoragePlus

Toutes les entités gérées par le type de ressource HAStoragePlus sont surveillées. Le type de ressource SUNWHAStoragePlus comporte un détecteur de pannes permettant de surveiller l'intégrité des entités gérées par la ressource HASP, notamment les périphériques globaux, les systèmes de fichiers et les pools de stockage ZFS. Le détecteur de pannes exécute des tests de détection de pannes à intervalles réguliers. Si l'une des entités devient indisponible, la ressource est redémarrée ou un basculement vers un autre noeud a lieu. Si plusieurs entités sont surveillées, le détecteur de pannes teste toutes les entités simultanément. Assurez-vous que toutes les modifications de configuration apportées aux entités gérées sont terminées avant d'activer la surveillance.


Remarque -  La version 9 du détecteur de pannes de la ressource HAStoragePlus teste les périphériques et les systèmes de fichiers gérés en effectuant des opérations de lecture et d'écriture sur les systèmes de fichiers. Si une opération de lecture est bloquée par un logiciel quelconque sur la pile d'E/S et que la mise en ligne de la ressource HAStoragePlus est obligatoire, l'utilisateur doit désactiver le détecteur de pannes. Vous devez par exemple désactiver la surveillance de la ressource HAStoragePlus qui gère les volumes de réplication à distance d'Availability Suite parce qu'Availability Suite d'Oracle bloque la lecture à partir de tous les volumes bitmap ou volumes de données présentant l'état NEED SYNC. La ressource HAStoragePlus qui gère les volumes d'Availability Suite doit en permanence être en ligne.

Pour plus d'informations sur les propriétés qui permettent la surveillance des entités gérées, reportez-vous à la page de manuel SUNW.HAStoragePlus(5).

Pour des instructions sur l'activation et la désactivation de la surveillance des entités gérées, reportez-vous à la section Activation d'un détecteur de pannes de ressources.

Selon le type d'entité géré, le détecteur de pannes teste la cible en effectuant des opérations de lecture et d'écriture sur celle-ci. Si plusieurs entités sont surveillées, le détecteur de pannes teste toutes les entités simultanément.

Table 2-2  Vérifications effectuées par le détecteur de pannes
Entité surveillée
Vérifications effectuées par le détecteur de pannes
Périphérique global
  • Le groupe de périphériques est en ligne ou dégradé.

  • Le périphérique est accessible en lecture.

Groupe de périphériques brut
  • Le groupe de périphériques est en ligne ou dégradé.

  • Le chemin d'accès (/dev/global/rdsk/device) de chaque périphérique du groupe de périphériques est disponible.

  • Les partitions de chaque périphérique sont accessibles en lecture.

Groupes de périphériques Solaris Volume Manager
  • Le groupe de périphériques est en ligne ou dégradé.

  • Le chemin d'accès de l'ensemble de métadonnées (/dev/md/metaset) est valide.

  • Etat de Solaris Volume Manager signalé par le noeud principal du groupe de périphériques :

    • Le métapériphérique non mis en miroir n'indique aucun des états d'erreur suivants : Maintenance requise, Last Erred ou Non disponible.

    • Au moins un sous-miroir d'un miroir n'indique pas d'état d'erreur. Une erreur affectant certains des sous-miroirs, mais pas tous, est considérée comme une erreur partielle.

  • Le métapériphérique non mis en miroir est accessible en lecture à partir du noeud principal.

  • Certains sous-miroirs d'un miroir sont accessibles en lecture. Une erreur affectant certains des sous-miroirs, mais pas tous, est considérée comme une erreur partielle.

Systèmes de fichiers (y compris UFS, QFS et PxFS)
  • Le système de fichiers est monté.

  • Tous les périphérique subordonnés au système de fichiers sont accessibles en lecture.

  • Le système de fichiers est accessible en lecture su la propriété IOOption est définie sur ReadOnly.

  • Le système de fichiers est accessible en lecture si la propriété IOOption est définie sur ReadWrite.

  • Si le système de fichiers est monté en lecture seule mais que la propriété IOOption est définie sur ReadWrite, le détecteur de pannes émet un avertissement, puis tente d'y accéder en lecture (et non en écriture).

  • Pour éviter que la ressource HAStoragePlus bascule hors ligne lorsqu'un système de fichiers atteint son quota, définissez la propriété IOOption sur ReadOnly. L'option ReadOnly garantit que le détecteur de pannes ne tentera pas d'écrire vers le système de fichiers.

Pool de stockage ZFS
  • L'état du pool est OK ou Dégradé.

  • Tous les systèmes de fichiers non hérités sont montés.

  • Tous les systèmes de fichiers non hérités sont accessibles en lecture si la propriété IOOption est définie sur ReadOnly.

  • Tous les systèmes de fichiers non hérités sont accessibles en écriture si la propriété IOOption est définie sur ReadWrite.

  • Si un système de fichiers non hérité est monté en lecture seule mais que la propriété IOOption est définie sur ReadWrite, le détecteur de pannes émet un avertissement, puis tente d'y accéder en lecture (et non en écriture).

  • Pour éviter que la ressource HAStoragePlus bascule hors ligne lorsqu'un système de fichiers atteint son quota, définissez la propriété IOOption sur ReadOnly. L'option ReadOnly garantit que le détecteur de pannes ne tentera pas d'écrire vers le système de fichiers.

Remarque -  Lorsque toutes les connexions à un périphérique de stockage ZFS de premier niveau sont interrompues, les requêtes concernant le pool de stockage ZFS ou le système de fichiers associé sont bloquées. Pour empêcher le blocage du détecteur de pannes, vous devez définir la propriété fail_mode du pool de stockage ZFS sur panic.

Pour des instructions sur l'activation d'un détecteur de pannes de ressources, reportez-vous à la section Activation d'un détecteur de pannes de ressources.

Dépannage de la surveillance des entités gérées

Si la surveillance n'est pas activée sur les entités gérées, effectuez les opérations de dépannage suivantes :

  1. Vérifiez que le processus hastorageplus_probe est en cours d'exécution.

  2. Recherchez les éventuels messages d'erreur sur la console.

  3. Activez l'envoi de messages de débogage vers le fichier syslog.

    # mkdir -p /var/cluster/rgm/rt/SUNW.HAStoragePlus:9
    # echo 9 > /var/cluster/rgm/rt/SUNW.HAStoragePlus:9/loglevel

    Contrôlez également le fichier /etc/syslog.conf pour vous assurer que les messages de niveau de fonction daemon.debug sont consignés dans le fichier /var/adm/messages. Si elle n'y figure pas encore, ajoutez l'entrée daemon.debug à l'action /var/adm/messages.