Guide du service de données Oracle® Solaris Cluster pour Oracle Real Application Clusters

Quitter la vue de l'impression

Mis à jour : Avril 2016
 
 

Panne d'un groupe de ressources de structure de gestionnaire de volumes multipropriétaire

Cette section décrit les problèmes qui peuvent affecter le groupe de ressources de structure de gestionnaire de volumes multipropriétaire.

Grave erreur de noeud au cours de l'initialisation de la structure de gestionnaire de volumes multipropriétaire

Si une erreur fatale survient lors de l'initialisation de la structure de gestionnaire de volumes multipropriétaire, de graves erreurs de noeuds se produisent avec un message d'erreur similaire à celui qui suit :


Remarque -  Quand le noeud est un noeud de cluster global, une grave erreur de noeud bloque la machine tout entière.

Echec de démarrage du démon vucmmd

Le démon de structure de gestionnaire de volumes multipropriétaire, vucmmd, gère la reconfiguration de la structure de gestionnaire de volumes multipropriétaire. Quand un cluster est initialisé ou réinitialisé, le démon n'est démarré qu'une fois tous les composants de la structure de gestionnaire de volumes multipropriétaire sont validés. Si la validation d'un composant sur un noeud échoue, le démon vucmmd ne parvient pas à démarrer sur le noeud.

Ce problème est généralement attribué aux raisons suivantes :

  • Une erreur s'est produite pendant la reconfiguration précédente d'un composant de la structure de gestionnaire de volumes multipropriétaire.

  • Le délai d'attente d'une étape dans une reconfiguration précédente de la structure de gestionnaire de volumes multipropriétaire a été dépassé, provoquant une erreur grave du noeud sur lequel le délai a été dépassé.

Pour obtenir des instructions sur la résolution du problème, reportez-vous à la section Récupération après un échec du démon vucmmd ou d'un composant associé.

Récupération après un échec du démon vucmmd ou d'un composant associé

  1. Pour déterminer la cause du problème, examinez les fichiers journaux des reconfigurations de structure de gestionnaire de volumes multipropriétaire ainsi que le fichier de messages système.

    Pour connaître l'emplacement des fichiers journaux des reconfigurations de structure de gestionnaire de volumes multipropriétaire, reportez-vous à la section Sources des informations de diagnostic.

    Dans ces fichiers, commencez par examiner le message le plus récent et suivez l'ordre chronologique inverse jusqu'à identifier la cause du problème.

    Pour obtenir plus d'informations sur les messages d'erreur pouvant indiquer la cause d'erreurs de reconfigurations, reportez-vous au manuel Oracle Solaris Cluster Error Messages Guide.

  2. Corrigez le problème à l'origine de l'erreur renvoyée par le composant à la structure de gestionnaire de volumes multipropriétaire.
  3. Si la solution au problème nécessite une réinitialisation, réinitialisez le noeud sur lequel le problème s'est produit.

    Seules certaines solutions nécessitent une réinitialisation. Par exemple, l'augmentation de la quantité de mémoire partagée nécessite une réinitialisation. En revanche, l'augmentation de la valeur de délai d'attente d'une étape ne nécessite pas de réinitialisation.

    Pour plus d'informations sur la réinitialisation d'un nœud, reportez-vous à la section Arrêt et initialisation d’un noeud unique dans un cluster du manuel Guide d’administration système d’Oracle Solaris Cluster 4.3.

  4. Sur le noeud où le problème s'est produit, faites passer le groupe de ressources de structure de gestionnaire de volumes multipropriétaire hors ligne puis en ligne.

    Cette étape actualise le groupe de ressources avec les modifications apportées à la configuration.

    1. Octroyez-vous le rôle root ou un rôle octroyant l'autorisation RBAC solaris.cluster.admin.
    2. Saisissez la commande pour faire passer en mode hors ligne le groupe de ressources de structure de gestionnaire de volumes multipropriétaire et ses ressources.
      # clresourcegroup offline -n node vucmm-fmwk-rg
      –n node

      Spécifie le nom ou l'identificateur (ID) du noeud sur lequel le problème s'est produit.

      vucmm-fmwk-rg

      Spécifie le nom du groupe de ressources qui doit être mis hors ligne.

    3. Saisissez la commande pour faire passer en ligne et en mode de gestion le groupe de ressources de structure de gestionnaire de volumes multipropriétaire et ses ressources.
      # clresourcegroup online -eM -n node vucmm-fmwk-rg