La détection des pannes pour le service de données de Prise en charge d'Oracle RAC est fournie par les détecteurs de pannes pour les ressources suivantes :
Ressource de groupe de périphériques évolutif
Ressource de point de montage de système de fichiers évolutif
Chaque détecteur de pannes est contenu dans une ressource dont le type est indiqué dans le tableau suivant.
|
Les propriétés standard et les propriétés d'extension de ces ressources déterminent le comportement des détecteurs de pannes. Les valeurs par défaut de ces propriétés déterminent le comportement prédéfini des détecteurs de pannes. Le comportement prédéfini doit être adapté à la plupart des installations Oracle Solaris Cluster. Vous devez donc régler les détecteurs de pannes Prise en charge d'Oracle RAC uniquement si vous devez modifier le comportement prédéfini.
Le réglage des détecteurs de pannes Prise en charge d'Oracle RAC implique les tâches suivantes :
Paramétrage de l'intervalle entre les tests du détecteur de pannes
Paramétrage du délai d'attente pour les tests du détecteur de pannes
Définition des critères pour les pannes persistantes
Spécification du comportement de basculement d'une ressource
Pour plus d'informations, reportez-vous à la section Réglage des détecteurs de pannes pour les services de données d’Oracle Solaris Cluster du manuel Guide de planification et d’administration des services de données d’Oracle Solaris Cluster 4.3. Pour des informations sur les détecteurs de pannes de Prise en charge d'Oracle RAC dont vous avez besoin pour effectuer ces tâches, reportez-vous aux sous-sections suivantes :
Fonctionnement du détecteur de pannes pour un groupe de périphériques évolutif
Fonctionnement du détecteur de pannes pour les points de montage de système de fichiers évolutif
Obtention de dumps noyau pour le dépannage des délais d'attente de SGBD
Par défaut, le détecteur de pannes contrôle tous les volumes logiques dans le groupe de périphériques que la ressource représente. Si vous avez besoin de ne contrôler qu'un sous-ensemble de volumes logiques d'un groupe de périphériques, définissez la propriété d'extension LogicalDeviceList.
Le statut du groupe de périphériques est dérivé des statuts des volumes logiques individuels qui sont contrôlés. Si tous les volumes logiques contrôlés sont fonctionnels, le groupe de périphériques est fonctionnel. Si un volume logique contrôlé est défaillant, le groupe de périphériques est défaillant. Si un groupe de périphériques apparaît défaillant, le contrôle de la ressource représentant le groupe est arrêté et la ressource est placée en état désactivé.
Le statut d'un volume logique individuel est obtenu en interrogeant le gestionnaire de volumes du volume. Lorsque le statut d'un volume Solaris Volume Manager pour Sun Cluster ne peut pas être déterminé à partir d'une requête, le détecteur de pannes effectue des opérations d'entrée/de sortie (E/S) de fichier pour déterminer l'état.
Si une reconfiguration de la composition du cluster utilisateur entraîne l'apparition d'une erreur d'E/S, le contrôle des ressources de groupe de périphériques par les détecteurs de pannes est suspendu tandis que les reconfigurations de moniteur de composition du cluster utilisateur sont en cours.
Pour déterminer si le système de fichiers monté est disponible, le détecteur de pannes exécute des opérations d'E/S, par exemple l'ouverture, la lecture et l'écriture d'un fichier de test sur le système de fichiers. Si une opération d'E/S n'est pas effectuée pendant la période d'attente, le détecteur de pannes signale une erreur. Pour spécifier le délai d'attente des opérations d'E/S, définissez la propriété d'extension IOTimeout.
La réponse à une erreur dépend du type de système de fichiers, comme suit :
Si le système de fichiers est un système de fichiers NFS sur un périphérique NAS qualifié, la réponse est la suivante :
Le contrôle de la ressource est arrêté sur le noeud de cluster en cours.
La ressource est placée en état désactivé sur le noeud de cluster actif, provoquant le démontage du système de fichiers de ce noeud.
Si le système de fichier est un système de fichiers partagé StorageTek QFS, la réponse est la suivante :
Si le noeud de cluster sur lequel l'erreur est survenue héberge la ressource de serveur de métadonnées, celle-ci est basculée vers un autre noeud.
Le système de fichiers est démonté.
Si la tentative de basculement échoue, le système de fichiers reste démonté et un avertissement est émis.
Pour faciliter le dépannage des délais d'attente SGBD inexpliqués, vous pouvez permettre au détecteur de pannes de créer un dump noyau lorsqu'un dépassement du délai d'attente de l'analyse se produit. Le contenu du dump noyau fait référence au processus du détecteur de pannes. Le détecteur de pannes crée un dump noyau dans le répertoire root (/). Pour permettre au détecteur de pannes de créer un dump noyau, servez-vous de la commande coreadm pour activer les dumps noyau de type set-id.
# coreadm -g /var/cores/%f.%n.%p.core -e global -e process \ -e global-setid -e proc-setid -e log
Pour plus d'informations, reportez-vous à la page de manuel coreadm(1M).