Guide de l'utilisateur de Sun Management Center 3.5

Annexe D Règles du logiciel Sun Management Center

Cette annexe répertorie les règles de Sun Management Center pour les modules suivants :

Règles - Concepts

Une règle est un mécanisme de contrôle d'alarme qui permet à des logiques complexes ou spéciales de déterminer le statut d'un hôte ou d'un nud surveillé.

Il y a deux types de règles :

Lecteur de noyau

Le tableau suivant répertorie les règles simples du Lecteur de noyau.

Tableau D–1 Règles simples du Lecteur de noyau

Propriété  

Description 

avg_1min  

Charge moyenne au cours de la dernière minute 

avg_5min  

Charge moyenne au cours des 5 dernières minutes 

avg_15min  

Charge moyenne au cours des 15 dernières minutes 

cpu_delta  

Différence entre l'heure courante et l'heure précédente 

cpu_idle  

Temps d'inactivité de l'UC 

cpu_kernel  

Temps noyau UC 

cpu_user  

Temps utilisateur UC 

cpu_wait  

Temps attente UC 

ipctused  

Pourcentage de noeuds I utilisés  

kpctused  

Pourcentage de Ko utilisés  

mem-inuse  

Mémoire physique en cours d'utilisation (Mo) 

numusers  

Nombre d'utilisateurs  

numsessions  

Nombre de sessions d'utilisateur  

swap_used  

Swap utilisé (en Ko) 

wait_io  

Détail du temps d'attente UC  

wait_pio  

Détail du temps d'attente UC  

wait_swap  

Détail du temps d'attente UC  

Le tableau suivant répertorie les règles complexes du Lecteur de noyau.

Tableau D–2 Règles complexes du Lecteur de noyau

ID de la règle  

Description 

Type d'alarme  

rknrd100

Cette règle couvre un événement transitoire. Elle génère une alarme majeure lorsque le disque est occupé à plus de 75%, que la longueur de file moyenne dépasse 10 et que la file d'attente augmente. Cette alarme majeure reste activée jusqu'à ce que le taux d'occupation du disque redescende sous 70% et que la longueur de file d'attente moyenne redescende sous 8.

Majeure 

rknrd102

Cette règle couvre un événement transitoire. Elle génère une alarme majeure si 90% de la zone de swap est utilisé. L'événement qui a causé l'alarme reste ouvert jusqu'à ce que la zone swap utilisée redescende sous 80% de la zone de swap totale.

Majeure 

rknrd103

Cette règle couvre un événement transitoire. Elle génère une alarme majeure si le swapping et la pagination sont importants pour une UC donnée. Cela indique qu'une UC peut être en phase d'emballement. Une alarme majeure est générée lorsque l'UC dépasse 1 swap-out, 10 page-in et 10 page-out par seconde. Cette alarme majeure se prolonge si l'UC dépasse 1 swap-out, 8 page-in et 8 page-out par seconde.

Majeure 

rknrd105

Erreur système de fichiers plein. Cette règle recherche un message d'erreur système de fichiers plein dans le syslog (/var/adm/message).

Alarme majeure immédiatement fermée  

rknrd106

Erreur pas de zone de swap. Cette règle recherche un message d'erreur pas de zone de swap dans le journal système (/var/adm/message).

Alarme majeure immédiatement fermée  

rknrd400

Cette règle regarde si la charge UC ne demeure pas au-dessus de six par UC pendant quatre heures. 

Informative  

rknrd401

Cette règle regarde s'il y a des disques occupés à plus de 90% pendant x heures. Le champ paramètres indique que la dernière fois où la charge de l'UC était en dessous de six et a été initialisée était en 2001.

Informative  

rknrd402

Cette règle regarde si la zone de swap disponible chute en dessous de 10% pendant x heures. Le champ paramètres indique la dernière fois où la charge de l'UC était en dessous de six. Ce champ est initialisé à une date de l'année 2001.

Informative  

rknrd403  

Cette règle n'est pas prise en charge actuellement. 

Informative  

rknrd404

Une alarme informative est générée si la règle rknrd401 est déclenchée 4 fois. 

Informative  

rknrd405

Une alarme informative est générée si la règle rknrd402 est déclenchée 4 fois. 

Informative  

Etat de santé

Le tableau suivant répertorie les règles complexes du module Etat de santé.

Tableau D–3 Règles complexes du module Etat de santé

ID de la règle  

Description 

Type d'alarme  

rhltm000

Cette règle contrôle s'il y a suffisamment de zone de swap.

Critique, Majeure, Mineure 

rhltm001

Chaque fois qu'une UC doit attendre qu'un verrou s'ouvre, elle gaspille de la puissance. Cet événement est comptabilisé puisque le noyau utilise des verrous mutuellement exclusifs pour synchroniser son fonctionnement et empêcher que plusieurs UC accèdent simultanément à des régions de données et/ou de code critiques.

Critique, Majeure, Mineure 

rhltm002

Le dépassement des délais des appels de procédures distantes NFS peut être associé à des réponses dupliquées après la retransmission de l'appel. Ceci indique que le réseau est OK mais que le serveur est lent à répondre.

Critique, Majeure, Mineure 

rhltm003

La longueur de la file d'exécution est divisée par le nombre d'UC car chaque UC élimine un travail de la file d'exécution par tranche de temps.

Critique, Majeure, Mineure 

rhltm004

Un disque occupé ou lent réduit le rendement du système et augmente les temps de réponse à l'utilisateur. Cette règle identifie les disques qui sont chargés, ce qui permet de rééquilibrer la charge.

Critique, Majeure, Mineure  

rhltm005

Règle de la RAM basée sur le temps de résidence pour une page non-référencée. Le système de mémoire virtuelle indique qu'il a besoin de plus de mémoire pour le balayage à la recherche de pages inactives à allouer à d'autres usages.

Critique, Majeure, Mineure 

rhltm006

Cette règle fait référence au problème d'allocation de la mémoire du noyau qui survient lorsque les tentatives de connexion ou les connexions réseau sont interrompues inopinément. Il y a deux causes possibles : soit le noyau a atteint l'extrémité de son espace d'adressage soit la liste libre ne contient plus de pages à allouer. Ces défaillances répétées servent avant tout à signaler un problème qui autrement risquerait de passer inaperçu.

Critique, Majeure, Mineure  

rhltm007

Il existe un cache global des composants noms-chemins de répertoires. Ce cache est appelé cache de recherche des noms de répertoires ou DNLC (Directory Name Lookup Cache). Si ce cache est absent, les entrées de répertoires doivent être lues sur le disque et balayées pour localiser le bon fichier.

Critique, Majeure, Mineure