Guide de l'utilisateur de Sun Management Center 3.6

Annexe D Règles du logiciel Sun Management Center

Cette annexe répertorie les règles de Sun Management Center pour les modules suivants :

Règles - Concepts

Une règle est un mécanisme de contrôle d'alarme qui permet à des logiques complexes ou spéciales de déterminer le statut d'un hôte ou d'un noeud contrôlé.

Il y a deux types de règles :

Lecteur de noyau

Le tableau suivant répertorie les règles simples du Lecteur de noyau.

Tableau D–1 Règles simples du Lecteur de noyau

Propriété 

Description 

avg_1min 

Charge moyenne au cours de la dernière minute 

avg_5min 

Charge moyenne au cours des 5 dernières minutes 

avg_15min 

Charge moyenne au cours des 15 dernières minutes 

cpu_delta 

Différence entre l'heure courante et l'heure précédente 

cpu_idle 

Temps d'inactivité de la CPU 

cpu_kernel 

Temps noyau CPU 

cpu_user 

Temps utilisateur CPU 

cpu_wait 

Temps attente CPU 

ipctused 

Pourcentage de noeuds I utilisés 

kpctused 

Pourcentage de Ko utilisés 

mem-inuse 

Mémoire physique en cours d'utilisation (Mo) 

numusers 

Nombre d'utilisateurs 

numsessions 

Nombre de sessions d'utilisateur 

swap_used 

Swap utilisé (en Ko) 

wait_io 

Détail du temps d'attente CPU 

wait_pio 

Détail du temps d'attente CPU 

wait_swap 

Détail du temps d'attente CPU 

Le tableau suivant répertorie les règles complexes du Lecteur de noyau.

Tableau D–2 Règles complexes du Lecteur de noyau

ID de la règle 

Description 

Type d'alarme  

rknrd100

Cette règle couvre un événement transitoire. Elle génère une alarme majeure lorsque le disque est occupé à plus de 75%, que la longueur de file moyenne dépasse 10 et que la file d'attente augmente. Cette alarme majeure reste activée jusqu'à ce que le taux d'occupation du disque redescende sous 70% et que la longueur de file d'attente moyenne redescende sous 8.

Majeure 

rknrd102

Cette règle couvre un événement transitoire. Elle génère une alarme majeure si 90% de la zone de swap est utilisé. L'événement qui a causé l'alarme reste ouvert jusqu'à ce que la zone swap utilisée redescende sous 80% de la zone de swap totale.

Majeure 

rknrd103

Cette règle couvre un événement transitoire. Elle génère une alarme majeure si le swapping et la pagination sont importants pour une CPU donnée. Cela indique qu'une CPU peut être en phase d'emballement. Une alarme majeure est générée lorsque la CPU dépasse 1 swap-out, 10 page-in et 10 page-out par seconde. Cette alarme majeure se prolonge si la CPU dépasse 1 swap-out, 8 page-in et 8 page-out par seconde.

Majeure 

rknrd105

Erreur système de fichiers plein. Cette règle recherche un message d'erreur système de fichiers plein dans le syslog ( /var/adm/message).

Alarme majeure immédiatement fermée 

rknrd106

Message d'erreur pas de zone de swap. Cette règle recherche un message d'erreur pas de zone de swap dans le journal système (/var/adm/message).

Alarme majeure immédiatement fermée 

rknrd400

Cette règle regarde si la charge de la CPU ne demeure pas au-dessus de six par CPU pendant quatre heures.  

Informative 

rknrd401

Cette règle vérifie s'il y a des disques occupés à plus de 90 % pendant x heures. Le champ paramètres indique que la dernière fois où la charge de la CPU était en dessous de six et a été initialisé à une date de l'année 2001.

Informative 

rknrd402

Cette règle vérifie si la zone de swap disponible chute en dessous de 10 % pendant x heures. Le champ paramètres indique la dernière fois où la charge de la CPU était en dessous de six. Ce champ est initialisé à une date de l'année 2001.

Informative  

rknrd403 

Cette règle n'est pas prise en charge actuellement. 

Informative 

rknrd404

Une alarme informative est générée si la règle rknrd401 est déclenchée 4 fois.  

Informative 

rknrd405

Une alarme informative est générée si la règle rknrd402 est déclenchée 4 fois.  

Informative 

État de santé

Le tableau suivant répertorie les règles complexes du module État de santé.

Tableau D–3 Règles complexes du module État de santé

ID de la règle 

Description 

Type d'alarme  

rhltm000

Cette règle contrôle s'il y a suffisamment de zone de swap.

Critique, Majeure, Mineure 

rhltm001

Chaque fois qu'une CPU doit attendre qu'un verrou s'ouvre, elle gaspille de la puissance. Cet événement est comptabilisé puisque le noyau utilise des verrous mutuellement exclusifs pour synchroniser son fonctionnement et empêcher que plusieurs CPU accèdent simultanément à des régions de données et/ou de code critiques.

Critique, Majeure, Mineure 

rhltm002

Le dépassement des délais des appels de procédures distantes NFS peut être associé à des réponses dupliquées après la retransmission de l'appel. Ceci indique que le réseau est OK mais que le serveur est lent à répondre.

Critique, Majeure, Mineure 

rhltm003

La longueur de la file d'exécution est divisée par le nombre de CPU car chaque CPU élimine un travail de la file d'exécution par tranche de temps.

Critique, Majeure, Mineure 

rhltm004

Un disque occupé ou lent réduit les performances du système et augmente les temps de réponse à l'utilisateur. Cette règle identifie les disques qui sont chargés, ce qui permet de rééquilibrer la charge.

Critique, Majeure, Mineure 

rhltm005

Règle de la RAM basée sur le temps de résidence pour une page non référencée. Le système de mémoire virtuelle indique qu'il a besoin de plus de mémoire pour le balayage à la recherche de pages inactives à allouer à d'autres usages.

Critique, Majeure, Mineure 

rhltm006

Cette règle fait référence au problème d'allocation de la mémoire du noyau qui survient lorsque les tentatives de connexion ou les connexions réseau sont interrompues inopinément. Il y a deux causes possibles : soit le noyau a atteint l'extrémité de son espace d'adressage soit la liste libre ne contient plus de pages à allouer. Ces défaillances répétées servent avant tout à signaler un problème qui autrement risquerait de passer inaperçu.

Critique, Majeure, Mineure 

rhltm007

Il existe un cache global des composants noms-chemins de répertoires. Ce cache est appelé cache de recherche des noms de répertoires ou DNLC (Directory Name Lookup Cache). Si ce cache est absent, les entrées de répertoires doivent être lues sur le disque et balayées pour localiser le bon fichier.

Critique, Majeure, Mineure