Guide de l'utilisateur de Sun Management Center 3.6

Annexe D Règles du logiciel Sun Management Center

Cette annexe répertorie les règles de Sun Management Center pour les modules suivants :

Règles - Concepts

Une règle est un mécanisme de contrôle d'alarme qui permet à des logiques complexes ou spéciales de déterminer le statut d'un hôte ou d'un noeud contrôlé.

Il y a deux types de règles :

Les règles simples sont basées sur la règle rCompare, dans laquelle les propriétés contrôlées sont comparées à la règle. Si la condition de la règle devient vraie (true), une alarme est générée. Par exemple, une règle simple peut être le pourcentage d'espace disque utilisé. Si le pourcentage de disque utilisé est égal ou supérieur au pourcentage spécifié dans la règle, une alarme est générée.
Les règles complexes sont basées sur la réunion du plusieurs conditions. Par exemple, une de ces règles établit qu'une alarme majeure est générée quand les conditions suivantes sont réunies :
- Le disque est occupé à plus de 75%.
- La longueur de file moyenne dépasse 10.
- La file d'attente augmente.
Remarque –
Toutes les règles Solstice SyMON^TM 1. x personnalisées par l'utilisateur doivent être adaptées au nouvel environnement Sun Management Center pour pouvoir être utilisées dans le logiciel Sun Management Center.

Lecteur de noyau

Le tableau suivant répertorie les règles simples du Lecteur de noyau.

Tableau D–1 Règles simples du Lecteur de noyau


Propriété	Description
avg_1min	Charge moyenne au cours de la dernière minute
avg_5min	Charge moyenne au cours des 5 dernières minutes
avg_15min	Charge moyenne au cours des 15 dernières minutes
cpu_delta	Différence entre l'heure courante et l'heure précédente
cpu_idle	Temps d'inactivité de la CPU
cpu_kernel	Temps noyau CPU
cpu_user	Temps utilisateur CPU
cpu_wait	Temps attente CPU
ipctused	Pourcentage de noeuds I utilisés
kpctused	Pourcentage de Ko utilisés
mem-inuse	Mémoire physique en cours d'utilisation (Mo)
numusers	Nombre d'utilisateurs
numsessions	Nombre de sessions d'utilisateur
swap_used	Swap utilisé (en Ko)
wait_io	Détail du temps d'attente CPU
wait_pio	Détail du temps d'attente CPU
wait_swap	Détail du temps d'attente CPU

Le tableau suivant répertorie les règles complexes du Lecteur de noyau.

Tableau D–2 Règles complexes du Lecteur de noyau


ID de la règle	Description	Type d'alarme
rknrd100	Cette règle couvre un événement transitoire. Elle génère une alarme majeure lorsque le disque est occupé à plus de 75%, que la longueur de file moyenne dépasse 10 et que la file d'attente augmente. Cette alarme majeure reste activée jusqu'à ce que le taux d'occupation du disque redescende sous 70% et que la longueur de file d'attente moyenne redescende sous 8.	Majeure
rknrd102	Cette règle couvre un événement transitoire. Elle génère une alarme majeure si 90% de la zone de swap est utilisé. L'événement qui a causé l'alarme reste ouvert jusqu'à ce que la zone swap utilisée redescende sous 80% de la zone de swap totale.	Majeure
rknrd103	Cette règle couvre un événement transitoire. Elle génère une alarme majeure si le swapping et la pagination sont importants pour une CPU donnée. Cela indique qu'une CPU peut être en phase d'emballement. Une alarme majeure est générée lorsque la CPU dépasse 1 swap-out, 10 page-in et 10 page-out par seconde. Cette alarme majeure se prolonge si la CPU dépasse 1 swap-out, 8 page-in et 8 page-out par seconde.	Majeure
rknrd105	Erreur système de fichiers plein. Cette règle recherche un message d'erreur système de fichiers plein dans le `syslog` ( `/var/adm/message`).	Alarme majeure immédiatement fermée
rknrd106	Message d'erreur pas de zone de swap. Cette règle recherche un message d'erreur pas de zone de swap dans le journal système (`/var/adm/message`).	Alarme majeure immédiatement fermée
rknrd400	Cette règle regarde si la charge de la CPU ne demeure pas au-dessus de six par CPU pendant quatre heures.	Informative
rknrd401	Cette règle vérifie s'il y a des disques occupés à plus de 90 % pendant `x` heures. Le champ paramètres indique que la dernière fois où la charge de la CPU était en dessous de six et a été initialisé à une date de l'année 2001.	Informative
rknrd402	Cette règle vérifie si la zone de swap disponible chute en dessous de 10 % pendant `x` heures. Le champ paramètres indique la dernière fois où la charge de la CPU était en dessous de six. Ce champ est initialisé à une date de l'année 2001.	Informative
rknrd403	Cette règle n'est pas prise en charge actuellement.	Informative
rknrd404	Une alarme informative est générée si la règle rknrd401 est déclenchée 4 fois.	Informative
rknrd405	Une alarme informative est générée si la règle rknrd402 est déclenchée 4 fois.	Informative

État de santé

Le tableau suivant répertorie les règles complexes du module État de santé.

Tableau D–3 Règles complexes du module État de santé


ID de la règle	Description	Type d'alarme
rhltm000	Cette règle contrôle s'il y a suffisamment de zone de swap.	Critique, Majeure, Mineure
rhltm001	Chaque fois qu'une CPU doit attendre qu'un verrou s'ouvre, elle gaspille de la puissance. Cet événement est comptabilisé puisque le noyau utilise des verrous mutuellement exclusifs pour synchroniser son fonctionnement et empêcher que plusieurs CPU accèdent simultanément à des régions de données et/ou de code critiques.	Critique, Majeure, Mineure
rhltm002	Le dépassement des délais des appels de procédures distantes NFS peut être associé à des réponses dupliquées après la retransmission de l'appel. Ceci indique que le réseau est OK mais que le serveur est lent à répondre.	Critique, Majeure, Mineure
rhltm003	La longueur de la file d'exécution est divisée par le nombre de CPU car chaque CPU élimine un travail de la file d'exécution par tranche de temps.	Critique, Majeure, Mineure
rhltm004	Un disque occupé ou lent réduit les performances du système et augmente les temps de réponse à l'utilisateur. Cette règle identifie les disques qui sont chargés, ce qui permet de rééquilibrer la charge.	Critique, Majeure, Mineure
rhltm005	Règle de la RAM basée sur le temps de résidence pour une page non référencée. Le système de mémoire virtuelle indique qu'il a besoin de plus de mémoire pour le balayage à la recherche de pages inactives à allouer à d'autres usages.	Critique, Majeure, Mineure
rhltm006	Cette règle fait référence au problème d'allocation de la mémoire du noyau qui survient lorsque les tentatives de connexion ou les connexions réseau sont interrompues inopinément. Il y a deux causes possibles : soit le noyau a atteint l'extrémité de son espace d'adressage soit la liste libre ne contient plus de pages à allouer. Ces défaillances répétées servent avant tout à signaler un problème qui autrement risquerait de passer inaperçu.	Critique, Majeure, Mineure
rhltm007	Il existe un cache global des composants noms-chemins de répertoires. Ce cache est appelé cache de recherche des noms de répertoires ou DNLC (Directory Name Lookup Cache). Si ce cache est absent, les entrées de répertoires doivent être lues sur le disque et balayées pour localiser le bon fichier.	Critique, Majeure, Mineure