Guide d'administration de Sun N1 System Manager 1.0

Gestion des dépassements de seuils

Si une valeur de seuil est dépassée pour un attribut de contrôle, un événement est généré. Vous pouvez créer des règles de notification pour être informé de ce type d'événement. La notification de dépassement de seuil ou les avertissement s'effectue via le journal de consignation des événements. La visualisation de ce journal est plus simple à partir de l'interface de navigateur.

Il est possible de créer des notifications à l'aide de la commande create notification et de les envoyer par messagerie ou pager à leur destinataire. Reportez-vous à la section create notification pour le détail de la syntaxe.

Identification des dépassements de seuil de SE et de matériel

Si la valeur d'un attribut de maintenance du matériel ou d'utilisation des ressources de SE contrôlé dépasse la valeur autorisée du seuil, un journal d'événements indique que le seuil en question a été dépassé. Ce journal est alors accessible via l'interface de navigateur. Le délai précédant la disponibilité de celui-ci dans l'interface de navigateur varie suivant l'intervalle d'interrogation défini pour l'attribut :

t + polling interval

L'heure a laquelle s'est produit le dépassement est indiquée par t. L'intervalle d'interrogation est exprimé en secondes et correspond au délai écoulé entre les interrogations successives de l'attribut contrôlé. Pour plus d'informations à ce sujet, consultez la section Intervalles d''interrogation . Utilisez la commande show log pour vérifier si le journal d'événements a été généré :


N1-ok> show log
Id            Date                       Severity    Subject     Message
.
. 
10            2004-11-22T01:45:02-0800   WARNING     Sun_V20z_XG041105786
A critical high threshold was violated for server Sun_V20z_XG041105786: 
Attribute cpu0.vtt-s3 Value 1.32

13            2004-11-22T01:50:08-0800   WARNING     Sun_V20z_XG041105786
A normal low  threshold was violated for server Sun_V20z_XG041105786: 
Attribute cpu0.vtt-s3 Value 1.2

Identification des problèmes de connexion réseau

Si les adresses IP de l'agent de contrôle du serveur de gestion, ou du réseau de données sont inaccessibles, un événement signale un problème de connexion réseau. Cela fait partie du contrôle d'accessibilité du réseau. Pour plus d'informations à ce sujet, consultez la section Contrôle de l'accessibilité du réseau . Ce journal est alors accessible via l'interface de navigateur. Le délai précédant la disponibilité de celui-ci dans l'interface de navigateur varie suivant l'intervalle d'interrogation défini pour l'attribut :

t + polling interval

L'heure à laquelle s'est produit le dépassement est indiquée par t. L'intervalle d'interrogation est exprimé en secondes et correspond au délai écoulé entre les interrogations successives de l'attribut contrôlé. Pour plus d'informations à ce sujet, consultez la section Intervalles d''interrogation . Utilisez la commande show log pour vérifier si le journal d'événements a été généré :


N1-ok> show log
.
.
13            2004-11-19T10:24:33-0800   INFORMATION  Sun_V20z_XGserial_number
Ip Address /<ip_address> on server Sun_V20z_XGserial_number is unreachable.

14            2004-11-19T10:24:38-0800   INFORMATION  Sun_V20z_XGserial_number
Ip Address /<ip_address> on server Sun_V20z_XGserial_number is unreachable.

Identification des problèmes de contrôle

Si la fonction de contrôle est activée, comme indiqué à la section Activation du contrôle et si l'état retourné pour les commandes show server ou show group est unknown ou unreachable, le serveur ou le groupe de serveur concerné n'est plus accessible à des fins de contrôle. Si l'état unknown ou unreachable persiste après moins de cinq intervalles d'interrogation, il est possible qu'un problème réseau provisoire soit survenu. En revanche, si cet état persiste après plus de cinq intervalles d'interrogation, il est possible que le contrôle n'ait pas abouti. Cela peut résulter d'un dysfonctionnement de l'agent de contrôle.

Un horodatage est fourni dans la sortie des données de contrôle. Le rapport existant entre cet horodatage et la valeur de l'intervalle d'interrogation peut également permettre d'identifier une erreur au niveau de l'agent de contrôle. Si la sortie contrôlée d'un serveur de déploiement continu d'indiquer le même horodatage, y compris après plusieurs intervalles d'interrogation, cela indique que l'interrogation de ce serveur a échoué et qu'il n'est plus contrôlé. Cela peut résulter d'un dysfonctionnement de l'agent de contrôle.