À propos de la gestion de pannes

Le gestionnaire de pannes de Sun Blade 8000 Series est un logiciel qui permet, d'une part, de contrôler l'état de fonctionnement du matériel et, d'autre part, de diagnostiquer et signaler les pannes matérielles des composants système. Le gestionnaire de pannes contrôle également les conditions extérieures et signale toute condition non acceptable pour le système. Le châssis du système, les unités d'alimentation (PSU, Power Supplies), les modules Server (lames) et les ventilateurs sont contrôlés en permanence par diverses sondes. Dès que l'une d'elles détecte un problème, elle le signale au gestionnaire de pannes qui s'exécute sur le module de contrôle du châssis (CMM, Chassis Monitoring Module).

Le gestionnaire de pannes diagnostique ensuite le problème. S'il en conclut qu'il s'agit d'une panne matérielle ou due à une condition extérieure, il allume la DEL Opération de maintenance requise du composant en question. Les interfaces de gestion ILOM sont également mises à jour afin de tenir compte de l'erreur (la panne) matérielle et la panne est consignée dans le journal des événements.

Note

Le logiciel de gestion de pannes de Sun Blade 8000 Series n'est en aucun cas lié à l'architecture de gestion de pannes (FMA, Fault Management Architecture) de Solaris. Le gestionnaire de pannes fait partie du logiciel de gestion du système et n'interagit pas avec les hôtes des lames ni avec leur système d'exploitation.

Pannes externes et pannes internes

Lorsqu'un composant système présente une défaillance matérielle, on parle de panne interne, à savoir, d'une panne résultant d'un problème lié au matériel de Sun Blade 8000 Series. Les pannes internes sont effacées une fois la réparation effectuée, c'est-à-dire, dans bon nombre des cas, une fois le composant défectueux remplacé.

D'autres pannes sont cependant qualifiées de pannes externes. Dans ce cas, il ne s'agit pas de matériel système défectueux mais d'une condition extérieure au système à l'origine d'un problème éventuel. Lorsque par exemple la température ambiante (extérieure au châssis) dépasse un certain seuil, la condition est considérée comme une erreur (panne). En effet, sans rectification, elle est susceptible d'affecter le fonctionnement du système. Les pannes externes sont effacées automatiquement dès que la condition externe disparaît. Une panne externe peut néanmoins, si elle n'est pas réparée, entraîner l'arrêt des composants, voire de l'ensemble du système.

Composants contrôlés par le gestionnaire de pannes

Le gestionnaire de pannes contrôle les composants système suivants.

Composant système

Reportez-vous à la rubrique

Châssis du système

Pannes du châssis

Unités d'alimentation (PSU)

Pannes électriques

Modules Server (lames)

Pannes de module Server (lame)

Ventilateurs

Pannes de ventilateur