|
|
Autorétablissement proactif |
L'autorétablissement proactif désigne une architecture et une méthodologie de gestion des pannes permettant de diagnostiquer, signaler et gérer automatiquement les conditions de panne logicielle et matérielle. L'autorétablissement proactif réduit le temps requis pour déboguer un problème matériel ou logiciel et fournit à l'administrateur système ou au personnel Oracle Services des données détaillées relatives à chaque panne. L'architecture se compose d'un protocole de gestion des événements, du gestionnaire des pannes, d'agents de gestion des pannes et de moteurs de diagnostic. |
Moteurs de diagnostic |
Dans Oracle ILOM, l'architecture de gestion des pannes inclut des moteurs de diagnostic diffusant des événements de panne concernant les erreurs système détectées. Pour obtenir une liste des moteurs de diagnostic pris en charge dans l'architecture de gestion des pannes pour Oracle ILOM, reportez-vous à la section fmstat Report Example and Description. |
Etats d'intégrité |
Oracle ILOM associe les états d'intégrité suivants à toutes les ressources pour lesquelles des informations de télémesure ont été reçues. Les états possibles présentés dans les interfaces d'Oracle ILOM incluent :
ok – La ressource matérielle est présente dans le châssis et fonctionne normalement. Aucun problème non résolu n'a été détecté.
unknown – La ressource matérielle est absente ou inutilisable, mais aucun problème non résolu n'a été détecté. Cet état de gestion peut indiquer que la ressource suspecte est désactivée par l'administrateur système.
faulted – La ressource matérielle est présente dans le châssis, mais ne peut pas être utilisée étant donné qu'un ou plusieurs problèmes ont été détectés. La ressource matérielle est désactivée (hors ligne) pour éviter d'occasionner des dommages plus importants au système.
degraded – La ressource matérielle est présente et utilisable, mais un ou plusieurs problèmes ont été détectés. Si toutes les ressources matérielles concernées se trouvent dans le même état, ce dernier est indiqué dans le message d'événement, au bas de la liste. Autrement, un état d'intégrité distinct est attribué à chaque ressource.
|
Panne |
Une panne indique qu'un composant matériel est présent, mais qu'il est inutilisable ou dégradé car un ou plusieurs problèmes ont été diagnostiqués par Oracle ILOM Fault Manager. Le composant a été désactivé pour éviter d'occasionner des dommages supplémentaires au système. |
Périphérique géré |
Un périphérique géré peut être un serveur Oracle monté en rack, un serveur lame ou un châssis lame. |
FRU |
Une FRU (Field-replacable unit) est une unité remplaçable sur site (comme un pilote, un DIMM de mémoire ou une carte de circuit imprimé). |
CRU |
Une CRU (Customer-Replaceable Unit) est une unité remplaçable par le client (comme un NEM dans un châssis lame Oracle). |
UUID (identifiant universel unique) |
Un identifiant universel unique (UUID) sert à identifier de façon univoque un problème particulier dans un ensemble de systèmes. |