JavaScript is required to for searching.
Ignorer les liens de navigation
Quitter l'aperu
Gestion des services et pannes dans Oracle Solaris 11.1     Oracle Solaris 11.1 Information Library (Français)
search filter icon
search icon

Informations document

Préface

1.  Gestion des services (présentation)

2.  Gestion des services (tâches)

3.  Utilisation du gestionnaire de pannes

Présentation de la gestion des pannes

Notification de pannes et de défauts

Affichage d'informations sur les pannes ou les défauts

Procédure d'affichage d'informations relatives aux composants défectueux

Procédure d'identification des CPU hors ligne

Procédure d'affichage d'informations relatives aux services défectueux

Réparation de pannes ou de défauts

Commande fmadm replaced

Commande fmadm repaired

Commande fmadm acquit

Fichiers journaux de gestion des pannes

Statistiques sur les pannes

Index

Réparation de pannes ou de défauts

Si la gestion des pannes repère un composant défectueux dans le système, nul doute que vous souhaiterez le réparer. Une réparation peut s'effectuer de l'une des deux manières suivantes : de manière implicite ou de manière explicite.

Une réparation implicite peut se produire lorsque le composant défectueux est remplacé ou supprimé, à condition que le composant comporte des informations de numéro de série identifiables par le démon du gestionnaire de pannes. Sur de nombreux systèmes SPARC, les informations sur le numéro de série sont incluses dans les FMRI, si bien que le démon du gestionnaire de pannes peut déterminer quand des composants sont retirés du service, soit par remplacement, soit par un autre moyen (mise sur liste noire par exemple). Lorsqu'un tel changement est détecté, le démon du gestionnaire de pannes n'affiche plus la ressource affectée dans la sortie de fmadm faulty. La ressource est conservée dans le cache de ressources interne du démon jusqu'à écoulement d'un délai de 30 jours après la détection de l'événement de panne ; passé ce délai, la ressource est purgée.

Les réparations implicites ne concernent pas tous les systèmes. Quelquefois, même si un ID de châssis figure dans les FMRI, aucune information sur le numéro de série n'est disponible. Le démon du gestionnaire de pannes ne peut donc pas détecter de remplacement de FRU, et une réparation explicite est nécessaire.

La commande fmadm permet de marquer explicitement une panne comme réparée. Quatre syntaxes sont associées aux réparations pour cette commande :

Bien que ces quatre commandes acceptent des FMRI et des UUID en tant qu'arguments, l'argument à privilégier est l'étiquette. Si une FRU présente plusieurs pannes, vous ne souhaitez remplacer qu'une seule fois la FRU. Si vous exécutez la commande fmadm replaced sur l'étiquette, la FRU est spécifiée comme telle dans tous les cas en suspens.

Commande fmadm replaced

Vous pouvez utiliser la commande fmadm replaced pour indiquer que la FRU suspecte a été remplacée ou supprimée.

Si le système découvre automatiquement qu'une FRU a été remplacée (le numéro de série a été modifié), cette découverte est traitée de la même manière que si fmadm replaced avait été saisi sur la ligne de commande. La commande fmadm replaced n'est pas autorisée si fmd peut confirmer automatiquement que la FRU n'a pas été remplacée (le numéro de série n'a pas été modifié).

Si le système découvre automatiquement qu'une FRU a été supprimée mais pas remplacée, le comportement actuel n'est pas modifié : le suspect est affiché comme not present, mais n'est considéré comme définitivement supprimé qu'après un délai de 30 jours après la détection de l'événement de panne ; passé ce délai, le suspect est purgé.

Commande fmadm repaired

Vous pouvez utiliser la commande fmadm repaired lorsqu'une réparation physique autre que le remplacement d'une FRU a été réalisée afin de résoudre le problème. Il peut s'agir par exemple de la réinsertion d'une carte ou du redressement d'une broche tordue.

Commande fmadm acquit

L'option acquit est souvent utilisée lorsqu'il a été déterminé que la ressource concernée n'était pas à l'origine du problème. Un acquittement peut également se produire implicitement lorsque des événements d'erreur supplémentaires se produisent et que le diagnostic s'affine.

Le remplacement est prioritaire par rapport à la réparation, et tous deux sont prioritaires par rapport à l'acquittement. Par conséquent, vous pouvez acquitter un composant puis le réparer, mais vous ne pouvez pas acquitter un composant qui a déjà été réparé.

Un cas est considéré comme réparé (il passe à l'état FMD_CASE_REPAIRED et un événement list.repaired est généré) lorsque l'UUID est acquitté ou que tous les suspects ont été réparés, remplacés, supprimés ou acquittés.

Généralement, fmd acquitte automatiquement un suspect dans une liste comportant plusieurs suspects, ou les services de support vous instruisent d'effectuer un acquittement manuel. Il est recommandé de n'acquitter via le FMRI ou l'étiquette que si vous avez déterminé que la ressource n'est coupable dans aucun des cas en cours dans lesquels elle est suspectée. Toutefois, pour permettre à une FRU d'être acquittée manuellement dans un cas tout en restant suspecte dans tous les autres cas, l'option suivante vous permet de spécifier l'UUID et le FMRI ou l'UUID et l'étiquette :

fmadm acquit uuid [fmri|label]