Gestion des pannes dans Oracle® Solaris 11.2

Quitter la vue de l'impression

Mis à jour : Juillet 2014
 
 

Réparation de pannes ou de défauts

Vous pouvez configurer Oracle Auto Service Request (ASR) pour demander automatiquement l'assistance d'Oracle lorsque des problèmes matériels surviennent. Pour plus d'informations sur ASR, reportez-vous à http://www.oracle.com/asr.

Lorsqu'un composant est défectueux dans le système, le gestionnaire de pannes peut réparer implicitement le composant ou vous pouvez le réparer explicitement.

Réparation implicite

Une réparation implicite peut se produire lorsque le composant défectueux est remplacé ou supprimé, à condition que le composant comporte des informations de numéro de série identifiables par le démon Gestionnaire de pannes (fmd). Sur la plupart des systèmes SPARC, les informations de numéro de série sont incluses dans les FMRI, si bien que fmd peut déterminer quand des composants sont retirés, soit par remplacement, soit par un autre moyen, tel que la mise sur la liste noire. Lorsque fmd détecte qu'un composant a été retiré, le gestionnaire de pannes n'affiche plus le composant dans la sortie fmadm faulty Le composant est conservé dans le cache de ressources interne du gestionnaire de pannes jusqu'à ce que l'événement de panne ait 30 jours d'ancienneté.

Lorsque fmd détecte des ressources CPU ou de mémoire défaillantes, ces ressources sont placées sur une liste noire. Une ressource défectueuse qui se trouve sur la liste noire ne peut pas être réaffectée tant que fmd n'indique pas que la ressource a été réparée.

Réparation explicite

Les informations de numéro de série FRU sont disponibles, même si l'dentificateur FMRI inclut un identificateur de châssis. Dans ce cas, fmd ne peut pas détecter un remplacement FRU, et vous devez exécuter une réparation explicite en utilisant la commande fmadm avec la sous commande replaced, repaired ou acquit, comme indiqué dans les sections suivantes. Exécutez une réparation explicite uniquement en suivant une procédure de réparation documentée.

Ces commandes fmadm acceptent les opérandes suivants :

  • L'UUID, appelé également EVENT-ID dans la sortie du gestionnaire de pannes, identifie l'événement de panne. L'UUID peut être utilisé uniquement avec la commande fmadm acquit Vous pouvez indiquer que l'ensemble de l'événement soit ignoré en toute sécurité, ou spécifier qu'une ressource n'est pas un suspecte dans cet événement.

  • Le FMRI et le libelléidentifie la ressource suspecte. Des exemples de FMRI et de libellé de ressource sont proposés dans Example 2–1. En règle générale, le libellé est plus facile à utiliser que le FMRI.

Une ressource est considérée réparée lorsque l'UUID d'événement de panne est acquitté ou que toutes les ressources suspectes ont été réparées, remplacées, supprimées ou acquittées. Une ressource réparée passe à l'état FMD_CASE_REPAIRED, et le gestionnaire de pannes génère un événement list.repaired