Contrôle des pannes

À propos du contrôle des pannes

Vous pouvez détecter une panne du système de trois manières différentes :

  • Sur le composant défaillant et sur le châssis du système, les DEL Opération de maintenance requise orange s'allument (voir Contrôle des DEL Opération de maintenance requise).

  • Les informations de statut du composant, disponibles via l'interface Web ILOM et la CLI, indiquent que le composant est défaillant (voir Contrôle des pannes à l'aide des interfaces de gestion).

  • L'occurrence de la panne est enregistrée dans le journal des événements système (voir Contrôle du journal des événements).

Contrôle des DEL Opération de maintenance requise

En cas de défaillance matérielle d'un composant (le composant est enregistré comme étant défaillant), le gestionnaire de pannes allume la DEL Opération de maintenance requise (orange) ainsi que les DEL Opération de maintenance requise sur le châssis du système (à l'avant et à l'arrière).

DEL Opération de maintenance requise éteintes

Une DEL Opération de maintenance requise indique une défaillance matérielle ; elle reste donc allumée jusqu'à ce que le gestionnaire de pannes détecte que le matériel défaillant a été remplacé ou réparé. Sur le châssis, les DEL Opération de maintenance requise (qui servent d'indicateurs pour toutes les pannes de composant) restent allumées tant que le composant système reste défini comme étant défaillant.

DEL du châssis allumées

Si les DEL Opération de maintenance requise du châssis sont allumées tandis qu'aucune DEL Opération de service requise d'autres composants système n'est allumée, le gestionnaire de pannes a détecté une panne externe, c'est-à-dire un événement qui s'est produit hors du système et qui risque d'affecter globalement celui-ci. Par exemple, si la température ambiante est supérieure à 43 oC, le système détecte une panne et s'arrête, bien qu'aucun élément matériel du système ne présente une défaillance physique effective.

Pour de plus amples informations sur les conditions externes susceptibles de provoquer les pannes du châssis, reportez-vous à la rubrique Pannes du châssis.

À propos des pannes électriques

Les unités d'alimentation (PSU, Power Supply Unit) constituent un cas à part : elles contrôlent elles-mêmes leur statut de panne et leurs DEL Opération de maintenance requise. Le gestionnaire de pannes ne peut pas éteindre ou allumer les DEL des PSU. Toutefois, comme le gestionnaire de pannes contrôle les sondes des PSU, il détecte les pannes de PSU. Le gestionnaire de pannes allume le châssis Opération de maintenance requise et note l'occurrence de la panne dans les interfaces de gestion ILOM et dans le journal des événements.

Une DEL Opération de maintenance requise de PSU peut être éteinte (la PSU considère que la panne a été réparée), tandis que le gestionnaire de pannes continue d'indiquer que la PSU est défaillante. Dans ce cas, l'état de panne reste également affiché dans les interfaces de gestion ILOM, les DEL Opération de maintenance requise du châssis et le journal des événements.

Pour de plus amples informations, reportez-vous à la rubrique Pannes électriques.

Contrôle des pannes à l'aide des interfaces de gestion

Contrôle du statut des composants à l'aide de l'interface Web

Pour vérifier le statut de panne des composants système à partir de l'interface Web :

  1. Connectez-vous à l'interface Web ILOM.

  2. Sélectionnez l'onglet System Information.

  3. Sélectionnez l'onglet Components.

    La page des composants s'affiche. Cette page contient un tableau, Component Management Status, qui indique le statut de panne de chaque composant système.

  4. Recherchez le composant défaillant.

    Recherchez le composant dont le statut de panne est défini sur Faulted (défaillant). Il suffit qu'un composant soit défaillant pour que le châssis du système (/CH) soit également défini sur Faulted.

Contrôle du statut des composants à l'aide de la CLI

Note

Reportez-vous à la rubrique À propos de l'interface de ligne de commande ILOM pour en savoir plus sur l'espace de noms d'objet et la manière d'identifier les cibles et propriétés susceptibles d'êtres liées aux pannes.

  1. Ouvrez la fenêtre de CLI ILOM.

  2. Exécutez la commande show adéquate pour afficher les informations relatives aux composants système.

    Par exemple, lorsque vous vous trouvez au niveau du châssis (/CH), si un composant est défaillant, l'état de panne du châssis indique que celui-ci est défaillant (fault_state est défini sur Faulted), comme indiqué ci-dessous.

    -> show  
    /CH
    Targets:
    	.
    	.
    	.
    
    
    Properties:
    	type = Chassis
    	fault_state = Faulted 
    	clear_fault_action = (none)
    ->
  3. Parcourez la liste jusqu'au composant défaillant et exécutez de nouveau la commande show pour confirmer que le composant est défaillant (fault_state = Faulted).

    L'exemple suivant indique que le module de ventilateur arrière 0 (/CH/RFM0) est défaillant (fault_state est défini sur Faulted).

    -> cd /CH/RFM0
    /CH/RFM0
    
    
    -> show  
    /CH/RFM0
    Targets:
    	SERVICE
    	ACT
    	FAN1_OK
    	FAN2_OK
    	FAN1_SPEED
    	FAN2_SPEED
    
    
    Properties:
    	type = Rear Fan FRU
    	fault_state = Faulted 
    	clear_fault_action = (none)
    	prepare_to_remove_status = NotReady
    	prepare_to_remove_action = (none)
    	return_to_service_action = (none)
    ->

Contrôle du journal des événements

Les pannes sont enregistrées dans le journal des événements système, consultable via l'interface Web ILOM ou la CLI.

Affichage du journal des événements via l'interface Web

  1. Connectez-vous à l'interface Web ILOM.

  2. Sélectionnez l'onglet System Monitoring.

  3. Sélectionnez l'onglet Event Logs.

    Les pannes sont répertoriées avec une classe de panneFault, un horodatage indiquant l'instant auquel la panne s'est produite et une description de la panne. Si vous recherchez une panne qui s'est produite récemment, vous la trouverez sûrement à la fin du journal. Toute panne consignée s'affiche dans le journal de manière similaire à l'exemple ci-dessous. Il s'agit ici d'une panne qui s'est produite sur l'unité d'alimentation 3 (/CH/PS3).

    4      Mon May  1 13:17:22 2006  FMA       Fault     critical
           Fault detected at time = Mon May  1 13:17:22 2006. The suspect component:
           /CH/PS3 has FAULT:powersupply_temperature_ps with probability=100

    Reportez-vous à la rubrique Affichage des journaux d'événements afin de connaître la procédure à suivre pour rechercher et interpréter le contenu du journal des événements.

Affichage du journal des événements via la fenêtre de CLI

  1. Ouvrez la fenêtre de CLI ILOM.

  2. Pour afficher le journal des événements, exécutez la commande suivante :

    show /CMM/logs/event list

    Pour savoir ce que contient le journal, faites défiler la sortie de la commande. Toute panne consignée s'affiche dans le journal de manière similaire à l'exemple ci-dessous. Il s'agit ici d'une panne qui s'est produite sur l'unité d'alimentation 3 (/CH/PS3).

    4      Mon May  1 13:17:22 2006  FMA       Fault     critical
           Fault detected at time = Mon May  1 13:17:22 2006. The suspect component:
           /CH/PS3 has FAULT:powersupply_temperature_ps with probability=100

    Reportez-vous à la rubrique Affichage des journaux d'événements afin de connaître la procédure à suivre pour rechercher et interpréter le contenu du journal des événements.