Notes de version Oracle® Hardware Management Pack for Oracle Solaris 11.2

Quitter la vue de l'impression

Mis à jour : Novembre 2015
 
 

Diagnostics d'Oracle Hardware Management Pack pour le HBA SGX-SAS6-INT-Z. En attente d'être complété (20364298)

Dans Oracle Solaris 11.2 SRU 10, des fonctionnalités de diagnostic améliorées ont été ajoutées pour recueillir davantage de données des disques connectés au HBA Sun Storage 6 Gb SAS PCIe, interne (SGX-SAS6-INT-Z). Cela comprend plusieurs erreurs de disque et des événements SMART. En outre, ces événements identifient les disques physiques suspects parmi les disques logiques d'un volume RAID. Ces événements sont capturés et enregistrés dans /var/log/ssm/event.log lorsque l'agent de gestion du matériel (svc:/system/sp/management:default) est en cours d'exécution.

Le tableau suivant répertorie les événements de diagnostic améliorés en train d'être enregistrés.

Nom d'événement dans le journal
Description
PD_RECOVERED_ERROR
Une erreur rétablie de disque a été détectée.
PD_BAD_DEVICE_FAULT
Une défaillance d'unité non récupérable a été détectée par l'appareil lors de l'exécution d'une commande.
PD_MEDIA_ERROR
Une erreur moyenne non récupérable a été détectée par l'appareil.
PD_DEVICE_ERROR
Une défaillance matérielle non récupérable a été détectée par l'appareil lors de l'exécution d'une commande. L'appareil est peut-être hors ligne ou endommagé.
PD_TRANSPORT_ERROR
Un chemin menant à l'appareil a été déconfiguré en raison de l'instabilité de transport.
PD_OVER_TEMPERATURE
Le processus de disque SMART signale une température critique.
PD_SELF_TEST_FAILURE
Un ou plusieurs autotests de disque SMART ont échoué.
PD_PREDICTIVE_FAILURE
Le microprogramme de surveillance de l'intégrité SMART a signalé qu'une panne de disque est imminente.

Le contrôleur interroge chaque disque physique du volume à intervalles réguliers. Si un disque rencontre une erreur, un événement est généré par le contrôleur. L'agent de gestion du matériel capture cet événement et l'enregistre dans le journal des événements de gestion du matériel.

Pour afficher les informations de l'événement dans le journal des événements de gestion du matériel, saisissez :

# view /var/log/ssm/event.log

En ce qui concerne les événements de disque, vous pourrez consulter des informations similaires à :

Thu Apr 30 12:32:31 2015:(CLI) Event Name  : PD_MEDIA_ERROR
Thu Apr 30 12:32:31 2015:(CLI) Event Description : A medium error was 
detected by the device that was non-recoverable.
Thu Apr 30 12:32:31 2015:(CLI) ASC  : 0x10
Thu Apr 30 12:32:31 2015:(CLI) ASCQ : 0x3
Thu Apr 30 12:32:31 2015:(CLI) Sense Key : 0x3
Thu Apr 30 12:32:31 2015:(CLI) Source : LSI
Thu Apr 30 12:32:31 2015:(CLI) SAS Address : 0x5000cca01200fadd
Thu Apr 30 12:32:31 2015:(CLI) LSI Description : Unexpected sense: PD 
0c(e0xfc/s1) Path 5000cca01200fadd, CDB: 2f 00 00 fc 4d 42 00 10 00 00, 
Sense: 3/10/03
Thu Apr 30 12:32:31 2015:(CLI) Event TimeStamp : 04/30/2015 ; 19:30:25
Thu Apr 30 12:32:31 2015:(CLI) Node ID : 00000000:12
Thu Apr 30 12:32:31 2015:(CLI) Nac Name : /SYS/HDD1
Thu Apr 30 12:32:31 2015:(CLI) Serial Number : 001015N0JPXA   PMG0JPXA
Thu Apr 30 12:32:31 2015:(CLI) WWN No : PDS:5000cca01200fadd
Thu Apr 30 12:32:31 2015:(CLI) Disk Model : H106030SDSUN300G

Vous pouvez ensuite utiliser les informations de la liste d'événements pour déterminer quel disque physique fait l'objet d'un problème au sein du système. Des informations, telles que le nom NAC d'Oracle ILOM (qui correspond à l'étiquette située sur le panneau avant du système) et le numéro de série de l'unité, vous permettent d'identifier le disque et son emplacement d'unité au sein du système.


Remarque -  Pour les événements PD_OVER_TEMPERATURE, PD_SELF_TEST_FAILURE et PD_PREDICTIVE_FAILURE, utilisez Oracle ILOM pour configurer des alertes proactives.

Quant aux autres événements de diagnostic décrits dans ce document, c'est à l'administrateur de vérifier le journal des événements de gestion du matériel lorsqu'un problème lié à ces événements est suspecté. Il n'existe pour l'instant aucun mécanisme d'alerte qui annonce de façon proactive ces événements.