Ignorer les liens de navigation | |
Quitter l'aperu | |
Administration d’Oracle Solaris : Tâches courantes Oracle Solaris 11 Information Library (Français) |
1. Localisation des informations relatives aux commandes Oracle Solaris
2. Gestion des comptes utilisateur et des groupes (présentation)
3. Gestion des comptes utilisateur et des groupes (tâches)
4. Initialisation et arrêt d'un système Oracle Solaris
5. Utilisation d'Oracle Configuration Manager
6. Gestion des services (présentation)
7. Gestion des services (tâches)
8. Utilisation du gestionnaire de pannes
Présentation de la gestion des pannes
Notification de pannes et de défauts
Affichage d'informations sur les pannes ou les défauts
Procédure d'affichage d'informations relatives aux composants défectueux
Procédure d'identification des CPU hors ligne
Procédure d'affichage d'informations relatives aux services défectueux
Réparation de pannes ou de défauts
Fichiers journaux de gestion des pannes
9. Gestion des informations système (tâches)
10. Gestion des processus système (tâches)
11. Surveillance des performances du système (tâches)
12. Gestion des packages de logiciels (tâches)
13. Gestion de l'utilisation du disque (tâches)
14. Tâches de planification du système (tâches)
15. Configuration et administration d'imprimantes à l'aide de CUPS (tâches)
17. Gestion des informations sur les pannes système (tâches)
18. Gestion des fichiers noyau (tâches)
19. Dépannage du système et des problèmes logiciels (tâches)
20. Dépannage de divers problèmes système et logiciels (tâches)
La méthode recommandée pour l'affichage des informations sur une panne ou un défaut et la détermination des FRU impliquées est la commande fmadm faulty. Toutefois, la commande fmdump est également prise en charge. La commande fmdump est souvent utilisée pour afficher un historique des problèmes sur le système et la commande fmadm faulty est utilisée pour afficher les problèmes actifs.
Attention - Ne fondez pas les actions d'administration sur la commande fmdump, mais plutôt sur la sortie de la commande fmadm faulty. Les fichiers journaux peuvent contenir des déclarations d'erreur, qui ne doivent pas être considérées comme des pannes ou des défauts. |
Pour plus d'informations, reportez-vous à la section Procédure d’obtention des droits d’administration du manuel Administration d’Oracle Solaris : services de sécurité.
# fmadm faulty
Reportez-vous aux exemples suivants pour une description du texte généré.
Exemple 8-1 Sortie de la commande fmadm concernant une CPU défectueuse
1 # fmadm faulty 2 --------------- ------------------------------------ -------------- --------- 3 TIME EVENT-ID MSG-ID SEVERITY 4 --------------- ------------------------------------ -------------- --------- 5 Aug 24 17:56:03 7b83c87c-78f6-6a8e-fa2b-d0cf16834049 SUN4V-8001-8H Minor 6 7 Host : bur419-61 8 Platform : SUNW,T5440 Chassis_id : BEL07524BN 9 Product_sn : BEL07524BN 10 11 Fault class : fault.cpu.ultraSPARC-T2plus.ireg 12 Affects : cpu:///cpuid=0/serial=1F95806CD1421929 13 faulted and taken out of service 14 FRU : "MB/CPU0" (hc://:product-id=SUNW,T5440:server-id=bur419-61:\ 15 serial=3529:part=541255304/motherboard=0/cpuboard=0) 16 faulty 17 Serial ID. : 3529 18 1F95806CD1421929 19 20 Description : The number of integer register errors associated with this thread 21 has exceeded acceptable levels. 22 23 Response : The fault manager will attempt to remove the affected thread from 24 service. 25 26 Impact : System performance may be affected. 27 28 Action : Use 'fmadm faulty' to provide a more detailed view of this event. 29 Please refer to the associated reference document at 30 http://sun.com/msg/SUN4V-8001-8H for the latest service 31 procedures and policies regarding this diagnosis.
La ligne 14 est particulièrement intéressante : elle fournit les informations relatives aux FRU affectées. La chaîne d'emplacement directement lisible est placée entre guillemets, "MB/CPU0". La valeur entre guillemets est censée correspondre à l'étiquette placée sur le matériel physique. La FRU est également représentée au format FMRI (Fault Management Resource Identifier, identificateur de ressource de gestion des pannes), qui comprend des propriétés descriptives concernant le système présentant la panne, telles que son nom d'hôte et le numéro de série du châssis. Sur les plates-formes qui les prennent en charge, le numéro de référence et le numéro de série de la FRU sont également inclus dans le FMRI de la FRU.
Les lignes Affects (lignes 12 et 13) indiquent les composants affectés par la panne et leur état relatif. Dans cet exemple, un seul élément de CPU est affecté. Il est faulted and taken out of service.
La ligne 16, qui suit la description de la FRU dans la sortie de la commande fmadm faulty, indique l'état faulty. La section Action peut préciser des actions spécifiques autres que, ou venant s'ajouter à, l'habituelle référence à la commande fmadm.
Exemple 8-2 Sortie de la commande fmadm concernant plusieurs pannes
1 # fmadm faulty 2 --------------- ------------------------------------ -------------- ------- 3 TIME EVENT-ID MSG-ID SEVERITY 4 --------------- ------------------------------------ -------------- ------- 5 Sep 21 10:01:36 d482f935-5c8f-e9ab-9f25-d0aaafec1e6c PCIEX-8000-5Y Major 6 7 Fault class : fault.io.pci.device-invreq 8 Affects : dev:///pci@0,0/pci1022,7458@11/pci1000,3060@0 9 dev:///pci@0,0/pci1022,7458@11/pci1000,3060@1 10 ok and in service 11 dev:///pci@0,0/pci1022,7458@11/pci1000,3060@2 12 dev:///pci@0,0/pci1022,7458@11/pci1000,3060@3 13 faulty and taken out of service 14 FRU : "SLOT 2" (hc://.../pciexrc=3/pciexbus=4/pciexdev=0) 15 repair attempted 16 "SLOT 3" (hc://.../pciexrc=3/pciexbus=4/pciexdev=1) 17 acquitted 18 "SLOT 4" (hc://.../pciexrc=3/pciexbus=4/pciexdev=2) 19 not present 20 "SLOT 5" (hc://.../pciexrc=3/pciexbus=4/pciexdev=3) 21 faulty 22 23 Description : The transmitting device sent an invalid request. 24 25 Response : One or more device instances may be disabled 26 27 Impact : Possible loss of services provided by the device instances 28 associated with this fault 29 30 Action : Use 'fmadm faulty' to provide a more detailed view of this event. 31 Please refer to the associated reference document at 32 http://sun.com/msg/PCIEX-8000-5Y for the latest service 33 procedures and policies regarding this diagnosis.
La ligne 21, qui suit la description des FRU dans la sortie de commande fmadm faulty, affiche l'état faulty. Dans d'autres situations, vous êtes susceptible de voir des valeurs d'état telles que acquitted et repair attempted, comme indiqué pour SLOT 2 et SLOT 3 aux lignes 15 et 17.
Exemple 8-3 Affichage des pannes avec la commande fmdump
Certains messages de la console et articles de la base de connaissances peuvent vous demander d'utiliser l'ancienne commande fmdump -v -u UUID pour afficher les informations sur les pannes. Bien que la commande fmadm faulty soit préférable, la commande fmdump fonctionne toujours, comme l'illustre l'exemple suivant :
1 % fmdump -v -u 7b83c87c-78f6-6a8e-fa2b-d0cf16834049 2 TIME UUID SUNW-MSG-ID EVENT 3 Aug 24 17:56:03.4596 7b83c87c-78f6-6a8e-fa2b-d0cf16834049 SUN4V-8001-8H Diagnosed 4 100% fault.cpu.ultraSPARC-T2plus.ireg 5 6 Problem in: - 7 Affects: cpu:///cpuid=0/serial=1F95806CD1421929 8 FRU: hc://:product-id=SUNW,T5440:server-id=bur419-61:\ 9 serial=9999:part=541255304/motherboard=0/cpuboard=0 10 Location: MB/CPU0
Les informations sur les FRU affectées sont toujours présentes, bien que réparties sur trois lignes (lignes 8 à 10). La chaîne Location présente la chaîne FRU directement lisible. Les lignes FRU présentent le FMRI formel. Notez que la gravité, le texte descriptif, et l'action ne sont pas affichés avec la commande fmdump, sauf si vous utilisez l'option -m. Reportez-vous à la page de manuel fmdump(1M) pour plus d'informations.
% /usr/sbin/psrinfo 0 faulted since 05/13/2011 12:55:26 1 on-line since 05/12/2011 11:47:26
L'état faulted indique que la CPU a été mise hors ligne par un agent de réponse de gestion des pannes.
Pour plus d'informations, reportez-vous à la section Procédure d’obtention des droits d’administration du manuel Administration d’Oracle Solaris : services de sécurité.
# fmadm faulty --------------- ------------------------------------ -------------- --------- TIME EVENT-ID MSG-ID SEVERITY --------------- ------------------------------------ -------------- --------- May 12 22:52:47 915cb64b-e16b-4f49-efe6-de81ff96fce7 SMF-8000-YX major Host : parity Platform : Sun-Fire-V40z Chassis_id : XG051535088 Product_sn : XG051535088 Fault class : defect.sunos.smf.svc.maintenance Affects : svc:///system/intrd:default faulted and taken out of service Problem in : svc:///system/intrd:default faulted and taken out of service Description : A service failed - it is restarting too quickly. Response : The service has been placed into the maintenance state. Impact : svc:/system/intrd:default is unavailable. Action : Run 'svcs -xv svc:/system/intrd:default' to determine the generic reason why the service failed, the location of any logfiles, and a list of other services impacted. Please refer to the associated reference document at http://sun.com/msg/SMF-8000-YX for the latest service procedures and policies regarding this diagnosis.
Suivez les instructions fournies dans la section Action dans la sortie de fmadm.
# svcs -xv svc:/system/intrd:default svc:/system/intrd:default (interrupt balancer) State: maintenance since Wed May 12 22:52:47 2010 Reason: Restarting too quickly. See: http://sun.com/msg/SMF-8000-YX See: man -M /usr/share/man -s 1M intrd See: /var/svc/log/system-intrd:default.log Impact: This service is not running.
Reportez-vous à l'article de la base de connaissances SMF-8000-YX pour plus d'informations sur la résolution de ce problème.