Gestion des pannes dans Oracle® Solaris 11.2

Quitter la vue de l'impression

Mis à jour : Juillet 2014
 
 

Statistiques des pannes

Le démon Gestionnaire de pannes et un grand nombre de ses modules collectent des statistiques. La commande fmadm config indique le statut des modules du gestionnaire de pannes. La commande fmstat signale les statistiques collectées par ces modules.

# fmadm config
MODULE                   VERSION STATUS  DESCRIPTION
cpumem-retire            1.1     active  CPU/Memory Retire Agent
disk-diagnosis           0.1     active  Disk Diagnosis engine
disk-transport           2.1     active  Disk Transport Agent
eft                      1.16    active  eft diagnosis engine
ext-event-transport      0.2     active  External FM event transport
fabric-xlate             1.0     active  Fabric Ereport Translater
fmd-self-diagnosis       1.0     active  Fault Manager Self-Diagnosis
fru-monitor              1.1     active  FRU Monitor
io-retire                2.0     active  I/O Retire Agent
network-monitor          1.0     active  Network monitor
sensor-transport         1.2     active  Sensor Transport Agent
ses-log-transport        1.0     active  SES Log Transport Agent
software-diagnosis       0.1     active  Software Diagnosis engine
software-response        0.1     active  Software Response Agent
sysevent-transport       1.0     active  SysEvent Transport Agent
syslog-msgs              1.1     active  Syslog Messaging Agent
zfs-diagnosis            1.0     active  ZFS Diagnosis Engine
zfs-retire               1.0     active  ZFS Retire Agent

Utilisée sans option, la commande fmstat offre une vue d'ensemble des événements, des temps de traitement et de l'utilisation de la mémoire de tous les modules chargés.

# fmstat
module             ev_recv ev_acpt wait  svc_t    %w  %b  open solve  memsz  bufsz
cpumem-retire            0       0  0.0 10010.0    0   0     0     0      0      0
disk-diagnosis           0       0  0.0 10007.7    0   0     0     0      0      0
disk-transport           0       0  0.9 1811945.5 92   0     0     0    52b      0
eft                      0       0  0.0 4278.0     0   0     3     0   1.6M    58b
ext-event-transport      6       0  0.0  860.8     0   0     0     0    46b   2.0K
fabric-xlate             0       0  0.0    4.8     0   0     0     0      0      0
fmd-self-diagnosis     393       0  0.0   25.5     0   0     0     0      0      0
fru-monitor              2       0  0.0   42.4     0   0     0     0   880b      0
io-retire                1       0  0.0 5003.8     0   0     0     0      0      0
network-monitor          0       0  0.0   13.2     0   0     0     0   664b      0
sensor-transport         0       0  0.0   38.3     0   0     0     0    40b      0
ses-log-transport        0       0  0.0   23.8     0   0     0     0    40b      0
software-diagnosis       0       0  0.0 10010.0    0   0     0     0   316b      0
software-response        0       0  0.0 10006.8    0   0     0     0    14K    14K
sysevent-transport       0       0  0.0 6125.0     0   0     0     0      0      0
syslog-msgs              2       0  0.0 3337.2     0   0     0     0      0      0
zfs-diagnosis            4       0  0.0 2002.0     0   0     0     0      0      0
zfs-retire               4       0  0.0 2715.1     0   0     0     0     4b      0
ev_recv

Nombre d'événements de télémesure reçus par le module.

ev_acpt

Nombre d'événements de télémesure acceptés par le module pouvant faire l'objet d'un diagnostic.

wait

Nombre moyen d'événements de télémesure en attente d'analyse par le module.

svc_t

Durée moyenne, en millisecondes, du service pour les événements de télémesure reçus par le module.

%w

Délai d'attente d'examen en pourcentage des événements de télémesure par le module.

%b

Délai de traitement en pourcentage des événements de télémesure par le module

open

Nombre de dossiers en cours (examens de problèmes ouverts) détenus par le module. La colonne open s'applique uniquement aux situations de gestion des pannes qui sont créées et résolues uniquement par les moteurs de diagnostic. Cette colonne ne s'applique pas aux autres modules, tels que les agents de réponse.

solve

Nombre total de situations résolues par le module depuis son chargement. La colonne solve s'applique uniquement aux situations de gestion des pannes qui sont créées et résolues par les moteurs de diagnostic. Cette colonne ne s'applique pas aux autres modules, tels que les agents de réponse.

memsz

Quantité de mémoire dynamique actuellement allouée par le module.

bufsz

Espace de tampon persistant actuellement alloué par le module.

Des statistiques et des colonnes différentes s'affichent lorsque vous définissez des options différentes.

Pour afficher des statistiques sur un module, utilisez l'option -m module. L'option --z supprime les statistiques de valeur zéro. L'exemple suivant montre que l'agent de réponse cpumem-retire a traité avec succès une demande de mise hors ligne d'une CPU.

# fmstat -z -m cpumem-retire
  NAME      VALUE        DESCRIPTION
  cpu_flts  1            cpu faults resolved

Reportez-vous à la page de manuel fmstat(1M) pour plus d'informations sur les autres options.