Gestión de fallos en Oracle® Solaris 11.2

Salir de la Vista de impresión

Actualización: Julio de 2014
 
 

Estadísticas de fallos

El daemon del gestor de fallos y muchos de sus módulos recopilan estadísticas. El comando fmadm config muestra el estado de los módulos del gestor de fallos. El comando fmstat informa las estadísticas recopiladas por estos módulos.

# fmadm config
MODULE                   VERSION STATUS  DESCRIPTION
cpumem-retire            1.1     active  CPU/Memory Retire Agent
disk-diagnosis           0.1     active  Disk Diagnosis engine
disk-transport           2.1     active  Disk Transport Agent
eft                      1.16    active  eft diagnosis engine
ext-event-transport      0.2     active  External FM event transport
fabric-xlate             1.0     active  Fabric Ereport Translater
fmd-self-diagnosis       1.0     active  Fault Manager Self-Diagnosis
fru-monitor              1.1     active  FRU Monitor
io-retire                2.0     active  I/O Retire Agent
network-monitor          1.0     active  Network monitor
sensor-transport         1.2     active  Sensor Transport Agent
ses-log-transport        1.0     active  SES Log Transport Agent
software-diagnosis       0.1     active  Software Diagnosis engine
software-response        0.1     active  Software Response Agent
sysevent-transport       1.0     active  SysEvent Transport Agent
syslog-msgs              1.1     active  Syslog Messaging Agent
zfs-diagnosis            1.0     active  ZFS Diagnosis Engine
zfs-retire               1.0     active  ZFS Retire Agent

Sin opciones, el comando fmstat proporciona una descripción general de alto nivel de los eventos, los tiempos de procesamiento y el uso de memoria de los módulos cargados.

# fmstat
module             ev_recv ev_acpt wait  svc_t    %w  %b  open solve  memsz  bufsz
cpumem-retire            0       0  0.0 10010.0    0   0     0     0      0      0
disk-diagnosis           0       0  0.0 10007.7    0   0     0     0      0      0
disk-transport           0       0  0.9 1811945.5 92   0     0     0    52b      0
eft                      0       0  0.0 4278.0     0   0     3     0   1.6M    58b
ext-event-transport      6       0  0.0  860.8     0   0     0     0    46b   2.0K
fabric-xlate             0       0  0.0    4.8     0   0     0     0      0      0
fmd-self-diagnosis     393       0  0.0   25.5     0   0     0     0      0      0
fru-monitor              2       0  0.0   42.4     0   0     0     0   880b      0
io-retire                1       0  0.0 5003.8     0   0     0     0      0      0
network-monitor          0       0  0.0   13.2     0   0     0     0   664b      0
sensor-transport         0       0  0.0   38.3     0   0     0     0    40b      0
ses-log-transport        0       0  0.0   23.8     0   0     0     0    40b      0
software-diagnosis       0       0  0.0 10010.0    0   0     0     0   316b      0
software-response        0       0  0.0 10006.8    0   0     0     0    14K    14K
sysevent-transport       0       0  0.0 6125.0     0   0     0     0      0      0
syslog-msgs              2       0  0.0 3337.2     0   0     0     0      0      0
zfs-diagnosis            4       0  0.0 2002.0     0   0     0     0      0      0
zfs-retire               4       0  0.0 2715.1     0   0     0     0     4b      0
ev_recv

El número de eventos de telemetría recibidos por el módulo.

ev_acpt

El número de eventos de telemetría aceptados por el módulo como relevantes para un diagnóstico.

wait

El número promedio de eventos de telemetría que se encuentran en espera para que el módulo los examine.

svc_t

El tiempo medio de servicio para los eventos de telemetría recibidos por el módulo, en milisegundos.

%w

El porcentaje de tiempo que los eventos de telemetría estuvieron en espera para ser examinados por el módulo.

%b

El porcentaje de tiempo que el módulo estuvo ocupado procesando los eventos de telemetría.

abierto

El número de casos activos (investigaciones de problemas abiertos) que pertenecen al módulo. La columna open se aplica sólo a casos de gestión de fallos, que sólo los motores de diagnóstico pueden crear y resolver. Esta columna no se aplica a otros módulos, como los agentes de respuesta.

solve

El número total de casos solucionados por este módulo desde que se cargó. La columna solve se aplica sólo a casos de gestión de fallos, que sólo los motores de diagnóstico pueden crear y resolver. Esta columna no se aplica a otros módulos, como los agentes de respuesta.

memsz

La cantidad de memoria dinámica asignada actualmente por este módulo.

bufsz

La cantidad de espacio de buffer persistente asignado actualmente por este módulo.

Al especificar diferentes opciones, se muestran columnas y estadísticas distintas.

Para mostrar estadísticas en un módulo individual, use la opción -m module. La opción -z suprime las estadísticas con un valor igual a cero. En el siguiente ejemplo, se muestra que el agente de respuesta cpumem-retire procesó correctamente una solicitud de desconexión de una CPU.

# fmstat -z -m cpumem-retire
  NAME      VALUE        DESCRIPTION
  cpu_flts  1            cpu faults resolved

Consulte la página del comando man fmstat(1M) para obtener más información acerca de otras opciones.