JavaScript is required to for searching.
Omitir Vínculos de navegación
Salir de la Vista de impresión
Gestión de servicios y errores en Oracle Solaris 11.1     Oracle Solaris 11.1 Information Library (Español)
search filter icon
search icon

Información del documento

Prefacio

1.  Gestión de servicios (descripción general)

2.  Gestión de servicios (tareas)

3.  Uso del gestor de fallos

Descripción general de gestión de errores

Notificación de fallos y defectos

Visualización de Información sobre fallos o defectos

Cómo mostrar información sobre componentes con fallos

Cómo identificar las CPU que están sin conexión

Cómo mostrar información sobre servicios defectuosos

Reparación de fallos o defectos

Comando fmadm replaced

Comando fmadm repaired

Comando fmadm acquit

Archivos de registro de gestión de fallos

Estadísticas de fallos

Índice

Visualización de Información sobre fallos o defectos

Se sugiere el comando fmadm faulty para mostrar la información acerca de defectos o fallos y determinar las FRU implicadas. Sin embargo, también se admite el comando fmdump. El comando fmdump se utiliza con frecuencia para mostrar un registro histórico de los problemas del sistema y fmadm faulty para mostrar los problemas activos.


Precaución

Precaución - No base una acción administrativa en la salida del comando fmdump, sino en la salida fmadm faulty. Los archivos de registro pueden contener declaraciones de errores, que no se deben considerar fallos o defectos.


Cómo mostrar información sobre componentes con fallos

  1. Conviértase en un administrador.

    Para obtener más información, consulte Cómo usar los derechos administrativos que tiene asignados de Administración de Oracle Solaris 11.1: servicios de seguridad.

  2. Muestre información sobre los componentes.
    # fmadm faulty

    Consulte los siguientes ejemplos para obtener una descripción del texto generado.

Ejemplo 3-1 Salida fmadm con una CPU con fallos

1    # fmadm faulty
2    --------------- ------------------------------------  -------------- ---------
3    TIME            EVENT-ID                              MSG-ID         SEVERITY
4    --------------- ------------------------------------  -------------- ---------
5    Aug 24 17:56:03 7b83c87c-78f6-6a8e-fa2b-d0cf16834049  SUN4V-8001-8H  Minor
6    
7    Host        : bur419-61
8    Platform    : SUNW,T5440        Chassis_id  : BEL07524BN
9    Product_sn  : BEL07524BN
10
11   Fault class : fault.cpu.ultraSPARC-T2plus.ireg
12   Affects     : cpu:///cpuid=0/serial=1F95806CD1421929
13                     faulted and taken out of service
14   FRU         : "MB/CPU0" (hc://:product-id=SUNW,T5440:server-id=bur419-61:\
15                 serial=3529:part=541255304/motherboard=0/cpuboard=0)
16                     faulty
17   Serial ID.  : 3529
18                 1F95806CD1421929
19   
20   Description : The number of integer register errors associated with this thread
21                 has exceeded acceptable levels.
22   
23   Response    : The fault manager will attempt to remove the affected thread from
24                 service.
25   
26   Impact      : System performance may be affected.
27   
28   Action      : Use 'fmadm faulty' to provide a more detailed view of this event.
29                 Please refer to the associated reference document at
30                 http://support.oracle.com/msg/SUN4V-8001-8H for the latest service
31                 procedures and policies regarding this diagnosis.
 

De interés primordial es la línea 14, que muestra los datos de las FRU afectadas. La cadena de ubicación más legible para el usuario está entre comillas, "MB/CPU0". El valor marcado entre comillas debe coincidir con la etiqueta en el hardware físico. La FRU también está representada en un formato de identificador de recursos de gestión de fallos (FMRI), que incluye propiedades descriptivas sobre el sistema que contiene el fallo, como su nombre de host y el número de serie del chasis. En las plataformas que lo admiten, el número de referencia y el número de serie de la FRU también se incluyen en el FMRI de la FRU.

Las líneas de afectados (líneas 12 y 13) indican los componentes que se ven afectados por el fallo y sus estados relativos. En este ejemplo, una única cadena de CPU se ve afectada. Es faulted and taken out of service.

Siguiendo la descripción de FRU en la salida del comando fmadm faulty, la línea 16 muestra el estado como faulty. La sección de acciones también puede incluir otras acciones específicas en lugar de la referencia habitual al comando fmadm.

Ejemplo 3-2 Salida fmadm con varios fallos

1    # fmadm faulty
2    --------------- ------------------------------------  -------------- -------
3    TIME            EVENT-ID                              MSG-ID         SEVERITY
4    --------------- ------------------------------------  -------------- -------
5    Sep 21 10:01:36 d482f935-5c8f-e9ab-9f25-d0aaafec1e6c  PCIEX-8000-5Y  Major
6    
7    Fault class  : fault.io.pci.device-invreq
8    Affects      : dev:///pci@0,0/pci1022,7458@11/pci1000,3060@0
9                   dev:///pci@0,0/pci1022,7458@11/pci1000,3060@1
10                   ok and in service
11                  dev:///pci@0,0/pci1022,7458@11/pci1000,3060@2
12                  dev:///pci@0,0/pci1022,7458@11/pci1000,3060@3
13                    faulty and taken out of service
14   FRU          : "SLOT 2" (hc://.../pciexrc=3/pciexbus=4/pciexdev=0)
15                    repair attempted
16                  "SLOT 3" (hc://.../pciexrc=3/pciexbus=4/pciexdev=1)
17                    acquitted
18                  "SLOT 4" (hc://.../pciexrc=3/pciexbus=4/pciexdev=2)
19                    not present
20                  "SLOT 5" (hc://.../pciexrc=3/pciexbus=4/pciexdev=3)
21                    faulty
22   
23    Description  : The transmitting device sent an invalid request.
24   
25    Response     : One or more device instances may be disabled
26   
27    Impact       : Possible loss of services provided by the device instances
28                   associated with this fault
29   
30    Action       : Use 'fmadm faulty' to provide a more detailed view of this event.
31                   Please refer to the associated reference document at
32                   http://support.oracle.com/msg/PCIEX-8000-5Y for the latest service
33                   procedures and policies regarding this diagnosis.

Siguiendo la descripción de FRU en la salida del comando fmadm faulty, la línea 21 muestra el estado como faulty. Otros valores de estado que posiblemente vea en otras situaciones incluyen acquitted y repair attempted, como se muestra para SLOT 2 y SLOT 3 en las líneas 15 y 17.

Ejemplo 3-3 Visualización de fallos con el comando fmdump

Algunos mensajes de la consola y artículos de conocimientos podrían indicarle que utilice el comando fmdump -v -u UUID para mostrar información de fallos. Aunque se prefiere el comando fmadm faulty, el comando fmdump sigue funcionando, como se muestra en el siguiente ejemplo:

1    % fmdump -v -u 7b83c87c-78f6-6a8e-fa2b-d0cf16834049
2    TIME                 UUID                                 SUNW-MSG-ID EVENT
3    Aug 24 17:56:03.4596 7b83c87c-78f6-6a8e-fa2b-d0cf16834049 SUN4V-8001-8H Diagnosed
4      100%  fault.cpu.ultraSPARC-T2plus.ireg
5
6            Problem in: -
7               Affects: cpu:///cpuid=0/serial=1F95806CD1421929
8                   FRU: hc://:product-id=SUNW,T5440:server-id=bur419-61:\
9                   serial=9999:part=541255304/motherboard=0/cpuboard=0
10              Location: MB/CPU0

La información sobre las unidades FRU afectadas sigue presente, aunque separada en tres líneas (líneas 8 a 10). La cadena de ubicación presenta la cadena de FRU legible para el usuario. Las líneas de FRU presentan el FMRI formal. Tenga en cuenta que la gravedad, el texto descriptivo y la acción no se muestran con el comando fmdump, a menos que utilice la opción -m. Consulte la página del comando man fmdump(1M) para obtener más información.

Cómo identificar las CPU que están sin conexión

Cómo mostrar información sobre servicios defectuosos

  1. Conviértase en un administrador.

    Para obtener más información, consulte Cómo usar los derechos administrativos que tiene asignados de Administración de Oracle Solaris 11.1: servicios de seguridad.

  2. Muestre información sobre el defecto.
    # fmadm faulty
    --------------- ------------------------------------  -------------- ---------
    TIME            EVENT-ID                              MSG-ID         SEVERITY
    --------------- ------------------------------------  -------------- ---------
    May 12 22:52:47 915cb64b-e16b-4f49-efe6-de81ff96fce7  SMF-8000-YX    major
    
    Host        : parity
    Platform    : Sun-Fire-V40z     Chassis_id  : XG051535088
    Product_sn  : XG051535088
    
    Fault class : defect.sunos.smf.svc.maintenance
    Affects     : svc:///system/intrd:default
                      faulted and taken out of service
    Problem in  : svc:///system/intrd:default
                      faulted and taken out of service
    
    Description : A service failed - it is restarting too quickly.
    
    Response    : The service has been placed into the maintenance state.
    
    Impact      : svc:/system/intrd:default is unavailable.
    
    Action      : Run 'svcs -xv svc:/system/intrd:default' to determine the
                  generic reason why the service failed, the location of any
                  logfiles, and a list of other services impacted. Please refer to
                  the associated reference document at
                  http://support.oracle.com/msg/SMF-8000-YX for the latest service procedures
                  and policies regarding this diagnosis.
  3. Muestre información sobre el servicio con defectos.

    Siga las instrucciones proporcionadas en la sección de acciones de la salida fmadm.

    # svcs -xv svc:/system/intrd:default
    svc:/system/intrd:default (interrupt balancer)
     State: maintenance since Wed May 12 22:52:47 2010
    Reason: Restarting too quickly.
       See: http://support.oracle.com/msg/SMF-8000-YX
       See: man -M /usr/share/man -s 1M intrd
       See: /var/svc/log/system-intrd:default.log
    Impact: This service is not running.

    Consulte el artículo de conocimientos, SMF-8000-YX, para obtener más instrucciones sobre la solución de este problema.