Omitir Vínculos de navegación | |
Salir de la Vista de impresión | |
![]() |
Guía de administración de Oracle Solaris ZFS Oracle Solaris 10 1/13 Information Library (Español) |
1. Sistema de archivos ZFS de Oracle Solaris (introducción)
2. Procedimientos iniciales con Oracle Solaris ZFS
3. Administración de agrupaciones de almacenamiento de Oracle Solaris ZFS
4. Instalación e inicio de un sistema de archivos raíz ZFS Oracle Solaris
5. Administración de sistemas de archivos ZFS de Oracle Solaris
6. Uso de clones e instantáneas de Oracle Solaris ZFS
7. Uso de listas de control de acceso y atributos para proteger archivos Oracle Solaris ZFS
8. Administración delegada de ZFS Oracle Solaris
9. Temas avanzados de Oracle Solaris ZFS
10. Recuperación de agrupaciones y solución de problemas de Oracle Solaris ZFS
Identificación de problemas de ZFS
Resolución de problemas de hardware generales
Identificación de fallos de hardware y dispositivos
Creación de informes del sistema sobre mensajes de error de ZFS
Identificación de problemas con agrupaciones de almacenamiento ZFS
Cómo establecer si una agrupación de almacenamiento de ZFS tiene problemas
Revisión de la salida de zpool status
Información sobre el estado general de la agrupación
Información de configuración de agrupación de almacenamiento ZFS
Estado de limpieza de agrupación de almacenamiento ZFS
Resolución de problemas de dispositivos de almacenamiento ZFS
Resolución de problemas de dispositivo extraído o faltante
Resolución de problemas de un dispositivo extraído
Cómo volver a conectar físicamente un dispositivo
Notificación de ZFS sobre disponibilidad de dispositivos
Sustitución o reparación de un dispositivo dañado
Cómo determinar el tipo de error en dispositivos
Eliminación de errores transitorios de dispositivos
Sustitución de un dispositivo de un grupo de almacenamiento de ZFS
Cómo determinar si un dispositivo se puede reemplazar o no
Dispositivos que no se pueden reemplazar
Sustitución de un dispositivo de un grupo de almacenamiento de ZFS
Visualización de estado de reconstrucción
Resolución de problemas del sistema de archivos ZFS
Resolución de problemas de datos en una agrupación de almacenamiento ZFS
Comprobación de integridad de sistema de archivos ZFS
Reparación de sistema de archivos
Validación de sistema de archivos
Control de la limpieza de datos de ZFS
Limpieza explícita de datos de ZFS
Limpieza y actualización de la duplicación de datos de ZFS
Resolución de problemas de espacio ZFS
Informes de espacio del sistema de archivos
Informes de espacio de la agrupación de almacenamiento ZFS
Identificación del tipo de corrupción de datos
Reparación de un archivo o directorio dañado
Reparación de datos dañados con referencias de varios bloques
Reparación de daños en las agrupaciones de almacenamiento de ZFS
Reparación de una configuración de ZFS dañada
Reparación de un sistema que no se puede iniciar
11. Prácticas de ZFS recomendadas por Oracle Solaris
Consulte las siguientes secciones para determinar si los problemas de la agrupación o la no disponibilidad del sistema de archivos están relacionados con un problema de hardware, como placa del sistema, memoria, dispositivo o HBA con errores, o configuración incorrecta.
Por ejemplo, un disco dañado o fallido en una agrupación ZFS ocupada puede degradar en gran medida el rendimiento general del sistema.
Si comienza con el diagnóstico y la identificación de problemas de hardware, que puede ser lo más fácil de detectar, una vez que está todo el hardware comprobado, puede continuar con el diagnóstico de problemas de agrupación y sistema de archivos que se describen en el resto de este capítulo. Si la configuración de hardware, agrupación y sistema de archivos está en buen estado, considere la posibilidad de diagnosticar problemas de aplicaciones, que normalmente son más complejos de solucionar y no están cubiertos en esta guía.
El gestor de errores de Solaris realiza un seguimiento de problemas de software, hardware y dispositivos específicos identificando información de telemetría de error que indica un determinado síntoma en un registro de errores e informando diagnósticos de fallos reales cuando el síntoma del error resulta en un fallo real.
El siguiente comando identifica fallos relacionados con software o hardware.
# fmadm faulty
Utilice el comando anterior de forma rutinaria para identificar servicios o dispositivos con errores.
Utilice el siguiente comando para identificar de forma rutinaria errores relacionados con hardware o dispositivos.
# fmdump -eV | more
Los mensajes de error de este archivo de registro que describen problemas de vdev.open_failed, checksum o io_failure requieren su atención o podrían convertirse en fallos reales que se muestran con el comando fmadm con errores.
Si lo anterior indica que un dispositivo genera errores, es un buen momento para asegurarse de que tiene un dispositivo de sustitución disponible.
También puede realizar un seguimiento de otros errores de dispositivos mediante el comando iostat. Utilice la sintaxis siguiente para identificar un resumen de estadísticas de errores.
# iostat -en ---- errors --- s/w h/w trn tot device 0 0 0 0 c0t5000C500335F95E3d0 0 0 0 0 c0t5000C500335FC3E7d0 0 0 0 0 c0t5000C500335BA8C3d0 0 12 0 12 c2t0d0 0 0 0 0 c0t5000C500335E106Bd0 0 0 0 0 c0t50015179594B6F11d0 0 0 0 0 c0t5000C500335DC60Fd0 0 0 0 0 c0t5000C500335F907Fd0 0 0 0 0 c0t5000C500335BD117d0
En la salida anterior, los errores se notifican en un disco interno c2t0d0. Utilice la siguiente sintaxis para mostrar errores de dispositivos más detallados.
# iostat -En c0t5000C500335F95E3d0 Soft Errors: 0 Hard Errors: 0 Transport Errors: 0 Vendor: SEAGATE Product: ST930003SSUN300G Revision: 0B70 Serial No: 110672QFSB Size: 300.00GB <300000000000 bytes> Media Error: 0 Device Not Ready: 0 No Device: 0 Recoverable: 0 Illegal Request: 0 Predictive Failure Analysis: 0 c0t5000C500335FC3E7d0 Soft Errors: 0 Hard Errors: 0 Transport Errors: 0 Vendor: SEAGATE Product: ST930003SSUN300G Revision: 0B70 Serial No: 110672TE67 Size: 300.00GB <300000000000 bytes> Media Error: 0 Device Not Ready: 0 No Device: 0 Recoverable: 0 Illegal Request: 0 Predictive Failure Analysis: 0 c0t5000C500335BA8C3d0 Soft Errors: 0 Hard Errors: 0 Transport Errors: 0 Vendor: SEAGATE Product: ST930003SSUN300G Revision: 0B70 Serial No: 110672SDF4 Size: 300.00GB <300000000000 bytes> Media Error: 0 Device Not Ready: 0 No Device: 0 Recoverable: 0 Illegal Request: 0 Predictive Failure Analysis: 0 c2t0d0 Soft Errors: 0 Hard Errors: 12 Transport Errors: 0 Vendor: AMI Product: Virtual CDROM Revision: 1.00 Serial No: Size: 0.00GB <0 bytes> Media Error: 0 Device Not Ready: 12 No Device: 0 Recoverable: 0 Illegal Request: 2 Predictive Failure Analysis: 0
Aparte de hacer un constante seguimiento de los errores en la agrupación, ZFS muestra mensajes de syslog cuando se generan eventos de interés. Las siguientes situaciones generan eventos de notificación:
Transición de estados del dispositivo: si un dispositivo pasa a tener el estado FAULTED, ZFS registra un mensaje que indica que la tolerancia a errores del grupo puede estar en peligro. Se envía un mensaje parecido si el dispositivo se conecta posteriormente, con lo cual la agrupación se recupera del error.
Datos dañados: si se detecta cualquier tipo de datos dañados, ZFS registra un mensaje en el que se indica su ubicación y el momento en que tiene lugar. Este mensaje se registra sólo la primera vez que se detecta. Los accesos posteriores no generan ningún mensaje.
Errores de agrupaciones y de dispositivos: si tiene lugar un error de agrupación o dispositivo, el daemon del administrador de errores informa de dichos errores mediante mensajes de syslog y mediante el comando fmdump.
Si ZFS detecta un error de dispositivo y se recupera automáticamente, no se genera ninguna notificación. Esta clase de errores no supone ningún fallo en la redundancia de la agrupación ni la integridad de los datos. Además, esta clase de errores suele ser fruto de un problema de controlador provisto de su propio conjunto de mensajes de error.