Novedades de Solaris 10

Recuperación automática predecible

Esta función es nueva en la versión Solaris Express 6/04. Las versiones Solaris Express 10/04 y Solaris 10 3/05 aportan mejoras importantes.

Sun Microsystems ha desarrollado una nueva arquitectura para crear e implementar sistemas y servicios que cuentan con la función de recuperación automática predecible. La tecnología de recuperación automática predecible hace posible que los sistemas y los servicios de Sun presenten una mayor disponibilidad cuando se produce un fallo de software o hardware. Además, con dicha tecnología se obtiene una experiencia integral mucho más sencilla y eficaz para los administradores de sistemas y los proveedores de servicios, reduciendo así los costes. El primer conjunto principal de funciones nuevas que se obtiene de esta iniciativa está disponible en el sistema operativo Solaris 10. El software Solaris 10 incluye componentes que facilitan la recuperación automática de los siguientes elementos: la CPU, la memoria, los componentes que sirven de unión para el bus de E/S y los servicios de sistemas.

Los detalles específicos acerca de estos componentes de la nueva arquitectura figuran en las siguientes descripciones de Solaris Service Manager y Solaris Fault Manager.

Solaris Service Manager

Incluido por primera vez en la versión Solaris Express 10/04 y mejorado en la versión Solaris 10 3/05, Solaris Service Manager proporciona una infraestructura que amplía las secuencias de comandos de inicio tradicionales de UNIX, los niveles de ejecución y los archivos de configuración. Esta infraestructura proporciona las siguientes funciones:

Consulte el capítulo 9, "Managing Services (Overview)", de la System Administration Guide: Basic Administration para obtener más información acerca de esta infraestructura. La página de comando man smf(5) incluye una descripción general de la infraestructura.

Solaris Fault Manager

Los sistemas que cuentan con recuperación automática predecible incluyen un modelo de administración simplificada. Los mensajes de error tradicionales se sustituyen por eventos de telemetría que son consumidos por los componentes de software. Los componentes de software diagnostican automáticamente el error o defecto subyacente e inician tareas de recuperación automática. Entre los ejemplos de actividades de recuperación automática se pueden destacar el envío de mensajes al administrador, el aislamiento o la desactivación de los componentes con errores y la reparación orientada. Existe un nuevo componente de software llamado Solaris Fault Manager, fmd(1M). Solaris Fault Manager administra la telemetría, los archivos de registro y los componentes. Las nuevas herramientas fmadm(1M), fmdump(1M) y fmstat(1M) también están disponibles en el sistema operativo Solaris 10 para interactuar Fault Manager y los nuevos archivos de registro.

Cuando sea pertinente, Solaris Fault Manager envía un mensaje al servicio syslogd(1M) para notificar a un administrador que se ha detectado un problema. El mensaje remite al administrador a un artículo con información al respecto del sitio web de mensajes nuevos de Sun, http://www.sun.com/msg/, donde se explica de forma detallada la repercusión del problema, qué decisiones se deben adoptar y las acciones necesarias para la reparación.

La versión Solaris Express 6/04 introdujo componentes de recuperación automática que efectuaban tareas de diagnóstico automatizado y recuperación para CPU UltraSPARC-III y UltraSPARC-IV y para sistemas de memoria. Esta versión también proporcionaba una resilencia y una telemetría mejoradas para E/S basadas en PCI.