Esta función es nueva en la versión Solaris Express 6/04. Las versiones Solaris Express 10/04 y Solaris 10 3/05 aportan mejoras importantes.
Sun Microsystems ha desarrollado una nueva arquitectura para crear e implementar sistemas y servicios que cuentan con la función de recuperación automática predecible. La tecnología de recuperación automática predecible hace posible que los sistemas y los servicios de Sun presenten una mayor disponibilidad cuando se produce un fallo de software o hardware. Además, con dicha tecnología se obtiene una experiencia integral mucho más sencilla y eficaz para los administradores de sistemas y los proveedores de servicios, reduciendo así los costes. El primer conjunto principal de funciones nuevas que se obtiene de esta iniciativa está disponible en el sistema operativo Solaris 10. El software Solaris 10 incluye componentes que facilitan la recuperación automática de los siguientes elementos: la CPU, la memoria, los componentes que sirven de unión para el bus de E/S y los servicios de sistemas.
Los detalles específicos acerca de estos componentes de la nueva arquitectura figuran en las siguientes descripciones de Solaris Service Manager y Solaris Fault Manager.
Incluido por primera vez en la versión Solaris Express 10/04 y mejorado en la versión Solaris 10 3/05, Solaris Service Manager proporciona una infraestructura que amplía las secuencias de comandos de inicio tradicionales de UNIX, los niveles de ejecución y los archivos de configuración. Esta infraestructura proporciona las siguientes funciones:
Reinicia automáticamente los servicios que hayan fallado en orden de dependencia, independientemente de si los servicios han fallado como consecuencia de un error del administrador, un fallo de software o un problema de hardware que no se pueda solucionar.
Convierte en servicios los objetos que se pueden ver (con el nuevo comando svcs) y que se pueden gestionar (con los comandos svcadm y svccfg). También es posible ver las relaciones existentes entre los servicios y los procesos usando svcs -p, tanto para servicios SMF como para secuencias de comandos init.d heredadas.
Facilita el hacer copias de seguridad de los cambios efectuados en los servicios mediante la realización de instantáneas automáticas de las configuraciones de los servicios. Restablecer y deshacer dichos cambios también es mucho más sencillo.
Facilita la depuración. Con el comando svcs -x, es posible formular preguntas sobre los servicios y recibir explicaciones acerca de por qué un servicio no se está ejecutando. Asimismo, este proceso se ve facilitado por el uso de archivos de registro individuales y persistentes para cada servicio.
Mejora la capacidad de los administradores para delegar de forma segura tareas en usuarios que no sean root, incluida la posibilidad de modificar propiedades e iniciar, detener o reiniciar servicios en el sistema.
Agiliza el arranque en sistemas grandes puesto que inicia los servicios de forma paralela, según sus relaciones de dependencia. Para apagar los sistemas se lleva a cabo el proceso contrario.
Permite la personalización de la salida de la consola de arranque para que sea lo más reducida posible (que es el valor predeterminado) o para que sea lo más detallada posible, usando el comando boot -m verbose.
Mantiene la compatibilidad con las prácticas administrativas existentes siempre que sea posible. Por ejemplo, la mayoría de las secuencias de comandos RC proporcionadas por ISV y las de los clientes siguen funcionando como siempre.
Le permite configurar los servicios del sistema de dos formas, ambas representadas como perfiles smf(5. ) El perfil “generic_open.xml” habilita todos los servicios de Internet tradicionales que estaban habilitados de forma predeterminada en el SO Solaris. El perfil “generic_limited_net.xml” deshabilita un gran número de servicios que están deshabilitados con frecuencia durante el proceso de reforzamiento del sistema. Sin embargo, este perfil no sustituye a la herramienta Solaris Security Toolkit (JASS). Consulte cada perfil para obtener más información.
Consulte el capítulo 9, "Managing Services (Overview)", de la System Administration Guide: Basic Administration para obtener más información acerca de esta infraestructura. La página de comando man smf(5) incluye una descripción general de la infraestructura.
Los sistemas que cuentan con recuperación automática predecible incluyen un modelo de administración simplificada. Los mensajes de error tradicionales se sustituyen por eventos de telemetría que son consumidos por los componentes de software. Los componentes de software diagnostican automáticamente el error o defecto subyacente e inician tareas de recuperación automática. Entre los ejemplos de actividades de recuperación automática se pueden destacar el envío de mensajes al administrador, el aislamiento o la desactivación de los componentes con errores y la reparación orientada. Existe un nuevo componente de software llamado Solaris Fault Manager, fmd(1M). Solaris Fault Manager administra la telemetría, los archivos de registro y los componentes. Las nuevas herramientas fmadm(1M), fmdump(1M) y fmstat(1M) también están disponibles en el sistema operativo Solaris 10 para interactuar Fault Manager y los nuevos archivos de registro.
Cuando sea pertinente, Solaris Fault Manager envía un mensaje al servicio syslogd(1M) para notificar a un administrador que se ha detectado un problema. El mensaje remite al administrador a un artículo con información al respecto del sitio web de mensajes nuevos de Sun, http://www.sun.com/msg/, donde se explica de forma detallada la repercusión del problema, qué decisiones se deben adoptar y las acciones necesarias para la reparación.
La versión Solaris Express 6/04 introdujo componentes de recuperación automática que efectuaban tareas de diagnóstico automatizado y recuperación para CPU UltraSPARC-III y UltraSPARC-IV y para sistemas de memoria. Esta versión también proporcionaba una resilencia y una telemetría mejoradas para E/S basadas en PCI.