Cette fonction est toute nouvelle dans Solaris Express version 6/04. La version 10/04 de Solaris Express et la version 3/05 de Solaris 10 ont apporté des améliorations importantes.
Sun Microsystems a développé une nouvelle architecture de construction et de déploiement de systèmes et services capables d'autorétablissement prédictif. La technologie d'autorétablissement permet aux systèmes et services Sun de maximiser la disponibilité lorsque des erreurs matérielles et logicielles se produisent. De plus, elle rend l'utilisation de bout en bout plus simple et efficace pour les administrateurs système et les fournisseurs de services, permettant ainsi de réduire les coûts. Le premier ensemble important de ces nouvelles fonctions découlant de cette initiative est disponible dans le SE Solaris 10. Le logiciel Solaris 10 contient des composants qui facilitent l'autorétablissement de la CPU, de la mémoire, des composants Nexus du bus d'entrée-sortie et des services système.
Des informations détaillées sur les composants de cette nouvelle architecture sont proposées dans les descriptions suivantes de Solaris Service Manager et Solaris Fault Manager.
Introduit dans la version 10/04 de Solaris Express et amélioré dans la version 3/05 de Solaris 10, Solaris Service Manager offre une infrastructure qui augmente les scripts de démarrage UNIX, les niveaux d'exécution init et les fichiers de configuration. Cette infrastructure fournit les fonctions suivantes :
redémarrage automatique des services après échec par ordre de dépendance, que les services aient échoué suite à une erreur de l'administrateur, à un bogue logiciel ou à une défaillance matérielle impossible à réparer ;
conversion des services en objets pouvant être affichés à l'aide de la nouvelle commande svcs et gérés à l'aide des commandes svcadm et svccfg ; possibilité d'afficher les relations entre services et processus à l'aide de la commande svcs -p, à la fois pour les services SMF et des scripts init.d hérités ;
facilité de sauvegarde, restauration et annulation de modifications apportées aux services par la prise automatique d'instantanés de la configuration des services ;
facilité de débogage : vous pouvez poser des questions concernant les services et obtenir une explication sur la raison du non-fonctionnement d'un service à l'aide de la commande svcs - x (ce processus est également facilité par des fichiers journaux distincts et persistants pour chaque service) ;
amélioration de la capacité de délégation de tâches de manière sécurisée aux utilisateurs non root par les administrateurs, y compris la possibilité de modifier des propriétés, et de démarrer, d'arrêter ou de redémarrer les services sur le système ;
initialisation plus rapide sur les gros systèmes grâce au démarrage des services en parallèle en fonction des dépendances des services (le processus inverse se produit au cours de l'arrêt) ;
possibilité de personnalisation de la sortie de la console d'initialisation soit pour qu'elle soit aussi silencieuse que possible (valeur par défaut), soit pour qu'elle soit détaillée, à l'aide de la commande boot - m verbose ;
maintien de la compatibilité avec les pratiques administratives existantes dans les environnements le permettant. Par exemple, la plupart des scripts rc utilisateur et ISV fonctionnent toujours de la même manière ;
possibilité de configurer les services du système sous l'un des deux modes, tous deux représentés comme des profils smf(5). Le profil “generic_open.xml” active tous les services Internet classiques précédemment activés par défaut dans le système d'exploitation Solaris. Le profil “generic_limited_net.xml” désactive un grand nombre de services souvent désactivés lors du processus de renforcement d'un système. Cependant, ce profil ne peut remplacer l'outil Solaris Security Toolkit (JASS). Pour plus de détails, reportez-vous aux profils individuels.
Voir le chapitre 9, “Managing Services (Overview)”, du System Administration Guide: Basic Administration pour plus d'informations sur cette infrastructure. Vous trouverez une présentation de l'infrastructure sur la page de manuel smf(5).
Les systèmes à autorétablissement prédictif incluent un modèle d'administration simplifié. Les messages d'erreur classiques sont remplacés par des événements de télémesure qui sont utilisés par les composants logiciels. Les composants logiciels diagnostiquent automatiquement l'erreur ou le défaut sous-jacent et lancent les activités d'autorétablissement. Exemples d'activités d'autorétablissement : messagerie de l'administrateur, isolement ou désactivation des composants défaillants, réparation guidée. Le nouveau composant logiciel s'appelle Fault Manager, fmd(1M). Il gère la télémesure, les fichiers journaux et les composants. Les nouveaux outils fmadm(1M), fmdump(1M) et fmstat(1M) sont également disponibles sur le système d'exploitation Solaris 10 pour interagir avec Fault Manager et les nouveaux fichiers journaux.
Lorsque cela s'avère nécessaire, Fault Manager envoie un message au service syslogd(1M) pour avertir l'administrateur qu'un problème a été détecté. Ce message dirige l'administrateur vers un article de la base de connaissances du site Web de Sun, http://www.sun.com/msg/, qui fournit plus d'explications sur l'impact du problème et propose les réponses appropriées ainsi que les réparations à effectuer.
Solaris Express 6/04 a introduit les composants d'autorétablissement pour le diagnostic automatisé et la réparation des processeurs UltraSPARC-III et UltraSPARC-IV, ainsi que des systèmes de mémoire. Cette version propose également une résilience améliorée et la télémesure pour les E/S sur bus PCI.