Questa funzione è stata introdotta in Solaris Express 6/04. Le versioni Solaris Express 10/04 e Solaris 10 3/05 hanno introdotto diversi miglioramenti importanti.
Sun Microsystems ha sviluppato una nuova architettura per la creazione e la distribuzione di sistemi e servizi con capacità di autocorrezione preventiva (Predictive Self-Healing). La tecnologia di autocorrezione consente ai sistemi e ai servizi Sun di aumentare al massimo la disponibilità quando si verificano errori del software o dell'hardware. Oltre a questo, la tecnologia di autocorrezione offre agli amministratori di sistema e ai fornitori di servizi una visione del sistema più completa ed efficace, riducendo i costi. Il primo importante gruppo di nuove funzioni provenienti da questa iniziativa è disponibile in Solaris 10. Questa versione di Solaris include componenti che facilitano la correzione automatica per la CPU, la memoria, i componenti nexus dei bus di I/O e i servizi di sistema.
Informazioni specifiche sui componenti di questa nuova architettura sono riportate nelle descrizioni di Solaris Service Manager e Solaris Fault Manager.
Introdotto in Solaris Express 10/04 e migliorato in Solaris 10 3/05, Solaris Service Manager offre un'infrastruttura che migliora gli script di avvio, i livelli di esecuzione init e i file di configurazione tradizionali di UNIX. Questa infrastruttura include le seguenti funzioni:
Riavvia automaticamente i servizi interrotti in ordine di dipendenza, sia che l'interruzione sia stata causata da un errore di amministrazione, da un difetto del software o da un errore hardware non correggibile.
Presenta i servizi come oggetti, offrendo la possibilità di visualizzarli con il nuovo comando svcs e di gestirli con i comandi svcadm e svccfg. È inoltre possibile visualizzare le relazioni tra servizi e processi utilizzando svcs -p, sia per i servizi SMF che per gli script init.d tradizionali.
Semplifica il backup, il ripristino e l'annullamento delle modifiche ai servizi catturando immagini automatiche delle loro configurazioni.
Semplifica il debugging. È possibile porre domande sui servizi e ricevere spiegazioni sulla loro mancata esecuzione utilizzando svcs -x. Questo processo è ulteriormente semplificato dall'utilizzo di file di log individuali e permanenti per ogni servizio.
Consente agli amministratori di delegare con maggiore sicurezza agli utenti non root una serie di attività, ad esempio la possibilità di modificare le proprietà e di avviare, arrestare o riavviare i servizi sul sistema.
Velocizza i processi di avvio dei sistemi di grandi dimensioni avviando i servizi in parallelo in base alle loro dipendenze. Il processo opposto si verifica durante l'arresto.
Permette di personalizzare l'output della console di avvio riducendo al minimo i messaggi visualizzati, come nell'impostazione predefinita, o impostando la visualizzazione di un maggior numero di messaggi con il comando boot -m verbose.
Ove possibile, preserva la compatibilità con le procedure di amministrazione precedenti. Ad esempio, la maggior parte degli script rc personalizzati o definiti dagli ISV può continuare ad essere utilizzata normalmente.
Permette di configurare i servizi di sistema in due modi, entrambi rappresentati come profili smf(5. ) Il profilo “generic_open.xml” abilita tutti i servizi Internet tradizionali che nelle precedenti versioni di Solaris erano abilitati per impostazione predefinita. Il profilo “generic_limited_net.xml” disabilita numerosi servizi che spesso vengono disabilitati nel processo di irrobustimento del sistema. Tuttavia, questo profilo non può essere considerato equivalente al Solaris Security Toolkit (JASS). Per maggiori dettagli, vedere i singoli profili.
Per maggiori informazioni su questa infrastruttura, vedere il Capitolo 9, “Managing Services (Overview)”, in System Administration Guide: Basic Administration Per una descrizione generale dell'infrastruttura, vedere la pagina man smf(5).
I sistemi dotati di autocorrezione preventiva includono un modello di amministrazione semplificato. I normali messaggi di errore vengono sostituiti da eventi trasmessi a distanza che vengono elaborati dai componenti software. Questi componenti software diagnosticano automaticamente il tipo di errore o difetto riscontrato e avviano le appropriate attività di autocorrezione. Alcuni esempi di queste attività di autocorrezione includono l'invio di messaggi agli amministratori, l'isolamento o la disattivazione dei componenti guasti e la riparazione guidata. È ora disponibile un nuovo componente software denominato Fault Manager, fmd(1M). Fault Manager è in grado di gestire la telemetria, i file di log e i componenti. Inoltre, in Solaris 10 sono disponibili i nuovi strumenti fmadm(1M), fmdump(1M) e fmstat(1M) per le interazioni con Fault Manager e i nuovi file di log.
Nelle occasioni appropriate, il Fault Manager invia un messaggio al servizio syslogd(1M) per notificare a un amministratore che è stato rilevato un problema. Il messaggio indirizza gli amministratori a un articolo presente nel nuovo sito Web dei messaggi di Sun, http://www.sun.com/msg/, che illustra in maggiore dettaglio l'impatto del problema e le appropriate risposte e azioni correttive.
La versione Solaris Express 6/04 ha introdotto componenti di autocorrezione per la diagnosi e il ripristino automatico delle CPU UltraSPARC-III e UltraSPARC-IV e dei sistemi di memoria. Sono inoltre state migliorate le caratteristiche di resilienza e telemetria per gli I/O PCI.