この機能は、Solaris Express 6/04 で新しく追加されました。Solaris Express 10/04 と Solaris 10 3/05 では、重要な拡張が施されました。
Sun は、予測的自己修復に対応したシステムとサービスを構築および配布するために、新しいアーキテクチャーを開発しました。自己修復技術により、ソフトウェアとハードウェアに障害が発生したときでも、Sun のシステムとサービスの稼働率を最大化できます。また、システム管理者とサービスプロバイダの管理作業をより簡素化し、より効率的なエンドツーエンドの管理を実現できるため、コストも削減されます。この自己修復機能によって実現された新機能の主要セットが、Solaris 10 OS から利用できるようになりました。Solaris 10 ソフトウェアには、CPU、メモリー、入出力バスの連結コンポーネント、およびシステムサービスの自己修復を容易にするためのコンポーネントが用意されています。
この新しいアーキテクチャーのコンポーネントに関する具体的な説明については、次の「Solaris サービスマネージャー」および「Solaris Fault Manager」を参照してください。
Solaris Express 10/04 で導入され、Solaris 10 3/05 で拡張された Solaris サービスマネージャーは、従来の UNIX 起動スクリプト、init 実行レベル、および構成ファイルを拡張するための基盤を提供します。 この基盤が提供する機能は次のとおりです。
サービスで障害が発生した場合、その発生原因が管理者のミス、ソフトウェアのバグ、修復不能なハードウェアエラーのいずれであるかにかかわらず、それらのサービスを依存関係の順序に従って自動的に再起動します。
表示可能なサービスオブジェクトを新しいコマンド svcs を使って作成したり、管理可能なサービスオブジェクトをコマンド svcadm と svccfg を使って作成したりします。また、svcs -p で、SMF サービスと従来の init.d スクリプトの両方に対し、サービスとプロセス間の関係を表示することも可能です。
サービスのバックアップ、復元、および変更の取り消しを簡単に行えるように、サービス構成の自動スナップショットを実行します。
デバッグを容易にします。ユーザーは、svcs -x を使用することでサービスに関する質問を行い、サービスが実行されていない理由の説明を受け取ることができます。また、この処理は、各サービスの個別の永続的なログファイルを使用するとより楽に行えます。
プロパティーの変更やシステム上のサービスの起動、停止、再起動といった作業を管理者がスーパーユーザー以外のユーザーに安全に委譲する機能を強化します。
大規模システムにおけるブートを高速化します。これは、サービス間の依存関係に従って各サービスを並列的に起動することで実現しています。シャットダウン時にはその逆の処理が実行されます。
ブートコンソール出力のカスタマイズが可能で、出力を可能なかぎり抑制するモード (デフォルト)、boot -m verbose による冗長モードのいずれかを選択できます。
可能な場合には既存の管理業務との互換性を維持します。たとえば、顧客および ISV から提供される rc スクリプトの大部分は、通常どおり動作します。
smf(5) プロファイルに示されている 2 つのモードのうちいずれかを使ってシステムサービスを構成できます。「generic_open.xml」プロファイルは、以前の Solaris OS でデフォルトで有効になっていた従来のインターネットサービスすべてを有効にします。「generic_limited_net.xml」プロファイルは、システムのセキュリティーを強化する過程で無効になることが多いサービスの大部分を無効にします。しかし、このプロファイルは Solaris Security Toolkit (JASS) ツールの代替としては使用できません。詳細は個々のプロファイルを参照してください。
この基盤の詳細については、『Solaris のシステム管理 (基本編)』の「サービスの管理 (概要)」を参照してください。この基盤の概要については、smf(5) のマニュアルページを参照してください。
予測的自己修復システムに、簡潔な管理モデルが含まれています。従来のエラーメッセージは遠隔測定イベントと置き換わり、いくつかのソフトウェアコンポーネントによって管理されます。これらのソフトウェアコンポーネントは、配下の障害または欠陥を自動的に診断し、自己修復処理を開始します。自己修復処理の例として、管理者へのメッセージ送信、障害の発生したコンポーネントの特定または停止、案内付きの修復などがあります。新しいソフトウェアコンポーネントの 1 つは、Fault Manager (fmd(1M)) と呼ばれます。Fault Manager は、遠隔測定、ログファイル、およびコンポーネントを管理します。また、Solaris 10 OS では、Fault Manager や新しいログファイルと対話するツール fmadm(1M)、fmdump(1M)、および fmstat(1M) も利用できます。
Fault Manager は、必要に応じて、問題を検出したことを管理者に通知するために、syslogd(1M) サービスにメッセージを送信します。このメッセージでは、管理者に Sun の新しいメッセージ Web サイト http://www.sun.com/msg/ の記事が示されます。このサイトには、問題の影響および適切な対応と修復処置が詳しく説明されています。
Solaris Express 6/04 では、UltraSPARC-III および UltraSPARC-IV の CPU とメモリーシステムを自動的に診断および回復するための自己修復コンポーネントが提供されました。このリリースでは、PCI ベースの入出力の回復と遠隔測定の機能も向上しています。