複雑なシステムの場合と同様に、ファームの状態が推移するときには、エラーが発生する可能性があります。 こうしたエラーは、ただちに修復できなければなりません。 エラー状態の解決には、次の一般的な方法を使用します。
ファーム要求が失敗したことを確認します。
エラー状態を確認して、問題を診断します。
問題を修正します。たとえば、障害が発生したサーバーを置き換えたり、ファームリソースを解放したり、ネットワークの問題を解決したりします。 次に、farm -af コマンドを実行してファームを起動します。
代わりに、問題を回避することもできます。たとえば、要求を削除してファームを元の状態に戻す方法や、ファームを削除して処理をやり直す方法があります。
論理サーバーファーム内の各デバイスは、継続して可用性を監視されます。 デバイスに障害が発生すると、監視機能により警告が発行されます。 N1 Provisioning Server ソフトウェアは、同じ構成の別の物理デバイスを自動的に起動し、障害が発生したデバイスを置き換えます。 このような場合、フェイルオーバーは予想された動作であり、エラーメッセージは生成されません。
ほとんどのエラー状態は、管理者が診断および解決できます。 しかし、稀に、Sun サービスプロバイダが解決しなければならないエラー状態もあります。
高度な障害の種類には、リソース層のデバイス障害、つまりデバイスとネットワークの障害、構成エラー、またはリソース不足、ソフトウェア構成エラー、ソフトウェアエラー、制御プレーンのエラーなどが含まれます。 ファームの起動時には、次のような障害が発生する可能性があります。
リソース不足のため処理を完了できない
プロビジョニング可能なサーバー (PES) の構成の問題
ネットワークの問題
ワイヤリングの問題
その他の障害も存在します。 さまざまなデバイスとシステムが使用されるため、多くの障害ポイントを調査する必要があります。 しかし、次の場合、問題が発生していることがわかります。
Control Center の「Administration」画面で、「Farm Request」ダイアログの「Message」セクションに障害ステータスが表示されている
Control Center のメイン画面と「Editor」画面の「Farm Details」セクションに障害が発生した要求が表示されている
farm -l farm_ID コマンドを実行したとき、ファームの ERROR が 1000 以外の非ゼロ値で、ファームが適切な状態にない