Oracle® Solaris 11.2 での障害の管理

印刷ビューの終了

更新: 2014 年 7 月
 
 

障害または欠陥の修復

Oracle 自動サービスリクエスト (ASR) を構成すると、特定のハードウェアの問題が発生したときに Oracle サービスを自動的にリクエストできます。ASR の詳細は、http://www.oracle.com/asr を参照してください。

システム内のコンポーネントに障害が発生している場合、Fault Manager ではそのコンポーネントを暗黙的に修復することも、明示的に修復することもできます。

暗黙的修復

暗黙的修復は、障害のあるコンポーネントに Fault Manager デーモン (fmd) が追跡できるシリアル番号情報が含まれている場合、そのコンポーネントを交換または取り外したときに実行されることがあります。多くの SPARC ベースシステムでは、FMRI にシリアル番号情報が含まれているため、fmd はコンポーネントが交換またはその他の手段 (ブラックリストへの登録など) によって、いつ運用から外されたのかを判定できます。fmd によってコンポーネントが運用から外されたと判断されると、Fault Manager はそのコンポーネントを fmadm faulty の出力に表示しなくなります。そのコンポーネントは、フォルトイベントの発生から 30 日が経過するまで、Fault Manager の内部リソースキャッシュ内に保持されます。

fmd が障害のある CPU またはメモリーリソースを検出すると、それらのリソースはブラックリストに登録されます。ブラックリストに登録されている障害のあるリソースは、fmd によって修復されたとマークされるまで再割り当てできません。

明示的修復

FMRI にシャーシ ID が含まれていても、FRU のシリアル番号情報を使用できない場合があります。この場合、fmd は FRU の交換を検出できないため、次のセクションに示すように、fmadm コマンドを replacedrepaired、または acquit サブコマンドとともに使用して、明示的修復を実行する必要があります。明示的修復は、ドキュメント化された特定の修復手順の指示でのみ実行するようにしてください。

これらの fmadm コマンドは次のオペランドを取ります。

  • UUID は Fault Manager の出力に EVENT-ID としても表示され、フォルトイベントを識別します。UUIDfmadm acquit コマンドでのみ使用できます。イベント全体を無視しても問題ないことを指定したり、ある特定のリソースがこのイベントの疑いではないことを指定したりできます。

  • FMRI および label は、障害発生の疑いがあるリソースを識別します。FMRI およびリソースのラベルの例は、Example 2–1 に示されています。通常は、ラベルの方が FMRI よりも簡単に使用できます。

あるケースが修復済みと見なされるのは、フォルトイベントの UUID の疑いがなくなった場合、あるいは疑いのあるすべてのリソースが修復、交換、または取り外されたか、疑いがなくなった場合です。修復済みとなったケースは FMD_CASE_REPAIRED 状態に移行し、Fault Manager によって list.repaired イベントが生成されます。