Go to main content
Oracle® Solaris 11.3 での障害、欠陥、およびアラートの管理

印刷ビューの終了

更新: 2015 年 10 月
 
 

障害または欠陥の修復

Oracle 自動サービスリクエスト (ASR) を構成すると、特定のハードウェアの問題が発生したときに Oracle サービスを自動的にリクエストできます。詳細は、http://www.oracle.com/us/support/auto-service-request/ を参照してください。

システム内のコンポーネントに障害が発生している場合、Fault Manager ではそのコンポーネントを暗黙的に修復することも、明示的に修復することもできます。

暗黙的修復

暗黙的修復は、障害のあるコンポーネントに Fault Manager デーモン (fmd) が追跡できるシリアル番号情報が含まれている場合、そのコンポーネントを交換したときに実行されることがあります。その他の多くのシステムでは、fmd がいつコンポーネントが交換されたかを判別できるように、シリアル番号情報が FMRI に含まれています。コンポーネントが交換され、交換されたコンポーネントが正常に使用され始めたと fmd が判断すると、Fault Manager は fmadm list の出力にそのコンポーネントを表示しなくなります。そのコンポーネントは、フォルトイベントの発生から 30 日が経過するまで、Fault Manager の内部リソースキャッシュ内に保持されます。

fmd がハードウェアの一部で障害を検出すると、そのハードウェアは、システムに悪影響を及ぼさないように停止されることがあります。ハードウェアの停止は、Solaris が問題を診断した場合も ILOM が問題を診断した場合も実行される可能性があります。ハードウェアの停止は通常、診断メッセージの「Response」セクションに報告されます。

明示的修復

FMRI にシャーシ ID が含まれていても、FRU のシリアル番号情報を使用できない場合があります。この場合、fmd は FRU の交換を検出できないため、次のセクションに示すように、fmadm コマンドを replacedrepaired、または acquit サブコマンドとともに使用して、明示的修復を実行する必要があります。明示的修復は、ドキュメント化された特定の修復手順の指示でのみ実行するようにしてください。

これらの fmadm コマンドは次のオペランドを取ります。

  • UUID は Fault Manager の出力に EVENT-ID としても表示され、フォルトイベントを識別します。UUIDfmadm acquit コマンドでのみ使用できます。イベント全体を無視しても問題ないことを指定したり、ある特定のリソースがこのイベントの疑いではないことを指定したりできます。

  • FMRI および label は、障害発生の疑いがあるリソースを識別します。FMRI およびリソースのラベルの例は、使用例 1 に示されています。通常は、ラベルの方が FMRI よりも簡単に使用できます。

あるケースが修復済みとみなされるのは、フォルトイベントの UUID が赦免された場合、または疑いのあるすべてのリソースが修復、交換、または赦免された場合です。修復済みとなったケースは repaired 状態に移行し、Fault Manager によって list.repaired イベントが生成されます。

fmadm replaced コマンド

疑いのある FRU が交換されたことを示すには、fmadm replaced コマンドを使用します。1 台の FRU に対して複数の障害が現時点で報告されている場合、その FRU はすべてのケースで交換済みとして表示されます。

fmadm replaced FMRI | label

FRU が交換されると、その FRU のシリアル番号が変わります。FRU のシリアル番号が変更されたことを fmd が自動的に検出した場合は、fmadm replaced コマンドを入力した場合と同じように Fault Manager が動作します。FRU のシリアル番号が変更されたかどうかを fmd が検出できない場合は、FRU を交換した際に fmadm replaced コマンドを入力する必要があります。FRU のシリアル番号が変更されていないことを fmd が検出した場合、fmadm replaced コマンドはエラーを表示して終了します。

FRU を取り外したが、交換しない場合、Fault Manager はその疑いを not present として表示します。

fmadm repaired コマンド

FRU の交換以外の物理的な修復を行なって問題を解決したときは、fmadm repaired コマンドを使用します。このような修復の例として、カードの再装着や曲がったピンの修正などがあります。1 台の FRU に対して複数の障害が現時点で報告されている場合、その FRU はすべてのケースで修復済みとして表示されます。

fmadm repaired FMRI | label

fmadm acquit コマンド

示されているリソースが障害の原因ではないと判断した場合は、acquit サブコマンドを使用します。通常は、Fault Manager が複数の要素を含む疑いリスト内のいくつかの疑いを自動的に赦免します。赦免は、追加のエラーイベントが発生した場合など、Fault Manager によって診断が絞り込まれたときに暗黙的に行われることもあります。場合によっては、サポートサービスから手動で赦免するよう指示されることもあります。

交換は修復より優先され、交換と修復はどちらも赦免より優先されます。したがって、コンポーネントを赦免してからコンポーネントを修復することはできますが、すでに修復されているコンポーネントを赦免することはできません。

FMRI または label のどちらも UUID とともに指定しない場合は、そのイベント全体が無視可能であるとして識別されます。あるケースが修復済みとみなされるのは、フォルトイベントの UUID が赦免された場合です。

fmadm acquit UUID

リソースが疑いとされる現在のどのケースでも、そのリソースが要因ではないと判断した場合にのみ、UUID を使わずに FMRI またはラベルによって赦免します。1 台の FRU に対して複数の障害が現時点で報告されている場合、その FRU はすべてのケースで疑いがなくなったとして表示されます。

fmadm acquit FMRI fmadm acquit label

リソースをあるケースでは赦免し、そのほかのケースでは疑いのままにするには、次の例に示すように、フォルトイベントの UUID とリソースの FMRI の両方を指定するか、UUID とリソースラベルの両方を指定します。

fmadm acquit FMRI UUID fmadm acquit label UUID