Solaris Fault Manager は、エラーログ内の具体的な兆候を示すエラー遠隔監視情報を特定し、エラーの兆候が実際の障害になったときに実際の障害診断を報告することにより、ソフトウェア、ハードウェア、および特定のデバイスの問題を追跡します。
次のコマンドは、ソフトウェアまたはハードウェア関連の障害を特定します。
# fmadm faulty
障害が発生したサービスまたはデバイスを特定するには、上記のコマンドを定期的に使用します。
ハードウェアまたはデバイス関連のエラーを特定するには、次のコマンドを定期的に使用します。
# fmdump -eV | more
このログファイルのエラーメッセージは、vdev.open_failed、checksum、または io_failure の問題を示しており、fmadm 障害コマンドで表示される実際の障害に発展する可能性があるため、注意が必要です。
上記によってデバイスに障害が発生していることが示された場合は、交換用デバイスが用意されているかどうかを確認することをお勧めします。
iostat コマンドを使用して、その他のデバイスエラーを追跡することもできます。エラー統計のサマリーを確認するには、次の構文を使用します。
# iostat -en ---- errors --- s/w h/w trn tot device 0 0 0 0 c0t5000C500335F95E3d0 0 0 0 0 c0t5000C500335FC3E7d0 0 0 0 0 c0t5000C500335BA8C3d0 0 12 0 12 c2t0d0 0 0 0 0 c0t5000C500335E106Bd0 0 0 0 0 c0t50015179594B6F11d0 0 0 0 0 c0t5000C500335DC60Fd0 0 0 0 0 c0t5000C500335F907Fd0 0 0 0 0 c0t5000C500335BD117d0
上記の出力では、内部ディスク c2t0d0 のエラーが報告されています。より詳細なデバイスエラーを表示するには、次の構文を使用します。
再試行またはリセットについて言及する永続的な SCSI トランスポートエラーは、ダウン改訂ファームウェア、不良ディスク、不良ケーブル、または障害が発生したるハードウェア接続によって引き起こされる可能性があります。一部の一時的なトランスポートエラーは、HBA またはデバイスファームウェアをアップグレードすることで解決することがあります。トランスポートエラーがファームウェアの更新後も持続し、すべてのデバイスが作動していると思われる場合は、ハードウェアコンポーネント間に不良ケーブルまたはほかの障害が発生した接続がないか調べます。