Go to main content
Oracle® Server Management Agents for Oracle Solaris 11.3 ユーザーズガイド

印刷ビューの終了

更新: 2017 年 3 月
 
 

ディスクイベントのモニタリング

Oracle Hardware Management Pack には、独立したボリュームであるのか、RAID ボリュームであるのかに関係なく、Sun Storage 6 Gb SAS PCIe 内蔵 HBA (SGX-SAS6-INT-Z) に接続されたディスクからディスクエラーおよび SMART イベントを収集するように拡張された診断機能が含まれます。

このように拡張された診断イベントは、ハードウェア管理エージェントの実行中に収集され、/var/log/ssm/event.log に記録されます。

次の表には、ログに記録された拡張診断イベントが一覧表示されています。

ログ内のイベント名
説明
PD_RECOVERED_ERROR
回復したディスクエラーが検出されました。
PD_BAD_DEVICE_FAULT
コマンドの実行中に、デバイスで回復不可能なドライブ障害が検出されました。
PD_MEDIA_ERROR
デバイスで回復不可能なメディアエラーが検出されました。
PD_DEVICE_ERROR
デバイスで回復不可能なハードウェア障害が検出されました。デバイスがオフラインになっているか、機能が低下している可能性があります。
PD_TRANSPORT_ERROR
トランスポートが不安定であるため、デバイスへのパスの構成が解除されました。
PD_OVER_TEMPERATURE
ディスクの SMART プロセスによってクリティカルな温度が報告されています。
PD_SELF_TEST_FAILURE
1 回以上のディスクの SMART 自己診断に失敗しました。
PD_PREDICTIVE_FAILURE
SMART ヘルスモニタリングファームウェアはディスク障害が差し迫っていることを報告しました。

コントローラは各物理ディスクを定期的な間隔でポーリングします。ディスクエラーが発生すると、コントローラによってイベントが生成されます。そのイベントはハードウェア管理エージェントによって取得され、ハードウェア管理イベントログに入れられます。

ハードウェア管理イベントログ内のイベント情報を表示するには、次のように入力します。

# view /var/log/ssm/event.log

拡張された診断ディスクイベントの場合は、次のような情報が表示されます。

Thu Apr 30 12:32:31 2015:(CLI) Event Name  : PD_MEDIA_ERROR
Thu Apr 30 12:32:31 2015:(CLI) Event Description : A medium error was 
detected by the device that was non-recoverable.
Thu Apr 30 12:32:31 2015:(CLI) ASC  : 0x10
Thu Apr 30 12:32:31 2015:(CLI) ASCQ : 0x3
Thu Apr 30 12:32:31 2015:(CLI) Sense Key : 0x3
Thu Apr 30 12:32:31 2015:(CLI) Source : LSI
Thu Apr 30 12:32:31 2015:(CLI) SAS Address : 0x5000cca01200fadd
Thu Apr 30 12:32:31 2015:(CLI) LSI Description : Unexpected sense: PD 
0c(e0xfc/s1) Path 5000cca01200fadd, CDB: 2f 00 00 fc 4d 42 00 10 00 00, 
Sense: 3/10/03
Thu Apr 30 12:32:31 2015:(CLI) Event TimeStamp : 04/30/2015 ; 19:30:25
Thu Apr 30 12:32:31 2015:(CLI) Node ID : 00000000:12
Thu Apr 30 12:32:31 2015:(CLI) Nac Name : /SYS/HDD1
Thu Apr 30 12:32:31 2015:(CLI) Serial Number : 001015N0JPXA   PMG0JPXA
Thu Apr 30 12:32:31 2015:(CLI) WWN No : PDS:5000cca01200fadd
Thu Apr 30 12:32:31 2015:(CLI) Disk Model : H106030SDSUN300G

イベント一覧の情報を使用すると、問題が発生しているシステム内の物理ディスクを特定できます。Oracle ILOM の NAC 名などの情報 (システムのフロントパネル上のラベルに一致) およびドライブのシリアル番号は、システム内のディスクおよびそのドライブスロットを識別する際に役立ちます。


注 -  PD_OVER_TEMPERATURE、PD_SELF_TEST_FAILURE および PD_PREDICTIVE_FAILURE イベントの場合、Oracle ILOM を使用して積極的な警告を構成します。

このドキュメントで説明したその他のディスク診断イベントの場合は、ディスクの問題が疑われるときに、これらのディスクイベントについてハードウェア管理イベントログを確認することは管理者の責任となります。現在、このようなイベントを積極的に通知する警告メカニズムがありません。