メモリーサブシステムの構成およびメモリー障害の処理には、さまざまな機能が関与します。基本的な機能に関する知識は、メモリーの問題を特定して修復するために役立ちます。
次のサーバーの機能は、メモリー障害を管理します。
POST – デフォルトでは、POST はサーバーの電源投入時に実行されます。
CE の場合、POST はエラー処理のために、そのエラーを PSH デーモンに転送します。修正不可能なメモリー障害が検出された場合、POST は障害と障害のある DIMM のデバイス名を表示し、障害を記録します。その後、POST は障害のある DIMM を使用不可にします。メモリーの構成および障害のある DIMM の位置によって、POST はサーバー内の物理メモリーの半分を使用不可にするか、または物理メモリーの半分とプロセッサスレッドの半分を使用不可にします。通常の処理でこのオフライン化処理が発生した場合は、障害メッセージに基づいて障害のある DIMM を交換し、Oracle ILOM の set devicecomponent_state=enabled コマンドを使用して、使用不可になった DIMM を使用可能にします。ここで、device は、使用可能にする DIMM の名前です。
PSH テクノロジ – Oracle PSH は、障害管理デーモン (fmd) を使用してさまざまな種類の障害を監視します。障害が発生した場合は、その障害に UUID が割り当てられ、記録されます。PSH は障害を報告し、その障害に関連する DIMM を交換することを推奨します。
メモリーに問題があることが疑われる場合は、Oracle ILOM の show faulty コマンドを実行します。このコマンドはメモリー障害を一覧表示し、障害に関連する DIMM モジュールを特定します。