マルチ DIMM の障害状態は、単一の DIMM 障害により、メモリーライザーカードの同じチャネルまたは 2 つ目のチャネルのその他の DIMM が、使用不可になるか、障害が発生したかのように見える場合です。
DIMM 障害が発生した場合は、Oracle ILOM システムイベントログ (SEL) を調べてください。
最初に障害が発生した DIMM を特定してください。
最初の DIMM 障害が発生したあとですぐに発生するその他の DIMM 障害に注意してください。
障害が発生した DIMM を含むメモリーライザーカードを特定します。
その他の DIMM 障害が発生したチャネルに注意してください。
単一の DIMM 障害が最初に発生したあとで別の DIMM に障害が発生した場合、かつ、DIMM 障害が同じメモリーライザーカード上の場合は、サーバーがマルチ DIMM 障害状態である可能性があります。
たとえば、システムエラーログに次のように表示される場合があります。
135 Sun May 21 00:53:57 2000 DIMM Service Required Memory P0/MR0/D9 (CPU Memory Riser 0 DIMM 9) A failure has occurred during Memory Reference Code (MRC) DIMM module training. (Probability:100, UUID:2a182715-983f-c4fb-e94f-b5a5b50d3650, Part Number:001-0003-01,HMT42GR7AFR4A-PB, Serial Number:00AD011321345849FF, Reference Document:http://support.oracle.com/msg/SPX86A-8004-67) 126 Sun May 21 00:53:56 2000 DIMM Service Required Memory P0/MR0/D6 (CPU Memory Riser 0 DIMM 6) A failure has occurred during Memory Reference Code (MRC) DIMM module training. (Probability:33, UUID:9014a82c-7bf9-ee96-b61b-9c7ccedc9aed, Part Number:001-0003-01,HMT42GR7AFR4A-PB, Serial Number:00AD01132129B11E9E, Reference Document:http://support.oracle.com/msg/SPX86A-8004-67)
このシナリオでは、D6 の DIMM が 00:53:56 に障害が発生し、その障害のあと、D9 の DIMM の報告された障害 (00:53:57 に発生) が続いています。どちらの DIMM も同じメモリーライザーカード (P0/MR0) にあります。それぞれの DIMM は別のチャネル上にありますが、両方とも同じメモリーバッファー ASIC にリンクされています。さらに、両方のチャネルのすべての DIMM がシステムによって使用不可にされている可能性があります。このシナリオはマルチ DIMM の障害状態の一例と考えられます。
この問題をトラブルシューティングするには、最初の障害を記録した DIMM のみを交換し、サーバーを再稼働して、マルチ DIMM の障害状態が残っているかどうかを確認します。マルチ DIMM の障害状態が発生した場合は、最初に障害が発生した DIMM のみを交換することで、最初の DIMM とそのあとの DIMM の障害状態が修正される場合があります。障害が残っている場合は、DIMM またはメモリーライザーカードの問題である可能性があります。