この問題は SPARC M7-16 サーバーのみに影響します。
PDECB 番号 0、1、2、または 3 上の ECB が失敗した場合、対応する CMIOU を所有しているホストの電源が再投入されます。電源再投入時にホストが再起動すると、DCU0 および DCU1 のすべてのコンポーネントが除外されます。
この問題が発生していることを確認するには、ホストコンソールで次のメッセージを確認します。
host-name-pd0 console login: 2015-11-03 11:35:17 SP> NOTICE: Fatal error occurred. Collecting diagnostic information. 2015-11-03 11:40:03 SP> NOTICE: Abort boot due to /SYS/CMIOU1. Power Cycle Host 2015-11-03 11:42:38 SP> NOTICE: Exclude all of /SYS/DCU0. Reason: Not enough power supplies 2015-11-03 11:42:38 SP> NOTICE: Exclude all of /SYS/DCU1. Reason: Not enough power supplies
同様に PDECB 番号 14、15、16、または 17 の ECB が失敗した場合、DCU2 および DCU3 のすべてのコンポーネントが除外されます。
回避方法: ありません。
回復方法: この問題が発生した場合は、クラス fault.chassis.voltage.isolated の障害がその PDECB と対応する CMIOU に対して記録されます。
障害管理シェルを起動します。
-> start /SP/faultmgmt/shell Are you sure you want to start /SP/faultmgmt/shell (y/n)? y faultmgmtsp>
障害を表示します。
faultmgmtsp> fmadm faulty
------------------- ------------------------------------ -------------- --------
Time UUID msgid Severity
------------------- ------------------------------------ -------------- --------
2015-11-12/15:42:38 45ce7f9f-bd7e-4599-db3d-ef728e714f31 SPT-8001-XC Critical
Problem Status : open
Diag Engine : fdd 1.0
System
Manufacturer : Oracle Corporation
Name : SPARC M7-16
Part_Number : 32397701+7+1
Serial_Number : AK00192372
----------------------------------------
Suspect 1 of 1
Fault class : fault.chassis.voltage.isolated
Certainty : 100%
Affects : /SYS/PDECB1
Status : faulted
FRU
Status : faulty
Location : /SYS/PDECB1
Manufacturer : Celestica Holdings PTE LTD
Name : ECB
Part_Number : 7082640
Revision : 02
Serial_Number : 465769T+14029F01YV
Chassis
Manufacturer : Oracle Corporation
Name : SPARC M7-16
Part_Number : 32397701+7+1
Serial_Number : AK00192372
Description : A power supply has failed to maintain a good POK (Power On
OK) condition.
Response : The system will shutdown in a non-graceful fashion.
Impact : The platform will restart with the affected component
deconfigured.
Action : Please refer to the associated reference document at
http://support.oracle.com/msg/SPT-8001-XC for the latest
service procedures and policies regarding this diagnosis.
------------------- ------------------------------------ -------------- --------
Time UUID msgid Severity
------------------- ------------------------------------ -------------- --------
2015-11-12/15:33:20 faf9042a-5452-ee1c-d9c3-a9f6d3248c17 SPT-8001-XC Critical
Problem Status : open
Diag Engine : fdd 1.0
System
Manufacturer : Oracle Corporation
Name : SPARC M7-16
Part_Number : 32397701+7+1
Serial_Number : AK00192372
----------------------------------------
Suspect 1 of 1
Fault class : fault.chassis.voltage.isolated
Certainty : 100%
Affects : /SYS/CMIOU1
Status : faulted
FRU
Status : faulty
Location : /SYS/CMIOU1
Manufacturer : Oracle Corporation
Name : CMIOU Module
Part_Number : 7090838
Revision : 04
Serial_Number : 465769T+14456C01VH
Chassis
Manufacturer : Oracle Corporation
Name : SPARC M7-16
Part_Number : 32397701+7+1
Serial_Number : AK00192372
Description : A power supply has failed to maintain a good POK (Power On
OK) condition.
Response : The system will shutdown in a non-graceful fashion.
Impact : The platform will restart with the affected component
deconfigured.
Action : Please refer to the associated reference document at
http://support.oracle.com/msg/SPT-8001-XC for the latest
service procedures and policies regarding this diagnosis.
faultmgmtsp>
Oracle ILOM で、電源の一部がこのホストの電源のリストから消去されます。これを次の例に示しています。
-> show /Servers/PDomains/PDomain_0/System/Power/Power_Supplies
/Servers/PDomains/PDomain_0/System/Power/Power_Supplies
Targets:
Power_Supply_6
Power_Supply_7
Power_Supply_8
Power_Supply_9
Power_Supply_10
Power_Supply_11
Power_Supply_12
Power_Supply_13
Power_Supply_14
Power_Supply_15
...
->
数分後に、すべての電源が再度リストに表示されます。これを次の例に示しています。
-> show /Servers/PDomains/PDomain_0/System/Power/Power_Supplies
/Servers/PDomains/PDomain_0/System/Power/Power_Supplies
Targets:
Power_Supply_0
Power_Supply_1
Power_Supply_2
Power_Supply_3
Power_Supply_4
Power_Supply_5
Power_Supply_6
Power_Supply_7
Power_Supply_8
Power_Supply_9
Power_Supply_10
Power_Supply_11
Power_Supply_12
Power_Supply_13
Power_Supply_14
Power_Supply_15
...
->
Oracle ILOM で電源が再表示されたら、ホストを再起動します。以前に除外された DCU が含まれるようになります。サービス呼び出しを開始し、PDECB 上の障害を解決します。