Go to main content

SPARC M7 シリーズサーバープロダクトノート

印刷ビューの終了

更新: 2017 年 3 月
 
 

PDECB がオフの場合、ホストの起動で DCU 全体を除外するべきではない (22146616)

この問題は SPARC M7-16 サーバーのみに影響します。


注 -  この問題には電源再投入が伴います。ホストの電源再投入に関するすべての問題を理解するには、プラットフォームユーザーガイドラインを参照してください。

PDECB 番号 0、1、2、または 3 上の ECB が失敗した場合、対応する CMIOU を所有しているホストの電源が再投入されます。電源再投入時にホストが再起動すると、DCU0 および DCU1 のすべてのコンポーネントが除外されます。

この問題が発生していることを確認するには、ホストコンソールで次のメッセージを確認します。

host-name-pd0 console login: 
2015-11-03 11:35:17      SP> NOTICE:  Fatal error occurred. Collecting diagnostic information.
2015-11-03 11:40:03      SP> NOTICE:  Abort boot due to /SYS/CMIOU1. Power Cycle Host
2015-11-03 11:42:38      SP> NOTICE:  Exclude all of /SYS/DCU0. Reason: Not enough power supplies
2015-11-03 11:42:38      SP> NOTICE:  Exclude all of /SYS/DCU1. Reason: Not enough power supplies

同様に PDECB 番号 14、15、16、または 17 の ECB が失敗した場合、DCU2 および DCU3 のすべてのコンポーネントが除外されます。

回避方法: ありません。

回復方法: この問題が発生した場合は、クラス fault.chassis.voltage.isolated の障害がその PDECB と対応する CMIOU に対して記録されます。

  1. 障害管理シェルを起動します。

    -> start /SP/faultmgmt/shell
    Are you sure you want to start /SP/faultmgmt/shell (y/n)? y
    faultmgmtsp>
  2. 障害を表示します。

    faultmgmtsp> fmadm faulty
    
    ------------------- ------------------------------------ -------------- --------
    Time                UUID                                 msgid          Severity
    ------------------- ------------------------------------ -------------- --------
    2015-11-12/15:42:38 45ce7f9f-bd7e-4599-db3d-ef728e714f31 SPT-8001-XC    Critical
    
    Problem Status    : open
    Diag Engine       : fdd 1.0
    System           
       Manufacturer   : Oracle Corporation
       Name           : SPARC M7-16
       Part_Number    : 32397701+7+1
       Serial_Number  : AK00192372
    
    ----------------------------------------
    Suspect 1 of 1
       Fault class  : fault.chassis.voltage.isolated
       Certainty    : 100%
       Affects      : /SYS/PDECB1
       Status       : faulted
    
       FRU                 
          Status            : faulty
          Location          : /SYS/PDECB1
          Manufacturer      : Celestica Holdings PTE LTD
          Name              : ECB
          Part_Number       : 7082640
          Revision          : 02
          Serial_Number     : 465769T+14029F01YV
          Chassis          
             Manufacturer   : Oracle Corporation
             Name           : SPARC M7-16
             Part_Number    : 32397701+7+1
             Serial_Number  : AK00192372
    
    Description : A power supply has failed to maintain a good POK (Power On
                  OK) condition.
    
    Response    : The system will shutdown in a non-graceful fashion.
    
    Impact      : The platform will restart with the affected component
                  deconfigured.
    
    Action      : Please refer to the associated reference document at
                  http://support.oracle.com/msg/SPT-8001-XC for the latest
                  service procedures and policies regarding this diagnosis.
    
    ------------------- ------------------------------------ -------------- --------
    Time                UUID                                 msgid          Severity
    ------------------- ------------------------------------ -------------- --------
    2015-11-12/15:33:20 faf9042a-5452-ee1c-d9c3-a9f6d3248c17 SPT-8001-XC    Critical
    
    Problem Status    : open
    Diag Engine       : fdd 1.0
    System           
       Manufacturer   : Oracle Corporation
       Name           : SPARC M7-16
       Part_Number    : 32397701+7+1
       Serial_Number  : AK00192372
    
    ----------------------------------------
    Suspect 1 of 1
       Fault class  : fault.chassis.voltage.isolated
       Certainty    : 100%
       Affects      : /SYS/CMIOU1
       Status       : faulted
    
       FRU                 
          Status            : faulty
          Location          : /SYS/CMIOU1
          Manufacturer      : Oracle Corporation
          Name              : CMIOU Module
          Part_Number       : 7090838
          Revision          : 04
          Serial_Number     : 465769T+14456C01VH
          Chassis          
             Manufacturer   : Oracle Corporation
             Name           : SPARC M7-16
             Part_Number    : 32397701+7+1
             Serial_Number  : AK00192372
    
    Description : A power supply has failed to maintain a good POK (Power On
                  OK) condition.
    
    Response    : The system will shutdown in a non-graceful fashion.
    
    Impact      : The platform will restart with the affected component
                  deconfigured.
    
    Action      : Please refer to the associated reference document at
                  http://support.oracle.com/msg/SPT-8001-XC for the latest
                  service procedures and policies regarding this diagnosis.
    
    faultmgmtsp>

    Oracle ILOM で、電源の一部がこのホストの電源のリストから消去されます。これを次の例に示しています。

    -> show  /Servers/PDomains/PDomain_0/System/Power/Power_Supplies
    
     /Servers/PDomains/PDomain_0/System/Power/Power_Supplies
        Targets:
            Power_Supply_6
            Power_Supply_7
            Power_Supply_8
            Power_Supply_9
            Power_Supply_10
            Power_Supply_11
            Power_Supply_12
            Power_Supply_13
            Power_Supply_14
            Power_Supply_15
    ...
    -> 

    数分後に、すべての電源が再度リストに表示されます。これを次の例に示しています。

    -> show  /Servers/PDomains/PDomain_0/System/Power/Power_Supplies
    
     /Servers/PDomains/PDomain_0/System/Power/Power_Supplies
        Targets:
            Power_Supply_0
            Power_Supply_1
            Power_Supply_2
            Power_Supply_3
            Power_Supply_4
            Power_Supply_5
            Power_Supply_6
            Power_Supply_7
            Power_Supply_8
            Power_Supply_9
            Power_Supply_10
            Power_Supply_11
            Power_Supply_12
            Power_Supply_13
            Power_Supply_14
            Power_Supply_15
    ...
    ->
  3. Oracle ILOM で電源が再表示されたら、ホストを再起動します。以前に除外された DCU が含まれるようになります。サービス呼び出しを開始し、PDECB 上の障害を解決します。