Go to main content

SPARC T8 シリーズサーバープロダクトノート

印刷ビューの終了

更新: 2017 年 11 月
 
 

通知された最大の速度/幅で XGBE がトレーニングされていない (26526760)

まれに、システムにはじめて電源を投入したときに、オンボード Ethernet デバイスへの PCI-Express (PCIe) リンクが最適な速度よりも低速でトレーニングされることがあります。これによって接続やサービスが失われることはありませんが、ネットワーク帯域幅が狭まったり、スループットが低下したりする可能性があります。この問題は、シャーシに AC 電源を投入したときにのみ発生します。リンクが正しい速度を示している場合は、AC 電源が供給されているかぎり、正しい速度のまま保たれます。

エラー状態の特定

この問題のトラブルシューティングを行うには、まずオンボードのネットワークがその全処理能力よりも低い性能にトレーニングされたかどうかを調べる必要があります。次に、処理能力を最大限に引き出すようにトレーニングされていないすべてのリンクを再トレーニングする必要があります。このエラー状態がシステムで発生しているかどうかを特定するには、次のどちらかの方法を使用します。どちらの方法も Solaris の制御ドメイン内から実行できます。

オプション 1: FMA 障害ログ

ブート中に電源投入時自己診断テスト (POST) を実行した場合にのみ、機能低下しているリンクの障害が FMA ログに登録されます。

  1. 診断された障害のリストを表示します。

    # fmadm faulty
    --------------------------------------------------------------------------------------
    TIME            EVENT-ID                                 MSG-ID               SEVERITY
    --------------------------------------------------------------------------------------
    Sep 14 06:21:49 33055e24-2f39-679e-9482-ec1c5f83b69b SPSUN4V-8001-0J Major Problem Status:open
    Diag Engine : fdd / 1.0
    System Manufacturer : Oracle Corporation
    Name : SPARC T8-1
    Part_Number : 32884356+1+1
    Serial_Number : AK00271486
    Host_ID : 86bbdd30
    ----------------------------------------
    Suspect 1 of 1 : Problem class : fault.io.pciex.bus-linkerr-deg
    Certainty : 100%
    Affects : location:////SYS/MB/NET2
    Status : faulted but still in service
    FRU Status : faulty
    Location : "/SYS/MB"
    ...
    Resource Location : "/SYS/MB/NET2" 
  2. これらの場所で「Problem class」が「ault.io.pciex.bus-linkerr-deg」に設定されている障害を探します。前の例では、この障害が /SYS/MB/NET2 にあることを示しています。

    • /SYS/MB/NET0

    • /SYS/MB/NET1

    • /SYS/MB/NET2

    • /SYS/MB/NET3

    • /SYS/MB/IOH/IOS2/RP0/PCIE_LINK

    これらの場所のいずれかに fault.io.pciex.bus-linkerr-deg が表示されている場合、オンボードネットワークの PCIe リンクはその処理能力を最大限に引き出すようにトレーニングされませんでした。

  3. fault.io.pciex.bus-linkerr-deg 障害ごとに、EVENT-ID の下に示されている値を記録します。この EVENT-ID は、あとで障害をクリアするために使用します。

    前の例では、この値は 33055e24-2f39-679e-9482-ec1c5f83b69b です。

オプション 2: prtdiag (1M) コマンド

POST が有効になっているかどうかに関係なく、プライマリドメインにログインしているときに、Solaris から prtdiag(1M) コマンドを使用できます。

  1. Solaris の制御ドメインで、オンボード Ethernet デバイスの PCIe の幅と速度を表示します。この場合、オンボード Ethernet デバイスのネットワークポートには /SYS/MB/XGBE/SYS/MB/NET1/SYS/MB/NET2、および /SYS/MB/NET3 という名前が付けられます。

  2. # prtdiag
    System Configuration: Oracle Corporation sun4v SPARC T8-1 Memory size: 243200 Slot
    …                                          Cur Speed/Width...
    /SYS/MB/XGBE PCIE network-pciex8086,1589 8.0GT/x8 8.0GT/x8 /pci@300/pci@1/network@0
    /SYS/MB/NET1 PCIE network-pciex8086,1589 8.0GT/x8 8.0GT/x8 /pci@300/pci@1/network@0,1
    /SYS/MB/NET2 PCIE network-pciex8086,1589 8.0GT/x8 8.0GT/x8 /pci@300/pci@1/network@0,2
    /SYS/MB/NET3 PCIE network-pciex8086,1589 8.0GT/x8 8.0GT/x8 

十分に最適化されていないリンクの再トレーニング

前述のどちらかの方法で、リンクが最適ではない設定にトレーニングされていることが判明した場合は、次のように再トレーニングします。

  1. シャーシ上のすべてのゲストを停止します。

  2. ホストの電源を切断します。

  3. 数秒間でシャーシから AC 電源を取り外します。

  4. fmadm repair uuid-of-fault コマンドと uuid 用に記録した EVENT-ID を使用して、障害を修復します。

    前の例で示すように、この場合の /SYS/MB/NET2 の EVENT-ID は 33055e24-2f39-679e-9482-ec1c5f83b69b です。この場合は、次のように障害をクリアします。

    # fmadm repair 33055e24-2f39-679e-9482-ec1c5f83b69b