まれに、システムにはじめて電源を投入したときに、オンボード Ethernet デバイスへの PCI-Express (PCIe) リンクが最適な速度よりも低速でトレーニングされることがあります。これによって接続やサービスが失われることはありませんが、ネットワーク帯域幅が狭まったり、スループットが低下したりする可能性があります。この問題は、シャーシに AC 電源を投入したときにのみ発生します。リンクが正しい速度を示している場合は、AC 電源が供給されているかぎり、正しい速度のまま保たれます。
エラー状態の特定
この問題のトラブルシューティングを行うには、まずオンボードのネットワークがその全処理能力よりも低い性能にトレーニングされたかどうかを調べる必要があります。次に、処理能力を最大限に引き出すようにトレーニングされていないすべてのリンクを再トレーニングする必要があります。このエラー状態がシステムで発生しているかどうかを特定するには、次のどちらかの方法を使用します。どちらの方法も Solaris の制御ドメイン内から実行できます。
オプション 1: FMA 障害ログ
ブート中に電源投入時自己診断テスト (POST) を実行した場合にのみ、機能低下しているリンクの障害が FMA ログに登録されます。
診断された障害のリストを表示します。
# fmadm faulty -------------------------------------------------------------------------------------- TIME EVENT-ID MSG-ID SEVERITY -------------------------------------------------------------------------------------- Sep 14 06:21:49 33055e24-2f39-679e-9482-ec1c5f83b69b SPSUN4V-8001-0J Major Problem Status:open Diag Engine : fdd / 1.0 System Manufacturer : Oracle Corporation Name : SPARC T8-1 Part_Number : 32884356+1+1 Serial_Number : AK00271486 Host_ID : 86bbdd30 ---------------------------------------- Suspect 1 of 1 : Problem class : fault.io.pciex.bus-linkerr-deg Certainty : 100% Affects : location:////SYS/MB/NET2 Status : faulted but still in service FRU Status : faulty Location : "/SYS/MB" ... Resource Location : "/SYS/MB/NET2"
これらの場所で「Problem class」が「ault.io.pciex.bus-linkerr-deg」に設定されている障害を探します。前の例では、この障害が /SYS/MB/NET2 にあることを示しています。
/SYS/MB/NET0
/SYS/MB/NET1
/SYS/MB/NET2
/SYS/MB/NET3
/SYS/MB/IOH/IOS2/RP0/PCIE_LINK
これらの場所のいずれかに fault.io.pciex.bus-linkerr-deg が表示されている場合、オンボードネットワークの PCIe リンクはその処理能力を最大限に引き出すようにトレーニングされませんでした。
fault.io.pciex.bus-linkerr-deg 障害ごとに、EVENT-ID の下に示されている値を記録します。この EVENT-ID は、あとで障害をクリアするために使用します。
前の例では、この値は 33055e24-2f39-679e-9482-ec1c5f83b69b です。
オプション 2: prtdiag (1M) コマンド
POST が有効になっているかどうかに関係なく、プライマリドメインにログインしているときに、Solaris から prtdiag(1M) コマンドを使用できます。
Solaris の制御ドメインで、オンボード Ethernet デバイスの PCIe の幅と速度を表示します。この場合、オンボード Ethernet デバイスのネットワークポートには /SYS/MB/XGBE、/SYS/MB/NET1、/SYS/MB/NET2、および /SYS/MB/NET3 という名前が付けられます。
# prtdiag System Configuration: Oracle Corporation sun4v SPARC T8-1 Memory size: 243200 Slot … Cur Speed/Width... /SYS/MB/XGBE PCIE network-pciex8086,1589 8.0GT/x8 8.0GT/x8 /pci@300/pci@1/network@0 /SYS/MB/NET1 PCIE network-pciex8086,1589 8.0GT/x8 8.0GT/x8 /pci@300/pci@1/network@0,1 /SYS/MB/NET2 PCIE network-pciex8086,1589 8.0GT/x8 8.0GT/x8 /pci@300/pci@1/network@0,2 /SYS/MB/NET3 PCIE network-pciex8086,1589 8.0GT/x8 8.0GT/x8
十分に最適化されていないリンクの再トレーニング
前述のどちらかの方法で、リンクが最適ではない設定にトレーニングされていることが判明した場合は、次のように再トレーニングします。
シャーシ上のすべてのゲストを停止します。
ホストの電源を切断します。
数秒間でシャーシから AC 電源を取り外します。
fmadm repair uuid-of-fault コマンドと uuid 用に記録した EVENT-ID を使用して、障害を修復します。
前の例で示すように、この場合の /SYS/MB/NET2 の EVENT-ID は 33055e24-2f39-679e-9482-ec1c5f83b69b です。この場合は、次のように障害をクリアします。
# fmadm repair 33055e24-2f39-679e-9482-ec1c5f83b69b