Oracle Solaris 10 9/10 ご使用にあたって

x64: Mellanox の ConnectX ファームウェア 2.6.0 で PCI サブシステム ID が変更される (6810093)

実行中のシステムで ConnectX ファームウェアをバージョン 2.6.000 以降にアップグレードすると、一部の HCA や x64 プラットフォームで問題が発生することがあります。この問題は、Mellanox ブランドの HCA だけに影響を与えます。Sun ブランドの PCIe HCA、EM、NEM、および SPARC プラットフォームには影響しません。

システムをブートできなかったり、ブート中にシステムがハングアップしたりすることがあります。ibd (IPoverIB) インスタンス番号が変わり、それによってシステムがブートできなくなったり、ibd デバイスを plumb できなくなったりすることがあります。

回避方法 1: cxflash を使ってファームウェアを更新したあと、システムをリブートする前に、/etc/path_to_inst ファイルと /dev ディレクトリから ibd<x> インスタンスを削除します。次の手順を実行します。

  1. root ユーザーとしてログインします。デバイスツリー情報は、次のようになります。


    # ls -R /devices | grep 15b3
    /devices/pci@0,0/pci10de,5d@e/pci15b3,634a@0
    /devices/pci@0,0/pci10de,5d@e/pci15b3,634a@0/ibport@1,ffff,ipib
    /devices/pci@0,0/pci10de,5d@e/pci15b3,634a@0/ibport@1,ffff,ipib:ibd0
    /devices/pci@0,0/pci10de,5d@e/pci15b3,634a@0/ibport@2,ffff,ipib
    /devices/pci@0,0/pci10de,5d@e/pci15b3,634a@0/ibport@2,ffff,ipib:ibd1
    /devices/pci@0,0/pci10de,5d@e/pci15b3,634a@0:devctl

    注 –

    デバイス仕様は、取り付けられている Mellanox ブランドのカードによって変わります。


  2. path_to_inst ファイルを編集します。次の手順を実行します。

    1. 既存の path_to_inst ファイルのバックアップコピーを作成します。


      # cp /etc/path_to_inst /etc/path_to_inst.backup
    2. path_to_inst ファイルを開きます。


      # vi /etc/path_to_inst
    3. ibd と hermon が含まれる行を検索し、それらの行を削除します。

    4. 変更内容を保存し、ファイルを閉じます。

  3. /dev ディレクトリで次のようにエントリを削除します。


    rm /dev/ibd?*
  4. システムを再起動します。システムが正常にブートし、対応するデバイスツリーが次のようになります。


    # ls -R /devices | grep 15b3
    /devices/pci@0,0/pci10de,5d@e/pci15b3,5@0
    /devices/pci@0,0/pci10de,5d@e/pci15b3,5@0/ibport@1,ffff,ipib
    /devices/pci@0,0/pci10de,5d@e/pci15b3,5@0/ibport@1,ffff,ipib:ibd0
    /devices/pci@0,0/pci10de,5d@e/pci15b3,5@0/ibport@2,ffff,ipib
    /devices/pci@0,0/pci10de,5d@e/pci15b3,5@0/ibport@2,ffff,ipib:ibd1
    /devices/pci@0,0/pci10de,5d@e/pci15b3,5@0:devctl

回避方法 2: path_to_inst ファイルと /dev ディレクトリを更新する前にシステムをリブートした場合は、システムがハングアップすることがあります。このような場合は、次の手順を実行します。

  1. システムの電源を切り、HCA をバスから取り外します。

  2. HCA を取り付けないでシステムをリブートします。

  3. システムが再開したら、回避方法 1 に記載された手順 2 から 3 を実行します。

  4. システムの電源を切ります。

  5. HCA を取り付け直します。システムを再起動します。

  6. システムをリブートしても ibd インタフェースが自動的に plumb しない場合は、/etc/hostname.ib<?> ファイルが最新のデバイス構成に適していない可能性があります。正しい構成を表すようにファイル名を手動で変更します。