実行中のシステムで ConnectX ファームウェアをバージョン 2.6.000 以降にアップグレードすると、一部の HCA や x64 プラットフォームで問題が発生することがあります。この問題は、Mellanox ブランドの HCA だけに影響を与えます。Sun ブランドの PCIe HCA、EM、NEM、および SPARC プラットフォームには影響しません。
システムをブートできなかったり、ブート中にシステムがハングアップしたりすることがあります。ibd (IPoverIB) インスタンス番号が変わり、それによってシステムがブートできなくなったり、ibd デバイスを plumb できなくなったりすることがあります。
回避方法 1: cxflash を使ってファームウェアを更新したあと、システムをリブートする前に、/etc/path_to_inst ファイルと /dev ディレクトリから ibd<x> インスタンスを削除します。次の手順を実行します。
root ユーザーとしてログインします。デバイスツリー情報は、次のようになります。
# ls -R /devices | grep 15b3 /devices/pci@0,0/pci10de,5d@e/pci15b3,634a@0 /devices/pci@0,0/pci10de,5d@e/pci15b3,634a@0/ibport@1,ffff,ipib /devices/pci@0,0/pci10de,5d@e/pci15b3,634a@0/ibport@1,ffff,ipib:ibd0 /devices/pci@0,0/pci10de,5d@e/pci15b3,634a@0/ibport@2,ffff,ipib /devices/pci@0,0/pci10de,5d@e/pci15b3,634a@0/ibport@2,ffff,ipib:ibd1 /devices/pci@0,0/pci10de,5d@e/pci15b3,634a@0:devctl |
デバイス仕様は、取り付けられている Mellanox ブランドのカードによって変わります。
path_to_inst ファイルを編集します。次の手順を実行します。
既存の path_to_inst ファイルのバックアップコピーを作成します。
# cp /etc/path_to_inst /etc/path_to_inst.backup |
path_to_inst ファイルを開きます。
# vi /etc/path_to_inst |
ibd と hermon が含まれる行を検索し、それらの行を削除します。
変更内容を保存し、ファイルを閉じます。
/dev ディレクトリで次のようにエントリを削除します。
rm /dev/ibd?* |
システムを再起動します。システムが正常にブートし、対応するデバイスツリーが次のようになります。
# ls -R /devices | grep 15b3 /devices/pci@0,0/pci10de,5d@e/pci15b3,5@0 /devices/pci@0,0/pci10de,5d@e/pci15b3,5@0/ibport@1,ffff,ipib /devices/pci@0,0/pci10de,5d@e/pci15b3,5@0/ibport@1,ffff,ipib:ibd0 /devices/pci@0,0/pci10de,5d@e/pci15b3,5@0/ibport@2,ffff,ipib /devices/pci@0,0/pci10de,5d@e/pci15b3,5@0/ibport@2,ffff,ipib:ibd1 /devices/pci@0,0/pci10de,5d@e/pci15b3,5@0:devctl |
回避方法 2: path_to_inst ファイルと /dev ディレクトリを更新する前にシステムをリブートした場合は、システムがハングアップすることがあります。このような場合は、次の手順を実行します。
システムの電源を切り、HCA をバスから取り外します。
HCA を取り付けないでシステムをリブートします。
システムが再開したら、回避方法 1 に記載された手順 2 から 3 を実行します。
システムの電源を切ります。
HCA を取り付け直します。システムを再起動します。
システムをリブートしても ibd インタフェースが自動的に plumb しない場合は、/etc/hostname.ib<?> ファイルが最新のデバイス構成に適していない可能性があります。正しい構成を表すようにファイル名を手動で変更します。