Mellanox ConnectXアダプタがブート時に検出されない
Mellanox ConnectXアダプタを使用しているシステムでは、ドライバは起動時にInfiniBandおよびRMDAモジュールをロードしないため、ibstatコマンドなどのRDMAおよびInfiniBand関連ツールを使用するときにアダプタが検出されません。
通常、次のようなエラーが表示されます:
ibpanic: [26013] main: stat of IB device 'mthca0' failed: No such file or directory
この問題は、PXEブートを容易にするためにinitramfsにmlx4_core
およびmlx5_core
ドライバが含まれていても、InfiniBandおよびRDMAモジュールが含まれていないために発生します。 PXEブートにドライバが必要な場合は、ブート後に手動でリロードできます。これにより、RDMAホット・プラグ・シーケンスがトリガーされます。次に例を示します:
# modprobe mlx5_core
PXEブートにmlx4_core
またはmlx5_core
ドライバを必要としない場合、これらのドライバはブート後にロードされるため、initramfsから削除できます。 その後、RDMAホット・プラグ・シーケンスが正常にトリガーされます。
initramfsからドライバを削除するには、/etc/dracut.conf.d/10-mlx_dracut-denylist.conf
ファイルを作成し、次の行を追加します:
omit_drivers+=" mlx4_* mlx5_* mlxfw "
ファイルを更新した後、次のコマンドを実行してinitramfsを再構築します:
# dracut -f
変更を有効にするには、システムを再起動します。
(バグID 31353413)