起動後にMellanox ConnectXアダプタが検出されない
Mellanox ConnectXアダプタを使用しているシステムでは、ドライバはブート時にInfiniBandおよびRMDAモジュールをロードしないため、RDMAおよびInfiniBand関連ツール(ibstatなど)の使用時にアダプタを検出できません。 通常、エラーは次のように表示されます:
ibpanic: [26013] main: stat of IB device 'mthca0' failed: No such file or directory
この問題は、mlx4_core
およびmlx5_core
ドライバは、PXEブートを容易にするためにinitramfsに含まれていますが、InfiniBandおよびRDMAモジュールは含まれていないために発生します。 PXEブートのためにドライバが必要な場合は、ブート後にドライバを手動で再ロードして、RDMAホット・プラグ・シーケンスをトリガーできます。次に例を示します:
# modprobe mlx5_core
PXEブートにmlx4_core
またはmlx5_core
ドライバが必要ない場合は、これらのドライバをinitramfsから削除し、必要に応じてブート後にロードでき、RDMAホット・プラグ・シーケンスが正常にトリガーされます。 initramfsからドライバを削除するには、次の行を含む/etc/dracut.conf.d/10-mlx_dracut-denylist.conf
を作成します:
omit_drivers+=" mlx4_* mlx5_* mlxfw "
これを行ったら、次を実行してinitramfsを再構築します:
# dracut -f
変更は再起動後に有効になります。
(バグID 31353413)