RDMAの問題
RDMAには次の問題があります:
-
ibacm
サービスはデフォルトで無効になっていますibacm
サービスは、インストール直後にデフォルトで無効になっています。 つまり、リブート後もibacm
サービスは自動的に起動しません。 再起動後にこのサービスを開始するには、サービスを有効にする必要があります:# systemctl enable ibacm
(Bug ID 28074471)
-
Network Managerの制御が有効または無効になっているときの問題
RDMAに使用されるインタフェースに
NM_CONTROLLED=yes
が設定されている場合、いくつかの問題が確認されています。 これらの理由から、インタフェース構成でNM_CONTROLLED=no
を設定することをお薦めします。ただし、Network Manager制御が無効の場合、InfiniBandインタフェースではCONNECTED_MODE=yes
パラメータは無視されます。 この問題を回避するには、次のコマンドを実行して手動で接続モードを設定します:# echo connected > /sys/class/net/ib0/mode
ここで、ib0はモードを変更するインタフェースです。 再起動後にこのコマンドを実行する必要があります。 (Bug ID 28074921)
-
エラー。他のホストではすでにアドレスxxx.xxx.xxx.xxxが使用されています
特定のインスタンスでは、次のエラー・メッセージが表示されることがあります:
Error, some other host already uses address xxx.xxx.xxx.xxx
このエラー・メッセージがトリガーされる可能性のある2つのインスタンスは、次のとおりです:
-
アクティブ・ボンディングが有効で、
ifup
ib-interfaceコマンドを実行します。 -
systemctl start rdma
コマンドを実行するとき。
どちらの場合も、InfiniBandインタフェースが正常に起動されるため、このメッセージは無視できます。 (バグID 28097516)
-
-
resilient_rdmaip
をアンロードすると、InfiniBandインタフェースへのアクセスに問題が発生する可能性がありますresilient_rdmaip
モジュールをアンロードすると、InfiniBandインタフェースへのアクセスおよび構成に問題が発生する可能性があります。 モジュールがアンロードされた後にInfiniBandインタフェースでifconfigコマンドを使用しようとすると、デバイスが見つかりませんというメッセージが表示され、これらのインタフェースのIP情報は使用できません。 インタフェースは、ifupコマンドを使用して再初期化する必要があります。 アクティブ・ボンディング機能はこの問題の影響を受けません。 (バグID 28123680)