RDMAの問題
RDMAには次の問題があります:
-
ibacmサービスはデフォルトで無効になっています
ibacmサービスは、インストール直後にデフォルトで無効になっています。 つまり、リブート後もibacmサービスは自動的に起動しません。 これは動作を目的としています。ibacmサービスを使用するための要件はアプリケーション固有です。 アプリケーションでこのサービスが必要な場合、再起動後にサービスを起動する必要がある可能性があります:# systemctl enable ibacm
(Bug ID 28074471)
-
Network Managerの制御が有効または無効になっているときの問題
RDMAに使用されるインタフェースに
NM_CONTROLLED=yesが設定されている場合、いくつかの問題が確認されています。 これらの理由から、インタフェース構成でNM_CONTROLLED=noを設定することをお薦めします。ただし、Network Manager制御が無効の場合、InfiniBandインタフェースではCONNECTED_MODE=yesパラメータは無視されます。 この問題を回避するには、次のコマンドを実行して手動で接続モードを設定します:# echo connected > /sys/class/net/ib0/modeここで、ib0はモードを変更するインタフェースです。 再起動後にこのコマンドを実行する必要があります。 (Bug ID 28074921)
-
エラー。他のホストではすでにアドレスxxx.xxx.xxx.xxxが使用されています
特定のインスタンスでは、次のエラー・メッセージが表示されることがあります:
Error, some other host already uses address xxx.xxx.xxx.xxxこのエラー・メッセージがトリガーされる可能性のある2つのインスタンスは、次のとおりです:
-
アクティブ・ボンディングが有効で、
ifupib-interfaceコマンドを実行します。 -
systemctl start rdmaコマンドを実行するとき。
どちらの場合も、InfiniBandインタフェースが正常に起動されるため、このメッセージは無視できます。 (バグID 28097516)
-
-
resilient_rdmaipをアンロードすると、InfiniBandインタフェースへのアクセスに問題が発生する可能性があります
resilient_rdmaipモジュールをアンロードすると、InfiniBandインタフェースへのアクセスおよび構成に問題が発生する可能性があります。 モジュールがアンロードされた後にInfiniBandインタフェースでifconfigコマンドを使用しようとすると、デバイスが見つかりませんというメッセージが表示され、これらのインタフェースのIP情報は使用できません。 インタフェースは、ifupコマンドを使用して再初期化する必要があります。 アクティブ・ボンディング機能はこの問題の影響を受けません。 (バグID 28123680)