4.7.8 RoCEネットワーク・ファブリックの動作の検証

基礎となるハードウェアを変更した後にRoCEネットワーク・ファブリックが適切に動作しているかどうかを検証します。

RoCEネットワーク・ファブリックの任意のコンポーネントを使用してハードウェアのメンテナンス(サーバー、スイッチまたはケーブル上のRDMAネットワーク・ファブリックのアダプタの交換を含む)が行われたか、RoCEネットワーク・ファブリックの操作が基準を満たしていない疑いがある場合、RoCEネットワーク・ファブリックが適切に動作しているかどうかを検証します。次の手順は、ネットワーク動作の確認方法を示しています。

  1. RoCEネットワーク・ファブリック構成の検証のステップを完了します。
  2. infinicheckの準備をします。

    infinicheckコマンドを使用してRoCEネットワーク・ファブリックの構成、接続性およびパフォーマンスのチェックを実行する前に、次のコマンドを実行する必要がある場合があります。

    • 必要に応じて、-sオプションを使用して、RoCEネットワーク・ファブリック全体にパスワードなしのSSHユーザー等価を設定します。次に例を示します:

      # /opt/oracle.SupportTools/ibdiagtools/infinicheck -g hostips -c cellips -s
    • -zオプションを使用すると、前回のinfinicheckコマンドの実行中に作成されたファイルを消去できます。次に例を示します:

      # /opt/oracle.SupportTools/ibdiagtools/infinicheck -g hostips -c cellips -z

    前述のコマンドで、hostipsは、データベース・サーバーのRoCEネットワーク・ファブリックのIPアドレスのリストを含む入力ファイルの名前で、cellipsは、ストレージ・サーバーのRoCEネットワーク・ファブリックのIPアドレスのリストを含む入力ファイルの名前です。

  3. infinicheckコマンドを実行して、RoCEネットワーク・ファブリックの構成、接続性およびパフォーマンスのチェックを実行します。

    適切に構成されたシステムで、最小限の引数を指定して、任意のデータベース・サーバー上でinfinicheckコマンドを実行できます。次に例を示します:

    # /opt/oracle.SupportTools/ibdiagtools/infinicheck

    デフォルトでは、infinicheckコマンドはRoCEネットワーク・ファブリックで構成および接続チェックのグループを実行します。-pオプションを使用して、オプションのパフォーマンス・テストを実行できます。または、-aオプションを使用して、パフォーマンス・テストを含むすべてのチェックを実行します。次に例を示します:

    # /opt/oracle.SupportTools/ibdiagtools/infinicheck -a

    ノート:

    infinicheckコマンドがパフォーマンス・ストレス・テストを実行すると、システムのパフォーマンスに影響が出る可能性があります。したがって、infinicheckパフォーマンス・テストは、必要な場合(なるべくシステム上にワークロードがないとき)にのみ、実行することをお薦めします。

    -gオプションを使用してデータベース・サーバーを指定し、-cオプションを使用してストレージ・サーバーを指定することによって、システム内のサーバーを明示的に指定することもできます。次に例を示します:

    # /opt/oracle.SupportTools/ibdiagtools/infinicheck -g hostips -c cellips

    前述の例で、hostipsは、データベース・サーバーのRoCEネットワーク・ファブリックのIPアドレスのリストを含む入力ファイルの名前で、cellipsは、ストレージ・サーバーのRoCEネットワーク・ファブリックのIPアドレスのリストを含む入力ファイルの名前です。

    データベース・サーバーとストレージ・サーバーを入力ファイルにリストするかわりに、コマンドラインで、IPアドレスのカンマ区切りリストを指定できます。

    次の例は、infinicheckコマンドの一般的な端末の出力を表示します。

    # /opt/oracle.SupportTools/ibdiagtools/infinicheck -g hostips -c cellips
                            INFINICHECK
                    [Network Connectivity, Configuration and Performance]
    
                        #### FABRIC TYPE TESTS ####
    
    System type identified: RoCE
    Verifying User Equivalence of user=root from all DBs to all CELLs.
    
                    #### RoCE CONFIGURATION TESTS ####
            Checking for presence of RoCE devices on all DBs and CELLs
    [SUCCESS].... RoCE devices on all DBs and CELLs look good
            Checking for RoCE Policy Routing settings on all DBs and CELLs
    [SUCCESS].... RoCE Policy Routing settings look good
            Checking for RoCE DSCP ToS mapping on all DBs and CELLs
    [SUCCESS].... RoCE DSCP ToS settings look good
            Checking for RoCE PFC settings and DSCP mapping on all DBs and CELLs
    [SUCCESS].... RoCE PFC and DSCP settings look good
            Checking for RoCE interface MTU settings. Expected value : 2300
    [SUCCESS].... RoCE interface MTU settings look good
            Verifying switch advertised DSCP on all DBs and CELLs ports ( ~ 2 min )
    [SUCCESS].... Advertised DSCP settings from RoCE switch looks good
    
                        #### CONNECTIVITY TESTS ####
                        [COMPUTE NODES -> STORAGE CELLS]
                               (60 seconds approx.)
                       (Will walk through QoS values: 0-6)
    [SUCCESS]..............Results OK
    [SUCCESS]....... All can talk to all storage cells
                        [COMPUTE NODES -> COMPUTE NODES]
                               (60 seconds approx.)
                       (Will walk through QoS values: 0-6)
    [SUCCESS]..............Results OK
    [SUCCESS]....... All hosts can talk to all other nodes
            Verifying Subnet Masks on all nodes
    [SUCCESS] ......... Subnet Masks is same across the network