4.7.8 RoCEネットワーク・ファブリックの動作の検証
基礎となるハードウェアを変更した後にRoCEネットワーク・ファブリックが適切に動作しているかどうかを検証します。
RoCEネットワーク・ファブリックの任意のコンポーネントを使用してハードウェアのメンテナンス(サーバー、スイッチまたはケーブル上のRDMAネットワーク・ファブリックのアダプタの交換を含む)が行われたか、RoCEネットワーク・ファブリックの操作が基準を満たしていない疑いがある場合、RoCEネットワーク・ファブリックが適切に動作しているかどうかを検証します。次の手順は、ネットワーク動作の確認方法を示しています。
- RoCEネットワーク・ファブリック構成の検証のステップを完了します。
infinicheck
の準備をします。infinicheck
コマンドを使用してRoCEネットワーク・ファブリックの構成、接続性およびパフォーマンスのチェックを実行する前に、次のコマンドを実行する必要がある場合があります。-
必要に応じて、
-s
オプションを使用して、RoCEネットワーク・ファブリック全体にパスワードなしのSSHユーザー等価を設定します。次に例を示します:# /opt/oracle.SupportTools/ibdiagtools/infinicheck -g hostips -c cellips -s
-
-z
オプションを使用すると、前回のinfinicheck
コマンドの実行中に作成されたファイルを消去できます。次に例を示します:# /opt/oracle.SupportTools/ibdiagtools/infinicheck -g hostips -c cellips -z
前述のコマンドで、
hostips
は、データベース・サーバーのRoCEネットワーク・ファブリックのIPアドレスのリストを含む入力ファイルの名前で、cellips
は、ストレージ・サーバーのRoCEネットワーク・ファブリックのIPアドレスのリストを含む入力ファイルの名前です。-
infinicheck
コマンドを実行して、RoCEネットワーク・ファブリックの構成、接続性およびパフォーマンスのチェックを実行します。適切に構成されたシステムで、最小限の引数を指定して、任意のデータベース・サーバー上で
infinicheck
コマンドを実行できます。次に例を示します:# /opt/oracle.SupportTools/ibdiagtools/infinicheck
デフォルトでは、
infinicheck
コマンドはRoCEネットワーク・ファブリックで構成および接続チェックのグループを実行します。-p
オプションを使用して、オプションのパフォーマンス・テストを実行できます。または、-a
オプションを使用して、パフォーマンス・テストを含むすべてのチェックを実行します。次に例を示します:# /opt/oracle.SupportTools/ibdiagtools/infinicheck -a
ノート:
infinicheck
コマンドがパフォーマンス・ストレス・テストを実行すると、システムのパフォーマンスに影響が出る可能性があります。したがって、infinicheck
パフォーマンス・テストは、必要な場合(なるべくシステム上にワークロードがないとき)にのみ、実行することをお薦めします。-g
オプションを使用してデータベース・サーバーを指定し、-c
オプションを使用してストレージ・サーバーを指定することによって、システム内のサーバーを明示的に指定することもできます。次に例を示します:# /opt/oracle.SupportTools/ibdiagtools/infinicheck -g hostips -c cellips
前述の例で、
hostips
は、データベース・サーバーのRoCEネットワーク・ファブリックのIPアドレスのリストを含む入力ファイルの名前で、cellips
は、ストレージ・サーバーのRoCEネットワーク・ファブリックのIPアドレスのリストを含む入力ファイルの名前です。データベース・サーバーとストレージ・サーバーを入力ファイルにリストするかわりに、コマンドラインで、IPアドレスのカンマ区切りリストを指定できます。
次の例は、
infinicheck
コマンドの一般的な端末の出力を表示します。# /opt/oracle.SupportTools/ibdiagtools/infinicheck -g hostips -c cellips INFINICHECK [Network Connectivity, Configuration and Performance] #### FABRIC TYPE TESTS #### System type identified: RoCE Verifying User Equivalence of user=root from all DBs to all CELLs. #### RoCE CONFIGURATION TESTS #### Checking for presence of RoCE devices on all DBs and CELLs [SUCCESS].... RoCE devices on all DBs and CELLs look good Checking for RoCE Policy Routing settings on all DBs and CELLs [SUCCESS].... RoCE Policy Routing settings look good Checking for RoCE DSCP ToS mapping on all DBs and CELLs [SUCCESS].... RoCE DSCP ToS settings look good Checking for RoCE PFC settings and DSCP mapping on all DBs and CELLs [SUCCESS].... RoCE PFC and DSCP settings look good Checking for RoCE interface MTU settings. Expected value : 2300 [SUCCESS].... RoCE interface MTU settings look good Verifying switch advertised DSCP on all DBs and CELLs ports ( ~ 2 min ) [SUCCESS].... Advertised DSCP settings from RoCE switch looks good #### CONNECTIVITY TESTS #### [COMPUTE NODES -> STORAGE CELLS] (60 seconds approx.) (Will walk through QoS values: 0-6) [SUCCESS]..............Results OK [SUCCESS]....... All can talk to all storage cells [COMPUTE NODES -> COMPUTE NODES] (60 seconds approx.) (Will walk through QoS values: 0-6) [SUCCESS]..............Results OK [SUCCESS]....... All hosts can talk to all other nodes Verifying Subnet Masks on all nodes [SUCCESS] ......... Subnet Masks is same across the network
親トピック: RoCEネットワーク・ファブリックの保守