4.7.8 RoCEネットワーク・ファブリックの動作の検証
基礎となるハードウェアを変更した後にRoCEネットワーク・ファブリックが適切に動作しているかどうかを検証します。
RoCEネットワーク・ファブリックの任意のコンポーネントを使用してハードウェアのメンテナンス(サーバー、スイッチまたはケーブル上のRDMAネットワーク・ファブリックのアダプタの交換を含む)が行われたか、RoCEネットワーク・ファブリックの操作が基準を満たしていない疑いがある場合、RoCEネットワーク・ファブリックが適切に動作しているかどうかを検証します。次の手順は、ネットワーク動作の確認方法を示しています。
- RoCEネットワーク・ファブリック構成の検証のステップを完了します。
infinicheckの準備をします。infinicheckコマンドを使用してRoCEネットワーク・ファブリックの構成、接続性およびパフォーマンスのチェックを実行する前に、次のコマンドを実行する必要がある場合があります。-
必要に応じて、
-sオプションを使用して、RoCEネットワーク・ファブリック全体にパスワードなしのSSHユーザー等価を設定します。次に例を示します:# /opt/oracle.SupportTools/ibdiagtools/infinicheck -g hostips -c cellips -s -
-zオプションを使用すると、前回のinfinicheckコマンドの実行中に作成されたファイルを消去できます。次に例を示します:# /opt/oracle.SupportTools/ibdiagtools/infinicheck -g hostips -c cellips -z
前述のコマンドで、
hostipsは、データベース・サーバーのRoCEネットワーク・ファブリックのIPアドレスのリストを含む入力ファイルの名前で、cellipsは、ストレージ・サーバーのRoCEネットワーク・ファブリックのIPアドレスのリストを含む入力ファイルの名前です。-
infinicheckコマンドを実行して、RoCEネットワーク・ファブリックの構成、接続性およびパフォーマンスのチェックを実行します。適切に構成されたシステムで、最小限の引数を指定して、任意のデータベース・サーバー上で
infinicheckコマンドを実行できます。次に例を示します:# /opt/oracle.SupportTools/ibdiagtools/infinicheckデフォルトでは、
infinicheckコマンドはRoCEネットワーク・ファブリックで構成および接続チェックのグループを実行します。-pオプションを使用して、オプションのパフォーマンス・テストを実行できます。または、-aオプションを使用して、パフォーマンス・テストを含むすべてのチェックを実行します。次に例を示します:# /opt/oracle.SupportTools/ibdiagtools/infinicheck -aノート:
infinicheckコマンドがパフォーマンス・ストレス・テストを実行すると、システムのパフォーマンスに影響が出る可能性があります。したがって、infinicheckパフォーマンス・テストは、必要な場合(なるべくシステム上にワークロードがないとき)にのみ、実行することをお薦めします。-gオプションを使用してデータベース・サーバーを指定し、-cオプションを使用してストレージ・サーバーを指定することによって、システム内のサーバーを明示的に指定することもできます。次に例を示します:# /opt/oracle.SupportTools/ibdiagtools/infinicheck -g hostips -c cellips前述の例で、
hostipsは、データベース・サーバーのRoCEネットワーク・ファブリックのIPアドレスのリストを含む入力ファイルの名前で、cellipsは、ストレージ・サーバーのRoCEネットワーク・ファブリックのIPアドレスのリストを含む入力ファイルの名前です。データベース・サーバーとストレージ・サーバーを入力ファイルにリストするかわりに、コマンドラインで、IPアドレスのカンマ区切りリストを指定できます。
次の例は、
infinicheckコマンドの一般的な端末の出力を表示します。# /opt/oracle.SupportTools/ibdiagtools/infinicheck -g hostips -c cellips INFINICHECK [Network Connectivity, Configuration and Performance] #### FABRIC TYPE TESTS #### System type identified: RoCE Verifying User Equivalence of user=root from all DBs to all CELLs. #### RoCE CONFIGURATION TESTS #### Checking for presence of RoCE devices on all DBs and CELLs [SUCCESS].... RoCE devices on all DBs and CELLs look good Checking for RoCE Policy Routing settings on all DBs and CELLs [SUCCESS].... RoCE Policy Routing settings look good Checking for RoCE DSCP ToS mapping on all DBs and CELLs [SUCCESS].... RoCE DSCP ToS settings look good Checking for RoCE PFC settings and DSCP mapping on all DBs and CELLs [SUCCESS].... RoCE PFC and DSCP settings look good Checking for RoCE interface MTU settings. Expected value : 2300 [SUCCESS].... RoCE interface MTU settings look good Verifying switch advertised DSCP on all DBs and CELLs ports ( ~ 2 min ) [SUCCESS].... Advertised DSCP settings from RoCE switch looks good #### CONNECTIVITY TESTS #### [COMPUTE NODES -> STORAGE CELLS] (60 seconds approx.) (Will walk through QoS values: 0-6) [SUCCESS]..............Results OK [SUCCESS]....... All can talk to all storage cells [COMPUTE NODES -> COMPUTE NODES] (60 seconds approx.) (Will walk through QoS values: 0-6) [SUCCESS]..............Results OK [SUCCESS]....... All hosts can talk to all other nodes Verifying Subnet Masks on all nodes [SUCCESS] ......... Subnet Masks is same across the network
親トピック: RoCEネットワーク・ファブリックの保守