4.8.3 トポロジ検証ユーティリティの使用

verify-topologyユーティリティは、ネットワーク接続の様々な問題を特定するために使用できます。

verify-topologyは、次のような問題の診断に使用できます。

  • InfiniBandネットワーク・ファブリック・ケーブルの欠落
  • InfiniBandネットワーク・ファブリック接続の欠落
  • 誤った位置に取り付けられているケーブル
  • 誤ったエンドポイントに接続されているケーブル

このユーティリティは、すべてのサーバーのibdiagtoolsディレクトリにあります。verify-topologyユーティリティのオプションを表示するには、次のコマンドを使用します。

./verify-topology -h

[ DB Machine Infiniband Cabling Topology Verification Tool ]
Usage: ./verify-topology 
    [-v|--verbose]
    [-r|--reuse (cached maps)]
    [-m|--mapfile]
    [-ibn|--ibnetdiscover (specify location of ibnetdiscover output)]
    [-ibh|--ibhosts (specify location of ibhosts output)]
    [-ibs|--ibswitches (specify location of ibswitches output)]
    [-t|--topology [torus | fattree | halfrack] default is fattree]

例4-1 verify-topologyを使用した取付け不良のケーブルの特定

次に、verify-topologyユーティリティ使用時の出力例を示します。このエラー例では、ケーブルの接続が正しくないことが示されています。サーバーからのケーブルは、どちらも同じInfiniBandネットワーク・ファブリック・スイッチに接続されています。スイッチに障害が発生すると、サーバーからInfiniBandネットワーク・ファブリック・ネットワークへの接続が失われます。

[ DB Machine Infiniband Cabling Topology Verification Tool ]

Bad link:Switch 0x21283a8371a0a0 Port 11A - Sun Port 11B
        Reason : 2.5 Gbps Speed found. Could be 10 Gbps
        Possible cause : Cable isn't fully seated in

Bad link:Switch 0x21283a89eba0a0 Port 11B - Sun Port 11A
        Reason : 2.5 Gbps Speed found. Could be 10 Gbps
        Possible cause : Cable isn't fully seated in

Is every external switch connected to every internal switch..........[SUCCESS]
Are any external switches connected to each other....................[SUCCESS]
Are any hosts connected to spine switch..............................[SUCCESS]
Check if all hosts have 2 CAs to different switches..................[ERROR]
Node trnA-db01 has 1 endpoints. (Should be 2)
Port 2 of this node is not connected to any switch

--------fattree End Point Cabling verification failed-----

Leaf switch check: cardinality and even distribution.................[ERROR]

Internal QDR Switch 0x21283a8371a0a0 has fewer than 4 compute nodes
It has only 3 links belonging to compute nodes
Check if each rack has a valid internal ring.........................[SUCCESS]