RDMAネットワーク・ファブリック・スイッチの構成

RDMAネットワーク・ファブリック・スイッチの初期構成を実行する必要があります。

InfiniBandスイッチの構成

リカバリ・アプライアンスでは、Sun Datacenter InfiniBand Switch 36の2つのリーフ・スイッチは、ibaおよびibbと識別されます。両方のスイッチに、次の構成手順を実行します。

InfiniBandスイッチの構成

U20のリーフ・スイッチ1のデフォルトの識別子はiba、U22のリーフ・スイッチ2のデフォルトの識別子はibbです。

Sun Datacenter InfiniBand Switch 36スイッチを構成するには、次のようにします。

  1. 1つのラック設置の場合、InfiniBandリーフ・スイッチ上のポート8BからInfiniBandケーブルを抜きます。これが邪魔にならないように吊るすには、フック・アンド・ループ・テープを使用します。

    このケーブルは、マルチラック設置の場合にスパイン・スイッチに接続するために事前に設置されています。ただし、1つのラック設置の場合、これはモニタリング・ソフトウェアではダウンリンクとして表示される可能性があります。

  2. ラップトップとInfiniBandスイッチのUSBシリアル・アダプタの間をシリアル・ケーブルで接続します。必要に応じて、次の端末設定を使用します。
    TERM=vt100; export TERM
    
  3. Oracle ILOMにログインします。
    localhost: ilom-admin
    password: welcome1
    
  4. ファームウェアのバージョンが2.1.5-1以上であることを確認します。
    -> version
    

    スイッチのバージョンが2.1.5-1より前のものである場合は、Oracleサポート・サービスに連絡してください。

  5. ドメイン名なしで、スイッチのホスト名を設定します。次の例では、名前ra1swを1つ目のゲートウェイ・スイッチ(iba)に割り当てています。
    -> set /SP hostname=ra1sw-iba
    -> show /SP hostname
    /SP
    Properties:
    hostname = ra1sw-iba
    

    スイッチの名前は、インストレーション・テンプレートを参照してください。

  6. DNSサーバー名とドメイン名を設定します。次の構文では、希望する検索順序で、IP_addressesに最大3つのIPアドレスをカンマで区切って指定できます。
    -> set /SP/clients/dns auto_dns=enabled
    -> set /SP/clients/dns nameserver=IP_addresses
    -> set /SP/clients/dns searchpath=domain_name
    
  7. 設定を確認します:
    -> show /SP/clients/dns
    /SP/clients/dns
    Targets:
    Properties:
    auto_dns = enabled
    nameserver = 10.196.23.245, 138.2.202.15
    retries = 1
    searchpath = example.com
    timeout = 5
         .
         .
         .
    
  8. スイッチ管理ネットワークの設定を構成します。次のコマンドで、pending_ippending_gwおよびpending_nmはネットワーク管理者によって定義されたIPアドレスです。
    -> cd /SP/network
    -> set pendingipaddress=pending_ip
    -> set pendingipgateway=pending_gw
    -> set pendingipnetmask=pending_nm
    -> set pendingipdiscovery=static
    -> set commitpending=true
    
  9. 設定を確認します:
    -> show
    /SP/network
    Targets:
    test
    Properties:
    commitpending = (Cannot show property)
    dhcp_server_ip = none
    ipaddress = 10.196.16.152
    ipdiscovery = static
    ipgateway = 10.196.23.254
    ipnetmask = 255.255.248.0
    macaddress = 00:E0:4B:38:77:7E
    pendingipaddress = 10.196.16.152
    pendingipdiscovery = static
    pendingipgateway = 10.196.23.254
    pendingipnetmask = 255.255.248.0
    state = enabled
         .
         .
         .
    
  10. いずれかの値が正しくない場合は、set pendingipparameterコマンド、commitpending=trueコマンドの順に繰り返します。

InfiniBandスイッチでの時間の設定

InfiniBandスイッチで時間を設定するには、次のようにします。

  1. インストレーション・テンプレートに表示されている値を使用して、タイムゾーンを設定します。次のコマンドでは、現在の設定の表示、タイムゾーンの変更、新しい設定の確認を行っています。
    -> show /SP/clock 
    -> set /SP/clock timezone=zone identifier
    -> show /SP/clock
    

    インストレーション・テンプレートは、Oracle Exadata Deployment Assistantによって生成されます。Oracle Exadata Deployment Assistantの使用を参照してください。

  2. SPクロックを現在時刻に設定します。使用する時間の形式はMMddHHmmCCyyで、月、日にち、時間、分、世紀および年を示しています。次のコマンドでは、現在の設定の表示、時間の変更、新しい設定の確認を行っています。
    -> show /SP/clock
    -> set /SP/clock datetime=MMddHHmmCCyy
    -> show /SP/clock
    
  3. NTPを構成します。次のコマンドは、プライマリ(1)とセカンダリ(2)の両方のNTPサーバーを構成しています。
    -> set /SP/clients/ntp/server/1 address=IP_address
    -> set /SP/clients/ntp/server/2 address=IP_address
    -> set /SP/clock usentpserver=enabled
    

    ノート:

    ネットワークでNTPが使用されていない場合は、「リカバリ・アプライアンス・ソフトウェアのインストール」でソフトウェアをインストールする前に、1台目の計算サーバー(U16)をNTPサーバーとして構成します。

  4. プライマリNTPサーバーのIPアドレスを確認します。
    -> show /SP/clients/ntp/server/1
    /SP/clients/ntp/server/1
       Targets:
    
       Properties:
          address = 10.204.74.2
    
       Commands:
          cd
          set
          show
    
  5. セカンダリNTPサーバーのIPアドレスを確認します。
    -> show /SP/clients/ntp/server/2
    /SP/clients/ntp/server/2
       Targets:
    
       Properties:
          address = 10.196.16.1
         .
         .
         .
    
  6. 時間を確認します:
    -> show /SP/clock
    /SP/clock
       Targets:
    
       Properties:
          datetime = Mon Nov 04 11:53:19 2013
          timezone = EST (US/Eastern)
          usentpserver = enabled
         .
         .
         .

スパイン・スイッチでのシリアル番号の設定

マルチラック構成で、スパイン・スイッチのILOMでラック・マスター・シリアル番号を設定します。リーフ・スイッチを構成する場合は、この手順をスキップします。

スパイン・スイッチでシリアル番号を設定するには:

  1. システム識別子を40文字以下に設定します。
    -> set /SP system_identifier="Oracle ZDLRA X5 serial_number"
    

    無効なプロパティ値に関するエラーは、文字数が多すぎることを示します。

  2. 値が設定されていることを検証します。
    -> show /SP system_identifier
         /SP
           Properties:
             system_identifier = Oracle ZDLRA X5 AK012345678

InfiniBandスイッチの状態の確認

InfiniBandスイッチの状態を確認するには、次のようにします。

  1. ファブリック管理シェルを開きます。

    -> show /SYS/Fabric_Mgmt
    NOTE: show on Fabric_Mgmt will launch a restricted Linux shell.
    User can execute switch diagnosis, SM Configuration and IB
    monitoring commands in the shell. To view the list of commands,
    use "help" at rsh prompt.
    Use exit command at rsh prompt to revert back to
    ILOM shell.
    FabMan@hostname->
    

    プロンプトが->からFabMan@hostname->に変わります

  2. スイッチの全般的な状態を確認します。

    FabMan@ra1sw-iba-> showunhealthy
    OK - No unhealthy sensors
    
  3. 環境全般を確認します。

    FabMan@ra1sw-iba-> env_test
    NM2 Environment test started:
    Starting Voltage test:
    Voltage ECB OK
    Measured 3.3V Main = 3.28 V
    Measured 3.3V Standby = 3.42 V
    Measured 12V = 12.06 V
         .
         .
         .
    

    レポートには、ファン1、2、3があり、ファン0と4がないことが表示されます。「All OK and Passed」という結果は、環境が正常であることを示します。

  4. スイッチのInfiniBandサブネット・マネージャの現在の優先度を確認します。リーフ・スイッチのsmpriorityの値は5、スパイン・スイッチのsmpriorityの値は8である必要があります。次に示すサンプル出力は、リーフ・スイッチの優先度が正しいことを示しています。

    FabMan@ra1sw-iba-> setsmpriority list
    Current SM settings:
    smpriority 5
    controlled_handover TRUE
    subnet_prefix 0xfe80000000000000
    
  5. 優先度の設定が正しくない場合は、リセットします。

    1. サブネット・マネージャを無効にします。

      FabMan@ra1sw-iba->disablesm
      Stopping partitiond daemon.             [ OK ]
      Stopping IB Subnet Manager..            [ OK ]
      
    2. 優先度をリセットします。この例では、リーフ・スイッチに優先度を設定しています。

      FabMan@ra1sw-iba->setsmpriority 5
      Current SM settings:
      smpriority
      5 controlled_handover TRUE
      subnet_prefix 0xfe80000000000000
      
    3. サブネット・マネージャを再起動します。

      FabMan@ra1sw-iba->enablesm
      Starting IB Subnet Manager.             [ OK ]
      Starting partitiond daemon.             [ OK ]
      
  6. ファブリック管理シェルとOracle ILOMシェルからログアウトします。

    FabMan@ra1sw-iba-> exit
    -> exit
    
  7. Linuxにrootとしてログインし、スイッチを再起動します。

    localhost: root
    password: welcome1
    [root@localhost ~]# reboot
    
  8. ラップトップをInfiniBandスイッチから取り外します。

  9. 2つ目のInfiniBandリーフ・スイッチで、この手順を繰り返します。

サブネット・マネージャ・マスターとしてのスパイン・スイッチの設定

ラック・ユニット1 (U1)にあるInfiniBandスイッチは、スパイン・スイッチと呼ばれます。リカバリ・アプライアンスでスパイン・スイッチを使用できるのは、別のリカバリ・アプライアンスに接続している場合のみです。ラックの基本コンポーネントには含まれていません。

ラックを配線した後、次のステップを実行します。

スパイン・スイッチはInfiniBandサブネットのサブネット・マネージャ・マスターです。サブネット・マネージャ・マスターの優先度は8です。

スパイン・スイッチの優先度の設定を確認するには、次のようにします。

  1. rootユーザーとしてスパイン・スイッチにログインします。

  2. setsmpriority listコマンドを実行します。

    このコマンドにより、smpriorityの値は8であることが示されます。smpriorityの値が異なる場合は、次のようにしてください。

    1. disablesmコマンドを使用して、サブネット・マネージャを停止します。

    2. setsmpriority 8コマンドを使用して優先度を8に設定します。

    3. enablesmコマンドを使用して、サブネット・マネージャを再起動します。

他の2つのInfiniBandスイッチはリーフ・スイッチです。リーフ・スイッチは、ラック・ユニット20および22 (U20とU22)にあります。これらは、優先度が5のスタンバイ・サブネット・マネージャです。ステータスは、前述のステップ22.bのコマンドに値5を代入して確認できます。

サブネット・マネージャ・マスターを確認するには、次のようにします。

  1. 任意のInfiniBandスイッチにrootユーザーとしてログインします。

  2. サブネット・マネージャ・マスターの場所が表示されます。

    # getmaster
    20100701 11:46:38 OpenSM Master on Switch : 0x0021283a8516a0a0 ports 36 Sun DCS 36
    QDR switch ra01sw-ib1.example.com enhanced port 0 lid 1 lmc 0
    

    前述の出力は、適切な構成を示しています。サブネット・マスター・マネージャは、スパイン・スイッチra01sw-ib1.example.comで実行されます。

スパイン・スイッチがサブネット・マネージャ・マスターではない場合、サブネット・マネージャ・マスターをリセットします。

  1. getmasterコマンドを使用して、サブネット・マネージャ・マスターの現在の場所を確認します。

  2. サブネット・マネージャ・マスターのリーフ・スイッチにrootユーザーとしてログインします。

  3. スイッチのサブネット・マネージャを無効にします。サブネット・マネージャ・マスターが別のスイッチに移動します。

    関連項目:

    次のWebサイトの『Sun Datacenter InfiniBand Switch 36 User's Guide』のサブネット・マネージャの無効化に関する項を参照してください。

    http://docs.oracle.com/cd/E19197-01/835-0784-05/z4001de61813698.html#z40003f12047367

  4. getmasterコマンドを使用して、サブネット・マネージャ・マスターの現在の場所を確認します。スパイン・スイッチがサブネット・マネージャ・マスターではない場合、スパイン・スイッチがサブネット・マネージャ・マスターになるまでステップ23を繰り返します。

  5. この手順の実行中に無効になったリーフ・スイッチのサブネット・マネージャを有効にします。

    関連項目:

    次のWebサイトの『Sun Datacenter InfiniBand Switch 36 User's Guide』のサブネット・マネージャの有効化に関する項を参照してください。

    http://docs.oracle.com/cd/E19197-01/835-0784-05/z4001de61707660.html#z40003f12047359

ノート:

4つ以上のラックを配線してInfiniBandネットワークを構成している場合、スパイン・スイッチでのみ、サブネット・マネージャを実行します。リーフ・スイッチのサブネット・マネージャは無効化します。

Cisco Nexus 9336C-FX2スイッチの構成

エンジニアド・システム・ラックに付属するRoCE Network Fabricスイッチは、インストール中に最小限の構成が実行されます。

最初のシステム構成時には、スイッチのリセットと構成を実行できます。

  1. 利用可能なRJ45ケーブルを使用して、RoCE Network Fabricスイッチ・シリアル・コンソールからラップトップなどのデバイスに接続します。
  2. ログ出力によって、端末セッションがラップトップ上に記録されていることを確認します。
    出力結果を使用して、スイッチが正しく構成されていることを確認できます。
  3. スイッチの電源をオンにします。
  4. adminユーザーとしてログインします。
    User Access Verification
    dbm0sw-rocea0 login: admin
    Password: ********
    

    ノート:

    adminユーザーのパスワードがない場合は、Oracleサポート・サービスにお問い合せください。
  5. 既存の構成を消去します。
    dbm0sw-rocea0# write erase
    
    Warning: This command will erase the startup-configuration.
    
    Do you wish to proceed anyway? (y/n)  [n] y
  6. 自動セットアップを実行できるよう、システムを再起動します。
    dbm0sw-rocea0# reload
    
    This command will reboot the system. (y/n)?  [n] y
    
    2017 Aug 31 01:09:00 dbm0sw-rocea0 %$ VDC-1 %$ %PLATFORM-2-PFM_SYSTEM_RESET: Manual system restart from Command Line Interface
    
    
    CISCO SWITCH Ver7.59
    Device detected on 0:1:2 after 0 msecs  
    ...
  7. 標準セットアップに切り替え、堅牢なパスワード基準を強制するかどうかを尋ねられた場合はnoと入力してから、adminユーザーの新規パスワードを入力します。
    Running S93thirdparty-script...
    
    Populating conf files for hybrid sysmgr ...
    Starting hybrid sysmgr ...
    inserting /isan/lib/modules/klm_cisco_nb.o ... done
    
    Abort Auto Provisioning and continue with normal setup ? (yes/no) [n]: yes
    
             ---- System Admin Account Setup ----
    
    Do you want to enforce secure password standard (yes/no) [y]: no
    
      Enter the password for "admin": 
      Confirm the password for "admin": 
    
  8. 基本システム構成ダイアログが表示されたら、基本構成ダイアログに入力することを選択します。
            ---- Basic System Configuration Dialog VDC: 1 ----
    
    This setup utility will guide you through the basic configuration of
    the system. Setup configures only enough connectivity for management
    of the system.
    
    Please register Cisco Nexus9000 Family devices promptly with your
    supplier. Failure to register may affect response times for initial
    service calls. Nexus9000 devices must be registered to receive 
    entitled support services.
    
    Press Enter at anytime to skip a dialog. Use ctrl-c at anytime
    to skip the remaining dialogs.
    
    Would you like to enter the basic configuration dialog (yes/no): yes
    
  9. 基本構成では、スイッチ名の入力を求められるまで、デフォルトの入力内容を使用できます。

    この例では、スイッチにはtest123sw-rocea0という名前が付けられています。

      Create another login account (yes/no) [n]: 
      Configure read-only SNMP community string (yes/no) [n]: 
      Configure read-write SNMP community string (yes/no) [n]: 
      Enter the switch name : test123sw-rocea0
    
    
  10. バンド外管理構成を構成するように求められたら、yesと応じて、プロンプトが表示されたら、適切なネットワーク・アドレスを指定します。
    Continue with Out-of-band (mgmt0) management configuration? (yes/no) [y]: yes
         Mgmt0 IPv4 address : 100.104.10.21
         Mgmt0 IPv4 netmask : 255.255.248.0
      Configure the default gateway? (yes/no) [y]:
         IPv4 address of the default gateway : 100.104.10.1
  11. 詳細IPオプションを構成するよう求められたら、yesと答えます。
    Configure advanced IP options? (yes/no) [n]: yes
  12. 静的ルートを構成するよう求められたら、yesと答えます(これは後で変更できます)。
    Configure static route? (yes/no) [n]: yes
  13. プロンプトが表示されたら、宛先の接頭辞とマスク、およびその他の値を入力します。
       Destination prefix : 10.100.100.0
    
       Destination prefix mask : 255.255.255.0
    
       Next hop IPv4 address : 10.100.100.1
    
  14. DNSのIPv4アドレスを構成します。
    Configure the DNS IPv4 address? (yes/no) [n]: yes
       DNS IP address: 10.100.100.2
  15. デフォルト・ドメイン名の構成はスキップします(これは後で構成する)。
    Configure the default domain name? (yes/no) [n]: no
    
  16. SSHおよびNTPサーバーを構成するよう求められるまで、デフォルトの回答を使用します。
    Enable the telnet service? (yes/no) [n]: no
    Enable the ssh service? (yes/no) [y]: yes
       Type of ssh key you would like to generate (dsa/rsa) [rsa]: rsa
       Number of rsa key bits <1024-2048> [1024]: 1024
     
    Configure the NTP server? (yes/no) [n]: yes
         NTP server IPv4 address : 10.100.100.3
  17. CoPPシステム・プロファイルを指定するよう求められるまで、デフォルトの回答を使用します。strictと入力します。
     Configure default interface layer (L3/L2) [L2]: 
     Configure default switchport interface state (shut/noshut) [noshut]: 
     Configure CoPP system profile (strict/moderate/lenient/dense) [strict]: strict
  18. 構成を確認した後、構成を保存します。
    The following configuration will be applied:
       no password strength-check
       switchname test123sw-rocea0
       ip route 100.104.8.0 255.255.248.0 100.104.10.1
       vrf context management
       ip route 0.0.0.0/0 100.104.10.1
       exit
        no feature telnet
        ssh key rsa 1024 force
        feature ssh
        ntp server 100.104.10.1
        system default switchport
        no system default switchport shutdown
        copp profile strict
       interface mgmt0
       ip address 100.104.10.21 255.255.248.0
       no shutdown
    
    Would you like to edit the configuration? (yes/no) [n]: 
    
    Use this configuration and save it? (yes/no) [y]: yes
    
    [########################################] 100%
    Copy complete.
  19. スイッチのscpサーバー機能を有効にします。
    test123sw-rocea0# feature scp-server
  20. 実行中の構成をフラッシュに保存します。
    test123sw-rocea0# copy running-config startup-config
    [########################################] 100%
    Copy complete.
    
  21. スイッチにゴールデン構成を適用します。
    1. ターゲット構成のスイッチの構成ファイルを削除します。

      ノート:

      置き換えるファイルを削除しない場合、ファイルを上書きしようとすると「権限が拒否されました」というエラーが発生します。

      スイッチにログインし、構成モードに移行してから、次のようなコマンドを実行します。

      test123sw-rocea0# delete bootflash:roce_leaf_switch.cfg
      Do you want to delete "/roce_leaf_switch.cfg" ? (yes/no/abort) [y] y
      test123sw-rocea0# 
    2. スイッチへのSSHアクセスがあり、最新のRDMAネットワーク・ファブリックのパッチZIPファイルが含まれているサーバーにログインします。

      使用可能なRDMAネットワーク・ファブリック・パッチを検索するには、My Oracle Supportドキュメント888828.1でRDMAネットワーク・スイッチを検索します。Oracle Exadata System Softwareリリースの最新パッチをダウンロードして使用します。

    3. RDMAネットワーク・ファブリックのパッチZIPファイルを解凍し、ディレクトリをpatchmgrユーティリティの場所に変更します。
    4. RDMA Network Fabricパッチ・バンドル内にあるゴールデン構成ファイルを見つけます。

      このファイルは、roce_switch_templatesディレクトリ内にあります。

      次に、各ゴールデン構成ファイルを示します。

      • シングル・ラックのリーフ(leaf): roce_leaf_switch.cfg
      • マルチラックのスパイン(mspine): roce_spine_switch_multi.cfg
      • マルチラックのリーフ(mleaf): roce_leaf_switch_multi.cfg
      • Secure Fabricサポート付きのシングル・ラックのリーフ(sfleaf): roce_sf_leaf_switch.cfg
      • Secure Fabricサポート付きのマルチラックのリーフ(msfleaf): roce_sf_leaf_switch_multi.cfg
      • 23個のホスト・ポートで構成されたシングル・ラックのリーフ(leaf23): roce_leaf_switch_23hosts.cfg
      • 23個のホスト・ポートで構成されたマルチラックのリーフ(mleaf23): roce_leaf_switch_23hosts_multi.cfg
      • 14個のスイッチ間リンクで構成されたマルチラックのリーフ(mleaf_u14): roce_leaf_switch_14uplinks_multi.cfg
      • 14個のスイッチ間リンクおよびSecure Fabricのサポートで構成されたマルチラックのリーフ(msfleaf_u14): roce_sf_leaf_switch_14uplinks_multi.cfg
      • 23個のホスト・ポートおよび13個のスイッチ間リンクで構成されたマルチラックのリーフ(mleaf23_u13): roce_leaf_switch_23hosts_13uplinks_multi.cfg
    5. ゴールデン構成ファイルをスイッチにコピーします。

      次の例で、100.104.10.21は構成するスイッチのIPアドレスを表しています。

      # scp roce_leaf_switch.cfg admin@100.104.10.21:/
      User Access Verification
      Password:
      roce_leaf_switch.cfg 100% 23KB 23.5KB/s 00:00
    6. スイッチにゴールデン構成ファイルを適用します。
      スイッチに直接接続しているときに、run-scriptコマンドを使用します。
      test123sw-rocea0# run-script bootflash:roce_leaf_switch.cfg | grep 'none'

      ノート:

      このコマンドは、シングルラックのスイッチでは最大1-2分、マルチラックのスイッチでは最大3-4分かかる場合があります。
    7. スイッチ構成を検証します。
      最新のRDMA Network Fabricパッチ・バンドルが格納されていて、スイッチへのSSHアクセスが可能なサーバーでpatchmgrユーティリティを使用します。

      次に示すコマンドのroceswitch.lstは、スイッチのホスト名またはIPアドレスが含まれているファイルです。

      # ./patchmgr --roceswitches roceswitch.lst --verify-config
  22. スイッチ構成をバックアップします。

    『Oracle Exadata Database Machineメンテナンス・ガイド』ROCEスイッチの設定のバックアップに関する項に示されたステップを実行します。

  23. オプション: Cisco 93108-1Gまたは9348イーサネット・スイッチのクロックの設定と同じ手順を使用して、クロックを設定します。