Sun Enterprise 10000 SSP 3.3 ユーザーマニュアル

第 10 章 デュアル制御ボードの取り扱い

プラットフォームに 2 枚の制御ボードを装着して、冗長機能を実現することができます。制御ボードは手動で切り替えることができますが、2 枚の制御ボードを同時に使用することはできません。

2 枚の制御ボードのいずれか一方が、主制御ボードとなります。SSP は主制御ボードとだけ通信しようとします。接続障害やその他の理由で主制御ボードを切り替える場合は、システム管理者は制御ボードの構成を変更 (ssp_config(1M) を使用) し、SSP プロセスを再起動して、新しい主制御ボードを有効にします。制御ボードはすべてのボードにシステムクロックを供給しているため、この作業を完了するには、動作中のドメインをすべて再起動する必要があります。

制御ボードエグゼクティブ

制御ボードエグゼクティブ (CBE: Control Board Executive) は、制御ボード上で実行され、SSP とプラットフォーム間のやり取りを容易にします。

電源を入れると、メイン SSP から両方の制御ボードが起動されます。起動された CBE は、SSP 上で実行されている制御ボードサーバーが接続を確立するのを待ちます。

主制御ボード

SSP 上で実行されている制御ボードサーバーが制御ボード上で実行されている CBE に接続されると、CBE はその制御ボードを主制御ボードとして認識します。主制御ボードはシステムクロックと JTAG クロックを供給し、ファントレーと電源装置を制御します。

制御ボードサーバー

SSP を起動すると、自動的に制御ボードサーバー (CBS: Control Board Server) が起動します。SSP と主制御ボードの間の通信は、すべて CBS によって行われます。

CBS が接続を試みるのは、制御ボードの構成ファイルで主制御ボードとして指定されているボードです。制御ボードの構成ファイルの形式は、以下のとおりです。


platform_name:platform_type:cb0_hostname:status0:cb1_hostname:status1

ここで、

platform_nameは、システム管理者が割り当てた名前です。

platform_typeのデフォルトは、Ultra-Enterprise-10000 です。

cb0_hostnameは、有効であれば、制御ボード 0 のホスト名です。

status0は、制御ボード 0 が主制御ボードであるかどうかを示します (P の場合は主制御ボードです。それ以外の文字の場合は、主制御ボードではありません)。

cb1_hostnameは、有効であれば、制御ボード 1 のホスト名です。

status1は、制御ボード 1 が主制御ボードであるかどうかを示します。

たとえば、以下のようになります。


xf2:Ultra-Enterprise-10000:xf2-cb0:P:xf2-cb1:

この例では、プラットフォーム xf2 に 2 個の制御ボードが装着されています。制御ボードは、xf2-cb0xf2-cb1 です。xf2-cb0 が主制御ボードに指定されています。詳細は、マニュアルページの cb_config(4) を参照してください。

制御ボードサーバーと制御ボードエグゼクティブ間の通信に使用される通信ポートは、/tftpboot/xxxxxxxx.cb_port に指定されます。xxxxxxxx は制御ボードの IP アドレスであり、16 進数で表されます。

CBE(制御ボードエグゼクティブ) イメージファイルとポート指定ファイル

メイン SSP は制御ボードの起動サーバーです。起動時には、制御ボードの起動 PROM によって 2 つのファイルがダウンロードされます。1 つは CBE のイメージファイルであり、もう 1 つはポート番号指定ファイルです。これらのファイルは、SSP の /tftpboot に保存されていて、以下の形式の名前になっています。


/tftpboot/xxxxxxxx  cbe イメージ
/tftpboot/xxxxxxxx.cb_port ポート番号

xxxxxxxx は、制御ボードの IP アドレスであり、16 進数で表示されます。

たとえば、制御ボード xf2-cb0 用のファイルは以下のようになります。


/tftpboot/81973213
/tftpboot/81973213.cb_port

NIS を使用している場合は、xf2-cb0 の IP アドレスは、以下のコマンドによって確認することができます。


% ypcat hosts | grep xf2-cb0

返されるアドレスは 129.153.49.147 です。このアドレスは、81993193 に変換されます。

主制御ボードを切り替える

注意 - 注意 -

/var/opt/SUNWssp/.ssp_private/cb_config ファイルを手動で編集してはなりません。代わりに、下記のように ssp_config(1M) コマンドを使用します。このコマンドを使用しないと、ドメインに障害が発生し、アービトレーション停止 (arbstops) が発生することがあります。


  1. 標準の shutdown(1M) コマンドを使用して実行中のドメインを停止します。

  2. メイン SSP にユーザー名 ssp でログインします。

  3. すべてのシステムボードの電源を切ります。


    ssp% power -off -all
    

  4. すべてのシステムボードの電源を入れます。


    ssp% power -on -all
    

  5. メイン SSP にスーパーユーザーとしてログインします。

  6. 2 つの制御ボードのホスト名と IP アドレスを取得します。

  7. 制御ボードの IP アドレスが、/etc/inet/hosts ファイルまたはローカルのネームサービスシステムに適切に設定されているかどうかを確認します。

  8. スーパーユーザーとして、/opt/SUNWssp/bin/ssp_config cb と入力します。

    この例のセッションでは、主制御ボードは snax-cb0 から snax-cb1 に切り替えられます。


    ssp# /opt/SUNWssp/bin/ssp_config cb
    
    Configuring control boards.
    
    Platform name   = snax
    Control Board 0 = snax-cb0 => 129.153.49.181
    Control Board 1 = snax-cb1 => 129.153.49.182
    Primary Control Board = 0
    
    Is this correct? (y/n): n
    Do you have a control board 0? (y/n): y
    Please enter the host name of the control board 0 [snax-cb0]: 
    Do you have a control board 1? (y/n): y
    Please enter the host name of the control board 1 [snax-cb0]:
    
    Please identify the primary control board.
    Is Control Board 0 [snax-cb0] the primary? (y/n) n
    Is Control Board 1 [snax-cb1] the primary? (y/n) y
    
    Platform name   = snax
    Control Board 0 = snax-cb0 => 129.153.49.181
    Control Board 1 = snax-cb1 => 129.153.49.182
    Primary Control Board = 1
    
    Is this correct? (y/n): y
    


    注 -

    プラットフォームの名前は、特定のドメインではなく、「ホストマシン全体」を表します。


  9. メイン SSP プロセスを再起動します。

    1. スーパーユーザーとしてログインし、以下のように入力します。


      ssp# /etc/init.d/ssp stop
      ssp# /etc/init.d/ssp start
      

    2. SSP にユーザー名 ssp でログインし、以下のように入力します。


      ssp% tail -f $SSPLOGGER/messages
      

      以下のメッセージが表示されます。


      Startup of SSP programs complete

  10. Hostview を起動します。


     ssp% hostview &
    

    Hostview のメイン画面内の新しいプライマリ制御ボードの記号として "J" および "C" が表示されていることを確認します。これは、新しいプライマリ制御ボードが JTAG 接続され、クロック信号を供給していることを示しています。

    Hostview が応答しない場合は、新しいプライマリ制御ボードと通信可能であることを確認してください。ping(1M) を使用して新しいプライマリ制御ボードと通信できない場合は、LED を見て新しいプライマリ制御ボードが正しく動作していることを確認します。たとえば、接続状態を示す LED を確認します。この LED が点灯している場合は、Ethernet 接続には異常ありません。一定のパターンで繰り返し LED が点灯している場合は、新しいプライマリ制御ボードは起動されています。LED が (一定のパターンで繰り返し点灯するのではなく) すべて消灯または点灯状態のままの場合は、新しいプライマリ制御ボードが起動されていません。SSP で snoop(1M) を実行して、制御ボードが正しく通信していることを確認してください。

  11. スペア SSP がある場合は、上記の手順 6 から 手順 8 をスペア SSP で繰り返します。

  12. すべてのドメインに対して bringup(1M) コマンドを実行します。