Sun Cluster 2.2 のシステム管理

SPARCstorage Array コントローラの交換と WWN の変更

SPARCstorage Array には、Solaris に対してコントローラを識別するための固有の名称である WWN (World Wide Name)があります。そのため、SPARCstorage Array の障害によってコントローラまたはコントローラを含むシャーシ全体を交換する必要が生じた場合は、特別な作業が必要となります。

WWN は、SPARC マシンのホスト IDPROM に格納されているホスト ID に似ています。SPARCstorage Array の WWN の最後の 4 桁は、シャーシの LCD パネルに表示されます。WWN は、SPARCstorage Array とそのコンポーネントのドライブに対応する /devices パスの一部です。

SPARCstorage Array コントローラまたはシャーシ全体を交換する必要がある場合は、それらが再起動される時に Sun Cluster ノードは新しい WWN を見つけます。新しい WWN によって Sun Cluster ソフトウェアの上位レイヤーが混乱することを防ぐには、新しいコントローラの WWN を古いコントローラの WWN に変更する必要があります。これは、SPARC マシンのシステムボードを交換する場合に、IDPROM を置換するのに似ています。

WWN をどの方法で置換するかを決定するには、次の点を考慮してください。

メンテナンスシステムを使用して SPARCstorage Array の WWN を変更するには

ここでは、SPARCstorage Array コントローラを変更し、その WWN を障害の発生したコントローラの WWN に置き換える方法を説明します。この方法を使用すると、クラスタ内のノードを停止せずに SPARCstorage Array コントローラを交換できます。

この方法は、「保守用システム」(SPARCstorage Array をサポートできる任意の Sun アーキテクチャ) を使用します。保守用システムを使用することで、クラスタ内のノードを停止することなくこの作業を行えます。

保守用システムは、クラスタノードと同じバージョンの Solaris オペレーティング環境を読み込んでください。このシステムには、該当するすべてのパッチが必要です。また、CD-ROM ドライブ、Fibre Channel SBus Card (FC/S)、Fibre Channel Optical Module (FC/OM) も必要とします。このシステムの FCODE およびハードウェアリビジョンは、適切なものでなければなりません。保守用システムは、ネットワーク上のサーバーから起動することもできます。


注 -

保守用システムが使用できない場合は、クラスタノードの 1 つをこの目的で使用し、この作業の手順に従ってください。


次に、保守用システムを使用して SPARCstorage Array の WWN を変更する手順の概略を示します。

次に、保守用システムを使用して SPARCstorage Array の WWN を変更する詳しい手順を示します。

  1. 障害が発生した SPARCstorage Array コントローラが定足数コントローラの場合は、scconf(1M) コマンドを使用して新しい定足数コントローラを選択します。

    詳細は、scconf(1M) のマニュアルページを参照してください。

  2. SPARCstorage Array の WWN を確認します。

    SPARCstorage Array の電源が落ちている場合は、次の方法で WWN を確認してください。

    WWN は、12 桁の 16 進数で構成されています。これらの数字は、デバイスパスコンポーネントの一部として示されます。WWN は、pln@a0 という文字の後に続く最後の 12 桁 (コンマを除く) です。現在の WWN を確認するには、SPARCstorage Array に接続されているクラスタノードで、ls(1) コマンドを実行してください。


    # ls -l /dev/rdsk/cNt0d0s0
    ...SUNW,pln@a0000000,7412bf ...

    この例では、SPARCstorage Array の WWN は 0000007412bf です。デバイス名の中の変数 N は、故障した SPARCstorage Array のコントローラ番号を示します。文字列「t0d0s0」は、1 つの例です。SPARCstorage Array 上に存在するデバイス名を使用するか、すべてのデバイスを指定するように /dev/rdsk/cN* を使用してください。

    SPARCstorage Array が稼動中の場合は、luxadm(1M) コマンドを使用して WWN を確認できます。

    display オプションを指定して luxadm(1M) を実行し、コントローラを指定すると、SPARCstorage Array の情報がすべて表示されます。luxadm(1M) が示すシリアル番号が WWN です。


    # /usr/sbin/luxadm display cN
    
  3. 障害のある SPARCstorage Array コントローラから光ケーブルを外します。

  4. 障害のあるコントローラを交換します。

    この手順を行うには、SPARCstorage Array のサービスマニュアル内の操作説明に従ってください。

    SPARCstorage Array が完全には故障していない場合や、コントローラ障害以外のほかの理由で交換する場合は、SPARCstorage Array の各トレーごとに 「SPARCstorage Array トレーの管理」で説明されている手順を実行して、交換の準備を行なってください。

    SPARCstorage Array コントローラが完全に故障した場合は、ボリューム管理ソフトウェアによって交換の用意ができています。

  5. 保守用システムから新しいコントローラに光ケーブルを接続します。

  6. 保守用システムで OpenBoot PROM モードに入り、「mini-unix」を指定して起動します。

    製品 CD (またはネットワーク上の同等プログラム) を使用して、メンテナンスシステムをシングルユーザーモードに設定し、新しい SPARCstorage Array の WWN を含むデバイス構造のメモリ内バージョンを取得します。


    <#0> ok boot cdrom -s
     
    or
     
    <#0> ok boot netqe1 -s
    

    デバイス情報が永続的に変更されることを避けるために、「mini-unix」を使用してください。

  7. luxadm download コマンドを実行して、WWN を設定します。

    # /usr/sbin/luxadm -s -w WWN download cN
    

    WWN は、交換されるコントローラの 12 桁の WWN です。N は、デバイス名の cNtXdX に含まれるコントローラ番号です。WWN は、手順 2で取得したものです。


    注 -

    先頭のゼロは、合計 12 桁にするために WWN の一部として必ず入力する必要があります。



    注意 - 注意 -

    ダウンロード処理は中断しないでください。luxadm(1M) コマンドが終了し、シェルプロンプトが表示されるまで待ってください。


  8. プロンプトが再表示された後、SPARCstorage Array をリセットします。

    SPARCstorage Array のウィンドウに、新しいアドレスが表示されます。

  9. 保守用システムを停止します。

  10. SPARCstorage Array コントローラをクラスタノードに再度接続します。

  11. クラスタノードから、SPARCstorage Array のファームウェアレベルを調べます。

    ファームウェアの現行バージョンを確認するには、luxadm(1M) コマンドを使用します。この場合は、luxadm(1M) コマンドに、コントローラ番号 (次の例の N) を指定してください。


    # /usr/sbin/luxadm display cN
    

    注 -

    システム上に古いファームウェアが検出されると、Solaris システムはコンソールと /var/adm/messages に次のようなメッセージを表示します。


    NOTICE: pln0: Old SSA firmware has been detected (Ver:3.11) : 
    Expected (Ver:3.12) - Please upgrade

  12. (省略可能) コントローラのファームウェアをアップグレードする場合は、次の手順に従います。

    1. 適切なファームウェアをダウンロードします。詳細は、ファームウェアパッチ内の README ファイルを参照してください。


      # /usr/sbin/ssaadm download -f path/ssafirmware cN
      

      path は、ファームウェアが格納されているディレクトリのパスです。N は、コントローラ番号です。次に例を示します。


      # /usr/sbin/ssaadm download -f /usr/lib/firmware/ssa/ssafirmware cN
      
    2. SPARCstorage Array にある「SYS OK」ボタンを押してリセットします。

      再起動するまで少々時間がかかります。

    3. 手順 11を使用して、ファームウェアレベルを再度確認します。ファームウェアレベルまたは WWN が依然として不正な場合は、別のコントローラを使用して 手順 12を繰り返してください。

  13. ボリュームマネージャの回復を開始します。

    「SPARCstorage Array トレーの管理」を参照してください。SPARCstorage Array がすべてのノードでオンラインになり、かつそれらのノードからすべてのディスクが見えるようになるまで待ちます。

SPARCstorage Array の WWN を変更するには


注意 - 注意 -

ルートディスクが VxVM によってカプセル化されているか、あるノードの起動ディスクがこの SPARCstorage Array に存在する場合は、この作業は行えません。このような場合には、「メンテナンスシステムを使用して SPARCstorage Array の WWN を変更するには」を行なってください。



注 -

定足数コントローラに障害が発生した場合は、ノードを停止する前に新しい定足数コントローラを選択する必要があります。


次に、SPARCstorage Array の WWN を変更する手順の概略を示します。

次に、SPARCstorage Array の WWN を変更する詳しい手順を示します。

  1. 障害が発生した SPARCstorage Array コントローラが定足数デバイスの場合は、scconf(1M) コマンドを使用して新しい定足数コントローラを選択します。

    詳細は、scconf(1M) のマニュアルページを参照してください。

  2. 修復する SPARCstorage Array に接続されているクラスタノードで、Sun Cluster ソフトウェアを停止し、続いてシステムを停止します。

    scadmin(1M) コマンドを使用し、すべての論理ホストの所有権をクラスタ内のほかのノードに移し、Sun Cluster を停止してください。続いて、halt(1M) コマンドを実行してマシンを停止してください。

    次の例では、phys-hahost2 が修復作業が行われるノードです。


    phys-hahost2# scadmin stopnode
    ...
    phys-hahost2# halt
    
  3. 故障した SPARCstorage Array の WWN を確認します。

    SPARCstorage Array の電源が落ちている場合は、次の方法で WWN を確認してください。

    WWN は、12 桁の 16 進数で構成されています。これらの数字は、デバイスパスコンポーネントの一部として示されます。WWN は、pln@a0 という文字の後に続く最後の 12 桁 (コンマを除く) です。現在の WWN を確認するには、SPARCstorage Array に接続されているクラスタノードで、ls(1) コマンドを実行してください。


    phys-hahost1# ls -l /dev/rdsk/cNt0d0s0
    ...SUNW,pln@a0000000,7412bf ...

    この例では、SPARCstorage Array の WWN は 0000007412bf です。デバイス名の中の変数 N は、故障した SPARCstorage Array のコントローラ番号を示します。文字列「t0d0s0」は、1 つの例です。SPARCstorage Array 上に存在するデバイス名を使用するか、すべてのデバイスを指定するように /dev/rdsk/cN* を使用してください。

    SPARCstorage Array が稼動中の場合は、luxadm(1M) コマンドを使用して WWN を確認できます。

    display オプションを指定して luxadm(1M) を実行し、コントローラを指定すると、SPARCstorage Array の情報がすべて表示されます。luxadm(1M) が示すシリアル番号が WWN です。


    phys-hahost1# /usr/sbin/luxadm display cN
    
  4. コントローラまたは SPARCstorage Array を交換します。

    この手順を行うには、SPARCstorage Array のサービスマニュアル内の操作説明に従ってください。

    SPARCstorage Array が完全には故障していない場合や、コントローラ障害以外のほかの理由で交換する場合は、SPARCstorage Array の各トレーごとに 「SPARCstorage Array トレーの管理」で説明されている手順を実行して、交換の準備を行なってください。

    SPARCstorage Array コントローラが完全に故障した場合は、ボリューム管理ソフトウェアによって交換の用意ができています。

  5. 停止されたノードで OpenBoot PROM モードに入り、「mini-unix」を指定して起動します。

    製品 CD (またはネットワーク上の同等プログラム) を使用して、メンテナンスシステムをシングルユーザーモードに設定し、新しい SPARCstorage Array の WWN を含むデバイス構造のメモリ内バージョンを取得します。

    <#0> ok boot cdrom -s
     
    または
     
     <#0> ok boot netqe1 -s
    

    デバイス情報が永続的に変更されることを避けるために、「mini-unix」を使用してください。

  6. 新しい SPARCstorage Array のコントローラ番号を確認します。

    ls(1) コマンドと新しい SPARCstorage Array の LCD 画面に表示される 4 桁で、コントローラ番号を確認してください。

    次の例では、LCD 画面に表示された 4 桁は 143b です。デバイス名 c*t0d0s0 はコントローラ番号のパターンマッチングを使用していますが、存在が明らかなスライスを指定しています。これは、出力される行の数を減らすためです。

    # ls -l /dev/rdsk/c*t0d0s0 | grep -i 143b
    lrwxrwxrwx   1 root     root          98 Mar 14 13:38
     /dev/rdsk/c3t0d0s0 ->
     ../../devices/iommu@f,e0000000/sbus@f,e0001000/SUNW,soc@3,0/SUNW
     ,pln@a0000000,74143b/ssd@0,0:a,raw

    この例では、/dev/rdsk/c3... に示された 3 が「mini-unix」における新しい SPARCstorage Array のコントローラ番号です。


    注 -

    この LCD 画面内の 16 進数字は、大文字と小文字が混在した例です (文字 ACEF は大文字、文字 bd は小文字)。この例は、grep -i を使用して大文字と小文字の区別を無視しています。


  7. luxadm download コマンドを実行して、WWN を設定します。

    手順 6 で確認したコントローラ番号を使用してください。たとえば、次のコマンドは、WWN を現在の値から 手順 3 で確認した値 0000007412bf に変更します。SPARCstorage Array コントローラは、c3 です。

    phys-hahost2# /usr/sbin/luxadm download -w 0000007412bf c3
    

    注 -

    先頭のゼロは、合計 12 桁にするために WWN の一部として必ず入力する必要があります。



    注意 - 注意 -

    ダウンロード処理は中断しないでください。luxadm(1M) コマンドが終了し、シェルプロンプトが表示されるまで待ってください。


  8. SPARCstorage Array 装置にある「SYS OK」ボタンを押し、リセットします。

    装置が再起動し、Sun Cluster ノードと通信を開始するまで少々時間がかかります。

  9. 「mini-unix」を終了し、通常どおりホストを起動します。

    コンソールにブレークを送信し、マシンを起動してください。

  10. クラスタノードから、SPARCstorage Array のファームウェアレベルを確認します。

    ファームウェアの現行バージョンを確認するには、luxadm(1M) コマンドを使用します。この場合は、luxadm(1M) コマンドに、コントローラ番号 (次の例の N) を指定してください。


    phys-hahost2# /usr/sbin/luxadm display cN
    

    注 -

    システム上に古いファームウェアが検出されると、Solaris システムはコンソールと /var/adm/messages に次のようなメッセージを表示します。


    NOTICE: pln0: Old SSA firmware has been detected (Ver:3.11) : 
    Expected (Ver:3.12) - Please upgrade

  11. (省略可能) コントローラのファームウェアをアップグレードする場合は、次の手順に従います。

    1. 適切なファームウェアをダウンロードします。詳細は、ファームウェアパッチ内の README ファイルを参照してください。


      # /usr/sbin/ssaadm download -f path/ssafirmware cN
      

      pathは、ファームウェアが格納されているディレクトリのパスです。N は、コントローラ番号です。次に例を示します。


      # /usr/sbin/ssaadm download -f /usr/lib/firmware/ssa/ssafirmware cN
      
    2. SPARCstorage Array 装置にある「SYS OK」ボタンを押し、リセットします。

      装置が再起動するまで少々時間がかかります。

    3. ファームウェアレベルを再度確認します (手順 10を参照)。ファームウェアレベルまたは WWN が依然として不正な場合は、別のコントローラを使用して 手順 11を繰り返してください。

  12. ノードを起動します。

    phys-hahost2# scadmin startnode
    
  13. 必要に応じて、論理ホストをデフォルトのマスターにスイッチバックします。

  14. 修復された SPARCstorage Array にボリュームマネージャコンポーネントを復元して、交換を完了します。

    この方法は、「SPARCstorage Array トレーの管理」に示されています。

  15. 必要に応じて、クラスタ内のほかのノードを再起動します。

    交換後 SPARCstorage Array 内のすべてのディスクを認識できないクラスタノードが存在する場合は、必要に応じてそれらを再起動してください。このためには、scadmin stopnode コマンドを使用して Sun Cluster の処理を停止し、その後再起動します。再起動後、必要に応じて論理ホストをそれらのデフォルトマスターにスイッチバックしてください。詳細は、scadmin(1M) マニュアルページを参照してください。