Sun Cluster Geographic Edition Hitachi TrueCopy 向けデータ複製ガイド

第 3 章 Hitachi TrueCopy データ複製を使用するサービスの移行

この章では、保守管理を行う場合やクラスタ障害が発生した場合のサービスの移行について説明します。この章の内容は次のとおりです。

Hitachi TrueCopy データ複製を使用するシステムでのクラスタ障害の検出

この節では、主クラスタまたは二次クラスタで障害が検出される際に発生する内部プロセスについて説明します。

主クラスタの障害の検出

ある保護グループの主クラスタに障害が発生すると、パートナーシップの二次クラスタがその障害を検出します。障害が発生するクラスタは複数のパートナーシップのメンバーである可能性があるため、このような障害の検出も複数発生する可能性があります。

主クラスタに障害が発生すると、次のアクションが発生します。障害中、該当する保護グループは Unknown 状態になります。

二次クラスタの障害の検出

ある保護グループの二次クラスタに障害が発生すると、同じパートナーシップのクラスタがその障害を検出します。障害が発生したクラスタは複数のパートナーシップのメンバーである可能性があるため、このような障害の検出も複数発生する可能性があります。

障害の検出中、次のアクションが発生します。

Hitachi TrueCopy データ複製を使用するサービスをスイッチオーバーで移行する

パートナークラスタにサービスを順番に移行する場合は、Hitachi TrueCopy 保護グループのスイッチオーバーを実行します。スイッチオーバーは次の手順で行われます。

スイッチオーバーの前に発生する検証

geopg switchover コマンドを使用してスイッチオーバーを開始すると、データ複製サブシステムが両方のクラスタでいくつかの検証を実行します。スイッチオーバーが実行されるのは、両方のクラスタで検証手順が成功した場合だけです。

まず、複製サブシステムは、Hitachi TrueCopy デバイスグループの全体的なデバイスグループ状態が有効であるかどうか検査します。 次に、複製サブシステムは、ターゲットの主クラスタ cluster-newyork のローカルのデバイスグループ状態が 23、33、43、または 53 であることを検査します。ローカルのデバイスグループの状態は、pairvolchk -g device-group-name -ss コマンドで返されます。これらの値は、PVOL_PAIR 状態または SVOL_PAIR 状態に対応します。次の表に、新しい主クラスタ cluster-newyork で実行される Hitachi TrueCopy コマンドを示します。

表 3–1 新しい主クラスタでの Hitachi TrueCopy スイッチオーバー検証

全体的なデバイスグループ状態 

ローカルクラスタでの有効なデバイスグループ状態 

cluster-newyork で実行される Hitachi TrueCopy スイッチオーバーコマンド

SMPL 

なし 

なし 

通常の主クラスタ 

23、43 

Hitachi TrueCopy デバイスグループはすでに PVOL_PAIR 状態であるため、コマンドは実行されません。

通常の二次クラスタ 

33、53 

horctakeover -g dg [-t]

Hitachi TrueCopy デバイスグループの fence_levelasync のときは、-t オプションを指定します。この値は、保護グループの Timeout プロパティーの 80% として計算されます。たとえば、保護グループの Timeout が 200 秒である場合、このコマンドで -t オプションを使用したときの値は 200 秒の 80%、つまり、160 秒になります。

テイクオーバー主クラスタ 

なし 

なし 

テイクオーバー二次クラスタ 

なし 

なし 

複製から見たスイッチオーバーの結果

スイッチオーバーが正常に完了したあと、データ複製レベルで、主ボリュームと二次ボリュームの役割が切り替わっています。スイッチオーバー前の PVOL_PAIR ボリュームは SVOL_PAIR ボリュームになります。スイッチオーバー前の SVOL_PAIR ボリュームは PVOL_PAIR ボリュームになります。データ複製は、新しい PVOL_PAIR ボリュームから 新しい SVOL_PAIR ボリュームに継続されます。

スイッチオーバー操作の一部として、新しい主クラスタでアプリケーションがオンラインになることができるかどうかにかかわらず、保護グループの Local-role プロパティーも切り替わります。保護グループの Local roleSecondary であったクラスタでは、保護グループの Local-role プロパティーが Primary になります。保護グループの Local-rolePrimary であったクラスタでは、保護グループの Local-role プロパティーが Secondary になります。

ProcedureHitachi TrueCopy 保護グループを主クラスタから二次クラスタにスイッチオーバーする方法

始める前に

スイッチオーバーを正常に完了するためには、主クラスタと二次クラスタ間のデータ複製が有効状態で、かつ、これら 2 つのクラスタ上のデータボリュームが同期していなければなりません。

主クラスタから二次クラスタへ保護グループのスイッチオーバーを行うには、次の条件が満たされている必要があります。


注意 – 注意 –

Cluster_dgs プロパティーを構成してある場合、この プロパティーに指定されているデバイスグループに書き込むことができるのは保護グループに属するアプリケーションだけです。


  1. クラスタノードの 1 つにログインします。

    この手順を行うには、Geo Management RBAC 権利プロファイルがユーザーに割り当てられている必要があります。RBAC の詳細は、『Sun Cluster Geographic Edition のシステム管理』「Sun Cluster Geographic Edition ソフトウェアと RBAC」を参照してください。

  2. スイッチオーバーを開始します。

    スイッチオーバーでは、保護グループに属するアプリケーションリソースグループの停止と起動が行われます。


    # geopg switchover [-f] -m newprimarycluster protectiongroupname
    
    -f

    ユーザーに確認することなく、強制的にコマンドを実行します

    -m newprimarycluster

    保護グループの新しい主クラスタにするクラスタの名前を指定します

    protectiongroupname

    保護グループの名前を指定します


例 3–1 主クラスタから二次クラスタへの強制的なスイッチオーバー

この例では、二次クラスタへのスイッチオーバーを実行します。


# geopg switchover -f -m cluster-newyork tcpg

Hitachi TrueCopy データ複製を使用するシステムでのテイクオーバーの強制実行

主ボリュームと二次ボリュームのデータが完全に整合しているかどうかにかかわらず二次クラスタ上でアプリケーションをオンラインにする必要がある場合は、テイクオーバーを実行します。ここでは、保護グループが起動しているものと仮定します。

テイクオーバーは次の手順で行われます。

テイクオーバーの前後で考えられる主クラスタと二次クラスタの条件についての詳細は、『Sun Cluster Geographic Edition のシステム管理』の付録 C「テイクオーバー後の状態」を参照してください。

これ以降の節では、二次クラスタによるテイクオーバーを強制実行するときに行う必要がある手順について説明します。

テイクオーバーの前に発生する検証

geopg takeover コマンドを使用してテイクオーバーを開始すると、両方のクラスタに対してデータ複製サブシステムがいくつかの検証を実行します。これらの手順は、元の主クラスタでは、その主クラスタに到達できる場合だけに行われます。元の主クラスタでの検証が失敗する場合でも、テイクオーバーは実行されます。

まず、複製サブシステムは、Hitachi TrueCopy デバイスグループの全体的なデバイスグループ状態が有効であるかどうか検査します。 続いて、複製サブシステムは、ターゲットの主クラスタ cluster-newyork のローカルのデバイスグループ状態が 32 または 52 でないことを検査します。これらの値は SVOL_COPY 状態に対応しています (この状態では horctakeover コマンドは失敗する)。次の表に、テイクオーバーに使用する Hitachi TrueCopy コマンドを示します。

表 3–2 新しい主クラスタでの Hitachi TrueCopy テイクオーバー検証

全体的なデバイスグループ状態 

有効なローカルのデバイスグループ状態 

cluster-newyork で実行される Hitachi TrueCopy テイクオーバーコマンド

SMPL 

すべて 

コマンドは実行されません。 

通常の主クラスタ 

すべて 

コマンドは実行されません。 

通常の二次クラスタ 

32 および 52 を除く、すべての通常の二次クラスタの状態 

通常の二次クラスタの状態のリストについては、表 2–1表 2–2を参照してください。

horctakeover -S -g dg [-t]

Hitachi TrueCopy デバイスグループの fence_levelasync のときは、-t オプションを指定します。この値は、保護グループの Timeout プロパティーの 80% として計算されます。たとえば、保護グループの Timeout が 200 秒である場合、このコマンドで -t オプションを使用したときの値は 200 秒の 80%、つまり、160 秒になります。

テイクオーバー主クラスタ 

すべて 

コマンドは実行されません。 

テイクオーバー二次クラスタ 

すべて 

pairsplit -R-g dg pairsplit -S-g dg

複製の観点からのテイクオーバーの結果

複製の観点から見れば、テイクオーバーが成功したあと、テイクオーバー操作の一部として、新しい主クラスタでアプリケーションがオンラインになることができるかどうかにかかわらず、保護グループの Local-role プロパティーは新しい役割を反映するように変更されます。保護グループの Local roleSecondary であった cluster-newyork では、保護グループの Local-role プロパティーが Primary になります。保護グループの Local-rolePrimary であった cluster-paris では、次のことが発生する可能性があります。

テイクオーバーが成功した場合、アプリケーションはオンラインになります。別の geopg start コマンドを実行する必要はありません


注意 – 注意 –

テイクオーバーが成功したあと、新しい主クラスタ cluster-newyork と以前の主クラスタ cluster-paris の間でのデータ複製が停止されます。geopg start コマンドを実行する場合、-n オプションを使用して、複製が再開されないようにする必要があります。


ProcedureHitachi TrueCopy サービスを二次クラスタにより即座に強制テイクオーバーする方法

始める前に

二次クラスタに主クラスタの処理を引き受けさせるためには、次の条件が満たされている必要があります。

  1. 二次クラスタ内のノードの 1 つにログインします。

    この手順を行うには、Geo Management RBAC 権利プロファイルがユーザーに割り当てられている必要があります。RBAC の詳細は、『Sun Cluster Geographic Edition のシステム管理』「Sun Cluster Geographic Edition ソフトウェアと RBAC」を参照してください。

  2. テイクオーバーを開始します。


    # geopg takeover [-f] protectiongroupname
    
    -f

    ユーザーに確認することなく、強制的にコマンドを実行します

    protectiongroupname

    保護グループの名前を指定します


例 3–2 二次クラスタによる強制テイクオーバー

この例では、二次クラスタ cluster-newyork によって、tcpg を強制的にテイクオーバーします。

phys-newyork-1 は二次クラスタの第 1 ノードです。どのノードが phys-newyork-1 かを確認するには、『Sun Cluster Geographic Edition のシステム管理』「Sun Cluster Geographic Edition クラスタ構成の例」を参照してください。


phys-newyork-1# geopg takeover -f tcpg

次の手順

テイクオーバー後の主クラスタと二次クラスタの状態についての詳細は、『Sun Cluster Geographic Edition のシステム管理』の付録 C「テイクオーバー後の状態」を参照してください。

Hitachi TrueCopy 複製を使用するシステムでのクラスタへのサービスの回復

テイクオーバーが正常に完了すると、二次クラスタ (cluster-newyork) が保護グループの主クラスタになり、この二次クラスタ上でサービスがオンラインになります。元の主クラスタ (cluster-paris) が回復したところで、フェイルバックと呼ばれる処理を行なって元の主クラスタ上でふたたびサービスをオンラインにすることができます。

Sun Cluster Geographic Edition ソフトウェアでは、次の 2 種類のフェイルバックがサポートされています。

元の主クラスタがふたたび起動されたあとでも、新しい主クラスタ (cluster-newyork) を主クラスタとし、元の主クラスタ (cluster-paris) を二次クラスタとして使い続ける場合は、スイッチオーバーやテイクオーバーを実行することなく、保護グループ構成を再同期させ、再検証します。

Procedure保護グループ構成を再同期および再検証する方法

次の手順に従って、元の主クラスタ (cluster-paris) 上のデータを現在の主クラスタ (cluster-newyork) 上のデータと再同期させて、再検証します。

始める前に

保護グループ構成を再同期させて再構成する前に、cluster-newyork 上でテイクオーバーが行われている場合を例とします。現在のクラスタの役割は次のとおりです。

  1. 元の主クラスタ cluster-paris を現在の主クラスタ cluster-newyork と再同期させます。

    この操作により、cluster-paris の独自の構成は削除され、cluster-newyork の構成がローカルに複製されます。パートナーシップ構成と保護グループ構成の両方を再同期させます。

    1. cluster-paris で、パートナーシップを再同期させます。


      # geops update partnershipname
      
      partnershipname

      パートナーシップの名前を指定します


      注 –

      複数の保護グループを再同期させている場合でも、この手順の実行が必要なのは 1 回だけです。


      パートナーシップの同期についての詳細は、『Sun Cluster Geographic Edition のシステム管理』「パートナーシップの再同期」を参照してください。

    2. cluster-paris で、各保護グループを再同期させます。

      cluster-newyork 上の保護グループの役割は primary であるため、この手順により cluster-paris 上の保護グループの役割は secondary になります。


      # geopg update protectiongroupname
      
      protectiongroupname

      保護グループの名前を指定します

      保護グループの同期についての詳細は、「Hitachi TrueCopy 保護グループの再同期」を参照してください。

  2. cluster-paris 上で、個々の保護グループのクラスタ構成を検証します。


    # geopg validate protectiongroupname 
    
    protectiongroupname

    単一の保護グループを識別する一意の名前を指定します

    詳細は、「Hitachi TrueCopy 保護グループを検証する方法」を参照してください。

  3. cluster-paris で、各保護グループを有効にします。

    cluster-paris の保護グループの役割は secondary であるため、geopg start コマンドは cluster-paris でアプリケーションを再起動しません。


    # geopg start -e local protectiongroupname
    
    -e local

    コマンドの範囲を指定します。

    範囲を local と指定すると、ローカルクラスタだけがコマンドの対象となります。

    protectiongroupname

    保護グループの名前を指定します。


    注意 – 注意 –

    データを現在の主クラスタ (cluster-newyork) から現在の二次クラスタ (cluster-paris) に同期させる必要があるため、-n オプションは使用しないでください。


    保護グループの役割は secondary であるため、データの同期化は現在の主クラスタである cluster-newyork から二次クラスタ cluster-paris へと行われます。

    geopg start コマンドの詳細は、「Hitachi TrueCopy 保護グループを有効にする方法」を参照してください。

  4. データが完全に同期したことを確認します。

    cluster-newyork 上の保護グループ上の状態は、 OKにします。


    phys-newyork-1# geoadm status

    出力の保護グループセクションを参照してください。

    cluster-newyork の Hitachi TrueCopy デバイスグループの状態が PVOL_PAIR であり、cluster-paris の Hitachi TrueCopy デバイスグループの状態が SVOL_PAIR であるとき、保護グループのローカル状態は OK です。

ProcedureHitachi TrueCopy 複製を使用するシステムでフェイルバックスイッチオーバーを実行する方法

この手順は、元の主クラスタ cluster-paris のデータが現在の主クラスタ cluster-newyork のデータと再同期されたあとで、アプリケーションを元の主クラスタで再起動するときに使用します。


注 –

フェイルバック手順は、パートナーシップの関係にあるクラスタにだけ適用されます。次の手順をパートナーシップごとに 1 回だけ実行する必要があります。


始める前に

フェイルバックスイッチオーバーを実行する前に、cluster-newyork ではテイクオーバーが発生した場合を例にします。クラスタの役割は次のとおりです。

  1. 元の主クラスタ cluster-paris を現在の主クラスタ cluster-newyork と再同期させます。

    この操作により、cluster-paris の独自の構成は削除され、cluster-newyork の構成がローカルに複製されます。パートナーシップ構成と保護グループ構成の両方を再同期させます。

    1. cluster-paris で、パートナーシップを再同期させます。


      phys-paris-1# geops update partnershipname
      
      partnershipname

      パートナーシップの名前を指定します


      注 –

      パートナーシップ内の複数の保護グループにフェイルバックスイッチオーバーを実行している場合でも、この手順を実行する必要があるのはパートナーシップごとに 1 回だけです。


      パートナーシップの同期についての詳細は、『Sun Cluster Geographic Edition のシステム管理』「パートナーシップの再同期」を参照してください。

    2. cluster-paris で、各保護グループを再同期させます。

      cluster-newyork の保護グループのローカルな役割は現在 primary であるため、この手順によって cluster-paris の保護グループの役割が確実に secondary になります。


      phys-paris-1# geopg update protectiongroupname
      
      protectiongroupname

      保護グループの名前を指定します

      保護グループの同期についての詳細は、「Hitachi TrueCopy 保護グループの再同期」を参照してください。

  2. cluster-paris 上で、個々の保護グループのクラスタ構成を検証します。

    保護グループがエラー状態でないことを確認します。エラー状態の場合、保護グループを起動できません。


    phys-paris-1# geopg validate protectiongroupname 
    
    protectiongroupname

    単一の保護グループを識別する一意の名前を指定します

    詳細は、「Hitachi TrueCopy 保護グループを検証する方法」を参照してください。

  3. cluster-paris で、各保護グループを有効にします。

    cluster-paris の保護グループの役割は secondary であるため、geopg start コマンドは cluster-paris でアプリケーションを再起動しません。


    phys-paris-1# geopg start -e local protectiongroupname
    
    -e local

    コマンドの範囲を指定します。

    範囲を local と指定すると、ローカルクラスタだけがコマンドの対象となります。

    protectiongroupname

    保護グループの名前を指定します。


    注意 – 注意 –

    データを現在の主クラスタ (cluster-newyork) から現在の二次クラスタ (cluster-paris) に同期させる必要があるため、-n オプションは使用しないでください。


    保護グループの役割は secondary であるため、データの同期化は現在の主クラスタである cluster-newyork から二次クラスタ cluster-paris へと行われます。

    geopg start コマンドの詳細は、「Hitachi TrueCopy 保護グループを有効にする方法」を参照してください。

  4. データが完全に同期したことを確認します。

    cluster-newyork 上の保護グループ上の状態は、 OKにします。


    phys-newyork-1# geoadm status

    出力の保護グループセクションを参照してください。

    cluster-newyork の Hitachi TrueCopy デバイスグループの状態が PVOL_PAIR であり、cluster-paris の Hitachi TrueCopy デバイスグループの状態が SVOL_PAIR であるとき、保護グループのローカル状態は OK です。

  5. どちらか一方のクラスタで、各保護グループについて cluster-newyork から cluster-paris へのスイッチオーバーを実行します。


    # geopg switchover [-f] -m clusterparis protectiongroupname
    

    詳細は、「Hitachi TrueCopy 保護グループを主クラスタから二次クラスタにスイッチオーバーする方法」を参照してください。

    cluster-paris は、元の役割である、保護グループの主クラスタに戻ります。

  6. スイッチオーバーが正しく実行されたことを確認します。

    保護グループが現在 cluster-paris で primary、cluster-newyork で secondary になっており、データ複製およびリソースグループが両方のクラスタで OK になっていることを確認します。


    # geoadm status

    各 Hitachi TrueCopy 保護グループのアプリケーションリソースグループとデータ複製の実行時ステータスを確認します。


    # scstat -g

    検査するデータ複製デバイスグループの Status フィールドと Status Message フィールドを参照してください。これらのフィールドについては、表 2–1 を参照してください。

    データ複製の実行時ステータスについての詳細は、「Hitachi TrueCopy データ複製の実行時状態の検査」を参照してください。

ProcedureHitachi TrueCopy 複製を使用するシステムでフェイルバックテイクオーバーを実行する方法

元の主クラスタ cluster-paris 上でアプリケーションを再起動し、元の主クラスタ上の現在のデータを使用するには、次の手順を実行します。この場合、現在主クラスタとして機能している二次クラスタ cluster-newyork の更新データはすべて破棄されます。

フェイルバック手順は、パートナーシップの関係にあるクラスタにだけ適用されます。次の手順をパートナーシップごとに 1 回だけ実行する必要があります。


注 –

条件付きですが、元の主クラスタ cluster-paris のデータは引き続き使用できます。cluster-newyork でのテイクオーバー操作のあとは、どのような時点でも、新しい主クラスタ cluster-newyork から元の主クラスタ cluster-paris にデータを複製していてはいけません。新しい主クラスタと元の主クラスタの間でデータの複製を行わないようにするために、geopg start コマンドを実行するときには常に、-n オプションを使用してください。


始める前に

クラスタが次の役割を持つことを確認します。

  1. 元の主クラスタ cluster-paris を元の二次クラスタ cluster-newyork と再同期させます。

    この操作により、cluster-paris の独自の構成は削除され、cluster-newyork の構成がローカルに複製されます。

    1. cluster-paris で、パートナーシップを再同期させます。


      phys-paris-1# geops update partnershipname
      
      partnershipname

      パートナーシップの名前を指定します


      注 –

      パートナーシップ内の複数の保護グループにフェイルバックテイクオーバーを実行している場合でも、この手順を実行する必要があるのはパートナーシップごとに 1 回だけです。


      パートナーシップの同期についての詳細は、『Sun Cluster Geographic Edition のシステム管理』「パートナーシップの再同期」を参照してください。

    2. Hitachi TrueCopy デバイスグループ devgroup1 を SMPL 状態にします。

      pairsplit コマンドを使用して、cluster-pariscluster-newyork の両方のクラスタの保護グループにある Hitachi TrueCopy デバイスグループを SMPL 状態にします。使用する pairsplit コマンドは、Hitachi TrueCopy デバイスグループのペアの状態によって変わります。次の表に、いくつかの典型的なペアの状態ごとに、cluster-paris で使用する必要があるコマンドの例を示します。

      cluster-paris でのペアの状態

      cluster-newyork でのペアの状態

      cluster-paris で使用される pairsplit コマンド

      PSUS または PSUE

      SSWS

      pairsplit -R -g dgname

      pairsplit -S -g dgname

      SSUS

      PSUS

      pairsplit -S -g dgname

      pairsplit コマンドについての詳細は、『Sun StorEdge SE 9900 V Series Command and Control Interface User and Reference Guide』を参照してください。

      このコマンドが成功した場合、pairdisplay コマンドの出力に devgroup1 の状態が次のように表示されます。


      phys-paris-1# pairdisplay -g devgroup1
      Group PairVol(L/R) (Port#,TID,LU),Seq#,LDEV#,P/S,Status,Fence,Seq#,P-LDEV# M 
      devgroup1 pair1(L) (CL1-A , 0, 1) 12345   1..SMPL ----  ----,-----  ----   - 
      devgroup1 pair1(R) (CL1-C , 0, 20)54321 609..SMPL ----  ----,-----  ----   - 
      devgroup1 pair2(L) (CL1-A , 0, 2) 12345   2..SMPL ----  ----,-----  ----   - 
      devgroup1 pair2(R) (CL1-C , 0,21) 54321 610..SMPL ----  ----,-----  ----   -
    3. cluster-paris で、各保護グループを再同期させます。


      phys-paris-1# geopg update protectiongroupname
      
      protectiongroupname

      保護グループの名前を指定します

      保護グループの再同期についての詳細は、「保護グループを再同期させる方法」を参照してください。

  2. cluster-paris 上で、個々の保護グループの構成を検証します。

    保護グループがエラー状態でないことを確認します。エラー状態の場合、保護グループを起動できません。


    phys-paris-1# geopg validate protectiongroupname 
    
    protectiongroupname

    単一の保護グループを識別する一意の名前を指定します

    詳細は、「Hitachi TrueCopy 保護グループを検証する方法」を参照してください。

  3. cluster-paris 上で、データ複製を行わずに、二次クラスタの役割が割り当てられている各保護グループを有効にします。

    cluster-paris の保護グループの役割は secondary であるため、geopg start コマンドは cluster-paris でアプリケーションを再起動しません。


    phys-paris-1# geopg start -e local -n protectiongroupname
    
    -e local

    コマンドの範囲を指定します

    範囲を local と指定すると、ローカルクラスタだけがコマンドの対象となります。

    -n

    保護グループを有効にしたときにデータ複製を開始しないようにします。


    注 –

    -n オプションを指定する必要があります。


    protectiongroupname

    保護グループの名前を指定します。

    詳細は、「Hitachi TrueCopy 保護グループを有効にする方法」を参照してください。

    -n オプションが cluster-paris で使用されているため、cluster-newyork から cluster-paris への複製は開始されません。

  4. cluster-paris 上で、各保護グループのテイクオーバーを開始します。


    phys-paris-1# geopg takeover [-f] protectiongroupname
    
    -f

    ユーザーに確認することなく、強制的にコマンドを実行します

    protectiongroupname

    保護グループの名前を指定します

    geopg takeover コマンドの詳細は、「Hitachi TrueCopy サービスを二次クラスタにより即座に強制テイクオーバーする方法」を参照してください。

    この時点で、cluster-paris の保護グループの役割は primary であり、cluster-newyork の保護グループの役割は secondary です。アプリケーションサービスは現在、cluster-paris でオンラインです。

  5. cluster-newyork で、各保護グループを有効にします。

    手順 4 の終わりで、cluster-newyork の保護グループのローカル状態は Offline です。保護グループのローカル状態の監視を開始するには、cluster-newyork の保護グループを有効にする必要があります。

    cluster-newyork 上の保護グループには secondary の役割が割り当てられているので、geopg start コマンドを実行しても、アプリケーションは cluster-newyork 上では再起動しません。


    phys-newyork-1# geopg start -e local [-n] protectiongroupname
    
    -e local

    コマンドの範囲を指定します。

    範囲を local と指定すると、ローカルクラスタだけがコマンドの対象となります。

    -n

    保護グループを有効にしたときにデータ複製を開始しないようにします。

    このオプションを省略した場合、データ複製サブシステムは保護グループと同時に起動されます。

    protectiongroupname

    保護グループの名前を指定します。

    geopg start コマンドの詳細は、「Hitachi TrueCopy 保護グループを有効にする方法」を参照してください。

  6. テイクオーバーが正しく実行されたことを確認します。

    保護グループが現在 cluster-paris で primary、cluster-newyork で secondary になっており、「データ複製」および「リソースグループ」が両方のクラスタで OK になっていることを確認します。


    # geoadm status

    各 Hitachi TrueCopy 保護グループのアプリケーションリソースグループとデータ複製の実行時ステータスを確認します。


    # scstat -g

    検査するデータ複製デバイスグループの Status フィールドと Status Message フィールドを参照してください。これらのフィールドの詳細は、表 2–1 を参照してください。

    データ複製の実行時ステータスについての詳細は、「Hitachi TrueCopy データ複製の実行時状態の検査」を参照してください。

Hitachi TrueCopy 複製を使用するシステムでのスイッチオーバー障害からの回復

geopg switchover コマンドを実行すると、 horctakeover コマンドが Hitachi TrueCopy データ複製レベルで実行されます。horctakeover コマンドが値 1 を返した場合、スイッチオーバーは成功です。

Hitachi TrueCopy の用語では、スイッチオーバーのことを「スワップテイクオーバー」と呼びます。horctakeover コマンドは、スワップテイクオーバーを実行できない場合があります。このような場合は、1 以外の値が返されます (スイッチオーバー障害を示す)。


注 –

障害が発生した場合、通常、horctakeover コマンドは値 5 を返します (SVOL-SSUS-takeover を示す)。


horctakeover コマンドがスワップテイクオーバーの実行に失敗する理由の 1 つに、データ複製リンク ESCON/FC が停止していることがあります。

スワップテイクオーバー以外の結果は、二次ボリュームが主ボリュームと完全には同期していない可能性があることを示します。スイッチオーバー障害のケースの場合、Sun Cluster Geographic Edition ソフトウェアは新しい主クラスタになる予定のクラスタではアプリケーションを起動しません。

この節の残りの部分では、スイッチオーバー障害につながる初期条件を示して、スイッチオーバー障害から回復する方法について説明します。

スイッチオーバー障害が起こる条件

この節では、スイッチオーバー障害が発生するケースを示します。このケースでは、cluster-paris が元の主クラスタであり、cluster-newyork が元の二次クラスタです。

次のようにスイッチオーバーを実行すると、cluster-paris から cluster-newyork にサービスが切り替わります。


phys-newyork-1# geopg switchover -f -m cluster-newyork tcpg

geopg switchover コマンドの処理中、horctakeover コマンドは SVOL-SSUS-takeover を実行して、Hitachi TrueCopy デバイスグループ devgroup1 に対して 値 5 を返します。結果として、geopg switchover コマンドは次のような障害メッセージを返します。


Processing operation.... this may take a while ....
"Switchover" failed for the following reason:
			Switchover failed for Truecopy DG devgroup1

この障害メッセージが発行されたあと、2 つのクラスタは次のような状態になります。


cluster-paris:
		tcpg role: Secondary
cluster-newyork:
		tcpg role: Secondary

phys-newyork-1# pairdisplay -g devgroup1 -fc 
Group  PairVol(L/R) (Port#,TID,LU),Seq#,LDEV#.P/S, Status,Fence,%, P-LDEV# M 
devgroup1 pair1(L) (CL1-C , 0, 20)12345 609..S-VOL SSWS  ASYNC,100   1    -
devgroup1 pair1(R) (CL1-A , 0, 1) 54321   1..P-VOL PSUS  ASYNC,100  609   -

スイッチオーバー障害からの回復

この節では、前の節で説明した障害シナリオから回復するための手順について説明します。これらの手順は、該当するクラスタでアプリケーションをオンラインにします。

  1. Hitachi TrueCopy デバイスグループ devgroup1 を SMPL 状態にします。

    pairsplit コマンドを使用して、cluster-paris cluster-newyork の両方のクラスタの保護グループにあるデバイスグループを SMPL 状態にします。前節で示したペア状態の場合、次の pairsplit コマンドを実行します。


    phys-newyork-1# pairsplit -R -g devgroup1
    phys-newyork-1# pairsplit -S -g devgroup1
  2. 保護グループのクラスタの 1 つを Primary に指定します。

    元の主クラスタでアプリケーションを起動する予定がある場合は、保護グループの元の主クラスタ cluster-parisPrimary に指定します。アプリケーションは、元の主クラスタで現在のデータを使用します。

    元の二次クラスタでアプリケーションを起動する予定がある場合は、保護グループの元の二次クラスタ cluster-newyorkPrimary に指定します。アプリケーションは、元の二次クラスタで現在のデータを使用します。


    注意 – 注意 –

    horctakeover コマンドはスワップテイクオーバーを実行していないため、cluster-newyork のデータボリュームは cluster-paris のデータボリュームと同期していない可能性があります。元の主クラスタにあるのと同じデータを使用してアプリケーションを起動する予定の場合は、元の二次クラスタを Primary にしないでください。


ProcedureHitachi TrueCopy 保護グループの元の主クラスタを Primary にする方法

  1. 元の主クラスタで保護グループを無効にします。


    phys-paris-1# geopg stop -e Local tcpg
  2. 保護グループの構成を再同期させます。

    このコマンドは、cluster-paris の保護グループ構成を、cluster-newyork の保護グループ構成情報と一致するように更新します。


    phys-paris-1# geopg update tcpg

    geopg update コマンドが正常に完了したあと、各クラスタで保護グループ tcpg の役割は次のようになります。


    cluster-paris:
    		tcpg role: Primary
    cluster-newyork:
    		tcpg role: secondary
  3. パートナーシップの両方のクラスタで保護グループを有効にします。


    phys-paris-1# geopg start -e Global tcpg

    このコマンドは、cluster-paris でアプリケーションを起動します。cluster-paris から cluster-newyork へのデータ複製が開始されます。

ProcedureHitachi TrueCopy 保護グループの元の二次クラスタを Primary にする方法

  1. 保護グループの構成を再同期させます。

    このコマンドは、cluster-newyork の保護グループ構成を、cluster-paris の保護グループ構成情報と一致するように更新します。


    phys-newyork-1# geopg update tcpg

    geopg update コマンドが正常に完了したあと、各クラスタで保護グループ tcpg の役割は次のようになります。


    cluster-paris:
    		tcpg role: Secondary
    cluster-newyork:
    		tcpg role: Primary
  2. パートナーシップの両方のクラスタで保護グループを有効にします。


    phys-newyork-1# geopg start -e Global tcpg

    このコマンドは、cluster-newyork でアプリケーションを起動します。cluster-newyork から cluster-paris へのデータ複製が開始されます。


    注意 – 注意 –

    このコマンドは、cluster-paris 上のデータを上書きします。


Hitachi TrueCopy データ複製エラーからの回復

データ複製レベルでエラーが発生した場合、関連するデバイスグループの複製リソースグループ内のリソースの状態に、そのエラーが反映されます。

データ複製エラーを検出する方法

Resource status のさまざまな値を実際の複製ペアの状態に対応付ける方法については、表 2–6 を参照してください。

複製リソースの状態は、scstat -g コマンドを次のように使用すると検査できます。


phys-paris-1# scstat -g

scstat -g コマンドを実行すると、次のようなメッセージが返ることがあります。


...

--Resources --
            Resource Name       Node Name           State         Status Message
            -------------       ---------           -----         --------------
Resource: r-tc-tcpg1-devgroup1  phys-paris-2        Offline       Offline
Resource: r-tc-tcpg1-devgroup1  phys-paris-1        Online        Faulted - P-VOL:PSUE

Resource: hasp4nfs              phys-paris-1        Offline       Offline
Resource: hasp4nfs              phys-paris-2        Offline       Offline

...

保護グループに含まれるすべてのデバイスグループの全体的なリソース状態を表示するには、geoadm status コマンドを使用します。たとえば、先の例における scstat -g コマンドの出力は、Hitachi TrueCopy デバイスグループ devgroup1cluster-parisPSUE 状態であることを示しています。表 2–6は、 PSUE 状態がリソース状態 FAULTED に対応することを示しています。したがって、保護グループのデータ複製状態も FAULTED です。この状態は、geoadm status コマンドの出力に反映され、保護グループの状態が Error として表示されます。


phys-paris-1# geoadm status
Cluster: cluster-paris

Partnership "paris-newyork-ps"  : OK
   Partner clusters             : cluster-newyork
   Synchronization              : OK      
   ICRM Connection              : OK

   Heartbeat "paris-to-newyork" monitoring "cluster-newyork": OK 
      Heartbeat plug-in "ping_plugin"             : Inactive
      Heartbeat plug-in "tcp_udp_plugin"          : OK

Protection group "tcpg"   : Error
      Partnership         : paris-newyork-ps
      Synchronization     : OK

      Cluster cluster-paris    : Error
         Role                  : Primary
         PG activation state   : Activated
         Configuration         : OK
         Data replication      : Error
         Resource groups       : OK 
   
      Cluster cluster-newyork  : Error
         Role                  : Secondary
         PG activation state   : Activated
         Configuration         : OK
         Data replication      : Error
         Resource groups       : OK

Pending Operations
      Protection Group         : "tcpg"
      Operations               : start        

ProcedureHitachi TrueCopy データ複製エラーから回復する方法

エラー状態から回復するには、次の手順の一部または全部を実行することをお勧めします。

  1. Hitachi TrueCopy のマニュアルに記載されている手順に従って、FAULTED 状態になった原因を調べます。この状態は PSUE として示されます。

  2. Hitachi TrueCopy の所定の手順に従って、障害状態から回復します。

    回復手順によってデバイスグループの状態が変化した場合、この状態は自動的にリソースによって検出され、新しい保護グループの状態として報告されます。

  3. 保護グループ構成を検証し直します。


    phys-paris-1# geopg validate protectiongroupname 
    
    protectiongroupname

    Hitachi TrueCopy 保護グループの名前を指定します

  4. 保護グループ構成の状態を確認します。


    phys-paris-1# geopg list protectiongroupname 
    
    protectiongroupname

    Hitachi TrueCopy 保護グループの名前を指定します

  5. 保護グループの実行時状態を確認します。


    phys-paris-1# geoadm status