Sun Cluster Geographic Edition EMC Symmetrix Remote Data Facility 向けデータ複製ガイド

第 3 章 EMC Symmetrix Remote Data Facility データ複製を使用するサービスの移行

この章では、保守管理を行う場合やクラスタ障害が発生した場合のサービスの移行について説明します。この章の内容は次のとおりです。

EMC Symmetrix Remote Data Facility データ複製を使用するシステム上でのクラスタの障害の検出

この節では、主クラスタまたは二次クラスタで障害が検出される際に発生する内部プロセスについて説明します。

主クラスタの障害の検出

ある保護グループの主クラスタに障害が発生すると、パートナーシップの二次クラスタがその障害を検出します。障害が発生するクラスタは複数のパートナーシップのメンバーである可能性があるため、このような障害の検出も複数発生する可能性があります。

主クラスタに障害が発生すると、次のアクションが発生します。障害中、障害が発生したクラスタ上で該当する保護グループが Unknown 状態になります。

二次クラスタの障害の検出

ある保護グループの二次クラスタに障害が発生すると、同じパートナーシップのクラスタがその障害を検出します。障害が発生したクラスタは複数のパートナーシップのメンバーである可能性があるため、このような障害の検出も複数発生する可能性があります。

障害の検出中、次のアクションが発生します。

EMC Symmetrix Remote Data Facility データ複製を使用するサービスをスイッチオーバーで移行する

パートナークラスタにサービスを順番に移行する場合は、EMC Symmetrix Remote Data Facility 保護グループのスイッチオーバーを実行します。geopg switchover などの Sun Cluster Geographic Edition の基本操作により、symrdf swap 操作が実行されます。symrdf swap 操作は、動的 RDF よりも静的 RDF に長時間が必要です。このため、静的 RDF を使用するときは、保護グループのタイムアウトプロパティーの値を増やしてください。

スイッチオーバーは次の手順で行われます。


注 –

EMC Symmetrix Remote Data Facility/Asynchronous データ複製を実行している場合、パーソナリティーの交換を実行できません。


スイッチオーバーの前に発生する検証

geopg switchover コマンドを使用してスイッチオーバーを開始すると、データ複製サブシステムが両方のクラスタでいくつかの検証を実行します。スイッチオーバーが実行されるのは、両方のクラスタで検証手順が成功した場合だけです。

まず、複製サブシステムは、EMC Symmetrix Remote Data Facility デバイスグループの全体的な RDF ペア状態が有効であるかどうか検査します。 次に、ターゲットの主クラスタ cluster-newyork のローカルデバイスグループタイプが RDF2 であることを確認します。ローカルデバイスグループの状態は symrdf -g device-group-name -query コマンドにより返されます。これらの値は、RDF1 または RDF2 状態に対応しています。次の表では、新しい主クラスタ cluster-newyork で実行される EMC Symmetrix Remote Data Facility コマンドを説明しています。

表 3–1 新しい主クラスタでの EMC Symmetrix Remote Data Facility スイッチオーバー検証

RDF ペア状態 

cluster-newyork で実行される EMC Symmetrix Remote Data Facility スイッチオーバーコマンド

Synchronized

RDF リンクを中断します。 

R1UpdatedFailedoverSuspended

symrdf swap コマンドで役割を切り替えます。

その他の RDF ペア状態 

コマンドは実行されません。 

複製から見たスイッチオーバーの結果

スイッチオーバーが正常に完了したあと、データ複製レベルで、主ボリュームと二次ボリュームの役割が切り替わっています。スイッチオーバー前の RDF1 ボリュームは、RDF2 ボリュームになります。スイッチオーバー前の RDF2 ボリュームは、RDF1 ボリュームになります。データ複製は、新しい RDF1 ボリュームから新しい RDF2 ボリュームに継続されます。

スイッチオーバー操作の一部として、新しい主クラスタでアプリケーションがオンラインになることができるかどうかにかかわらず、保護グループの Local-role プロパティーも切り替わります。保護グループの Local roleSecondary であったクラスタでは、保護グループの Local-role プロパティーが Primary になります。保護グループの Local rolePrimary であったクラスタでは、保護グループの Local-role プロパティーが Secondary になります。

ProcedureEMC Symmetrix Remote Data Facility 保護グループを主クラスタから二次クラスタにスイッチオーバーする方法

始める前に

スイッチオーバーを正常に完了するためには、主クラスタと二次クラスタ間のデータ複製が有効状態で、かつ、これら 2 つのクラスタ上のデータボリュームが同期していなければなりません。

主クラスタから二次クラスタへ保護グループのスイッチオーバーを行うには、次の条件が満たされている必要があります。


注意 – 注意 –

Cluster_dgs プロパティーを構成してある場合、この プロパティーに指定されているデバイスグループに書き込むことができるのは保護グループに属するアプリケーションだけです。


  1. クラスタノードの 1 つにログインします。

    この手順を行うには、Geo Management RBAC 権利プロファイルがユーザーに割り当てられている必要があります。RBAC についての詳細は、『Sun Cluster Geographic Edition のシステム管理』「Sun Cluster Geographic Edition ソフトウェアと RBAC」を参照してください。

  2. スイッチオーバーを開始します。

    スイッチオーバーでは、保護グループに属するアプリケーションリソースグループの停止と起動が行われます。


    # geopg switchover [-f] -m newprimarycluster protectiongroupname
    
    -f

    ユーザーに確認することなく、強制的にコマンドを実行します

    -m newprimarycluster

    保護グループの新しい主クラスタにするクラスタの名前を指定します

    protectiongroupname

    保護グループの名前を指定します


例 3–1 主クラスタから二次クラスタへの強制的なスイッチオーバー

この例では、二次クラスタへのスイッチオーバーを実行します。


# geopg switchover -f -m cluster-newyork srdfpg

EMC Symmetrix Remote Data Facility データ複製を使用するシステムでのテイクオーバーの強制実行

主ボリュームと二次ボリュームのデータが完全に整合しているかどうかにかかわらず二次クラスタ上でアプリケーションをオンラインにする必要がある場合は、テイクオーバーを実行します。ここでは、保護グループが起動しているものと仮定します。

テイクオーバーは次の手順で行われます。

テイクオーバーの前後で考えられる主クラスタと二次クラスタの条件については、『Sun Cluster Geographic Edition のシステム管理』の付録 C「テイクオーバー後の状態」を参照してください。

これ以降の節では、二次クラスタによるテイクオーバーを強制実行するときに行う必要がある手順について説明します。

テイクオーバーの前に発生する検証

geopg takeover コマンドを使用してテイクオーバーを開始すると、両方のクラスタに対してデータ複製サブシステムがいくつかの検証を実行します。これらの手順は、元の主クラスタでは、その主クラスタに到達できる場合だけに行われます。元の主クラスタでの検証が失敗する場合でも、テイクオーバーは実行されます。

まず、複製サブシステムは、EMC Symmetrix Remote Data Facility デバイスグループの全体的な RDF ペア状態が有効であるかどうか検査します。 次の表に、テイクオーバーに使用する EMC Symmetrix Remote Data Facility コマンドを示します。

表 3–2 新しい主クラスタでの EMC Symmetrix Remote Data Facility テイクオーバー検証

全体的な RDF ペア状態 

保護グループのローカルの役割 

cluster-newyork で実行される EMC Symmetrix Remote Data Facility テイクオーバーコマンド

FailedOver

プライマリ 

symrdf $option $dg write_disable r2

symrdf —g dg suspend

symrdf $option $dg rw_enable r1

FailedOver

二次 

コマンドは実行されません。 

Synchronized, Suspended, R1 Updated, Partitioned

すべて 

symrdf -g dg failover

複製の観点から見たテイクオーバーの結果

複製の観点から見れば、テイクオーバーが成功したあと、テイクオーバー操作の一部として、新しい主クラスタでアプリケーションがオンラインになることができるかどうかにかかわらず、保護グループの Local-role プロパティーは新しい役割を反映するように変更されます。保護グループの Local roleSecondary であった cluster-newyork では、保護グループの Local-role プロパティーが Primary になります。保護グループの Local-rolePrimary であった cluster-paris では、次のことが発生する可能性があります。

テイクオーバーが成功した場合、アプリケーションはオンラインになります。別の geopg start コマンドを実行する必要はありません。


注意 – 注意 –

テイクオーバーが成功したあと、新しい主クラスタ cluster-newyork と以前の主クラスタ cluster-paris の間でのデータ複製が停止されます。geopg start コマンドを実行する場合、-n オプションを使用して、複製が再開されないようにする必要があります。


ProcedureEMC Symmetrix Remote Data Facility サービスを二次クラスタへ即時にテイクオーバーを強制する方法

始める前に

二次クラスタに主クラスタの処理を引き受けさせるためには、次の条件が満たされている必要があります。

  1. 二次クラスタ内のノードの 1 つにログインします。

    この手順を行うには、Geo Management RBAC 権利プロファイルがユーザーに割り当てられている必要があります。RBAC についての詳細は、『Sun Cluster Geographic Edition のシステム管理』「Sun Cluster Geographic Edition ソフトウェアと RBAC」を参照してください。

  2. テイクオーバーを開始します。


    # geopg takeover [-f] protectiongroupname
    
    -f

    ユーザーに確認することなく、強制的にコマンドを実行します

    protectiongroupname

    保護グループの名前を指定します


例 3–2 二次クラスタによる強制テイクオーバー

この例では、二次クラスタ cluster-newyork によって、srdfpg を強制的にテイクオーバーします。

phys-newyork-1 は二次クラスタの第 1 ノードです。どのノードが phys-newyork-1 かを確認するために、『Sun Cluster Geographic Edition のシステム管理』「Sun Cluster Geographic Edition クラスタ構成の例」を参照してください。


phys-newyork-1# geopg takeover -f srdfpg

次の手順

テイクオーバー後の主クラスタと二次クラスタの状態については、『Sun Cluster Geographic Edition のシステム管理』の付録 C「テイクオーバー後の状態」を参照してください。

EMC Symmetrix Remote Data Facility 複製を使用するシステムでのクラスタへのサービスの回復

テイクオーバーが正常に完了すると、二次クラスタ (cluster-newyork) が保護グループの主クラスタになり、この二次クラスタ上でサービスがオンラインになります。元の主クラスタ (cluster-paris) が回復したところで、フェイルバックと呼ばれる処理を行なって元の主クラスタ上でふたたびサービスをオンラインにすることができます。

Sun Cluster Geographic Edition ソフトウェアでは、次の 2 種類のフェイルバックがサポートされています。

元の主クラスタが再起動したあとで、新しい主クラスタ (cluster-newyork) を主クラスタのままにして、元の主クラスタ (cluster-paris) を二次クラスタとして使う場合は、スイッチオーバーやテイクオーバーを実行することなく、保護グループを再同期し、再検証します。

Procedure保護グループ構成を再同期し、再検証する方法

次の手順に従って、元の主クラスタ (cluster-paris) 上のデータを現在の主クラスタ (cluster-newyork) 上のデータと再同期して、再検証します。

始める前に

保護グループ構成を再同期して再構成する前に、cluster-newyork 上でテイクオーバーが行われています。現在のクラスタの役割は次のとおりです。

  1. 元の主クラスタ cluster-paris を現在の主クラスタ cluster-newyork と再同期させます。

    この操作により、cluster-paris の独自の構成は削除され、cluster-newyork の構成がローカルに複製されます。パートナーシップ構成と保護グループ構成の両方を再同期させます。

    1. cluster-paris で、パートナーシップを再同期させます。


      phys-paris-1# geops update partnershipname
      
      partnershipname

      パートナーシップの名前を指定します


      注 –

      複数の保護グループを再同期させている場合でも、この手順の実行が必要なのは 1 回だけです。


      パートナーシップの同期については、『Sun Cluster Geographic Edition のシステム管理』「パートナーシップの再同期」を参照してください。

    2. cluster-paris で、各保護グループを再同期させます。

      cluster-newyork 上の保護グループの役割は primary であるため、この手順により cluster-paris 上の保護グループの役割は secondary になります。


      phys-paris-1# geopg update protectiongroupname
      
      protectiongroupname

      保護グループの名前を指定します

      保護グループの同期についての詳細は、「EMC Symmetrix Remote Data Facility 保護グループの再同期」を参照してください。

  2. cluster-paris 上で、個々の保護グループのクラスタ構成を検証します。


    phys-paris-1# geopg validate protectiongroupname 
    
    protectiongroupname

    単一の保護グループを識別する一意の名前を指定します

    詳細は、「EMC Symmetrix Remote Data Facility 保護グループを検証する方法」を参照してください。

  3. cluster-paris で、各保護グループを有効にします。

    cluster-paris の保護グループの役割は secondary であるため、geopg start コマンドは cluster-paris でアプリケーションを再起動しません。


    phys-paris-1# geopg start -n -e local protectiongroupname
    
    -e local

    コマンドの範囲を指定します。

    範囲を local と指定すると、ローカルクラスタだけがコマンドの対象となります。

    -n

    データ複製を、当該保護グループに使用してはならないことを指定します。このオプションを省略すると、データ複製は保護グループと同時に始まります。

    protectiongroupname

    保護グループの名前を指定します。

    保護グループの役割は secondary であるため、データの同期化は現在の主クラスタである cluster-newyork から二次クラスタ cluster-paris へと行われます。

    geopg start コマンドの詳細は、「EMC Symmetrix Remote Data Facility 保護グループを有効にする方法」を参照してください。

  4. 保護グループの構成に問題がないことを確認します。

    まず、cluster-newyork 上の保護グループの状態が OK であることを確認します。cluster-newyork 上の EMC Symmetrix Remote Data Facility デバイスグループの EMC Symmetrix Remote Data Facility ペア状態が Synchronized の場合、保護グループのローカルの状態は OK です。


    phys-newyork-1# geoadm status
    

    出力の保護グループセクションを参照してください。

    次に、複製リソースグループ protectiongroupname-rep-rg 内のすべてのリソースの状態が OK であることを確認します。


    phys-newyork-1# scstat -g
    

ProcedureEMC Symmetrix Remote Data Facility 複製を使用するシステム上でフェイルバックスイッチオーバーを実行する方法

この手順は、元の主クラスタ cluster-paris のデータが現在の主クラスタ cluster-newyork のデータと再同期されたあとで、アプリケーションを元の主クラスタで再起動するときに使用します。


注 –

フェイルバック手順は、パートナーシップのクラスタにだけ適用されます。次の手順は、パートナーシップごとに 1 回だけ実行する必要があります。


始める前に

フェイルバックスイッチオーバーを実行する前に、cluster-newyork ではテイクオーバーが発生していた場合を例とします。クラスタの役割は次のとおりです。

  1. 元の主クラスタ cluster-paris を現在の主クラスタ cluster-newyork と再同期させます。

    この操作により、cluster-paris の独自の構成は削除され、cluster-newyork の構成がローカルに複製されます。パートナーシップ構成と保護グループ構成の両方を再同期させます。

    1. cluster-paris で、パートナーシップを再同期させます。


      phys-paris-1# geops update partnershipname
      
      partnershipname

      パートナーシップの名前を指定します


      注 –

      パートナーシップ内の複数の保護グループにフェイルバックスイッチオーバーを実行している場合でも、この手順を実行する必要があるのはパートナーシップごとに 1 回だけです。


      パートナーシップの同期についての詳細は、『Sun Cluster Geographic Edition のシステム管理』「パートナーシップの再同期」を参照してください。

    2. cluster-paris で、各保護グループを再同期させます。

      cluster-newyork の保護グループのローカルな役割は現在 primary であるため、この手順によって cluster-paris の保護グループのローカルな役割が確実に secondary となります。


      phys-paris-1# geopg update protectiongroupname
      
      protectiongroupname

      保護グループの名前を指定します

      保護グループの同期についての詳細は、「EMC Symmetrix Remote Data Facility 保護グループの再同期」を参照してください。

  2. cluster-paris 上で、個々の保護グループのクラスタ構成を検証します。

    保護グループがエラー状態でないことを確認します。エラー状態の場合、保護グループを起動できません。


    phys-paris-1# geopg validate protectiongroupname 
    
    protectiongroupname

    単一の保護グループを識別する一意の名前を指定します

    詳細は、「EMC Symmetrix Remote Data Facility 保護グループを検証する方法」を参照してください。

  3. cluster-paris で、各保護グループを有効にします。

    cluster-paris の保護グループの役割は secondary であるため、geopg start コマンドは cluster-paris でアプリケーションを再起動しません。


    phys-paris-1# geopg start -e local protectiongroupname
    
    -e local

    コマンドの範囲を指定します。

    範囲を local と指定すると、ローカルクラスタだけがコマンドの対象となります。

    protectiongroupname

    保護グループの名前を指定します。


    注 –

    データを現在の主クラスタ (cluster-newyork) から現在の二次クラスタ (cluster-paris) に同期させる必要があるため、フェイルバックスイッチオーバーを実行するときに、-n オプションは使用しないでください。


    保護グループの役割は secondary であるため、データの同期化は現在の主クラスタである cluster-newyork から二次クラスタ cluster-paris へと行われます。

    geopg start コマンドの詳細は、「EMC Symmetrix Remote Data Facility 保護グループを有効にする方法」を参照してください。

  4. データが完全に同期したことを確認します。

    cluster-newyork の保護グループの状態が OK になると、データは完全に同期しています。cluster-newyork 上の EMC Symmetrix Remote Data Facility デバイスグループの RDF ペア状態が Synchronized の場合、保護グループのローカルの状態は OK です。

    cluster-newyork の保護グループの状態が OK であることを確認するには、次のコマンドを使用します。


    phys-newyork-1# geoadm status
    

    出力の保護グループセクションを参照してください。

  5. どちらか一方のクラスタで、各保護グループについて cluster-newyork から cluster-paris へのスイッチオーバーを実行します。


    # geopg switchover [-f] -m clusterparis protectiongroupname
    

    詳細は、「EMC Symmetrix Remote Data Facility 保護グループを主クラスタから二次クラスタにスイッチオーバーする方法」を参照してください。

    cluster-paris は、元の役割である、保護グループの主クラスタに戻ります。

  6. スイッチオーバーが正しく実行されたことを確認します。

    保護グループが現在 cluster-paris で primary、cluster-newyork で secondary になっており、「データ複製」および「リソースグループ」が両方のクラスタで OK になっていることを確認します。


    # geoadm status
    

    各 EMC Symmetrix Remote Data Facility 保護グループのアプリケーションリソースグループとデータ複製の実行時ステータスを確認します。


    # scstat -g
    

    検査するデータ複製デバイスグループの Status フィールドと Status Message フィールドを参照してください。これらのフィールドの詳細は、表 2–1 を参照してください。

    データ複製の実行時ステータスについては、「EMC Symmetrix Remote Data Facility データ複製の実行時状態の検査」を参照してください。

ProcedureEMC Symmetrix Remote Data Facility 複製を使用するシステム上でフェイルバックテイクオーバーを実行する

元の主クラスタ cluster-paris 上でアプリケーションを再起動し、元の主クラスタ上の現在のデータを使用するには、次の手順を実行します。この場合、現在の二次クラスタ cluster-newyork が一次クラスタとして機能していた間に更新されたデータは、すべて破棄されます。

フェイルバック手順は、パートナーシップのクラスタにだけ適用されます。次の手順は、パートナーシップごとに 1 回だけ実行する必要があります。


注 –

元の主クラスタ (cluster-paris ) でデータの使用を再開する場合、cluster-newyork でのテイクオーバー操作のあと、決してデータを新しい主クラスタ (cluster-newyork ) から元の主クラスタ (cluster-paris) に複製しないでください。新しい主クラスタと元の主クラスタの間でデータの複製を行わないようにするために、geopg start コマンドを使用するときには常に、-n オプションを使用しておく必要があります。


始める前に

クラスタが次の役割を持つことを確認します。

  1. 元の主クラスタ cluster-paris を元の二次クラスタ cluster-newyork と再同期させます。

    この操作により、cluster-paris の独自の構成は削除され、cluster-newyork の構成がローカルに複製されます。

    1. cluster-paris で、パートナーシップを再同期させます。


      phys-paris-1# geops update partnershipname
      
      partnershipname

      パートナーシップの名前を指定します


      注 –

      パートナーシップ内の複数の保護グループにフェイルバックテイクオーバーを実行している場合でも、この手順を実行する必要があるのはパートナーシップごとに 1 回だけです。


      パートナーシップの同期についての詳細は、『Sun Cluster Geographic Edition のシステム管理』「パートナーシップの再同期」を参照してください。

    2. cluster-paris で、各保護グループを再同期させます。

      cluster-newyork の保護グループのローカルな役割は現在 primary であるため、この手順によって cluster-paris の保護グループのローカルな役割が確実に secondary となります。


      phys-paris-1# geopg update protectiongroupname
      
      protectiongroupname

      保護グループの名前を指定します

      保護グループの再同期についての詳細は、「保護グループを再同期させる方法」を参照してください。

  2. cluster-paris 上で、個々の保護グループの構成を検証します。

    保護グループがエラー状態でないことを確認します。エラー状態の場合、保護グループを起動できません。


    phys-paris-1# geopg validate protectiongroupname 
    
    protectiongroupname

    単一の保護グループを識別する一意の名前を指定します

    詳細は、「EMC Symmetrix Remote Data Facility 保護グループを検証する方法」を参照してください。

  3. cluster-paris 上で、データ複製を行わずに、二次クラスタの役割が割り当てられている各保護グループを有効にします。

    cluster-paris の保護グループの役割は secondary であるため、geopg start コマンドは cluster-paris でアプリケーションを再起動しません。


    注 –

    この保護グループでデータ複製を使用しないことを指定する -n オプションを使用します。このオプションを省略すると、データ複製は保護グループと同時に始まります。



    phys-paris-1# geopg start -e local -n protectiongroupname
    
    -e local

    コマンドの範囲を指定します。

    範囲を local と指定すると、ローカルクラスタだけがコマンドの対象となります。

    -n

    データ複製を、当該保護グループに使用してはならないことを指定します。このオプションを省略すると、データ複製は保護グループと同時に始まります。

    protectiongroupname

    保護グループの名前を指定します

    詳細は、「EMC Symmetrix Remote Data Facility 保護グループを有効にする方法」を参照してください。

    cluster-paris-n オプションが 使用されているため、cluster-newyork から cluster-paris への複製は開始されません。

  4. cluster-paris 上で、各保護グループのテイクオーバーを開始します。


    phys-paris-1# geopg takeover [-f] protectiongroupname
    
    -f

    ユーザーに確認することなく、強制的にコマンドを実行します

    protectiongroupname

    保護グループの名前を指定します

    geopg takeover コマンドについての詳細は、「EMC Symmetrix Remote Data Facility サービスを二次クラスタへ即時にテイクオーバーを強制する方法」を参照してください。

    この時点で、cluster-paris の保護グループの役割は primary であり、cluster-newyork の保護グループの役割は secondary です。アプリケーションサービスは現在、cluster-paris でオンラインです。

  5. cluster-newyork で、各保護グループを有効にします。

    手順 4 の終わりで、cluster-newyork の保護グループのローカル状態は Offline です。保護グループのローカル状態の監視を開始するには、cluster-newyork の保護グループを有効にする必要があります。

    cluster-newyork 上の保護グループには secondary の役割が割り当てられているので、geopg start コマンドを実行しても、アプリケーションは cluster-newyork 上では再起動しません。


    phys-newyork-1# geopg start -e local [-n] protectiongroupname
    
    -e local

    コマンドの範囲を指定します。

    範囲を local と指定すると、ローカルクラスタだけがコマンドの対象となります。

    -n

    保護グループを有効にしたときにデータ複製を開始しないようにします。

    このオプションを省略した場合、データ複製サブシステムは保護グループと同時に起動されます。

    protectiongroupname

    保護グループの名前を指定します。

    geopg start コマンドの詳細は、「EMC Symmetrix Remote Data Facility 保護グループを有効にする方法」を参照してください。

  6. テイクオーバーが正しく実行されたことを確認します。

    保護グループが現在 cluster-paris で primary、cluster-newyork で secondary になっており、「データ複製」および「リソースグループ」が両方のクラスタで OK になっていることを確認します。


    # geoadm status
    

    注 –

    手順 5 でデータ複製が開始されるのを防ぐために -n オプションを使用した場合、「データ複製」ステータスは OK 状態になりません。


    各 EMC Symmetrix Remote Data Facility 保護グループのアプリケーションリソースグループとデータ複製の実行時ステータスを確認します。


    # scstat -g
    

    検査するデータ複製デバイスグループの Status フィールドと Status Message フィールドを参照してください。これらのフィールドの詳細は、表 2–1 を参照してください。

    データ複製の実行時ステータスについては、「EMC Symmetrix Remote Data Facility データ複製の実行時状態の検査」を参照してください。

EMC Symmetrix Remote Data Facility 複製を使用するシステムでのスイッチオーバー障害からの回復

geopg switchover などの Sun Cluster Geographic Edition の基本操作により、EMC Symmetrix Remote Data Facility データ複製レベルで symrdf swap 操作が実行されます。EMC Symmetrix Remote Data Facility の用語では、スイッチオーバーは「スワップ」とも呼ばれます。symrdf swap 操作は、動的 RDF よりも静的 RDF にかなりの長時間が必要です。このため、静的 RDF を使用するときは、保護グループのタイムアウトプロパティーの値を増やす必要がある場合があります。

symrdf swap コマンドが値 0 を返した場合、スイッチオーバーは成功です。場合によっては、symrdf swap コマンドはスワップを実行できない場合があります。このような場合は、0 以外の値が返されます (スイッチオーバー障害を示す)。

スワップ以外の結果は、二次ボリュームが主ボリュームと完全には同期していない可能性があることを示します。スイッチオーバー障害のケースの場合、Sun Cluster Geographic Edition ソフトウェアは新しい主クラスタになる予定のクラスタではアプリケーションを起動しません。

この節の残りの部分では、スイッチオーバー障害につながる初期条件を示して、スイッチオーバー障害から回復する方法について説明します。

スイッチオーバー障害の条件

この節では、スイッチオーバー障害が発生するケースを示します。このケースでは、cluster-paris が元の主クラスタであり、cluster-newyork が元の二次クラスタです。

次のようにスイッチオーバーを実行すると、cluster-paris から cluster-newyork にサービスが切り替わります。


phys-newyork-1# geopg switchover -f -m cluster-newyork srdfpg

geopg switchover コマンドの処理中に、 symrdf swap コマンドが実行され、EMC Symmetrix Remote Data Facility デバイスグループ (devgroup1) のエラーを返します。結果として、geopg switchover コマンドは次のような障害メッセージを返します。


Processing operation.... this may take a while ....
"Switchover" failed for the following reason:
			Switchover failed for SRDF DG devgroup1

この障害メッセージが発行されたあと、2 つのクラスタは次のような状態になります。


cluster-paris:
		srdfpg role: Secondary
cluster-newyork:
		srdfpg role: Secondary

phys-newyork-1# symdg list 

                          D E V I C E      G R O U P S                       

                                                             Number of
    Name               Type     Valid  Symmetrix ID  Devs   GKs  BCVs  VDEVs

    devgroup1         RDF1    Yes    000187401215     2     0     0      0
    devgroup2         RDF2    Yes    000187401215     6     0     0      0

スイッチオーバー障害からの回復

この節では、前の節で説明した障害シナリオから回復するための手順について説明します。これらの手順は、該当するクラスタでアプリケーションをオンラインにします。

  1. EMC Symmetrix Remote Data Facility デバイスグループ (devgroup1) を Split 状態にします。

    symrdf split コマンドを使用して、cluster-pariscluster-newyork の両方のクラスタの保護グループにあるデバイスグループを Split 状態にします。


    phys-newyork-1# symrdf -g devgroup1 split
    
  2. 保護グループのクラスタの 1 つを Primary にします。

    元の主クラスタでアプリケーションを起動する予定がある場合は、保護グループの元の主クラスタ cluster-parisPrimary にします。アプリケーションは、元の主クラスタで現在のデータを使用します。

    元の二次クラスタでアプリケーションを起動する予定がある場合は、保護グループの元の二次クラスタ cluster-newyorkPrimary にします。アプリケーションは、元の二次クラスタで現在のデータを使用します。


    注意 – 注意 –

    symrdf swap コマンドはスワップを実行していないため、cluster-newyork のデータボリュームは cluster-paris のデータボリュームと同期していない可能性があります。元の主クラスタにあるのと同じデータを使用してアプリケーションを起動する予定の場合は、元の二次クラスタを Primary にしないでください。


ProcedureEMC Symmetrix Remote Data Facility 保護グループの元の主クラスタを Primary にする方法

  1. 元の主クラスタで保護グループを無効にします。


    phys-paris-1# geopg stop -e Local srdfpg
    
  2. 保護グループの構成を再同期させます。

    このコマンドは、cluster-paris の保護グループ構成を、cluster-newyork の保護グループ構成情報と一致するように更新します。


    phys-paris-1# geopg update srdfpg
    

    geopg update コマンドが正常に実行されたあと、各クラスタで保護グループ srdfp の役割は次のようになります。


    cluster-paris:
    		srdfpg role: Primary
    cluster-newyork:
    		srdfpg role: secondary
  3. symrdf swap コマンドを実行して、デバイスグループ devgroup1 が RDF1 の役割を持つようにします。


    phys-paris-1# symrdf -g devgroup1 failover
    
    phys-paris-1# symrdf -g devgroup1 swap
    

    symrdf list コマンドを使用してデバイスグループ情報を表示し、スワップが成功したことを確認します。


    phys-paris-1# symdg list
                            D E V I C E      G R O U P S                       
    
                                                                 Number of
        Name               Type     Valid  Symmetrix ID  Devs   GKs  BCVs  VDEVs
    
        devgroup1         RDF1    Yes    000187401215     6     0     0      0
        devgroup2         RDF1    Yes    000187401215     2     0     0      0
  4. パートナーシップの両方のクラスタで保護グループを有効にします。


    phys-paris-1# geopg start -e Global srdfpg
    

    このコマンドは、cluster-paris でアプリケーションを起動します。cluster-paris から cluster-newyork へのデータ複製が開始されます。

ProcedureEMC Symmetrix Remote Data Facility 保護グループの元の二次クラスタを Primary にする方法

  1. 保護グループの構成を再同期させます。

    このコマンドは、cluster-newyork の保護グループ構成を、cluster-paris の保護グループ構成情報と一致するように更新します。


    phys-newyork-1# geopg update srdfpg
    

    geopg update コマンドが正常に実行されたあと、各クラスタで保護グループ srdfpg の役割は次のようになります。


    cluster-paris:
    		srdfpg role: Secondary
    cluster-newyork:
    		srdfpg role: Primary
  2. symrdf swap コマンドを実行して、デバイスグループ (devgroup2) が RDF2 の役割を持つようにします。


    phys-paris-1# symrdf -g devgroup2 failover
    
    phys-paris-1# symrdf -g devgroup2 swap
    

    symrdf list コマンドを使用してデバイスグループ情報を表示し、スワップが成功したことを確認します。


    phys-paris-1# symdg list
    
                              D E V I C E      G R O U P S                       
    
                                                                 Number of
        Name               Type     Valid  Symmetrix ID  Devs   GKs  BCVs  VDEVs
    
        devgroup1        RDF2    Yes    000187401215     6     0     0      
        devgroup2        RDF2    Yes    000187401215     2     0     0      0
  3. パートナーシップの両方のクラスタで保護グループを有効にします。


    phys-newyork-1# geopg start -e Global srdfpg
    

    このコマンドは、cluster-newyork でアプリケーションを起動します。cluster-newyork から cluster-paris へのデータ複製が開始されます。


    注意 – 注意 –

    このコマンドは、cluster-paris 上のデータを上書きします。


EMC Symmetrix Remote Data Facility データ複製エラーからの回復

データ複製レベルでエラーが発生した場合、関連するデバイスグループの複製リソースグループ内のリソースの状態に、そのエラーが反映されます。この変更されたステータスは、その保護グループの geoadm status コマンドの出力の「Data Replication status」フィールドに表示されます。

データ複製エラーを検出する方法

複製リソースの状態は、scstat -g コマンドを次のように使用すると検査できます。


phys-paris-1# scstat -g

Resource status のさまざまな値を実際の複製ペアの状態に対応付ける方法については、表 2–4 を参照してください。

scstat -g コマンドを実行すると、次のようなメッセージが返ることがあります。


...

-- Resources --

            Resource Name       Node Name           State     Status Message
            -------------       ---------           -----     --------------
  Resource: sc_geo_dr-SRDF-srdfpg-devgroup1 pemc1  Online    Online - Partitioned
  Resource: sc_geo_dr-SRDF-srdfpg-devgroup1 pemc2  Offline   Offline
...

geoadm status コマンドを使用して、保護グループに含まれるすべてのデバイスグループの全体的なリソース状態を表示できます。たとえば、前の例で scstat -g コマンドの出力は EMC Symmetrix Remote Data Facility デバイスグループ (devgroup1) が cluster-parisSuspended 状態にあることを示しています。表 2–4 は、 Suspended 状態がリソース状態 FAULTED に対応することを示しています。したがって、保護グループのデータ複製状態も FAULTED です。この状態は、geoadm status コマンドの出力に反映され、保護グループの状態が Error として表示されます。


phys-paris-1# geoadm status
Cluster: cluster-paris

Partnership "paris-newyork-ps"  : OK
   Partner clusters             : cluster-newyork
   Synchronization              : OK      
   ICRM Connection              : OK

   Heartbeat "paris-to-newyork" monitoring "cluster-newyork": OK 
      Heartbeat plug-in "ping_plugin"             : Inactive
      Heartbeat plug-in "tcp_udp_plugin"          : OK

Protection group "srdfpg"   : Error
      Partnership         : paris-newyork-ps
      Synchronization     : OK

      Cluster cluster-paris    : Error
         Role                  : Primary
         PG activation state   : Activated
         Configuration         : OK
         Data replication      : Error
         Resource groups       : OK 
   
      Cluster cluster-newyork  : Error
         Role                  : Secondary
         PG activation state   : Activated
         Configuration         : OK
         Data replication      : Error
         Resource groups       : OK

Pending Operations
      Protection Group         : "srdfpg"
      Operations               : start        

ProcedureEMC Symmetrix Remote Data Facility データ複製エラーから回復する方法

エラー状態から回復するには、次の手順の一部または全部を実行することをお勧めします。

  1. EMC Symmetrix Remote Data Facility のマニュアルに記載されている手順に従って、FAULTED 状態になった原因を調べます。この状態は PSUE として示されます。

  2. EMC Symmetrix Remote Data Facility の所定の手順に従って、障害状態から回復します。

    回復手順によってデバイスグループの状態が変化した場合、この状態は自動的にリソースによって検出され、新しい保護グループの状態として報告されます。

  3. 保護グループ構成を検証し直します。


    phys-paris-1# geopg validate protectiongroupname 
    
    protectiongroupname

    EMC Symmetrix Remote Data Facility 保護グループの名前を指定します

    geopg validate コマンドが構成が有効であると判断した場合、保護グループの状態はその判断結果を反映して変わります。構成が有効でない場合、geopg validate はエラーメッセージを返します。

  4. 保護グループ構成の状態を確認します。


    phys-paris-1# geopg list protectiongroupname 
    
    protectiongroupname

    EMC Symmetrix Remote Data Facility 保護グループの名前を指定します

  5. 保護グループの実行時状態を確認します。


    phys-paris-1# geoadm status