Platinum MAAアーキテクチャでのGGHub配置の計画

停止時間をゼロ(RTOをゼロまたはほぼゼロ)にし、データ損失をゼロまたはほぼゼロ(RPOをゼロまたはほぼゼロ)にする極限の可用性を実現するには、通常、次に示すPlatinum MAAアーキテクチャが必要です。

  1. Oracle GoldenGateアーキテクチャには、障害(データベース、クラスタまたはサイト障害)の発生時にアプリケーションをただちにフェイルオーバーできるように、またはデータベースやアプリケーションのアップグレード時にスイッチオーバーできるようにするために、ソース・データベースとターゲット・データベースがあります。このアーキテクチャにより、障害シナリオやデータベースおよびアプリケーションのアップグレードの保守に対して、潜在的なRTOをゼロまたはほぼゼロにできます。
  2. 各ソース・データベースおよびターゲット・データベースはExadataシステムにデプロイされているため、ローカルの障害は許容されるかほぼ瞬時にリカバリされます。
  3. 各ソースおよびターゲット・データベースは、Data Guardファスト・スタート・フェイルオーバーを備えたスタンバイ・データベースとともに構成されているため、データベースに障害が発生すると数秒から数分で新しいプライマリ・データベースがアクティブ化されます。最大可用性保護モードのSYNC転送を利用すると、データ損失ゼロのData Guardフェイルオーバーが実現されます。
  4. ソースおよびターゲット・データベースの間にMAA GGhubを使用するGoldenGateレプリケーションを使用して構成されます。
  5. Data Guardのスイッチオーバーまたはフェイルオーバーによってプライマリ・データベースになるスタンバイが、自動的にターゲットのGoldenGateデータベースと再同期するように構成されます。データ損失ゼロのData Guardスイッチオーバーまたはフェイルオーバーが発生した場合は、GoldenGateの再同期により、分散データベース環境全体のデータ損失がゼロになります。
  6. 双方向レプリケーションが構成されているか必要な場合は、GoldenGateの自動競合検出および解決を使用して構成されています。

MAAプライマリGGHubとスタンバイGGHubを配置する場所

  1. GGHubペア(プライマリGGhubとスタンバイGGhub)は、各プライマリ・データベースおよびスタンバイ・データベースと同じリージョン(ラウンド・トリップ待機時間が4ミリ秒未満)に存在する必要があります。たとえば、

    1. プライマリ・データベースがデータ・センター1、リージョンAにあり、スタンバイ・データベースがデータ・センター2、リージョンAにある場合、GGHubペアはリージョンAに存在します。

    2. プライマリ・データベースがリージョンAにあり、スタンバイ・データベースがリージョンBにある場合、GGHubペアはリージョンAとリージョンBの間で分割します。プライマリまたはアクティブGGhubは、ターゲットのプライマリ・データベースと同じリージョンに配置されている必要があります。

  2. パフォーマンスへの影響:

    1. プライマリまたはアクティブGGhubは、ラウンド・トリップ待機時間が必ず4ミリ秒以下になるように、ターゲット・データベースと同じデータ・センターに存在する必要があります。(Replicatのパフォーマンス)

    2. プライマリまたはアクティブなGGhubは、GoldenGateのパフォーマンス(Extractのパフォーマンス)低下が発生することのない、ソース・データベースから90ミリ秒未満に収める必要があります。

  3. GoldenGate分散パス

    1. ソースGGhubとターゲットGGhubが別々の領域にあり待機時間が90ミリ秒より長い場合は、GoldenGate分散パスが必要です。

    2. 双方向レプリケーションの場合、または複数のターゲット・データベースが別々のデータ・センターにある場合は、追加のハブと、それらの間で証跡ファイルを送信する分散パスが必要になることがあります。

同じデータ・センターに配置されたMAA GGHub

このシナリオでは、プライマリ・データベースとスタンバイ・データベースが同じデータ・センターにあります(待機時間が4ミリ秒未満)。そのため、プライマリ(アクティブ)GGHubとスタンバイGGHubも同じデータ・センターにあります。

次の例では、2つのデータ・センター(言い換えると、同じデータ・センター内の複数の可用性ドメイン(AD))があります。

図1に示すように、次のアーキテクチャ・コンポーネントがあります。

  1. プライマリ・データベースおよび関連付けられたスタンバイ・データベースは、Oracle Active Data Guardファスト・スタート・フェイルオーバー(FSFO)によって構成されています。FSFOは、データ損失の最大許容度に応じて、ASYNCまたはSYNC REDO転送を使用するData Guard保護モードで構成できます。

  2. プライマリGGHubアクティブ/パッシブ・クラスタ: 2ノード・クラスタに1つのみのGGHubソフトウェア・デプロイメントと構成があります。このクラスタには、11.2.0.4以降のデータベース・バージョンのサポートが可能な、21cのOracle GoldenGateソフトウェア・デプロイメントが含まれています。このGGHubは、多数のプライマリ・データベースをサポートし、ソース・データベースからトランザクションをマイニングするGoldenGate Extractとターゲット・データベースに同じ変更を適用するGoldenGate ReplicatのGoldenGateプロセスをカプセル化できます。GoldenGate証跡とチェックポイント・ファイルは、GGhub ACFSファイル・システム内にも存在します。HAフェイルオーバー・ソリューションはGGhubに組み込まれています。このソリューションには、同じクラスタ内のパッシブ・ノードへの自動フェイルオーバーが含まれていて、ノード障害後にGoldenGateプロセスとアクティビティを再起動します。

  3. スタンバイGGHubアクティブ/パッシブ・クラスタ: 対称スタンバイGGhubが構成されています。ACFSレプリケーションは、すべてのGoldenGateファイルを保持するために、プライマリとスタンバイのGGHubの間に設定されています。ACFSフェイルオーバーを含む手動によるGGhubフェイルオーバーは、プライマリGGhub全体が損なわれるまれなケースで実行することになります。

図22-1 2つの別個の可用性ドメインがある同じデータ・センター内のプライマリGGHubとスタンバイGGHub



上の図は、次のステップによって、プライマリ・データベースAからプライマリ・データベースBにデータをレプリケートして、プライマリBからプライマリAに戻している様子を示しています。

  1. プライマリ・データベースA: プライマリAのLogminerサーバーは、プライマリGGHub ExtractプロセスにREDO変更を送信します。
  2. プライマリGGHub: Extractプロセスによって、変更が証跡ファイルに書き込まれます。
  3. プライマリGGHubからプライマリ・データベースB: プライマリGGHubのReplicatプロセスは、該当する変更をターゲット・データベース(プライマリB)に適用します。
  4. プライマリ・データベースB: プライマリBのLogminerサーバーは、プライマリGGHub ExtractプロセスにREDOを送信します。
  5. プライマリGGHub: プライマリGGHubのExtractプロセスによって、変更が証跡ファイルに書き込まれます。
  6. プライマリGGHubからプライマリ・データベースA: プライマリGGHubのReplicatプロセスは、該当する変更をターゲット・データベース(プライマリA)に適用します。

ソースとターゲットのデータベースが異なるOracle Databaseリリースであっても、1つのGGHubで複数のソース・データベースとターゲット・データベースをサポートできます。

表22-1 同じデータ・センター内のGGHubの停止シナリオ、修復、および冗長性のリストア

停止シナリオ アプリケーションの可用性と修復 冗長性と初期状態の復元
プライマリ・データベースA (またはデータベースB)の障害

影響: アプリケーション停止時間は、ほぼゼロです。GoldenGateレプリケーションは、新しいプライマリ・データベースの起動時に再開されます。

  1. 1つのプライマリ・データベースが引き続き使用できます。すべてのアクティビティは、アプリケーションの停止時間がゼロになるように、使用可能な既存のプライマリ・データベースにルーティングされます。Global Data Servicesのグローバル・サービス・フェイルオーバーのソリューションを参照してください。たとえば、アプリケーション・サービスのAからFはデータベースAにルーティングされ、アプリケーション・サービスのGからJはデータベースBにルーティングされているとします。データベースAに障害が発生すると、すべてのアプリケーション・サービスは一時的にデータベースBに移動します。
  2. スタンバイは、Data Guard FSFOによって自動的に新しいプライマリになります。Oracle GoldenGateレプリケーションが再開され、プライマリ・データベースが再同期されます。データ損失は、Data Guard保護レベルによって制限されます。最大可用性または最大保護が構成されている場合は、データ損失がゼロになります。すべてのコミットされたトランザクションは、一方または両方のデータベースにあります。ワークロードは、プライマリ・データベースAとデータベースBが使用可能であり、同期状態にあるときには「リバランス」できます。たとえば、データベースAが稼働中で同期状態にある場合、サービスAからFはデータベースAに戻すことができます。
  1. 元のプライマリ・データベースは、冗長性をリストアするために新しいスタンバイ・データベースとして回復されます。
  2. オプションで、Data Guardスイッチオーバーを実行して元の構成に戻すと、1つ以上のプライマリ・データベースが個別のAD内に存在するようにします。
プライマリまたはスタンバイGGHubの単一ノード障害

影響: アプリケーションに影響はありません。GoldenGateレプリケーションは、数分後に自動的に再開されます。

処置は必要ありません。GGHubに組み込まれたHAフェイルオーバー・ソリューションには、GoldenGateプロセスとアクティビティの自動フェイルオーバーと再起動が含まれます。レプリケーション・アクティビティは、GoldenGateプロセスが再度アクティブになるまでブロックされます。GoldenGateレプリケーションのブラックアウトは数分間続くことがあります。

ノードが再起動すると、アクティブ/パッシブ構成が再確立されます。
プライマリGGHubクラスタがクラッシュしてリカバリできない

影響: アプリケーションに影響はありません。GoldenGateレプリケーションは、既存のGGHubの再起動後、または手動によるGGHubフェイルオーバー操作の実行後に再開されます。

  1. GGHubクラスタの再起動が可能な場合は、それが最も単純なソリューションです。
  2. プライマリGGHubがリカバリ不可能な場合は、スタンバイGGHubへの手動によるGGHubフェイルオーバー(ACFSフェイルオーバーを含む)を実行します。これには通常、数分かかります。
  3. GoldenGateレプリケーションは、新しいプライマリGGhubが使用可能になるまで停止するため、ステップ1またはステップ2は迅速に実行する必要があります。
前のGGHubが最終的に再起動されると、ACFSレプリケーションは別の方向に自動的に再開されます。GGHubクラスタが損なわれた場合やリカバリ不能になった場合は、新しいスタンバイGGHubを再構築する必要があります。
スタンバイGGHubクラスタがクラッシュしてリカバリできない

影響: アプリケーションまたはレプリケーションに影響はありません。

  1. GGHubクラスタが再起動可能な場合は、それが最も単純なソリューションであり、ACFSレプリケーションを再開できます。
  2. スタンバイGGHubがリカバリ不可能な場合は、新しいスタンバイGGHubを再構築することになります。
N/A
データ・センターまたは可用性ドメイン(AD1またはAD2)の全体的な障害

影響: アプリケーション停止時間は、ほぼゼロです。GoldenGateレプリケーションは、新しいプライマリ・データベースの起動時に再開されます。

  1. 1つのプライマリ・データベースが引き続き使用できます。すべてのアクティビティは、アプリケーションの停止時間がゼロになるように、使用可能な既存のプライマリ・データベースにルーティングされます。グローバル・サービス・フェイルオーバーのソリューションを参照してください。たとえば、アプリケーション・サービスのAからFはデータベースAにルーティングされ、アプリケーション・サービスのGからJはデータベースBにルーティングされているとします。データベースAに障害が発生すると、すべてのサービスは一時的にデータベースBに移動します。
  2. プライマリGGHubがまだ機能している場合、GoldenGateレプリケーションは続行されます。可用性ドメイン(AD)の障害が原因でプライマリGGHubが損なわれた場合は、手動によるGGhubフェイルオーバーが必要です。GoldenGateレプリケーションが再開され、プライマリ・データベースが再同期されます。データ損失は、Data Guard保護レベルによって制限されます。最大可用性または最大保護が構成されている場合は、データ損失がゼロになります。すべてのコミットされたトランザクションは、一方または両方のデータベースにあります。ワークロードは、プライマリ・データベースAとデータベースBが使用可能であり同期状態にあるときにはリバランスできます。データベースAが稼働中で同期状態にある場合、サービスAからFはデータベースAに戻すことができます。
  1. データ・センター/ADの復帰時に、スタンバイの回復などの構成を再確立します。前のGGHubが最終的に再起動されると、ACFSレプリケーションは別の方向に自動的に再開されます。
  2. 可能な場合は、Data Guardスイッチオーバー(フェイルバック)を実行して、各ADに1つのプライマリ・データベースが存在する元の状態に戻します。

別々のデータ・センターに配置されたMAA GGHub

このシナリオでは、プライマリ・データベースとスタンバイ・データベースは別々のデータ・センターにあります。そのため、プライマリ(アクティブ)GGHubはプライマリ・データベースと同じデータ・センターにあり、スタンバイGGHubはスタンバイ・データベースと同じデータ・センターにあります。

例を簡単にするために、このシナリオではデータ・センター間の待機時間は90ミリ秒未満になっています。

図2に示すように、次のアーキテクチャ・コンポーネントがあります。

  1. プライマリ・データベースおよび関連付けられたスタンバイ・データベースは、Oracle Active Data Guardファスト・スタート・フェイルオーバー(FSFO)によって構成されています。FSFOは、データ損失の最大許容度に応じて、ASYNCまたはSYNC REDO転送を使用するData Guard保護モードで構成できます。

  2. プライマリGGHubアクティブ/パッシブ・クラスタ: この構成には、2つのOracle GoldenGateソフトウェア構成を備えた2ノード・クラスタがあります。プライマリGGHubはターゲット・データベースから4ミリ秒以下である必要がありますが、2つのデータ・センターのネットワーク待機時間は5ミリ秒より長いため、GGHubクラスタごとに2つのGGhub構成が作成されています。基本的に、プライマリGGHub構成は、必ずターゲット・データベースと同じデータ・センター内にあります。GGHubは、11g以降のOracle Databaseリリースのサポートが可能なOracle GoldenGate 21cソフトウェア・デプロイメントで構成されています。このGGHubは、多数のプライマリ・データベースをサポートし、ソース・データベースからトランザクションをマイニングするExtractとターゲット・データベースに該当する変更を適用するReplicatのGoldenGateプロセスをカプセル化できます。GoldenGate証跡とチェックポイント・ファイルは、ACFSファイル・システム内にも存在します。GGhubクラスタに組み込まれたHAフェイルオーバー・ソリューションには、ノード障害後のGoldenGateプロセスとアクティビティの自動フェイルオーバーと再起動が含まれています。

    それぞれのGGhub構成に、GoldenGateサービス・マネージャおよびデプロイメント、ACFSレプリケーションによるACFSファイル・システム、ならびに別個のアプリケーションVIPが含まれています。

  3. スタンバイGGHubアクティブ/パッシブ・クラスタ: 対称スタンバイGGhubが構成されています。ACFSレプリケーションは、すべてのGoldenGateファイルを保持するために、プライマリとスタンバイのGGHubの間に設定されています。ACFSフェイルオーバーを含む手動によるGGhubフェイルオーバーは、プライマリGGhub全体が損なわれた場合に実行することになります。

図22-2 別々のデータ・センターにあるプライマリGGHubとスタンバイGGHub



上の図は、次のステップによって、プライマリ・データベースAからプライマリ・データベースBにデータをレプリケートして、プライマリBからプライマリAに戻している様子を示しています。

  1. プライマリ・データベースA: プライマリAのLogminerサーバーは、データベースAのプライマリGGHubにあるPHXデータ・センターのGGHub ExtractプロセスにREDO変更を送信します。
  2. プライマリGGHub: Extractプロセスによって、証跡ファイルに変更が書き込まれます。
  3. プライマリGGHubからプライマリ・データベースB: PHXデータ・センターのGoldenGate Replicatプロセスは、該当する変更をターゲット・データベース(プライマリB)に適用します。
  4. プライマリ・データベースB: プライマリBのLogminerサーバーは、データベースBのプライマリGGHubにあるASHデータ・センターのGGHub ExtractプロセスにREDOを送信します。
  5. プライマリGGHub: Extractプロセスによって、証跡ファイルに変更が書き込まれます。
  6. プライマリGGHubからプライマリ・データベースA: ASHデータ・センターのGoldenGate Replicatプロセスは、該当する変更をターゲット・データベース(プライマリA)に適用します。

表22-2 別々のデータ・センター内のGGHubの停止シナリオ、修復および冗長性のリストア

停止シナリオ アプリケーションの可用性と修復 冗長性と初期状態の復元
プライマリ・データベースA (またはデータベースB)の障害

影響: アプリケーション停止時間は、ほぼゼロです。GoldenGateレプリケーションは、新しいプライマリ・データベースの起動時に再開されます。

  1. 1つのプライマリ・データベースが引き続き使用できます。すべてのアクティビティは、アプリケーションの停止時間がゼロになるように、使用可能な既存のプライマリ・データベースにルーティングされます。Global Data Servicesのグローバル・サービス・フェイルオーバーのソリューションを参照してください。たとえば、アプリケーション・サービスのAからFはデータベースAにルーティングされ、アプリケーション・サービスのGからJはデータベースBにルーティングされているとします。データベースAに障害が発生すると、すべてのサービスは一時的にデータベースBに移動します。

  2. スタンバイは、Data Guard FSFOによって自動的に新しいプライマリになります。GoldenGateレプリケーションが再開され、プライマリ・データベースが再同期されます。データ損失は、Data Guard保護レベルによって制限されます。最大可用性または最大保護が構成されている場合は、データ損失がゼロになります。すべてのコミットされたトランザクションは、一方または両方のデータベースにあります。ワークロードは、プライマリ・データベースAとデータベースBが使用可能であり同期状態にあるときにはリバランスできます。たとえば、データベースAが稼働中で同期状態にある場合、サービスAからFはデータベースAに戻すことができます。

  3. Replicatのパフォーマンスは、プライマリGGHubがターゲット・データベースと同じデータ・センターにないと低下するようになります。ACFSレプリケーション・スイッチオーバーによるGGHubスイッチオーバーをスケジュールして、ターゲット・データベースに対する最適なReplicatパフォーマンスを再開します。そのようにすると、同じGGHubクラスタで2つのアクティブなGGhub構成が発生する可能性があります。
  1. 元のプライマリ・データベースは、冗長性をリストアするために新しいスタンバイ・データベースとして回復されます。

  2. オプションで、Data Guardスイッチオーバーを実行し、元の構成に戻すことで1つ以上のプライマリ・データベースが個別のAD内に存在するようにします。ACFSレプリケーション・スイッチオーバーによるGGHubスイッチオーバーをスケジュールして、ターゲット・データベースに対する最適なReplicatパフォーマンスを再開します。
プライマリまたはスタンバイGGHubの単一ノード障害

影響: アプリケーションに影響はありません。GoldenGateレプリケーションは、数分後に自動的に再開されます。

処置は必要ありません。GGHubに組み込まれたHAフェイルオーバー・ソリューションには、GoldenGateプロセスとアクティビティの自動フェイルオーバーおよび再起動が含まれます。レプリケーション・アクティビティは、GoldenGateプロセスが再度アクティブになるまでブロックされます。GoldenGateレプリケーションのブラックアウトは数分間続くことがあります。

ノードが再起動すると、アクティブ/パッシブ構成が再確立されます。
プライマリGGHubクラスタがクラッシュしてリカバリできない

影響: アプリケーションに影響はありません。GoldenGateレプリケーションは、既存のプライマリGGHubの再起動後または手動によるGGHubフェイルオーバーの完了後に再開されます。

  1. GGHubクラスタの再起動が可能な場合は、それが最も単純なソリューションです。
  2. プライマリGGHubがリカバリ不可能な場合は、スタンバイGGHubへの手動によるGGHubフェイルオーバー(ACFSフェイルオーバーを含む)を実行します。これには通常、数分かかります。
  3. レプリケーションは、新しいプライマリGGhubが起動されるまで停止するため、ステップ1またはステップ2は迅速に実行する必要があります。オーケストレーションが存在する場合、これは自動化する必要があります。
  1. 前のGGHubが最終的に再起動されると、ACFSレプリケーションは別の方向に自動的に再開されます。GGHubクラスタが損なわれた場合やリカバリ不能になった場合は、新しいスタンバイGGHubを再構築する必要があります。
  2. Replicatのパフォーマンスは、プライマリGGHubがターゲット・データベースと同じデータ・センターにないと低下します。ACFSレプリケーション・スイッチオーバーによるGGHubスイッチオーバーをスケジュールして、ターゲット・データベースに対する最適なReplicatパフォーマンスを再開します。

スタンバイGGHubクラスタがクラッシュしてリカバリできない

影響: アプリケーションまたはレプリケーションに影響はありません。

  1. GGHubクラスタが再起動可能な場合は、それが最も単純なソリューションであり、それによりACFSレプリケーションが再開されます。
  2. スタンバイGGHubがリカバリ不可能な場合は、新しいスタンバイGGHubを再構築することになります。
N/A
リージョン全体の障害

影響: アプリケーションの停止時間は、ほぼゼロです。GoldenGateレプリケーションは、新しいプライマリ・データベースが起動すると再開されます。

  1. 1つのプライマリ・データベースが引き続き使用できます。すべてのアクティビティは、アプリケーションの停止時間がゼロになるように、使用可能な既存のプライマリ・データベースにルーティングされます。Global Data Servicesのグローバル・サービス・フェイルオーバーのソリューションを参照してください。たとえば、アプリケーション・サービスのAからFはデータベースAにルーティングされていて、アプリケーション・サービスのGからJはデータベースBにルーティングされているとします。データベースAに障害が発生すると、すべてのサービスは一時的にデータベースBに移動するようになります。
  2. プライマリGGHubがまだ機能している場合は、GoldenGateレプリケーションが続行されます。リージョンの障害が原因でプライマリGGHubが損なわれた場合は、手動によるGGhubフェイルオーバーが必要です。GoldenGateレプリケーションが再開され、プライマリ・データベースが再同期されます。データ損失は、Data Guard保護レベルによって制限されます。最大の可用性または保護が構成されている場合は、データ損失がゼロになります。すべてのコミットされたトランザクションは、一方または両方のデータベースにあります。ワークロードは、プライマリ・データベースAとデータベースBが使用可能であり同期状態にあるときにはリバランスできます。データベースAが稼働中で同期状態にある場合、サービスAからFはデータベースAに戻すことができます。
  1. データ・センターの復帰時に、スタンバイの回復などの構成を再確立します。前のGGHubが最終的に再起動されると、ACFSレプリケーションは別の方向に自動的に再開されます。
  2. 可能な場合は、Data Guardスイッチオーバー(フェイルバック)を実行して、各データ・センターに1つのプライマリ・データベースが存在する元の状態に戻します。

  3. Replicatのパフォーマンスは、プライマリGGHubがターゲット・データベースと同じデータ・センターにないと低下します。ACFSレプリケーション・スイッチオーバーによるGGHubスイッチオーバーをスケジュールして、ターゲット・データベースに対する最適なReplicatパフォーマンスを再開します。