機械翻訳について

障害時リカバリ

ディザスタ・リカバリの目的は、インストール・サイトのレベルで高可用性を提供し、Private Cloud Applianceでホストされているクリティカルなワークロードを停止およびデータ損失から保護することです。 実装には、異なるサイトに2つのPrivate Cloud Applianceシステムをインストールし、Oracle Site Guardを使用してOracle Enterprise Managerインストールを実行する3番目のシステムが必要です。

2つのPrivate Cloud Applianceシステムはどちらも完全に動作する環境ですが、同時に相互のレプリカとして構成されます。 2つのピアZFS Storage Appliance間の専用ネットワーク接続 - 各ラックに1つ - 5分間隔で信頼性の高いデータ・レプリケーションを実現します。 いずれかの環境でインシデントが検出された場合、Oracle Site Guardのロールは、操作計画と呼ばれるフェイルオーバー・ワークフローを実行することです。

障害リカバリの設定は、アプライアンス管理者またはOracleエンジニアの責任です。 関連するすべてのシステムを相互接続し、両方のPrivate Cloud ApplianceシステムでOracle Site Guard操作計画およびレプリケーション設定を構成します。 管理者は、2つのアプライアンスの「サービスCLI」を使用して「DR構成」を作成および管理することによって、障害リカバリ制御下にあるワークロードおよびリソースを決定します。

DR構成はコア要素です。 管理者は、重要なコンピュート・インスタンスをサイトレベルのインシデントから保護できるように、DR構成に追加します。 ストレージおよびネットワーク接続情報は、DR構成に含まれる各インスタンスに対して収集および格納されます。 DR構成を作成すると、ピアZFS Storage Applianceへのレプリケーション用に専用のZFSプロジェクトが設定され、関連するコンピュート・インスタンス・リソースがデフォルトのストレージ・ロケーションからこの新しいZFSプロジェクトに移動されます。 DR構成はいつでもリフレッシュして、含まれているインスタンスに対して発生した可能性のある変更を取得できます。

次に、サイト・マッピングの詳細がDR構成に追加されます。 関連するすべてのコンパートメントおよびサブネットは、レプリカ・システム上の対応するコンパートメントにマップする必要があります。 DR構成は、コンパートメント階層とネットワーク構成が両方のPrivate Cloud Applianceシステムに存在しないかぎり機能しません。

インシデントが発生すると、フェイルオーバー操作が起動され、レプリカ・システムの障害時リカバリ制御下にインスタンスが起動されます。 このフェイルオーバーは粒度ではなく、次のステップを含むサイト全体のプロセスです:

  1. サイト・レベルのインシデントにより、実行中のインスタンスが突然失敗します。 正常に停止することはできません。

  2. プライマリおよびレプリカZFS Storage Applianceのロールを元に戻します。

  3. プライマリ・システムの影響を受けるコンピュート・インスタンスをレプリカ・システムで起動することでリカバリします。

  4. プライマリ・システムのクリーン・アップ: 停止したインスタンスの削除、凍結されたDR構成など。

  5. ZFSプロジェクトおよびインスタンス・メタデータに基づいて、リバースDR構成を設定します。

フェイルオーバーは、中断を伴うインシデントがインストール・サイトの1つで検出される結果です。 ただし、Oracle Site Guardではスイッチオーバーもサポートされており、これは事実上同じプロセスですが、管理者によって手動でトリガーされます。 制御されたスイッチオーバー・シナリオでは、データの損失や破損を回避するために、プライマリ・システムで実行中のインスタンスを安全に停止することがプロセスの最初のステップです。 スイッチオーバーは通常、計画メンテナンスまたはテストに使用されます。 フェイルオーバーまたはスイッチオーバーの後、両方のサイトが完全に動作している場合は、2つのPrivate Cloud Applianceシステムを元の構成に戻すためにフェイルバックが実行されます。