フェイルオーバーおよびフェイルバック動作の検証

VMware vSANストレッチ・クラスタを構成したら、フェイルオーバー・ワークフローとフェイルバック・ワークフローの両方を検証して、ビジネス継続性とディザスタ・リカバリの準備を整えることが不可欠です。この項では、プライマリ・サイトでの障害をシミュレートし、セカンダリ・サイトからのリカバリをテストするステップと、プライマリ・サイトへのサービスのリストアについて概説します。

フェイルオーバー・イベントのシミュレート

プライマリ・リージョンの障害をシミュレートするには:

  1. プライマリ・リージョン・ホストの電源切断
    • OCIコンソールを使用して、プライマリ・リージョン内のすべてのVMware ESXiホストを強制的に電源切断します。
  2. セカンダリ・サイトでのHAリカバリの確認
    • セカンダリ・リージョンの要塞VMから、VMware ESXiホストの1つに接続します。
    • 管理およびワークロードのVMが、VMware vSphere HAを介して自動的に電源投入されることを確認します。
  3. ネットワーク・ルーティングの更新
    • プライマリ・リージョンのDRGからVCN-MGMT-Activeをデタッチします。
    • VCN-MGMT-Failoverをセカンダリ・リージョンのDRGにアタッチします。
  4. VCN-MGMT-Failoverのルート表の変更
    • 次の宛先トラフィックを指すようにルート表を更新します。
      • 10.16.0.0/16 (プライマリVCN)
      • 10.17.0.0/16 (セカンダリVCN)
      • 172.30.0.0/16 (オーバーレイ・ネットワークまたは外部リソース)
      • セカンダリ・リージョンのDRGに向かって進みます。
  5. 接続の検証
    • ネットワーク・アナライザまたは同様の診断ツールを使用して、vSphereコンポーネントへの到達可能性を検証します。
    • vCenterが動作していることを確認し、プライマリ・リージョン・ホストが使用不可として表示されます。
    • テスト用仮想マシンを使用して、東西(サイト内)および北南(外部)接続を検証します。
    • セカンダリ・リージョンのNAT Gatewayを介して、インターネット・アクセスが期待どおりに機能することを確認します。

    最適化されたルーティングと構成により、障害検出から15分以内に仮想マシンをリカバリして動作させることができます。通常、ネットワーキングの更新と確認は5分以内に完了します。

フェイルバックの実行

プライマリ・リージョンがリストアされて操作可能になったら、次のステップに従ってサービスを元の状態に戻します。

  1. プライマリホストを復元してリブートする
    • 以前に停止したVMware ESXiホストの電源を入れます。
    • オンラインになったら、OCIコンソールを介して完全再起動を実行するか、services.shを使用してSSH経由でシステム・サービスを手動で再起動して安定性を確保します。
  2. vMotionプライマリ・ホストに仮想マシンを戻す
    • セカンダリ・リージョン・ホストからプライマリ・リージョン・ホストにすべてのワークロードおよび管理仮想マシンを移行します。

      ノート:

      この段階では、未調整のルーティングが原因で、仮想マシンが一時的にネットワークを切断する可能性があります。
  3. ネットワークルーティングの再構成
    • セカンダリ・リージョンのDRGからVCN-MGMT-Failoverをデタッチします。
    • プライマリ・リージョンのDRGにVCN-MGMT-Activeを再アタッチします。
    • 既存エントリが以前の構成から有効なままであるため、ルート表の変更は必要ありません。
  4. 操作ステータスの確認
    • プライマリ・リージョンの要塞からVMおよびサービス到達可能性を検証します。
    • HA、vMotion、および VMware vSAN操作が期待どおりに再開されていることを確認します。
    • これで、すべてのルートおよびポリシーにフェイルオーバー前の状態が反映されます。

これで、フェイルオーバーおよびフェイルバック・シナリオの正常なシミュレーションを含む、OCI専用リージョン全体のVMware vSANストレッチ・クラスタの構成および検証が完了します。