フェイルオーバーおよびフェイルバック動作の検証

VMware vSANストレッチ・クラスタを構成したら、フェイルオーバー・ワークフローとフェイルバック・ワークフローの両方を検証して、ビジネス継続性とディザスタ・リカバリの準備を整えることが不可欠です。この項では、プライマリ・サイトでの障害をシミュレートし、セカンダリ・サイトからのリカバリをテストするステップと、プライマリ・サイトへのサービスのリストアについて概説します。

フェイルオーバー・イベントのシミュレート

プライマリ・リージョンの障害をシミュレートするには:

プライマリ・リージョン・ホストの電源切断
- OCIコンソールを使用して、プライマリ・リージョン内のすべてのVMware ESXiホストを強制的に電源切断します。
セカンダリ・サイトでのHAリカバリの確認
- セカンダリ・リージョンの要塞VMから、VMware ESXiホストの1つに接続します。
- 管理およびワークロードのVMが、VMware vSphere HAを介して自動的に電源投入されることを確認します。
ネットワーク・ルーティングの更新
- プライマリ・リージョンのDRGからVCN-MGMT-Activeをデタッチします。
- VCN-MGMT-Failoverをセカンダリ・リージョンのDRGにアタッチします。
VCN-MGMT-Failoverのルート表の変更
- 次の宛先トラフィックを指すようにルート表を更新します。
  - 10.16.0.0/16 (プライマリVCN)
  - 10.17.0.0/16 (セカンダリVCN)
  - 172.30.0.0/16 (オーバーレイ・ネットワークまたは外部リソース)
  - セカンダリ・リージョンのDRGに向かって進みます。
接続の検証
- ネットワーク・アナライザまたは同様の診断ツールを使用して、vSphereコンポーネントへの到達可能性を検証します。
- vCenterが動作していることを確認し、プライマリ・リージョン・ホストが使用不可として表示されます。
- テスト用仮想マシンを使用して、東西(サイト内)および北南(外部)接続を検証します。
- セカンダリ・リージョンのNAT Gatewayを介して、インターネット・アクセスが期待どおりに機能することを確認します。
最適化されたルーティングと構成により、障害検出から15分以内に仮想マシンをリカバリして動作させることができます。通常、ネットワーキングの更新と確認は5分以内に完了します。

フェイルバックの実行

プライマリ・リージョンがリストアされて操作可能になったら、次のステップに従ってサービスを元の状態に戻します。

プライマリホストを復元してリブートする
- 以前に停止したVMware ESXiホストの電源を入れます。
- オンラインになったら、OCIコンソールを介して完全再起動を実行するか、services.shを使用してSSH経由でシステム・サービスを手動で再起動して安定性を確保します。
vMotionプライマリ・ホストに仮想マシンを戻す
- セカンダリ・リージョン・ホストからプライマリ・リージョン・ホストにすべてのワークロードおよび管理仮想マシンを移行します。
  
  ノート:
  この段階では、未調整のルーティングが原因で、仮想マシンが一時的にネットワークを切断する可能性があります。
ネットワークルーティングの再構成
- セカンダリ・リージョンのDRGからVCN-MGMT-Failoverをデタッチします。
- プライマリ・リージョンのDRGにVCN-MGMT-Activeを再アタッチします。
- 既存エントリが以前の構成から有効なままであるため、ルート表の変更は必要ありません。
操作ステータスの確認
- プライマリ・リージョンの要塞からVMおよびサービス到達可能性を検証します。
- HA、vMotion、および VMware vSAN操作が期待どおりに再開されていることを確認します。
- これで、すべてのルートおよびポリシーにフェイルオーバー前の状態が反映されます。

これで、フェイルオーバーおよびフェイルバック・シナリオの正常なシミュレーションを含む、OCI専用リージョン全体のVMware vSANストレッチ・クラスタの構成および検証が完了します。