フェイルオーバーおよびフェイルバック動作の検証
VMware vSANストレッチ・クラスタを構成したら、フェイルオーバー・ワークフローとフェイルバック・ワークフローの両方を検証して、ビジネス継続性とディザスタ・リカバリの準備を整えることが不可欠です。この項では、プライマリ・サイトでの障害をシミュレートし、セカンダリ・サイトからのリカバリをテストするステップと、プライマリ・サイトへのサービスのリストアについて概説します。
フェイルオーバー・イベントのシミュレート
プライマリ・リージョンの障害をシミュレートするには:
- プライマリ・リージョン・ホストの電源切断
- OCIコンソールを使用して、プライマリ・リージョン内のすべてのVMware ESXiホストを強制的に電源切断します。
- セカンダリ・サイトでのHAリカバリの確認
- セカンダリ・リージョンの要塞VMから、VMware ESXiホストの1つに接続します。
- 管理およびワークロードのVMが、VMware vSphere HAを介して自動的に電源投入されることを確認します。
- ネットワーク・ルーティングの更新
- プライマリ・リージョンのDRGから
VCN-MGMT-Active
をデタッチします。 VCN-MGMT-Failover
をセカンダリ・リージョンのDRGにアタッチします。
- プライマリ・リージョンのDRGから
VCN-MGMT-Failover
のルート表の変更- 次の宛先トラフィックを指すようにルート表を更新します。
10.16.0.0/16
(プライマリVCN)10.17.0.0/16
(セカンダリVCN)172.30.0.0/16
(オーバーレイ・ネットワークまたは外部リソース)- セカンダリ・リージョンのDRGに向かって進みます。
- 次の宛先トラフィックを指すようにルート表を更新します。
- 接続の検証
- ネットワーク・アナライザまたは同様の診断ツールを使用して、vSphereコンポーネントへの到達可能性を検証します。
- vCenterが動作していることを確認し、プライマリ・リージョン・ホストが使用不可として表示されます。
- テスト用仮想マシンを使用して、東西(サイト内)および北南(外部)接続を検証します。
- セカンダリ・リージョンのNAT Gatewayを介して、インターネット・アクセスが期待どおりに機能することを確認します。
最適化されたルーティングと構成により、障害検出から15分以内に仮想マシンをリカバリして動作させることができます。通常、ネットワーキングの更新と確認は5分以内に完了します。
フェイルバックの実行
プライマリ・リージョンがリストアされて操作可能になったら、次のステップに従ってサービスを元の状態に戻します。
- プライマリホストを復元してリブートする
- 以前に停止したVMware ESXiホストの電源を入れます。
- オンラインになったら、OCIコンソールを介して完全再起動を実行するか、
services.sh
を使用してSSH経由でシステム・サービスを手動で再起動して安定性を確保します。
- vMotionプライマリ・ホストに仮想マシンを戻す
- セカンダリ・リージョン・ホストからプライマリ・リージョン・ホストにすべてのワークロードおよび管理仮想マシンを移行します。
ノート:
この段階では、未調整のルーティングが原因で、仮想マシンが一時的にネットワークを切断する可能性があります。
- セカンダリ・リージョン・ホストからプライマリ・リージョン・ホストにすべてのワークロードおよび管理仮想マシンを移行します。
- ネットワークルーティングの再構成
- セカンダリ・リージョンのDRGから
VCN-MGMT-Failover
をデタッチします。 - プライマリ・リージョンのDRGに
VCN-MGMT-Active
を再アタッチします。 - 既存エントリが以前の構成から有効なままであるため、ルート表の変更は必要ありません。
- セカンダリ・リージョンのDRGから
- 操作ステータスの確認
- プライマリ・リージョンの要塞からVMおよびサービス到達可能性を検証します。
- HA、vMotion、および VMware vSAN操作が期待どおりに再開されていることを確認します。
- これで、すべてのルートおよびポリシーにフェイルオーバー前の状態が反映されます。
これで、フェイルオーバーおよびフェイルバック・シナリオの正常なシミュレーションを含む、OCI専用リージョン全体のVMware vSANストレッチ・クラスタの構成および検証が完了します。