クラスタ化コントローラノードは、常に次の状態のいずれかになります。
|
これらの状態間の遷移は、2 つの操作 (テイクオーバーとフェイルバック) の一部として発生します。
テイクオーバーは常時発生する可能性があり、ピアの障害が検出されるたびに試みられます。クラスタ構成 CLI または BUI を使用して手動でトリガーすることもでき、これはテストのために役立つことがあります。最後に、テイクオーバーはコントローラがブートし、そのピアが存在しないことを検出すると発生します。これにより、通常は片方のコントローラで永続的に障害が発生したり、両方のコントローラが一時的に電源を喪失したりするときにサービスを再開できます。
フェイルバックは自動的には発生しません。障害が発生したコントローラが修復されブートされると、そのコントローラはクラスタに再度参加し (すべてのリソースのビュー、プロパティー、および所有権の再同期化)、管理者がフェイルバック操作を実行するまで待機を継続します。そのときまで、元の動作しているコントローラはすべてのサービスの提供を継続します。これにより、コントローラが本番サービスに戻る前に、最初にテイクオーバーをトリガーした問題の詳細な調査、新規ソフトウェアリビジョンの検証、またはその他の管理タスクを実行できます。フェイルバックはクライアントに大きな影響を与えるため、業務固有の要件およびプロセスに応じてスケジュールするようにしてください。例外が 1 つあります。コントローラ A に障害が発生して、コントローラ B がテイクオーバーしたと想定します。コントローラ A がクラスタに再度参加すると、コントローラ B が存在しないか、障害が発生したことが検出された場合にテイクオーバーの対象になります。原則として、元の問題を調査する機会がない場合でも、サービスを提供しないよりは提供する方が適切です。したがって、以前に障害が発生したコントローラへのフェイルバックは自動的には発生しませんが、テイクオーバーはいつでも実行できます。
クラスタを設定すると、初期状態は設定を OWNER 状態で開始したノードと、STRIPPED 状態のその他のノードで構成されます。初期フェイルバック操作を実行して、STRIPPED ノードにシェアリソースのその部分を渡すと、両方のノードが CLUSTERED 状態になります。両方のクラスタノードに障害が発生するか、電源が切られると、同時起動時にノードが調停され、一方が OWNER 状態になり、他方が STRIPPED 状態になります。
フェイルバック中に、すべての外部リソース (ピアに割り当てられたリソース) がエクスポートされ、そのピアによってインポートされます。障害が発生したためにインポートできないプールでは、STRIPPED ノードのリブートがトリガーされます。障害が発生したプールでフェイルバックを試みると、インポート失敗の結果として STRIPPED ノードがリブートする可能性があります。
サービスの停止時間を最小限に抑えるため、フェイルバックとテイクオーバーの操作中は統計およびデータセットを使用できません。データの収集は行われず、統計を一時停止または再開する試みは、フェイルバックとテイクオーバーの操作が完了してデータの収集が自動的に再開されるまで、すべて遅延されます。
関連トピック