クラスタのテイクオーバーとフェイルバック

言語:

クラスタ化コントローラノードは、常に次の状態のいずれかになります。

表 13 クラスタの状態

状態	CLI/BUI の表示	説明
UNCONFIGURED	クラスタ化が構成されていません	まったくクラスタ化されていないシステムは、この状態になります。システムが設定中であるか、またはクラスタ設定タスクがまだ完了していません。
OWNER	アクティブ (テイクオーバーが完了しました)	クラスタ化が構成され、このノードでクラスタ内のすべてのシェアリソースが制御されます。クラスタ設定がユーザーインタフェースから完了した直後、およびそのピアに障害が発生したことが検出されたとき (テイクオーバー後など) に、システムはこの状態に移行します。管理者が手動でフェイルバック操作を実行するまで、この状態のままです。
STRIPPED	準備完了 (フェイルバックを待機中)	クラスタ化が構成され、このノードではシェアリソースが制御されません。クラスタ設定がほかのノードのユーザーインタフェースから完了した直後、またはリブート、電源切断、その他の障害が発生したあとに、システムは STRIPPED になります。管理者が手動でフェイルバック操作を実行するまで、ノードはこの状態のままです。
CLUSTERED	アクティブ	クラスタ化が構成され、両方のノードがリソース割り当てに応じてシェアリソースを所有しています。各ノードが ZFS プールを所有し、CLUSTERED 状態である場合、2 つのノードは「アクティブ/アクティブ」クラスタと一般に呼ばれる状態になります。
-	クラスタに再度参加しています...	アプライアンスは最近リブートされたか、内部障害が発生したあとにアプライアンス管理ソフトウェアが再起動しています。リソース状態は再同期化されています。
-	不明 (切断または再起動中)	ピアアプライアンスの電源が切られているかリブート中であるか、クラスタ相互接続リンクがすべて停止しているか、またはクラスタ化がまだ構成されていません。

これらの状態間の遷移は、2 つの操作 (テイクオーバーとフェイルバック) の一部として発生します。

テイクオーバーは常時発生する可能性があり、ピアの障害が検出されるたびに試みられます。クラスタ構成 CLI または BUI を使用して手動でトリガーすることもでき、これはテストのために役立つことがあります。最後に、テイクオーバーはコントローラがブートし、そのピアが存在しないことを検出すると発生します。これにより、通常は片方のコントローラで永続的に障害が発生したり、両方のコントローラが一時的に電源を喪失したりするときにサービスを再開できます。

フェイルバックは自動的には発生しません。障害が発生したコントローラが修復されブートされると、そのコントローラはクラスタに再度参加し (すべてのリソースのビュー、プロパティー、および所有権の再同期化)、管理者がフェイルバック操作を実行するまで待機を継続します。そのときまで、元の動作しているコントローラはすべてのサービスの提供を継続します。これにより、コントローラが本番サービスに戻る前に、最初にテイクオーバーをトリガーした問題の詳細な調査、新規ソフトウェアリビジョンの検証、またはその他の管理タスクを実行できます。フェイルバックはクライアントに大きな影響を与えるため、業務固有の要件およびプロセスに応じてスケジュールするようにしてください。例外が 1 つあります。コントローラ A に障害が発生して、コントローラ B がテイクオーバーしたと想定します。コントローラ A がクラスタに再度参加すると、コントローラ B が存在しないか、障害が発生したことが検出された場合にテイクオーバーの対象になります。原則として、元の問題を調査する機会がない場合でも、サービスを提供しないよりは提供する方が適切です。したがって、以前に障害が発生したコントローラへのフェイルバックは自動的には発生しませんが、テイクオーバーはいつでも実行できます。

クラスタを設定すると、初期状態は設定を OWNER 状態で開始したノードと、STRIPPED 状態のその他のノードで構成されます。初期フェイルバック操作を実行して、STRIPPED ノードにシェアリソースのその部分を渡すと、両方のノードが CLUSTERED 状態になります。両方のクラスタノードに障害が発生するか、電源が切られると、同時起動時にノードが調停され、一方が OWNER 状態になり、他方が STRIPPED 状態になります。

フェイルバック中に、すべての外部リソース (ピアに割り当てられたリソース) がエクスポートされ、そのピアによってインポートされます。障害が発生したためにインポートできないプールでは、STRIPPED ノードのリブートがトリガーされます。障害が発生したプールでフェイルバックを試みると、インポート失敗の結果として STRIPPED ノードがリブートする可能性があります。

サービスの停止時間を最小限に抑えるため、フェイルバックとテイクオーバーの操作中は統計およびデータセットを使用できません。データの収集は行われず、統計を一時停止または再開する試みは、フェイルバックとテイクオーバーの操作が完了してデータの収集が自動的に再開されるまで、すべて遅延されます。

関連トピック

クラスタ構成のシャットダウン (CLI)