この節では、主クラスタまたはスタンバイクラスタで障害が検出される際に発生する内部プロセスについて説明します。
ある保護グループの主クラスタに障害が発生すると、パートナーシップのスタンバイクラスタがその障害を検出します。障害が発生するクラスタが複数のパートナーシップのメンバーである場合、障害の検出が複数発生する可能性があります。
保護グループ全体の状態が Unknown 状態に変化すると、次の動作が発生します。
ハートビート異常がパートナークラスタによって検出されます。
ハートビート喪失が一時的なものではないことと、主クラスタに障害が発生していることを確認するため、緊急モードでハートビートが有効になります。このデフォルトのタイムアウト間隔の間、つまり、ハートビート機構が主クラスタの状態を確認 (照会) しようと再試行している間、ハートビートは OK 状態のままです。Error 状態ではハートビートのプラグインだけが現れます。
ハートビートの Query_interval プロパティーを設定することにより、この照会間隔を設定します。設定した Query_interval が 4 回 (再試行 3 回と緊急モード検証 1 回) 経過してもハートビート異常が続く場合は、heartbeat-lost イベントが生成され、システムログに記録されます。デフォルトの照会間隔を指定する場合、緊急モードの再試行動作によって、ハートビート喪失通知は約 9 分間遅れる可能性があります。メッセージは、GUI と geoadm status コマンドの出力に表示されます。
ログについては、『Sun Cluster Geographic Edition のシステム管理』の「Sun Cluster Geographic Edition のログメッセージの表示」を参照してください。
ある保護グループのスタンバイクラスタに障害が発生すると、同じパートナーシップのクラスタがその障害を検出します。障害が発生したクラスタが複数のパートナーシップのメンバーである場合、障害の検出が複数発生する可能性があります。
障害の検出中、次のアクションが発生します。
ハートビート異常がパートナークラスタによって検出されます。
二次クラスタに障害が発生したことを確認するため、ハートビートが緊急モードでアクティブ化されます。
クラスタはメッセージを発行して管理者に通知します。障害が発生したクラスタがスタンバイクラスタとして動作しているすべての保護グループが検出されます。これらの保護グループは Unknown 状態に設定されています。