この情報は、Sun Cluster HA for WebSphere MQ 障害モニターを理解するうえで役立ちます。ここでは、Sun Cluster HA for WebSphere MQ 障害モニターの検証アルゴリズムまたは機能について説明し、検証エラーに関連する条件、メッセージ、回復アクションを示します。
障害モニターの概念については、『Sun Cluster 3.1 の概念』を参照してください。
Sun Cluster HA for WebSphere MQ 障害モニターでは、リソースタイプ SUNW.gds と同じリソースプロパティを使用します。 使用するリソースプロパティの全リストについては、SUNW.gds(5) のマニュアルページを参照してください。
WebSphere MQ Manager
Thorough_probe_interval の間、休止します。
Queue Manager に接続し、一時動的キューを作成し、メッセージをキューに格納し、そのうえで Queue Manager を切断します。これに失敗すると、検証により Queue Manager を再起動します。
すべての Queue Manager プロセスが無効な場合は、pmf が検証に割り込んでただちに Queue Manager を再起動します。
Queue Manager が繰り返し再起動され、最終的に Retry_interval の Retry_count を使い果たすと、別のノードでそのリソースグループのフェイルオーバーが開始されます。
その他の WebSphere MQ コンポーネント (chi、csv、および trm)
プローブアルゴリズムと機能の動作は、Channel Initiator、Command Server、Trigger Monitor のいずれでも同じです。したがって、以下の説明では、単にリソースでこれらのコンポーネントを表します。
Thorough_probe_interval の間、休止します。
Queue Manager に依存します。Queue Manager が失敗するとリソースも失敗します。Queue Manager が再び使用できるようになると、リソースが再起動されます。
リソースが停止すると、pmf が検証に割り込んでただちにプロセスを再起動します。
リソースが繰り返し再起動されて、 Retry_interval の Retry_count を使い果たしても、別のノードへのフェイルオーバーは開始されません。Failover_enabled=FALSE が設定されているからです。代わりに、リソースが再起動されます。ただし、この動作は今後拡張され、再起動する代わりに、リソースを Offline としてマーキングできるようになる予定です。
WebSphere MQ Listener
Thorough_probe_interval の間、休止します。
runmqlsr プロセスが Queue Manager と対応づけられており、なおかつポートが稼働しているかどうかを確認します。
リスナーは、同じ pmftag で複数のポート番号に対応できます。特定のポートに対応するリスナーが欠落していることが判明すると、検証によりそのリスナーの再起動が開始されます。他のリスナーは影響を受けません。
リソースは複数のリスナーに対応できますが、すべてのリスナーが失敗してからでなければ、リソースは再起動されません。したがって、複数のリスナーが動作しているリソースでも、再起動をきめ細かく制御できます。
リソースが繰り返し再起動されて、 Retry_interval の Retry_count を使い果たしても、別のノードへのフェイルオーバーは開始されません。Failover_enabled=FALSE が設定されているからです。代わりに、リソースが再起動されます。ただし、この動作は今後拡張され、再起動する代わりに、リソースを Offline としてマーキングできるようになる予定です。