Sun Cluster 3.1 データサービス (WebSphere MQ 編)

Sun Cluster HA for WebSphere MQ 障害モニターの概要

この情報は、Sun Cluster HA for WebSphere MQ 障害モニターを理解するうえで役立ちます。ここでは、Sun Cluster HA for WebSphere MQ 障害モニターの検証アルゴリズムまたは機能について説明し、検証エラーに関連する条件、メッセージ、回復アクションを示します。

障害モニターの概念については、『Sun Cluster 3.1 の概念』を参照してください。

リソースプロパティ

Sun Cluster HA for WebSphere MQ 障害モニターでは、リソースタイプ SUNW.gds と同じリソースプロパティを使用します。使用するリソースプロパティの全リストについては、SUNW.gds(5) のマニュアルページを参照してください。

検証アルゴリズムと機能

WebSphere MQ Manager
- Thorough_probe_interval の間、休止します。
- Queue Manager に接続し、一時動的キューを作成し、メッセージをキューに格納し、そのうえで Queue Manager を切断します。これに失敗すると、検証により Queue Manager を再起動します。
- すべての Queue Manager プロセスが無効な場合は、pmf が検証に割り込んでただちに Queue Manager を再起動します。
- Queue Manager が繰り返し再起動され、最終的に Retry_interval の Retry_count を使い果たすと、別のノードでそのリソースグループのフェイルオーバーが開始されます。

その他の WebSphere MQ コンポーネント (chi、csv、および trm)

注 –
プローブアルゴリズムと機能の動作は、Channel Initiator、Command Server、Trigger Monitor のいずれでも同じです。したがって、以下の説明では、単にリソースでこれらのコンポーネントを表します。
- Thorough_probe_interval の間、休止します。
- Queue Manager に依存します。Queue Manager が失敗するとリソースも失敗します。Queue Manager が再び使用できるようになると、リソースが再起動されます。
- リソースが停止すると、pmf が検証に割り込んでただちにプロセスを再起動します。
- リソースが繰り返し再起動されて、 Retry_interval の Retry_count を使い果たしても、別のノードへのフェイルオーバーは開始されません。Failover_enabled=FALSE が設定されているからです。代わりに、リソースが再起動されます。ただし、この動作は今後拡張され、再起動する代わりに、リソースを Offline としてマーキングできるようになる予定です。

WebSphere MQ Listener
- Thorough_probe_interval の間、休止します。
- runmqlsr プロセスが Queue Manager と対応づけられており、なおかつポートが稼働しているかどうかを確認します。
- リスナーは、同じ pmftag で複数のポート番号に対応できます。特定のポートに対応するリスナーが欠落していることが判明すると、検証によりそのリスナーの再起動が開始されます。他のリスナーは影響を受けません。
  
  リソースは複数のリスナーに対応できますが、すべてのリスナーが失敗してからでなければ、リソースは再起動されません。したがって、複数のリスナーが動作しているリソースでも、再起動をきめ細かく制御できます。
- リソースが繰り返し再起動されて、 Retry_interval の Retry_count を使い果たしても、別のノードへのフェイルオーバーは開始されません。Failover_enabled=FALSE が設定されているからです。代わりに、リソースが再起動されます。ただし、この動作は今後拡張され、再起動する代わりに、リソースを Offline としてマーキングできるようになる予定です。