この節では、Sun Cluster HA for Sun Java System Message Queue 障害モニターについて説明します。
Sun Cluster HA for Sun Java System Message Queue 障害モニターは、次の拡張プロパティを使用します。 次の拡張プロパティは調整できます。
表 1–3 Sun Cluster HA for Sun Java System Message Queue 拡張プロパティ
Sun Cluster HA for Sun Java System Message Queue の検証機能は、Sun Java System Message Queue サーバーに要求を送ることにより、その状態を照会します。 検証機能は、次の作業を行います。
Probe_timeout リソースプロパティで設定されたタイムアウト値に基づいて、Sun Java System Message Queue インスタンスを検証します。
ネットワークリソース構成とリソースグループの Port_list 設定によって定義された IP アドレスとポートの組に接続します。 正常に接続できた場合、検証はポートマッパー情報を読み取ります。 最後に、検証の接続が切断されます。 接続に失敗した部分があると、障害が記録されます。
大量のネットワークトラフィック、高システム負荷、構成の誤りは、問い合わせが失敗する原因になることがあります。 Sun Java System Message Queue サーバーが検証対象のすべての IP アドレスとポートの組み合わせで待機するように構成されていないと、構成ミスになります。 Sun Java System Message Queue サーバーは、このリソースに指定したすべての IP アドレスのすべてのポートに対応するように構成します。
検証が完全に失敗した場合は次のようになります。
サーバーとの接続に失敗すると、次のエラーメッセージが出されます。 %s はホスト名、%d はポート番号を表します。
Failed to connect to the host <%s> and port <%d>.
リソースプロパティ期間 Retry_interval 内に発生した部分的な障害は対策が必要な障害になるまで蓄積されます。
次に示すのは、検証の部分的な障害です。
リソース %s のポート %d との接続を切断できない。
Failed to disconnect from port %d of resource %s.
Probe_timeout の時間内にすべての検証手順を完了できない。
その他の理由でサーバーからデータを読み取ることができなかった場合は、次のエラーメッセージが出されます。 %s はホスト名、%d はポート番号を表します。 2 番めの %s はエラーの詳細を意味します。
Failed to communicate with server %s port %d: %s
異常履歴に基づいて、データサービスのローカルでの再起動、またはデータサービスのフェイルオーバーのいずれかを実行します。