Sun Cluster 3.1 Data Service for Sun ONE Message Queue ガイド

Sun Cluster HA for Sun ONE Message Queue 障害モニターの概要

ここで説明する情報は、Sun Cluster HA for Sun ONE Message Queue 障害モニターを理解する上で役立ちます。

拡張プロパティ

Sun Cluster HA for Sun ONE Message Queue 障害モニターでは、次の拡張プロパティを使用します。場合によっては、これらすべての拡張プロパティを有効にする必要があります。

表 1–3 Sun Cluster HA for Sun ONE Message Queue 拡張プロパティ

名前/データタイプ 

説明 

Smooth_shutdown

Smooth_shutdown 拡張プロパティでは、imqcmd コマンドを使用したスムーズシャットダウンの有効/無効を指定します。 Sun ONE Message Queue プロセスの終了前にスムーズシャットダウンを実行する方が望ましい場合は、この拡張プロパティに TRUE を設定します。この拡張プロパティの値が TRUE の場合は、$IMQ_VARHOME/instances/broker/scs1mqconfig にパスワードを設定する必要があります。

次に該当するとき、この拡張プロパティに TRUE を設定します。

  • SIGTERM を送信する代わりに imqcmd を使用してブローカをシャットダウンする場合。

  • エージェントのパスワードが imqcmd コマンド文字列に含まれていてもよい場合。

初期値: False

調整: 任意の時点 (Anytime)

検証アルゴリズムと機能

Sun Cluster HA for Sun ONE Message Queue の検証機能は、Sun ONE Message Queue サーバーに要求を送ることにより、その状態を照会します。検証機能は、次のことを行います。

  1. Sun ONE Message Queue インスタンスが、Probe_timeout リソースプロパティで設定されたタイムアウト値に従っていることを検証します。

  2. ネットワークリソース構成とリソースグループの Port_list 設定によって定義された IP アドレスとポートの組み合わせに接続します。正常に接続できた場合、検証はポートマッパー情報を読み取ります。最後に、検証の接続が切断されます。接続に失敗した部分があると、障害が記録されます。

    ネットワークトラフィックが多い場合、システムの負荷が高い場合、または構成ミスがあった場合は、照会に失敗することがあります。Sun ONE Message Queue サーバーが検証対象のすべての IP アドレスとポートの組み合わせで待機するように構成されていないと、構成ミスになります。Sun ONE Message Queue サーバーは、このリソースに指定したすべての IP アドレスのすべてのポートに対応するように構成します。

    検証が完全に失敗した場合は次のようになります。

    サーバーへの接続時に障害が発生すると、次のエラーメッセージが表示されます。%s はホスト名、%d はポート番号を表します。


    Failed to connect to the host <%s> and port <%d>.

  3. リソースプロパティ期間 Retry_interval 内に発生した部分的な障害は対策が必要な障害になるまで蓄積されます。

    次に示すのは、検証の部分的な障害です。

    • リソース %s のポート %d との接続を切断できない。


      Failed to disconnect from port %d of resource %s.

    • Probe_timeout の時間内にすべての検証手順を完了できない。

    • その他の原因でサーバーからデータを読み取れなかった場合は、次のエラーメッセージが表示されます。最初の %s はホスト名、%d はポート番号を表します。2 番目の %s はエラーの詳細です。


      Failed to communicate with server %s port %d: %s

異常履歴に基づいて、データサービスのローカルでの再起動、またはデータサービスのフェイルオーバーのいずれかが実行されます。