Sun Cluster 3.1 データサービスのインストールと構成

Sun Cluster HA for SAP liveCache の障害モニターとは

この節の情報を使用して、Sun Cluster HA for SAP liveCache 障害モニターについて理解してください。この節では、Sun Cluster HA for SAP liveCache 障害モニターの検証アルゴリズム や機能性について説明します。また、検証に失敗した場合の状況、メッセージ、回復アクションに関する説明と、検証に成功した場合の状況およびメッセージについての説明も提供します。

拡張プロパティ

Sun Cluster HA for SAP liveCache が使用する拡張プロパティについては、Sun Cluster HA for SAP liveCache 拡張プロパティを参照してください。

モニター検査メソッド

liveCache リソースの Monitor_check メソッドは、SAP xserver がこのノード上で利用可能かどうかを検査します。SAP xserver がこのノード上で利用できない場合、このメソッドはエラーを返してこのノードへの liveCache のフェイルオーバーを拒否します。

このメソッドは、SAP xserver と liveCache 間の、リソースグループを横断するリソース依存を強制するために必要です。

アルゴリズムと機能性の検証

Sun Cluster HA for SAP liveCache には、リソースタイプ毎に障害モニターがあります。

SAP xserver 障害モニター

SAP xserver の親プロセスは、プロセスモニター pmfadm の制御下にあります。親プロセスが停止または強制終了した場合、プロセスモニターは SAP xserver 障害モニターに照会し、SAP xserver 障害モニターは取るべきアクションを判断します。

SAP xserver 障害モニターは、クラスタ内およびスケーラブルリソースグループ内の複数のノード上で動作します。SAP xserver 障害モニターは、次の手順を繰り返し実行します。

  1. Thorough_probe_interval の間、休止します。

  2. SAP ユーティリティーdbmclidb_enum を使用して SAP xserver の可用性を検査します。

    • SAP xserver が利用可能でない場合、SAP xserver の検証機能は SAP xserver リソースを再起動し、再起動の最大数に到達するとフェイルオーバーします。

    • 検査処理中にシステムエラーメッセージが syslog に書き込まれた場合、SAP xserver 検証機能は一部に失敗が生じたと判断します。probe_interval の処理中に、システムエラーメッセージの syslog への書き込みが 4 回発生した場合、SAP xserver 検証機能は SAP xserver を再起動します。

liveCache 障害モニター

liveCache 検証機能は、liveCache 親プロセスの存在、liveCache データベースの状態、およびユーザーによって liveCache が Sun Cluster ソフトウェアの外から 意図的に停止されたかどうかを検査します。ユーザーが Sun Cluster ソフトウェアの外から LC10 の「Stop liveCache」ボタンまたは lcinit コマンドを使用して liveCache を停止した場合、liveCache 検証機能は、ユーザーが Sun Cluster ソフトウェアの外から liveCache を意図的に停止したと判断します。

ユーザーが LC10 の「Stop liveCache」ボタンまたは lcinit コマンドを使用して Sun Cluster ソフトウェアの外から liveCache を意図的に停止した場合、Sun Cluster HA for SAP liveCache 障害モニターはこのアクションを反映してリソース状態と状態メッセージを更新しますが、liveCache は再起動しません。ユーザーが LC10 の「Start liveCache」ボタンまたは lcinit コマンドを使用して Sun Cluster ソフトウェアの外から正常に liveCache を起動した場合、Sun Cluster HA for SAP liveCache 障害モニターは liveCache が Sun Cluster ソフトウェアの制御下で動作していることを反映するようリソース状態と状態メッセージを更新します。また、Sun Cluster HA for SAP liveCache 障害モニターは、liveCache が OFFLINE であることを検知した場合に適切なアクションを取ります。

liveCache データベース状態によって、liveCache が動作していないか、liveCache 親プロセスの終了が報告された場合、Sun Cluster HA for SAP liveCache 障害モニターは liveCache を再起動するかまたは、フェイルオーバーします。

Sun Cluster HA for SAP liveCache 障害モニターは、次の手順を繰り返し実行します。任意の手順で liveCache is offline が返された場合、liveCache 検証機能は、liveCache を再起動するかフェイルオーバーします。

  1. Thorough_probe_interval の間、休止します。

  2. dbmcli ユーティリティーと db_state を使用して、liveCache データベース状態を検査します。

  3. liveCache がオンラインの場合、liveCache 検証機能は liveCache の親プロセスを検査します。

    • 親プロセスが終了している場合、liveCache 検証機能は liveCache is offline を返します。

    • 親プロセスがオンラインの場合、liveCache 検証機能は OK を返します。

  4. liveCache がオンラインでない場合、liveCache 検証機能は、ユーザーが LC10 の「Stop liveCache」ボタンまたは lcinit コマンドを使用して Sun Cluster ソフトウェアの外から liveCache を停止したかどうかを判断します。

  5. ユーザーが LC10 の「Stop liveCache」ボタンまたは lcinit コマンドを使用して Sun Cluster ソフトウェアの外から liveCache を停止した場合、OK が返されます。

  6. ユーザーが LC10 の「Stop liveCache」ボタンまたは lcinit コマンドを使用して Sun Cluster ソフトウェアの外から liveCache を停止していなかった場合、SAP xserver の可用性が検査されます。

    • SAP xserver が利用可能でない場合、OK が返されます。SAP xserver が利用可能でないと、検証機能は liveCache を再起動できないからです。

    • SAP xserver が利用可能な場合は、liveCache is offline が返されます。

  7. システム関数呼び出しからエラーが報告された場合は、system failure が返されます。