Sun Cluster Data Service for SAP liveCache ガイド (Solaris OS 版)

Sun Cluster HA for SAP liveCache 障害モニターの概要

この情報は、Sun Cluster HA for SAP liveCache の障害モニターを理解するうえで役立ちます。 ここでは、Sun Cluster HA for SAP liveCache 障害モニターの検証アルゴリズムまたは機能について説明し、検証エラーに関連する条件、メッセージ、回復アクション、さらに正常な検証に関連する条件とメッセージを示します。

拡張プロパティ

Sun Cluster HA for SAP liveCache 障害モニターで使用する拡張プロパティについては、Sun Cluster HA for SAP liveCache の拡張プロパティ を参照してください。

Monitor_check メソッド

liveCache リソースの Monitor_check メソッドは、そのノードで SAP xserver を使用できるかどうかを調べます。 そのノードで SAP xserver を使用できない場合、メソッドがエラーを返し、このノードへの liveCache のフェイルオーバーを拒否します。

SAP xserver と liveCache の間で、相互参照グループリソースの依存関係を確立するには、このメソッドが必要です。

検証アルゴリズムと機能

Sun Cluster HA for SAP liveCache にはリソースタイプごとに 1 つずつ障害モニターがあります。

SAP xserver の障害モニター

SAP xserver の親プロセスは、プロセスモニター pmfadm によって制御されます。 親プロセスが停止または終了されると、プロセスモニターが SAP xserver 障害モニターに伝え、SAP xserver 障害モニターが実行するアクションを決定します。

SAP xserver 障害モニターは次の手順をループで実行します。

  1. Thorough_probe_interval の間、休止します。

  2. SAP ユーティリティーdbmcli db_enum と組み合わせて使用し、SAP xserver の可用性を調べます。

    • SAP xserver が使用できない場合、SAP xserver 検証は SAP xserver リソースを再起動します。 最大再起動回数に達すると、SAP xserver 監視モニターは、SAP xserver を使用できない SAP xserver リソースをオフラインにします。

    • チェックプロセスの間にシステムエラーメッセージが syslog に書き込まれると、SAP xserver プローブは部分障害が発生したとみなします。 probe_interval の間に、システムエラーメッセージが 4 回にわたってsyslog に書き込まれると、SAP xserver プローブは SAP xserver を再起動します。

liveCache の障害モニター

liveCache プローブが liveCache 親プロセスの有無、liveCache データベースの状態、さらにユーザーが Sun Cluster ソフトウェアの外部で liveCache を意図的に停止したかどうかを調べます。 ユーザーが LC10 の Stop liveCache ボタンまたは lcinit コマンドを使用して、Sun Cluster ソフトウェアの外部で liveCache を停止した場合、liveCache プローブはユーザーが Sun Cluster ソフトウェアの外部で liveCache を意図的に停止したものとみなします。

ユーザーが LC10 の Stop liveCache ボタンまたは lcinit を使用することによって、Sun Cluster ソフトウェアの外部で liveCache を意図的に停止した場合は、Sun Cluster HA for SAP liveCache 障害モニターがこのアクションが反映されるようにリソースの状態と状態メッセージを更新します。liveCache の再起動は行われません。 ユーザーが LC10 の Start liveCache ボタンまたは lcinit コマンドを使用することによって、Sun Cluster ソフトウェアの外部で liveCache を正常に再起動した場合、Sun Cluster HA for SAP liveCache 障害モニターはリソースの状態と状態メッセージを更新して、liveCache が Sun Cluster ソフトウェアの制御下で動作していることを示します。また、 liveCache が OFFLINE であることが検出された場合は、Sun Cluster HA for SAP liveCache 障害モニターが適切なアクションを実行します。

liveCache データベースの状態から、liveCache が動作していない、または liveCache の親プロセスが打ちきられたことがわかると、Sun Cluster HA for SAP liveCache 障害モニターが liveCache を再起動するか、またはフェイルオーバーします。

Sun Cluster HA for SAP liveCache 障害モニターは次の手順をループで実行します。 いずれかの手順で「liveCache is offline」が戻ると、liveCache プローブは liveCache を再起動するか、またはフェイルオーバーします。

  1. Thorough_probe_interval の間、休止します。

  2. dbmcli ユーティリティーを db_stateと組み合わせて使用し、liveCache データベースの状態を調べます。

  3. liveCache がオンラインの場合、liveCache プローブはliveCache の親プロセスを調べます。

    • 親プロセスが終了すると、liveCache プローブは「liveCache is offline」を戻します。

    • 親プロセスがオンラインの場合、liveCache プローブは「OK」を戻します。

  4. liveCache がオンラインではない場合、liveCache プローブはユーザーが LC10 の Stop liveCache ボタンまたは lcinit コマンドを使用することによって、liveCache を Sun Cluster ソフトウェアの外部で停止したかどうかを判別します。

  5. ユーザーが LC10 の Stop liveCache ボタンまたは lcinit コマンドを使用して、Sun Cluster ソフトウェアの外部で liveCache を停止した場合は、「OK 」を戻します。

  6. ユーザーが LC10 のStop liveCache ボタンまたは lcinit コマンドを使用して、Sun Cluster ソフトウェアの外部で liveCache を停止していない場合は、SAP xserver の可用性を調べます。

    • SAP xserver が使用できない場合は、「OK 」を戻します。SAP xserver が使用できないと、プローブは liveCache を再起動できないからです。

    • SAP xserver を使用できる場合は、「liveCache is offline」を戻します。

  7. システムファンクションコールからエラーが伝えられた場合は、「 system failure」を戻します。