Sun Cluster 3.1 Data Service for SAP liveCache ガイド

検証アルゴリズムと機能

Sun Cluster HA for SAP liveCache には、リソースタイプ別の障害モニターがあります。

SAP xserver の障害モニター

SAP xserver の親プロセスは、プロセスモニター pmfadm によって制御されます。親プロセスが停止または終了すると、プロセスモニターがその事実を SAP xserver 障害モニターに伝え、実行すべきアクションを SAP xserver を障害モニターが決定します。

SAP xserver 障害モニターは次の手順をループで実行します。

  1. Thorough_probe_interval の間、休止します。

  2. SAP ユーティリティーdbmcli db_enum と組み合わせて使用し、SAP xserver の可用性を調べます。

    • SAP xserver を使用できない場合は、SAP xserver プローブが SAP xserver リソースを再起動する再起動の最大回数に達した場合は フェイルオーバーします。

    • チェックプロセスの間にシステムエラーメッセージが syslog に書き込まれると、SAP xserver プローブは部分障害が発生したとみなします。probe_interval の間に、システムエラーメッセージが 4 回にわたってsyslog に書き込まれると、SAP xserver プローブは SAP xserver を再起動します。

liveCache の障害モニター

liveCache プローブは、liveCache 親プロセスの有無、liveCache データベースの状態、さらにユーザーが Sun Cluster ソフトウェアの外部で liveCache を意図的に停止したかどうかを調べます。ユーザーが LC10 の Stop liveCache ボタンまたは lcinit コマンドを使用して、Sun Cluster ソフトウェアの外部で liveCache を停止した場合、liveCache プローブは、ユーザーが Sun Cluster ソフトウェアの外部で liveCache を意図的に停止したものとみなします。

ユーザーが LC10 の Stop liveCache ボタンまたは lcinit を使用することによって、Sun Cluster ソフトウェアの外部で liveCache を意図的に停止した場合は、このアクションが反映されるように Sun Cluster HA for SAP liveCache 障害モニターによってリソースの状態と状態メッセージが更新されます。liveCache の再起動は行われません。ユーザーが LC10 の Start liveCache ボタンまたは lcinit コマンドを使用することによって、Sun Cluster ソフトウェアの外部で liveCache を正常に再起動した場合、Sun Cluster HA for SAP liveCache 障害モニターによってリソースの状態と状態メッセージが更新され、liveCache が Sun Cluster ソフトウェアの制御下で動作していることが示されます。また、 liveCache が OFFLINE であることが検出された場合は、Sun Cluster HA for SAP liveCache 障害モニターによって適切なアクションが実行されます。

liveCache データベースの状態から、liveCache が動作していない、または liveCache の親プロセスが終了していることを認識すると、Sun Cluster HA for SAP liveCache 障害モニターは liveCache を再起動するか、フェイルオーバーします。

Sun Cluster HA for SAP liveCache 障害モニターは次の手順をループで実行します。手順のどれかで「liveCache is offline」が戻ると、liveCache プローブは liveCache を再起動するか、フェイルオーバーします。

  1. Thorough_probe_interval の間、休止します。

  2. dbmcli ユーティリティーを db_stateと組み合わせて使用し、liveCache データベースの状態を調べます。

  3. liveCache がオンラインの場合、liveCache プローブはliveCache の親プロセスを調べます。

    • 親プロセスが終了すると、liveCache プローブは「liveCache is offline」を戻します。

    • 親プロセスがオンラインの場合、liveCache プローブは「OK」を戻します。

  4. liveCache がオンラインではない場合、liveCache プローブはユーザーが LC10 の Stop liveCache ボタンまたは lcinit コマンドを使用することによって、liveCache を Sun Cluster ソフトウェアの外部で停止したかどうかを判別します。

  5. ユーザーが LC10 の Stop liveCache ボタンまたは lcinit コマンドを使用して、Sun Cluster ソフトウェアの外部で liveCache を停止した場合は、「OK 」を戻します。

  6. ユーザーが LC10 のStop liveCache ボタンまたは lcinit コマンドを使用して、Sun Cluster ソフトウェアの外部で liveCache を停止していない場合は、SAP xserver の可用性を調べます。

    • SAP xserver が使用できない場合は、「OK 」を戻します。SAP xserver が使用できないと、プローブは liveCache を再起動できないからです。

    • SAP xserver を使用できる場合は、「liveCache is offline」を戻します。

  7. システムファンクションコールからエラーが伝えられた場合は、「 system failure」を戻します。