この節では、Sun Cluster HA for Oracle Application Server 障害モニターのプローブアルゴリズムや機能について説明します。
障害モニターの概念については、『Sun Cluster 3.1 の概念』を参照してください。
Sun Cluster HA for Oracle Application Server 障害モニターでは、リソースタイプ SUNW.gds と同じリソースプロパティーを使用します。使用するリソースプロパティーの全リストについては、SUNW.gds(5) のマニュアルページを参照してください。
Oracle Internet Directory Monitor (OIDMON)
この手順は、Oracle 9iAS Infrastructure の場合だけ行われます。
Thorough_probe_interval の間、休止します。
OIDMON プロセスが動作しているか検査します。動作していない場合は、OIDMON リソースを再起動します。
OIDMON リソースが繰り返し再起動され、最終的に Retry_interval の Retry_count を使い果たすと、別のノードでそのリソースグループのフェイルオーバーが開始されます。
Oracle Internet Directory Process (OIDLDAP)
この手順は、Oracle 9iAS Infrastructure の場合だけ行われます。
Thorough_probe_interval の間、休止します。
$ORACLE_HOME/bin/ldapsearch を実行して、ディレクトリサービスが使用可能か検査します。使用可能でない場合、検証モニターは「半分の障害」を発行します (通常は、Oracle Internet Directory Monitor (OIDMON) プロセスが Oracle Internet Directory Process (OIDLDAP) を再起動するからです)。さらに、次の検証サイクルで再びディレクトリサービスが使用可能でないと、検証モニターは別の「半分の障害」を発行します。2 つの「半分の障害」が連続して起こった場合には、検証モニターは OIDLDAP リソースを再起動します。
OIDLDAP リソースが繰り返し再起動され、最終的に Retry_interval の Retry_count を使い果たすと、別のノードでそのリソースグループのフェイルオーバーが開始されます。ただし、実際には、検査の失敗のたびに「半分の障害」を発行するのは OIDLDAP 検証であり、OIDLDAP プロセスを再起動する責任は通常 OIDMON プロセスにあるため、フェイルオーバーが行われる可能性は非常に低くなります。
Oracle Process Management and Notification (OPMN)
Thorough_probe_interval の間、休止します。
OPMN プロセスが動作しているか検査します。動作していない場合は、OPMN リソースを再起動します。
Oracle 9iAS の場合、$ORACLE_HOME/dcm/bin/dcmctl getstate -v によって報告された各管理対象 OPMN コンポーネントが Up 状態であるかテストします。UP 状態でない場合、検証モニターは OPMN コンポーネントを (再) 起動しようとします。ただし、実際には、これらのコンポーネントを再起動する責任は OPMN プロセスにあります。OPMN 検証モニターが OPMN コンポーネントを (再) 起動しようとしたら、すでに OPMN プロセスが同じ OPMN コンポーネントを起動しようとしていた場合、後の (再) 起動は無視されます。
Oracle 10g AS の場合、$ORACLE_HOME/opmn/bin/opmnctl status により、OPMN が動作しているかをテストします。動作していないと、検証モニターはエラーを報告し、再起動を要求します。
OPMN リソースが繰り返し再起動され、最終的に Retry_interval の Retry_count を使い果たすと、別のノードでそのリソースグループのフェイルオーバーが開始されます。