Sun Cluster Data Service for Oracle Application Server ガイド (Solaris OS 版)

Sun Cluster HA for Oracle Application Server 障害モニターの概要

この節では、Sun Cluster HA for Oracle Application Server 障害モニターのプローブアルゴリズムや機能について説明します。

障害モニターの概念については、『Sun Cluster 3.1 の概念』を参照してください。

リソースプロパティー

Sun Cluster HA for Oracle Application Server 障害モニターでは、リソースタイプ SUNW.gds と同じリソースプロパティーを使用します。使用するリソースプロパティーの全リストについては、SUNW.gds(5) のマニュアルページを参照してください。

検証アルゴリズムと機能

Oracle Internet Directory Monitor (OIDMON)

注 –
この手順は、Oracle 9iAS Infrastructure の場合だけ行われます。
- Thorough_probe_interval の間、休止します。
- OIDMON プロセスが動作しているか検査します。動作していない場合は、OIDMON リソースを再起動します。
- OIDMON リソースが繰り返し再起動され、最終的に Retry_interval の Retry_count を使い果たすと、別のノードでそのリソースグループのフェイルオーバーが開始されます。

Oracle Internet Directory Process (OIDLDAP)

注 –
この手順は、Oracle 9iAS Infrastructure の場合だけ行われます。
- Thorough_probe_interval の間、休止します。
- $ORACLE_HOME/bin/ldapsearch を実行して、ディレクトリサービスが使用可能か検査します。使用可能でない場合、検証モニターは「半分の障害」を発行します (通常は、Oracle Internet Directory Monitor (OIDMON) プロセスが Oracle Internet Directory Process (OIDLDAP) を再起動するからです)。さらに、次の検証サイクルで再びディレクトリサービスが使用可能でないと、検証モニターは別の「半分の障害」を発行します。2 つの「半分の障害」が連続して起こった場合には、検証モニターは OIDLDAP リソースを再起動します。
- OIDLDAP リソースが繰り返し再起動され、最終的に Retry_interval の Retry_count を使い果たすと、別のノードでそのリソースグループのフェイルオーバーが開始されます。ただし、実際には、検査の失敗のたびに「半分の障害」を発行するのは OIDLDAP 検証であり、OIDLDAP プロセスを再起動する責任は通常 OIDMON プロセスにあるため、フェイルオーバーが行われる可能性は非常に低くなります。

Oracle Process Management and Notification (OPMN)
- Thorough_probe_interval の間、休止します。
- OPMN プロセスが動作しているか検査します。動作していない場合は、OPMN リソースを再起動します。
- Oracle 9iAS の場合、$ORACLE_HOME/dcm/bin/dcmctl getstate -v によって報告された各管理対象 OPMN コンポーネントが Up 状態であるかテストします。UP 状態でない場合、検証モニターは OPMN コンポーネントを (再) 起動しようとします。ただし、実際には、これらのコンポーネントを再起動する責任は OPMN プロセスにあります。OPMN 検証モニターが OPMN コンポーネントを (再) 起動しようとしたら、すでに OPMN プロセスが同じ OPMN コンポーネントを起動しようとしていた場合、後の (再) 起動は無視されます。
- Oracle 10g AS の場合、$ORACLE_HOME/opmn/bin/opmnctl status により、OPMN が動作しているかをテストします。動作していないと、検証モニターはエラーを報告し、再起動を要求します。
- OPMN リソースが繰り返し再起動され、最終的に Retry_interval の Retry_count を使い果たすと、別のノードでそのリソースグループのフェイルオーバーが開始されます。

Enterprise Manager (EM)
- Thorough_probe_interval の間、休止します。
- EM プロセスが動作しているか検査します。動作していない場合は、EM リソースを再起動します。
- EM ステータスが EMD is up and running であるか、テストします。動作していない場合は、EM リソースを再起動します。
- EM リソースが繰り返し再起動され、最終的に Retry_interval の Retry_count を使い果たすと、別のノードでそのリソースグループのフェイルオーバーが開始されます。