Sun Cluster HA for SAP 障害検証 (アプリケーションサーバー) (Sun Cluster 3.0 5/02 補足情報)

Sun Cluster 3.0 5/02 補足情報

Sun Cluster HA for SAP 障害検証 (アプリケーションサーバー)

アプリケーションサーバーの障害検証では次の手順を実行します。

主ディスパッチャのプロセス ID を取得します。
無限にループします (Thorough_probe_interval の間スリープ)。
SAP リソースの状態を検査します。
1. 異常終了 - Process Monitor Facility (PMF) が SAP プロセスツリーの障害を検出すると、障害モニターはこの問題を全面的な障害とみなします。障害モニターは、SAP リソースの障害履歴に基づいて、このリソースを再起動するか、別のノードにフェイルオーバーします。
2. プローブによる SAP リソースの状態チェック - プローブでは、ps(1) コマンドを使って、SAP Message Server と主ディスパッチャのプロセスを検査します。SAP の主ディスパッチャプロセスがシステムのアクティブプロセスリストにないと、障害モニターはこの問題を全面的な障害とみなします。
3. 検証によるデータベース接続の状態 - 検証では、SAP 提供の R3trans ユーティリティを使ってデータベース接続の状態を検査します。Sun Cluster HA for SAP の障害検証では、SAP がそのデータベースに接続できるかどうかが検査されます。しかし、Sun Cluster HA for SAP は、高可用性データベース障害検証を通してデータベースの状態を検査する必要があります。障害モニターは、データベース接続状態の検査に失敗すると、Database might be down というメッセージを syslog に書き込み、SAP リソースの状態に DEGRADED を設定します。この後のデータベース状態の検査で接続が確立されていると、障害モニターは、Database is up というメッセージを syslog に書き込み、SAP リソースのステータスに OK を設定します。
障害履歴を評価します。

障害モニターは、障害履歴に基づいて次のいずれかのアクションを行います。
- アクションなし
- ローカル再起動
- フェイルオーバー
  
  そのアプリケーションサーバーリソースがフェイルオーバーリソースであれば、障害モニターはアプリケーションサーバーをフェイルオーバーします。
  
  アプリケーションサーバーリソースがスケーラブルリソースの場合は、RGM が一定回数のローカル再起動を試みた後で、クラスタに別のノードがあればそのノードでアプリケーションサーバーを起動します。