Sun Cluster HA for SAP 障害検証 (アプリケーションサーバー) (Sun Cluster 3.1 データサービスのインストールと構成)

Sun Cluster 3.1 データサービスのインストールと構成

Sun Cluster HA for SAP 障害検証 (アプリケーションサーバー)

アプリケーションサーバーの障害検証では次の手順を実行します。

主ディスパッチャのプロセス ID を取得します。
無限にループします (Thorough_probe_interval の間スリープ)。
SAP リソースの可用性を検査します。
1. 異常終了 – Process Monitor Facility (PMF) が SAP プロセスツリーの障害を検出すると、障害モニターはこの問題を全面的な障害とみなします。障害モニターは、SAP リソースの障害履歴に基づいて、このリソースを再起動するか、別のノードにフェイルオーバーします。
2. 検証機能による SAP リソースの可用性検査 – 検証機能は、ps(1) コマンドを使って SAP メッセージサーバーと主ディスパッチャのプロセスを検査します。SAP の主ディスパッチャプロセスがシステムのアクティブプロセスリストにないと、障害モニターはこの問題を全面的な障害とみなします。
3. 検証によるデータベース接続の状態 – 検証では、SAP 提供の R3trans ユーティリティを使ってデータベース接続の状態を検査します。Sun Cluster HA for SAP の障害検証では、SAP がそのデータベースに接続できるかどうかが検査されます。ただし、Sun Cluster HA for SAP は、高可用性なデータベースの障害検証に基づいて、データベースの可用性を判断します。データベース接続の状態検査で異常が検出されると、障害モニターは Database might be down というメッセージを /var/adm/messages に書き込み、SAP リソースの状態を DEGRADED に設定します。この後のデータベースの状態検査で接続が確立されると、障害モニターは Database is up というメッセージを /var/adm/messages に書き込みます。SAP リソースのステータスに OK を設定します。
障害履歴を調べます。

障害モニターは、障害履歴に基づいて次のいずれかのアクションを行います。
- アクションなし
- ローカル再起動
- フェイルオーバー
  
  そのアプリケーションサーバーリソースがフェイルオーバーリソースであれば、障害モニターはアプリケーションサーバーをフェイルオーバーします。
  
  アプリケーションサーバーリソースがスケーラブルリソースの場合は、RGM が一定回数のローカル再起動を試みた後で、クラスタに別のノードがあればそのノードでアプリケーションサーバーを起動します。