Sun Cluster 3.1 Data Service for SAP ガイド

Sun Cluster HA for SAP の障害検証 (アプリケーションサーバー)

アプリケーションサーバーの場合、障害検証の手順は次のとおりです。

  1. 主ディスパッチャのプロセス ID を取得します。

  2. 無限にループします (Thorough_probe_interval の間スリープ)。

  3. SAP リソースの可用性を検査します。

    1. 異常終了 – Process Monitor Facility (PMF) が SAP プロセスツリーの障害を検出すると、障害モニターはこの問題を全面的な障害とみなします。障害モニターは、SAP リソースの障害履歴に基づいて、このリソースを再起動するか、別のノードにフェイルオーバーします。

    2. プローブによる SAP リソースの可用性チェック – プローブでは、ps(1) コマンドを使用して、SAP Message Server と主ディスパッチャのプロセスを検査します。SAP の主ディスパッチャプロセスがシステムのアクティブプロセスリストにないと、障害モニターはこの問題を全面的な障害とみなします。

    3. 検証によるデータベース接続の状態 – 検証では、SAP 提供の R3trans ユーティリティーを使って データベース接続の状態を検査します。Sun Cluster HA for SAP の障害検証では、SAP がそのデータベースに接続できるかどうかが検査されます。ただし、Sun Cluster HA for SAP によるデータベースの可用性の判断は、高可用性データベース障害検証機能に大きく依存しています。障害モニターは、データベース接続の状態検査に失敗すると、Database might be down というメッセージを /var/adm/messages に記録し、SAP リソースの状態を DEGRADED に設定します。検証機能はデータベースの状態を再び検査し、接続が再確立されていると、Database is up というメッセージを /var/adm/messages に記録します。SAP リソースのステータスに OK を設定します。

  4. 障害履歴を評価します。

    障害モニターは、障害履歴に基づいて次のいずれかのアクションを行います。

    • アクションなし

    • ローカル再起動

    • フェイルオーバー

      そのアプリケーションサーバーリソースがフェイルオーバーリソースであれば、障害モニターはアプリケーションサーバーをフェイルオーバーします。

      アプリケーションサーバーリソースがスケーラブルリソースの場合は、RGM が一定回数のローカル再起動を試みた後で、クラスタに別のノードがあればそのノードでアプリケーションサーバーを起動します。