适用于应用服务器的 Sun Cluster HA for SAP 故障探测 (用于 SAP 的 Sun Cluster 数据服务指南（适用于 Solaris OS）)

用于 SAP 的 Sun Cluster 数据服务指南（适用于 Solaris OS）

Previous: 适用于中央实例的 Sun Cluster HA for SAP 故障探测

适用于应用服务器的 Sun Cluster HA for SAP 故障探测

对于应用服务器，故障探测执行以下步骤。

检索主分发程序的进程 ID
不断地进行循环（如果为 Thorough_probe_interval，则休眠）
检查 SAP 资源的可用性
1. 非正常退出 – 如果 Process Monitor Facility (PMF) 检测到 SAP 进程树失败，故障监视器就会将此问题视为完全失败。故障监视器根据资源的故障历史记录重新启动或将 SAP 资源故障转移到其他节点。
2. 通过探测来检查 SAP 资源的可用性 – 探测使用 ps(1) 命令来检查 SAP Message Server 和主分发程序进程。如果在系统的活动进程列表中没有找到 SAP 主分发程序进程，故障监视器就会将该问题视为完全失败。
3. 通过探测来检查数据库的连接状态 – 探测调用 SAP 提供的公用程序 R3trans 来检查数据库连接的状态。 Sun Cluster HA for SAP 故障探测可以检验 SAP 是否能够连接到数据库。但是，Sun Cluster HA for SAP 依赖于具有高可用性的数据库故障探测来确定数据库的可用性。如果数据库连接状态检查失败，故障监视器将在 /var/adm/messages 中记录以下消息：数据库可能要关闭，并将 SAP 资源的状态设置为 DEGRADED。如果探测再次检查数据库的状态时连接已重新建立，故障监视器将在 /var/adm/messages 中记录以下消息：数据库正在运行。然后，故障监视器会将 SAP 资源的状态设置为 OK。
评估故障历史记录

根据故障历史记录，故障监视器可以完成以下操作之一。
- 不执行任何操作
- 本地重新启动
- 故障转移
  
  如果应用服务器资源是故障转移资源，则故障监视器会对该应用服务器进行故障转移。
  
  如果应用服务器资源是可伸缩资源，则本地重新启动的次数用尽后，RGM 将在另一节点上启动该应用服务器（如果群集中有其他可用节点）。

Previous: 适用于中央实例的 Sun Cluster HA for SAP 故障探测