为了尽可能地降低由于资源中的瞬态故障引起的中断所带来的影响,故障监视器将重新启动资源以响应这类故障。 对于持久性故障,需要比重新启动资源更具破坏性的操作:
对于 SAP DB 资源,故障监视器将资源故障切换到其它节点。 SAP DB 资源是故障切换资源。
对于 SAP xserver 资源,故障监视器将使该资源脱机。 SAP xserver 是可伸缩资源。
如果在指定的重试间隔内尝试重新启动资源的次数超过了指定的阈值,则故障监视器将认为故障是持久性的。 为持久性故障定义标准使您能够根据群集的性能特点和可用性要求来设置阈值和重试间隔。
重新启动一次出现故障的资源所需的最长时间是以下特性的值的总和:
Thorough_probe_interval 系统特性
Probe_timeout 扩展特性
为了确保在重试间隔内达到阈值之前您具有足够的时间,请使用以下表达式来计算重试间隔和阈值:
retry-interval ≥ threshold × (thorough-probe-interval + probe-timeout)
要设置阈值和重试间隔,请设置以下系统特性:
为每个包含需要调节的 Sun Cluster HA for SAP DB 故障监视器的资源设置这些特性。 表 1–3 中显示了这些资源的资源类型。
除了定义持久性故障标准以外,重试间隔还影响故障监视器对以下故障做出的响应:
SAP DB 故障监视器检测到 SAP xserver 不可用。 如果 SAP DB 故障监视器在重试间隔内两次检测到 SAP xserver 不可用,则 SAP DB 故障监视器将重新启动 SAP xserver。
持久性系统错误。持久性系统错误是指在重试间隔内发生四次的系统错误。 如果发生持久性系统错误,故障监视器将重新启动 SAP xserver。