Sun Cluster HA for BroadVision One-To-One Enterprise 故障监视器可以检查 BroadVision One-To-One Enterprise 后端和 Interaction Manager 进程的运行状况。BroadVision One-To-One Enterprise 进程的健康状况将影响 BroadVision One-To-One Enterprise 资源的故障历史记录,故障历史记录转而又推动故障监视器的操作。对于每个 BroadVision One-To-One Enterprise 资源,故障监视器操作包括“无操作”、“重新启动”和“故障转移”。
对于 Interaction Manager 资源,仅在满足以下两个条件时才进行故障转移。
主节点的所需数目小于主节点的最大数目。
其中一个节点不可用。
故障转移之后,如果以下两个条件均具备,故障监视器将不重新启动任何群集节点上的资源。
Interaction Manager 资源组的主节点的最大数目与所需数目相同。
故障监视器重新启动 Interaction Manager 资源的次数已经达到 Retry_count 特性指定的次数。
每个 BroadVision One-To-One Enterprise 资源(根主机、后端主机和 Interaction Manager 主机)的故障监视器可监视以下进程。
orbix 守护程序 (orbixd ),它为所有 BroadVision One-To-One Enterprise 资源所公用 – 探测将使用 ps(1) 命令以确保 orbixd 运行正常。如果 orbixd 运行不正常,探测会将其视为完全失败,Resource Group Manager (RGM) 将重新启动 orbix 守护程序。
orbix 守护程序启动时具有检查点功能。因此,前一个 orbixd 实例启动的 BroadVision One-To-One Enterprise 服务器将继续在新的 orbixd 实例中运行。
您已在资源中配置的 BroadVision One-To-One Enterprise 守护程序 – 如果 orbixd 健康状况良好,探测将使用 BroadVision 命令 bvconf ps 以确保 BroadVision One-To-One Enterprise 守护程序运行正常。如果 BroadVision One-To-One Enterprise 守护程序运行不正常,RGM 将重新启动资源,这将重新启动所有已配置的守护程序。