用于 Sun Java System Message Queue 的 Sun Cluster 数据服务指南(适用于 Solaris OS)

Sun Cluster HA for Sun Java System Message Queue 故障监视器操作

本节介绍 Sun Cluster HA for Sun Java System Message Queue 故障监视器。

扩展特性

Sun Cluster HA for Sun Java System Message Queue 故障监视器使用以下扩展特性。您可能可以调整这些扩展特性。

表 1–3 Sun Cluster HA for Sun Java System Message Queue 扩展特性

名称/数据类型 

说明 

Smooth_shutdown

Smooth_shutdown 扩展特性使用 imqcmd 命令启用正常关机。如果在终止 Sun Java System Message Queue 进程之前希望进行正常关机,则必须将此扩展特性设置为 TRUE。如果此扩展特性为 TRUE,则必须在 $IMQ_VARHOME/instances/broker/scs1mqconfig 中设置口令。

在以下情况下将此扩展特性设置为 TRUE

  • 需要使用 imqcmd 关闭代理程序而不是通过向其发送 SIGTERM 来关闭代理程序(缺省情况)。

  • 代理是否将口令包含在 imqcmd 命令字符串中并不是非常重要。

缺省值:False

可调:任何时候

探测算法和功能

Sun Cluster HA for Sun Java System Message Queue 探测将向服务器发送请求以查询 Sun Java System Message Queue 服务器的运行状况。探测执行以下步骤:

  1. 根据用 Probe_timeout 资源特性设置的超时值探测 Sun Java System Message Queue 实例。

  2. 连接到由资源组的网络资源配置和 Port_list 设置定义的 IP 地址和端口组合。如果连接成功,探测将读取端口映射信息。最后探测将断开。如果连接的任何部分失败,都将记录为失败信息。

    网络通信繁忙、系统负载大和配置错误均会导致查询失败。如果未将 Sun Java System Message Queue 服务器配置为在所有被探测的 IP 地址和端口组合上进行侦听,则可能导致配置错误。Sun Java System Message Queue 服务器应为针对此资源指定的每个 IP 地址的所有端口提供服务。

    下面是一种完全探测失败的情况。

    无法连接到服务器时会接收到以下错误消息。%s 表示主机名,%d 表示端口号。


    无法连接至主机 <%s> 和端口 <%d>。

  3. 将累计在资源特性间隔 Retry_interval 内发生的部分失败,直至累计量等于需要采取措施的完全失败。

    以下是部分探测失败的情况。

    • 无法从资源 %s 的端口 %d 断开。


      Failed to disconnect from port %d of resource %s.

    • 无法在 Probe_timeout 时间内完成所有探测步骤。

    • 由于其他原因从服务器读取数据时失败,会接收到以下错误消息。其中第一个 %s 表示主机名,%d 表示端口号。第二个 %s 表示错误的更详细信息。


      Failed to communicate with server %s port %d: %s

基于故障的历史记录,故障会导致本地重新启动或数据服务的故障转移。