Sun Java System Messaging Server 6.3 管理指南

3.2 高可用性模型

Messaging Server 可以使用不同的高可用性模型。下面是三个比较基本的模型:

以下几个小节更详细地介绍了其中的每个模型。

请注意,不同的 HA 产品可能会支持不同的模型,也可能不支持不同的模型。请参见 HA 文档以确定支持哪些模型。

3.2.1 不对称

基本不对称或备用高可用性模型由两个群集主机或节点组成。将为两个节点指定逻辑 IP 地址和关联主机名。

在这种模型中,只有一个节点在任何给定时间都处于活动状态,备份或备用节点大部分时间内处于空闲状态。这两个节点之间的单一共享磁盘阵列由活动或节点进行配置和控制。消息存储分区和邮件传输代理 (Mail Transport Agent, MTA) 队列位于此共享卷上。

图 3–1 不对称高可用性模式

此图像显示了 HA 不对称模型。

上图显示了两个物理节点 Physical-APhysical-B。 在故障转移之前,活动节点是 Physical-A。在故障转移之后,Physical-B 变为活动节点,并切换共享卷以便由 Physical-B 对其进行控制。将停止 Physical-A 上的所有服务,并在 Physical-B上启动这些服务。

此模型的优点在于,备份节点是专用的,并且是完全为主节点保留的。此外,发生故障转移时,备份节点上不会出现资源争用。但是,此模型也意味着备份节点大部分时间内处于空闲状态,因此资源的利用率很低。

3.2.2 对称

基本对称或“双重服务”高可用性模型由两个主机构成,每个主机都有自己的逻辑 IP 地址。每个逻辑节点都与一个物理节点相关联,并且每个物理节点都控制一个具有两个存储卷的磁盘阵列。一个卷用作其本地消息存储分区和 MTA 队列,另一个卷是其伙伴的消息存储分区和 MTA 队列的镜像。

下图显示了对称高可用性模式。两个节点同时处于活动状态,并且每个节点都用作另一个节点的备份节点。正常情况下,每个节点仅运行一个 Messaging Server 实例。

图 3–2 对称高可用性模式

此图像显示了 HA 对称模型。

在故障转移后,将关闭出现故障的节点上的服务,并在备份节点上重新启动这些服务。此时,备份节点为这两个节点运行 Messaging Server 并管理两个单独的卷。

此模型的优点在于,两个节点同时处于活动状态,因而充分利用计算机资源。但是,在出现故障期间,备份节点会发生较多的资源争用,因为它从两个节点运行 Messaging Server 服务。因此,应尽快修复出现故障的节点,并将服务器切换回其双重服务状态。

此模型还提供了一个备份存储阵列。如果磁盘阵列发生故障,备份节点上的服务可以选取其冗余映像。

要配置对称模型,您需要在共享磁盘上安装共享的二进制文件。请注意,这样做可能会阻止您执行滚动升级(一种可以让您在 Messaging Server 修补程序发行期间更新系统的功能)。(计划在将来的版本中提供此功能。)

3.2.3 N+1 (N Over 1)

N+1 或 "N over 1" 模型在多节点不对称配置下运行。需要 N 个逻辑主机名和 N 个共享磁盘阵列。将保留单一备份节点以作为所有其他节点的备用节点。备份节点能够从 N 个节点同时运行 Messaging Server。

下图说明了基本的 N+1 高可用性模型。

图 3–3 N+1 高可用性模式

此图像显示了 N+1 HA 模型。

在一个或多个活动节点进行故障转移后,备份节点将承担出现故障的节点的工作。

N+1 模型的优点在于,可以将服务器负载分配到多个节点上,在出现任何可能的节点故障时,只需由一个备份节点来承担这些节点的工作。因此,计算机空闲率为 1/N,而单一不对称模型为 1/1。

要配置 N+1 模型,您只需在本地磁盘上安装二进制文件(即,不是像对称模型一样在共享磁盘上安装二进制文件)。对于任何对称、1+1 或 N+1 不对称或对称 HA 解决方案,当前 Messaging Server 安装和设置过程强制您将二进制文件放在共享磁盘上。

3.2.4 选择高可用性模型

下表简要说明了每个高可用性模型的优点和缺点。使用这些信息将有助于确定适合您的部署的模型。

表 3–1 HA 模型比较

模型 

优点 

缺点 

建议的用户 

不对称 

  • 简单配置

  • 100% 保留备份节点

不能充分利用计算机资源。 

计划将来扩大规模的小型服务提供商 

对称 

  • 系统资源使用率较高

  • 可用性较高

备份节点上存在资源争用。 

HA 需要完全冗余的磁盘。 

在出现单一服务器故障时可以接受性能下降的小型公司部署 

N+1 

  • 负载分配

  • 易于扩展

管理和配置比较复杂。 

需要不受限制地分配资源的大型服务提供商 

3.2.5 系统故障时间计算

下表说明了在任何给定的一天邮件传送服务由于系统故障而无法使用的概率。这些计算假设每个服务器平均每三个月会有一天出现故障(由于系统崩溃或服务器挂起),并且每个存储设备每 12 个月会有一天出现故障。这些计算还忽略了两个节点同时出现故障的小概率事件。

表 3–2 HA 故障概率

模型 

服务器故障时间概率 

单个服务器(没有高可用性) 

概率(故障)=(4 天系统故障 + 1 天存储故障)/365 = 1.37% 

不对称 

概率(故障)=(0 天系统故障 + 1 天存储故障)= 0.27% 

对称 

概率(故障)=(0 天系统故障 + 0 天存储故障)/365 =(接近 0) 

N+1 不对称 

概率(故障)=(5 小时系统故障 + 1 天存储故障)/(365xN) = 0.27%/N