Oracle® Solaris Cluster 系统管理指南

退出打印视图

更新时间: 2015 年 10 月
 
 

管理公共网络

Oracle Solaris Cluster 软件支持将 Internet 协议网络多路径 (Internet Protocol network Multipathing, IPMP) 的 Oracle Solaris 软件实现用于公共网络。对群集环境和非群集环境而言,基本的 IPMP 管理是相同的。多路径功能随 Oracle Solaris 11 OS 自动安装,必须启用多路径功能才能使用该功能。多路径管理在相应的 Oracle Solaris OS 文档中进行介绍。不过,在 Oracle Solaris Cluster 环境中管理 IPMP 之前请先查看下面的准则。

如何在群集中管理 IP 网络多路径组

在群集中执行 IPMP 过程之前,请考虑以下准则。

  • 在配置使用 SUNW.SharedAddress 网络资源的可伸缩服务资源(在资源类型的资源类型注册文件中 SCALABLE=TRUE)时,可以配置 PNM 以监视群集节点上所有 IPMP 组的状态,以及 SUNW.SharedAddress 配置使用的 IPMP 组的状态。此配置允许在群集节点上的任何 IPMP 组发生故障时,重新启动服务并进行故障转移,以便最大程度地提高与群集节点并存于同一个子网上的网络客户机的服务可用性。例如:

    # echo ssm_monitor_all > /etc/cluster/pnm/pnm.conf

    重新引导该节点。

  • 每个用于数据服务通信的公共网络适配器都必须属于 IPMP 组。如果某个公共网络适配器在数据服务通信中未用到,便不必将它配置到 IPMP 组中。

  • 对于以太网适配器,local-mac-address? 变量必须具有 true 值。

  • 您可以在群集中使用基于探测的 IPMP 组或基于链路的 IPMP 组。基于探测的 IPMP 组用于测试目标 IP 地址,并通过识别更多可能危及可用性的情况来提供最强大的保护。

    如果要使用 iSCSI 存储作为法定设备,请确保正确配置基于探测的 IPMP 设备。如果 iSCSI 网络是仅包含群集节点和 iSCSI 存储设备的专用网络,并且在 iSCSI 网络上没有其他主机,则当除了其中一个群集节点以外的所有群集节点都发生故障时,可能会破坏基于探测的 IPMP 机制。发生该问题的原因在于 iSCSI 网络上没有其他主机供 IPMP 探测,因此当群集中仅剩一个节点时,IPMP 将此视为网络故障。IPMP 会将 iSCSI 网络适配器脱机,从而使其余节点无法访问 iSCSI 存储,因此也无法访问法定设备。要解决此问题,可以在 iSCSI 网络中添加一个路由器,从而使群集以外的其他主机可以响应探测,防止 IPMP 将网络适配器脱机。或者,也可以将 IPMP 配置为基于链路的故障转移,而不是配置为基于探测的故障转移。

  • 除非公共网络配置中有一个或多个非链路本地 IPv6 公共网络接口,否则 scinstall 实用程序会自动为群集中使用同一子网的每个公共网络适配器集配置一个多适配器 IPMP 组。这些组是基于链路的,具有传递式探测器。如果需要基于探测的故障探测,可添加测试地址。

  • 同一个多路径组中的所有适配器的测试 IP 地址必须属于一个 IP 子网。

  • 正常的应用程序不得使用测试 IP 地址,因为它们属于高度不可用地址。

  • 未对多路径组的命名加以限制。不过,在配置资源组时,netiflist 命名惯例是多路径名称后接节点 ID 号或节点名称。例如,如果多路径组的名称为 sc_ipmp0,则 netiflist 的命名应为 sc_ipmp0@1sc_ipmp0@phys-schost-1,其中适配器位于节点 ID 为 1 的节点 phys-schost-1 上。

  • 在未将 IP 地址从要删除的适配器切换到组中的备用适配器(使用 if_mpadm(1M) 命令)之前,请不要取消配置(取消激活)或关闭 IP 网络多路径组的适配器。

  • 在激活了 Oracle Solaris Cluster HA IP 地址的 IPMP 组中,请勿取消激活或删除网络接口。此 IP 地址可能属于逻辑主机资源或共享地址资源。但是,如果使用 ifconfig 命令取消激活活动接口,Oracle Solaris Cluster 现在可识别此事件。如果 IPMP 组在该过程中变得不可用,则将资源组故障转移到其他某个正常的节点。如果 IPMP 组有效,但 HA IP 地址缺失,则 Oracle Solaris Cluster 还可以在同一个节点上重新启动资源组。出于多种原因,IPMP 组会变得不可用:IPv4 连接中断和/或 IPv6 连接中断。有关更多信息,请参见 if_mpadm(1M) 手册页。

  • 避免在事先未将适配器从其各自的多路径组中删除的情况下,将其重新连接到其他子网上。

  • 即使正在监视多路径组,也可以对适配器进行逻辑适配器操作。

  • 您必须为群集中的每个节点至少维护一个公共网络连接。如果没有公共网络连接,就无法访问群集。

  • 要查看某个群集上 IP 网络多路径组的状态,请使用 ipmpstat -g 命令。

有关 IP 网络多路径的更多信息,请参见 Oracle Solaris OS 系统管理文档集中的相应文档。

表 7-3  任务列表:管理公共网络
Oracle Solaris OS 发行版
指导
Oracle Solaris 11 OS

有关群集软件安装过程,请参见Oracle Solaris Cluster 软件安装指南 。有关维修公共网络硬件组件的过程,请参见Oracle Solaris Cluster 4.2 Hardware Administration Manual

动态重新配置公共网络接口

在对群集中的公共网络接口完成动态重新配置 (dynamic reconfiguration, DR) 操作时,必须考虑几个问题。

  • 针对 Oracle Solaris 动态重新配置功能介绍的所有要求、过程和限制也适用于 Oracle Solaris Cluster 动态重新配置支持(操作系统停止操作除外)。因此,请阅读关于 Oracle Solaris 动态重新配置功能的文档,然后再对 Oracle Solaris Cluster 软件使用动态重新配置功能。您应该特别注意那些在执行动态重新配置分离操作时影响非网络 IO 设备的问题。

  • 只有公共网络接口不活动时,动态重新配置删除板操作才能成功。在删除活动的公共网络接口之前,使用 if_mpadm 命令将 IP 地址从要删除的适配器切换到多路径组中的另一个适配器。有关更多信息,请参见 if_mpadm(1M) 手册页。

  • 在没有正确地禁用公共网络接口卡(作为活动网络接口适配器)的情况下,如果试图删除此公共网络接口卡,Oracle Solaris Cluster 将拒绝此操作并标识出会受此操作影响的接口。


Caution

注意  -  当多路径组中有两个适配器时,如果在对禁用的网络适配器执行动态重新配置删除操作时,另一个网络适配器出现故障,将会影响可用性。执行动态重新配置操作期间另一个适配器无法进行故障转移。


对公共网络接口执行动态重新配置操作时,请按所示顺序完成下列过程。

表 7-4  任务列表:动态重新配置公共网络接口
任务
指导
1. 使用 if_mpadm 命令将 IP 地址从要删除的适配器切换到多路径组中的另一个适配器
if_mpadm(1M) 手册页。
2. 使用 ipadm 命令将适配器从多路径组中删除
ipadm(1M) 手册页
3. 对公共网络接口执行动态重新配置操作