本章提供管理 Sun Cluster 互连和公共网络的软件过程。
群集互连和公共网络的管理由硬件和软件过程组成。 通常,在初次安装并配置群集时,要配置群集互连和公共网络,包括 NAFO 组。 如果后来需要更改群集互连或公共网络配置,则可以使用本章中的软件过程。
以下是本章中包含的过程的列表。
有关本章中相关过程的高级说明,请参阅表 5-1 和表 5-3。
有关群集互连和公共网络的背景和概述信息,请参阅《Sun Cluster 3.0 12/01 概念》文档。
本节叙述了重新配置群集互连(诸如 cluster transport adapter 和 cluster transport cable)的过程。 这些过程要求安装 Sun Cluster 软件。
在大多数情况下,您可以使用 scsetup 实用程序来管理群集互连的群集传输。有关详细信息,请参阅 scsetup(1M) 手册页。
有关群集软件的安装过程,请参阅《Sun Cluster 3.0 12/01 软件安装指南》。有关维护群集硬件组件的过程,请参阅《Sun Cluster 3.0 12/01 Hardware Guide》。
在群集互连过程中,只要适合,一般情况下都可以使用缺省端口名。缺省端口名与电缆适配器端所在的那个节点的内部节点 ID 号相同。 但是,不能让某些适配器类型(如 SCI)使用缺省端口名。
任务 |
有关说明,请转到... |
---|---|
管理群集传输 - 使用 scsetup | |
检查群集互连的状态 - 使用 scstat | |
添加群集传输电缆、传输适配器或传输结点 - 使用 scsetup | |
删除群集传输电缆、传输适配器或传输结点 - 使用 scsetup | |
启用群集传输电缆 - 使用 scsetup | |
禁用群集传输电缆 - 使用 scsetup |
完成对群集互连的动态重新配置 (DR) 操作时,有几个问题必须予以考虑。
相关文档中适用于 Solaris 8 DR 功能的所有要求、步骤和限制同样适用于 Sun Cluster DR 支持(唯一的区别是操作环境静态操作)。 因此,在通过 Sun Cluster 软件使用 DR 之前,须查阅有关 Solaris 8 DR 功能的文档。应特别查阅那些在 DR 分离操作期间影响非网络 IO 设备的问题。
不能对活动的专用互连接口执行 DR 删除操作。
如果 DR 删除操作会影响活动的专用互连接口,系统将拒绝操作并标识出会受此操作影响的接口。
更换专用互连上的某个接口之后,该接口的状态保持不变,从而不需再执行一些步骤来重新配置 Sun Cluster。
Sun Cluster 要求每个群集节点都至少拥有一条通向其他各群集节点的有效路径。如果某个专用互连接口支持到任何群集节点的最后一条路径,则请勿禁用它。
对公共网络接口执行 DR 操作时,请按所示顺序完成下列过程。
表 5-2 任务表:动态重新配置公共网络接口
任务 |
有关说明,请转到... |
---|---|
1. 从活动的互连中禁用并删除接口 | |
2. 对公共网络接口执行 DR 操作。 |
《Sun Enterprise 10000 Dynamic Reconfiguration User Guide》和《Sun Enterprise 10000 Dynamic Reconfiguration Reference Manual》(出自《 Solaris 8 on Sun Hardware》集) |
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
执行此步骤不需要作为超级用户登录。
检查群集互连的状态。
# scstat -W |
常见的状态消息如下所示。
状态消息 |
说明和可能的操作 |
---|---|
Path online |
此路径当前可正常工作。 不需要执行任何操作。 |
Path waiting |
当前正在初始化此路径。 不需要执行任何操作。 |
Path faulted |
此路径当前不工作。 如果路径在等待和联机状态之间,则这种情况是瞬态的。 如果重新运行 scstat -W 后,此消息依然存在,则请采取更正措施。 |
以下示例显示了群集互连正常运行时的状态。
# scstat -W -- Cluster Transport Paths -- Endpoint Endpoint Status -------- -------- ------ Transport path: phys-schost-1:qfe1 phys-schost-2:qfe1 Path online Transport path: phys-schost-1:qfe0 phys-schost-2:qfe0 Path online Transport path: phys-schost-1:qfe1 phys-schost-3:qfe1 Path online Transport path: phys-schost-1:qfe0 phys-schost-3:qfe0 Path online Transport path: phys-schost-2:qfe1 phys-schost-3:qfe1 Path online Transport path: phys-schost-2:qfe0 phys-schost-3:qfe0 Path online |
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
确保安装了cluster transport cable(电缆本身)。
有关安装cluster transport cable的过程,请参阅《Sun Cluster 3.0 12/01 Hardware Guide》。
成为群集中任一节点上的超级用户。
进入 scsetup 实用程序。
# scsetup |
显示"Main Menu"。
通过键入 3(群集互连)来访问"Cluster Interconnect Menu"(群集互连菜单)。
如果配置所使用的是 SCI 适配器,则在该过程的 "添加" 操作中提示适配器连接(端口名)时,不要接受缺省设置。 应提供在 Dolphin 交换机上所找到的端口名(0、 1、 2 或 3),节点与之通过电缆以物理方式进行连接。
通过键入 1(添加传输电缆)来添加传输电缆。
按说明输入请求的信息。
通过键入 2(向节点添加传输适配器)来添加传输适配器。
按说明输入请求的信息。
通过键入 3(添加传输结点)来添加传输结点。
按说明输入请求的信息。
检验是否已添加cluster transport cable、传输适配器或传输结点。
# scconf -p | grep cable # scconf -p | grep adapter # scconf -p | grep junction |
以下示例显示了如何使用 scsetup 命令向节点添加传输电缆、传输适配器或传输结点。
[Ensure the physical cable is installed.] Become superuser on any node and place the node to be removed in maintenance state. # scsetup Select Cluster interconnect. Select either Add a transport cable, Add a transport adapter to a node, or Add a transport junction. Answer the questions when prompted. You Will Need: Example: node names phys-schost-1 adapter names qfe2 junction names hub2 transport type dlpi [Verify that the scconf command completed successfully:] Command completed successfully. Quit the scsetup Cluster Interconnect Menu and Main Menu. [Verify that the cable, adapter, and junction are added:] # scconf -p | grep cable Transport cable: phys-schost-2:qfe0@1 ethernet-1@2 Enabled Transport cable: phys-schost-3:qfe0@1 ethernet-1@3 Enabled Transport cable: phys-schost-1:qfe0@0 ethernet-1@1 Enabled # scconf -p | grep adapter Node transport adapters: qfe2 hme1 qfe0 Node transport adapter: qfe0 Node transport adapters: qfe0 qfe2 hme1 Node transport adapter: qfe0 Node transport adapters: qfe0 qfe2 hme1 Node transport adapter: qfe0 # scconf -p | grep junction Cluster transport junctions: hub0 hub1 hub2 Cluster transport junction: hub0 Cluster transport junction: hub1 Cluster transport junction: hub2 |
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
请按照以下过程从节点配置中删除群集传输电缆、传输适配器和传输结点。 禁用电缆后,电缆的两个端点仍处于已配置状态。 如果适配器正用作传输电缆的端点,则无法删除该适配器。
每个群集节点至少需要一条通向群集中其他各节点的有效传输路径。 任何两个节点之间都必须有传输路径。 禁用电缆前,请务必检验节点的群集互连的状态。 仅当您确信某个电缆连接为冗余之后才可禁用它。这就是说,有另外一个连接可用。禁用节点所剩的最后一条工作电缆会使该节点脱离群集。
成为群集中任一节点上的超级用户。
检查其余群集传输路径的状态。
# scstat -W |
如果在尝试删除由两个节点所组成的群集中的一个节点时收到错误消息(如 "path faulted"),请先找出问题之所在,然后再继续执行此过程。这样的问题可能表明节点路径不可用。 如果删除仅剩的那根有效路径,则会使该节点脱离群集,并可能导致重新配置群集。
进入 scsetup 实用程序。
# scsetup |
显示"Main Menu"。
通过键入 3(群集互连)来访问群集互连菜单。
通过键入 4(删除传输电缆)来删除电缆。
按说明输入请求的信息。 您需要知道所适用的节点名称、适配器名称和结点名称。
如果删除的是物理电缆,请断开端口与目标设备之间的电缆。
通过键入 5(从节点删除传输适配器)来删除适配器。
按说明输入请求的信息。 您需要知道所适用的节点名称、适配器名称和结点名称。
如果要从节点删除物理适配器,请参阅《Sun Cluster 3.0 12/01 Hardware Guide》,以了解硬件维护过程的有关信息。
通过键入 6(删除传输结点)来删除结点。
按说明输入请求的信息。 您需要知道所适用的节点名称、适配器名称和结点名称。
如果结点的任一端口正用作任一传输电缆的端点,则无法删除它。
检验是否已删除电缆或适配器。
# scconf -p | grep cable # scconf -p | grep adapter # scconf -p | grep junction |
此命令的输出内容中不应出现已从指定节点删除的传输电缆或适配器。
以下示例显示了如何使用 scsetup 命令来删除传输电缆、传输适配器或传输结点。
[Become superuser on any node in the cluster.] [Enter the utility:] # scsetup Type 3 (Cluster interconnect). Select either Add a transport cable, Add a transport adapter to a node, or Add a transport junction. Answer the questions when prompted. You Will Need: Example: node names phys-schost-1 adapter names qfe1 junction names hub1 [Verify that the scconf command completed successfully:] "Command completed successfully." Quit the scsetup Cluster Interconnect Menu and Main Menu. [Verify that the cable, adapter, or junction is removed:] # scconf -p | grep cable Transport cable: phys-schost-2:qfe0@1 ethernet-1@2 Enabled Transport cable: phys-schost-3:qfe0@1 ethernet-1@3 Enabled Transport cable: phys-schost-1:qfe0@0 ethernet-1@1 Enabled # scconf -p | grep adapter Node transport adapters: qfe2 hme1 qfe0 Node transport adapter: qfe0 Node transport adapters: qfe0 qfe2 hme1 Node transport adapter: qfe0 Node transport adapters: qfe0 qfe2 hme1 Node transport adapter: qfe0 # scconf -p | grep junction Cluster transport junctions: hub0 hub2 Cluster transport junction: hub0 Cluster transport junction: hub2 |
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
此选项用于启用现有的群集传输电缆。
成为群集中任一节点上的超级用户。
进入 scsetup 实用程序。
# scsetup |
显示"Main Menu"。
通过键入 2(群集互连)来访问群集互连菜单。
通过键入 7(启用传输电缆)来启用传输电缆。
出现提示后按说明操作。 对于您正尝试标识的那根电缆,您需要输入它的其中一个端点的节点名称和适配器名称。
检验是否已启用该电缆。
# scconf -p | grep cable |
此示例说明了如何启用位于节点 phys-schost-2 的适配器 qfe-1 上的群集传输电缆。
[Become superuser on any node.] [Enter the scsetup utility:] # scsetup Select Cluster interconnect>Enable a transport cable. Answer the questions when prompted. You will need the following information. You Will Need: Example: node names phys-schost-2 adapter names qfe1 junction names hub1 [Verify that the scconf command completed successfully:] scconf -c -m endpoint=phys-schost-2:qfe1,state=enabled Command completed successfully. Quit the scsetup Cluster Interconnect Menu and Main Menu. [Verify that the cable is enabled:] # scconf -p | grep cable Transport cable: phys-schost-2:qfe1@0 ethernet-1@2 Enabled Transport cable: phys-schost-3:qfe0@1 ethernet-1@3 Enabled Transport cable: phys-schost-1:qfe0@0 ethernet-1@1 Enabled |
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
您可能需要禁用群集传输电缆,以便临时关闭群集互连路径。 这在排除群集互连的故障或更换群集互连硬件时很有用。
禁用电缆后,电缆的两个端点仍处于已配置状态。 如果适配器仍用作传输电缆的一个端点,则无法删除该适配器。
每个群集节点至少需要一条通向群集中其他各节点的有效传输路径。 任何两个节点之间都必须有传输路径。 禁用电缆前,请务必检验节点的群集互连的状态。 仅当您确信某个电缆连接为冗余之后才可禁用它。这就是说,有另外一个连接可用。禁用节点所剩的最后一条工作电缆会使该节点脱离群集。
成为群集中任一节点上的超级用户。
禁用电缆前,请检查群集互连的状态。
# scstat -W |
如果在尝试删除由两个节点所组成的群集中的一个节点时收到错误消息(如 "path faulted"),请先找出问题之所在,然后再继续执行此过程。这样的问题可能表明节点路径不可用。 如果删除仅剩的那根有效路径,则会使该节点脱离群集,并可能导致重新配置群集。
进入 scsetup 实用程序。
# scsetup |
显示"Main Menu"。
通过键入 3(群集互连)来访问群集互连菜单。
通过键入 8(禁用传输电缆)来禁用电缆。
按说明输入请求的信息。 这时将禁用此群集互连中的所有组件。 对于您正尝试标识的那根电缆,您需要输入它的其中一个端点的节点名称和适配器名称。
检验是否已禁用电缆。
# scconf -p | grep cable |
此示例说明了如何禁用位于节点 phys-schost-2 的适配器 qfe-1 上的群集传输电缆。
[Become superuser on any node.] [Enter the scsetup utility:] # scsetup Select Cluster interconnect>Disable a transport cable. Answer the questions when prompted. You will need the following information. You Will Need: Example: node names phys-schost-2 adapter names qfe1 junction names hub1 [Verify that the scconf command completed successfully:] scconf -c -m endpoint=phys-schost-2:qfe1,state=disabled Command completed successfully. Quit the scsetup Cluster Interconnect Menu and Main Menu. [Verify that the cable is disabled:] # scconf -p | grep cable Transport cable: phys-schost-2:qfe1@0 ethernet-1@2 Disabled Transport cable: phys-schost-3:qfe0@1 ethernet-1@3 Enabled Transport cable: phys-schost-1:qfe0@0 ethernet-1@1 Enabled |
如果需要改变公共网络配置,可按照本节中的软件过程进行。
避免以下做法:在事先未在网络适配器故障转移 (NAFO) 组中从活动适配器切换到备份适配器的情况下,直接卸下该组中的活动适配器或取消其配置。 请参阅"5.2.6 如何切换 NAFO 组的活动适配器"。
避免在事先未将备份适配器从其各自的 NAFO 组中删除的情况下,将其重新连接到其他子网上。
即使该组处于监视中,也可对活动适配器进行逻辑适配器操作。
您必须为群集中的每个节点至少维护一个公共网络连接。 如果没有公共网络连接,就无法访问群集。
有关群集软件的安装过程,请参阅《Sun Cluster 3.0 12/01 软件安装指南》。有关维护公共联网硬件组件的过程,请参阅《Sun Cluster 3.0 12/01 Hardware Guide》。
表 5-3 任务表:管理公共网络
任务 |
有关说明,请转到... |
---|---|
在节点上创建 NAFO 组 | |
向节点添加更多的公共网络适配器 | |
删除 NAFO 组 | |
从现有的 NAFO 组中删除备份适配器 | |
将活动的适配器切换到备份的适配器 | |
检查 NAFO 组的状态 | |
更改参数以调整 PNM 故障检测和故障转移进程 |
在完成对群集中的公共网络进行动态重新配置 (DR) 操作时,有几个问题必须予以考虑。
相关文档中适用于 Solaris 8 DR 功能的所有要求、步骤和限制同样适用于 Sun Cluster DR 支持(唯一的区别是操作环境静态操作)。 因此,在通过 Sun Cluster 软件使用 DR 之前,须查阅有关 Solaris 8 DR 功能的文档。应特别查阅那些在 DR 分离操作期间影响非网络 IO 设备的问题。
可以对非活动的公共网络接口执行 DR 删除操作。 首先必须将所有活动的公共网络接口从 NAFO 组的活动状态中删除掉。
更换专用互连上的某个接口之后,该接口的状态保持不变,从而不需再执行一些步骤来重新配置 Sun Cluster。
在没有正确地禁用公共网络接口卡(作为活动网络适配器)的情况下,如果试图删除该公共网络接口卡,系统将拒绝此操作并标识出会受此操作影响的接口。
在对已禁用的网络适配器执行 DR 删除操作期间,如果活动的网络适配器发生故障,则说明可用性受到了影响。在 DR 操作期间,活动的适配器没有地方可转移故障。
对公共网络接口执行 DR 操作时,请按所示顺序完成下列过程。
表 5-4 任务表:动态重新配置公共网络接口
任务 |
有关说明,请转到... |
---|---|
1. 将活动适配器切换到备份适配器。这样,就可以从 NAFO 组中将它删除。 | |
2. 从 NAFO 组中删除该适配器。 | |
3. 对公共网络接口执行 DR 操作。 |
《Sun Enterprise 10000 Dynamic Reconfiguration User Guide》和《Sun Enterprise 10000 Dynamic Reconfiguration Reference Manual》(出自《 Solaris 8 on Sun Hardware》集) |
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
创建 NAFO 组时,请注意以下要求:
必须对所有公共网络适配器进行配置,使它们属于某个 NAFO 组。
对于任一给定的节点,在给定的子网上最多只能有一个 NAFO 组。
给定的 NAFO 组中的所有适配器必须连接到同一子网上。
在给定的 NAFO 组中,只能有一个适配器具有主机名关联,即 /etc/hostname. adapter 文件。
一个公共网络适配器只能属于一个 NAFO 组。
在要为 NAFO 组配置的那个节点上成为超级用户。
对于此节点,找出所有与同一子网进行物理连接的公共网络适配器。
这些适配器成为 NAFO 组的备份适配器。
为其中的一个公共网络适配器创建 /etc/hostname.adapter 文件(如果尚未创建该文件)。
该文件中所指定的适配器将成为 NAFO 组的缺省活动适配器。
# vi /etc/hostname.<adapter> phys-schost-1 |
编辑 /etc/inet/hosts 文件,以添加分配给公共网络适配器的 IP 地址和相应的主机名。
例如,以下显示了添加到 /etc/inet/hosts 文件的 IP 地址 192.29.75.101 和主机名 phys-schost-1。
# vi /etc/inet/hosts 192.29.75.101 phys-schost-1 |
如果使用了命名服务,则命名服务数据库中也应该有这些信息。
创建 NAFO 组。
# pnmset -c nafo-group -o create adapter [adapter ...] |
对指定的 NAFO 组执行配置子命令。 必须将 NAFO 组命名为 nafoN,其中 N 是一个非负的整数,用来标识该组。 对每个节点而言,组名都是本地名称。 因而,同一 NAFO 组名可在多个节点上使用。
创建新的 NAFO 组。
指定用作备份适配器的公共网络适配器。 请参阅步骤 3。
如果已经配置了一个适配器,则该适配器将被选定为活动适配器,并且 pnmset 命令不会改变其状态。 否则,将需要配置一个备份适配器并将在 NAFO 组的 /etc/hostname. adapter 文件中找到的 IP 地址分配给它。
检验该 NAFO 组的状态。
# pnmstat -l |
以下示例显示了创建一个 NAFO 组 (nafo0) 的过程,该 NAFO 组配有两个网络适配器(qfe0 和 qfe1)。
# pnmstat -l # vi /etc/hostname.qfe0 phys-schost-1 # vi /etc/inet/hosts 192.168.0.0 phys-schost-1 # pnmset -c nafo0 -o create qfe0 qfe1 # pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK NEVER qfe0 |
您可以向现有的 NAFO 组添加适配器,以便为 NAFO 组提供额外的备份适配器,从而提高群集节点的公共网络连接的可用性。
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
如果是,请参阅《Sun Cluster 3.0 12/01 Hardware Guide》 的有关说明。
如果否,请继续步骤 2。
确保要添加到 NAFO 组中的适配器与 NAFO 组的活动适配器连接到同一子网上。
确保该适配器未经配置,且没有关联的 /etc/hostname.adapter 文件。
成为要添加新适配器的 NAFO 组所在节点上的超级用户。
向 NAFO 组添加适配器。
# pnmset -c nafo-group -o add adapter |
指定要添加新适配器的 NAFO 组。
指定要添加到指定的 NAFO 组的公共网络适配器。
检验该 NAFO 组的状态。
# pnmstat -l |
以下示例说明了向已包含两个适配器(qfe0 和 qfe1)的 NAFO 组 nafo0 添加额外适配器 qfe2 的过程。
# pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK NEVER qfe0 # pnmset -c nafo0 -o add qfe2 # pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1:qfe2 OK NEVER qfe0 |
如果您不想对 NAFO 组中的任何适配器进行监视和故障转移,请删除该 NAFO 组。 要想能够删除 NAFO 组,逻辑主机资源组或共享地址资源组不得使用该组。
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
成为包含要删除的 NAFO 组的节点的超级用户。
确定是否有任何逻辑主机资源或共享地址资源正在使用 NAFO 组。
# scrgadm -pv |
您还可以使用 scrgadm-pvv(带有两个 v 标志)来确定那些正在使用将要删除的 NAFO 组的资源。
切换使用该 NAFO 组的逻辑主机资源组和共享地址资源。
# scswitch -z -g resource-group -h nodelist |
切换指定的资源组。
指定要将资源组切换到的节点的名称。
删除 NAFO 组。
# pnmset -c nafo-group -o delete |
指定要删除的 NAFO 组。
删除 NAFO 组。
检验该 NAFO 组的状态。
列表中不应出现已删除的 NAFO 组。
# pnmstat -l |
以下示例显示了从系统中删除名为 nafo1 的 NAFO 组的过程。 先将使用该 NAFO 组的逻辑主机资源组 lh-rg-1 切换到另外一个节点上。
# scswitch -z -g lh-rg-1 -h phys-schost-2 # pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK NEVER qfe0 nafo1 qfe2 OK NEVER qfe2 # pnmset -c nafo1 -o delete # pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK NEVER qfe0 |
从现有的 NAFO 组中删除备份适配器,以便能够从系统中删除该适配器、更换该适配器、使该适配器重新连接到另一子网并用作另一个 NAFO 组的备份适配器。
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
如果从 NAFO 组中删除最后一个备份适配器,其结果是无法对活动的适配器上检测到的故障提供保护措施,从而降低群集节点的公共网络可用性。
如果要删除活动适配器,请首先切换到该组中的另一适配器。
以超级用户的身份将适配器从 NAFO 组中删除。
# pnmset -c nafo-group -o remove adapter |
指定要从其中删除适配器的 NAFO 组。
从 NAFO 组中删除适配器。
检验该 NAFO 组的状态。
已删除的适配器不应出现在 NAFO 组的列表中。
# pnmstat -l |
以下示例显示了从 NAFO 组 nafo0 中删除适配器 qfe2 的过程。
# pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1:qfe2 OK NEVER qfe0 # pnmset -c nafo0 -o remove qfe2 # pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK NEVER qfe0 |
将活动适配器切换到一个备份适配器,以便能够从 NAFO 组中删除当前活动适配器。 pnmd(1M) 守护程序以类似于由于故障触发的适配器故障转移的方式将当前活动适配器主管的所有 IP 地址移到新的活动适配器。
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
切换过程中,连接可能会经历短暂的延迟。 延迟可能会持续数分钟。 否则,该操作对高级应用程序是透明的。
确保新的活动适配器的物理连通性与当前活动适配器的物理连通性相同。
如果该新的活动适配器无法作为当前活动适配器管理某些 IP 地址,则依赖那些 IP 地址的网络服务和数据服务将会中断,直到物理连接得以修复或之后成功地进行了故障转移才恢复正常。
成为要切换其活动适配器的 NAFO 组所在节点的超级用户。
切换活动适配器。
# pnmset -c nafo-group -o switch adapter |
指定包含有要切换的适配器的 NAFO 组。
使指定的适配器成为 NAFO 组中的活动适配器。
重命名旧活动适配器的 etc/hostname.adapter 文件,以反映新的活动适配器。
# mv /etc/hostname.<old_adapter> /etc/hostname.<new_adapter> |
检验该 NAFO 组的状态。
"作为切换目标"的那个适配器现在就应显示为活动适配器。
# pnmstat -l |
以下示例说明了将活动适配器从 qfe0 切换到 qfe1 的过程。
# pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK NEVER qfe0 # pnmset -c nafo0 -o switch qfe1 # mv /etc/hostname.qfe0 /etc/hostname.qfe1 # pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK 11 qfe1 |
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
运行 pnmstat(1M) 命令,列出某个节点上所有 NAFO 组的当前设置和状态的有关信息。
# pnmstat -l |
您还可以使用 pnmptor(1M) 和 pnmrtop(1M) 命令来获取有关适配器的信息。
以下示例显示了某个节点的三个 NAFO 组的状态。
# pnmstat -l Group adapters status fo_time act_adp nafo0 qfe5 OK NEVER qfe5 nafo1 qfe6 OK NEVER qfe6 nafo2 qfe7 OK NEVER qfe7 |
以下示例显示了 NAFO 组 nafo0 中的活动适配器是 qfe5 适配器。
# pnmptor nafo0 qfe5 |
以下示例显示适配器 qfe5 属于 NAFO 组 nafo0。
# pnmrtop qfe5 nafo0 |
此算法中包含四个可调参数。
inactive_time
ping_timeout
repeat_test
slow_network
这些参数可折中处理故障检测的速度与正确性,而且这种折中处理方式可以进行调整。 有关详细信息,请参阅表 5-5。
按照此过程更改 pnmd(1M) 守护程序的缺省公共网络管理 (PNM) 值。
成为群集中任一节点上的超级用户。
如果还没有 pnmparams 文件,则创建此文件。
# vi /etc/cluster/pnmparams |
使用下表来设置 PNM 参数。
/etc/cluster/pnmparams 文件中的设置适用于节点上的所有 NAFO 组。 忽略以井号 (#) 开头的行。此文件中的其他行必须采用以下格式: variable=value.
参数 |
说明 |
---|---|
inactive_time |
当前活动适配器的包计数器在连续进行两次探测之间的秒数。 缺省值为 5。 |
ping_timeout |
ALL_HOST_MULTICAST 和子网广播 ping 的超时值(以秒为单位)。 缺省值为 4。 |
repeat_test |
在声明活动适配器有故障并触发故障转移前执行 ping 序列的次数。 缺省值为 3。 |
slow_network |
每次从执行 ping 序列之后到检查包计数器以查看是否有任何更改之间所等待的秒数。 缺省值为 2。 |
warmup_time |
从将故障转移到备份适配器后到恢复故障监视前所等待的秒数。 此设置为慢速驱动程序或缓慢的端口初始化过程保留了额外的时间。 缺省值为 0。 |
在下一次启动 pnmd 守护程序后,这些更改才生效。
以下显示了 /etc/cluster/pnmparams 文件的一个样例,其中有两个参数已不再是缺省值。
inactive_time=3 repeat_test=5 |