Sun Cluster 3.0 12/01 系统管理指南

第 5 章 管理群集互连和公共网络

本章提供管理 Sun Cluster 互连和公共网络的软件过程。

群集互连和公共网络的管理由硬件和软件过程组成。 通常,在初次安装并配置群集时,要配置群集互连和公共网络,包括 NAFO 组。 如果后来需要更改群集互连或公共网络配置,则可以使用本章中的软件过程。

以下是本章中包含的过程的列表。

有关本章中相关过程的高级说明,请参阅表 5-1表 5-3

有关群集互连和公共网络的背景和概述信息,请参阅《Sun Cluster 3.0 12/01 概念》文档。

5.1 管理群集互连

本节叙述了重新配置群集互连(诸如 cluster transport adapter 和 cluster transport cable)的过程。 这些过程要求安装 Sun Cluster 软件。

在大多数情况下,您可以使用 scsetup 实用程序来管理群集互连的群集传输。有关详细信息,请参阅 scsetup(1M) 手册页。

有关群集软件的安装过程,请参阅《Sun Cluster 3.0 12/01 软件安装指南》。有关维护群集硬件组件的过程,请参阅《Sun Cluster 3.0 12/01 Hardware Guide》。


注意:

在群集互连过程中,只要适合,一般情况下都可以使用缺省端口名。缺省端口名与电缆适配器端所在的那个节点的内部节点 ID 号相同。 但是,不能让某些适配器类型(如 SCI)使用缺省端口名。


表 5-1 任务列表:管理群集互连

任务 

有关说明,请转到... 

管理群集传输 

- 使用 scsetup

"1.4.2 如何访问 scsetup 实用程序"

检查群集互连的状态 

- 使用 scstat

"5.1.2 如何检查群集互连的状态"

添加群集传输电缆、传输适配器或传输结点 

- 使用 scsetup

"5.1.3 如何添加Cluster Transport Cable、传输适配器或传输结点"

删除群集传输电缆、传输适配器或传输结点 

- 使用 scsetup

"5.1.4 如何删除Cluster Transport Cable、传输适配器和传输结点"

启用群集传输电缆 

- 使用 scsetup

"5.1.5 如何启用Cluster Transport Cable"

禁用群集传输电缆 

- 使用 scsetup

"5.1.6 如何禁用Cluster Transport Cable"

5.1.1 动态重新配置群集互连

完成对群集互连的动态重新配置 (DR) 操作时,有几个问题必须予以考虑。


小心:小心:

Sun Cluster 要求每个群集节点都至少拥有一条通向其他各群集节点的有效路径。如果某个专用互连接口支持到任何群集节点的最后一条路径,则请勿禁用它。


对公共网络接口执行 DR 操作时,请按所示顺序完成下列过程。

表 5-2 任务表:动态重新配置公共网络接口

任务 

有关说明,请转到... 

1. 从活动的互连中禁用并删除接口 

"5.1.4 如何删除Cluster Transport Cable、传输适配器和传输结点"

2. 对公共网络接口执行 DR 操作。 

Sun Enterprise 10000 Dynamic Reconfiguration User Guide》和《Sun Enterprise 10000 Dynamic Reconfiguration Reference Manual》(出自《 Solaris 8 on Sun Hardware》集)

5.1.2 如何检查群集互连的状态

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

执行此步骤不需要作为超级用户登录。

  1. 检查群集互连的状态。


    # scstat -W
    

  2. 常见的状态消息如下所示。

    状态消息 

    说明和可能的操作 

    Path online

    此路径当前可正常工作。 不需要执行任何操作。 

    Path waiting

    当前正在初始化此路径。 不需要执行任何操作。 

    Path faulted

    此路径当前不工作。 如果路径在等待和联机状态之间,则这种情况是瞬态的。 如果重新运行 scstat -W 后,此消息依然存在,则请采取更正措施。

5.1.2.1 示例 - 检查群集互连的状态

以下示例显示了群集互连正常运行时的状态。


# scstat -W
-- Cluster Transport Paths --
                    Endpoint             Endpoint             Status
                    --------             --------             ------
  Transport path:   phys-schost-1:qfe1   phys-schost-2:qfe1   Path online
  Transport path:   phys-schost-1:qfe0   phys-schost-2:qfe0   Path online
  Transport path:   phys-schost-1:qfe1   phys-schost-3:qfe1   Path online
  Transport path:   phys-schost-1:qfe0   phys-schost-3:qfe0   Path online
  Transport path:   phys-schost-2:qfe1   phys-schost-3:qfe1   Path online
  Transport path:   phys-schost-2:qfe0   phys-schost-3:qfe0   Path online

5.1.3 如何添加Cluster Transport Cable、传输适配器或传输结点

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

  1. 确保安装了cluster transport cable(电缆本身)。

    有关安装cluster transport cable的过程,请参阅《Sun Cluster 3.0 12/01 Hardware Guide》。

  2. 成为群集中任一节点上的超级用户。

  3. 进入 scsetup 实用程序。


    # scsetup
    

    显示"Main Menu"。

  4. 通过键入 3(群集互连)来访问"Cluster Interconnect Menu"(群集互连菜单)。


    注意:

    如果配置所使用的是 SCI 适配器,则在该过程的 "添加" 操作中提示适配器连接(端口名)时,不要接受缺省设置。 应提供在 Dolphin 交换机上所找到的端口名(0、 1、 2 或 3),节点与之通过电缆以物理方式进行连接。


  5. 通过键入 1(添加传输电缆)来添加传输电缆。

    按说明输入请求的信息。

  6. 通过键入 2(向节点添加传输适配器)来添加传输适配器。

    按说明输入请求的信息。

  7. 通过键入 3(添加传输结点)来添加传输结点。

    按说明输入请求的信息。

  8. 检验是否已添加cluster transport cable、传输适配器或传输结点。


    # scconf -p | grep cable
    # scconf -p | grep adapter
    # scconf -p | grep junction
    

5.1.3.1 示例 - 添加群集传输电缆、传输适配器或传输结点

以下示例显示了如何使用 scsetup 命令向节点添加传输电缆、传输适配器或传输结点。


[Ensure the physical cable is installed.]
Become superuser on any node and place the node to be removed in maintenance state.
# scsetup
Select Cluster interconnect.
Select either Add a transport cable, Add a transport adapter to a node,
 or Add a transport junction.
Answer the questions when prompted. 
   You Will Need:         Example:
   node names             phys-schost-1
   adapter names          qfe2
   junction names         hub2
   transport type         dlpi
[Verify that the scconf command completed successfully:]
Command completed successfully.
Quit the scsetup Cluster Interconnect Menu and Main Menu.
[Verify that the cable, adapter, and junction are added:]
# scconf -p | grep cable
  Transport cable:   phys-schost-2:qfe0@1 ethernet-1@2    Enabled
  Transport cable:   phys-schost-3:qfe0@1 ethernet-1@3    Enabled
  Transport cable:   phys-schost-1:qfe0@0 ethernet-1@1    Enabled
# scconf -p | grep adapter
  Node transport adapters:                         qfe2 hme1 qfe0
  Node transport adapter:                          qfe0
  Node transport adapters:                         qfe0 qfe2 hme1
  Node transport adapter:                          qfe0
  Node transport adapters:                         qfe0 qfe2 hme1
  Node transport adapter:                          qfe0
# scconf -p | grep junction
  Cluster transport junctions:                       hub0 hub1 hub2
  Cluster transport junction:                        hub0
  Cluster transport junction:                        hub1
  Cluster transport junction:                        hub2

5.1.4 如何删除Cluster Transport Cable、传输适配器和传输结点

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

请按照以下过程从节点配置中删除群集传输电缆、传输适配器和传输结点。 禁用电缆后,电缆的两个端点仍处于已配置状态。 如果适配器正用作传输电缆的端点,则无法删除该适配器。


小心:小心:

每个群集节点至少需要一条通向群集中其他各节点的有效传输路径。 任何两个节点之间都必须有传输路径。 禁用电缆前,请务必检验节点的群集互连的状态。 仅当您确信某个电缆连接为冗余之后才可禁用它。这就是说,有另外一个连接可用。禁用节点所剩的最后一条工作电缆会使该节点脱离群集。


  1. 成为群集中任一节点上的超级用户。

  2. 检查其余群集传输路径的状态。


    # scstat -W
    


    小心:小心:

    如果在尝试删除由两个节点所组成的群集中的一个节点时收到错误消息(如 "path faulted"),请先找出问题之所在,然后再继续执行此过程。这样的问题可能表明节点路径不可用。 如果删除仅剩的那根有效路径,则会使该节点脱离群集,并可能导致重新配置群集。


  3. 进入 scsetup 实用程序。


    # scsetup
    

    显示"Main Menu"。

  4. 通过键入 3(群集互连)来访问群集互连菜单。

  5. 通过键入 4(删除传输电缆)来删除电缆。

    按说明输入请求的信息。 您需要知道所适用的节点名称、适配器名称和结点名称。


    注意:

    如果删除的是物理电缆,请断开端口与目标设备之间的电缆。


  6. 通过键入 5(从节点删除传输适配器)来删除适配器。

    按说明输入请求的信息。 您需要知道所适用的节点名称、适配器名称和结点名称。


    注意:

    如果要从节点删除物理适配器,请参阅《Sun Cluster 3.0 12/01 Hardware Guide》,以了解硬件维护过程的有关信息。


  7. 通过键入 6(删除传输结点)来删除结点。

    按说明输入请求的信息。 您需要知道所适用的节点名称、适配器名称和结点名称。


    注意:

    如果结点的任一端口正用作任一传输电缆的端点,则无法删除它。


  8. 检验是否已删除电缆或适配器。


    # scconf -p | grep cable
    # scconf -p | grep adapter
    # scconf -p | grep junction
    

    此命令的输出内容中不应出现已从指定节点删除的传输电缆或适配器。

5.1.4.1 示例 - 删除传输电缆、传输适配器或传输结点

以下示例显示了如何使用 scsetup 命令来删除传输电缆、传输适配器或传输结点。


[Become superuser on any node in the cluster.]
[Enter the utility:]
# scsetup
Type 3 (Cluster interconnect).
Select either Add a transport cable, Add a transport adapter to a node, 
or Add a transport junction.
Answer the questions when prompted.
   You Will Need:         Example:
   node names             phys-schost-1
   adapter names          qfe1
   junction names         hub1
[Verify that the scconf command completed successfully:]
"Command completed successfully."
Quit the scsetup Cluster Interconnect Menu and Main Menu.
[Verify that the cable, adapter, or junction is removed:]
# scconf -p | grep cable
  Transport cable:   phys-schost-2:qfe0@1 ethernet-1@2    Enabled
  Transport cable:   phys-schost-3:qfe0@1 ethernet-1@3    Enabled
  Transport cable:   phys-schost-1:qfe0@0 ethernet-1@1    Enabled
# scconf -p | grep adapter
  Node transport adapters:   qfe2 hme1 qfe0
  Node transport adapter:   qfe0
  Node transport adapters:   qfe0 qfe2 hme1
  Node transport adapter:   qfe0
  Node transport adapters:   qfe0 qfe2 hme1
  Node transport adapter:   qfe0
# scconf -p | grep junction
  Cluster transport junctions:     hub0 hub2
  Cluster transport junction:      hub0
  Cluster transport junction:      hub2

5.1.5 如何启用Cluster Transport Cable

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

此选项用于启用现有的群集传输电缆。

  1. 成为群集中任一节点上的超级用户。

  2. 进入 scsetup 实用程序。


    # scsetup
    

    显示"Main Menu"。

  3. 通过键入 2(群集互连)来访问群集互连菜单。

  4. 通过键入 7(启用传输电缆)来启用传输电缆。

    出现提示后按说明操作。 对于您正尝试标识的那根电缆,您需要输入它的其中一个端点的节点名称和适配器名称。

  5. 检验是否已启用该电缆。


    # scconf -p | grep cable
    

5.1.5.1 示例 - 启用群集传输电缆

此示例说明了如何启用位于节点 phys-schost-2 的适配器 qfe-1 上的群集传输电缆。


[Become superuser on any node.]
[Enter the scsetup utility:]
# scsetup
Select Cluster interconnect>Enable a transport cable.
Answer the questions when prompted.
You will need the following information.
   You Will Need:         Example:
   node names             phys-schost-2
   adapter names          qfe1
   junction names         hub1
[Verify that the scconf command completed successfully:]
 
scconf -c -m endpoint=phys-schost-2:qfe1,state=enabled
 
Command completed successfully.
Quit the scsetup Cluster Interconnect Menu and Main Menu.
[Verify that the cable is enabled:]
# scconf -p | grep cable
  Transport cable:   phys-schost-2:qfe1@0 ethernet-1@2    Enabled
  Transport cable:   phys-schost-3:qfe0@1 ethernet-1@3    Enabled
  Transport cable:   phys-schost-1:qfe0@0 ethernet-1@1    Enabled

5.1.6 如何禁用Cluster Transport Cable

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

您可能需要禁用群集传输电缆,以便临时关闭群集互连路径。 这在排除群集互连的故障或更换群集互连硬件时很有用。

禁用电缆后,电缆的两个端点仍处于已配置状态。 如果适配器仍用作传输电缆的一个端点,则无法删除该适配器。


小心:小心:

每个群集节点至少需要一条通向群集中其他各节点的有效传输路径。 任何两个节点之间都必须有传输路径。 禁用电缆前,请务必检验节点的群集互连的状态。 仅当您确信某个电缆连接为冗余之后才可禁用它。这就是说,有另外一个连接可用。禁用节点所剩的最后一条工作电缆会使该节点脱离群集。


  1. 成为群集中任一节点上的超级用户。

  2. 禁用电缆前,请检查群集互连的状态。


    # scstat -W
    


    小心:小心:

    如果在尝试删除由两个节点所组成的群集中的一个节点时收到错误消息(如 "path faulted"),请先找出问题之所在,然后再继续执行此过程。这样的问题可能表明节点路径不可用。 如果删除仅剩的那根有效路径,则会使该节点脱离群集,并可能导致重新配置群集。


  3. 进入 scsetup 实用程序。


    # scsetup
    

    显示"Main Menu"。

  4. 通过键入 3(群集互连)来访问群集互连菜单。

  5. 通过键入 8(禁用传输电缆)来禁用电缆。

    按说明输入请求的信息。 这时将禁用此群集互连中的所有组件。 对于您正尝试标识的那根电缆,您需要输入它的其中一个端点的节点名称和适配器名称。

  6. 检验是否已禁用电缆。


    # scconf -p | grep cable
    

5.1.6.1 示例 - 禁用群集传输电缆

此示例说明了如何禁用位于节点 phys-schost-2 的适配器 qfe-1 上的群集传输电缆。


[Become superuser on any node.]
[Enter the scsetup utility:]
# scsetup
Select Cluster interconnect>Disable a transport cable.
Answer the questions when prompted.
You will need the following information.
   You Will Need:         Example:
   node names             phys-schost-2
   adapter names          qfe1
   junction names         hub1
[Verify that the scconf command completed successfully:]
 
scconf -c -m endpoint=phys-schost-2:qfe1,state=disabled
 
Command completed successfully.
Quit the scsetup Cluster Interconnect Menu and Main Menu.
[Verify that the cable is disabled:]
# scconf -p | grep cable
  Transport cable:   phys-schost-2:qfe1@0 ethernet-1@2    Disabled
  Transport cable:   phys-schost-3:qfe0@1 ethernet-1@3    Enabled
  Transport cable:   phys-schost-1:qfe0@0 ethernet-1@1    Enabled

5.2 管理公共网络

如果需要改变公共网络配置,可按照本节中的软件过程进行。

管理公共网络适配器时,请注意以下事项:

有关群集软件的安装过程,请参阅《Sun Cluster 3.0 12/01 软件安装指南》。有关维护公共联网硬件组件的过程,请参阅《Sun Cluster 3.0 12/01 Hardware Guide》。

表 5-3 任务表:管理公共网络

任务 

有关说明,请转到... 

在节点上创建 NAFO 组 

"5.2.2 如何创建 NAFO 组"

向节点添加更多的公共网络适配器 

"5.2.3 如何向 NAFO 组添加适配器"

删除 NAFO 组 

"5.2.4 如何删除 NAFO 组"

从现有的 NAFO 组中删除备份适配器 

"5.2.5 如何从 NAFO 组中删除适配器"

将活动的适配器切换到备份的适配器 

"5.2.6 如何切换 NAFO 组的活动适配器"

检查 NAFO 组的状态 

"5.2.7 如何检查 NAFO 组的状态"

更改参数以调整 PNM 故障检测和故障转移进程 

"5.2.8 如何更改公共网络管理可调参数"

5.2.1 动态重新配置公共网络接口

在完成对群集中的公共网络进行动态重新配置 (DR) 操作时,有几个问题必须予以考虑。


小心:小心:

在对已禁用的网络适配器执行 DR 删除操作期间,如果活动的网络适配器发生故障,则说明可用性受到了影响。在 DR 操作期间,活动的适配器没有地方可转移故障。


对公共网络接口执行 DR 操作时,请按所示顺序完成下列过程。

表 5-4 任务表:动态重新配置公共网络接口

任务 

有关说明,请转到... 

1. 将活动适配器切换到备份适配器。这样,就可以从 NAFO 组中将它删除。  

"5.2.6 如何切换 NAFO 组的活动适配器"

2. 从 NAFO 组中删除该适配器。 

"5.2.5 如何从 NAFO 组中删除适配器"

3. 对公共网络接口执行 DR 操作。  

Sun Enterprise 10000 Dynamic Reconfiguration User Guide》和《Sun Enterprise 10000 Dynamic Reconfiguration Reference Manual》(出自《 Solaris 8 on Sun Hardware》集)

5.2.2 如何创建 NAFO 组

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

  1. 创建 NAFO 组时,请注意以下要求:

    • 必须对所有公共网络适配器进行配置,使它们属于某个 NAFO 组。

    • 对于任一给定的节点,在给定的子网上最多只能有一个 NAFO 组。

    • 给定的 NAFO 组中的所有适配器必须连接到同一子网上。

    • 在给定的 NAFO 组中,只能有一个适配器具有主机名关联,即 /etc/hostname. adapter 文件。

    • 一个公共网络适配器只能属于一个 NAFO 组。

  2. 在要为 NAFO 组配置的那个节点上成为超级用户。

  3. 对于此节点,找出所有与同一子网进行物理连接的公共网络适配器。

    这些适配器成为 NAFO 组的备份适配器。

  4. 为其中的一个公共网络适配器创建 /etc/hostname.adapter 文件(如果尚未创建该文件)。

    该文件中所指定的适配器将成为 NAFO 组的缺省活动适配器。


    # vi /etc/hostname.<adapter>
    phys-schost-1

  5. 编辑 /etc/inet/hosts 文件,以添加分配给公共网络适配器的 IP 地址和相应的主机名。

    例如,以下显示了添加到 /etc/inet/hosts 文件的 IP 地址 192.29.75.101 和主机名 phys-schost-1


    # vi /etc/inet/hosts
    192.29.75.101   phys-schost-1


    注意:

    如果使用了命名服务,则命名服务数据库中也应该有这些信息。


  6. 创建 NAFO 组。


    # pnmset -c nafo-group -o create adapter [adapter ...]

    -c nafo-group

    对指定的 NAFO 组执行配置子命令。 必须将 NAFO 组命名为 nafoN,其中 N 是一个非负的整数,用来标识该组。 对每个节点而言,组名都是本地名称。 因而,同一 NAFO 组名可在多个节点上使用。

    -o create

    创建新的 NAFO 组。

    adapter [ adapter ... ]

    指定用作备份适配器的公共网络适配器。 请参阅步骤 3


    注意:

    如果已经配置了一个适配器,则该适配器将被选定为活动适配器,并且 pnmset 命令不会改变其状态。 否则,将需要配置一个备份适配器并将在 NAFO 组的 /etc/hostname. adapter 文件中找到的 IP 地址分配给它。


  7. 检验该 NAFO 组的状态。


    # pnmstat -l
    

5.2.2.1 示例 - 创建 NAFO 组

以下示例显示了创建一个 NAFO 组 (nafo0) 的过程,该 NAFO 组配有两个网络适配器(qfe0qfe1)。


# pnmstat -l
# vi /etc/hostname.qfe0
phys-schost-1
# vi /etc/inet/hosts
192.168.0.0   phys-schost-1
# pnmset -c nafo0 -o create qfe0 qfe1
# pnmstat -l
group   adapters       status   fo_time   act_adp
nafo0   qfe0:qfe1       OK      NEVER     qfe0

5.2.3 如何向 NAFO 组添加适配器

您可以向现有的 NAFO 组添加适配器,以便为 NAFO 组提供额外的备份适配器,从而提高群集节点的公共网络连接的可用性。

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

  1. 您是否需要在节点中安装新的公共网络适配器卡?

    • 如果是,请参阅《Sun Cluster 3.0 12/01 Hardware Guide》 的有关说明。

    • 如果否,请继续步骤 2

  2. 确保要添加到 NAFO 组中的适配器与 NAFO 组的活动适配器连接到同一子网上。

  3. 确保该适配器未经配置,且没有关联的 /etc/hostname.adapter 文件。

  4. 成为要添加新适配器的 NAFO 组所在节点上的超级用户。

  5. 向 NAFO 组添加适配器。


    # pnmset -c nafo-group -o add adapter
    

    -c nafo-group

    指定要添加新适配器的 NAFO 组。

    -o add adapter

    指定要添加到指定的 NAFO 组的公共网络适配器。

  6. 检验该 NAFO 组的状态。


    # pnmstat -l
    

5.2.3.1 示例 - 向 NAFO 组添加额外的公共网络适配器

以下示例说明了向已包含两个适配器(qfe0qfe1)的 NAFO 组 nafo0 添加额外适配器 qfe2 的过程。


# pnmstat -l
group   adapters        status   fo_time  act_adp
nafo0   qfe0:qfe1        OK      NEVER    qfe0
# pnmset -c nafo0 -o add qfe2
# pnmstat -l
group   adapters        status   fo_time  act_adp
nafo0   qfe0:qfe1:qfe2   OK      NEVER    qfe0

5.2.4 如何删除 NAFO 组

如果您不想对 NAFO 组中的任何适配器进行监视和故障转移,请删除该 NAFO 组。 要想能够删除 NAFO 组,逻辑主机资源组或共享地址资源组不得使用该组。

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

  1. 成为包含要删除的 NAFO 组的节点的超级用户。

  2. 确定是否有任何逻辑主机资源或共享地址资源正在使用 NAFO 组。


    # scrgadm -pv
    

    您还可以使用 scrgadm-pvv(带有两个 v 标志)来确定那些正在使用将要删除的 NAFO 组的资源。

  3. 切换使用该 NAFO 组的逻辑主机资源组和共享地址资源。


    # scswitch -z -g resource-group -h nodelist
    

    -z -g resource-group

    切换指定的资源组。

    -h nodelist

    指定要将资源组切换到的节点的名称。

  4. 删除 NAFO 组。


    # pnmset -c nafo-group -o delete 
    

    -c nafo-group

    指定要删除的 NAFO 组。

    -o delete

    删除 NAFO 组。

  5. 检验该 NAFO 组的状态。

    列表中不应出现已删除的 NAFO 组。


    # pnmstat -l
    

5.2.4.1 示例 - 删除 NAFO 组

以下示例显示了从系统中删除名为 nafo1 的 NAFO 组的过程。 先将使用该 NAFO 组的逻辑主机资源组 lh-rg-1 切换到另外一个节点上。


# scswitch -z -g lh-rg-1 -h phys-schost-2
# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1       OK      NEVER    qfe0
nafo1   qfe2            OK      NEVER    qfe2
# pnmset -c nafo1 -o delete
# pnmstat -l
group   adapters        status  fo_time  act_adp
nafo0   qfe0:qfe1        OK     NEVER    qfe0

5.2.5 如何从 NAFO 组中删除适配器

从现有的 NAFO 组中删除备份适配器,以便能够从系统中删除该适配器、更换该适配器、使该适配器重新连接到另一子网并用作另一个 NAFO 组的备份适配器。

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。


小心:小心:

如果从 NAFO 组中删除最后一个备份适配器,其结果是无法对活动的适配器上检测到的故障提供保护措施,从而降低群集节点的公共网络可用性。


  1. 如果要删除活动适配器,请首先切换到该组中的另一适配器。

    请参阅"5.2.6 如何切换 NAFO 组的活动适配器"

  2. 以超级用户的身份将适配器从 NAFO 组中删除。


     # pnmset -c nafo-group -o remove adapter
    

    -c nafo-group

    指定要从其中删除适配器的 NAFO 组。

    -o remove adapter

    从 NAFO 组中删除适配器。

  3. 检验该 NAFO 组的状态。

    已删除的适配器不应出现在 NAFO 组的列表中。


    # pnmstat -l
    

5.2.5.1 示例 - 从 NAFO 组中删除适配器

以下示例显示了从 NAFO 组 nafo0 中删除适配器 qfe2 的过程。


# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1:qfe2  OK      NEVER    qfe0
# pnmset -c nafo0 -o remove qfe2
# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1       OK      NEVER    qfe0

5.2.6 如何切换 NAFO 组的活动适配器

将活动适配器切换到一个备份适配器,以便能够从 NAFO 组中删除当前活动适配器。 pnmd(1M) 守护程序以类似于由于故障触发的适配器故障转移的方式将当前活动适配器主管的所有 IP 地址移到新的活动适配器。

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。


注意:

切换过程中,连接可能会经历短暂的延迟。 延迟可能会持续数分钟。 否则,该操作对高级应用程序是透明的。


  1. 确保新的活动适配器的物理连通性与当前活动适配器的物理连通性相同。

    如果该新的活动适配器无法作为当前活动适配器管理某些 IP 地址,则依赖那些 IP 地址的网络服务和数据服务将会中断,直到物理连接得以修复或之后成功地进行了故障转移才恢复正常。

  2. 成为要切换其活动适配器的 NAFO 组所在节点的超级用户。

  3. 切换活动适配器。


     # pnmset -c nafo-group -o switch adapter
    

    -c nafo-group

    指定包含有要切换的适配器的 NAFO 组。

    -o switch adapter

    使指定的适配器成为 NAFO 组中的活动适配器。

    • 如果此更改是临时的,并且您不希望在重新引导节点后保留它,请转到步骤 5

    • 如果此更改是永久的,而且您希望重新引导节点后仍然保留它,请转到步骤 4

  4. 重命名旧活动适配器的 etc/hostname.adapter 文件,以反映新的活动适配器。


    # mv /etc/hostname.<old_adapter> /etc/hostname.<new_adapter>

  5. 检验该 NAFO 组的状态。

    "作为切换目标"的那个适配器现在就应显示为活动适配器。


    # pnmstat -l
    

5.2.6.1 示例 - 切换 NAFO 组的活动适配器

以下示例说明了将活动适配器从 qfe0 切换到 qfe1 的过程。


# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1       OK      NEVER    qfe0
# pnmset -c nafo0 -o switch qfe1
# mv /etc/hostname.qfe0 /etc/hostname.qfe1
# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1       OK      11       qfe1

5.2.7 如何检查 NAFO 组的状态

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

    运行 pnmstat(1M) 命令,列出某个节点上所有 NAFO 组的当前设置和状态的有关信息。


    # pnmstat -l
    

您还可以使用 pnmptor(1M)pnmrtop(1M) 命令来获取有关适配器的信息。

5.2.7.1 示例 - 检查 NAFO 组的状态

以下示例显示了某个节点的三个 NAFO 组的状态。


# pnmstat -l
Group   adapters        status  fo_time act_adp 
nafo0   qfe5            OK      NEVER   qfe5 
nafo1   qfe6            OK      NEVER   qfe6 
nafo2   qfe7            OK      NEVER   qfe7 

5.2.7.2 示例 - 查找 NAFO 组的活动适配器

以下示例显示了 NAFO 组 nafo0 中的活动适配器是 qfe5 适配器。


# pnmptor nafo0
qfe5

5.2.7.3 示例 - 查找适配器的 NAFO 组

以下示例显示适配器 qfe5 属于 NAFO 组 nafo0


# pnmrtop qfe5
nafo0

5.2.8 如何更改公共网络管理可调参数

此算法中包含四个可调参数。

这些参数可折中处理故障检测的速度与正确性,而且这种折中处理方式可以进行调整。 有关详细信息,请参阅表 5-5

按照此过程更改 pnmd(1M) 守护程序的缺省公共网络管理 (PNM) 值。

  1. 成为群集中任一节点上的超级用户。

  2. 如果还没有 pnmparams 文件,则创建此文件。


    # vi /etc/cluster/pnmparams
    

  3. 使用下表来设置 PNM 参数。


    注意:

    /etc/cluster/pnmparams 文件中的设置适用于节点上的所有 NAFO 组。 忽略以井号 (#) 开头的行。此文件中的其他行必须采用以下格式: variable=value.


    表 5-5 公共网络管理可调参数

    参数 

    说明 

    inactive_time

    当前活动适配器的包计数器在连续进行两次探测之间的秒数。 缺省值为 5。 

    ping_timeout

    ALL_HOST_MULTICAST 和子网广播 ping 的超时值(以秒为单位)。 缺省值为 4。

    repeat_test

    在声明活动适配器有故障并触发故障转移前执行 ping 序列的次数。 缺省值为 3。 

    slow_network

    每次从执行 ping 序列之后到检查包计数器以查看是否有任何更改之间所等待的秒数。 缺省值为 2。 

    warmup_time

    从将故障转移到备份适配器后到恢复故障监视前所等待的秒数。 此设置为慢速驱动程序或缓慢的端口初始化过程保留了额外的时间。 缺省值为 0。 


    注意:

    在下一次启动 pnmd 守护程序后,这些更改才生效。


5.2.8.1 示例 - 更改公共网络管理可调参数

以下显示了 /etc/cluster/pnmparams 文件的一个样例,其中有两个参数已不再是缺省值。


inactive_time=3
repeat_test=5