Sun Cluster 3.0 系统管理指南

第 5 章 管理群集互连和公共网络

本章提供管理 Sun Cluster 互连和公共网络的软件过程。

群集互连和公共网络的管理由硬件和软件操作过程组成。通常您在初始安装并配置群集时配置群集 互连和公共网络,包括 NAFO 组。如果后来需要改变群集互连或公共网络配置,可以使用本章中的软件操作过程。

以下是本章中包含的过程的列表。

有关本章中相关过程的高级别说明,请 参见 表 5-1表 5-2

有关群集互连和公共网络的背景和概要信息,请参考 Sun Cluster 3.0 概念 文档。

5.1 管理群集互连

本节提供有关重新配置群集互连(如 cluster transport adapter 和 cluster transport cable)的过程。这些过程需要您 安装 Sun Cluster 软件。

大多数时候,您可以使用 scsetup 公用程序来管理群集互连的群集传输。有关详细信息,请参见 scsetup(1M) 手册页。

有关群集软件安装过程,请参见 Sun Cluster 3.0 安装指南。有关群集硬件组件维护的过程,请参见 Sun Cluster 3.0 Hardware Guide

表 5-1 任务图:管理群集互连

任务 

有关说明,请转到... 

管理群集传输 

- 使用 scsetup

"1.5.2 如何访问 scsetup 公用程序"

检查群集互连的状态 

- 使用 scstat

"5.1.1 如何检查群集互连的状态"

添加群集传输电缆或传输适配器 

- 使用 scsetup

"5.1.2 如何添加Cluster Transport Cable和传输适配器"

移除一个群集传输电缆或传输适配器 

- 使用 scsetup

"5.1.3 如何添加Cluster Transport Cable和传输适配器"

启用群集传输电缆 

- 使用 scsetup

"5.1.4 如何启用Cluster Transport Cable"

禁用群集传输电缆 

- 使用 scsetup

"5.1.5 如何禁用Cluster Transport Cable "

5.1.1 如何检查群集互连的状态

执行此步骤不需要作为超级用户登录。

  1. 检查群集互连的状态。


    # scstat -W
    
  2. 有关一般状态消息,请参考以下内容。

    状态消息 

    描述和可能的操作 

    Path online

    此路径当前运行正常。不需要采取任何步骤。 

    Path waiting

    当前正在初始化此路径。不需要采取任何步骤。 

    Path faulted

    此路径当前不工作。请采取纠正措施。 

5.1.1.1 示例-检查群集互连的状态

以下示例展示当前运行的群集互连的状态。


# scstat -W
-- Cluster Transport Paths --
                    Endpoint             Endpoint             Status
                    --------             --------             ------
  Transport path:   phys-schost-1:qfe1   phys-schost-2:qfe1   Path online
  Transport path:   phys-schost-1:qfe0   phys-schost-2:qfe0   Path online
  Transport path:   phys-schost-1:qfe1   phys-schost-3:qfe1   Path online
  Transport path:   phys-schost-1:qfe0   phys-schost-3:qfe0   Path online
  Transport path:   phys-schost-2:qfe1   phys-schost-3:qfe1   Path online
  Transport path:   phys-schost-2:qfe0   phys-schost-3:qfe0   Path online

5.1.2 如何添加Cluster Transport Cable和传输适配器

  1. 确保已安装物理cluster transport cable。

    有关安装cluster transport cable的过程,请参见 Sun Cluster 3.0 Hardware Guide

  2. 成为群集中任一节点上的超级用户。

  3. 执行 scsetup 公用程序。


    # scsetup
    

    出现主菜单。

  4. 通过输入 2(群集互连)访问群集互连菜单。

  5. 通过输入 1(添加传输电缆)来添加电缆。

    按说明操作并输入系统请求的信息。在拥有两个节点的群集中进行直接连接不需要结点。但 是,您需要输入您尝试标识的电缆的一个端点的节点名称和适配器名称。


    >>> Add a Cluster Transport Cable <<<
        ...
        Is it okay to continue (yes/no) [yes]? <Return>
        ...
        To which node do you want to add the cable?  nodename
        Name of the adapter to use on "node"?  adaptername
        Name of the junction at the other end of the cable?  junctionname
        Okay to use the default for this cable connection [yes]? <Return>
        Is it okay to proceed with the update (yes/no) [yes]? <Return>
    
  6. 通过输入 2(添加传输适配器到节点)。

    按说明操作并输入系统请求的信息。在拥有两个节点的群集中进行直接连接不需要结点。但 是,您需要输入您尝试标识的电缆的一个端点的节点名称和适配器名称。


    >>> Add a Cluster Transport Adapter <<<
        ...
        Is it okay to continue (yes/no) [yes]? <Return>
        ...
        To which node do you want to add the cable?  nodename
        Name of the adapter to use on "node"?  adaptername
        Name of the junction at the other end of the cable?  junctionname
        Okay to use the default for this cable connection [yes]? <Return>
        Is it okay to proceed with the update (yes/no) [yes]? <Return>
    
  7. 检验是否已添加cluster transport cable或传输适配器。


    # scconf -p | grep cable
    # scconf -p | grep adapter
    

5.1.2.1 示例-添加群集传输电缆和传输适配器

以下示例展示如何使用 scsetup 命令为一个节点添加一个传输电缆或传输适配器。


[Ensure the physical cable is installed.]
[Become superuser on a node in the cluster.]
[Execute the scsetup utility:]
# scsetup
[Enter option 2:]
*** Main Menu ***
    Please select from one of the following options:
    ...
      2) Cluster interconnect
    ...    Option: 2
[Enter option 1 to add a cable:]
*** Cluster Interconnect Menu ***
    Please select from one of the following options:
    ...
    1) Add a transport cable
    ...
    Option: 1
[Enter the requested information:]
>>> Add a Cluster Transport Cable <<<
    ...
    Is it okay to continue (yes/no) [yes]? <Return>	.
    ...
    To which node is the cable attached? phys-schhost-2
    Name of the adapter on "phys-schost-2"? qfe-0
    Is it okay to proceed with the update (yes/no) [yes]? <Return>	.
scconf -a -m endpoint=phys-schost-2:hme1,endpoint=hub0
    Command completed successfully.    Hit ENTER to continue: <Return>
[Enter option 2 to add an adapter:]
*** Cluster Interconnect Menu ***
    Please select from one of the following options:
    ...
    2) Add a transport adapter to a node
    ...
    Option: 2
[Enter the requested information:]
>>> Add a Cluster Transport Adapter <<<
    ...
    Is it okay to continue (yes/no) [yes]? <Return>	.
    ...
    To which node is the cable attached? phys-schhost-2
    Name of the adapter on "phys-schost-2"? qfe-0
    Is it okay to proceed with the update (yes/no) [yes]? <Return>	.
scconf -a -m endpoint=phys-schost-2:hme1,endpoint=hub0
    Command completed successfully.    Hit ENTER to continue: <Return>
[Verify that the cable and adapter are added:]
# scconf -p | grep cable
  Transport cable:   phys-schost-2:qfe0@1 ethernet-1@2    Enabled
  Transport cable:   phys-schost-3:qfe0@1 ethernet-1@3    Enabled
  Transport cable:   phys-schost-1:qfe0@0 ethernet-1@1    Enabled
# scconf -p | grep adapter
  Node transport adapters:                         qfe2 hme1 qfe0
  Node transport adapter:                          qfe0
  Node transport adapters:                         qfe0 qfe2 hme1
  Node transport adapter:                          qfe0
  Node transport adapters:                         qfe0 qfe2 hme1
  Node transport adapter:                          qfe0

5.1.3 如何添加Cluster Transport Cable和传输适配器

使用以下过程从节点中移除群集传输电缆和群集传输适配器。当禁用一个电缆后,电缆的两个端点 仍处于已配置状态。如果一个适配器仍用作一个传输电缆的一个端点,则无法移除该适配器。


小心:小心:

一个群集节点要成为一个群集的成员,至少需要有一个使用中的电缆连接到 群集互连。每次禁用一个电缆前,都要检验节点的群集互连的状态。对于一个电缆连接,只有验证了它是 冗余的(即除它之外还有另外一个连接),才予以禁用。禁用节点所剩的最后一个工作电缆会使节点 脱离群集。


  1. 成为群集中任一节点上的超级用户。

  2. 检查尚存的群集传输路径的状态。


    # scstat -W
    

    小心:小心:

    如果在尝试移除由两个节点组成的群集的一个节点时接收到一个 错误(如 "path faulted"),请在继续进行此过程前调研该问题。这样一个问题可能 表明一个节点路径不可用。如果移除所剩的正常路径,则会使节点脱离群集,并可能导致群集重新配置。


  3. 执行 scsetup 公用程序。


    # scsetup
    

    出现主菜单。

  4. 通过输入 2(群集互连)访问群集互连菜单。

  5. 通过输入 4(移除一个传输电缆)移除传输电缆。

    按说明操作并输入系统请求的信息。您需要输入您尝试标识的电缆的一个端点的节点名称和适配器名称。


    *** Cluster Interconnect Menu ***
        Please select from one of the following options:
        ...
        4) Remove a transport cable
        ...
        Option: 4
        ...
    >>> Remove a Cluster Transport Cable <<<
        ...
        Is it okay to continue (yes/no) [yes]? <Return>
        ...
        To which node is the cable attached? nodename
        Name of the adapter on "node"? adaptername
        Is it okay to proceed with the update (yes/no) [yes]? <Return>
        ...
        Command completed successfully.    Hit ENTER to continue: <Return>
    

    注意:

    如果您要移除一个物理电缆,请断开端口与目标设备之间的电缆。


  6. 要移除一个适配器,请输入 5(从一个节点移除一个传输适配器)。

    按说明操作并输入系统请求的信息。您需要输入您尝试标识的电缆的一个端点的节点名称和适配器名称。


    *** Cluster Interconnect Menu **    Please select from one of the following options:
        ...
        5) Remove a transport adapter
        ...
        Option: 5
        ...
    >>> Remove a Cluster Transport Adapter <<<
        ...
        Is it okay to continue (yes/no) [yes]? <Return>
        ...
        To which node is the cable attached? nodename
        Name of the adapter on "node"? adaptername
        Is it okay to proceed with the update (yes/no) [yes]? <Return>
        ...
        Command completed successfully.    Hit ENTER to continue: <Return>
    

    注意:

    如果您要从节点移除一个物理适配器,请参见 Sun Cluster 3.0 Hardware Guide 中的硬件维护过程。


  7. 检验是否已移除电缆或适配器。


    # scconf -p | grep cable
    # scconf -p | grep adapter
    

    此命令的输出中不应出现已从给定节点移除的传输电缆或适配器。

5.1.3.1 示例-移除传输电缆或传输适配器

以下示例展示如何使用 scsetup 命令来移除一个传输电缆或传输适配器。


[Become superuser on a node in the cluster.]
[Execute the scsetup utility:]
# scsetup
[Enter option 2:]
*** Main Menu ***
    Please select from one of the following options:
    ...
      2) Cluster interconnect
    ...    Option: 2
[Enter option 4 to remove a cable:]
*** Cluster Interconnect Menu ***
    Please select from one of the following options:
    ...
      4) Remove a transport cable
    ...
    Option: 4
[Enter the requested information:]
>>> Remove a Cluster Transport Cable <<<
    ...
    Is it okay to continue (yes/no) [yes]? <Return>	.
    ...
    To which node is the cable attached? phys-schhost-2
    Name of the adapter on "phys-schost-2"? qfe-0
    Is it okay to proceed with the update (yes/no) [yes]? <Return>	.
scconf -a -m endpoint=phys-schost-2:hme1,endpoint=hub0
    Command completed successfully.    Hit ENTER to continue: <Return>
[Enter option 5 to remove an adapter:]
*** Cluster Interconnect Menu ***
    Please select from one of the following options:
    ...
      5) Remove a transport adapter from a node
    ...
    Option: 5
[Enter the requested information:]
>>> Remove a Cluster Transport Adapter <<<
    ...
    Is it okay to continue (yes/no) [yes]? <Return>	.
    ...
    To which node is the cable attached? phys-schhost-2
    Name of the adapter on "phys-schost-2"? qfe-0
    Is it okay to proceed with the update (yes/no) [yes]? <Return>	.
 
scconf -r -m endpoint=phys-schost-2:hme1
 
    Command completed successfully.    Hit ENTER to continue: <Return>
[Verify that the cable or adapter is removed:]
# scconf -p | grep cable
  Transport cable:   phys-schost-2:qfe0@1 ethernet-1@2    Enabled
  Transport cable:   phys-schost-3:qfe0@1 ethernet-1@3    Enabled
  Transport cable:   phys-schost-1:qfe0@0 ethernet-1@1    Enabled
# scconf -p | grep adapter
  Node transport adapters:   qfe2 hme1 qfe0
  Node transport adapter:   qfe0
  Node transport adapters:   qfe0 qfe2 hme1
  Node transport adapter:   qfe0
  Node transport adapters:   qfe0 qfe2 hme1
  Node transport adapter:   qfe0

5.1.4 如何启用Cluster Transport Cable

此选项用于启用一个现有的群集传输电缆。

  1. 成为群集中任一节点上的超级用户。

  2. 输入 scsetup 公用程序。


    # scsetup
    

    出现主菜单。

  3. 通过输入 2(群集互连)访问群集互连菜单。

  4. 通过输入 7(启用传输电缆)来启用传输电缆。

    得到提示后按说明操作。您需要输入您尝试标识的电缆的一个端点的节点名称和适配器名称。

  5. 检验是否已启用电缆。


    # scconf -p | grep cable
    

5.1.4.1 示例-禁用群集传输电缆

此示例展示如何启用在节点 phys-schost-2 上的 适配器 qfe-1 上的群集传输电缆。


[Become superuser on any node.]
[Enter the scsetup utility:]
# scsetup
[Enter option 7:]
*** Cluster Interconnect Menu ***
    Please select from one of the following options:
    ...
      7) Enable a transport cable
    ...
    Option: 7
[Enter the requested information:]
>>> Enable a Cluster Transport Cable <<<
    ...
    Is it okay to continue (yes/no) [yes]? <Return>
    ...
    To which node is the cable attached? phys-schhost-2
    Name of the adapter on "phys-schost-2"? qfe-1
    Is it okay to proceed with the update (yes/no) [yes]? <Return>
 
scconf -c -m endpoint=phys-schost-2:qfe1,state=enabled
 
    Command completed successfully.
    Hit ENTER to continue: <Return>
[Verify that the cable is enabled:]
# scconf -p | grep cable
  Transport cable:   phys-schost-2:qfe1@0 ethernet-1@2    Enabled
  Transport cable:   phys-schost-3:qfe0@1 ethernet-1@3    Enabled
  Transport cable:   phys-schost-1:qfe0@0 ethernet-1@1    Enabled

5.1.5 如何禁用Cluster Transport Cable

可能需要禁用一个群集传输电缆,以便临时关闭一个群集互连路径。这在排查群集互连故障 或更换群集硬件时有用。

当禁用一个电缆后,电缆的两个端点 仍处于已配置状态。如果一个适配器仍用作一个传输电缆的一个端点,则无法移除该适配器。


小心:小心:

一个群集节点要成为一个群集的成员,至少需要有一个使用中的电缆连接到 群集互连。每次禁用一个电缆前,都要检验节点的群集互连的状态。对于一个电缆连接,只有验证了它是 冗余的(即除它之外还有另外一个连接),才予以禁用。禁用节点所剩的最后一个工作电缆会使节点 脱离群集。


  1. 成为群集中任一节点上的超级用户。

  2. 在禁用一个电缆前检查群集互连的状态。


    # scstat -W
    

    小心:小心:

    如果在尝试移除由两个节点组成的群集的一个节点时接收到一个 错误(如 "path faulted"),请在继续进行此过程前调研该问题。这样一个问题可能 表明一个节点路径不可用。如果移除所剩的正常路径,则会使节点脱离群集,并可能导致群集重新配置。


  3. 输入 scsetup 公用程序。


    # scsetup
    

    出现主菜单。

  4. 通过输入 2(群集互连)访问群集互连菜单。

  5. 通过输入 8(禁用一个传输电缆)。

    按说明操作并输入系统请求的信息。将禁用此群集互连上的所有组件。您需要输入您尝试标识的电缆的一个端点的节点名称和适配器名称。

  6. 检验是否已禁用电缆。


    # scconf -p | grep cable
    

5.1.5.1 示例-禁用群集传输电缆

此示例展示如何禁用在节点 phys-schost-2 上的 适配器 qfe-1 上的群集传输电缆。


[Become superuser on any node.]
[Enter the scsetup utility:]
# scsetup
[Enter option 8:]
*** Cluster Interconnect Menu ***
    Please select from one of the following options:
    ...
      8) Disable a transport cable
    ...
    Option: 8
[Enter the requested information:]
>>> Disable a Cluster Transport Cable <<<
    ...
    Is it okay to continue (yes/no) [yes]? <Return>
    ...
    To which node is the cable attached? phys-schhost-2
    Name of the adapter on "phys-schost-2"? qfe-1
    Is it okay to proceed with the update (yes/no) [yes]? <Return>

scconf -c -m endpoint=phys-schost-2:qfe1,state=disabled

    Command completed successfully.
    Hit ENTER to continue: <Return>
[Verify that the cable is disabled:]
# scconf -p | grep cable
  Transport cable:   phys-schost-2:qfe1@0 ethernet-1@2    Disabled
  Transport cable:   phys-schost-3:qfe0@1 ethernet-1@3    Enabled
  Transport cable:   phys-schost-1:qfe0@0 ethernet-1@1    Enabled

5.2 管理公共网络

如果需要改变一个公共网络配置,则可按照本节中的软件操作过程来进行。

在管理公共网络适配器时,请注意以下几点:

有关群集软件安装过程,请参见 Sun Cluster 3.0 安装指南。有关维护公共联网硬件组件的过程,请 参见 Sun Cluster 3.0 Hardware Guide

表 5-2 任务图:管理公共网络

任务 

有关说明,请转到... 

在一个节点上创建一个 NAFO 组。 

"5.2.1 如何创建一个 NAFO 组"

为一个节点添加更多公共网络适配器以增强公共网络的可用性。 

"5.2.3 如何为 NAFO 组添加适配器"

删除一个 NAFO 组,这样就不再监视组中的任何适配器,这些适配器也不再失败切换。 

"5.2.2 如何删除 NAFO 组"

从一个现有 的 NAFO 组移除备份适配器,以便更换从系统中移除的适配器,或者使该适配器重新连接到另一子网并 用作另一 NAFO 组的备份。 

"5.2.4 如何从 NAFO 组中移除适配器"

将活动适配器切换到一个备份适配器,以便能够从 NAFO 组中移除当前活动 适配器。 

"5.2.5 如何切换 NAFO 组的活动适配器"

检查 NAFO 组的状态。 

"5.2.6 如何检查 NAFO 组的状态"

更改参数以调整 PNM 故障检测和失败切换进程。 

"5.2.7 如何更改公共网络管理可调整参数"

5.2.1 如何创建一个 NAFO 组

  1. 注意创建 NAFO 组的以下要求:

    • 所有的公共网络适配器都必须配置,从而归属于某个 NAFO 组。

    • 对于任一给定的节点,在一个给定的子网上最多只能有一 NAFO 组。

    • 一个给定的 NAFO 组中的所有适配器都必须连接到同一子网。

    • 在一个给定的 NAFO 组中,只能有一个适配器有一个主机名关联,即 一个 /etc/hostname.adapter 文件。

    • 一个公共网络适配器仅能属于一个 NAFO 组。

  2. 在要为 NAFO 组配置的节点上成为一个超级用户。

  3. 对于此节点,找出物理连接到同一子网的公共网络适配器。

    这些适配器成了 NAFO 组的备份适配器。

  4. 确定您是否需要为公共网络适配器之一创建 一个 /etc/hostname.adapter 文件。

    • 如果不需要(该文件已存在),请继续 进行步骤 5

    • 如果需要(尚不存在该文件),请创建该文件,并将公共网络适配器 的 IP 地址的主机名添加到该文件中。例如:


    # vi /etc/hostname.hme0
    phys-schost-1
  5. 编辑 /etc/inet/hosts 文件以 添加分配给此公共网络适配器的 IP 地址和相应的主机名。

    例如,下面展示添加到 /etc/inet/hosts 文件中 的 IP 地址 192.29.75.101 和主机名 phys-schost-1


    # vi /etc/inet/hosts
    192.29.75.101   phys-schost-1

    注意:

    如果使用了一个命名服务,则命名服务数据库中也应存在这些信息。


  6. 创建 NAFO 组。


    # pnmset -c nafo-group -o create adapter [adapter ...]
    -c nafo-group

    为指定的 NAFO 组执行一个配置子命令。必须将 NAFO 组命名 为 nafoN,其 中 N 是该组的一个非负的整型标识符。组名称都在每个节点的本地。这样,同一 NAFO 组可用在多个节点上。

    -o create

    创建新的 NAFO 组。

    adapter [ adapter ... ]

    指定充当备份适配器的公共网络适配器。请参见上文中步骤 3


    注意:

    如果已配置一个适配器,它将被选作活动适配 器,且 pnmset 命令不会改变这一状态。不然,就会配置备份适配器 之一,并将该 NAFO 组 的 /etc/hostname.adapter 文件中保存的 IP 地址 分配给此适配器。


  7. 检验该 NAFO 组的状态。


    # pnmstat -l
    

5.2.1.1 示例-创建 NAFO 组

以下示例展示配置了两个网络适配器(qfe0qfe1)的 NAFO 组 (nafo0) 的 创建。


# pnmstat -l
# pnmset -c nafo0 -o create qfe0 qfe1
# pnmstat -l
group   adapters       status   fo_time   act_adp
nafo0   qfe0:qfe1       OK      NEVER     qfe0

5.2.2 如何删除 NAFO 组

当您不想监视一个 NAFO 组中的适配器并且也不想让这些适配器失败切换时,就请删除 该 NAFO 组。在删除 NAFO 组时,逻辑主机资源组或共享地址资源组不能使用该组。

  1. 成为包含要删除的 NAFO 组的节点上的超级用户。

  2. 标识是否有逻辑主机或共享地址资源在使用着 NAFO 组。


    # scrgadm -pv
    

    可以使用 scrgadm -pvv(带有两 个 v 标志位)来定位使用着您要删除的 NAFO 组的资源。

  3. 将使用着此 NAFO 组的逻辑主机资源组和共享地址资源组切换到另一个节点。


    # scswitch -z -g resource-group -h node
    
    -z -g resource-group

    切换指定的资源组。

    -h node

    指定要将资源组切换到的节点的名称。

  4. 删除 NAFO 组。


    # pnmset -c nafo-group -o delete 
    
    -c nafo-group

    指定要删除的 NAFO 组。

    -o delete

    删除 NAFO 组。

  5. 检验该 NAFO 组的状态。

    已删除的 NAFO 组不应出现在列表中。


    # pnmstat -l
    

5.2.2.1 示例-删除 NAFO 组

以下示例展示已从系统中删除的名称为 nafo1 的 NAFO 组。使用此 NAFO 组 的逻辑主机资源组 lh-rg-1 首先切换到另一节点。


# scswitch -z -g lh-rg-1 -h phys-schost-2
# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1       OK      NEVER    qfe0
nafo1   qfe2            OK      NEVER    qfe2
# pnmset -c nafo1 -o delete
# pnmstat -l
group   adapters        status  fo_time  act_adp
nafo0   qfe0:qfe1        OK     NEVER    qfe0

5.2.3 如何为 NAFO 组添加适配器

可以为一个现有的 NAFO 组添加适配器,以便为 NAFO 组提供更多的备份适配器,从而提高 群集节点的公共网络连接可用性。

  1. 需要在节点中安装新的公共网络适配卡吗?

    • 如果需要,请参见 Sun Cluster 3.0 Hardware Guide 中的说明。

    • 如果不需要,请继续进行步骤 2

  2. 确保将添加到 NAFO 组中的适配器与 NAFO 组中的活动适配器连接到了同一子网。

  3. 确保未配置适配器,并且它没有关联 的 /etc/hostname.adapter 文件。

  4. 成为要添加新的适配器的 NAFO 组所在的节点上的超级用户。

  5. 将适配器添加到 NAFO 组。


    # pnmset -c nafo-group -o add adapter
    
    -c nafo-group

    指定要添加新适配器的 NAFO 组。

    -o add adapter

    指定要为指定的 NAFO 组添加的公共网络适配器。

  6. 检验该 NAFO 组的状态。


    # pnmstat -l
    

5.2.3.1 示例-为 NAFO 组再添加一个公共网络适配器

以下示例为已经包含两个适配 器(qfe0qfe1)的 NAFO 组 nafo0 添 加适配器 qfe2


# pnmstat -l
group   adapters        status   fo_time  act_adp
nafo0   qfe0:qfe1        OK      NEVER    qfe0
# pnmset -c nafo0 -o add qfe2
# pnmstat -l
group   adapters        status   fo_time  act_adp
nafo0   qfe0:qfe1:qfe2   OK      NEVER    qfe0

5.2.4 如何从 NAFO 组中移除适配器

从一个现有 的 NAFO 组移除备份适配器,以便更换从系统中移除的适配器,或者使该适配器重新连接到另一子网并 用作另一 NAFO 组的备份。


小心:小心:

如果移除一个 NAFO 组的最后一个备份适配器,则会 导致对活动的适配器上检测到的故障没有保护措施,因而会降低群集节点的公共网络可用性。


  1. 如果您想移除活动适配器,请首先切换到组中的另一适配器。

    请参见"5.2.5 如何切换 NAFO 组的活动适配器"

  2. 以超级用户身份从 NAFO 组中移除适配器。


     # pnmset -c nafo-group -o remove adapter
    
    -c nafo-group

    指定要从其中移除适配器的 NAFO 组。

    -o remove adapter

    从 NAFO 组中移除适配器。

  3. 检验该 NAFO 组的状态。

    已删除的适配器不应出现在 NAFO 组的列表中。


    # pnmstat -l
    

5.2.4.1 示例-从 NAFO 组中移除适配器

以下示例从 NAFO 组 nafo0 中移除适配器 qfe2


# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1:qfe2  OK      NEVER    qfe0
# pnmset -c nafo0 -o remove qfe2
# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1       OK      NEVER    qfe0

5.2.5 如何切换 NAFO 组的活动适配器

将活动适配器切换到一个备份适配器,以便能够从 NAFO 组中移除当前活动 适配器。pnmd(1M) 守护程序以类似于由故障触发的适配器失败切换的方式 将当前活动适配器管理的所有 IP 地址移到新的活动适配器。


注意:

切换过程中,连接可能会有一个短暂的延迟。除此以外,此操作对更高级别的应用程序是透明的。


  1. 确保新的活动适配器的连通性与当前活动适配器的连通性相同。

    如果新的活动适配器未能管理当前活动适配器管理的某些 IP 地址,则依赖这些 IP 地址的网络 服务和数据服务会中断,直到物理连通性得以修复或以后成功进行失败切换才恢复正常。

  2. 成为您想切换其活动适配器的 NAFO 组中的超级用户。

  3. 切换活动适配器。


     # pnmset -c nafo-group -o switch adapter
    
    -c nafo-group

    指定包含要切换的适配器的 NAFO 组。

    -o switch adapter

    使指定的适配器成为 NAFO 组中的活动适配器。

  4. 检验该 NAFO 组的状态。

    “将切换到的”适配器现在应该以活动适配器的身份出现。


    # pnmstat -l
    

5.2.5.1 示例-切换 NAFO 组的活动适配器

以下示例将活动适配器从 qfe0 切换到 qfe1


# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1       OK      NEVER    qfe0
# pnmset -c nafo0 -o switch qfe1
# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1       OK      11       qfe1

5.2.6 如何检查 NAFO 组的状态

    运行 pnmstat(1M) 命 令以列出有关一个节点上所有 NAFO 组的当前设置和状态的信息。


    # pnmstat -l
    

可以使用 pnmptor(1M)pnmrtop(1M) 两个命令来获取适配器的信息。

5.2.6.1 示例-检查 NAFO 组的状态

以下示例展示一个节点的三个 NAFO 组的状态。


# pnmstat -l
Group   adapters        status  fo_time act_adp 
nafo0   qfe5            OK      NEVER   qfe5 
nafo1   qfe6            OK      NEVER   qfe6 
nafo2   qfe7            OK      NEVER   qfe7 

5.2.6.2 示例-查找 NAFO 组的活动适配器

以下示例展示 NAFO 组 nafo0 中的活动适配器是 qfe5


# pnmptor nafo0
qfe5

5.2.6.3 示例-查找适配器的 NAFO 组

以下示例展示 qfe5 属于 NAFO 组 nafo0


# pnmrtop qfe5
nafo0

5.2.7 如何更改公共网络管理可调整参数

此算法中有四个可调整的参数:inactive_timeping_timeoutrepeat_testslow_network。这些参数在 故障检测的速度和正确性之间提供了一种可调整的平衡。有关详细 信息,请参见表 5-3

按照此过程来更改缺省的公共网络 管理 (PNM) 的 pnmd(1M) 守护程序值。

  1. 成为群集中一个节点上的超级用户。

  2. 如果还不存在,请创建 pnmparams 文件。


    # vi /etc/cluster/pnmparams
    
  3. 使用下表来设置 PNM 参数。


    注意:

    /etc/cluster/pnmparams 文件中的设置适用于节点上的 所有 NAFO 组。忽略以井号 (#) 开头的行。文件中的其他行的格式必须 为:variable=value


    表 5-3 公共网络管理可调整参数

    参数 

    说明 

    inactive_time

    当前活动适配器的包计数器前后两次探测之间的秒数。缺省值为 5。 

    ping_timeout

    ALL_HOST_MULTICAST 和子网广播强制回应的超时值,以秒为单位。缺省值 为 4。

    repeat_test

    在声明活动的适配器有故障并触发失败切换前执行强制回应序列的次数。缺省值为 3。 

    slow_network

    从每个强制回应序列后到声明活动适配器 出现故障并且已触发失败切换前等待的秒数。缺省值为 2。 

    warmup_time

    失败切换到备份适配器以后、恢复故障监视 以前等待的秒数。这使慢速驱动程序和端口初始化有了更多的时间。缺省值为 0。 


    注意:

    直到下一次启动 pnmd 守护程序,更改才生效。


5.2.7.1 示例-更改公共网络管理可调整参数

以下展示一个样例 /etc/cluster/pnmparams 文件,其中有两个参数已更改了缺省值。


inactive_time=3
repeat_test=5