Sun Cluster 3.0 系统管理指南

5.2 管理公共网络

如果需要改变一个公共网络配置,则可按照本节中的软件操作过程来进行。

在管理公共网络适配器时,请注意以下几点:

有关群集软件安装过程,请参见 Sun Cluster 3.0 安装指南。有关维护公共联网硬件组件的过程,请 参见 Sun Cluster 3.0 Hardware Guide

表 5-2 任务图:管理公共网络

任务 

有关说明,请转到... 

在一个节点上创建一个 NAFO 组。 

"5.2.1 如何创建一个 NAFO 组"

为一个节点添加更多公共网络适配器以增强公共网络的可用性。 

"5.2.3 如何为 NAFO 组添加适配器"

删除一个 NAFO 组,这样就不再监视组中的任何适配器,这些适配器也不再失败切换。 

"5.2.2 如何删除 NAFO 组"

从一个现有 的 NAFO 组移除备份适配器,以便更换从系统中移除的适配器,或者使该适配器重新连接到另一子网并 用作另一 NAFO 组的备份。 

"5.2.4 如何从 NAFO 组中移除适配器"

将活动适配器切换到一个备份适配器,以便能够从 NAFO 组中移除当前活动 适配器。 

"5.2.5 如何切换 NAFO 组的活动适配器"

检查 NAFO 组的状态。 

"5.2.6 如何检查 NAFO 组的状态"

更改参数以调整 PNM 故障检测和失败切换进程。 

"5.2.7 如何更改公共网络管理可调整参数"

5.2.1 如何创建一个 NAFO 组

  1. 注意创建 NAFO 组的以下要求:

    • 所有的公共网络适配器都必须配置,从而归属于某个 NAFO 组。

    • 对于任一给定的节点,在一个给定的子网上最多只能有一 NAFO 组。

    • 一个给定的 NAFO 组中的所有适配器都必须连接到同一子网。

    • 在一个给定的 NAFO 组中,只能有一个适配器有一个主机名关联,即 一个 /etc/hostname.adapter 文件。

    • 一个公共网络适配器仅能属于一个 NAFO 组。

  2. 在要为 NAFO 组配置的节点上成为一个超级用户。

  3. 对于此节点,找出物理连接到同一子网的公共网络适配器。

    这些适配器成了 NAFO 组的备份适配器。

  4. 确定您是否需要为公共网络适配器之一创建 一个 /etc/hostname.adapter 文件。

    • 如果不需要(该文件已存在),请继续 进行步骤 5

    • 如果需要(尚不存在该文件),请创建该文件,并将公共网络适配器 的 IP 地址的主机名添加到该文件中。例如:


    # vi /etc/hostname.hme0
    phys-schost-1
  5. 编辑 /etc/inet/hosts 文件以 添加分配给此公共网络适配器的 IP 地址和相应的主机名。

    例如,下面展示添加到 /etc/inet/hosts 文件中 的 IP 地址 192.29.75.101 和主机名 phys-schost-1


    # vi /etc/inet/hosts
    192.29.75.101   phys-schost-1

    注意:

    如果使用了一个命名服务,则命名服务数据库中也应存在这些信息。


  6. 创建 NAFO 组。


    # pnmset -c nafo-group -o create adapter [adapter ...]
    -c nafo-group

    为指定的 NAFO 组执行一个配置子命令。必须将 NAFO 组命名 为 nafoN,其 中 N 是该组的一个非负的整型标识符。组名称都在每个节点的本地。这样,同一 NAFO 组可用在多个节点上。

    -o create

    创建新的 NAFO 组。

    adapter [ adapter ... ]

    指定充当备份适配器的公共网络适配器。请参见上文中步骤 3


    注意:

    如果已配置一个适配器,它将被选作活动适配 器,且 pnmset 命令不会改变这一状态。不然,就会配置备份适配器 之一,并将该 NAFO 组 的 /etc/hostname.adapter 文件中保存的 IP 地址 分配给此适配器。


  7. 检验该 NAFO 组的状态。


    # pnmstat -l
    

5.2.1.1 示例-创建 NAFO 组

以下示例展示配置了两个网络适配器(qfe0qfe1)的 NAFO 组 (nafo0) 的 创建。


# pnmstat -l
# pnmset -c nafo0 -o create qfe0 qfe1
# pnmstat -l
group   adapters       status   fo_time   act_adp
nafo0   qfe0:qfe1       OK      NEVER     qfe0

5.2.2 如何删除 NAFO 组

当您不想监视一个 NAFO 组中的适配器并且也不想让这些适配器失败切换时,就请删除 该 NAFO 组。在删除 NAFO 组时,逻辑主机资源组或共享地址资源组不能使用该组。

  1. 成为包含要删除的 NAFO 组的节点上的超级用户。

  2. 标识是否有逻辑主机或共享地址资源在使用着 NAFO 组。


    # scrgadm -pv
    

    可以使用 scrgadm -pvv(带有两 个 v 标志位)来定位使用着您要删除的 NAFO 组的资源。

  3. 将使用着此 NAFO 组的逻辑主机资源组和共享地址资源组切换到另一个节点。


    # scswitch -z -g resource-group -h node
    
    -z -g resource-group

    切换指定的资源组。

    -h node

    指定要将资源组切换到的节点的名称。

  4. 删除 NAFO 组。


    # pnmset -c nafo-group -o delete 
    
    -c nafo-group

    指定要删除的 NAFO 组。

    -o delete

    删除 NAFO 组。

  5. 检验该 NAFO 组的状态。

    已删除的 NAFO 组不应出现在列表中。


    # pnmstat -l
    

5.2.2.1 示例-删除 NAFO 组

以下示例展示已从系统中删除的名称为 nafo1 的 NAFO 组。使用此 NAFO 组 的逻辑主机资源组 lh-rg-1 首先切换到另一节点。


# scswitch -z -g lh-rg-1 -h phys-schost-2
# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1       OK      NEVER    qfe0
nafo1   qfe2            OK      NEVER    qfe2
# pnmset -c nafo1 -o delete
# pnmstat -l
group   adapters        status  fo_time  act_adp
nafo0   qfe0:qfe1        OK     NEVER    qfe0

5.2.3 如何为 NAFO 组添加适配器

可以为一个现有的 NAFO 组添加适配器,以便为 NAFO 组提供更多的备份适配器,从而提高 群集节点的公共网络连接可用性。

  1. 需要在节点中安装新的公共网络适配卡吗?

    • 如果需要,请参见 Sun Cluster 3.0 Hardware Guide 中的说明。

    • 如果不需要,请继续进行步骤 2

  2. 确保将添加到 NAFO 组中的适配器与 NAFO 组中的活动适配器连接到了同一子网。

  3. 确保未配置适配器,并且它没有关联 的 /etc/hostname.adapter 文件。

  4. 成为要添加新的适配器的 NAFO 组所在的节点上的超级用户。

  5. 将适配器添加到 NAFO 组。


    # pnmset -c nafo-group -o add adapter
    
    -c nafo-group

    指定要添加新适配器的 NAFO 组。

    -o add adapter

    指定要为指定的 NAFO 组添加的公共网络适配器。

  6. 检验该 NAFO 组的状态。


    # pnmstat -l
    

5.2.3.1 示例-为 NAFO 组再添加一个公共网络适配器

以下示例为已经包含两个适配 器(qfe0qfe1)的 NAFO 组 nafo0 添 加适配器 qfe2


# pnmstat -l
group   adapters        status   fo_time  act_adp
nafo0   qfe0:qfe1        OK      NEVER    qfe0
# pnmset -c nafo0 -o add qfe2
# pnmstat -l
group   adapters        status   fo_time  act_adp
nafo0   qfe0:qfe1:qfe2   OK      NEVER    qfe0

5.2.4 如何从 NAFO 组中移除适配器

从一个现有 的 NAFO 组移除备份适配器,以便更换从系统中移除的适配器,或者使该适配器重新连接到另一子网并 用作另一 NAFO 组的备份。


小心:小心:

如果移除一个 NAFO 组的最后一个备份适配器,则会 导致对活动的适配器上检测到的故障没有保护措施,因而会降低群集节点的公共网络可用性。


  1. 如果您想移除活动适配器,请首先切换到组中的另一适配器。

    请参见"5.2.5 如何切换 NAFO 组的活动适配器"

  2. 以超级用户身份从 NAFO 组中移除适配器。


     # pnmset -c nafo-group -o remove adapter
    
    -c nafo-group

    指定要从其中移除适配器的 NAFO 组。

    -o remove adapter

    从 NAFO 组中移除适配器。

  3. 检验该 NAFO 组的状态。

    已删除的适配器不应出现在 NAFO 组的列表中。


    # pnmstat -l
    

5.2.4.1 示例-从 NAFO 组中移除适配器

以下示例从 NAFO 组 nafo0 中移除适配器 qfe2


# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1:qfe2  OK      NEVER    qfe0
# pnmset -c nafo0 -o remove qfe2
# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1       OK      NEVER    qfe0

5.2.5 如何切换 NAFO 组的活动适配器

将活动适配器切换到一个备份适配器,以便能够从 NAFO 组中移除当前活动 适配器。pnmd(1M) 守护程序以类似于由故障触发的适配器失败切换的方式 将当前活动适配器管理的所有 IP 地址移到新的活动适配器。


注意:

切换过程中,连接可能会有一个短暂的延迟。除此以外,此操作对更高级别的应用程序是透明的。


  1. 确保新的活动适配器的连通性与当前活动适配器的连通性相同。

    如果新的活动适配器未能管理当前活动适配器管理的某些 IP 地址,则依赖这些 IP 地址的网络 服务和数据服务会中断,直到物理连通性得以修复或以后成功进行失败切换才恢复正常。

  2. 成为您想切换其活动适配器的 NAFO 组中的超级用户。

  3. 切换活动适配器。


     # pnmset -c nafo-group -o switch adapter
    
    -c nafo-group

    指定包含要切换的适配器的 NAFO 组。

    -o switch adapter

    使指定的适配器成为 NAFO 组中的活动适配器。

  4. 检验该 NAFO 组的状态。

    “将切换到的”适配器现在应该以活动适配器的身份出现。


    # pnmstat -l
    

5.2.5.1 示例-切换 NAFO 组的活动适配器

以下示例将活动适配器从 qfe0 切换到 qfe1


# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1       OK      NEVER    qfe0
# pnmset -c nafo0 -o switch qfe1
# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1       OK      11       qfe1

5.2.6 如何检查 NAFO 组的状态

    运行 pnmstat(1M) 命 令以列出有关一个节点上所有 NAFO 组的当前设置和状态的信息。


    # pnmstat -l
    

可以使用 pnmptor(1M)pnmrtop(1M) 两个命令来获取适配器的信息。

5.2.6.1 示例-检查 NAFO 组的状态

以下示例展示一个节点的三个 NAFO 组的状态。


# pnmstat -l
Group   adapters        status  fo_time act_adp 
nafo0   qfe5            OK      NEVER   qfe5 
nafo1   qfe6            OK      NEVER   qfe6 
nafo2   qfe7            OK      NEVER   qfe7 

5.2.6.2 示例-查找 NAFO 组的活动适配器

以下示例展示 NAFO 组 nafo0 中的活动适配器是 qfe5


# pnmptor nafo0
qfe5

5.2.6.3 示例-查找适配器的 NAFO 组

以下示例展示 qfe5 属于 NAFO 组 nafo0


# pnmrtop qfe5
nafo0

5.2.7 如何更改公共网络管理可调整参数

此算法中有四个可调整的参数:inactive_timeping_timeoutrepeat_testslow_network。这些参数在 故障检测的速度和正确性之间提供了一种可调整的平衡。有关详细 信息,请参见表 5-3

按照此过程来更改缺省的公共网络 管理 (PNM) 的 pnmd(1M) 守护程序值。

  1. 成为群集中一个节点上的超级用户。

  2. 如果还不存在,请创建 pnmparams 文件。


    # vi /etc/cluster/pnmparams
    
  3. 使用下表来设置 PNM 参数。


    注意:

    /etc/cluster/pnmparams 文件中的设置适用于节点上的 所有 NAFO 组。忽略以井号 (#) 开头的行。文件中的其他行的格式必须 为:variable=value


    表 5-3 公共网络管理可调整参数

    参数 

    说明 

    inactive_time

    当前活动适配器的包计数器前后两次探测之间的秒数。缺省值为 5。 

    ping_timeout

    ALL_HOST_MULTICAST 和子网广播强制回应的超时值,以秒为单位。缺省值 为 4。

    repeat_test

    在声明活动的适配器有故障并触发失败切换前执行强制回应序列的次数。缺省值为 3。 

    slow_network

    从每个强制回应序列后到声明活动适配器 出现故障并且已触发失败切换前等待的秒数。缺省值为 2。 

    warmup_time

    失败切换到备份适配器以后、恢复故障监视 以前等待的秒数。这使慢速驱动程序和端口初始化有了更多的时间。缺省值为 0。 


    注意:

    直到下一次启动 pnmd 守护程序,更改才生效。


5.2.7.1 示例-更改公共网络管理可调整参数

以下展示一个样例 /etc/cluster/pnmparams 文件,其中有两个参数已更改了缺省值。


inactive_time=3
repeat_test=5