Sun Cluster 3.0 12/01 系统管理指南

5.2 管理公共网络

如果需要改变公共网络配置,可按照本节中的软件过程进行。

管理公共网络适配器时,请注意以下事项:

有关群集软件的安装过程,请参阅《Sun Cluster 3.0 12/01 软件安装指南》。有关维护公共联网硬件组件的过程,请参阅《Sun Cluster 3.0 12/01 Hardware Guide》。

表 5-3 任务表:管理公共网络

任务 

有关说明,请转到... 

在节点上创建 NAFO 组 

"5.2.2 如何创建 NAFO 组"

向节点添加更多的公共网络适配器 

"5.2.3 如何向 NAFO 组添加适配器"

删除 NAFO 组 

"5.2.4 如何删除 NAFO 组"

从现有的 NAFO 组中删除备份适配器 

"5.2.5 如何从 NAFO 组中删除适配器"

将活动的适配器切换到备份的适配器 

"5.2.6 如何切换 NAFO 组的活动适配器"

检查 NAFO 组的状态 

"5.2.7 如何检查 NAFO 组的状态"

更改参数以调整 PNM 故障检测和故障转移进程 

"5.2.8 如何更改公共网络管理可调参数"

5.2.1 动态重新配置公共网络接口

在完成对群集中的公共网络进行动态重新配置 (DR) 操作时,有几个问题必须予以考虑。


小心:小心:

在对已禁用的网络适配器执行 DR 删除操作期间,如果活动的网络适配器发生故障,则说明可用性受到了影响。在 DR 操作期间,活动的适配器没有地方可转移故障。


对公共网络接口执行 DR 操作时,请按所示顺序完成下列过程。

表 5-4 任务表:动态重新配置公共网络接口

任务 

有关说明,请转到... 

1. 将活动适配器切换到备份适配器。这样,就可以从 NAFO 组中将它删除。  

"5.2.6 如何切换 NAFO 组的活动适配器"

2. 从 NAFO 组中删除该适配器。 

"5.2.5 如何从 NAFO 组中删除适配器"

3. 对公共网络接口执行 DR 操作。  

Sun Enterprise 10000 Dynamic Reconfiguration User Guide》和《Sun Enterprise 10000 Dynamic Reconfiguration Reference Manual》(出自《 Solaris 8 on Sun Hardware》集)

5.2.2 如何创建 NAFO 组

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

  1. 创建 NAFO 组时,请注意以下要求:

    • 必须对所有公共网络适配器进行配置,使它们属于某个 NAFO 组。

    • 对于任一给定的节点,在给定的子网上最多只能有一个 NAFO 组。

    • 给定的 NAFO 组中的所有适配器必须连接到同一子网上。

    • 在给定的 NAFO 组中,只能有一个适配器具有主机名关联,即 /etc/hostname. adapter 文件。

    • 一个公共网络适配器只能属于一个 NAFO 组。

  2. 在要为 NAFO 组配置的那个节点上成为超级用户。

  3. 对于此节点,找出所有与同一子网进行物理连接的公共网络适配器。

    这些适配器成为 NAFO 组的备份适配器。

  4. 为其中的一个公共网络适配器创建 /etc/hostname.adapter 文件(如果尚未创建该文件)。

    该文件中所指定的适配器将成为 NAFO 组的缺省活动适配器。


    # vi /etc/hostname.<adapter>
    phys-schost-1

  5. 编辑 /etc/inet/hosts 文件,以添加分配给公共网络适配器的 IP 地址和相应的主机名。

    例如,以下显示了添加到 /etc/inet/hosts 文件的 IP 地址 192.29.75.101 和主机名 phys-schost-1


    # vi /etc/inet/hosts
    192.29.75.101   phys-schost-1


    注意:

    如果使用了命名服务,则命名服务数据库中也应该有这些信息。


  6. 创建 NAFO 组。


    # pnmset -c nafo-group -o create adapter [adapter ...]

    -c nafo-group

    对指定的 NAFO 组执行配置子命令。 必须将 NAFO 组命名为 nafoN,其中 N 是一个非负的整数,用来标识该组。 对每个节点而言,组名都是本地名称。 因而,同一 NAFO 组名可在多个节点上使用。

    -o create

    创建新的 NAFO 组。

    adapter [ adapter ... ]

    指定用作备份适配器的公共网络适配器。 请参阅步骤 3


    注意:

    如果已经配置了一个适配器,则该适配器将被选定为活动适配器,并且 pnmset 命令不会改变其状态。 否则,将需要配置一个备份适配器并将在 NAFO 组的 /etc/hostname. adapter 文件中找到的 IP 地址分配给它。


  7. 检验该 NAFO 组的状态。


    # pnmstat -l
    

5.2.2.1 示例 - 创建 NAFO 组

以下示例显示了创建一个 NAFO 组 (nafo0) 的过程,该 NAFO 组配有两个网络适配器(qfe0qfe1)。


# pnmstat -l
# vi /etc/hostname.qfe0
phys-schost-1
# vi /etc/inet/hosts
192.168.0.0   phys-schost-1
# pnmset -c nafo0 -o create qfe0 qfe1
# pnmstat -l
group   adapters       status   fo_time   act_adp
nafo0   qfe0:qfe1       OK      NEVER     qfe0

5.2.3 如何向 NAFO 组添加适配器

您可以向现有的 NAFO 组添加适配器,以便为 NAFO 组提供额外的备份适配器,从而提高群集节点的公共网络连接的可用性。

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

  1. 您是否需要在节点中安装新的公共网络适配器卡?

    • 如果是,请参阅《Sun Cluster 3.0 12/01 Hardware Guide》 的有关说明。

    • 如果否,请继续步骤 2

  2. 确保要添加到 NAFO 组中的适配器与 NAFO 组的活动适配器连接到同一子网上。

  3. 确保该适配器未经配置,且没有关联的 /etc/hostname.adapter 文件。

  4. 成为要添加新适配器的 NAFO 组所在节点上的超级用户。

  5. 向 NAFO 组添加适配器。


    # pnmset -c nafo-group -o add adapter
    

    -c nafo-group

    指定要添加新适配器的 NAFO 组。

    -o add adapter

    指定要添加到指定的 NAFO 组的公共网络适配器。

  6. 检验该 NAFO 组的状态。


    # pnmstat -l
    

5.2.3.1 示例 - 向 NAFO 组添加额外的公共网络适配器

以下示例说明了向已包含两个适配器(qfe0qfe1)的 NAFO 组 nafo0 添加额外适配器 qfe2 的过程。


# pnmstat -l
group   adapters        status   fo_time  act_adp
nafo0   qfe0:qfe1        OK      NEVER    qfe0
# pnmset -c nafo0 -o add qfe2
# pnmstat -l
group   adapters        status   fo_time  act_adp
nafo0   qfe0:qfe1:qfe2   OK      NEVER    qfe0

5.2.4 如何删除 NAFO 组

如果您不想对 NAFO 组中的任何适配器进行监视和故障转移,请删除该 NAFO 组。 要想能够删除 NAFO 组,逻辑主机资源组或共享地址资源组不得使用该组。

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

  1. 成为包含要删除的 NAFO 组的节点的超级用户。

  2. 确定是否有任何逻辑主机资源或共享地址资源正在使用 NAFO 组。


    # scrgadm -pv
    

    您还可以使用 scrgadm-pvv(带有两个 v 标志)来确定那些正在使用将要删除的 NAFO 组的资源。

  3. 切换使用该 NAFO 组的逻辑主机资源组和共享地址资源。


    # scswitch -z -g resource-group -h nodelist
    

    -z -g resource-group

    切换指定的资源组。

    -h nodelist

    指定要将资源组切换到的节点的名称。

  4. 删除 NAFO 组。


    # pnmset -c nafo-group -o delete 
    

    -c nafo-group

    指定要删除的 NAFO 组。

    -o delete

    删除 NAFO 组。

  5. 检验该 NAFO 组的状态。

    列表中不应出现已删除的 NAFO 组。


    # pnmstat -l
    

5.2.4.1 示例 - 删除 NAFO 组

以下示例显示了从系统中删除名为 nafo1 的 NAFO 组的过程。 先将使用该 NAFO 组的逻辑主机资源组 lh-rg-1 切换到另外一个节点上。


# scswitch -z -g lh-rg-1 -h phys-schost-2
# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1       OK      NEVER    qfe0
nafo1   qfe2            OK      NEVER    qfe2
# pnmset -c nafo1 -o delete
# pnmstat -l
group   adapters        status  fo_time  act_adp
nafo0   qfe0:qfe1        OK     NEVER    qfe0

5.2.5 如何从 NAFO 组中删除适配器

从现有的 NAFO 组中删除备份适配器,以便能够从系统中删除该适配器、更换该适配器、使该适配器重新连接到另一子网并用作另一个 NAFO 组的备份适配器。

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。


小心:小心:

如果从 NAFO 组中删除最后一个备份适配器,其结果是无法对活动的适配器上检测到的故障提供保护措施,从而降低群集节点的公共网络可用性。


  1. 如果要删除活动适配器,请首先切换到该组中的另一适配器。

    请参阅"5.2.6 如何切换 NAFO 组的活动适配器"

  2. 以超级用户的身份将适配器从 NAFO 组中删除。


     # pnmset -c nafo-group -o remove adapter
    

    -c nafo-group

    指定要从其中删除适配器的 NAFO 组。

    -o remove adapter

    从 NAFO 组中删除适配器。

  3. 检验该 NAFO 组的状态。

    已删除的适配器不应出现在 NAFO 组的列表中。


    # pnmstat -l
    

5.2.5.1 示例 - 从 NAFO 组中删除适配器

以下示例显示了从 NAFO 组 nafo0 中删除适配器 qfe2 的过程。


# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1:qfe2  OK      NEVER    qfe0
# pnmset -c nafo0 -o remove qfe2
# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1       OK      NEVER    qfe0

5.2.6 如何切换 NAFO 组的活动适配器

将活动适配器切换到一个备份适配器,以便能够从 NAFO 组中删除当前活动适配器。 pnmd(1M) 守护程序以类似于由于故障触发的适配器故障转移的方式将当前活动适配器主管的所有 IP 地址移到新的活动适配器。

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。


注意:

切换过程中,连接可能会经历短暂的延迟。 延迟可能会持续数分钟。 否则,该操作对高级应用程序是透明的。


  1. 确保新的活动适配器的物理连通性与当前活动适配器的物理连通性相同。

    如果该新的活动适配器无法作为当前活动适配器管理某些 IP 地址,则依赖那些 IP 地址的网络服务和数据服务将会中断,直到物理连接得以修复或之后成功地进行了故障转移才恢复正常。

  2. 成为要切换其活动适配器的 NAFO 组所在节点的超级用户。

  3. 切换活动适配器。


     # pnmset -c nafo-group -o switch adapter
    

    -c nafo-group

    指定包含有要切换的适配器的 NAFO 组。

    -o switch adapter

    使指定的适配器成为 NAFO 组中的活动适配器。

    • 如果此更改是临时的,并且您不希望在重新引导节点后保留它,请转到步骤 5

    • 如果此更改是永久的,而且您希望重新引导节点后仍然保留它,请转到步骤 4

  4. 重命名旧活动适配器的 etc/hostname.adapter 文件,以反映新的活动适配器。


    # mv /etc/hostname.<old_adapter> /etc/hostname.<new_adapter>

  5. 检验该 NAFO 组的状态。

    "作为切换目标"的那个适配器现在就应显示为活动适配器。


    # pnmstat -l
    

5.2.6.1 示例 - 切换 NAFO 组的活动适配器

以下示例说明了将活动适配器从 qfe0 切换到 qfe1 的过程。


# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1       OK      NEVER    qfe0
# pnmset -c nafo0 -o switch qfe1
# mv /etc/hostname.qfe0 /etc/hostname.qfe1
# pnmstat -l
group   adapters       status   fo_time  act_adp
nafo0   qfe0:qfe1       OK      11       qfe1

5.2.7 如何检查 NAFO 组的状态

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

    运行 pnmstat(1M) 命令,列出某个节点上所有 NAFO 组的当前设置和状态的有关信息。


    # pnmstat -l
    

您还可以使用 pnmptor(1M)pnmrtop(1M) 命令来获取有关适配器的信息。

5.2.7.1 示例 - 检查 NAFO 组的状态

以下示例显示了某个节点的三个 NAFO 组的状态。


# pnmstat -l
Group   adapters        status  fo_time act_adp 
nafo0   qfe5            OK      NEVER   qfe5 
nafo1   qfe6            OK      NEVER   qfe6 
nafo2   qfe7            OK      NEVER   qfe7 

5.2.7.2 示例 - 查找 NAFO 组的活动适配器

以下示例显示了 NAFO 组 nafo0 中的活动适配器是 qfe5 适配器。


# pnmptor nafo0
qfe5

5.2.7.3 示例 - 查找适配器的 NAFO 组

以下示例显示适配器 qfe5 属于 NAFO 组 nafo0


# pnmrtop qfe5
nafo0

5.2.8 如何更改公共网络管理可调参数

此算法中包含四个可调参数。

这些参数可折中处理故障检测的速度与正确性,而且这种折中处理方式可以进行调整。 有关详细信息,请参阅表 5-5

按照此过程更改 pnmd(1M) 守护程序的缺省公共网络管理 (PNM) 值。

  1. 成为群集中任一节点上的超级用户。

  2. 如果还没有 pnmparams 文件,则创建此文件。


    # vi /etc/cluster/pnmparams
    

  3. 使用下表来设置 PNM 参数。


    注意:

    /etc/cluster/pnmparams 文件中的设置适用于节点上的所有 NAFO 组。 忽略以井号 (#) 开头的行。此文件中的其他行必须采用以下格式: variable=value.


    表 5-5 公共网络管理可调参数

    参数 

    说明 

    inactive_time

    当前活动适配器的包计数器在连续进行两次探测之间的秒数。 缺省值为 5。 

    ping_timeout

    ALL_HOST_MULTICAST 和子网广播 ping 的超时值(以秒为单位)。 缺省值为 4。

    repeat_test

    在声明活动适配器有故障并触发故障转移前执行 ping 序列的次数。 缺省值为 3。 

    slow_network

    每次从执行 ping 序列之后到检查包计数器以查看是否有任何更改之间所等待的秒数。 缺省值为 2。 

    warmup_time

    从将故障转移到备份适配器后到恢复故障监视前所等待的秒数。 此设置为慢速驱动程序或缓慢的端口初始化过程保留了额外的时间。 缺省值为 0。 


    注意:

    在下一次启动 pnmd 守护程序后,这些更改才生效。


5.2.8.1 示例 - 更改公共网络管理可调参数

以下显示了 /etc/cluster/pnmparams 文件的一个样例,其中有两个参数已不再是缺省值。


inactive_time=3
repeat_test=5