如果需要改变公共网络配置,可按照本节中的软件过程进行。
避免以下做法:在事先未在网络适配器故障转移 (NAFO) 组中从活动适配器切换到备份适配器的情况下,直接卸下该组中的活动适配器或取消其配置。 请参阅"5.2.6 如何切换 NAFO 组的活动适配器"。
避免在事先未将备份适配器从其各自的 NAFO 组中删除的情况下,将其重新连接到其他子网上。
即使该组处于监视中,也可对活动适配器进行逻辑适配器操作。
您必须为群集中的每个节点至少维护一个公共网络连接。 如果没有公共网络连接,就无法访问群集。
有关群集软件的安装过程,请参阅《Sun Cluster 3.0 12/01 软件安装指南》。有关维护公共联网硬件组件的过程,请参阅《Sun Cluster 3.0 12/01 Hardware Guide》。
表 5-3 任务表:管理公共网络
任务 |
有关说明,请转到... |
---|---|
在节点上创建 NAFO 组 | |
向节点添加更多的公共网络适配器 | |
删除 NAFO 组 | |
从现有的 NAFO 组中删除备份适配器 | |
将活动的适配器切换到备份的适配器 | |
检查 NAFO 组的状态 | |
更改参数以调整 PNM 故障检测和故障转移进程 |
在完成对群集中的公共网络进行动态重新配置 (DR) 操作时,有几个问题必须予以考虑。
相关文档中适用于 Solaris 8 DR 功能的所有要求、步骤和限制同样适用于 Sun Cluster DR 支持(唯一的区别是操作环境静态操作)。 因此,在通过 Sun Cluster 软件使用 DR 之前,须查阅有关 Solaris 8 DR 功能的文档。应特别查阅那些在 DR 分离操作期间影响非网络 IO 设备的问题。
可以对非活动的公共网络接口执行 DR 删除操作。 首先必须将所有活动的公共网络接口从 NAFO 组的活动状态中删除掉。
更换专用互连上的某个接口之后,该接口的状态保持不变,从而不需再执行一些步骤来重新配置 Sun Cluster。
在没有正确地禁用公共网络接口卡(作为活动网络适配器)的情况下,如果试图删除该公共网络接口卡,系统将拒绝此操作并标识出会受此操作影响的接口。
在对已禁用的网络适配器执行 DR 删除操作期间,如果活动的网络适配器发生故障,则说明可用性受到了影响。在 DR 操作期间,活动的适配器没有地方可转移故障。
对公共网络接口执行 DR 操作时,请按所示顺序完成下列过程。
表 5-4 任务表:动态重新配置公共网络接口
任务 |
有关说明,请转到... |
---|---|
1. 将活动适配器切换到备份适配器。这样,就可以从 NAFO 组中将它删除。 | |
2. 从 NAFO 组中删除该适配器。 | |
3. 对公共网络接口执行 DR 操作。 |
《Sun Enterprise 10000 Dynamic Reconfiguration User Guide》和《Sun Enterprise 10000 Dynamic Reconfiguration Reference Manual》(出自《 Solaris 8 on Sun Hardware》集) |
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
创建 NAFO 组时,请注意以下要求:
必须对所有公共网络适配器进行配置,使它们属于某个 NAFO 组。
对于任一给定的节点,在给定的子网上最多只能有一个 NAFO 组。
给定的 NAFO 组中的所有适配器必须连接到同一子网上。
在给定的 NAFO 组中,只能有一个适配器具有主机名关联,即 /etc/hostname. adapter 文件。
一个公共网络适配器只能属于一个 NAFO 组。
在要为 NAFO 组配置的那个节点上成为超级用户。
对于此节点,找出所有与同一子网进行物理连接的公共网络适配器。
这些适配器成为 NAFO 组的备份适配器。
为其中的一个公共网络适配器创建 /etc/hostname.adapter 文件(如果尚未创建该文件)。
该文件中所指定的适配器将成为 NAFO 组的缺省活动适配器。
# vi /etc/hostname.<adapter> phys-schost-1 |
编辑 /etc/inet/hosts 文件,以添加分配给公共网络适配器的 IP 地址和相应的主机名。
例如,以下显示了添加到 /etc/inet/hosts 文件的 IP 地址 192.29.75.101 和主机名 phys-schost-1。
# vi /etc/inet/hosts 192.29.75.101 phys-schost-1 |
如果使用了命名服务,则命名服务数据库中也应该有这些信息。
创建 NAFO 组。
# pnmset -c nafo-group -o create adapter [adapter ...] |
对指定的 NAFO 组执行配置子命令。 必须将 NAFO 组命名为 nafoN,其中 N 是一个非负的整数,用来标识该组。 对每个节点而言,组名都是本地名称。 因而,同一 NAFO 组名可在多个节点上使用。
创建新的 NAFO 组。
指定用作备份适配器的公共网络适配器。 请参阅步骤 3。
如果已经配置了一个适配器,则该适配器将被选定为活动适配器,并且 pnmset 命令不会改变其状态。 否则,将需要配置一个备份适配器并将在 NAFO 组的 /etc/hostname. adapter 文件中找到的 IP 地址分配给它。
检验该 NAFO 组的状态。
# pnmstat -l |
以下示例显示了创建一个 NAFO 组 (nafo0) 的过程,该 NAFO 组配有两个网络适配器(qfe0 和 qfe1)。
# pnmstat -l # vi /etc/hostname.qfe0 phys-schost-1 # vi /etc/inet/hosts 192.168.0.0 phys-schost-1 # pnmset -c nafo0 -o create qfe0 qfe1 # pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK NEVER qfe0 |
您可以向现有的 NAFO 组添加适配器,以便为 NAFO 组提供额外的备份适配器,从而提高群集节点的公共网络连接的可用性。
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
如果是,请参阅《Sun Cluster 3.0 12/01 Hardware Guide》 的有关说明。
如果否,请继续步骤 2。
确保要添加到 NAFO 组中的适配器与 NAFO 组的活动适配器连接到同一子网上。
确保该适配器未经配置,且没有关联的 /etc/hostname.adapter 文件。
成为要添加新适配器的 NAFO 组所在节点上的超级用户。
向 NAFO 组添加适配器。
# pnmset -c nafo-group -o add adapter |
指定要添加新适配器的 NAFO 组。
指定要添加到指定的 NAFO 组的公共网络适配器。
检验该 NAFO 组的状态。
# pnmstat -l |
以下示例说明了向已包含两个适配器(qfe0 和 qfe1)的 NAFO 组 nafo0 添加额外适配器 qfe2 的过程。
# pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK NEVER qfe0 # pnmset -c nafo0 -o add qfe2 # pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1:qfe2 OK NEVER qfe0 |
如果您不想对 NAFO 组中的任何适配器进行监视和故障转移,请删除该 NAFO 组。 要想能够删除 NAFO 组,逻辑主机资源组或共享地址资源组不得使用该组。
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
成为包含要删除的 NAFO 组的节点的超级用户。
确定是否有任何逻辑主机资源或共享地址资源正在使用 NAFO 组。
# scrgadm -pv |
您还可以使用 scrgadm-pvv(带有两个 v 标志)来确定那些正在使用将要删除的 NAFO 组的资源。
切换使用该 NAFO 组的逻辑主机资源组和共享地址资源。
# scswitch -z -g resource-group -h nodelist |
切换指定的资源组。
指定要将资源组切换到的节点的名称。
删除 NAFO 组。
# pnmset -c nafo-group -o delete |
指定要删除的 NAFO 组。
删除 NAFO 组。
检验该 NAFO 组的状态。
列表中不应出现已删除的 NAFO 组。
# pnmstat -l |
以下示例显示了从系统中删除名为 nafo1 的 NAFO 组的过程。 先将使用该 NAFO 组的逻辑主机资源组 lh-rg-1 切换到另外一个节点上。
# scswitch -z -g lh-rg-1 -h phys-schost-2 # pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK NEVER qfe0 nafo1 qfe2 OK NEVER qfe2 # pnmset -c nafo1 -o delete # pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK NEVER qfe0 |
从现有的 NAFO 组中删除备份适配器,以便能够从系统中删除该适配器、更换该适配器、使该适配器重新连接到另一子网并用作另一个 NAFO 组的备份适配器。
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
如果从 NAFO 组中删除最后一个备份适配器,其结果是无法对活动的适配器上检测到的故障提供保护措施,从而降低群集节点的公共网络可用性。
如果要删除活动适配器,请首先切换到该组中的另一适配器。
以超级用户的身份将适配器从 NAFO 组中删除。
# pnmset -c nafo-group -o remove adapter |
指定要从其中删除适配器的 NAFO 组。
从 NAFO 组中删除适配器。
检验该 NAFO 组的状态。
已删除的适配器不应出现在 NAFO 组的列表中。
# pnmstat -l |
以下示例显示了从 NAFO 组 nafo0 中删除适配器 qfe2 的过程。
# pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1:qfe2 OK NEVER qfe0 # pnmset -c nafo0 -o remove qfe2 # pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK NEVER qfe0 |
将活动适配器切换到一个备份适配器,以便能够从 NAFO 组中删除当前活动适配器。 pnmd(1M) 守护程序以类似于由于故障触发的适配器故障转移的方式将当前活动适配器主管的所有 IP 地址移到新的活动适配器。
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
切换过程中,连接可能会经历短暂的延迟。 延迟可能会持续数分钟。 否则,该操作对高级应用程序是透明的。
确保新的活动适配器的物理连通性与当前活动适配器的物理连通性相同。
如果该新的活动适配器无法作为当前活动适配器管理某些 IP 地址,则依赖那些 IP 地址的网络服务和数据服务将会中断,直到物理连接得以修复或之后成功地进行了故障转移才恢复正常。
成为要切换其活动适配器的 NAFO 组所在节点的超级用户。
切换活动适配器。
# pnmset -c nafo-group -o switch adapter |
指定包含有要切换的适配器的 NAFO 组。
使指定的适配器成为 NAFO 组中的活动适配器。
重命名旧活动适配器的 etc/hostname.adapter 文件,以反映新的活动适配器。
# mv /etc/hostname.<old_adapter> /etc/hostname.<new_adapter> |
检验该 NAFO 组的状态。
"作为切换目标"的那个适配器现在就应显示为活动适配器。
# pnmstat -l |
以下示例说明了将活动适配器从 qfe0 切换到 qfe1 的过程。
# pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK NEVER qfe0 # pnmset -c nafo0 -o switch qfe1 # mv /etc/hostname.qfe0 /etc/hostname.qfe1 # pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK 11 qfe1 |
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
运行 pnmstat(1M) 命令,列出某个节点上所有 NAFO 组的当前设置和状态的有关信息。
# pnmstat -l |
您还可以使用 pnmptor(1M) 和 pnmrtop(1M) 命令来获取有关适配器的信息。
以下示例显示了某个节点的三个 NAFO 组的状态。
# pnmstat -l Group adapters status fo_time act_adp nafo0 qfe5 OK NEVER qfe5 nafo1 qfe6 OK NEVER qfe6 nafo2 qfe7 OK NEVER qfe7 |
以下示例显示了 NAFO 组 nafo0 中的活动适配器是 qfe5 适配器。
# pnmptor nafo0 qfe5 |
以下示例显示适配器 qfe5 属于 NAFO 组 nafo0。
# pnmrtop qfe5 nafo0 |
此算法中包含四个可调参数。
inactive_time
ping_timeout
repeat_test
slow_network
这些参数可折中处理故障检测的速度与正确性,而且这种折中处理方式可以进行调整。 有关详细信息,请参阅表 5-5。
按照此过程更改 pnmd(1M) 守护程序的缺省公共网络管理 (PNM) 值。
成为群集中任一节点上的超级用户。
如果还没有 pnmparams 文件,则创建此文件。
# vi /etc/cluster/pnmparams |
使用下表来设置 PNM 参数。
/etc/cluster/pnmparams 文件中的设置适用于节点上的所有 NAFO 组。 忽略以井号 (#) 开头的行。此文件中的其他行必须采用以下格式: variable=value.
参数 |
说明 |
---|---|
inactive_time |
当前活动适配器的包计数器在连续进行两次探测之间的秒数。 缺省值为 5。 |
ping_timeout |
ALL_HOST_MULTICAST 和子网广播 ping 的超时值(以秒为单位)。 缺省值为 4。 |
repeat_test |
在声明活动适配器有故障并触发故障转移前执行 ping 序列的次数。 缺省值为 3。 |
slow_network |
每次从执行 ping 序列之后到检查包计数器以查看是否有任何更改之间所等待的秒数。 缺省值为 2。 |
warmup_time |
从将故障转移到备份适配器后到恢复故障监视前所等待的秒数。 此设置为慢速驱动程序或缓慢的端口初始化过程保留了额外的时间。 缺省值为 0。 |
在下一次启动 pnmd 守护程序后,这些更改才生效。
以下显示了 /etc/cluster/pnmparams 文件的一个样例,其中有两个参数已不再是缺省值。
inactive_time=3 repeat_test=5 |