本章提供管理 Sun Cluster 互连和公共网络的软件过程。
群集互连和公共网络的管理由硬件和软件过程组成。通常,在初次安装并配置群集时,要配置群集互连和公共网络,包括 NAFO 组。如果后来需要改变群集互连或公共网络配置,则可以使用本章中的软件过程。
以下是本章中包含的过程的列表:
对于本章中相关过程的高级说明,请参阅表 5-1 和表 5-2。
有关群集互连和公共网络的背景和概述信息,请参阅 《Sun Cluster 3.0 U1 概念》 文档。
本节提供有关重新配置群集互连(如: cluster transport adapter 和 cluster transport cable)的过程。这些过程需要安装 Sun Cluster 软件。
在大多数时候,您可以使用 scsetup 实用程序来管理群集互连的群集传输。有关详细信息,请参阅 scsetup(1M) 手册页。
有关群集软件的安装过程,请参阅《Sun Cluster 3.0 U1 安装指南》。有关维护群集硬件组件的过程,请参阅《Sun Cluster 3.0 U1 Hardware Guide》。
表 5-1 任务列表:管理群集互连
任务 |
有关说明,请转到... |
---|---|
管理群集传输 - 使用 scsetup | |
检查群集互连的状态 - 使用 scstat | |
添加群集传输电缆、传输适配卡或传输结点 - 使用 scsetup | |
删除群集传输电缆、传输适配卡或传输结点 - 使用 scsetup | |
启用群集传输电缆 - 使用 scsetup | |
禁用群集传输电缆 - 使用 scsetup |
您还可以使用 SunPlex Manager GUI 来完成此过程。有关详细信息,请参阅 SunPlex Manager 的联机帮助。
执行此步骤不需要作为超级用户登录。
检查群集互连的状态。
# scstat -W |
有关一般状态的消息,请参阅以下内容。
状态消息 |
说明和可能的操作 |
---|---|
联机路径 |
此路径当前工作正常。不需要执行任何操作。 |
路径等待 |
当前正在初始化此路径。不需要执行任何操作。 |
路径出现故障 |
此路径当前不工作。如果路径在等待和联机状态之间,则这种情况是瞬态的。如果重新运行 scstat -W 后此消息依然存在,请执行改正的操作。 |
以下示例说明了当前运行的群集互连的状态。
# scstat -W -- Cluster Transport Paths -- Endpoint Endpoint S tatus -------- -------- ------ Transport path: phys-schost-1:qfe1 phys-schost-2:qfe1 Path online Transport path: phys-schost-1:qfe0 phys-schost-2:qfe0 Path online Transport path: phys-schost-1:qfe1 phys-schost-3:qfe1 Path online Transport path: phys-schost-1:qfe0 phys-schost-3:qfe0 Path online Transport path: phys-schost-2:qfe1 phys-schost-3:qfe1 Path online Transport path: phys-schost-2:qfe0 phys-schost-3:qfe0 Path online |
您还可以使用 SunPlex Manager GUI 来完成此过程。有关详细信息,请参阅 SunPlex Manager 的联机帮助。
确保已安装物理 cluster transport cable。
有关安装 cluster transport cable 的过程,请参阅《Sun Cluster 3.0 U1 Hardware Guide》。
成为群集中任一节点的超级用户。
输入 scsetup 实用程序。
# scsetup |
这时将显示主菜单。
通过键入 3(群集互连)来访问 "Cluster Interconnect" 菜单。
通过键入 1(添加传输电缆)来添加传输电缆。
(按说明输入请求的信息。)
通过键入 2(向节点添加传输适配卡)来添加传输适配卡。
(按说明输入请求的信息。)
通过键入 3(添加传输结点)来添加传输结点。
(按说明输入请求的信息。)
检验是否已添加 cluster transport cable、传输适配卡或传输结点。
# scconf -p | grep cable # scconf -p | grep adapter # scconf -p | grep junction |
以下示例说明了如何使用 scsetup 命令向节点添加传输电缆、传输适配卡或传输结点。
[Ensure the physical cable is installed.] Become superuser on any node and place the node to be removed in maintenance state. # scsetup Select Cluster interconnect. Select either Add a transport cable, Add a transport adapter to a node, or Add a transport junction. Answer the questions when prompted. You Will Need: Example: node names phys-schost-1 adapter names qfe2 junction names hub2 transport type dlpi [Verify that the scconf command completed successfully:] Command completed successfully. Quit the scsetup Cluster Interconnect Menu and Main Menu. [Verify that the cable, adapter, and junction are added:] # scconf -p | grep cable Transport cable: phys-schost-2:qfe0@1 ethernet-1@2 Enabled Transport cable: phys-schost-3:qfe0@1 ethernet-1@3 Enabled Transport cable: phys-schost-1:qfe0@0 ethernet-1@1 Enabled # scconf -p | grep adapter Node transport adapters: qfe2 hme1 qfe0 Node transport adapter: qfe0 Node transport adapters: qfe0 qfe2 hme1 Node transport adapter: qfe0 Node transport adapters: qfe0 qfe2 hme1 Node transport adapter: qfe0 # scconf -p | grep junction Cluster transport junctions: hub0 hub1 hub2 Cluster transport junction: hub0 Cluster transport junction: hub1 Cluster transport junction: hub2 |
您还可以使用 SunPlex Manager GUI 来完成此过程。有关详细信息,请参阅 SunPlex Manager 的联机帮助。
请按照以下过程从节点配置中删除群集传输电缆、传输适配卡和传输结点。禁用电缆后,电缆的两个端点仍处于已配置状态。如果适配卡正用作传输电缆的端点,则无法删除该适配卡。
一个群集节点要成为一个群集的成员,至少需要有一个工作正常的电缆连接到群集互连。禁用电缆前,请务必检验节点的群集互连的状态。对于一个电缆连接,只有验证了它是冗余的(即除它之外还有另外一个连接),才予以禁用。禁用节点所剩的最后一个工作电缆会使该节点脱离群集。
成为群集中任一节点的超级用户。
检查剩余的群集传输路径的状态。
# scstat -W |
如果在尝试删除由两个节点组成的群集中的一个节点时接收到错误(如 "path faulted"),请先调查问题,然后再继续进行此过程。这样的问题可能表明节点路径不可用。如果删除所剩的正常路径,则会使节点脱离群集,并可能导致重新配置群集。
输入 scsetup 实用程序。
# scsetup |
这时将显示主菜单。
通过键入 3(群集互连)来访问 "Cluster Interconnect" 菜单。
通过键入 4(删除传输电缆)来删除电缆。
(按说明输入请求的信息。)
如果删除的是物理电缆,请断开端口与目标设备之间的电缆。
通过键入 5(从节点删除传输适配卡)来删除适配卡。
(按说明输入请求的信息。)
如果要从节点删除物理适配卡,请参阅《Sun Cluster 3.0 U1 Hardware Guide》,以获得有关硬件维护过程的信息。
通过键入 6(删除传输结点)来删除结点。
(按说明输入请求的信息。)
如果结点的任一端口正用作任一传输电缆的端点,则无法删除结点。
检验是否已删除电缆或适配卡。
# scconf -p | grep cable # scconf -p | grep adapter # scconf -p | grep junction |
此命令的输出中不应出现已从给定节点删除的传输电缆或适配卡。
以下示例说明了如何使用 scsetup 命令删除传输电缆、传输适配卡或传输结点。
[Become superuser on any node in the cluster.] [Enter the scsetup utility:] # scsetup Select Cluster interconnect. Select either Add a transport cable, Add a transport adapter to a node, or Add a transport junction. Answer the questions when prompted. You Will Need: Example: node names phys-schost-1 adapter names qfe1 junction names hub1 [Verify that the scconf command completed successfully:] "Command completed successfully." Quit the scsetup Cluster Interconnect Menu and Main Menu. [Verify that the cable, adapter, or junction is removed:] # scconf -p | grep cable Transport cable: phys-schost-2:qfe0@1 ethernet-1@2 Enabled Transport cable: phys-schost-3:qfe0@1 ethernet-1@3 Enabled Transport cable: phys-schost-1:qfe0@0 ethernet-1@1 Enabled # scconf -p | grep adapter Node transport adapters: qfe2 hme1 qfe0 Node transport adapter: qfe0 Node transport adapters: qfe0 qfe2 hme1 Node transport adapter: qfe0 Node transport adapters: qfe0 qfe2 hme1 Node transport adapter: qfe0 # scconf -p | grep junction Cluster transport junctions: hub0 hub2 Cluster transport junction: hub0 Cluster transport junction: hub2 |
您还可以使用 SunPlex Manager GUI 来完成此过程。有关详细信息,请参阅 SunPlex Manager 的联机帮助。
此选项用于启用现有的群集传输电缆。
成为群集中任一节点的超级用户。
输入 scsetup 实用程序。
# scsetup |
这时将显示主菜单。
通过键入 2(群集互连)来访问 "Cluster Interconnect" 菜单。
通过键入 7(启用传输电缆)来启用传输电缆。
出现提示后按说明操作。您需要输入您尝试标识的电缆的一个端点的节点名称和适配卡名称。
检验是否已启用该电缆。
# scconf -p | grep cable |
此示例说明了如何启用节点 phys-schost-2 上的适配卡 qfe-1 上的群集传输电缆。
[Become superuser on any node.] [Enter the scsetup utility:] # scsetup Select Cluster interconnect>Enable a transport cable. Answer the questions when prompted. You will need the following information. You Will Need: Example: node names phys-schost-2 adapter names qfe1 junction names hub1 [Verify that the scconf command completed successfully:] scconf -c -m endpoint=phys-schost-2:qfe1,state=enabled Command completed successfully. Quit the scsetup Cluster Interconnect Menu and Main Menu. [Verify that the cable is enabled:] # scconf -p | grep cable Transport cable: phys-schost-2:qfe1@0 ethernet-1@2 Enabled Transport cable: phys-schost-3:qfe0@1 ethernet-1@3 Enabled Transport cable: phys-schost-1:qfe0@0 ethernet-1@1 Enabled |
您还可以使用 SunPlex Manager GUI 来完成此过程。有关详细信息,请参阅 SunPlex Manager 的联机帮助。
您可能需要禁用群集传输电缆,以便临时关闭群集互连路径。这在排除群集互连的故障或更换群集互连硬件时很有用。
禁用电缆后,电缆的两个端点仍处于已配置状态。如果适配卡仍用作传输电缆的一个端点,则无法删除该适配卡。
一个群集节点要成为一个群集的成员,至少需要有一个工作正常的电缆连接到群集互连。禁用电缆前,请务必检验节点的群集互连的状态。对于一个电缆连接,只有验证了它是冗余的(即除它之外还有另外一个连接),才予以禁用。禁用节点所剩的最后一个工作电缆会使该节点脱离群集。
成为群集中任一节点的超级用户。
禁用电缆前,请检查群集互连的状态。
# scstat -W |
如果在尝试删除由两个节点组成的群集中的一个节点时接收到错误(如 "path faulted"),请先调查问题,然后再继续进行此过程。这样的问题可能表明节点路径不可用。如果删除所剩的正常路径,则会使节点脱离群集,并可能导致重新配置群集。
输入 scsetup 实用程序。
# scsetup |
这时将显示主菜单。
通过键入 3(群集互连)来访问 "Cluster Interconnect" 菜单。
通过键入 8(禁用传输电缆)来禁用电缆。
按说明输入请求的信息。这时将禁用此群集互连中的所有组件。您需要输入您尝试标识的电缆的一个端点的节点名称和适配卡名称。
检验是否已禁用电缆。
# scconf -p | grep cable |
此示例说明了如何禁用节点 phys-schost-2 上的适配卡 qfe-1 上的群集传输电缆。
[Become superuser on any node.] [Enter the scsetup utility:] # scsetup Select Cluster interconnect>Disable a transport cable. Answer the questions when prompted. You will need the following information. You Will Need: Example: node names phys-schost-2 adapter names qfe1 junction names hub1 [Verify that the scconf command completed successfully:] scconf -c -m endpoint=phys-schost-2:qfe1,state=disabled Command completed successfully. Quit the scsetup Cluster Interconnect Menu and Main Menu. [Verify that the cable is disabled:] # scconf -p | grep cable Transport cable: phys-schost-2:qfe1@0 ethernet-1@2 Disabled Transport cable: phys-schost-3:qfe0@1 ethernet-1@3 Enabled Transport cable: phys-schost-1:qfe0@0 ethernet-1@1 Enabled |
如果需要改变公共网络配置,可按照本节中的软件过程进行。
在事先未将 NAFO 组中的活动适配卡切换到备份适配卡的情况下,不要取消配置(拔掉)或关闭该组中的活动适配卡。请参阅 "5.2.5 如何切换 NAFO 组的活动适配卡"。
在事先未将备份适配卡从其各自的 NAFO 组中删除的情况下,不要将它重新连接到其它子网上。
即使该组处于监视中,也可在活动适配卡上进行逻辑适配卡操作。
您必须为群集中的每个节点至少维护一个公共网络连接。如果没有公共网络连接,就无法访问群集。
有关群集软件的安装过程,请参阅《Sun Cluster 3.0 U1 安装指南》。有关维护公共联网硬件组件的过程,请参阅《Sun Cluster 3.0 U1 Hardware Guide》。
表 5-2 任务图:管理公共网络
任务 |
有关说明,请转到... |
---|---|
在节点上创建 NAFO 组 | |
向节点添加多个公共网络适配卡 | |
删除 NAFO 组 | |
从现有的 NAFO 中删除备份适配卡 | |
将活动的适配卡切换到备份的适配卡 | |
检查 NAFO 组的状态 | |
更改参数以调整 PNM 故障检测和故障转移进程 |
您还可以使用 SunPlex Manager GUI 来完成此过程。有关详细信息,请参阅 SunPlex Manager 的联机帮助。
创建 NAFO 组时,请注意以下要求:
必须将所有公共网络适配卡配置为属于某个 NAFO 组。
对于任一给定的节点,在给定的子网上最多只能有一个 NAFO 组。
给定的 NAFO 组中的所有适配卡必须连接到同一子网上。
在给定的 NAFO 组中,只能有一个适配卡具有主机名关联,即 /etc/hostname.adapter 文件。
一个公共网络适配卡只能属于一个 NAFO 组。
在要为 NAFO 组配置的节点上成为一个超级用户。
对于此节点,找出与同一子网进行物理连接的公共网络适配卡。
这些适配卡构成 NAFO 组的备份适配卡。
如果 /etc/hostname.adapter 文件尚未存在,请为公共网络适配卡之一创建该文件。
此文件中指定的适配卡将是 NAFO 组的缺省活动适配卡。
# vi /etc/hostname.<adapter> phys-schost-1 |
编辑 /etc/inet/hosts 文件,为公共网络适配卡分配 IP 地址和相应的主机名。
例如: 以下信息说明了添加到 /etc/inet/hosts 文件的 IP 地址 192.29.75.101 和主机名 phys-schost-1。
# vi /etc/inet/hosts 192.29.75.101 phys-schost-1 |
如果使用了命名服务,则命名服务数据库中也应该有这些信息。
创建 NAFO 组。
# pnmset -c nafo-group -o create adapter [adapter ...] |
对指定的 NAFO 组执行配置子命令。必须将 NAFO 组命名为 nafoN,其中 N 是该组的非负整型标识符。对每个节点而言,组名都是本地名称。因而,同一 NAFO 组名可在多个节点上使用。
创建新的 NAFO 组。
指定用作备份适配卡的公共网络适配卡。请参阅步骤 3。
如果已配置了适配卡,该适配卡将被选作活动适配卡,pnmset 命令不会改变它的状态。否则,将配置其中一个备份适配卡,并将 NAFO 组的 /etc/hostname.adapter 文件中找到的 IP 地址分配给它。
检验 NAFO 组的状态。
# pnmstat -l |
以下示例说明了配有两个网络适配卡(qfe0 和 qfe1)的 NAFO 组 (nafo0) 的创建过程。
# pnmstat -l # vi /etc/hostname.qfe0 phys-schost-1 # vi /etc/inet/hosts 192.29.75.101 phys-schost-1 # pnmset -c nafo0 -o create qfe0 qfe1 # pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK NEVER qfe0 |
您可以向现有的 NAFO 组添加适配卡,以便为 NAFO 组提供额外的备份适配卡,从而提高群集节点的公共网络连接的可用性。
您还可以使用 SunPlex Manager GUI 来完成此过程。有关详细信息,请参阅 SunPlex Manager 的联机帮助。
如果需要,请参阅《Sun Cluster 3.0 U1 Hardware Guide》 中的说明。
如果不需要,继续执行步骤 2。
确保要添加到 NAFO 组中的适配卡与 NAFO 组的活动适配卡连接到了同一子网上。
确保该适配卡未经配置,且没有相关的 /etc/hostname.adapter 文件。
成为要添加新适配卡的 NAFO 组所在的节点上的超级用户。
向 NAFO 组添加适配卡。
# pnmset -c nafo-group -o add adapter |
指定要添加新适配卡的 NAFO 组。
指定要添加到指定的 NAFO 组的公共网络适配卡。
检验 NAFO 组的状态。
# pnmstat -l |
以下示例说明了向已包含两个适配卡(qfe0 和 qfe1)的 NAFO 组 nafo0 添加额外适配卡 qfe2 的过程。
# pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK NEVER qfe0 # pnmset -c nafo0 -o add qfe2 # pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1:qfe2 OK NEVER qfe0 |
如果您不想对 NAFO 组中的任何适配卡进行监视和故障转移,请删除该 NAFO 组。删除 NAFO 组后,逻辑主机资源组或共享地址资源组不能使用它。
您还可以使用 SunPlex Manager GUI 来完成此过程。有关详细信息,请参阅 SunPlex Manager 的联机帮助。
成为包含要删除的 NAFO 组的节点的超级用户。
确定是否有任何逻辑主机或共享地址资源在使用 NAFO 组。
# scrgadm -pv |
您还可以使用 scrgadm -pvv(带有两个 v 标志)来确定正在使用要删除的 NAFO 组的资源。
切换使用此 NAFO 组的逻辑主机资源和共享地址资源组。
# scswitch -z -g resource-group -h nodelist |
切换指定的资源组。
指定要将资源组切换到的节点的名称。
删除 NAFO 组。
# pnmset -c nafo-group -o delete |
指定要删除的 NAFO 组。
删除 NAFO 组。
检验该 NAFO 组的状态。
列表中不应出现已删除的 NAFO 组。
# pnmstat -l |
以下示例说明了已从系统中删除的名为 nafo1 的 NAFO 组, 使用此 NAFO 组的逻辑主机资源组 lh-rg-1 首先切换到另一节点。
# scswitch -z -g lh-rg-1 -h phys-schost-2 # pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK NEVER qfe0 nafo1 qfe2 OK NEVER qfe2 # pnmset -c nafo1 -o delete # pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK NEVER qfe0 |
从现有的 NAFO 组中删除备份适配卡,以便能使该适配卡可从系统中删除、被替换或重新连接到另一子网并用作另一 个NAFO 组的备份适配卡。
您还可以使用 SunPlex Manager GUI 来完成此过程。有关详细信息,请参阅 SunPlex Manager 的联机帮助。
如果从 NAFO 组删除最后一个备份适配卡,其结果是不会对活动的适配卡上检测到的故障提供保护措施,从而降低群集节点的公共网络可用性。
如果要删除活动适配卡,请首先切换到该组中的另一适配卡。
如果是超级用户,就可以从 NAFO 组中删除适配卡。
# pnmset -c nafo-group -o remove adapter |
指定要从其中删除适配卡的 NAFO 组。
从 NAFO 组中删除适配卡。
检验该 NAFO 组的状态。
NAFO 组的列表中不应出现已删除的适配卡。
# pnmstat -l |
以下示例说明了从 NAFO 组 nafo0 中删除适配卡 qfe2 的过程。
# pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1:qfe2 OK NEVER qfe0 # pnmset -c nafo0 -o remove qfe2 # pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK NEVER qfe0 |
将活动适配卡切换到一个备份适配卡,以便能够从 NAFO 组中删除当前活动适配卡。pnmd(1M) 守护程序以类似于故障触发的适配卡故障转移方式将当前活动适配卡管理的所有 IP 地址移到新的活动适配卡。
您还可以使用 SunPlex Manager GUI 来完成此过程。有关详细信息,请参阅 SunPlex Manager 的联机帮助。
切换过程中,连接可能会经历短暂的延迟。延迟可能会持续数分钟。另外,此操作对高级应用程序是透明的。
确保新的活动适配卡的物理连通性与当前活动适配卡的物理连通性相同。
如果新的活动适配卡无法作为当前活动适配卡管理某些 IP 地址,则依赖那些 IP 地址的网络和数据服务将会中断,直到物理连接得以修复或以后成功地进行了故障转移才恢复正常。
成为要切换其活动适配卡的 NAFO 组所在节点的超级用户。
切换活动适配卡。
# pnmset -c nafo-group -o switch adapter |
指定包含要切换的适配卡的 NAFO 组。
使指定的适配卡成为 NAFO 组中的活动适配卡。
重新命名旧的活动适配卡的 /etc/hostname.adapter 文件,使之反映新的活动适配卡。
# mv /etc/hostname.<old_adapter> /etc/hostname.< new_adapter> |
检验该 NAFO 组的状态。
"switched-to" 适配卡当前应作为活动适配卡出现。
# pnmstat -l |
以下示例说明了将活动适配卡从 qfe0 切换到 qfe1 的过程。
# pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1:qfe2 OK NEVER qfe0 # pnmset -c nafo0 -o remove qfe2 # pnmstat -l group adapters status fo_time act_adp nafo0 qfe0:qfe1 OK NEVER qfe0 |
您还可以使用 SunPlex Manager GUI 来完成此过程。有关详细信息,请参阅 SunPlex Manager 的联机帮助。
运行 pnmstat(1M) 命令,列出关于节点上所有 NAFO 组的当前设置和状态的信息。
# pnmstat -l |
您还可以使用 pnmptor(1M) 和 pnmrtop(1M) 命令来获取有关适配卡的信息。
以下示例说明了节点的三个 NAFO 组的状态。
# pnmstat -l Group adapters status fo_time act_adp nafo0 qfe5 OK NEVER qfe5 nafo1 qfe6 OK NEVER qfe6 nafo2 qfe7 OK NEVER qfe7 |
以下示例说明了 NAFO 组 nafo0 中的活动适配卡是 qfe5 适配卡。
# pnmptor nafo0 qfe5 |
以下示例说明适配卡 qfe5 属于 NAFO 组 nafo0。
# pnmrtop qfe5 nafo0 |
此算法中包含四个可调参数:
inactive_time
ping_timeout
repeat_test
slow_network
这些参数在故障检测的速度和正确性之间提供了一种可调整的平衡。有关详细信息,请参阅表 5-3。
按照此过程更改 pnmd(1M) 守护程序的缺省公共网络管理 (PNM) 值:
成为群集中任一节点的超级用户。
如果该 PNM 值不存在,请创建 pnmparams 文件。
# vi /etc/cluster/pnmparams |
使用下表来设置 PNM 参数。
/etc/cluster/pnmparams 文件中的设置适用于节点上的所有 NAFO 组, 忽略以井号 (#) 开头的行。此文件中的其它行必须采用以下格式: variable=value。
参数 |
说明 |
---|---|
inactive_time |
当前活动适配卡的包计数器在连续进行的两次探测之间的秒数, 缺省值为 5。 |
ping_timeout |
ALL_HOST_MULTICAST 和子网广播 ping 的超时值(以秒为单位), 缺省值为 4。 |
repeat_test |
在声明活动适配卡有故障并触发故障转移前执行 ping 序列的次数, 缺省值为 3。 |
slow_network |
从执行每个 ping 序列后到检查包计数器的所有更改前等待的秒数, 缺省值为 2。 |
warmup_time |
从故障转移到备份适配卡后到恢复故障监视前等待的秒数。此设置使慢速驱动程序或端口初始化有了额外的时间。缺省值为 0。 |
只有在下一次启动 pnmd 守护程序时,该更改才生效。
以下显示了样例 /etc/cluster/pnmparams 文件,其中有两个参数已更改了缺省值。
inactive_time=3 repeat_test=5 |