本节说明重新配置群集互连(例如,群集传输适配器和群集传输电缆)的过程。这些过程要求您安装 Sun Cluster 软件。
在大多数情况下,可以使用 clsetup 实用程序来管理群集互连的群集传输。有关更多信息,请参见 clsetup(1CL) 手册页。如果运行的是 Solaris 10 OS,则所有群集互连命令都必须在全局群集投票节点中运行。
有关群集软件安装过程,请参见《Sun Cluster 软件安装指南(适用于 Solaris OS)》。有关群集硬件部件的维修过程,请参见《Sun Cluster 3.1 - 3.2 Hardware Administration Manual for Solaris OS》。
在群集互连过程中,只要适合,一般情况下都可以使用默认端口名。默认端口名称与用于控制电缆适配器端的那个节点的内部节点 ID 号相同。但是,某些适配器类型(如 SCI)不能使用默认端口名。
任务 |
指导 |
---|---|
使用 clsetup(1CL) 管理群集传输 | |
使用 clinterconnect status 检查群集互连的状态 | |
使用 clsetup 添加群集传输电缆、传输适配器或交换机 | |
使用 clsetup 删除群集传输电缆、传输适配器或传输交换机 | |
使用 clsetup 启用群集传输电缆 | |
使用 clsetup 禁用群集传输电缆 | |
确定传输适配器的实例编号 | |
更改现有群集的 IP 地址或地址范围 |
在对群集互连完成动态重新配置 (Dynamic Reconfiguration, DR) 操作时,必须考虑几个问题。
文档中提到的针对 Solaris DR 功能的所有要求、过程及限制同样适用于 Sun Cluster DR 支持(操作系统停止操作除外)。因此,在通过 Sun Cluster 软件使用 DR 功能之前,请查阅有关 Solaris DR 功能的文档。您应该特别注意那些在执行 DR 分离操作时将影响非网络 IO 设备的问题。
Sun Cluster 软件拒绝对活动的专用互连接口进行 DR 删除板操作。
要在群集互连上执行 DR,必须从群集中完全删除活动适配器。使用 scsetup 菜单或相应的 scconf 命令。
Sun Cluster 软件要求每个群集节点与群集中其他节点之间至少有一个有效路径。如果某个专用互连接口支持到任何群集节点的最后一条路径,则请勿禁用它。
对公共网络接口执行 DR 操作时,请按所示顺序完成下列过程。
表 7–2 任务表:动态重新配置公共网络接口
任务 |
指导 |
---|---|
1. 从活动的互连中禁用并删除接口 | |
2. 对公共网络接口执行 DR 操作。 |
《Sun Enterprise 10000 DR 配置指南》和《Sun Enterprise 10000 Dynamic Reconfiguration Reference Manual》(来自 Solaris 9 on Sun Hardware 和 Solaris 10 on Sun Hardware 文档集) |
您还可以使用 Sun Cluster Manager GUI 完成此过程。有关详细信息,请参见 Sun Cluster Manager 联机帮助。
phys-schost# 提示符表示全局群集提示符。此操作过程适用于全局群集。
此过程提供了 Sun Cluster 命令的长格式。此外,大多数命令还有简短格式。这些命令除了名称长短的不同以外,其功能都是相同的。有关命令及其简短格式的列表,请参见附录 B。
执行此步骤不需要作为超级用户登录。
检查群集互连的状态。
% clinterconnect status |
有关常见状态消息,请参阅下表。
状态消息 |
说明和可能的操作 |
---|---|
Path online |
此路径当前工作正常。不需要执行任何操作。 |
Path waiting |
当前正在初始化此路径。不需要执行任何操作。 |
Faulted |
此路径当前不工作。如果路径在等待和联机状态之间,则这种情况是瞬态的。如果重新运行 clinterconnect status 后仍出现此消息,请采取更正措施。 |
以下示例说明了当前运行的群集互连的状态。
% clinterconnect status -- Cluster Transport Paths -- Endpoint Endpoint Status -------- -------- ------ Transport path: phys-schost-1:qfe1 phys-schost-2:qfe1 Path online Transport path: phys-schost-1:qfe0 phys-schost-2:qfe0 Path online Transport path: phys-schost-1:qfe1 phys-schost-3:qfe1 Path online Transport path: phys-schost-1:qfe0 phys-schost-3:qfe0 Path online Transport path: phys-schost-2:qfe1 phys-schost-3:qfe1 Path online Transport path: phys-schost-2:qfe0 phys-schost-3:qfe0 Path online |
有关群集专用传输要求的信息,请参见《Sun Cluster 3.1 - 3.2 Hardware Administration Manual for Solaris OS》中的“Interconnect Requirements and Restrictions”。
您还可以使用 Sun Cluster Manager GUI 来完成此过程。有关详细信息,请参见 Sun Cluster Manager 联机帮助。
phys-schost# 提示符表示全局群集提示符。此操作过程适用于全局群集。
此过程提供了 Sun Cluster 命令的长格式。此外,大多数命令还有简短格式。这些命令除了名称长短的不同以外,其功能都是相同的。有关命令及其简短格式的列表,请参见附录 B。
确保安装了群集传输电缆(电缆本身)。
有关安装群集传输电缆的过程,请参见《Sun Cluster 3.1 - 3.2 Hardware Administration Manual for Solaris OS》。
成为群集中任一节点上的超级用户。
启动 clsetup 实用程序。
# clsetup |
显示“Main Menu”。
键入与显示群集互连菜单的选项相对应的编号。
如果配置所使用的是 SCI 适配器,则在该过程的 “添加” 操作中提示适配器连接(端口名)时,不要接受默认设置。而是应提供在 Dolphin 交换机上所找到的端口名(0、1、2、或 3),节点通过电缆以物理方式与之连接。
键入与添加传输电缆的选项相对应的编号。
按说明进行操作,并键入请求的信息。
键入与向节点添加传输适配器的选项相对应的编号。
按说明进行操作,并键入请求的信息。
如果打算将以下任何适配器用于群集互联,请在各群集节点上的 /etc/system 文件中添加相关条目。此条目在下次引导系统后生效。
适配器 |
条目 |
---|---|
ce |
set ce:ce_taskq_disable=1 |
ipge |
set ipge:ipge_taskq_disable=1 |
ixge |
set ixge:ixge_taskq_disable=1 |
键入与添加传输交换机的选项相对应的编号。
按说明进行操作,并键入请求的信息。
检验是否添加了群集传输电缆、传输适配器或传输交换机。
# clinterconnect show node:adapter,adapternode # clinterconnect show node:adapter # clinterconnect show node:switch |
以下示例说明了如何使用 clsetup 实用程序向节点添加传输电缆、传输适配器或传输交换机。
[Ensure that the physical cable is installed.] [Start the clsetup utility:] # clsetup [Select Cluster interconnect] [Select either Add a transport cable, Add a transport adapter to a node, or Add a transport switch.} [Answer the questions when prompted.] [You Will Need: ] [Information: Example:[ node names phys-schost-1 adapter names qfe2 switch names hub2 transport type dlpi [Verify that the clinterconnect command completed successfully:]Command completed successfully. Quit the clsetup Cluster Interconnect Menu and Main Menu. [Verify that the cable, adapter, and switch are added:] # clinterconnect show phys-schost-1:qfe2,hub2 ===Transport Cables === Transport Cable: phys-schost-1:qfe2@0,hub2 Endpoint1: phys-schost-2:qfe0@0 Endpoint2: ethernet-1@2 ???? Should this be hub2? State: Enabled # clinterconnect show phys-schost-1:qfe2 === Transport Adepters for qfe2 Transport Adapter: qfe2 Adapter State: Enabled Adapter Transport Type: dlpi Adapter Property (device_name): ce Adapter Property (device_instance): 0 Adapter Property (lazy_free): 1 Adapter Property (dlpi_heartbeat_timeout): 10000 Adpater Property (dlpi_heartbeat_quantum): 1000 Adapter Property (nw_bandwidth): 80 Adapter Property (bandwidth): 70 Adapter Property (ip_address): 172.16.0.129 Adapter Property (netmask): 255.255.255.128 Adapter Port Names: 0 Adapter Port STate (0): Enabled # clinterconnect show phys-schost-1:hub2 === Transport Switches === Transport Switch: hub2 Switch State: Enabled Switch Type: switch Switch Port Names: 1 2 Switch Port State(1): Enabled Switch Port State(2): Enabled |
要检查群集传输电缆的互连状态,请参见如何检查群集互连的状态。
您还可以使用 Sun Cluster Manager GUI 完成此过程。有关详细信息,请参见 Sun Cluster Manager 联机帮助。
使用以下过程可从节点配置中删除群集传输电缆、传输适配器和传输交换机。禁用电缆后,电缆的两个端点仍处于已配置状态。如果适配器仍用作传输电缆的一个端点,则无法删除该适配器。
每个群集节点至少需要一条通向群集中其他各节点的有效传输路径。任何两个节点之间都必须有传输路径。禁用电缆前,请务必检验节点的群集互连的状态。只有当您确认了某个电缆连接是冗余的之后,才能禁用它。也就是说,要确保有另外一个连接可用。禁用节点所剩的最后一个工作电缆会使该节点脱离群集。
phys-schost# 提示符表示全局群集提示符。此操作过程适用于全局群集。
此过程提供了 Sun Cluster 命令的长格式。此外,大多数命令还有简短格式。这些命令除了名称长短的不同以外,其功能都是相同的。有关命令及其简短格式的列表,请参见附录 B。
成为群集中任一节点上的超级用户。
检查其余群集传输路径的状态。
# clinterconnect status |
如果在尝试删除由两个节点所组成的群集中的一个节点时收到错误消息(如 “path faulted”),请先找出问题之所在,然后再继续执行此过程。这样的问题可能表明节点路径不可用。删除所剩的正常路径会使节点脱离群集,并可能导致群集重新配置。
启动 clsetup 实用程序。
# clsetup |
显示“Main Menu”。
键入与访问群集互连菜单的选项相对应的编号。
键入与禁用传输电缆的选项相对应的编号。
按说明进行操作,并键入请求的信息。您需要知道适用的节点名称、适配器名称和交换机名称。
键入与删除传输电缆的选项相对应的编号。
按说明进行操作,并键入请求的信息。您需要知道适用的节点名称、适配器名称和交换机名称。
如果删除的是物理电缆,请断开端口与目标设备之间的电缆。
键入与从节点中删除传输适配器的选项相对应的编号。
按说明进行操作,并键入请求的信息。您需要知道适用的节点名称、适配器名称和交换机名称。
如果要从节点中移除物理适配器,请参见《Sun Cluster 3.1 - 3.2 Hardware Administration Manual for Solaris OS》以了解硬件维修过程。
键入与删除传输交换机的选项相对应的编号。
按说明进行操作,并键入请求的信息。您需要知道适用的节点名称、适配器名称和交换机名称。
如果有任何端口在任何传输电缆上仍用作端点,则无法删除交换机。
检验是否已删除电缆、适配器或交换机。
# clinterconnect show node:adapter,adapternode # clinterconnect show node:adapter # clinterconnect show node:switch |
此命令的输出内容中不应出现已从相应节点删除的传输电缆或适配器。
以下示例显示了如何使用 clsetup 命令删除传输电缆、传输适配器或传输交换机。
[Become superuser on any node in the cluster.] [Start the utility:] # clsetup [Select Cluster interconnect.[ [Select either Remove a transport cable, Remove a transport adapter to a node, or Remove a transport switch.[ [Answer the questions when prompted.[ You Will Need: Information Example: node names phys-schost-1 adapter names qfe1 switch names hub1 [Verify that the clinterconnect command was completed successfully:] Command completed successfully. [Quit the clsetup utility Cluster Interconnect Menu and Main Menu.] [Verify that the cable, adapter, or switch is removed:] # clinterconnect show phys-schost-1:qfe2,hub2 ===Transport Cables === Transport Cable: phys-schost-2:qfe2@0,hub2 Cable Endpoint1: phys-schost-2:qfe0@0 Cable Endpoint2: ethernet-1@2 ??? Should this be hub2??? Cable State: Enabled # clinterconnect show phys-schost-1:qfe2 === Transport Adepters for qfe2 Transport Adapter: qfe2 Adapter State: Enabled Adapter Transport Type: dlpi Adapter Property (device_name): ce Adapter Property (device_instance): 0 Adapter Property (lazy_free): 1 Adapter Property (dlpi_heartbeat_timeout): 10000 Adpater Property (dlpi_heartbeat_quantum): 1000 Adapter Property (nw_bandwidth): 80 Adapter Property (bandwidth): 70 Adapter Property (ip_address): 172.16.0.129 Adapter Property (netmask): 255.255.255.128 Adapter Port Names: 0 Adapter Port STate (0): Enabled # clinterconnect show phys-schost-1:hub2 === Transport Switches === Transport Switch: hub2 Switch State: Enabled Switch Type: switch Switch Port Names: 1 2 Switch Port State(1): Enabled Switch Port State(2): Enabled |
您还可以使用 Sun Cluster Manager GUI 完成此过程。有关详细信息,请参见 Sun Cluster Manager 联机帮助。
此选项用于启用现有的群集传输电缆。
phys-schost# 提示符表示全局群集提示符。此操作过程适用于全局群集。
此过程提供了 Sun Cluster 命令的长格式。此外,大多数命令还有简短格式。这些命令除了名称长短的不同以外,其功能都是相同的。有关命令及其简短格式的列表,请参见附录 B。
成为群集中任一节点上的超级用户。
启动 clsetup 实用程序。
# clsetup |
显示“Main Menu”。
键入与访问群集互连菜单的选项相对应的编号,然后按 Return 键。
键入与启用传输电缆的选项相对应的编号,然后按 Return 键。
出现提示后按说明操作。您需要提供正在尝试标识的电缆的一个端点的节点名称和适配器名称。
检验是否已启用该电缆。
# clinterconnect show node:adapter,adapternode |
本示例说明了如何启用位于节点 phys-schost-2 上的适配器 qfe-1 上的群集传输电缆。
[Become superuser on any node.] [Start the clsetup utility:] # clsetup [Select Cluster interconnect>Enable a transport cable.[ [Answer the questions when prompted.[ [You will need the following information.[ You Will Need: Information: Example: node names phys-schost-2 adapter names qfe1 switch names hub1 [Verify that the scinterconnect command was completed successfully:] clinterconnect enable phys-schost-2:qfe1 Command completed successfully. [Quit the clsetup Cluster Interconnect Menu and Main Menu.] [Verify that the cable is enabled:] # clinterconnect show phys-schost-1:qfe2,hub2 Transport cable: phys-schost-2:qfe1@0 ethernet-1@2 Enabled Transport cable: phys-schost-3:qfe0@1 ethernet-1@3 Enabled Transport cable: phys-schost-1:qfe0@0 ethernet-1@1 Enabled |
您还可以使用 Sun Cluster Manager GUI 完成此过程。有关详细信息,请参见 Sun Cluster Manager 联机帮助。
您可能需要禁用群集传输电缆,以便临时关闭群集互连路径。这在排除群集互连故障或更换群集互连硬件时很有用。
禁用电缆后,电缆的两个端点仍处于已配置状态。如果适配器仍用作传输电缆的一个端点,则无法删除该适配器。
每个群集节点至少需要一条通向群集中其他各节点的有效传输路径。任何两个节点之间都必须有传输路径。禁用电缆前,请务必检验节点的群集互连的状态。只有当您确认了某个电缆连接是冗余的之后,才能禁用它。也就是说,要确保有另外一个连接可用。禁用节点所剩的最后一个工作电缆会使该节点脱离群集。
phys-schost# 提示符表示全局群集提示符。此操作过程适用于全局群集。
此过程提供了 Sun Cluster 命令的长格式。此外,大多数命令还有简短格式。这些命令除了名称长短的不同以外,其功能都是相同的。有关命令及其简短格式的列表,请参见附录 B。
成为群集中任一节点上的超级用户。
禁用电缆前,请检查群集互连的状态。
# clinterconnect status |
如果在尝试删除由两个节点所组成的群集中的一个节点时收到错误消息(如 “path faulted”),请先找出问题之所在,然后再继续执行此过程。这样的问题可能表明节点路径不可用。删除所剩的正常路径会使节点脱离群集,并可能导致群集重新配置。
启动 clsetup 实用程序。
# clsetup |
显示“Main Menu”。
键入与访问群集互连菜单的选项相对应的编号,然后按 Return 键。
键入与禁用传输电缆的选项相对应的编号,然后按 Return 键。
按说明进行操作,并提供请求的信息。这时将禁用此群集互连中的所有组件。您需要提供正在尝试标识的电缆的一个端点的节点名称和适配器名称。
检验是否已禁用电缆。
# clinterconnect show node:adapter,adapternode |
本示例说明了如何禁用位于节点 phys-schost-2 上的适配器 qfe-1 上的群集传输电缆。
[Become superuser on any node.] [Start the clsetup utility:] # clsetup [Select Cluster interconnect>Disable a transport cable.] [Answer the questions when prompted.] [You will need the following information.] [ You Will Need:] Information: Example: node names phys-schost-2 adapter names qfe1 switch names hub1 [Verify that the clinterconnect command was completed successfully:] Command completed successfully. [Quit the scsetup Cluster Interconnect Menu and Main Menu.] [Verify that the cable is disabled:] # clinterconnect show -p phys-schost-1:qfe2,hub2 Transport cable: phys-schost-2:qfe1@0 ethernet-1@2 Disabled Transport cable: phys-schost-3:qfe0@1 ethernet-1@3 Enabled Transport cable: phys-schost-1:qfe0@0 ethernet-1@1 Enabled |
您需要确定传输适配器的实例编号,以确保通过 clsetup 命令添加和删除正确的传输适配器。适配器的名称是适配器类型和适配器的实例编号的组合。本过程以 SCI-PCI 适配器为例。
根据槽号,查找适配器的名称。
下面的屏幕只是一个示例,反映的可能不是您的硬件的真实情况。
# prtdiag ... ========================= IO Cards ========================= Bus Max IO Port Bus Freq Bus Dev, Type ID Side Slot MHz Freq Func State Name Model ---- ---- ---- ---- ---- ---- ---- ----- -------------------------------- PCI 8 B 2 33 33 2,0 ok pci11c8,0-pci11c8,d665.11c8.0.0 PCI 8 B 3 33 33 3,0 ok pci11c8,0-pci11c8,d665.11c8.0.0 ... |
使用适配器的路径来查找适配器的实例编号。
下面的屏幕只是一个示例,反映的可能不是您的硬件的真实情况。
# grep sci /etc/path_to_inst "/pci@1f,400/pci11c8,o@2" 0 "sci" "/pci@1f,4000.pci11c8,0@4 "sci" |
根据适配器的名称和槽号,查找适配器的实例编码。
下面的屏幕只是一个示例,反映的可能不是您的硬件的真实情况。
# prtconf ... pci, instance #0 pci11c8,0, instance #0 pci11c8,0, instance #1 ... |
使用此过程可更改专用网络地址或/和所使用的网络地址的范围。
请确保已对所有群集节点启用超级用户的远程 shell (rsh(1M)) 或安全 shell (ssh(1)) 访问权限。
在每个群集节点上执行以下子步骤,将所有群集节点重新引导至非群集模式:
从一个节点启动 clsetup 实用程序。
在非群集模式下运行时,clsetup 实用程序会为非群集模式操作显示主菜单。
键入与“更改 IP 地址范围”选项对应的编号,然后按 Return 键。
clsetup 实用程序显示当前专用网络配置,然后询问您是否要更改此配置。
要更改专用网络 IP 地址或 IP 地址范围,请键入 yes,然后按 Return 键。
clsetup 实用程序将显示默认专用网络 IP 地址 172.16.0.0,并询问您是否接受此默认值。
更改或接受此专用网络 IP 地址。
更改或接受默认专用网络 IP 地址范围。
在 Solaris 9 OS 上,默认网络掩码是 255.255.248.0。此默认 IP 地址范围支持在群集中包含最多 64 个节点和最多 10 个专用网络。在 Solaris 10 OS 上,默认网络掩码是 255.255.240.0。此默认 IP 地址范围支持在群集中最多包含 64 个节点、12 个区域群集和 10 个专用网络。
要接受该默认 IP 地址范围,请键入 yes,然后按 Return 键。
然后跳到下一步。
要更改该 IP 地址范围,请执行以下子步骤。
对于 clsetup 实用程序询问的是否接受默认地址范围的问题,键入 no 作为响应,然后按 Return 键。
当您拒绝默认网络掩码时,clsetup 实用程序将提示您输入要在群集中配置的、位于 Solaris 10 OS 上的节点、专用网络和区域群集的数量。
输入您希望在群集中配置的节点和专用网络(在 Solaris 10 OS 上还包括区域群集)的数量。
clsetup 实用程序将根据这些数字计算出两个网络掩码供选择:
第一个网络掩码是支持您所指定的节点和专用网络(在 Solaris 10 OS 上还包括区域群集)的数量所需的最低网络掩码。
第二个网络掩码支持您所指定的节点和专用网络(在 Solaris 10 OS 上还包括区域群集)数量的两倍,以便适应未来可能出现的增长。
指定所计算的任一网络掩码,或者指定一个不同的网络掩码来支持节点和专用网络(在 Solaris 10 OS 上还包括区域群集)的预期数量。
对于 clsetup 实用程序询问的是否继续进行更新的问题,键入 yes 作为响应。
完成后,退出 clsetup 实用程序。
在每个群集节点上完成以下子步骤,将各个群集节点重新引导回群集模式:
引导节点。
在基于 SPARC 的系统上,运行以下命令。
ok boot |
在基于 x86 的系统上,运行以下命令。
显示 GRUB 菜单后,选择相应的 Solaris 条目,然后按 Enter 键。GRUB 菜单显示如下内容:
GNU GRUB version 0.95 (631K lower / 2095488K upper memory) +-------------------------------------------------------------------------+ | Solaris 10 /sol_10_x86 | | Solaris failsafe | | | +-------------------------------------------------------------------------+ Use the ^ and v keys to select which entry is highlighted. Press enter to boot the selected OS, 'e' to edit the commands before booting, or 'c' for a command-line. |
验证引导节点时未发生错误,而且节点现在处于联机状态。
# cluster status -t node |