Sun Cluster 3.0 12/01 概念

动态重新配置支持

Sun Cluster 3.0 对动态重新配置 (DR) 软件功能的支持正在进一步的开发过程中。 本节说明了 Sun Cluster 3.0 12/01 对 DR 功能的支持所涉及的一些概念和考虑事项。

注意:相关文档中适用于 Solaris 8 DR 功能的所有要求、步骤和限制同样适用于 Sun Cluster DR 支持(唯一的区别是操作环境静态操作)。 因此,在对 Sun Cluster 软件使用 DR 功能之前,请先查阅有关 Solaris 8 DR 功能的文档。 特别要注意那些在执行 DR 分离操作时将影响非网络 IO 设备的问题。 《Sun Enterprise 10000 Dynamic Reconfiguration User Guide》和《Sun Enterprise 10000 Dynamic Reconfiguration Reference Manual》(包括在《Solaris 8 on Sun Hardware》 文档集中)可以从 http://docs.sun.com 下载。

动态重新配置的一般说明

DR 功能允许在运行的系统中进行各项操作,如删除系统硬件。 DR 进程的设计旨在确保系统操作的连续性,而不必使系统停机或中断群集的使用。

DR 操作在板级别进行。 因此,DR 操作会影响板上的所有组件。 每块板可以包含多个组件,如 CPU、内存以及用于磁盘驱动器、磁带驱动器和网络连接的外部接口。

如果删除某块板,系统就再也无法使用该板上的任何组件。 删除某块板之前,DR 子系统可以确定是否正在使用该板上的组件。 如果删除的设备正在使用中,则将导致系统错误。 如果 DR 子系统发现正在使用某个设备,则该子系统将拒绝 DR 删除板操作。 因此,DR 删除板操作始终是很安全的。

DR 添加板操作也始终是安全的。 系统自动将新添加到板上的 CPU 和内存投入使用。 不过,系统管理员必须手动配置群集,然后才可随意使用新添加的板上的其他组件。


注意:

DR 子系统包含若干个级别。 如果较低的级别报错,则较高的级别同样也会报错。 不过,如果较低级别报具体的错误,较高级别将报"未知错误"。系统管理员应该忽略较高级别所报的"未知错误"。


下面各节说明了对于不同设备类型的 DR 考虑事项。

对于 CPU 设备的 DR 群集考虑事项

如果 DR 板删除操作会影响到板上的 CPU,则 DR 子系统允许执行该操作,但会自动使该节点停止使用这些 CPU。

如果 DR 添加板操作会影响到所添加板上的 CPU,则 DR 子系统自动使该节点开始使用这些 CPU。

对于内存的 DR 群集考虑事项

基于 DR 目的,有两种内存需要加以考虑。 这两种内存仅在用法上有所不同。 对于这两种内存而言,实际的硬件是相同的。

操作系统所用的内存称作内核内存箱。 Sun Cluster 软件不支持对包含内核内存箱的板执行删除操作,并将拒绝执行这样的操作。 如果 DR 删除板操作所影响的是内存不是内核内存箱,则 DR 子系统允许执行该操作,但会自动使节点停止使用该内存。

如果 DR 添加板操作会影响内存,则 DR 子系统将自动使节点开始使用新的内存。

对于磁盘驱动器和磁带驱动器的 DR 群集考虑事项

允许对主节点的活动驱动器执行 DR 删除操作。可以对主节点中的非活动驱动器和辅助节点的驱动器执行 DR 删除操作。 在 DR 操作之前和之后都可继续访问群集数据。


注意:

允许执行那些会影响定额设备可用性的 DR 操作。有关定额设备的考虑事项以及对其执行 DR 操作的过程,请参阅"对于定额设备的 DR 群集考虑事项"


下面的步骤简要说明了对磁盘驱动器或磁带驱动器执行 DR 删除板操作的过程。 有关如何执行这些操作的详细说明,请参阅《Sun Cluster 3.0 U1 系统管理指南》。

  1. 确定磁盘驱动器或磁带驱动器是否是活动设备组的一部分。

    • 如果该驱动器不是活动设备组的组成部分,就可以对其执行 DR 删除操作。

    • 如果 DR 删除板操作将影响活动的磁盘驱动器或磁带驱动器,则系统将拒绝执行该操作并且标识出可能会受该操作影响的驱动器。如果驱动器是活动设备组的组成部分,请转到步骤 2

  2. 确定驱动器是主节点的组件还是辅助节点的组件。

    • 如果驱动器是辅助节点的组件,就可以对其执行 DR 删除操作。

    • 如果驱动器是主节点的组件,就必须先将主节点和辅助节点对调,然后才对该设备执行 DR 删除操作。


小心:小心:

如果当前的主节点在您正对辅助节点执行 DR 操作时出现故障,则会影响群集的可用性。 在提供辅助节点之前,该主节点将无法进行故障转移。


对于定额设备的 DR 群集考虑事项

不能对当前配置为定额设备的设备执行 DR 删除操作。如果 DR 删除板操作将影响定额设备,则系统会将拒绝执行该操作并标识出可能会受该操作影响的定额设备。只有将定额设备进行处理使之不再是定额设备之后,才能对其执行 DR 删除操作。

下面的步骤简要说明了对定额设备执行 DR 删除操作的过程。 有关如何执行这些操作的详细说明,请参阅《Sun Cluster 3.0 U1 系统管理指南》。

  1. 启用一个设备(不是正对其执行 DR 操作的设备)作为定额设备。

  2. 对您正对其执行 DR 操作的设备进行处理,使之不是定额设备。

  3. 对该设备执行 DR 删除操作。

对于专用互连接口的 DR 群集考虑事项

不能对活动的专用互连接口执行 DR 操作。如果 DR 删除板操作将影响活动的专用互连接口,则系统将拒绝执行该操作并标识出可能会受该操作影响的接口。只有禁用活动接口后,才能将其删除(另见下面的警告)。如果用某个接口替换专用互连接口,其状态将保持不变,从而免于执行 Sun Cluster 的其他重新配置步骤。

下面的步骤简要说明了对专用互连接口执行 DR 删除操作的过程。 有关如何执行这些操作的详细说明,请参阅《Sun Cluster 3.0 U1 系统管理指南》。


小心:小心:

Sun Cluster 要求每个节点与群集中的其他节点之间至少有一个有效路径。 请勿禁用支持任一群集节点的最后一个路径的专用互连接口。


  1. 禁用其中包含您正对其执行 DR 操作的互连接口的传输电缆。

  2. 对物理的专用互连接口执行 DR 删除操作。

对于公共网络接口的 DR 群集考虑事项

可以对不处于活动状态的公共网络接口执行 DR 删除操作。如果 DR 删除板操作将影响活动的公共网络接口,则系统将拒绝执行该操作并标识出可能会受该操作影响的接口。首先必须将活动的公共网络接口从网络适配器故障转移 (NAFO) 组的活动适配器实例中删除。


小心:小心:

如果活动的网络适配器在您正对禁用的网络适配器执行 DR 删除操作时出现故障,则会影响其可用性。活动适配器在执行 DR 操作期间无法进行故障转移。


下面的步骤简要说明了对公共网络接口执行 DR 删除操作的过程。 有关如何执行这些操作的详细说明,请参阅《Sun Cluster 3.0 U1 系统管理指南》。

  1. 将活动适配器切换成备用适配器,以便可以将其从 NAFO 组中删除。

  2. 从 NAFO 组中删除该适配器。

  3. 对公共网络接口执行 DR 操作。