将该规划信息添加到《Sun Cluster 3.0 12/01 发行说明》中的 "Disk Device Group Configurations Worksheet" 和 "Volume Manager Configurations Worksheet" 中。 对于 Solstice DiskSuite,还要将该规划信息添加到"元设备工作表 (Solstice DiskSuite)"中。
本节提供规划群集配置的卷管理的指南。
Sun Cluster 使用卷管理器软件将磁盘分成磁盘设备组,这样,就可以将磁盘设备组作为一个单元来管理。Sun Cluster 支持 Solstice DiskSuite 软件和 VERITAS Volume Manager (VxVM)。
如果使用 Solstice DiskSuite 软件,则必须将它安装在群集的所有节点上,不管是否在某些节点上使用 VxVM 来管理磁盘。
如果使用 VxVM 并启用 VxVM 群集功能,则必须在群集的所有节点上安装和许可 VxVM。
如果使用 VxVM,却不启用 VxVM 群集功能,则只需在与 VxVM 将管理的存储设备连接的节点上安装和许可 VxVM。
如果在一个节点上同时安装了 Solstice DiskSuite 软件和 VxVM,则必须使用 Solstice DiskSuite 软件来管理每个节点的本地磁盘(如根磁盘),且必须使用 VxVM 来管理所有共享磁盘。
有关如何安装和配置卷管理器软件的说明,请参阅卷管理器文档及"安装和配置 Solstice DiskSuite 软件"或"安装和配置 VxVM 软件"。有关群集配置中卷管理的详细信息,请参阅《Sun Cluster 3.0 12/01 概念》。
配置磁盘时请考虑以下一般指南。
镜像的多主机磁盘 - 必须跨磁盘扩展单元镜像所有多主机磁盘。 有关镜像多主机磁盘的指南,请参阅"镜像多主机磁盘"。如果存储设备提供了硬件 RAID 及到磁盘的冗余通道,则不需要使用软件镜像。
镜像的根 - 镜像根磁盘可确保高可用性,但这种镜像并非必需操作。有关确定是否镜像根磁盘的指南,请参阅"镜像指南"。
唯一命名 - 在任何群集节点上,如果一个本地 Solstice DiskSuite 元设备或 VxVM 卷是 /global/.devices/node@nodeid 文件系统安装所在的设备,则该元设备或卷的名称在整个群集中必须是唯一的。
节点列表 - 为确保磁盘设备组的高可用性,该磁盘设备组与任何关联资源组的潜在主节点的节点列表和故障返回策略必须完全相同。或者,如果可伸缩资源组使用多于其关联的磁盘设备组的节点,则使可伸缩资源组的节点列表成为磁盘设备组的节点列表的一个超集。 有关节点列表的信息,请参见《Sun Cluster 3.0 12/01 Data Services Installation and Configuration Guide》中的资源组规划信息。
多端口磁盘 - 必须将用于构成群集内设备组的所有磁盘连接(或端口连接)到在节点列表中为该设备组配置的所有节点上。当这些磁盘被添加到磁盘集时,Solstice DiskSuite 软件会自动就此问题进行检查。但是,配置的 VxVM 磁盘组与任何特定的节点集都没有关联。
热备用磁盘 - 可以使用热备用磁盘提高可用性,但它们不是必需的。
有关磁盘布局建议和附加限制的信息,请参阅卷管理器文档。
规划 Solstice DiskSuite 配置时请考虑以下几点。
本地元设备名称 - 每个本地元设备的名称在整个群集中必须是唯一的,并且不能与任何设备 ID (DID) 名称相同。
调解器 - 每个刚好配置有两个磁盘串并刚好由两个节点控制的磁盘集都必须有为该磁盘集配置的 Solstice DiskSuite 调解器。 磁盘串由一个磁盘群组、其物理磁盘、群组到节点的电缆以及接口适配卡组成。每个磁盘集都必须刚好配置有两个充当调解主机的节点。 必须对需要调解器的所有磁盘集使用这两个同样的节点,并且这两个节点必须控制这些磁盘集。 调解器不能配置用于不满足两个字符串和两个主机要求的磁盘集。 有关详细信息,请参阅 mediator(7) 手册页。
/kernel/drv/md.conf 设置 - 在重新配置引导时,会根据 /kernel/drv/md.conf 文件中找到的配置参数,预先创建每个磁盘集使用的所有元设备。md.conf 文件中的字段在 Solstice DiskSuite 文档中有详细说明。要支持 Sun Cluster 配置,必须对 nmd 和 md_nsets 字段进行如下修改。
nmd - nmd 字段定义了为每个磁盘集创建的元设备的数目。 必须将 nmd 的值设置为由群集中的任何一个磁盘集所使用的元设备数目的最大预测值。例如,如果群集在其前 15 个磁盘集中使用 10 个元设备,但在第 16 个磁盘集中使用 1000 个元设备,则您至少必须将 nmd 的值设置为 1000。同时,nmd 的值必须足够大,以确保有足够的号码使每个 DID 名称和每个本地元设备名称在整个群集中是唯一的。每个磁盘集最多允许 8192 个元设备。每个磁盘集的缺省元设备个数为 128。
md_nsets - md_nsets 字段规定可为系统创建的磁盘集的总数,以满足整个群集的需要。必须将 md_nsets 的值设置为群集中预计的磁盘集数目再加上 1,以允许 Solstice DiskSuite 软件管理本地主机上的专用磁盘(即不在本地磁盘集中的那些元设备)。每个群集最多允许 32 个磁盘集。缺省磁盘集数为 4。
在安装时设置这些字段,以便将来可以对群集进行扩展。 在群集运行后增大这些值将非常耗时,因为它需要对每个节点进行重新配置和重新引导。 在以后增加这些值还会增大在根 (/) 文件系统中创建所有请求的设备时空间分配不足的可能性。
所有群集节点必须有完全相同的 /kernel/drv/md.conf 文件,而不管每个节点向多少个磁盘集提供服务。不按本指南操作可能导致严重的 Solstice DiskSuite 错误并且可能丢失数据。
规划 VERITAS Volume Manager (VxVM) 配置时请考虑以下几点。
基于群组的命名 - 如果使用设备的基于群组的命名(VxVM 版本 3.2 中引入的功能),请确保在共享相同存储器的所有群集节点上使用一致的设备名称。VxVM 不会使这些名称协调一致,因此,管理员必须确保 VxVM 将相同名称分配给不同节点上的相同设备。虽然未能分配一致名称不会影响群集的正确运转,但会严重加大群集管理的复杂性,从而增加配置错误的可能性,这一切都潜在着导致数据丢失的风险。
根磁盘组 - 必须在每个节点上创建一个缺省根磁盘组 (rootdg)。可以在下列磁盘上创建 rootdg 磁盘组。
根磁盘,它必须是封装的
一个或多个本地非根磁盘,它可以是封装的,也可以是初始化的
根和本地非根磁盘的组合
rootdg 磁盘组必须在节点本地。
封装 - 要封装的磁盘必须有两个磁盘片表条目是空闲的。
卷数 - 创建任一给定磁盘设备组时,估计该磁盘设备组将使用的最大卷数。
如果卷数小于 1000,则可以使用缺省次编号。
如果卷数是 1000 或更大的数目,则必须小心计划给磁盘设备组卷分配次编号的方式。 任何两个磁盘设备组都不能有重叠的次编号赋值。
脏区域记录 - 强烈建议您使用"脏区域记录"(DRL),但这不是必需的。使用 DRL 可以缩短节点发生故障后的卷恢复时间。 使用 DRL 可能减少 I/O 吞吐量。
对于群集文件系统,记录是必需的。Sun Cluster 支持以下记录文件系统。
Solaris UFS logging
Solstice DiskSuite trans 元设备 UNIX 文件系统 (UFS) 记录
VERITAS File System (VxFS) 记录
有关 Solstice DiskSuite trans metadevice UFS logging 的信息,请参阅 Solstice DiskSuite 文档。有关 Solaris UFS logging 的信息,请参阅 mount_ufs(1M) 手册页。有关 VxFS 记录的信息,请参阅随 VxVM 软件提供的 mount_vxfs(1M) 手册页。
下表列出由每个卷管理器支持的记录文件系统。
表 1-4 支持的文件系统记录矩阵
卷管理器 |
支持的文件系统记录 |
---|---|
Solstice DiskSuite |
Solaris UFS logging、Solstice DiskSuite trans metadevice UFS logging、VxFS 记录 |
VERITAS Volume Manager |
Solaris UFS logging、VxFS 记录 |
当在 Solaris UFS logging 和 Solstice DiskSuite trans metadevice UFS logging 之间进行选择时,请考虑以下几点。
Solaris UFS 日志大小 - Solaris UFS logging 始终根据文件系统的大小,使用 UFS 文件系统中的空闲空间来分配日志。
在小于 1 千兆字节的文件系统中,日志占用 1 兆字节。
在 1 千兆以上字节的文件系统中,日志将按文件系统上每 1 千兆字节占用 1 兆字节计算,最多可占用 64 兆字节。
记录元设备 - Solstice DiskSuite trans 元设备管理 UFS 记录。trans 元设备的记录设备组件是一个可镜像和剥离的元设备。 可以创建最大为 1 千兆字节的日志大小,但 64 兆字节对于大多数系统来说已绰绰有余。最小的日志大小为 1 兆字节。有关使用 trans 元设备进行记录的信息,请参阅 Solstice DiskSuite 文档。
本节提供规划群集配置的镜像的指南。
在 Sun Cluster 配置中镜像所有多主机磁盘使该配置能够承受单磁盘故障。Sun Cluster 软件要求跨磁盘扩展单元来镜像所有多主机磁盘。如果存储设备提供了硬件 RAID 及到磁盘的冗余通道,则不需要使用软件镜像。
单独的磁盘扩展单元 - 给定镜像或丛的每个子镜像应驻留在不同的多主机磁盘扩展单元中。
磁盘空间 - 镜像使必需的磁盘空间量增加一倍。
三路镜像 - Solstice DiskSuite 软件和 VERITAS Volume Manager (VxVM) 支持三路镜像。但是,Sun Cluster 只要求两路镜像。
元设备数 - 在 Solstice DiskSuite 软件中,镜像由诸如并置或条带的其他元设备组成。大型配置可能包含大量的元设备。 例如,为每个记录 UFS 文件系统创建 7 个元设备。
不同的磁盘大小 - 如果镜像到不同大小的磁盘,则镜像容量限于最小子镜像或丛的大小。
有关多主机磁盘的详细信息,请参阅《Sun Cluster 3.0 12/01 概念》。
将该规划信息添加到《Sun Cluster 3.0 12/01 发行说明》中的 "Local File System Layout Worksheet" 中。
为实现最大可用性,应镜像根 (/)、/usr、/var、/opt 和本地磁盘上的 交换。在 VxVM 中,封装根磁盘并且镜像所生成的子磁盘。 但是,Sun Cluster 软件不要求镜像根磁盘。
在决定是否镜像根磁盘之前,请考虑关于根磁盘的各种备用方法的风险、复杂性、成本以及服务时间。一个镜像策略不可能适用于所有配置。在决定是否要镜像根时,可能要考虑本地企业服务代表的首选解决方案。
有关如何镜像根磁盘的说明,请参阅卷管理器文档和"安装和配置 Solstice DiskSuite 软件"或"安装和配置 VxVM 软件"。
复杂性 - 镜像根磁盘会增加系统管理的复杂性并且使单用户模式下的引导复杂化。
备份 - 不管是否镜像根磁盘,都应该定期执行根备份。 仅镜像并不能避免管理错误。 只有备份计划才能使您恢复被误改或误删的文件。
定额设备 - 不要使用已配置为定额设备的磁盘来镜像根磁盘。
定额 - 在 Solstice DiskSuite 软件中,如果发生元设备状态数据库定额丢失的故障,则必须先进行维护才能重新引导系统。有关元设备状态数据库和状态数据库复本的信息,请参阅 Solstice DiskSuite 文档。
单独的控制器 - 最高可用性包括在一个单独的控制器上镜像根磁盘。
引导磁盘 - 可以将镜像设置为一个可引导的根磁盘,以便在主根磁盘发生故障后可以从镜像中进行引导。
辅助根磁盘 - 通过镜像的根磁盘,即使主根磁盘出现故障,仍可以在辅助(镜像)根磁盘中继续工作。稍后(可能在动力循环或瞬时 I/O 错误之后)可能要将主根磁盘返回维修,并使用 OpenBootTM PROM boot-device 字段中指定的主根磁盘来执行后续引导。在这种情况下,不需要执行任何手动修复任务,只需要正常启动驱动器即可进行引导。 注意,的确发生 Solstice DiskSuite 重新同步。在驱动器返回维修时,重新同步需要手动进行一个步骤。
如果对辅助(镜像)根磁盘中的任何文件进行了修改,则引导时它们可能不反映在主根磁盘中(导致失效子镜像)。 例如,可能会丢失对 /etc/system 文件所作的更改。一些 Solstice DiskSuite 管理命令可能在主根磁盘损坏时更改了 /etc/system 文件。
引导程序不检查它是从镜像中引导还是从基础物理设备中引导,并且镜像将成为通过引导进程的活动 partway(在装入元设备后)。 在此之前,系统容易受到子镜像问题的攻击。