了解 Oracle ZFS Storage Appliance 群集实施的范围非常重要。“群集”一词在业内用于指用途多种多样的多项不同技术。本文中的群集指这样一种元系统:由两个设备机头和共享存储组成,用于在其中一个机头发生某些硬件或软件故障的情况下提高可用性。一个群集只包含两个设备或存储控制器,为简洁起见,本文档中通篇将其称为机头。可以从群集可用的资源集合中为每个机头分配一组存储、网络和其他资源,以便构建两个主要拓扑之一。许多人使用主动-主动一词描述这样一种群集:包含两个(或更多)存储池,为每个机头分配其中一个存储池以及客户机用于连接到该池中所存储数据的网络资源。而主动-被动是指将单个存储池以及关联的网络接口分配给指定为主动的机头。这两个拓扑都受 Oracle ZFS Storage Appliance 支持。两者之间的区别是人为的,没有软件或硬件差别,只需添加或销毁存储池即可随意转换。在这两种情况下,如果一个机头发生故障,另一个(其对等设备)将控制所有已知资源,并提供与这些资源关联的服务。
通过群集,对等设备可在执行修复或更换时提供服务,而不会在修复机头时停机数小时甚至数天时间。此外,群集还支持软件的滚动升级,这样可减少迁移到较新的软件时对业务的中断。除可用性增强之外,一些群集技术还具备某些其他功能。Oracle ZFS Storage Appliance 群集子系统目的并不在于提供这些功能。特别需要指出的是,它不具备以下功能:在多个机头之间实现负载平衡、在发生存储故障时提高可用性、为客户机提供多个设备之间统一的文件系统名称空间,或为了灾难恢复目的而在广泛的地理区域内划分服务职责。这些功能同样不在本文档论述范围之内,但是 Oracle ZFS Storage Appliance 和它提供的数据协议支持可提高可用性的多种其他功能和策略:
数据的Chapter 13, 复制,可用于一个或多个远程站点(从地理位置上讲)的灾难恢复
数据的客户端镜像,可使用多个任意位置的存储服务器提供的冗余 iSCSI LUN 执行
负载平衡,内置到 NFS 协议中,可由外部硬件或软件为其他某些协议提供(仅适用于只读数据)
冗余硬件组件,包括电源、网络设备和存储控制器
Oracle ZFS Storage Appliance 客户服务手册 中的问题软件,可识别发生故障的组件、将其从服务中删除,以及指导技术人员修复或更换适当的硬件
由 LACP 和 IPMP 功能提供的网络结构冗余
冗余存储设备 (RAID)
有关其他可用性功能的其他信息可在本文档相应章节中找到。