在群集与单机 Oracle ZFS Storage Appliance 配置之间选择时,权衡群集操作的利与弊非常重要。整个 IT 行业的常见做法是将群集视为自动化架构决策,但这种想法反映了该领域内某些供应商推崇的群集风险和回报理想化的观点。除与第二个机头关联的显著提高的前期和持续硬件与支持成本之外,群集还具有其他技术和操作风险。其中某些风险可通过确保对所有人员进行有关群集操作的全面培训来减轻,而其他一些则是群集操作概念固有的风险。此类风险包括:
接管期间应用程序可能无法容忍依赖于协议的行为
群集软件自身可能会发生故障或导致另一个子系统发生故障,这种情况在单机操作中不会发生
提高管理复杂性以及执行管理任务时操作员出错的可能性
多种故障或严重的操作员错误可能会导致数据丢失或损坏,这种情况在单机配置中不会发生
增加从意外的软件和/或硬件状态恢复的难度
这些是基本的成本和风险,以某种形式存在于市场上所有群集产品或支持群集的产品(包括 Oracle ZFS Storage Appliance)中,无法减轻或完全消除。存储架构师必须将其与群集的以下主要优势进行权衡:发生相当少见的灾难性硬件或软件故障事件时,可将不可用期限从数小时或数天缩短到几分钟甚至更短时间。这种成本/优势分析是否表明在 Oracle ZFS Storage Appliance 部署中使用群集更有利取决于一些局部因素,例如 SLA 条款、现有支持人员及其资格、预算限制、认为发生各种可能故障的可能性,以及增强可用性的备选策略的适用性。这些因素高度依赖于站点、应用和业务,必须逐个进行评估。了解本节中其余部分的内容有助于您在设计和实施统一存储基础结构期间做出适当的选择。