JavaScript is required to for searching.
跳过导航链接
退出打印视图
Oracle® ZFS Storage Appliance 管理指南,发行版 2013.1.3.0
Oracle 技术网
文档库
PDF
打印视图
反馈
search filter icon
search icon

文档信息

关于 Oracle ZFS Storage Appliance

配置 Oracle ZFS Storage Appliance

初始设备配置

使用 BUI 进行初始配置

使用 CLI 进行初始配置

网络配置

使用

配置网络设备

配置网络数据链路

配置网络接口

配置网络 IP 多路径 (IP MultiPathing, IPMP)

配置网络性能和可用性

配置网络路由

使用 BUI 进行网络配置

使用 BUI 创建单端口接口

使用 BUI 修改接口

使用 BUI 创建单端口接口

使用 BUI 创建 LACP 聚合链路接口

创建使用基于探测的故障检测和链路状态故障检测的 IPMP 组

创建仅使用链路状态故障检测的 IPMP 组

使用 BUI 扩展 LACP 聚合

使用 BUI 扩展 IPMP 组

使用 BUI 创建 InfiniBand 分区数据链路和接口

使用 BUI 为群集化控制器创建没有 VLAN ID 的 VNIC

使用 BUI 为群集化控制器创建具有相同 VLAN ID 的 VNIC

使用 BUI 添加静态路由

使用 BUI 删除静态路由

使用 CLI 进行网络配置

使用 CLI 添加静态路由

使用 CLI 删除静态路由

使用 CLI 将多宿主属性更改为 Strict

存储配置

选择存储配置文件

数据配置文件配置

导入现有存储池

添加存储

取消配置存储

重命名存储池

存储池清理

使用 BUI 配置存储池

使用 BUI 将高速缓存设备添加到现有池

使用 CLI 将高速缓存设备添加到现有池

了解设备状态

显示板状态

内存使用情况汇总

显示板服务

显示板硬件

磁盘活动显示板

最新警报

显示板 CLI

持续运行

更改显示的活动统计信息

更改活动阈值

NDMP 状态

NDMP 状态

配置存储区域网络

SAN 术语

配置 SAN 光纤通道

使用 BUI 配置 FC 端口模式

使用 BUI 搜索 FC 端口

使用 BUI 创建 FC 启动器组

使用 BUI 将 LUN 与 FC 启动器组关联

使用 CLI 更改 FC 端口模式

使用 CLI 搜索 FC 端口

使用 CLI 创建 FC 启动器组

使用 CLI 将 LUN 与 FC 启动器组关联

使用 CLI 为启动器和启动器组编写别名脚本

配置 SAN iSCSI

配置 SAN iSCSI 启动器

使用 BUI 创建 Analytics(分析)工作表

配置 SAN iSER 目标

通过 CLI 使用自动生成的 IQN 添加 iSCSI 目标

使用 CLI 添加利用特定 IQN 和 RADIUS 验证的 iSCSI 目标

使用 CLI 添加利用 CHAP 验证的 iSCSI 启动器

使用 CLI 添加 iSCSI 目标组

使用 CLI 添加 iSCSI 启动器组

配置 SAN SRP

使用 BUI 配置 SRP 目标

使用 CLI 配置 SRP 目标

配置用户

用户授权

管理用户属性

使用 BUI 添加管理员

使用 BUI 添加角色

使用 BUI 为角色添加授权

使用 BUI 从角色删除授权

使用 BUI 添加只能查看显示板的用户

使用 CLI 添加角色

使用 CLI 添加管理员

使用 CLI 为角色添加授权

使用 CLI 从角色删除授权

设置 Oracle ZFS Storage Appliance 首选项

首选项属性

使用 CLI 设置首选项

使用 CLI 设置 SSH 公钥

配置警报

警报类别

阈值警报

使用 BUI 添加阈值警报

使用 BUI 添加警报操作

使用 CLI 添加阈值警报

使用 CLI 添加警报操作

发送电子邮件警报

发送 SNMP 陷阱

发送 Syslog 消息

恢复/暂停数据集

恢复/暂停工作表

执行工作流

配置群集

了解群集

群集优点和缺点

群集术语

群集互连 I/O

群集资源管理

群集的接管和故障恢复

群集环境中的配置更改

存储的群集注意事项

网络的群集注意事项

专用本地 IP 接口

Infiniband 的群集注意事项

防止“记忆分裂”情况

估计和降低接管影响

使用 BUI 配置群集

使用 BUI 取消配置群集

使用 CLI 关闭群集配置

使用 CLI 关闭备用机头

使用 CLI 取消配置群集

ZS3-2 群集布线

ZS4-4、ZS3-4 和 7x20 群集布线

用于群集的存储机框布线

使用服务

维护 Oracle ZFS Storage Appliance

使用共享资源

将设备与 Oracle ZFS Storage Appliance 集成

防止“记忆分裂”情况

群集系统中的一种常见故障模式称为记忆分裂;在这种情况下,每个群集机头都认为其对等设备已发生故障并尝试接管。这种情况不进行额外的逻辑推理,会导致大范围难以诊断或更正的破坏性意外行为。这种情况典型的起因是机头共享的通信介质发生故障;对于 Oracle ZFS Storage Appliance,群集 I/O 链路发生故障时会出现这种情况。除内置三重链路冗余(要避免触发接管,只需要一条链路)外,设备软件还会执行仲裁程序来确定哪个机头应该继续接管。

类似的产品采用多种仲裁机制,这些机制通常要求使用法定磁盘(使用 SCSI 预留空间)或法定服务器。为了支持使用 ATA 磁盘而无需其他硬件,Oracle ZFS Storage Appliance 采用一种不同的方法,依靠存储结构自身来提供所需的互斥性。仲裁过程包括尝试以预定义的顺序对存储结构中的每个可见 SAS 扩展器执行 SAS ZONE LOCK 命令。尝试获取所有这些锁定成功的设备将继续接管,另一个将对自身进行重置。由于引导并检测到对等设备无法连接的群集设备将尝试接管并开始相同的仲裁过程,因此将连续循环重置,直到至少恢复一条群集 I/O 链路为止。这可确保另一个机头以后的故障不会造成长时间中断。执行故障恢复后或处于 AKCS_OWNER 状态的机头最新续订其自己对存储结构的访问权限大约 10 秒后,即会解除这些 SAS 区域锁定。

这种仲裁机制非常简单、成本较低且无需其他硬件,但是要求两个群集设备都必须至少能够访问存储结构中的一个通用 SAS 扩展器。在正常情况下,每个设备均可访问所有扩展器,仲裁包括采用至少两个 SAS 区域锁定。但是,可能会出现多重故障情形,在这种情况下,设备无法访问任何通用扩展器。例如,如果拔下了两条 SAS 电缆或关闭了磁盘机框的电源,则每个设备可访问不相交的一部分扩展器。在这种情况下,每个设备都将成功锁定所有可连接的扩展器,断定对等设备已发生故障,并尝试继续接管。这样会因磁盘从属关系冲突和/或严重的数据损坏而导致不可修复的挂起。

请注意,尽管这种情况的后果非常严重,但是只会在多重故障情况(通常只在四重或更多故障的情况)下发生。嵌入 Oracle ZFS Storage Appliance 的群集解决方案目的在于确保不会发生单点故障,保护数据和可用性不受任何似乎合理的故障的影响,而不会造成系统的成本和复杂性过高。仍有可能发生大规模的多重故障而导致丢失服务和/或数据,就像没有 RAID 布局可保护系统免受无限数量磁盘故障的影响一样。

图 2-26  防止“记忆分裂”

image:防止“记忆分裂”

幸运的是,大多数此类故障情形都由人为错误引起,可通过正确安装硬件和对员工进行群集设置和管理最佳做法方面的培训来全面预防。管理员始终都要确保三条群集 I/O 链路全部都已连接且正常运行(参见图),并按照设备随附的安装说明页中所示连接所有存储电缆。特别重要的一点是,将群集投入生产环境前以及此后必须能检测到每个磁盘机框有两个路径(参见图),临时更改布线来支持容量增加或更换故障组件当然除外。管理员应使用警报来监视群集互连链路和磁盘机框路径的状态,并即时解决所有故障。通过确保维持正确的连接,可在硬件或软件组件发生故障时保证可用性和数据完整性。

图 2-27  群集的两个路径

image:群集的两个路径