Go to main content

Oracle® ZFS Storage Appliance 管理指南,发行版 OS8.8.x

退出打印视图

更新时间: 2021 年 8 月
 
 

群集互连 I/O

所有控制器间通信都是通过控制器群集接口卡提供的冗余群集 I/O 链路发送一条或多条消息。有关群集接口卡和群集布线的更多信息,请参见Oracle ZFS Storage Appliance 布线指南中的控制器群集 I/O 端口Oracle ZFS Storage Appliance 布线指南中的连接群集电缆

  • ZS9-2 控制器采用基于以太网的群集,使用 Oracle 四端口 10GBASE-T 以太网适配器中的两个以太网端口。

  • ZS7-2、ZS5-x、ZS4-4、ZS3-x 和 7x20 控制器采用基于串行的群集,使用两个串行群集链路,并通过一个链路提供以太网连接。以太网链路可以为非心跳消息提供性能较高的传输(例如重新联接同步),并提供备份心跳。

群集控制器只通过由群集互连建立的安全专用网络互相通信,从不通过打算用于服务或管理的网络接口进行通信。消息归为两大类:一类是用于检测远程控制器故障的定期心跳,另一类是与资源管理器和群集管理子系统关联的较高级别的流量。

所有链路上都将发送心跳,并且是预期的。心跳以固定的时间间隔连续传送。从不会确认或重新传送心跳,因为所有心跳都相同,并且不包含唯一的信息。为使较高级别的软件保持可靠的传输,要对其他流量进行确认、验证和重新传送。

对于 ZS9-2 控制器,以 200 毫秒的时间间隔发送心跳消息。如果 1 秒后未能收到任何消息,将视为发生了链路故障。对于所有其他控制器,所有群集 I/O 链路上都以 50 毫秒的时间间隔发送心跳消息。如果 200 毫秒(串行链路)或 500 毫秒(以太网链路)后未能收到任何消息,将视为发生了链路故障。对于所有控制器,如果所有链路都发生故障,则认为对等设备发生了故障,将执行接管仲裁。

如果 ZS9-2 控制器上发生紧急情况,则群集系统可以在 1200 毫秒内检测到对等设备发生了故障。不会发送紧急情况消息。

如果 ZS7-2、ZS5-x、ZS4-4、ZS3-x 或 7x20 控制器上发生紧急情况,发生紧急情况的控制器会通过每个串行链路传送一条通知消息。无论任何其他链路的状态如何,对等控制器都将立即开始接管。考虑到这些特征,群集子系统通常可以在以下时间内检测到对等设备发生故障:

  • 550 毫秒,如果对等设备已停止响应或断电,或者

  • 30 毫秒,如果对等设备遇到致命的软件错误而导致操作系统发生紧急情况。

本节所述的所有值都是固定值。该设备不提供调整这些参数的功能。此处提供的参数仅供参考,可能随时被修改,恕不另行通知。


注 -  为了避免在群集物理重新定位后造成数据损坏,应验证在新位置是否正确执行了所有群集布线。有关更多信息,请参见防止记忆分裂情况

相关主题