复制故障
各个复制更新可能会因多种原因而失败。如有可能,ZFSSA 会在源 ZFSSA 或目标 ZFSSA 上或在失败操作的 "Replication"(复制)屏幕上发布警报,报告该故障的原因。您可以通过单击表示该操作的状态的对应橙色警报图标来获得有关故障的详细信息。以下为最常见的故障类型:
|
|
已取消
|
复制更新已被管理员取消。源或目标上可能已取消了复制,并且一方可能不知道另一方已取消了操作。
|
网络连接失败
|
由于网络问题,ZFSSA 无法连接到目标 ZFSSA。可能是源、目标或网络上存在错误配置。
|
对等设备验证失败
|
ZFSSA 无法验证目标的身份。当设备已重新安装或恢复了出厂设置时,此故障最常发生。要生成一组新的验证密钥,必须在源 ZFSSA 上为重新安装或恢复了出厂设置的目标配置一个新的复制目标。请参见 项目复制目标 。
|
对等设备 RPC 失败
|
|
没有数据包
|
复制失败,因为目标上不存在用以包含已复制数据的数据包。由于该数据包是在配置操作时创建的,所以此故障通常发生在管理员销毁了目标上的数据包之后。如果在目标系统上未导入包含数据包的存储池,也可能会发生此故障。如果池出现了故障或在目标 ZFSSA 上重新配置了网络,可能会出现未导入的情况。
|
存在非空数据包
|
复制失败,因为目标数据包包含来自先前失败的复制更新的数据。如果某个操作的首次复制更新在复制了一些数据后失败,则当尝试为该操作发送复制更新时,会发生此故障。目标 ZFSSA 不会在没有显式的管理指令的情况下销毁数据,因此它不会覆盖已部分接收的数据。管理员应当删除现有的操作和数据包,在源上创建一个新操作,然后再次启动复制。
|
已禁用
|
复制失败,因为目标上已禁用了复制。目标上已禁用了复制服务,或已经为正在复制的特定数据包禁用了复制。
|
目标正忙
|
复制失败,因为目标系统已达到最大并发复制更新数。系统限制了进行中的最大复制操作数,以避免资源耗尽。达到此限制后,后续的更新接收尝试将失败并显示此错误,后续的更新发送尝试将排入队列中,直到有资源可用。
|
空间不足
|
复制失败,因为源系统没有足够的空间来创建新快照。这可能是因为存储池中没有可用的物理空间,或因为项目或其某个共享资源因预留空间不包括快照而将超出配额。
|
目标不兼容
|
复制失败,因为目标系统无法接收源系统的数据流格式。如果升级源系统和应用延迟更新,但不在目标上升级和应用相同更新,则可能会导致此故障。检查源系统的软件版本的发行说明以获取延迟更新列表,检查是否有某些更新对远程复制产生影响。
|
其他
|
复制失败,但源上没有提供更多信息。检查目标系统上的警报日志。如有必要,请联系技术支持以获取帮助。目前属于此类别的一些故障包括目标上没有足够的磁盘空间来接收更新,以及尝试复制目标系统上不存在其原始快照的克隆。
|
|
如果复制更新的任何部分失败,该复制更新也会失败。当前的实施会依次复制项目内的共享资源,不会回滚来自失败更新的更改。因此,当更新失败时,目标上的某些共享资源可能是最新的,而另一些共享资源则可能不是最新的。有关详细信息,请参见上文中的“快照和数据一致性”。
虽然某些数据可能已作为失败更新的一部分被成功复制,但是当前实施会重新发送已作为先前(失败的)更新的一部分发送过的所有数据。也就是说,失败的更新不会从其停止的地方开始,而是将从失败更新原来开始的位置开始。
当手动的或调度的更新失败时,系统在下一次调度更新(如果有)之前不会自动重试。当连续复制失败时,系统会等待几分钟,然后重试。系统将无限地继续重试失败的连续复制。
当一个复制更新正在进行而另一更新按调度要发生时,会完全跳过后一更新,而不是在先前的更新完成后随即启动后一更新。仅当调度发生下一更新时才会发送下一更新。更新因该原因而跳过时系统会发布警报。