Oracle® ZFS Storage Appliance 管理指南,发行版 2013.1.5.0

退出打印视图

更新时间: 2016 年 2 月
 
 

复制故障

各个复制更新可能会因许多原因而失败。如有可能,设备会在源设备或目标设备上或在失败的操作的 "Replication"(复制)屏幕上发布警报,报告该故障的原因。您可以通过单击表示该操作的状态的对应橙色警报图标来获得有关故障的详细信息。

有关其他信息,请参见 My Oracle Support 上的 How to Troubleshoot Replication Issues(文档 ID 1397959.1)。

以下为最常见的复制故障类型:

故障
详细信息
Cancelled(已取消)
复制更新已被管理员取消。源或目标上可能已取消了复制,并且一方可能不知道另一方已取消了操作。
Network connectivity failure(网络连接失败)
由于网络问题,设备无法连接到目标设备。可能是源、目标或网络上存在错误配置。
Peer verification failed(对等设备验证失败)
设备无法验证目标的身份。当设备已重新安装或恢复了出厂设置时,此故障最常发生。要生成一组新的验证密钥,必须在源设备上为重新安装或恢复了出厂设置的目标配置一个新的复制目标。请参见About Replication Targets
Peer RPC failed(对等设备 RPC 失败)
远程过程调用在目标系统上失败。当目标设备正在运行不兼容的软件时,此故障最常发生。
Name collision(名称冲突)
由于与目标上为 NDMP 保留的 @<snapname> 存在名称冲突,从 <source> 复制 <project/share> 失败。要恢复,请重命名(或删除)复制源上与目标(警报中指定的目标)上 NDMP 保留的快照具有相同名称的快照,除非它以 .rr 开头。然后,执行手动同步或允许复制源自动重试复制更新。
No package(没有数据包)
复制失败,因为目标上不存在用以包含复制的数据的数据包。由于该数据包是在配置操作时创建的,所以此故障通常发生在管理员销毁了目标上的数据包之后。如果在目标系统上未导入包含数据包的存储池,也可能会发生此故障。如果池出现了故障或在目标设备上重新配置了网络,可能会出现未导入的情况。
Non-empty package exists(存在非空数据包)
复制失败,因为目标数据包包含来自先前的、失败的复制更新的数据。如果某个操作的首次复制更新在复制了一些数据后失败,则当尝试为该操作发送复制更新时,会发生此故障。目标设备不会在没有显式的管理指令的情况下销毁数据,因此它不会覆盖已部分接收的数据。管理员应当删除现有的操作和数据包,在源上创建一个新操作,然后再次启动复制。
Disabled(已禁用)
复制失败,因为目标上已禁用了复制。要么是目标上已禁用了复制服务,要么是已经为正在复制的特定数据包禁用了复制。
Target busy(目标正忙)
复制失败,因为目标系统已达到最大并发复制更新数。系统限制了进行中的最大复制操作数,以避免资源耗尽。达到此限制后,后续的更新接收尝试将失败并显示此错误,后续的更新发送尝试将排入队列中,直到有资源可用。
Out of space(空间不足)
复制失败,因为源系统没有足够的空间来创建新快照。这可能是因为存储池中没有可用的物理空间,或因为项目或其某个共享资源因预留空间不包括快照而将超出配额。
Key Unavailability(密钥不可用性)
由于共享资源使用的加密密钥在源或目标系统上不可用,复制失败。请查看源和目标系统上的警报以确保密钥在这两个系统上都可用。有关复制加密的共享资源和项目的信息,请参见Replicating an Encrypted Share
Incompatible target(目标不兼容)
复制失败,因为目标系统无法接收源系统的数据流格式。如果升级源系统和应用延迟更新,但不在目标上升级和应用相同更新,则可能会导致发生此故障。检查源系统的软件版本的发行说明以获取延迟更新列表,检查是否有某些更新对远程复制有影响。
iSCSI initiator/target missing(缺少 iSCSI 启动器/目标)
复制克隆、断开连接或反转操作失败,因为对于复制数据包中包括的 LUN,不存在启动器组或目标组 LUN。启动器或目标组名称在目标设备上已删除或重命名。
Misc(其他)
复制失败,但源上没有提供更多信息。检查目标系统上的警报日志。如有必要,请联系技术支持以获取帮助。目前属于此类别的一些故障包括目标上没有足够的磁盘空间来接收更新,以及尝试复制目标系统上不存在其原始快照的克隆。

如果复制更新的任何部分失败,该复制更新也会失败。当前的实施会依次复制项目内的共享资源,不会回滚来自失败更新的更改。因此,当更新失败时,目标上的某些共享资源可能是最新的,而另一些共享资源则可能不是最新的。有关详细信息,请参见复制快照和数据一致性

虽然某些数据可能已作为失败更新的一部分被成功复制,但是当前实施会重新发送已作为先前(失败的)更新的一部分发送过的所有数据。也就是说,失败的更新不会从其停止的地方开始,而是将从失败更新原来开始的位置开始。

当调度或连续的复制失败时,系统会等待几分钟,然后重试。系统将无限地继续重试失败的调度或连续的复制。在重试过程中的任何时间点,启动手动更新都将立即开始重试,不存在通常情况下两次连续重试之间会有的延迟。如果手动更新成功完成,则它将终止重试序列并且复制操作将恢复为其正常的已调度或连续更新。前面没有已调度复制的失败手动复制不会重试。

当一个复制更新正在进行并且调度了另一个更新时,调度的复制将推迟,直至前一个更新完成,并且将发出警报。

相关主题