27 使用匹配和重复数据删除

匹配和重复数据删除是指比较各种上下文中的节点,找出相同的节点,然后将结果合并的过程。这有助于防止系统中出现重复数据。

Oracle Fusion Cloud Enterprise Data Management 提供了两种预防重复数据的机制:

  • 匹配和合并请求项:将请求中的传入节点与视点中的现有节点进行匹配,以识别并合并相同的节点,从而在出现重复之前加以预防。请参阅“了解匹配和合并请求项”。
  • 重复数据删除:匹配视点中已存在的节点,以识别并合并相同的节点,从而在出现重复之后在系统中予以纠正。请参阅“了解重复数据删除”。

对于这两种机制,您需要创建匹配规则,以指定如何基于属性值将节点与其他节点进行匹配;同时创建生存规则,以指定如何合并节点的属性及关系。

术语

以下术语可以帮助您理解匹配流程:

  • 数据源:一个对象,表示要在云 EDM 中匹配和链接的传入数据的源。这可以是另一个云 EDM 应用程序(称为已注册数据源),也可以是其数据不在云 EDM 中进行管理的外部系统(称为未注册数据源)。请参阅“了解数据源”。

    Note:

    您可以匹配任何数据源的请求项。您只能对已注册数据源的数据进行重复数据删除。
  • 匹配规则:控制如何将传入数据源中的节点与节点类型(对于匹配和合并)或视点(对于重复数据删除)中已存在的节点进行匹配。请参阅“创建、编辑和删除匹配规则”。
  • 生存规则:指定源节点中的哪些属性和关系会在确认匹配后合并到视点中的目标节点。请参阅“创建、编辑和删除生存规则”。
  • 匹配工作台:用于根据匹配规则中的条件检查匹配候选者,并接受要合并到现有节点的匹配候选者。请参阅“匹配和重复数据删除”。
  • 群集属性(仅限重复数据删除):您确定的一个属性,用于将节点分组为群集,以便您可以对群集运行匹配,以识别并组合重复的节点。