对视点中的节点进行重复数据删除

通过对节点进行重复数据删除,您可以评估视点中的相似节点,如果它们相互重复,则将其合并为单个节点。

重复数据删除过程概览

对视点进行重复数据删除操作时遵循的一般流程如下:

  1. 数据管理员为包含要进行重复数据删除的视点的视图创建请求。

    Tip:

    对视点进行重复数据删除需要请求是因为,重复数据删除过程的结果会导致处理视点中节点的更改。
  2. 数据管理员针对特定视点中的特定节点类型创建并运行匹配,以便对该视点进行重复数据删除。请参阅“对视点运行重复数据删除操作”。
  3. 匹配工作台显示根据为每个数据源配置的匹配规则确定的潜在匹配项。请参阅“了解重复数据删除结果”和“创建、编辑和删除匹配规则”。

    Note:

    仅显示匹配分数超过匹配规则的自动排除阈值的匹配结果。
  4. 数据管理员检查重复数据删除匹配项,并接受或拒绝每个匹配项,然后应用更改。请参阅“检查重复数据删除结果并应用更改”。
  5. 接受的匹配项应用如下:
    • 匹配的(源)节点将从视点中删除(因为它是重复项)
    • 按照生存规则,来自重复节点的属性和关系将合并到将保留的匹配候选(目标)节点中。请参阅“创建、编辑和删除生存规则”。
  6. 系统使用应用的更改在请求中创建请求项。将为重复节点添加删除操作,并根据生存规则添加属性插入、更新和移动操作。

了解重复数据删除中的匹配的节点和匹配候选者

由于您进行重复数据删除的视点同时包含匹配的节点和匹配候选者,因此务必要了解这两者之间的差异:

  • 匹配的节点是数据源中您在匹配过程中评估的节点。合并节点时,它们成为源节点,在合并操作后,它们会被删除。
  • 匹配候选者是在匹配过程中与其进行匹配的节点。合并节点时,它们成为目标节点(合并后,它们会保留下来),按照生存规则,来自源节点的属性和关系值将合并到这些节点中。

Note:

使用群集键运行重复数据删除时,群集键仅应用于匹配的节点。它不用于限制与其进行匹配的节点。

例如,如果使用群集键“州/省/自治区/直辖市”对客户视点进行重复数据删除,并且群集属性值为“德克萨斯”,则将仅评估德克萨斯的客户(匹配的节点),但可以将这些客户与加利福尼亚的同名客户(匹配候选者)进行匹配。合并记录时,德克萨斯的节点将被删除,其信息将合并到加利福利亚的节点中。