通过重复数据删除,您可以使用匹配过程找出视点中相互重复的节点,并将其组合为单个节点。
重复数据删除对已存在于视点中的节点运行,这与匹配和合并请求项不同,后者处理在请求中添加的传入节点。这使您可以查找并合并可能在匹配可用之前或请求流程之外(例如通过导入或加载)添加到视点的重复现有节点。
重复数据删除使用了许多与匹配和合并请求项相同的元素:
重复数据删除模式
您可以在两种模式下对视点中的节点进行重复数据删除:
在单个请求中,针对特定视点和节点类型,您只能运行一种重复数据删除模式,但可以在不同上下文中使用两种模式对视点中的节点进行重复数据删除。例如,您可以先通过群集键对视点中的节点进行重复数据删除,然后使用基于时间的重复数据删除以增量方式对之后创建的所有节点进行重复数据删除。
Note:
无论采用哪种模式,一次只能对一个活动请求中特定节点类型的节点进行重复数据删除。群集键和基于时间的重复数据删除的节点创建日期本质上作用都是限制重复数据删除操作的范围。与匹配和合并不同,匹配和合并会自动受到请求中请求项的最大限制的约束,而视点可能包含数百万个节点。通过指定节点创建日期或群集属性,您可以将要进行重复数据删除的特定节点放在单个操作中予以处理。
Note:
群集键和基于时间的重复数据删除均要求进行重复数据删除的节点类型包含CoreStats.Created Date
属性,以便系统能够跟踪哪些节点已评估、哪些未评估方面的进展。使用群集键进行重复数据删除
要使用群集键对节点进行重复数据删除,必须为要匹配的节点的节点类型定义群集属性。这会筛选视点中的节点列表,以便与同一视点中的其他节点进行匹配。运行重复数据删除流程时,应指定要用于对节点进行重复数据删除的群集属性值。
Tip:
为节点类型定义群集属性时,所选属性必须具有该节点类型的“允许的值”列表(请参阅“为节点类型配置群集属性”)。然后,当使用群集键运行重复数据删除时,应从该允许的值列表中选择群集属性。例如,如果要对客户进行重复数据删除且群集属性为 "State",您可以选择 "Texas" 作为群集值,以对德克萨斯州的客户进行重复数据删除。集群键应用于要匹配的节点集,而不是与其进行匹配的节点。因此,在上面的示例中要匹配的是德克萨斯州的客户,如果加利福尼亚州有同名的匹配项,仍会显示出来。
基于时间的重复数据删除
使用基于时间的重复数据删除,您可以对在特定日期当日或之后创建的节点进行重复数据删除。它不要求您指定群集属性。而是,在创建匹配项以进行重复数据删除时,应指定节点创建开始日期和(可选)批大小。