通过对节点进行重复数据删除,您可以匹配视点中的相似现有节点,并将其组合为单个节点。
注意事项
您必须对视点具有数据管理员权限或更高权限,才能对该视点进行重复数据删除。
例如,假定您有节点 "Oracle"、"Oracle Inc" 和 "Oracle Incorporated",您想要保留 "Oracle Incorporated",并将其他两个节点的信息合并到该节点。不能将 "Oracle" 合并到 "Oracle Inc",然后再将 "Oracle Inc" 合并到 "Oracle Incorporated"。而是,找到匹配的节点 "Oracle" 并将其标记为 "Oracle Incorporated" 的重复项,然后找到 "Oracle Inc" 并将其标记为 "Oracle Incorporated" 的重复项。
要对视点进行重复数据删除:
Note:
如果已为群集属性运行了重复数据删除操作,将显示处理的最后一个节点的节点创建日期。Tip:
这可能会很有用,例如,如果您对要测试的匹配规则进行了更改。您可以在对整个视点进行重复数据删除之前,小批量地运行并评估结果。使用节点类型的已定义匹配规则和视点的已注册数据源,对视点运行重复数据删除。
重复数据删除操作
由于视点可以包含数千个节点,通常分批对其进行重复数据删除。可以按以下方式定义批:
还可以通过使用以上部分项的组合(例如群集键和指定的批大小)来定义批。
按这些批来处理节点的方式有多个选项。以下术语可以帮助您了解这些选项:
Table 11-1 批处理选项
选项 | 定义 | 如何执行 |
---|---|---|
运行 | 按指定的群集或节点创建开始日期,对第一批节点执行初始重复数据删除。 | 在对视点进行重复数据删除对话框中单击运行重复数据删除。 |
继续 | 按指定的群集或节点创建开始日期,对下一批节点执行后续重复数据删除。系统会跟踪已处理的节点,以便您可以从上次结束的位置继续。 | 执行初始运行操作后,在对视点进行重复数据删除对话框中单击运行重复数据删除。 |
重新运行 | 重新处理请求中的现有结果集。这可能包括一个或多个批。
注意:重新运行将仅重新处理未接受的匹配结果。 |
在重复数据删除结果集面板中,单击要重新运行的结果集旁边的操作 ![]() |
重新启动 | 从已处理的群集的开头开始重新处理该群集。
注意:重新启动仅可用于群集键重复数据删除。 提示:重新运行与重新启动之间的差异在于,重新运行是重新处理一个或多个批,而重新启动是重新处理群集。 |
在对视点进行重复数据删除对话框中单击群集键旁边的重新启动 ![]() |
放弃 | 删除给定请求的现有结果集。处理的最后一个节点将保留,以便您在下次运行重复数据删除时可以继续。
注意:删除请求还将放弃结果集。 |
在重复数据删除结果集面板中,单击要重新运行的结果集旁边的操作 ![]() |
放弃并重新运行 | 删除给定请求的现有结果集,并重新处理结果集中的相同节点。这可能包括一个或多个批。 | 在重复数据删除结果集面板中,单击要重新运行的结果集旁边的操作 ![]() |