了解重复数据删除结果

“重复数据删除结果”屏幕显示匹配候选者,并允许您接受、拒绝或跳过这些匹配候选者。

运行匹配后,屏幕会显示匹配候选者:


重复数据删除工作台,在下面各部分中进行了介绍

该屏幕包含以下部分:

“重复数据删除结果集”面板


重复数据删除的“重复数据删除结果集”面板

“重复数据删除结果集”面板显示按群集属性或节点创建日期(如果对多个不同的视点或节点类型进行重复数据删除)为此请求运行的匹配的重复数据删除结果集。单击重复数据删除结果集可将视图切换到基于该群集属性或创建日期的匹配项。

Note:

如果您从匹配工作台离开(例如,通过返回请求视图或关闭视点),重复数据删除结果集会保留。

每个重复数据删除结果集都会显示具有匹配候选者的匹配的节点总数,以及具有匹配候选者的已接受、已拒绝和已跳过的匹配的节点数。

从此面板中,您可以执行以下操作:

“摘要”部分


“摘要”部分,下面进行了介绍

“摘要”部分显示视点、节点类型、用于匹配的群集键(用于基于群集键的重复数据删除)或节点创建日期(用于基于时间的重复数据删除)、视点中具有匹配项和没有匹配项的匹配的节点数、重复数据删除的运行日期和时间、要处理的最后一个节点的创建日期。您可以单击视点或节点类型以检查相应对象。

Note:

每个重复数据删除结果集都特定于某个视点、节点类型和群集键值或节点创建日期。因此,如果您的视点包含的节点具有不同的群集键值,则必须针对每个群集键值运行单独的匹配,才能查看每个值的匹配候选者。

“重复数据删除结果”部分


“重复数据删除结果”部分,下面进行了介绍

“重复数据删除结果”部分显示所选重复数据删除结果集中的匹配候选者,并允许您接受、拒绝或跳过匹配项。对于群集键重复数据删除操作,将显示群集键。在匹配规则中使用的其他属性以粗体突出显示。

如果某个候选者满足多个匹配规则的条件,对于该候选者,将返回单个结果,并显示关联的匹配规则。此外还显示每个规则的匹配分数。例如,在上面的屏幕截图中,TRL Bank Limited 候选者满足两个匹配规则的条件:Name and Industry 和 Industry Only。

Note:

如果某个匹配规则达到或低于自动排除阈值,则匹配候选者不显示在重复数据删除结果中。

“重复数据删除结果”部分包含以下信息:

  • 匹配的节点:结果集按匹配的节点(即,来自您评估的数据源的节点)分组。匹配的节点显示有数据源 数据源图标 图标,并以灰色背景突出显示。每个匹配的节点的“匹配结果”列均显示找到的匹配结果数。

    在上面的示例中,名称为 "Dink Bank Limited" 的第一行是匹配的节点。

  • 匹配候选者:每个匹配的节点下缩进显示的是匹配候选者。匹配候选者是根据匹配规则与其进行匹配的节点,它们显示有节点 节点图标 图标。系统会显示有关每个候选者的以下详细信息。(示例列显示以上示例屏幕截图中的相应值。)
    描述 示例
    名称 匹配候选者的名称属性。

    Note:

    如果名称属性用于匹配,则列标题中会显示信息图标。

    匹配候选者包括 TRL Bank Limited、Bank of Salem 和 Moore Limited 等。

    群集属性(仅基于群集键的重复数据删除) 用于重复数据删除的群集属性值。 Industry
    用于匹配的其他属性 如果在匹配规则中使用了除名称以外的其他属性,则这些属性将显示为列,而且列标题中显示有信息图标。 Industry
    匹配结果

    对于每个匹配的节点,会显示匹配项数。

    对于匹配候选者,会显示检查,这表明节点类型中的节点被确定为可能与匹配的节点匹配。

    匹配的节点行显示 29,匹配候选者行均会在“匹配结果”列中显示检查,这表明它们被确定为可能的匹配候选者。
    匹配规则和分数 显示以下信息:
    • 节点类型和数据源的匹配规则名称
    • 匹配候选者的置信度,用数字分数和彩色计量表条表示。

    有关匹配分数计算的详细信息,请参阅常见问题“匹配分数是如何计算的,如何使用它们?

    显示前三个 Industry Only 匹配规则的置信度为 100,这表明匹配候选者与匹配规则条件完全匹配。其他候选者的数字较小,这表明这些候选者的置信度较低,因为它们只匹配部分匹配规则条件。

    根据匹配的节点与匹配候选者之间名称中共享的字符数,Name and Industry 规则的候选者显示不同的数字。

    状态 显示以下信息:
    • 暂挂:尚未对匹配候选者执行任何操作。
    • 已接受:已接受匹配候选者为匹配项。

      Note:

      接受匹配候选者会自动将该请求项的所有其他“暂挂”匹配候选者更新为“已拒绝”。
    • 已拒绝:已拒绝匹配候选者,可能是因为您接受了其他匹配候选者,也可能是因为您拒绝了该匹配候选者。
    • 已跳过:已检查匹配候选者并将其标记为“已跳过”。将候选者标记为“已跳过”后,下次对此节点类型和数据源运行匹配时,该候选者将再次显示以供检查,以便您对其执行操作。
    • 重复:匹配候选者是在此请求中以前已被接受作为视点中其他节点的重复项的匹配的节点。

    TRL Bank Limited 为已接受,而 Bank Unite 和 Bank of Salem 为已跳过

    Bank Citoyen 标记为重复,这表示在此请求中它已被接受作为重复节点。

    操作 允许您接受、拒绝或跳过匹配候选者。请参阅“检查重复数据删除结果并应用更改”。 每个匹配候选者都显示有“接受”、“拒绝”和“跳过”按钮。

重复数据删除详细信息


“匹配详细信息”屏幕,下面进行了介绍

“重复数据删除详细信息”部分以并排布局显示匹配的(源)节点和匹配候选(目标)节点的属性,以便您可以进行比较。

使用下拉菜单可选择源节点的视点(对于层次视点,还可以选择父代)。

  • 源节点部分显示匹配的节点实例的属性和值,包括父代和关系属性。
  • 目标节点部分显示视点中匹配候选者的属性和值。

源节点与目标节点之间属性值的差异用不等号 () 指示。

您可以通过在“源节点”或“目标节点”列中选择单选按钮,选择为存活节点保留源或目标属性值。保留列指示属性的值来自源节点还是目标节点(请参阅“选择要在合并期间保留的属性”)。显示的属性和默认保留设置基于为节点类型和数据源设置的生存规则。请参阅“创建、编辑和删除生存规则”。