Knoten in einem Ansichtspunkt deduplizieren

Mit der Deduplizierung von Knoten können Sie ähnliche Knoten in einem Ansichtspunkt auswerten und diese dann zu einem einzelnen Knoten zusammenführen, wenn sie Duplikate voneinander sind.

Überblick über den Deduplizierungsprozess

Deduplizierungsvorgänge für einen Ansichtspunkt laufen im Allgemeinen wie folgt ab:

  1. Ein Datenmanager erstellt eine Anforderung für eine Ansicht, die den zu deduplizierenden Ansichtspunkt enthält.

    Tip:

    Die Anforderung ist zum Deduplizieren eines Ansichtspunkts erforderlich, da das Ergebnis des Deduplizierungsprozesses zu Verarbeitungsänderungen an Knoten in einem Ansichtspunkt führt.
  2. Der Datenmanager erstellt einen Abgleich für einem bestimmten Knotentyp in einem bestimmten Ansichtspunkt, und führt diesen aus, um diesen Ansichtspunkt zu deduplizieren. Informationen hierzu finden Sie unter Deduplizierungsvorgang für einen Ansichtspunkt ausführen.
  3. Die Abgleichs-Workbench zeigt die potenziellen Übereinstimmungen an. Die Übereinstimmungen werden anhand der Abgleichsregeln ermittelt, die für jede Datenquelle konfiguriert wurden. Informationen hierzu finden Sie unter Erläuterungen zu Deduplizierungsergebnissen und Abgleichsregeln erstellen, bearbeiten und löschen.

    Note:

    Nur die Abgleichsergebnisse, deren Abgleichsscores den Schwellenwert für automatisches Ausschließen für die Abgleichsregeln überschreiten, werden angezeigt.
  4. Der Datenmanager prüft jede einzelne Deduplizierungsübereinstimmung und akzeptiert sie oder lehnt sie ab. Anschließend wendet er die Änderungen an. Informationen hierzu finden Sie unter Deduplizierungsergebnisse prüfen und Änderungen anwenden.
  5. Die akzeptierten Übereinstimmungen werden wie folgt angewendet:
    • Der abgeglichene (Quell-)Knoten wird aus dem Ansichtspunkt gelöscht (da er ein Duplikat ist).
    • Die Eigenschaften und Beziehungen aus dem doppelten Knoten werden mit dem Übereinstimmungskandidaten (Zielknoten) zusammengeführt. Dieser bleibt gemäß den Survivorship-Regeln erhalten. Informationen hierzu finden Sie unter Survivorship-Regeln erstellen, bearbeiten und löschen.
  6. Das System erstellt anhand der angewendeten Änderungen Anforderungselemente in der Anforderung. Löschaktionen werden für doppelte Knoten hinzugefügt, und Aktionen zum Einfügen, Aktualisieren und Verschieben von Eigenschaften werden basierend auf den Survivorship-Regeln hinzugefügt.

Erläuterungen zu abgeglichenen Knoten und Übereinstimmungskandidaten bei der Deduplizierung

Da die deduplizierten Ansichtspunkte sowohl die abgeglichenen Knoten als auch die Übereinstimmungskandidaten enthalten, müssen Sie sich unbedingt mit den Unterschieden zwischen ihnen vertraut machen:

  • Abgeglichene Knoten sind die Knoten aus der Datenquelle, die Sie beim Abgleichsprozess auswerten. Beim Zusammenführen der Knoten werden sie zu den Quellknoten, die nach der Zusammenführung gelöscht werden.
  • Übereinstimmungskandidaten sind die Knoten, die Sie für den Abgleichsprozess heranziehen. Beim Zusammenführen der Knoten werden sie zu den Zielknoten, die nach der Zusammenführung erhalten bleiben. Die Eigenschaften und Beziehungswerte aus den Quellknoten werden dabei entsprechend den Survivorship-Regeln mit ihnen zusammengeführt.

Note:

Wenn Sie die Deduplizierung mit einem Clusterschlüssel ausführen, wird der Clusterschlüssel nur auf die abgeglichenen Knoten angewendet. Er wird nicht dazu verwendet, die Zielknoten für den Abgleich zu begrenzen.

Beispiel: Wenn Sie einen Kundenansichtspunkt mit einem Clusterschlüssel für den Bundesstaat und der Clustering-Eigenschaft "Texas" deduplizieren, werden nur Kunden in Texas (abgeglichener Knoten) ausgewertet. Sie können aber mit einem gleichnamigen Kunden in Kalifornien (Übereinstimmungskandidat) abgeglichen werden. Beim Zusammenführen der Datensätze wird der Knoten aus Texas gelöscht, und seine Informationen werden mit dem Knoten aus Kalifornien zusammengeführt.