Deduplizierungsvorgang für einen Ansichtspunkt ausführen

Mit der Deduplizierung von Knoten können Sie ähnliche vorhandene Knoten in einem Ansichtspunkt abgleichen und zu einem einzelnen Knoten kombinieren.

Wichtige Aspekte

  • Sie benötigen mindestens die Berechtigung Datenmanager für den Ansichtspunkt, ihn zu deduplizieren.

  • Ansichtspunkte mit Zeitlabels oder archivierte Ansichtspunkte können nicht dedupliziert werden.
  • Sie können jeweils eine aktive Anforderung zum Deduplizieren eines Ansichtspunkts ausführen. Wenn ein Ansichtspunkt gerade in einer anderen aktiven Anforderung dedupliziert wird, können Sie diesen Ansichtspunkt nicht in einem neuen Deduplizierungsvorgang auswählen.
  • Jede Anforderung unterstützt nur einen Deduplizierungsmodus. Sie können eine Deduplizierung mit Clusterschlüssel und eine zeitbasierte Deduplizierung nicht in derselben Anforderung ausführen.
  • Bei der Deduplizierung eines Ansichtspunkts gilt Folgendes:
    • Knoten im Ansichtspunkt werden anhand aller Knoten im Knotentyp abgeglichen, selbst wenn einige dieser Knoten nicht im vorhandenen Ansichtspunkt enthalten sind.
    • Wenn ein Ansichtspunkt gemeinsame Knoten enthält, werden Abgleichsregeln nur für eine Knoteninstanz ausgeführt.
    • Für jeden abgeglichenen Knoten werden maximal 20 Abgleichsergebnisse angezeigt.
  • Anforderungen können höchstens 10.000 Anforderungselemente enthalten. Da jeder Zusammenführungsvorgang zwei Anforderungselemente ergibt (einen Löschvorgang des Quellknotens und eine Eigenschaftsaktualisierung des Zielknotens), wird der Deduplizierungsprozess für eine Anforderung gestoppt, wenn 5000 abgeglichene Knoten erreicht werden. Dann werden Sie aufgefordert, eine neue Anforderung zu erstellen, um weiter Knoten zu deduplizieren. Wenn Ihre Anforderung bereits andere Anforderungselemente enthält, kann der Höchstwert früher erreicht werden.
  • Da Sie ein Set von Knoten in einem Ansichtspunkt und nicht eingehende Anforderungselemente deduplizieren, können zwei unterschiedliche Knoten oft Übereinstimmungskandidaten füreinander sein. Beispiel: Bei der Deduplizierung eines Ansichtspunkts mit den Knoten "Oracle" und "Oracle Inc" kann jeder Knoten ein Übereinstimmungskandidat für den jeweils anderen sein. Der Knoten, den Sie als Duplikat akzeptieren, steuert, welcher Knoten gelöscht und welcher beibehalten wird. Denken Sie daran, dass die abgeglichenen Knoten gelöscht und die Übereinstimmungskandidatenknoten beibehalten werden. Informationen hierzu finden Sie unter Erläuterungen zu abgeglichenen Knoten und Übereinstimmungskandidaten bei der Deduplizierung.

    Tip:

    Wenn Sie eine Übereinstimmung als Duplikat akzeptieren, wird dieser Duplikatknoten im Fenster "Deduplizierungsergebnisse" als Duplikat markiert (siehe Erläuterungen zu Deduplizierungsergebnissen). Der markierte Knoten ist derjenige, der gelöscht wird.
  • Wenn drei oder mehr Knoten bei der Deduplizierung abgeglichen werden, können Sie nicht den ersten Knoten erst mit dem zweiten und dann den zweiten mit dem dritten Knoten zusammenführen. Sie können jedoch sowohl den ersten als auch den zweiten Knoten mit dem dritten zusammenführen.

    Beispiel: Sie verfügen über die Knoten "Oracle", "Oracle Inc" und "Oracle Incorporated" und möchten "Oracle Incorporated" beibehalten und Informationen aus den anderen beiden Knoten dort zusammenführen. In diesem Fall können Sie nicht erst "Oracle" mit "Oracle Inc" und anschließend "Oracle Inc" mit "Oracle Incorporated" zusammenführen. Suchen Sie stattdessen den abgeglichenen Knoten "Oracle", und markieren Sie ihn als Duplikat von "Oracle Incorporated". Markieren Sie anschließend "Oracle Inc" als Duplikat von "Oracle Incorporated".

So deduplizieren Sie einen Ansichtspunkt:

  1. Erstellen Sie eine Anforderung für den zu deduplizierenden Ansichtspunkt.
  2. Klicken Sie auf der linken Seite des Ansichtspunktfensters auf die Registerkarte Abgleichen und deduplizieren Abgleichssymbol.
  3. Klicken Sie im Abgleichsfenster auf Neu Symbol 'Abgleich erstellen', und wählen Sie Ansichtspunkt deduplizieren aus.
  4. Führen Sie im Dialogfeld "Ansichtspunkt deduplizieren" die folgenden Aktionen aus:
    1. Wählen Sie den zu deduplizierenden Ansichtspunkt aus.
    2. Wählen Sie einen Knotentyp in diesem Ansichtspunkt aus. Der Knotentyp muss für die Deduplizierung konfiguriert sein (siehe Erläuterungen zur Deduplizierung).
    3. Wählen Sie den Modus für die Deduplizierung aus:
      • Clusterschlüssel: Deduplizieren Sie den Ansichtspunkt mit einer Clustering-Eigenschaft. Wählen Sie den Wert der Clustering-Eigenschaft im Dropdown-Menü aus. Die Clustering-Eigenschaftswerte im Dropdown-Menü basieren auf den zulässigen Werten für die Eigenschaft, die Sie als Clusterschlüssel definiert haben. Informationen hierzu finden Sie unter Deduplizierung anhand eines Clusterschlüssels ausführen.

        Note:

        Wenn bereits ein Deduplizierungsvorgang für die Clustering-Eigenschaft ausgeführt wurde, wird das Datum der Knotenerstellung für den zuletzt verarbeiteten Knoten angezeigt.
      • Zeitbasiert: Deduplizieren Sie den Ansichtspunkt basierend auf dem Datum der Knotenerstellung. Geben Sie das Knotenerstellungsdatum ein. Informationen hierzu finden Sie unter Zeitbasierte Deduplizierung.
  5. Optional: Geben Sie eine Batchgröße ein, um anzugeben, in wie vielen Knoten nach Duplikaten gesucht werden soll.

    Tip:

    Das kann beispielsweise nützlich sein, wenn Sie Änderungen an einer Abgleichsregel testen möchten. Dann könnten Sie einen kleineren Batch ausführen und die Ergebnisse auswerten, bevor Sie den gesamten Ansichtspunkt deduplizieren.
  6. Klicken Sie auf Deduplizieren ausführen.

Die Deduplizierung wird mit den definierten Abgleichsregeln für den Knotentyp und der registrierten Datenquelle für den Ansichtspunkt auf dem Ansichtspunkt ausgeführt.

Deduplizierungsvorgänge

Da Ansichtspunkte Tausende Knoten enthalten können, deduplizieren Sie sie im Allgemeinen in Batches. Die Batches können auf folgende Arten definiert werden:

Batches können auch über eine Kombination aus einigen der oben genannten Faktoren definiert werden, wie z.B. einen Clusterschlüssel und eine angegebene Batchgröße.

Sie können die Knoten in diesen Batches auf mehrere Arten verarbeiten. Die folgenden Begriffe können Ihnen helfen, diese Optionen besser zu verstehen:

Table 11-1 Batchverarbeitungsoptionen

Option Definition Anleitung
Ausführen Führen Sie die anfängliche Deduplizierung des ersten Knotenbatches für ein angegebenes Cluster oder Startdatum der Knotenerstellung aus. Klicken Sie im Dialogfeld "Ansichtspunkt deduplizieren" auf Deduplizieren ausführen.
Fortfahren Führen Sie eine nachfolgende Deduplizierung des nächsten Knotenbatches für ein angegebenes Cluster oder Startdatum der Knotenerstellung aus. Das System verfolgt, welche Knoten bereits verarbeitet wurden, damit Sie dort weitermachen können, wo Sie aufgehört haben. Klicken Sie im Dialogfeld "Ansichtspunkt deduplizieren" auf Deduplizieren ausführen, nachdem Sie bereits den Vorgang "Ausführen" ausgeführt haben.
Erneut ausführen Verarbeiten Sie ein vorhandenes Ergebnisset in einer Anforderung erneut. Das kann einen oder mehrere Batches umfassen.

Hinweis: Bei der erneuten Ausführung werden nur nicht akzeptierte Abgleichsergebnisse erneut verarbeitet.

Klicken Sie im Bereich mit Ergebnissets der Deduplizierung neben dem gewünschten Ergebnisset auf Aktionen Symbol "Aktion", und wählen Sie Erneut ausführen aus.
Neu starten Verarbeiten Sie ein Cluster, das bereits verarbeitet wurde, von Anfang an erneut.

Hinweis: "Neu starten" ist nur für die Deduplizierung mit Clusterschlüsseln verfügbar.

Tipp: Der Unterschied zwischen Erneut ausführen und Neu starten besteht darin, dass bei "Erneut ausführen" Batches erneut verarbeitet werden und bei "Neu starten" ein Cluster erneut verarbeitet wird.

Klicken Sie im Dialogfeld "Ansichtspunkt deduplizieren" neben dem Clusterschlüssel auf Neu starten.Symbol "Neu starten"
Verwerfen Löschen Sie ein vorhandenes Ergebnisset für eine angegebene Anforderung. Der zuletzt verarbeitete Knoten wird beibehalten, damit Sie bei der nächsten Deduplizierung die Option "Fortfahren" auswählen können.

Hinweis: Beim Löschen der Anforderung wird auch das Ergebnisset verworfen.

Klicken Sie im Bereich mit Ergebnissets der Deduplizierung neben dem gewünschten Ergebnisset auf Aktionen Symbol "Aktion", und wählen Sie Verwerfen aus.
Verwerfen und erneut ausführen Löschen Sie ein vorhandenes Ergebnisset für eine angegebene Anforderung, und verarbeiten Sie dieselben Knoten im Ergebnisset erneut. Das kann einen oder mehrere Batches umfassen. Klicken Sie im Bereich mit Ergebnissets der Deduplizierung neben dem gewünschten Ergebnisset auf Aktionen Symbol "Aktion", und wählen Sie Verwerfen und erneut ausführen aus.