Suppression des doublons de noeuds dans un point de vue

La suppression des doublons de noeuds vous permet d'évaluer les noeuds similaires dans un point de vue, puis de les fusionner en un noeud unique s'ils sont des doublons les uns des autres.

Présentation du processus de suppression de doublons

Les opérations de suppression de doublons sur un point de vue suivent le processus général ci-dessous :

  1. Un gestionnaire de données crée une demande pour une vue qui contient le point de vue dont les doublons doivent être supprimés.

    Tip:

    Une demande est nécessaire pour la suppression des doublons d'un point de vue car ce processus entraîne le traitement des modifications apportées à des noeuds dans un point de vue.
  2. Le gestionnaire de données crée et exécute une correspondance pour un type de noeud spécifique dans un point de vue afin de supprimer les doublons de celui-ci. Reportez-vous à la section Exécution d'une opération de suppression de doublons pour un point de vue.
  3. Le workbench de mise en correspondance affiche les correspondances potentielles telles que déterminées par les règles de correspondance configurées pour chaque source de données. Reportez-vous aux sections Présentation des résultats de la suppression de doublons et Création, modification et suppression de règles de correspondance.

    Note:

    Seuls les résultats de correspondance dont le score dépasse le seuil d'exclusion automatique sur les règles de correspondance sont affichés.
  4. Le gestionnaire de données examine les correspondances de suppression de doublons, et accepte ou rejette chacune d'elles, puis applique les modifications. Reportez-vous à la section Consultation des résultats de suppression de doublons et application des modifications.
  5. Les correspondances acceptées sont appliquées comme suit :
    • Le noeud mis en correspondance (source) est supprimé du point de vue (car il s'agit d'un doublon).
    • Les propriétés et les relations du noeud en double seront fusionnées dans le noeud candidat correspondant (cible) qui restera tel qu'il est défini par les règles de conservation. Reportez-vous à la section Création, modification et suppression de règles de conservation.
  6. Le système utilise les modifications appliquées pour créer des éléments dans la demande. Des actions de suppression sont ajoutées pour les noeuds en double, et des actions d'insertion, de mise à jour et de déplacement de propriété sont ajoutées d'après les règles de conservation.

Présentation des noeuds mis en correspondance et des candidats de correspondance dans la suppression de doublons

Etant donné que les points de vue dont vous supprimez des doublons contiennent à la fois les noeuds mis en correspondance et les candidats de correspondance, il est important de comprendre la différence entre les deux :

  • Les noeuds mis en correspondance sont les noeuds de la source de données que vous évaluez pendant le processus de correspondance. Lorsque vous fusionnez les noeuds, ils deviennent des noeuds source qui sont supprimés une fois l'opération de fusion terminée.
  • Les candidats de correspondance sont les noeuds par rapport auxquels vous effectuez la mise en correspondance pendant ce processus. Lors de la fusion des noeuds, ils deviennent des noeuds cible qui sont conservés après la fusion. Les valeurs des propriétés et de relation des noeuds source sont fusionnées dans ces noeuds tel que défini par les règles de conservation.

Note:

Lorsque vous exécutez la suppression de doublons à l'aide d'une clé de cluster, celle-ci est appliquée uniquement aux noeuds mis en correspondance. Elle n'est pas utilisée pour limiter les noeuds qui servent à la mise en correspondance.

Par exemple, si vous supprimez les doublons d'un point de vue client à l'aide d'une clé de cluster State et d'une valeur de propriété de mise en cluster Texas, seuls les clients de Texas (noeud mis en correspondance) sont évalués, mais ils peuvent être mis en correspondance avec un client de California (candidat de correspondance) qui porte le même nom. Lorsque vous fusionnez les enregistrements, le noeud de Texas est supprimé et ses informations sont fusionnées dans le noeud de California.