Exécution d'une opération de suppression de doublons pour un point de vue

La suppression des doublons de noeud vous permet de mettre en correspondance des noeuds similaires existants d'un point de vue et de les combiner en un noeud unique.

Remarques

  • Vous devez au moins disposer de l'autorisation Gestionnaire de données sur le point de vue afin de supprimer les doublons de ce point de vue.

  • Vous ne pouvez pas supprimer les doublons de point de vue archivé ou avec libellé de temps.
  • Vous pouvez supprimer les doublons d'un point de vue dans une demande active à la fois. Si le processus de suppression de doublons d'un point de vue est déjà en cours dans une autre demande active, vous ne pouvez pas sélectionner ce point de vue dans une nouvelle opération de suppression de doublons.
  • Chaque demande prend en charge un mode de suppression de doublons uniquement. Vous ne pouvez pas exécuter une suppression de doublons basée sur une clé de cluster et une suppression de doublons basée sur le temps dans une même demande.
  • Lorsque la suppression de doublons dans un point de vue est exécutée :
    • Les noeuds dans le point de vue sont mis en correspondance avec tous les noeuds du type de noeud, même si certains de ces noeuds ne se trouvent pas dans le point de vue existant.
    • Si un point de vue contient des noeuds partagés, les règles de correspondance sont exécutées uniquement pour une instance du noeud.
    • Au maximum, 20 résultats de correspondance sont affichés pour chaque noeud mis en correspondance.
  • Les demandes contiennent au maximum 10 000 éléments de demande. Comme chaque opération de fusion génère deux éléments de demande (une suppression du noeud source et une mise à jour de propriété du noeud cible), lorsque le nombre de noeuds mis en correspondance atteint 5 000, le processus de suppression de doublons pour cette demande est arrêté et vous êtes invité à créer une autre demande pour continuer à supprimer les doublons de noeud. La limite maximale peut être atteinte plus tôt si votre demande contient déjà d'autres éléments de demande.
  • Comme vous supprimez les doublons d'un ensemble de noeuds d'un point de vue, au lieu des éléments de demande entrants, deux noeuds différents peuvent souvent être des candidats de correspondance l'un pour l'autre. Par exemple, lorsque vous supprimez les doublons d'un point de vue qui contient les noeuds "Oracle" et "Oracle Inc", chaque noeud peut être un candidat de correspondance pour l'autre. Le noeud que vous acceptez en tant que doublon déterminera celui qui sera supprimé et celui qui sera conservé. Pour rappel, les noeuds mis en correspondance sont ceux qui seront supprimés, et les noeuds candidats de correspondance seront le noeud conservé. Reportez-vous à la section Présentation des noeuds mis en correspondance et des candidats de correspondance dans la suppression de doublons.

    Tip:

    Lorsque vous acceptez une correspondance en tant que doublon, ce noeud en double est identifié comme Doublon sur l'écran Résultats de suppression de doublons (reportez-vous à la section Présentation des résultats de la suppression de doublons). Le noeud identifié est celui qui sera supprimé.
  • Si au moins trois noeuds sont mis en correspondance pendant la suppression de doublons, vous ne pouvez pas fusionner le premier dans le deuxième, puis fusionner le deuxième dans le troisième. Toutefois, vous pouvez fusionner le premier et le deuxième dans le troisième.

    Par exemple, supposons que vous disposez des noeuds "Oracle", "Oracle Inc" et "Oracle Incorporated", et que vous voulez conserver "Oracle Incorporated" et fusionner les informations des deux autres noeuds dans ce noeud. Vous ne pouvez pas fusionner "Oracle" dans "Oracle Inc", puis "Oracle Inc" dans "Oracle Incorporated". Par contre, vous pouvez rechercher le noeud mis en correspondance "Oracle" et l'identifier comme un doublon de "Oracle Incorporated", puis faire la même chose pour "Oracle Inc".

Pour supprimer les doublons d'un point de vue, procédez comme suit :

  1. Créez une demande pour le point de vue dont vous voulez supprimer les doublons.
  2. Cliquez sur l'onglet Mettre en correspondance et supprimer les doublons icône de mise en correspondance sur la gauche de la fenêtre du point de vue.
  3. Dans le volet Correspondance, cliquez sur Nouveau Icône de création de correspondance, puis sélectionnez Supprimer les doublons du point de vue.
  4. Effectuez les actions suivantes dans la boîte de dialogue Supprimer les doublons du point de vue :
    1. Sélectionnez le point de vue dont vous voulez supprimer les doublons.
    2. Sélectionnez un type de noeud dans ce point de vue. Le type de noeud doit être configuré pour la suppression de doublons (reportez-vous à la section Présentation de la suppression de doublons).
    3. Sélectionnez le mode de suppression de doublons :
      • Clé de cluster : permet de supprimer les doublons du point de vue à l'aide d'une propriété de mise en cluster. Sélectionnez la valeur de propriété de mise en cluster dans le menu déroulant. Les valeurs de propriété de mise en cluster dans le menu déroulant reposent sur les valeurs autorisées pour la propriété que vous avez définie en tant que clé de cluster. Reportez-vous à la section Suppression de doublons à l'aide d'une clé de cluster.

        Note:

        Si une opération de suppression de doublons a déjà été exécutée pour la propriété de mise en cluster, la date de création du dernier noeud traité est affichée.
      • Basé sur le temps : permet de supprimer les doublons du point de vue en fonction de la date de création des noeuds. Saisissez la date de création du noeud. Reportez-vous à la section Suppression de doublons basée sur le temps.
  5. Facultatif : entrez une taille de lot pour indiquer le nombre de noeuds pour lesquels rechercher les doublons.

    Tip:

    Cela peut s'avérer utile, par exemple, si vous avez apporté des modifications à une règle de correspondance que vous voulez tester. Vous pouvez exécuter un plus petit lot et évaluer les résultats avant de supprimer les doublons de l'intégralité du point de vue.
  6. Cliquez sur Exécuter la suppression de doublons.

La suppression de doublons est exécutée sur le point de vue à l'aide des règles de correspondance définies pour le type de noeud et de la source de données enregistrée pour le point de vue.

Opérations de suppression de doublons

Les points de vue peuvent contenir des milliers de noeuds, vous devez donc généralement supprimer leurs doublons par lots. Les lots peuvent être définis comme suit :

Les lots peuvent également être définis par une combinaison de certains des éléments ci-dessus, par exemple une clé de cluster et une taille de lot spécifiée.

Vous disposez de plusieurs options pour traiter les noeuds dans ces lots. Les termes suivants peuvent vous aider à comprendre ces options :

Table 11-1 Options de traitement par lots

Option Définition Action
Exécuter Permet d'effectuer une suppression initiale de doublons dans le premier lot de noeuds pour une date de début de création de noeud ou un cluster spécifié. Cliquez sur Exécuter la suppression de doublons dans la boîte de dialogue Supprimer les doublons du point de vue.
Continuer Permet d'effectuer une autre suppression de doublons dans le lot de noeuds suivant pour une date de début de création de noeud ou un cluster spécifié. Le système suit les noeuds qui ont déjà été traités, vous pouvez donc reprendre là où vous vous étiez arrêté. Cliquez sur Exécuter la suppression de doublons dans la boîte de dialogue Supprimer les doublons du point de vue après avoir effectué une opération Exécuter initiale.
Réexécuter Permet de traiter de nouveau un ensemble de résultats existant dans une demande. Cela peut inclure un ou plusieurs lots.

Remarque : l'option Réexécuter traite de nouveau les résultats de correspondance non acceptés uniquement.

Dans le panneau de l'ensemble de résultats de suppression de doublons, cliquez sur Actions icône d'action en regard de l'ensemble de résultats à réexécuter, puis sélectionnez Réexécuter.
Redémarrer Permet de traiter de nouveau un cluster qui a déjà été traité en commençant par le début.

Remarque : l'option Redémarrer est disponible pour la suppression de doublons de type Clé de cluster uniquement.

Conseil : la différence entre les options Réexécuter et Redémarrer réside dans le fait que Réexécuter traite de nouveau un ou plusieurs lots, tandis que Redémarrer traite de nouveau un cluster.

Cliquez sur Redémarrer icône de redémarrage en regard de la clé de cluster dans la boîte de dialogue Supprimer les doublons du point de vue.
Annuler Permet de supprimer un ensemble de résultats existant pour une demande donnée. Le dernier noeud traité est conservé afin que vous puissiez continuer la prochaine fois que vous exécutez une suppression de doublons.

Remarque : la suppression de la demande entraîne également l'annulation de l'ensemble de résultats.

Dans le panneau de l'ensemble de résultats de suppression de doublons, cliquez sur Actions icône d'action en regard de l'ensemble de résultats à réexécuter, puis sélectionnez Annuler.
Annuler et réexécuter Permet de supprimer un ensemble de résultats existant pour une demande donnée et de traiter de nouveau les mêmes noeuds de l'ensemble de résultats. Cela peut inclure un ou plusieurs lots. Dans le panneau de l'ensemble de résultats de suppression de doublons, cliquez sur Actions icône d'action en regard de l'ensemble de résultats à réexécuter, puis sélectionnez Annuler et réexécuter.