Comment les scores de correspondance sont-ils calculés et comment les utiliser ?
Le mécanisme exact de calcul d'un score de correspondance dépend de plusieurs facteurs, tels que le type de données (Chaîne, Entier, Date, etc.), le type de correspondance (Contient, Semblable à, Entre), et si les opérations de correspondance sont combinées ou non. En général, un score de correspondance élevé indique qu'un grand nombre de critères de correspondance ont été remplis pour un candidat.
Etudions quelques exemples pour mieux comprendre la façon dont un score de correspondance est calculé.
Exemple 1
Dans cet exemple, la règle de correspondance effectue la mise en correspondance selon la propriété Name, qui est une chaîne :
Le nom cible avec lequel nous effectuons la mise en correspondance est "Atkins Pearson International" et le nom source que nous essayons de mettre en correspondance est "Baker H. International".
Dans cet exemple, le nom cible comporte 28 caractères et le nom source correspond à 17 d'entre eux ("a", "k", deux espaces et la totalité de "International"). Par conséquent, environ 61 % (17 sur 28) des caractères correspondent, ce qui donne un score de correspondance de 61.
Exemple 2
Dans le second exemple, nous effectuons la mise en correspondance selon deux propriétés de type Chaîne, à savoir Name et Industry :
Le nom cible avec lequel nous effectuons la mise en correspondance est "Andrews Corporation" et le secteur cible est "Diagnostics & Research". Le nom source est "Andrews" et le secteur source est "Diagnostics & Research".
Dans ce cas, le nom source correspond à 37 % (7 sur 19) des caractères du nom cible et le secteur source correspond à 100 % du secteur cible. Puisqu'il s'agit d'une correspondance combinée, la moyenne est obtenue par le calcul (37+100)/2, ce qui donne un score de 68.
D'autres types de données et opérateurs de correspondance effectuent des calculs similaires pour déterminer le score de correspondance.
Dois-je utiliser un code ou un nom de source de données dans un fichier de chargement ?
Lorsqu'un fichier de demande contenant des informations de source de données est traité, la source de données de chaque noeud est identifiée de deux manières :
Comme les noms de source de données peuvent changer au fil du temps, il est conseillé de toujours configurer un code pour vos sources de données et de l'utiliser dans vos fichiers de demande à la place du nom de source de données.
Puis-je créer une règle de conservation pour une source de données enregistrée ?
Les règles de conservation déterminent les propriétés et les relations d'une source de données non enregistrée qui sont fusionnées d'un candidat de correspondance accepté vers un noeud correspondant d'un type de noeud. Pour les sources de données enregistrées, vous utilisez un convertisseur de type de noeud afin de déterminer la façon dont les propriétés et les relations d'un candidat de correspondance sont fusionnées dans un noeud cible correspondant. Reportez-vous à la section Utilisation de convertisseurs de type de noeud. Vous n'avez pas besoin de créer de règles de conservation pour les sources de données enregistrées.
Tip:
Bien que les convertisseurs de type de noeud pour les sources de données enregistrées déterminent quelles propriétés peuvent être fusionnées d'un candidat de correspondance accepté vers un noeud correspondant dans un type de noeud, vous pouvez toujours décider laquelle de ces propriétés sera fusionnée. Utilisez les boutons radio Noeud source et Noeud cible du panneau Résultats de correspondance pour déterminer les valeurs à conserver. Reportez-vous à la section Sélection des propriétés à conserver pendant une fusion.Lors de la création de règles de correspondance, vaut-il mieux ajouter plusieurs critères à une règle ou créer des règles distinctes ?
La décision d'utiliser des règles de correspondance distinctes pour des propriétés d'identification spécifiques ou comme critères multiples au sein d'une règle unique doit être prise sur la base d'expérimentations menées par l'organisation qui effectue l'implémentation. Lors de l'ajustement des règles dans un environnement de test, les responsables peuvent évaluer quelle règle est la plus efficace pour réduire le nombre de faux positifs.
En principe, la combinaison de propriétés d'identification dans une règle de correspondance unique constitue une opération "AND", alors que l'utilisation de règles distinctes pour une propriété d'identification spécifique permet d'évaluer sa valeur en tant que déterminant de correspondance sur une base individuelle, ce qui constitue une opération "OR" potentielle entre plusieurs règles lorsqu'elles sont évaluées pour une combinaison unique de type de noeud et de source de données.
Il peut être intéressant de créer plusieurs règles de correspondance distinctes au lieu d'ajouter plusieurs critères à une règle unique combinée lorsque vous acceptez automatiquement les règles de correspondance au-dessus d'un certain seuil de score de correspondance et que vous vous attendez à ce que certains critères atteignent ce seuil et que d'autres ne l'atteignent pas.
Prenons l'exemple d'un scénario dans lequel vous acceptez automatiquement les correspondances supérieures à 90 % et pour lequel vous disposez de deux critères de correspondance, l'un à 100 % et l'autre à 50 % :
Ainsi, dans cet exemple, la décision de combiner les critères ou de créer des règles de correspondance distinctes dépend de votre volonté ou non d'accepter automatiquement certaines correspondances au-dessus d'un certain seuil.
J'ai accepté par inadvertance une correspondance. Puis-je vérifier mes correspondances précédemment acceptées et les annuler ?
Une fois qu'une demande avec un élément mis en correspondance et fusionné est terminée et fermée, vous ne pouvez plus annuler l'opération de mise en correspondance et de fusion avec le noeud existant. Avant que la demande ne soit terminée et fermée, vous pouvez annuler la correspondance avec un noeud existant des manières suivantes :
Cependant, une fois que la demande est terminée et fermée, vous ne pouvez plus annuler cette correspondance. Vous devez supprimer et ajouter une nouvelle fois le noeud cible existant pour supprimer les informations de correspondance stockées.
Quand les liens sont-ils établis entre les noeuds ?
Les liens de noeud sont établis entre un noeud source et un noeud cible lorsqu'un noeud cible existant est mis à jour par un noeud source entrant disposant d'une source de données définie. Pour obtenir des détails, reportez-vous à la section Présentation des liens de noeud et des sources de données.