Foire aux questions relative à la mise en correspondance et à la fusion

Comment les scores de correspondance sont-ils calculés et comment les utiliser ?
Dois-je utiliser un code ou un nom de source de données dans un fichier de chargement ?
Lors de la création de règles de correspondance, vaut-il mieux ajouter plusieurs critères à une règle ou créer des règles distinctes ?
J'ai accepté par inadvertance une correspondance. Puis-je vérifier mes correspondances précédemment acceptées et les annuler ?
Quand les liens sont-ils établis entre les noeuds ?

Comment les scores de correspondance sont-ils calculés et comment les utiliser ?

Le mécanisme exact de calcul d'un score de correspondance dépend de plusieurs facteurs, tels que le type de données (Chaîne, Entier, Date, etc.), le type de correspondance (Contient, Semblable à, Entre), et si les opérations de correspondance sont combinées ou non. En général, un score de correspondance élevé indique qu'un grand nombre de critères de correspondance ont été remplis pour un candidat.

Etudions quelques exemples pour mieux comprendre la façon dont un score de correspondance est calculé.

Exemple 1

Dans cet exemple, la règle de correspondance effectue la mise en correspondance selon la propriété Name, qui est une chaîne :

Le nom cible avec lequel nous effectuons la mise en correspondance est "Atkins Pearson International" et le nom source que nous essayons de mettre en correspondance est "Baker H. International".

Dans cet exemple, le nom cible comporte 28 caractères et le nom source correspond à 17 d'entre eux ("a", "k", deux espaces et la totalité de "International"). Par conséquent, environ 61 % (17 sur 28) des caractères correspondent, ce qui donne un score de correspondance de 61.

Exemple 2

Dans le second exemple, nous effectuons la mise en correspondance selon deux propriétés de type Chaîne, à savoir Name et Industry :

Le nom cible avec lequel nous effectuons la mise en correspondance est "Andrews Corporation" et le secteur cible est "Diagnostics & Research". Le nom source est "Andrews" et le secteur source est "Diagnostics & Research".

Dans ce cas, le nom source correspond à 37 % (7 sur 19) des caractères du nom cible et le secteur source correspond à 100 % du secteur cible. Puisqu'il s'agit d'une correspondance combinée, la moyenne est obtenue par le calcul (37+100)/2, ce qui donne un score de 68.

D'autres types de données et opérateurs de correspondance effectuent des calculs similaires pour déterminer le score de correspondance.

Note:

Si des mots ignorés ont été configurés pour des propriétés du type de noeud servant à la mise en correspondance, ils sont exclus lors du calcul des scores de correspondance. Reportez-vous à la section Configuration de mots ignorés lors d'une mise en correspondance.

Dois-je utiliser un code ou un nom de source de données dans un fichier de chargement ?

Lorsqu'un fichier de demande contenant des informations de source de données est traité, la source de données de chaque noeud est identifiée de deux manières :

Si un code est configuré pour la source de données, il est utilisé. Reportez-vous à la section Création, modification et suppression de sources de données.
Si aucun code n'est configuré pour la source de données, le nom de la source de données est utilisé.

Comme les noms de source de données peuvent changer au fil du temps, il est conseillé de toujours configurer un code pour vos sources de données et de l'utiliser dans vos fichiers de demande à la place du nom de source de données.

Lors de la création de règles de correspondance, vaut-il mieux ajouter plusieurs critères à une règle ou créer des règles distinctes ?

La décision d'utiliser des règles de correspondance distinctes pour des propriétés d'identification spécifiques ou comme critères multiples au sein d'une règle unique doit être prise sur la base d'expérimentations menées par l'organisation qui effectue l'implémentation. Lors de l'ajustement des règles dans un environnement de test, les responsables peuvent évaluer quelle règle est la plus efficace pour réduire le nombre de faux positifs.

En principe, la combinaison de propriétés d'identification dans une règle de correspondance unique constitue une opération "AND", alors que l'utilisation de règles distinctes pour une propriété d'identification spécifique permet d'évaluer sa valeur en tant que déterminant de correspondance sur une base individuelle, ce qui constitue une opération "OR" potentielle entre plusieurs règles lorsqu'elles sont évaluées pour une combinaison unique de type de noeud et de source de données.

Il peut être intéressant de créer plusieurs règles de correspondance distinctes au lieu d'ajouter plusieurs critères à une règle unique combinée lorsque vous acceptez automatiquement les règles de correspondance au-dessus d'un certain seuil de score de correspondance et que vous vous attendez à ce que certains critères atteignent ce seuil et que d'autres ne l'atteignent pas.

Prenons l'exemple d'un scénario dans lequel vous acceptez automatiquement les correspondances supérieures à 90 % et pour lequel vous disposez de deux critères de correspondance, l'un à 100 % et l'autre à 50 % :

Si vous disposez de deux règles de correspondance distinctes, la règle avec une correspondance de 100 % sera automatiquement acceptée.
Si vous disposez d'une seule règle de correspondance qui contient les deux critères, le score de correspondance moyen est de 75 %, ce qui est inférieur à votre seuil de 90 % pour l'acceptation automatique de la correspondance. La correspondance ne sera pas automatiquement acceptée.

Ainsi, dans cet exemple, la décision de combiner les critères ou de créer des règles de correspondance distinctes dépend de votre volonté ou non d'accepter automatiquement certaines correspondances au-dessus d'un certain seuil.

J'ai accepté par inadvertance une correspondance. Puis-je vérifier mes correspondances précédemment acceptées et les annuler ?

Une fois qu'une demande avec un élément mis en correspondance et fusionné est terminée et fermée, vous ne pouvez plus annuler l'opération de mise en correspondance et de fusion avec le noeud existant. Avant que la demande ne soit terminée et fermée, vous pouvez annuler la correspondance avec un noeud existant des manières suivantes :

Avant d'appliquer les modifications (en cliquant sur Rejeter ou Ignorer dans le workbench de mise en correspondance)
Après l'application des modifications mais avant que la demande ne soit terminée (en supprimant l'élément de demande et en le recréant séparément)

Cependant, une fois que la demande est terminée et fermée, vous ne pouvez plus annuler cette correspondance. Vous devez supprimer et ajouter une nouvelle fois le noeud cible existant pour supprimer les informations de correspondance stockées.

Quand les liens sont-ils établis entre les noeuds ?

Les liens de noeud sont établis entre un noeud source et un noeud cible lorsqu'un noeud cible existant est mis à jour par un noeud source entrant disposant d'une source de données définie. Pour plus de détails, reportez-vous à la section Présentation des liens de noeud et des sources de données.