Come vengono calcolati i punteggi di corrispondenza e come posso utilizzarli?
Il meccanismo esatto per calcolare un punteggio di corrispondenza dipende da diversi fattori, come il tipo di dati (stringa, numero intero, data, ecc.), il tipo di corrispondenza (contiene, simile a, tra) e la combinazione o meno delle operazioni di corrispondenza. Tuttavia, in generale un punteggio di corrispondenza più alto indica che sono stati soddisfatti più criteri di corrispondenza per un candidato.
Per una migliore comprensione delle modalità di calcolo del punteggio di corrispondenza, di seguito vengono illustrati alcuni esempi.
Esempio 1
In questo esempio, la regola di corrispondenza si basa sulla proprietà Nome, che è una stringa:
Il nome target con cui stiamo cercando una corrispondenza è "Atkins Pearson International", mentre il nome di origine con cui stiamo cercando di trovare una corrispondenza è "Baker H. International".
In questo esempio, il nome target contiene 28 caratteri, mentre il nome di origine presenta una corrispondenza per 17 di questi ("a", "k", due spazi e tutto "International"). Pertanto, circa il 61% (17 su 28) dei caratteri corrispondono, per un punteggio di corrispondenza pari a 61.
Esempio 2
Nel secondo esempio, si esegue la ricerca della corrispondenza in base a due proprietà di tipo stringa, Nome e Settore:
Il nome target oggetto della ricerca è "Andrews Corporation" e il settore target è "Diagnostics & Research". Il nome di origine è "Andrews" e il settore di origine è "Diagnostics & Research".
In questo caso, il nome di origine corrisponde al 37% (7 su 19) dei caratteri del nome target, mentre il settore di origine corrisponde al 100% del settore target. Poiché si tratta di una corrispondenza combinata, la media viene calcolata (37+100)/2, ottenendo un punteggio di 68.
Altri tipi di dati e operatori di corrispondenza eseguono calcoli simili per determinare il punteggio di corrispondenza.
È necessario usare un codice o un nome di origine dati in un file di caricamento?
Quando viene elaborato un file di richiesta che include informazioni sull'origine dati, l'origine dati per ciascun nodo viene identificata in due modi:
Poiché i nomi delle origini dati possono cambiare nel tempo, è buona norma configurare sempre un codice per le origini dati e utilizzare tale codice nei file di richiesta al posto del nome dell'origine dati.
È possibile creare una regola di conservazione per un'origine dati registrata?
Le regole di conservazione determinano quali proprietà e relazioni di un'origine dati non registrata vengono unite da un candidato accettato in un nodo corrispondente in un tipo di nodo. Per le origini dati registrate, si utilizza un convertitore di tipi di nodo per determinare in che modo le proprietà e le relazioni di un candidato corrispondente vengono unite nei nodi target corrispondenti. Fare riferimento alla sezione Utilizzo dei convertitori di tipi di nodo. Non è necessario creare regole di conservazione per le origini dati registrate.
Tip:
Sebbene i convertitori di tipo di nodo per le origini dati registrate determinino quali proprietà sono disponibili per l'unione da un candidato di corrispondenza accettato in un nodo corrispondente in un tipo di nodo, è comunque possibile decidere quali di queste proprietà unire. Utilizzare i pulsanti di opzione Nodo di origine e Nodo target nel pannello Risultati corrispondenza per determinare quali valori conservare. Fare riferimento alla sezione Selezione delle proprietà da conservare durante un'unione.Quando si creano regole di corrispondenza, è meglio aggiungere più criteri a una regola o creare regole separate?
La decisione se utilizzare regole di corrispondenza separate per specifiche proprietà di identificazione o come più criteri all'interno di un'unica regola è una decisione che l'organizzazione che si occupa dell'implementazione deve determinare tramite sperimentazione. Durante la messa a punto delle regole in un ambiente di test, gli steward possono valutare quale regola sia più efficace rispetto alla generazione di falsi positivi.
In linea di principio, la combinazione di proprietà di identificazione in un'unica regola di corrispondenza esegue un'operazione "AND", mentre l'utilizzo di regole separate per una specifica proprietà di identificazione ne valuterebbe il valore come determinante per la corrispondenza su base singola, fungendo quindi da potenziale operazione "OR" su più regole mentre vengono valutate per una singola combinazione di tipo di nodo e origine dati.
Uno scenario in cui potrebbe essere utile creare più regole di corrispondenza separate anziché aggiungere più criteri a un'unica regola combinata è quello in cui si accettano automaticamente regole di corrispondenza al di sopra di una certa soglia di punteggio e si prevede che alcuni criteri soddisfino tale soglia mentre altri potrebbero non farlo.
Ad esempio, si consideri uno scenario in cui si accetta automaticamente corrispondenze superiori al 90% e in cui sono presenti due criteri di corrispondenza: uno con corrispondenza al 100% e l'altro al 50%:
Pertanto, in questo esempio, la decisione di combinare i criteri o di creare regole di corrispondenza separate dipende dall'intenzione o meno di accettare automaticamente alcune corrispondenze oltre una certa soglia.
Accidentalmente, è stata accettata una corrispondenza non desiderata. È possibile rivedere le corrispondenze accettate in precedenza e annullarle?
Dopo il completamento e la chiusura di una richiesta con un elemento per cui è stato eseguito il processo di ricerca corrispondenza e di unione, non è possibile annullare l'operazione di ricerca corrispondenza e unione con il nodo esistente. Prima che la richiesta venga completata e chiusa, è possibile annullare la ricerca corrispondenza con un nodo esistente nei modi descritti di seguito.
Tuttavia, dopo il completamento e la chiusura della richiesta, non è più possibile annullare la corrispondenza. È necessario eliminare e aggiungere nuovamente il nodo target esistente per eliminare le informazioni delle corrispondenze memorizzate.
Quando vengono stabiliti i collegamenti tra i nodi?
I collegamenti tra nodi vengono stabiliti tra un nodo di origine e un nodo target quando un nodo target esistente viene aggiornato da un nodo di origine in entrata con un'origine dati definita. Per informazioni dettagliate, fare riferimento alla sezione Introduzione a collegamenti tra nodi e origini dati.