La rimozione dei duplicati dei nodi consente di valutare nodi simili in un'angolazione vista e quindi di unirli in un singolo nodo nel caso siano duplicati l'uno dell'altro.
Panoramica del processo di rimozione duplicati
Le operazioni di rimozione duplicati in un'angolazione vista seguono il processo generale illustrato di seguito.
Tip:
Per la rimozione dati di un'angolazione vista è necessaria una richiesta poiché il risultato del processo di rimozione duplicati comporta l'elaborazione di modifiche ai nodi in un'angolazione vista.Note:
Vengono visualizzati solo i risultati delle corrispondenze con punteggi che superano la Soglia esclusione automatica nelle regole di corrispondenza.Introduzione ai nodi con corrispondenza e ai candidati corrispondenza nella rimozione dei duplicati
Poiché le angolazioni vista per cui si stanno rimuovendo i duplicati contengono sia i nodi con corrispondenza sia i candidati per la corrispondenza, è importante comprendere la differenza tra questi due tipi di nodi.
Note:
Quando si esegue la rimozione dei duplicati utilizzando una chiave cluster, tale la chiave viene applicata solo ai nodi con corrispondenza. La chiave non viene utilizzata per limitare i nodi con cui viene effettuato il confronto.
Ad esempio, se si rimuovono i duplicati in un'angolazione vista di un cliente utilizzando una chiave cluster "Stato" e un valore della proprietà clustering "Texas", verranno valutati solo i clienti del Texas (nodo con corrispondenza), ma questi potrebbero essere abbinati a un cliente della California (candidato per la corrispondenza) con lo stesso nome. Quando si uniscono i record, il nodo del Texas verrà eliminato e le sue informazioni verranno unite al nodo della California.