La rimozione dei duplicati dei nodi consente di abbinare nodi simili esistenti in un'angolazione vista e di combinarli in un singolo nodo.
Considerazioni
Per rimuovere i duplicati di un'angolazione vista, è necessario disporre dell'autorizzazione Gestione dati o di un'autorizzazione superiore per tale angolazione vista.
Tip:
Quando si accetta una corrispondenza come duplicata, il nodo duplicato viene contrassegnato come Duplicato nella schermata Risultati rimozione duplicati (fare riferimento alla sezione Introduzione ai risultati della rimozione duplicati). Il nodo contrassegnato è quello che verrà eliminato.Ad esempio, si supponga che siano presenti i nodi "Oracle", "Oracle Inc" e "Oracle Incorporated" e di voler conservare "Oracle Incorporated" in cui si desidera unire le informazioni degli altri due nodi. Non è possibile unire "Oracle" a "Oracle Inc" e poi unire "Oracle Inc" a "Oracle Incorporated". È possibile invece individuare invece il nodo corrispondente "Oracle" e contrassegnarlo come duplicato di "Oracle Incorporated", quindi individuare "Oracle Inc" e contrassegnarlo come duplicato di "Oracle Incorporated".
Per rimuovere i duplicati in un'angolazione vista, procedere come segue.
Note:
Se è già stata eseguita un'operazione di rimozione duplicati per la proprietà clustering, viene visualizzata la data di creazione dell'ultimo nodo elaborato.Tip:
Questo può essere utile, ad esempio, se sono state apportate modifiche a una regola di corrispondenza che si desidera testare. È possibile eseguire un batch più piccolo e valutare i risultati prima di rimuovere i duplicati l'intera angolazione vista.La rimozione duplicati viene eseguita nell'angolazione vista utilizzando le regole di corrispondenza definite per il tipo di nodo e l'origine dati registrata per l'angolazione vista.
Operazioni del processo di rimozione duplicati
Poiché le angolazioni vista possono contenere migliaia di nodi, in genere la rimozione duplicati viene eseguita in batch. I batch possono essere definiti nei modi illustrati di seguito.
I batch possono inoltre essere definiti da una combinazione di alcuni degli elementi sopra menzionati, come una chiave cluster e una dimensione batch specificata.
Sono disponibili diverse opzioni per l'elaborazione dei nodi in questi batch. I termini descritti di seguito possono contribuire a comprendere le opzioni disponibili.
Table 11-1 Opzioni di elaborazione in batch
Opzione | Definizione | Modalità di esecuzione |
---|---|---|
Esegui | Esegue la rimozione duplicati iniziale del primo batch di nodi per una data di inizio della creazione di un cluster o di un nodo specificata. | Fare clic su Esegui rimozione duplicati nella finestra di dialogo Rimuovi duplicati in angolazione vista. |
Continua | Esegue una rimozione duplicati successiva del batch di nodi successivi per una data di inizio della creazione di un cluster o di un nodo specificata. Il sistema tiene traccia dei nodi che sono già stati elaborati, in modo da consentire di riprendere da dove ci si era interrotti. | Fare clic su Esegui rimozione duplicati nella finestra di dialogo Rimuovi duplicati in angolazione vista dopo aver eseguito un'operazione di esecuzione iniziale. |
Riesegui | Rielabora un set di risultati esistente in una richiesta. Il risultato potrebbe includere uno o più batch.
Nota: l'opzione Riesegui rielabora solo i risultati delle corrispondenze non accettate. |
Nel pannello Set di risultati di Rimuovi duplicati, fare clic su Azioni ![]() |
Riavvia | Rielabora un cluster già elaborato, ripartendo dall'inizio.
Nota: il riavvio è disponibile solo per la rimozione duplicati basata su chiave cluster. Suggerimento: la differenza tra Riesegui e Riavvia consiste nel fatto che l'opzione Riesegui rielabora uno o più batch, mentre Riavvia rielabora un cluster. |
Fare clic su Riavvia ![]() |
Scarta | Elimina un set di risultati esistente per una determinata richiesta. L'ultimo nodo elaborato viene conservato in modo da poter continuare la volta successiva che si esegue la rimozione duplicati.
Nota: l'eliminazione della richiesta comporterà anche lo scarto del set di risultati. |
Nel pannello Set di risultati di Rimuovi duplicati, fare clic su Azioni ![]() |
Scarta e riesegui | Elimina un set di risultati esistente per una determinata richiesta e e rielaborare gli stessi nodi nel set di risultati. Il risultato potrebbe includere uno o più batch. | Nel pannello Set di risultati di Rimuovi duplicati, fare clic su Azioni ![]() |