Esecuzione di un'operazione di rimozione duplicati per un'angolazione vista

La rimozione dei duplicati dei nodi consente di abbinare nodi simili esistenti in un'angolazione vista e di combinarli in un singolo nodo.

Considerazioni

  • Per rimuovere i duplicati di un'angolazione vista, è necessario disporre dell'autorizzazione Gestione dati o di un'autorizzazione superiore per tale angolazione vista.

  • Non è possibile rimuovere i duplicati di angolazioni vista con etichetta tempo o archiviate.
  • È possibile rimuovere i duplicati di angolazioni vista in una richiesta attiva alla volta. Se un'angolazione vista è in fase di rimozione duplicati in un'altra richiesta attiva, non è possibile selezionare tale angolazione vista in una nuova operazione di rimozione duplicati.
  • Ogni richiesta supporta una sola modalità di rimozione duplicati. Non è possibile eseguire una chiave cluster e una rimozione duplicati basata su tempo nella stessa richiesta.
  • Quando si esegue una rimozione duplicati in un'angolazione vista:
    • I nodi nell'angolazione vista vengono confrontati con tutti i nodi nel tipo di nodo, anche se alcuni di questi non si trovano nell'angolazione vista esistente.
    • Se un'angolazione vista contiene nodi condivisi, le regole di corrispondenza vengono eseguite solo per un'istanza del nodo.
    • Per ogni nodo con corrispondenza vengono visualizzati un massimo di 20 risultati corrispondenti.
  • Le richieste prevedono un limite di 10.000 elementi richiesta. Poiché ogni operazione di unione genera due elementi richiesta (un'eliminazione del nodo di origine e un aggiornamento delle proprietà del nodo target), quando il numero di nodi con corrispondenza raggiunge 5.000, il processo di rimozione duplicati per tale richiesta viene interrotto e viene richiesto di creare una nuova richiesta per continuare la rimozione dei duplicati dei nodi. Il numero massimo di richieste potrebbe essere raggiunto prima se la richiesta contiene già altri elementi.
  • Poiché in un'angolazione vista si rimuovono i duplicati di un set di nodi anziché di elementi richiesta in entrata, spesso due nodi diversi possono essere candidati per la corrispondenza l'uno per l'altro. Ad esempio, quando si rimuovono i duplicati in un'angolazione vista che contiene i nodi "Oracle" e "Oracle Inc", ogni nodo può essere un candidato corrispondenza per l'altro. Il nodo che si accetta come duplicato determinerà quale nodo verrà eliminato e quale sarà il nodo conservato. Ricordare che i nodi con corrispondenza sono i nodi che verranno eliminati, mentre i nodi candidati per la corrispondenza sono i nodi che verranno conservati. Fare riferimento a Introduzione ai nodi con corrispondenza e ai candidati corrispondenza nella rimozione dei duplicati.

    Tip:

    Quando si accetta una corrispondenza come duplicata, il nodo duplicato viene contrassegnato come Duplicato nella schermata Risultati rimozione duplicati (fare riferimento alla sezione Introduzione ai risultati della rimozione duplicati). Il nodo contrassegnato è quello che verrà eliminato.
  • Se durante la rimozione dei duplicati vengono abbinati tre o più nodi, non è possibile unire il primo al secondo e quindi unire il secondo al terzo. Tuttavia è possibile unire sia il primo che il secondo nel terzo.

    Ad esempio, si supponga che siano presenti i nodi "Oracle", "Oracle Inc" e "Oracle Incorporated" e di voler conservare "Oracle Incorporated" in cui si desidera unire le informazioni degli altri due nodi. Non è possibile unire "Oracle" a "Oracle Inc" e poi unire "Oracle Inc" a "Oracle Incorporated". È possibile invece individuare invece il nodo corrispondente "Oracle" e contrassegnarlo come duplicato di "Oracle Incorporated", quindi individuare "Oracle Inc" e contrassegnarlo come duplicato di "Oracle Incorporated".

Per rimuovere i duplicati in un'angolazione vista, procedere come segue.

  1. Creare una richiesta per l'angolazione vista da cui rimuovere i duplicati.
  2. Fare clic sulla scheda Esegui corrispondenza e rimozione duplicati icona di ricerca corrispondenza sul lato sinistro della finestra dell'angolazione vista.
  3. Nel riquadro di ricerca corrispondenza, fare clic su Nuova icona di creazione ricerca corrispondenza e quindi selezionare Rimuovi duplicati in angolazione vista.
  4. Nella finestra di dialogo Rimuovi duplicati in angolazione vista, eseguire le azioni riportate di seguito.
    1. Selezionare l'Angolazione vista in cui si desidera rimuovere i duplicati.
    2. Selezionare un Tipo di nodo in tale angolazione vista. Per la rimozione duplicati è necessario configurare il tipo di nodo (fare riferimento alla sezione Introduzione alla rimozione duplicati).
    3. Selezionare la Modalità di rimozione duplicati.
      • Chiave cluster: consente di rimuovere i duplicati nell'angolazione vista utilizzando una proprietà clustering. Selezionare il valore della proprietà clustering dal menu a discesa. I valori delle proprietà clustering nel menu a discesa si basano sui valori consentiti per la proprietà definita come chiave cluster. Fare riferimento a Rimozione dei duplicati tramite una chiave cluster.

        Note:

        Se è già stata eseguita un'operazione di rimozione duplicati per la proprietà clustering, viene visualizzata la data di creazione dell'ultimo nodo elaborato.
      • Basata su tempo: rimuove i duplicati nell'angolazione vista in base alla data in cui sono stati creati i nodi. Immettere la data di creazione del nodo. Fare riferimento alla sezione Rimozione dei duplicati basata sul tempo.
  5. Facoltativo: immettere una Dimensione batch per specificare il numero di nodi da controllare per eventuali duplicati.

    Tip:

    Questo può essere utile, ad esempio, se sono state apportate modifiche a una regola di corrispondenza che si desidera testare. È possibile eseguire un batch più piccolo e valutare i risultati prima di rimuovere i duplicati l'intera angolazione vista.
  6. Fare clic su Esegui rimozione duplicati.

La rimozione duplicati viene eseguita nell'angolazione vista utilizzando le regole di corrispondenza definite per il tipo di nodo e l'origine dati registrata per l'angolazione vista.

Operazioni del processo di rimozione duplicati

Poiché le angolazioni vista possono contenere migliaia di nodi, in genere la rimozione duplicati viene eseguita in batch. I batch possono essere definiti nei modi illustrati di seguito.

I batch possono inoltre essere definiti da una combinazione di alcuni degli elementi sopra menzionati, come una chiave cluster e una dimensione batch specificata.

Sono disponibili diverse opzioni per l'elaborazione dei nodi in questi batch. I termini descritti di seguito possono contribuire a comprendere le opzioni disponibili.

Table 11-1 Opzioni di elaborazione in batch

Opzione Definizione Modalità di esecuzione
Esegui Esegue la rimozione duplicati iniziale del primo batch di nodi per una data di inizio della creazione di un cluster o di un nodo specificata. Fare clic su Esegui rimozione duplicati nella finestra di dialogo Rimuovi duplicati in angolazione vista.
Continua Esegue una rimozione duplicati successiva del batch di nodi successivi per una data di inizio della creazione di un cluster o di un nodo specificata. Il sistema tiene traccia dei nodi che sono già stati elaborati, in modo da consentire di riprendere da dove ci si era interrotti. Fare clic su Esegui rimozione duplicati nella finestra di dialogo Rimuovi duplicati in angolazione vista dopo aver eseguito un'operazione di esecuzione iniziale.
Riesegui Rielabora un set di risultati esistente in una richiesta. Il risultato potrebbe includere uno o più batch.

Nota: l'opzione Riesegui rielabora solo i risultati delle corrispondenze non accettate.

Nel pannello Set di risultati di Rimuovi duplicati, fare clic su Azioni icona Azione accanto al set di risultati che si desidera rieseguire, quindi selezionare Riesegui.
Riavvia Rielabora un cluster già elaborato, ripartendo dall'inizio.

Nota: il riavvio è disponibile solo per la rimozione duplicati basata su chiave cluster.

Suggerimento: la differenza tra Riesegui e Riavvia consiste nel fatto che l'opzione Riesegui rielabora uno o più batch, mentre Riavvia rielabora un cluster.

Fare clic su Riavvia icona Riavvia accanto alla chiave cluster nella finestra di dialogo Rimuovi duplicati in angolazione vista.
Scarta Elimina un set di risultati esistente per una determinata richiesta. L'ultimo nodo elaborato viene conservato in modo da poter continuare la volta successiva che si esegue la rimozione duplicati.

Nota: l'eliminazione della richiesta comporterà anche lo scarto del set di risultati.

Nel pannello Set di risultati di Rimuovi duplicati, fare clic su Azioni icona Azione accanto al set di risultati che si desidera rieseguire, quindi selezionare Scarta.
Scarta e riesegui Elimina un set di risultati esistente per una determinata richiesta e e rielaborare gli stessi nodi nel set di risultati. Il risultato potrebbe includere uno o più batch. Nel pannello Set di risultati di Rimuovi duplicati, fare clic su Azioni icona Azione accanto al set di risultati che si desidera rieseguire, quindi selezionare Scarta e riesegui.