Eliminação de Duplicidades em Nós em um Ponto de Vista

A eliminação de duplicidades em nós permite avaliar nós similares em um ponto de vista e, em seguida, mesclá-los em um único nó, caso sejam duplicatas.

Visão Geral do Processo de Eliminação de Duplicidades

As operações de eliminação de duplicidades em um ponto de vista seguem o seguinte processo geral:

  1. Um gerente de dados cria uma solicitação para a exibição que contém o ponto de vista no qual o processo de eliminação de duplicidades será executado.

    Tip:

    O processo de eliminação de duplicidades em um ponto de vista exige uma solicitação porque a execução do processo resulta na alteração de nós do ponto de vista.
  2. O gerente de dados cria e executa uma correspondência para um tipo de nó específico em determinado ponto de vista a fim de eliminar as duplicidades nesse ponto de vista. Consulte Execução da Operação de Eliminação de Duplicidades em um Ponto de Vista.
  3. O workbench de correspondência exibe as possíveis correspondências, conforme determinado pelas regras de correspondência configuradas para cada origem de dados. Consulte Noções Básicas sobre os Resultados da Eliminação de Duplicidades e Criação, Edição e Exclusão de Regras de Correspondência.

    Note:

    Só são exibidos os resultados de correspondência com pontuação superior ao valor de Limite de Excluir Automaticamente nas regras de correspondência.
  4. O gerente de dados analisa as correspondências de eliminação de duplicidades, aceita ou rejeita cada correspondência, depois aplica as alterações. Consulte Análise dos Resultados da Eliminação de Duplicidades e Aplicação de Alterações.
  5. As correspondências aceitas são aplicadas da seguinte forma:
    • O nó correspondido (origem) é excluído do ponto de vista (por ser um item duplicado)
    • As propriedades e os relacionamentos do nó duplicado são mesclados no nó candidato da correspondência (destino) que permanecerá, conforme determinado pelas regras de sobrevivência. Consulte Criação, Edição e Exclusão de Regras de Sobrevivência.
  6. O sistema usa as alterações aplicadas para criar itens de solicitação na solicitação. As ações de exclusão são adicionadas para nós duplicados, e as ações de inserção, atualização e movimentação da propriedade são adicionadas com base nas regras de sobrevivência.

Noções Básicas sobre Nós Correspondidos e Candidatos da Correspondência na Eliminação de Duplicidades

Os pontos de vista usados no processo de eliminação de duplicidades contêm nós correspondidos e candidatos da correspondência, então é importante entender a diferença entre os dois:

  • Nós Correspondidos são os nós da origem de dados que estão sendo avaliados durante o processo de correspondência. Durante a mesclagem de nós, eles se tornam os nós de origem que são excluídos após a operação de mesclagem.
  • Candidatos da Correspondência são os nós que estão sendo comparados durante o processo de correspondência. Durante a mesclagem de nós, eles se tornam os nós de destino que permanecem após a mesclagem. Os valores de propriedades e relacionamentos dos nós de origem são mesclados nesses nós, conforme determinado pelas regras de sobrevivência.

Note:

Quando você executa o processo de eliminação de duplicidades usando uma chave do cluster, essa chave é aplicada somente aos nós correspondidos. Ela não é usada para limitar os nós que estão sendo usados para comparação.

Por exemplo, se você eliminar duplicidades de um ponto de vista de cliente usando uma chave do cluster Estado e o valor de propriedade de clustering Texas, somente os clientes do Texas (nó correspondido) serão avaliados, mas eles poderiam ser correspondidos com um cliente na Califórnia (candidato da correspondência) com o mesmo nome. Quando você mescla os registros, o nó do Texas é excluído e suas informações são mescladas no nó da Califórnia.