Execução da Operação de Eliminação de Duplicidades em um Ponto de Vista

A eliminação de duplicidades em nós permite corresponder nós similares em um ponto de vista e combiná-los em um único nó.

Considerações

  • É necessário ter pelo menos a permissão Gerente de Dados em um ponto de vista para eliminar duplicidades nesse ponto de vista.

  • Não é possível eliminar duplicidades de pontos de vista arquivados ou com rótulos de hora.
  • É possível eliminar duplicidades em um ponto de vista em uma solicitação ativa por vez. Se um ponto de vista estiver programado para ser usado no processo de eliminação de duplicidades em outra solicitação ativa, não será possível selecionar esse ponto de vista em uma nova operação de eliminação de duplicidades.
  • É possível usar apenas um modo de eliminação de duplicidades em cada solicitação. Não é possível executar uma operação de eliminação de duplicidades com base em chave do cluster e com base em tempo na mesma solicitação.
  • Quando o processo de eliminação de duplicidades de um ponto de vista é executado:
    • Os nós no ponto de vista são comparados com todos os nós no tipo de nó, mesmo que alguns deles não estejam no ponto de vista existente.
    • Se um ponto de vista tiver nós compartilhados, as regras de correspondência serão executadas apenas para uma instância do nó.
    • Até 20 resultados de correspondência são exibidos para cada nó correspondido.
  • As solicitações têm um limite de 10.000 itens de solicitação. Como cada operação de mesclagem resulta em dois itens de solicitação (a exclusão do nó de origem e a atualização de propriedade do nó de destino), quando o número de nós correspondidos atinge 5.000, o processo de eliminação de duplicidades da solicitação é interrompido, e é necessário criar outra solicitação para continuar o processo de eliminação de duplicidades em nós. O limite da solicitação poderá ser atingido antes se a solicitação já tiver outros itens de solicitação.
  • Como você está eliminando duplicidades em um conjunto de nós de um ponto de vista, e não em itens de solicitação de entrada, dois nós diferentes podem com frequência ser candidatos da correspondência um do outro. Por exemplo, ao eliminar duplicidades em um ponto de vista que tem os nós "Oracle" e "Oracle Inc", um nó pode ser candidato da correspondência do outro e vice-versa. O nó que você aceitar como duplicado determinará qual nó será excluído e qual nó será mantido. Lembre o seguinte: nós correspondidos são aqueles que serão excluídos, e nós candidatos da correspondência são aqueles que serão mantidos. Consulte Noções Básicas sobre Nós Correspondidos e Candidatos da Correspondência na Eliminação de Duplicidades.

    Tip:

    Quando você aceita uma correspondência como um nó duplicado, ele é marcado como Duplicado na tela Resultados da Eliminação de Duplicidade (consulte Noções Básicas sobre os Resultados da Eliminação de Duplicidades). O nó marcado é o nó que será excluído.
  • Se três ou mais nós forem correspondidos durante o processo de eliminação de duplicidades, não será possível mesclar o primeiro no segundo e depois o segundo no terceiro. No entanto, será possível mesclar o primeiro e o segundo nó no terceiro.

    Por exemplo, digamos que você tenha os nós "Oracle", "Oracle Inc" e "Oracle Incorporated", queira manter o nó "Oracle Incorporated" e queira mesclar as informações dos outros dois nós nele. Não será possível mesclar o nó "Oracle" ao nó "Oracle Inc" e depois mesclar o nó "Oracle Inc" ao nó "Oracle Incorporated". Em vez disso, localize o nó correspondido "Oracle" e marque-o como duplicata de "Oracle Incorporated", depois localize o nó "Oracle Inc" e marque-o como duplicata de "Oracle Incorporated".

Para eliminar duplicidades de um ponto de vista:

  1. Crie uma solicitação para o ponto de vista do qual deseja eliminar duplicidades.
  2. Clique na guia Corresponder e Eliminar a Duplicidade ícone de correspondência no lado esquerdo da janela do ponto de vista.
  3. No painel Correspondência, clique em Novo Ícone Criar correspondência e selecione Ponto de Vista da Eliminação de Duplicidade.
  4. Execute as seguintes ações na caixa de diálogo Ponto de Vista da Eliminação de Duplicidade:
    1. Selecione o Ponto de Vista do qual deseja eliminar duplicidades.
    2. Selecione um Tipo de Nó nesse ponto de vista. O tipo de nó deve ser configurado para a eliminação de duplicidades (consulte Noções Básicas sobre Eliminação de Duplicidades).
    3. Selecione o Modo da eliminação de duplicidades:
      • Chave do Cluster: Elimine duplicidades do ponto de vista usando uma propriedade de clustering. Selecione o valor da propriedade de clustering no menu suspenso. Os valores da propriedade de clustering no menu suspenso são baseados nos valores permitidos da propriedade que você definiu como a chave do cluster. Consulte Eliminação de Duplicidades Usando Chave do Cluster.

        Note:

        Se uma operação de eliminação de duplicidades já tiver sido executada para a propriedade de clustering, a data de criação do último nó processado será exibida.
      • Baseado na Hora: Elimine duplicidades do ponto de vista com base na data de criação dos nós. Insira a data de criação do nó. Consulte Eliminação de Duplicidades Baseada em Hora.
  5. Opcional: Insira um Tamanho do Lote para especificar o número de nós nos quais serão procurados itens duplicados.

    Tip:

    Isso pode ser útil, por exemplo, caso você tenha feito alterações em uma regra de correspondência que deseja testar. Você pode executar um lote menor e avaliar os resultados antes de eliminar duplicidades no ponto de vista todo.
  6. Clique em Executar a Eliminação de Duplicidade.

A eliminação de duplicidades é executada no ponto de vista usando as regras de correspondência para o tipo de nó e a origem de dados registrada para o ponto de vista.

Operações de Eliminação de Duplicidades

Os pontos de vista podem conter milhares de nós, então o processo de eliminação de duplicidades geralmente é executado em lotes. Os lotes podem ser definidos da seguinte forma:

Os lotes também podem ser definidos por uma combinação dos itens acima, como chave do cluster e tamanho do lote especificado.

Há diversas formas de processar os nós nesses lotes. Os seguintes termos podem ajudar você a entender essas opções:

Table 11-1 Opções de Processamento em Lote

Opção Definição Como Executar
Executar Execute o processo inicial de eliminação de duplicidades do primeiro lote de nós para determinado cluster ou data de início de criação do nó. Clique em Executar a Eliminação de Duplicidade na caixa de diálogo Ponto de Vista da Eliminação de Duplicidade.
Continuar Execute um processo subsequente de eliminação de duplicidades do próximo lote de nós para determinado cluster ou data de início de criação do nó. O sistema controla os nós que já foram processados, então você pode continuar de onde parou. Clique em Executar a Eliminação de Duplicidade na caixa de diálogo Ponto de Vista da Eliminação de Duplicidade após a execução de uma opção Executar inicial.
Executar Novamente Processa novamente o conjunto de resultados em uma solicitação. Esse conjunto pode incluir um ou mais lotes.

Observação: Esta operação processa novamente somente os resultados de correspondência não aceitos.

No painel Conjunto de Resultados da Eliminação de Duplicidades, clique em Ações ícone de ação ao lado do conjunto de resultados que deseja executar novamente, depois selecione Executar Novamente.
Reiniciar Processa novamente do início um cluster que já foi processado.

Observação: Esta operação só está disponível para eliminação de duplicidades usando chave do cluster.

Dica: A diferença entre Executar Novamente e Reiniciar é que Executar Novamente processa novamente um ou mais lotes, enquanto Reiniciar processa novamente um cluster.

Clique em Reiniciar ícone reiniciar ao lado de Chave do Cluster na caixa de diálogo Ponto de Vista da Eliminação de Duplicidade.
Descartar Exclui o conjunto de resultados de determinada solicitação. O último nó processado é mantido, então você poderá Continuar na próxima vez que executar a eliminação de duplicidades.

Observação: A exclusão da solicitação também excluirá o conjunto de resultados.

No painel Conjunto de Resultados da Eliminação de Duplicidades, clique em Ações ícone de ação ao lado do conjunto de resultados que deseja executar novamente, depois selecione Descartar.
Descartar e Executar Novamente Exclui o conjunto de resultados de determinada solicitação e processa novamente os mesmos nós no conjunto de resultados. Esse conjunto pode incluir um ou mais lotes. No painel Conjunto de Resultados da Eliminação de Duplicidades, clique em Ações ícone de ação ao lado do conjunto de resultados que deseja executar novamente, depois selecione Descartar e Executar Novamente.