Ejecución de una operación de desduplicación para un punto de vista

La desduplicación de nodos le permite buscar las coincidencias con nodos similares existentes de un punto de vista y combinarlos en un único nodo.

Consideraciones

  • Debe tener el permiso Gestor de datos o superior en el punto de vista para desduplicar ese punto de vista.

  • No puede desduplicar puntos de vista con etiquetas de tiempo o archivados.
  • Puede desduplicar un punto de vista en una solicitud activa cada vez. Si un punto de vista está en el proceso de desduplicación en otra solicitud activa, no puede seleccionar ese punto de vista en una nueva operación de desduplicación.
  • Cada solicitud solo soporta un modo de desduplicación. No se puede ejecutar una desduplicación con clave de cluster y una basada en el tiempo en la misma solicitud.
  • Cuando se ejecuta la desduplicación en un punto de vista:
    • Se buscan las coincidencias de los nodos del punto de vista con todos los nodos del tipo de nodo, incluso si algunos de esos nodos no están en el punto de vista existente.
    • Si un punto de vista contiene nodos compartidos, las reglas de coincidencia se ejecutan solo para una instancia del nodo.
    • Se muestra un límite máximo de 20 resultados de coincidencia para cada nodo coincidente.
  • Las solicitudes tienen un límite de 10 000 elementos de solicitud. Debido a que cada operación de fusión da lugar a dos elementos de solicitud (una supresión del nodo de origen y una actualización de propiedad del nodo de destino), cuando el número de nodos coincidentes llega a 5000, se detiene el proceso de desduplicación y se le solicita que cree una nueva solicitud para seguir desduplicando nodos. El máximo de la solicitud se podría alcanzar antes si su solicitud ya contiene otros elementos de solicitud.
  • Dado que está desduplicando un conjunto de nodos de un punto de vista en lugar de elementos de solicitud entrantes, a menudo dos nodos diferentes pueden ser candidatos para coincidencia entre sí. Por ejemplo, al desduplicar un punto de vista que contiene los nodos "Oracle" y "Oracle Inc", cada nodo puede ser un candidato de coincidencia para el otro. El nodo que acepta como duplicado controlará qué nodo se suprime y cuál será el nodo superviviente. Recuerde que los nodos coincidentes son los nodos que se suprimirán, y los nodos candidatos para coincidencia son el nodo de superviviente. Consulte Descripción de nodos coincidentes y candidatos para coincidencia en la desduplicación.

    Tip:

    Cuando acepta una coincidencia como un duplicado, ese nodo duplicado se marca como Duplicado en la pantalla Resultados de desduplicación (consulte Descripción de los resultados de la desduplicación). El nodo marcado es el que será suprimido.
  • Si se buscan coincidencias entre tres o más nodos durante la desduplicación, no puede fusionar el primer nodo en el segundo y, posteriormente, el segundo en el tercero. Sin embargo, sí puede fusionar el primero y el segundo en el tercero.

    Por ejemplo, supongamos que tiene los nodos "Oracle", "Oracle Inc" y "Oracle Incorporated", y que desea conservar "Oracle Incorporated" y fusionar en él la información de los otros dos nodos. No es posible fusionar "Oracle" en "Oracle Inc" y, a continuación, fusionar "Oracle Inc" en "Oracle Incorporated". En su lugar, busque el nodo coincidente "Oracle" y márquelo como duplicado de "Oracle Incorporated" y, después, busque "Oracle Inc" y márquelo como duplicado de "Oracle Incorporated".

Para desduplicar un punto de vista:

  1. Cree una solicitud para el punto de vista que desea desduplicar.
  2. Haga clic en el separador Buscar coincidencias y desduplicar icono de coincidencia en la parte izquierda de la ventana de punto de vista.
  3. En el panel de coincidencias, haga clic en Nuevo icono de Crear coincidencia y, a continuación, seleccione Desduplicar punto de vista.
  4. En el cuadro de diálogo Desduplicar punto de vista, realice estas acciones:
    1. Seleccione el Punto de vista que desea desduplicar.
    2. Seleccione un Tipo de nodo en ese punto de vista. El tipo de nodo debe estar configurado para la desduplicación (consulte Descripción de la desduplicación).
    3. Seleccione el Modo de desduplicación:
      • Clave de cluster: desduplique el punto de vista utilizando una propiedad de agrupación en clusters. Seleccione el valor de propiedad de agrupación en clusters en el menú desplegable. Los valores de propiedad de agrupación en clusters del menú desplegable están basados en los valores permitidos para la propiedad que ha definido como clave de cluster. Consulte Desduplicación mediante una clave de cluster.

        Note:

        Si ya se ha ejecutado una operación de desduplicación para la propiedad de agrupación en clusters, se muestra la fecha de creación de nodo del último nodo procesado.
      • Basada en el tiempo: desduplique el punto de vista según la fecha en la que se crearon los nodos. Introduzca la fecha de creación del nodo. Consulte Desduplicación basada en el tiempo.
  5. Opcional: Introduzca un Tamaño de lote para especificar el número de nodos que se van a comprobar en busca de duplicados.

    Tip:

    Esto puede resultar útil, por ejemplo, si ha realizado cambios en una regla de coincidencia que desea probar. Puede ejecutar una lote más pequeño y evaluar los resultados antes de desduplicar el punto de vista completo.
  6. Haga clic en Ejecutar desduplicación.

La desduplicación se ejecuta en el punto de vista utilizando las reglas de coincidencia definidas para el tipo de nodo y el origen de datos registrado para el punto de vista.

Operaciones de desduplicación

Debido a que los puntos de vista pueden contener miles de nodos, se suelen desduplicar en lotes. Los lotes se pueden definir de las siguientes formas:

Los lotes también se pueden definir mediante una combinación de algunas de las opciones anteriores, como una clave de cluster y un tamaño de lote especificado.

Dispone de varias opciones para procesar los nodos de estos lotes. Los siguientes términos le pueden resultar útiles para entender estas opciones:

Table 11-1 Opciones de procesamiento por lotes

Opción Definición Cómo realizarlo
Ejecutar Realice la desduplicación inicial del primer lote de nodos para una fecha de inicio de creación de nodo o cluster especificada. Haga clic en Ejecutar desduplicación en el cuadro de diálogo Desduplicar punto de vista.
Continuar Realice una desduplicación posterior del siguiente lote de nodos para una fecha de inicio de creación de nodo o cluster especificada. El sistema realiza el seguimiento de los nodos que ya se han procesado para que pueda retomarlo donde lo dejó. Haga clic en Ejecutar desduplicación en el cuadro de diálogo Desduplicar punto de vista después de realizar la operación Ejecutar inicial.
Volver a ejecutar Vuelva a procesar un conjunto de resultados existente en una solicitud. Puede incluir uno o más lotes.

Nota: Volver a ejecutar vuelve a procesar solo los resultados de coincidencia no aceptados.

En el panel Conjunto de resultados de desduplicación, haga clic en Acciones icono Acciones junto al conjunto de resultados que desea volver a ejecutar y, a continuación, seleccione Volver a ejecutar.
Reiniciar Vuelva a procesar un cluster que ya estaba procesado empezando desde el principio.

Nota: Reiniciar solo está disponible para la desduplicación mediante una clave de cluster.

Consejo: La diferencia entre Volver a ejecutar y Reiniciar es que Volver a ejecutar vuelve a procesar uno o más lotes, mientras que Reiniciar vuelve a procesar un cluster.

Haga clic en Reiniciar icono de reiniciar junto a Clave de cluster en el cuadro de diálogo Desduplicar punto de vista.
Desechar Suprima un conjunto de resultados existente para una solicitud determinada. El último nodo que se ha procesado se conserva de modo que pueda Continuar la siguiente vez que ejecute la desduplicación.

Nota: La supresión de la solicitud también desechará el conjunto de resultados.

En el panel Conjunto de resultados de desduplicación, haga clic en Acciones icono Acciones junto al conjunto de resultados que desea volver a ejecutar y, a continuación, seleccione Desechar.
Desechar y volver a ejecutar Suprima un conjunto de resultados existente para una solicitud determinada y vuelva a procesar los mismos nodos en el conjunto de resultados. Puede incluir uno o más lotes. En el panel Conjunto de resultados de desduplicación, haga clic en Acciones icono Acciones junto al conjunto de resultados que desea volver a ejecutar y, a continuación, seleccione Desechar y volver a ejecutar.