Desduplicación de nodos en un punto de vista

La desduplicación de nodos le permite evaluar nodos similares en un punto de vista y fusionarlos a continuación en un único nodo si son un duplicado uno del otro.

Descripción general del proceso de desduplicación

Las desduplicación de operaciones en un punto de vista sigue este proceso general:

Un gestor de datos crea una solicitud para una vista que contiene el punto de vista que se va a desduplicar.

Tip:
Es necesaria una solicitud para desduplicar un punto de vista porque el resultado del proceso de desduplicación da lugar al procesamiento de cambios en los nodos de un punto de vista.
El gestor de datos crea y ejecuta una coincidencia para un tipo de nodo específico en un punto de vista concreto a fin de desduplicar ese punto de vista. Consulte Ejecución de una operación de desduplicación para un punto de vista.
En el área de trabajo de coincidencias se muestran las posibles coincidencias según se haya determinado en las reglas de coincidencia configuradas para cada origen de datos. Consulte Descripción de los resultados de la desduplicación y Creación, edición y supresión de reglas de coincidencia.

Note:
Solo se muestran las reglas de coincidencia con puntuaciones de coincidencia que excedan el Umbral de exclusión automática en las reglas de coincidencia.
El gestor de datos revisa las coincidencias de desduplicación y acepta o rechaza cada una de ellas para, a continuación, aplicar los cambios. Consulte Revisión de resultados de desduplicación y aplicación de cambios.
Las coincidencias aceptadas se aplican del siguiente modo:
- El nodo (de origen) coincidente se suprime del punto de vista (porque es un duplicado)
- Las propiedades y las relaciones del nodo duplicado se fusionan en el nodo (de destino) candidato de coincidencia que se conservará según se determina en la reglas de supervivencia. Consulte Creación, edición y supresión de reglas de supervivencia.
El sistema utiliza los cambios aplicados para crear elementos de solicitud en la solicitud. Se agregan acciones de supresión para nodos duplicados, y las acciones de inserción, actualización y traslado de propiedad se agregan según las reglas de supervivencia.

Descripción de nodos coincidentes y candidatos para coincidencia en la desduplicación

Debido a que los puntos de vista que va a desduplicar contienen tanto los nodos coincidentes como los candidatos para coincidencia, es importante comprender la diferencia entre ambos:

Los nodos coincidentes son los nodos del origen de datos que va a evaluar durante el proceso de coincidencia. Al fusionar los nodos, estos se convierten en los nodos de origen que se suprimen después de la operación de fusión.
Los candidatos para coincidencia son los nodos en los que se realiza la búsqueda de coincidencias durante el proceso de coincidencia. Al fusionar los nodos, estos se convierten en los nodos de destino que sobreviven tras una fusión, y las propiedades y los valores de relación de los nodos de origen se fusionan en ellos según se determina en las reglas de supervivencia.

Note:

Cuando ejecuta una desduplicación utilizando una clave de cluster, esta solo se aplica a los nodos coincidentes. No se utiliza para limitar los nodos con los que se buscan las coincidencias.

Por ejemplo, si desduplica un punto de vista de clientes con la clave de cluster Estado y el valor de propiedad de agrupación en clusters Texas, solo se evaluarán los clientes de Texas (nodo coincidente), pero estos podrían coincidir con un cliente de California (candidato de coincidencia) con el mismo nombre. Cuando fusiona los registros, el nodo de Texas se suprime y su información se fusiona en el nodo de California.