중복제거 이해

중복제거를 사용하면 일치 프로세스를 사용하여 뷰포인트에서 서로 중복되는 노드를 확인하고 이를 단일 노드로 결합할 수 있습니다.

요청에 추가되는 들어오는 노드에서 작동하는 요청 항목 일치 및 병합과 달리, 중복제거는 뷰포인트에 이미 있는 노드에서 실행됩니다. 이를 통해 일치가 가능하기 전 뷰포인트에 추가되었거나 요청 프로세스 외부(예: 임포트 또는 로드)에서 중복된 기존 노드를 찾아 병합할 수 있습니다.

중복제거는 요청 항목의 일치 및 병합과 동일한 요소를 많이 사용합니다.

  • 일치 규칙은 잠재적인 중복 노드를 확인하는 데 사용됩니다.
  • 보존 규칙은 일치가 확인된 후 속성 및 관계를 병합하는 방식을 제어합니다.
  • 일치 워크벤치를 사용하여 일치 후보를 수락하거나, 거부하거나, 건너뛸 수 있습니다.

중복제거 모드

두 가지 모드로 뷰포인트에서 노드 중복을 제거할 수 있습니다.

  • 클러스터 키: 일치시킬 노드의 노드 유형에 대한 클러스터링 속성을 정의한 후, 각 클러스터에 대해 일치 작업을 수행합니다. 클러스터 키를 사용한 중복제거를 참조하십시오.
  • 시간 기준: 노드가 생성된 날짜를 기준으로 뷰포인트에서 노드 중복을 제거합니다. 시간 기준 중복제거을 참조하십시오.

단일 요청에서 특정 뷰포인트 및 노드 유형에 대해 하나의 중복제거 모드만 실행할 수 있지만, 두 모드를 모두 사용하여 서로 다른 컨텍스트에서 뷰포인트의 노드 중복을 제거할 수 있습니다. 예를 들어, 클러스터 키를 기준으로 뷰포인트의 노드 중복을 먼저 제거한 후, 이후에 생성된 노드는 시간 기준 중복제거를 사용하여 증분 방식으로 중복을 제거할 수 있습니다.

Note:

특정 노드 유형의 노드 중복제거는 모드에 관계없이 한 번에 하나의 활성 요청에서만 수행할 수 있습니다.

시간 기준 중복제거에서 클러스터 키와 노드 생성 날짜는 기본적으로 중복제거 작업의 범위를 제한합니다. 요청의 최대 요청 항목 수 제한에 따라 자동으로 제한되는 일치 및 병합과 달리, 뷰포인트는 잠재적으로 수백만 개의 노드를 포함할 수 있습니다. 노드 생성 날짜 또는 클러스터링 속성을 지정하면 단일 작업에서 중복을 제거하려는 특정 노드를 타겟으로 지정할 수 있습니다.

Note:

클러스터 키 및 시간 기준 중복제거는 모두 중복을 제거할 노드 유형에 CoreStats.Created Date 속성이 포함되어야 하며, 이를 통해 시스템에서 어떤 노드가 평가되었고 어떤 노드가 평가되지 않았는지에 대한 진행 상태를 추적할 수 있습니다.

클러스터 키를 사용한 중복제거

클러스터 키를 사용하여 노드 중복을 제거하려면 일치시킬 노드의 노드 유형에 클러스터링 속성을 정의해야 합니다. 이렇게 하면 뷰포인트의 노드 목록이 동일한 뷰포인트의 다른 노드와 일치하도록 필터링됩니다. 중복제거 프로세스를 실행할 때 노드 중복을 제거할 클러스터링 속성 값을 지정합니다.

Tip:

노드 유형에 클러스터링 속성을 정의하는 경우 선택하는 속성에는 해당 노드 유형에 대한 허용되는 값 목록이 있어야 합니다(노드 유형에 대한 클러스터링 속성 구성 참조). 그런 다음 클러스터 키를 사용하여 중복제거를 실행할 때 허용되는 값 목록에서 클러스터링 속성을 선택합니다. 예를 들어, 고객 중복을 제거하는 중이며 클러스터링 속성이 State인 경우, Texas 주에 있는 고객 중복을 제거하기 위해 클러스터링 값으로 Texas를 선택할 수 있습니다.

클러스터 키는 일치되는 노드가 아닌 일치시키는 노드 세트에 적용됩니다. 따라서 위 예에서 Texas 주에 있는 고객을 일치시키는 경우, California에 있는 동일한 이름의 일치 항목이 표시됩니다.

시간 기준 중복제거

시간 기준 중복제거를 사용하면 지정된 날짜 이후에 생성된 노드의 중복을 제거할 수 있습니다. 클러스터링 속성을 지정할 필요는 없습니다. 대신, 중복을 제거할 일치 항목을 생성할 때 노드 생성 시작 날짜 및 뱃치 크기(선택사항)를 지정합니다.