뷰포인트에서 중복제거 작업 실행

노드 중복을 제거하면 뷰포인트에서 유사한 기존 노드를 일치시키고 이를 단일 노드로 병합할 수 있습니다.

고려 사항

  • 뷰포인트의 중복을 제거하려면 해당 뷰포인트에 대한 데이터 관리자 권한이나 그 이상의 권한이 있어야 합니다.

  • 시간 레이블이 지정되었거나 아카이브된 뷰포인트의 중복은 제거할 수 없습니다.
  • 한 번에 하나의 활성 요청에서 뷰포인트 중복을 제거할 수 있습니다. 다른 활성 요청에서 뷰포인트의 중복을 제거하는 중이면 새로운 중복제거 작업에서 해당 뷰포인트를 선택할 수 없습니다.
  • 각 요청에서는 하나의 중복제거 모드만 지원됩니다. 동일한 요청에서 클러스터 키와 시간 기준의 중복제거를 동시에 실행할 수 없습니다.
  • 뷰포인트에서 중복제거가 실행되는 경우:
    • 일부 노드가 기존 뷰포인트에 없더라도 뷰포인트의 노드는 해당 노드 유형의 모든 노드와 일치됩니다.
    • 뷰포인트에 공유 노드가 포함된 경우, 일치 규칙은 노드의 한 인스턴스에 대해서만 실행됩니다.
    • 일치하는 각 노드에 대해 표시되는 최대 일치 결과는 20개로 제한됩니다.
  • 요청의 요청 항목은 10,000개로 제한됩니다. 각 병합 작업에서 두 ​​개의 요청 항목(소스 노드 삭제 및 타겟 노드 속성 업데이트)이 생성되므로 일치하는 노드 수가 5000개에 도달하면 해당 요청에 대한 중복제거 프로세스가 중지되고 노드 중복제거를 계속하려면 새 요청을 생성하라는 메시지가 표시됩니다. 요청에 이미 다른 요청 항목이 포함된 경우 요청 최대값에 더 일찍 도달할 수 있습니다.
  • 들어오는 요청 항목 대신 뷰포인트에서 중복된 노드 세트를 제거하기 때문에 서로 다른 두 노드가 서로에게 일치 후보가 되는 경우가 많습니다. 예를 들어, "Oracle"과 "Oracle Inc" 노드가 포함된 뷰포인트의 중복을 제거할 때 각 노드는 다른 노드의 일치 후보가 될 수 있습니다. 중복으로 수락한 노드에 따라 삭제될 노드와 보존될 노드가 결정됩니다. 일치하는 노드는 삭제될 노드이고, 일치 후보 노드는 보존될 노드입니다. 중복제거에서 일치하는 노드 및 일치 후보 이해를 참조하십시오.

    Tip:

    일치하는 노드를 중복 항목으로 수락하면 해당 중복 노드는 [중복제거 결과] 화면(결과 중복제거 이해 참조)에서 중복으로 표시됩니다. 표시된 노드가 삭제될 노드입니다.
  • 중복제거 중에 세 개 이상의 노드가 일치하면 첫번째 노드를 두번째 노드에 병합한 다음 두번째 노드를 세번째 노드에 병합할 수 없습니다. 그러나 첫번째 노드와 두번째 노드를 모두 세번째 노드에 병합할 수는 있습니다.

    예를 들어 "Oracle", "Oracle Inc" 및 "Oracle Incorporated" 노드가 있고 "Oracle Incorporated"는 유지하고 다른 두 노드의 정보를 해당 노드에 병합하려고 한다고 가정해 보겠습니다. "Oracle"을 "Oracle Inc"에 병합한 후 "Oracle Inc"를 "Oracle Incorporated"에 병합할 수는 없습니다. 대신, 일치하는 노드인 "Oracle"을 찾아 "Oracle Incorporated"의 중복 항목으로 표시한 다음, "Oracle Inc"를 찾아 "Oracle Incorporated"의 중복 항목으로 표시해야 합니다.

뷰포인트 중복을 제거하려면:

  1. 중복을 제거할 뷰포인트에 대한 요청을 생성합니다.
  2. 뷰포인트 창 왼쪽에 있는 일치 및 중복제거 일치 아이콘 탭을 누릅니다.
  3. 일치 창에서 새로 생성 일치 생성 아이콘을 누른 후 뷰포인트 중복제거를 선택합니다.
  4. 뷰포인트 중복제거 대화상자에서 다음 작업을 수행합니다.
    1. 중복을 제거할 뷰포인트를 선택합니다.
    2. 해당 뷰포인트에서 노드 유형을 선택합니다. 중복을 제거하려면 노드 유형을 구성해야 합니다(중복제거 이해 참조).
    3. 중복제거 모드를 선택합니다.
      • 클러스터 키: 클러스터링 속성을 사용하여 뷰포인트의 중복을 제거합니다. 드롭다운 메뉴에서 클러스터링 속성 값을 선택합니다. 드롭다운 메뉴의 클러스터링 속성 값은 클러스터 키로 정의한 속성에 허용되는 값을 기반으로 합니다. 클러스터 키를 사용한 중복제거를 참조하십시오.

        Note:

        클러스터링 속성에 대해 중복제거 작업이 이미 실행된 경우 마지막으로 처리된 노드의 노드 생성 날짜가 표시됩니다.
      • 시간 기준: 노드가 생성된 날짜를 기준으로 뷰포인트의 중복을 제거합니다. 노드 생성 날짜를 입력합니다. 시간 기준 중복제거를 참조하십시오.
  5. 선택사항: 중복 여부를 검사할 노드 수를 지정하려면 뱃치 크기를 입력합니다.

    Tip:

    예를 들어, 테스트하려는 일치 규칙을 변경한 경우 이 기능이 유용할 수 있습니다. 전체 뷰포인트의 중복을 제거하기 전에 더 작은 뱃치를 실행하고 결과를 평가할 수 있습니다.
  6. 중복제거 실행을 누릅니다.

중복제거는 노드 유형에 대해 정의된 일치 규칙과 뷰포인트에 대해 등록된 데이터 소스를 사용하여 뷰포인트에서 실행됩니다.

중복제거 작업

뷰포인트에는 수천 개의 노드가 포함될 수 있으므로 일반적으로 뱃치 단위로 중복을 제거합니다. 뱃치를 정의하는 방법은 다음과 같습니다.

클러스터 키와 지정된 뱃치 크기 등 위의 몇 가지를 조합하여 뱃치를 정의할 수도 있습니다.

이러한 뱃치에서 노드를 처리하는 방법에는 여러 가지 옵션이 있습니다. 다음 용어는 이러한 옵션을 이해하는 데 도움이 될 수 있습니다.

Table 11-1 뱃치 처리 옵션

옵션 정의 수행 방법
실행 지정된 클러스터 또는 노드 생성 시작 날짜에 첫번째 노드 뱃치의 초기 중복제거를 수행합니다. 뷰포인트 중복제거 대화상자에서 중복제거 실행을 누릅니다.
계속 지정된 클러스터 또는 노드 생성 시작 날짜에 다음 노드 뱃치의 후속 중복제거를 수행합니다. 시스템에서 이미 처리된 노드가 추적되므로 중단한 부분부터 다시 시작할 수 있습니다. 초기 실행 작업을 수행한 후 뷰포인트 중복제거 대화상자에서 중복제거 실행을 누릅니다.
다시 실행 요청의 기존 결과 세트를 재처리합니다. 여기에는 하나 이상의 뱃치가 포함될 수 있습니다.

참고: 다시 실행 옵션은 수락되지 않은 일치 결과만 재처리합니다.

결과 세트 중복제거 패널에서 다시 실행할 결과 세트 옆에 있는 작업 작업 아이콘을 누른 후 다시 실행을 선택합니다.
재시작 이미 처리된 클러스터를 처음부터 재처리합니다.

참고: 재시작 옵션은 클러스터 키 중복제거에만 사용할 수 있습니다.

: 다시 실행재시작의 차이점은 다시 실행이 하나 이상의 뱃치를 재처리하는 반면, 재시작은 클러스터를 재처리한다는 것입니다.

뷰포인트 중복제거 대화상자에서 클러스터 키 옆에 있는 재시작 재시작 아이콘을 누릅니다.
취소 지정된 요청의 기존 결과 세트를 삭제합니다. 마지막으로 처리된 노드는 다음에 중복제거를 실행할 때 계속할 수 있도록 유지됩니다.

참고: 요청을 삭제하면 결과 세트도 취소됩니다.

결과 세트 중복제거 패널에서 다시 실행할 결과 세트 옆에 있는 작업 작업 아이콘을 누른 후 취소를 선택합니다.
취소 및 다시 실행 지정된 요청의 기존 결과 세트를 삭제하고 결과 세트의 동일한 노드를 재처리합니다. 여기에는 하나 이상의 뱃치가 포함될 수 있습니다. 결과 세트 중복제거 패널에서 다시 실행하려는 결과 세트 옆에 있는 작업 작업 아이콘을 누른 후 취소 및 다시 실행을 선택합니다.