유사성 분석 모델에서 결과 해석

유사성 분석을 수행하기 위해 데이터 흐름을 실행할 때 Oracle Analytics는 결과를 포함하는 데이터 집합을 생성합니다.

수행할 수 있는 작업:
  • Oracle Analytics 데이터 페이지에서 출력 데이터 집합을 찾습니다. 데이터 흐름의 데이터 저장 단계에서 지정된 이름을 가진 데이터 집합을 찾습니다. 데이터 집합에는 데이터 흐름 내 유사성 분석 단계의 출력 섹션에 나열된 것과 동일한 출력 열이 포함됩니다.

    유사성 분석 모델에 의해 생성된 데이터 집합 열은 다음과 같습니다.

    • source_value - 데이터 흐름에서 소스 객체로 선택된 해당 열 내의 단일 값이 있는 열을 반환합니다. 벡터 거리는 이 열의 다른 모든 값과 비교하여 이 값을 기준으로 측정됩니다.
    • source_reference_column1 - 유사성 분석을 위해 소스 레코드에서 선택된 레코드에 대해 참조 열(데이터 흐름 노드 속성에 설정됨)의 선택된 값을 반환합니다. 이 출력은 가장 가까운 레코드 또는 가장 먼 레코드를 찾은 소스 레코드를 표시하는 데 도움이 됩니다.
    • results_reference_column1, 2 및 3 - 유사성 분석에 의해 가장 가깝거나 가장 먼 것으로 식별된 레코드에 대한 각 참조 열(데이터 흐름 노드 속성에 설정됨)의 값을 반환합니다.
    • 거리 - 소스 값과 결과 레코드 간의 계산된 거리입니다. 즉, source_reference_col1, source_reference_col2 및 source_reference_col3의 데이터가 result_reference1, result_reference2 및 result_reference3의 데이터와 얼마나 유사하거나 다른지 나타냅니다.
    • profile_expression - 유사성 분석 모델에 사용되는 모든 열의 연결된 표현식을 단일 문자열로 변환합니다. 임베딩 모델에 의해 값이 벡터화된 열입니다.

      주:

      선택된 속성 열은 프로파일 문자열의 일부인 반면, 측정항목 열의 측정 단위는 먼저 하위, 중간 및 상위 Bin으로 동적으로 분류되어 벡터에 올바르게 표시됩니다.
  • 유사성 분석 데이터 흐름에서 생성된 출력 데이터 집합을 기반으로 워크북을 생성합니다.
  • 시각화를 생성하여 결과를 분석합니다. 예를 들어, 다음과 같습니다.