신중한 데이터 인덱스화 및 구성을 통해 Oracle Analytics AI Assistant의 결과를 개선할 수 있습니다.
Oracle Analytics AI Assistant는 LLM(대형 언어 모델)을 기반으로 합니다. LLM은 숫자보다 텍스트를 더 잘 이해하므로 데이터 집합의 널 값을 "알 수 없음" 또는 "사용할 수 없음"과 같은 의미 있는 텍스트로 변경하십시오. 총 판매를 기반으로 고객을 그룹으로 분류하거나 주문 금액을 소규모, 중간, 대규모 범위로 분류하는 등 숫자 값을 분류하여 결과를 최적화할 수도 있습니다. 데이터 준비 시 Bin 열 생성을(를) 참조하십시오.
Oracle Analytics의 제안에 따라 데이터를 강화하고 변환하면 Assistant에 향상된 컨텍스트를 제공할 수 있습니다. 예를 들어, 숫자 날짜에서 요일을 추출하는 데이터 부분 추출을 포함하도록 데이터 집합을 변환하면 Assistant가 "2024년 모든 금요일에 대한 판매 표시"와 같은 프롬프트에 더 정확하게 응답할 수 있습니다. 데이터 강화 및 변환을(를) 참조하십시오.
누구나 읽을 수 있도록 명확한 열 이름을 지정하고, 중복된 이름을 피하고, 동의어를 활용하면 인덱스화된 데이터의 모호성을 줄일 수 있습니다. 예를 들어, 데이터 집합에는 날짜 필드가 여러 개(주문 날짜, 배송 날짜, 송장 날짜) 있는 경우가 많습니다. 이로 인해 누군가가 "월별 판매 표시"와 같은 질문을 하면 혼동이 야기될 수 있습니다. 기본 날짜로 지정할 열에 "Date"라는 동의어를 생성하면 이를 방지할 수 있습니다. 데이터 집합 열에 대한 동의어 지정을(를) 참조하십시오.
데이터를 인덱스화할 때는 인덱스화할 열을 신중하게 선택하십시오. 측정항목, 영역, 날짜와 같이 인사이트 및 시각화를 제공하도록 Assistant에 요청할 가능성이 가장 높은 열을 고려하십시오. 고객 ID, SKU 또는 주소와 같은 높은 카디널리티 열을 인덱스화하지 마십시오. 해당 열은 Assistant 인사이트를 향상시키지 않으면서 복잡성을 가중시킬 수 있습니다. 먼저 데이터 집합을 인덱스화할 때 권장 인덱스 설정 사용을 선택하고 개별 열 선택 항목을 세분화하여 검색 인덱스를 최적화합니다. 권장 인덱스 설정 정보을(를) 참조하십시오.