Poprawianie wyników zwracanych przez asystenta AI Oracle Analytics

Dzięki starannemu indeksowaniu i organizowaniu danych można poprawić wyniki zwracane przez asystenta AI Oracle Analytics.

Asystent AI Oracle Analytics jest oparty na dużym modelu językowym (LLM). Modele LLM lepiej rozumieją tekst niż liczby, więc należy zmienić wartości Null w zbiorach danych na zrozumiały tekst, na przykład "Nieznane" lub "Niedostępne". Wyniki można także zoptymalizować, przypisując wartości liczbowe do pojemników, na przykład poprzez podział klientów na grupy w oparciu o łączną wielkość sprzedaży lub poprzez podział kwot zamówień na zakresy w rodzaju "mała", "średnia" i "duża". Zob. Tworzenie kolumny pojemnika podczas przygotowywania danych.

Wzbogacanie i przekształcanie danych przy wykorzystaniu sugestii z Oracle Analytics może zapewnić asystentowi szerszy kontekst. Na przykład przekształcenie zbioru danych tak, aby uwzględnić wyodrębnienia części daty polegające na wyodrębnieniu dnia tygodnia z daty w postaci liczbowej, sprawi, że asystent będzie w stanie precyzyjniej odpowiedzieć na instrukcję taką jak "pokaż sprzedaż we wszystkie piątki w 2024 roku". Zob. Wzbogacanie i przekształcanie danych.

Niejednoznaczności w indeksowanych danych można ograniczyć, stosując oczywiste nazwy kolumn, które będą łatwe do zrozumienia, a także unikając duplikowania nazw i wykorzystując synonimy. Na przykład zbiory danych często zawierają wiele pól daty (data zamówienia, data wysyłki, data faktury). Może to powodować nieporozumienia, gdy użytkownik zada pytanie typu "pokaż sprzedaż według miesiąca". Aby uniknąć takich sytuacji, należałoby utworzyć synonim o nazwie "Data" w kolumnie, która ma zostać przypisana jako data domyślna. Zob. Określanie synonimów nazw kolumn zbioru danych.

Podczas indeksowania danych należy starannie wybierać kolumny, które mają być indeksowane. Należy zastanowić się, o które kolumny użytkownicy będą najprawdopodobniej pytać asystenta w celu uzyskania spostrzeżeń i wizualizacji, takie jak miary, regiony i daty. Należy unikać indeksowania kolumn o wysokiej kardynalności takich jak identyfikatory klientów, numery SKU lub adresy, ponieważ może to spowodować wzrost złożoności bez żadnego pozytywnego wpływu na spostrzeżenia asystenta. Podczas indeksowania zbioru danych najlepiej zacząć od wybrania opcji Użyj zalecanych ustawień indeksowania, a następnie doprecyzować poszczególne wybrane kolumny tak, aby zoptymalizować indeks wyszukiwania. Zob. Zalecane ustawienia indeksowania - informacje podstawowe.