Gdy jest tworzony zbiór danych, Oracle Analytics przeprowadza profilowanie na poziomie kolumn, mające na celu utworzenie zestawu zaleceń semantycznych służących naprawie lub wzbogaceniu zbioru danych. Podczas tworzenia skoroszytów można również dodać do wizualizacji wzbogacenia wiedzy, używając panelu "Dane".
Uwaga:
Wzbogacenia wiedzy są zazwyczaj włączane domyślnie, ale osoby redagujące skoroszyty mogą włączać i wyłączać je w odniesieniu do zbiorów danych, które do nich należą lub które mogą edytować na podstawie swoich uprawnień. Oracle Analytics nie zapewnia w sposób automatyczny zaleceń dotyczących wzbogacania dla zbiorów danych wygenerowanych z przepływu danych. W takim przypadku właściciel lub administrator zbioru danych musi najpierw włączyć opcję wzbogacania wiedzy dla zbioru danych. Zob. Włączanie wzbogacania wiedzy dla zbiorów danych.Zalecenia te bazują na typie semantycznym, automatycznie wykrywanym na etapie profilowania. Na przykład zbiory danych oparte na obszarach tematycznych są profilowane z użyciem prostej próbki N czołowych.
Istnieją kategorie typów semantycznych, takich jak lokalizacje geograficzne wskazywane przez nazwy miast, rozpoznawalne wzorce na kartach kredytowych, adresy e-mail i numery ubezpieczenia społecznego, daty oraz wzorce cykliczne. Można także utworzyć swoje własne niestandardowe typy semantyczne.
Profilowanie jest stosowane do różnych typów semantycznych.
Kategorie typów semantycznych są profilowane po to, aby można było zidentyfikować:
Zalecenia dotyczące naprawy, udoskonalenia lub wzbogacenia zbioru danych są ustalane na podstawie typu danych.
Przykłady zaleceń opartych na typach semantycznych:
Typy semantyczne są rozpoznawane na podstawie wzorców wykrywanych w danych.
Rekomendacje są oferowane dla następujących typów:
Rozpoznawanie typów semantycznych zależy od załadowanej wiedzy, udostępnianej przez usługę.
Zalecenia ustalane referencyjnie są oferowane dla następujących typów semantycznych:
Zalecane wzbogacenia bazują na typach semantycznych.
Wzbogacenia są ustalane na podstawie hierarchii lokalizacji geograficznej:
W procesie profilowania wykorzystywane są określone wartości progowe w celu decydowania o konkretnych typach semantycznych.
Generalnie przyjmuje się, że - aby system mógł ustalić klasyfikację - 85% wartości zawartych w kolumnie musi spełniać kryteria danego typu semantycznego. Wskutek tego, jeśli 70% wartości w kolumnie będą stanowić imiona, a 30% - inne dane, to nie zostaną spełnione kryteria dotyczące wartości progowej i nie pojawią się żadne zalecenia.
Używając zaleceń opartych na wiedzy niestandardowej, można powiększyć systemową wiedzę Oracle Analytics. Wiedza niestandardowa umożliwia profilerowi semantyki Oracle Analytics identyfikować więcej biznesowych typów semantycznych i tworzyć bardziej odpowiednie, zarządzane zalecenia dotyczące wzbogacania danych. Na przykład można dodać odwołanie oparte na wiedzy niestandardowej, klasyfikujące lekarstwa z recepty do kategorii "Przeciwbólowe" lub "Opioidalne" w pliku USP (Unsupervised Semantic Parsing).
O wysłanie plików wiedzy niestandardowej do Oracle Analytics należy się zwrócić do swojego administratora. Gdy użytkownik wzbogaca zbiory danych, Oracle Analytics przedstawia zalecenia dotyczące wzbogacenia danych, oparte na tych danych semantycznych. Podczas tworzenia skoroszytów można również dodać do wizualizacji wzbogacenia wiedzy, używając panelu "Dane".
Tworzenie własnych plików wiedzy niestandardowej
Tworząc pliki semantyczne, należy postępować zgodnie z następującymi wytycznymi:
O wysłanie swojego pliku wiedzy niestandardowej do Oracle Analytics należy się zwrócić do swojego administratora.
Ten przykład ilustruje, w jaki sposób można dodać biznesowe ramy czasowe do danych sprzedaży i umożliwić analizę sprzedaży według roku obrotowego, jeśli pierwotny zbiór danych nie zawiera danych okresów obrotowych.