Při vytváření datové sady provede Oracle Analytics profilování na úrovni sloupců, aby se vytvořila sada sémantických doporučení k opravě či rozšíření dat. Při vytváření sešitů můžete do vizualizací zahrnout také rozšíření znalostí, a to jejich přidáním z panelu Data.
Poznámka:
Rozšíření znalostí jsou obvykle při výchozím nastavení aktivována, nicméně editory sešitů je mohou aktivovat nebo deaktivovat pro datové sady, které vlastní nebo pro které mají práva k úpravám. Služba Oracle Analytics pro obohacení datových sad generovaných z toku dat neposkytuje doporučení automaticky. V takovém případě musí pro datovou sadu její vlastník nebo správce nejprve aktivovat volbu obohacení znalostí. Viz část Aktivace obohacení znalostí pro datové sady.Tato doporučení jsou založena automatické detekci konkrétního sémantického typu systémem během kroku profilování. Například datové sady založené na místních cílových oblastech se profilují pomocí jednoduchého vzorku Prvních N.
Existují kategorie sémantických typů, jako jsou zeměpisná místa identifikovaná názvy měst, rozpoznatelné vzory jako u kreditních karet, e-mailových adres a čísel sociálního zabezpečení, kalendářní data a opakující se vzory. Můžete také vytvořit své vlastní sémantické typy.
Profilování se vztahuje na různé sémantické typy.
Kategorie sémantických typů jsou profilovány, aby umožnily identifikovat:
Doporučení pro opravy, vylepšení nebo obohacení datové sady jsou určována podle typu dat.
Příklady doporučení pro sémantické typy:
Sémantické typy jsou identifikovány na základě vzorů nalezených ve vašich datech.
Doporučení jsou poskytována pro tyto sémantické typy:
Rozeznávání sémantických typů vychází z načtených referenčních znalostí poskytnutých službou.
Doporučení založená na referencích jsou poskytována pro tyto sémantické typy:
Doporučená rozšíření jsou založena na sémantických typech.
Rozšíření jsou určována na základě hierarchie geografického umístění:
Proces profilování používá specifické prahové hodnoty k rozhodování o konkrétních sémantických typech.
Podle obecného pravidla musí 85 % datových hodnot ve sloupci splňovat kritéria pro jeden sémantický typ, aby systém mohl určit klasifikaci. V důsledku toho nebude sloupec, který obsahuje např. 70 % jmen a 30 % hodnot „ostatní“, splňovat požadavky na prahovou hodnotu a nebudou tedy provedena doporučení.
Použijte doporučení pro vlastní znalosti k rozšíření znalostí systému Oracle Analytics. Vlastní znalosti umožňují sémantickému profileru služby Oracle Analytics identifikovat více sémantických typů specifických pro danou firmu a vytvářet relevantnější a řízená doporučení pro rozšíření. Můžete například přidat referenci vlastních znalostí, která klasifikuje léky na předpis do kategorií léků USP Analgetika nebo Opiáty.
Požádejte správce, aby odeslal soubory vlastních znalostí do služby Oracle Analytics. Když rozšiřujete datové sady, služba Oracle Analytics nabídne doporučení pro rozšíření založená na těchto sémantických datech. Při vytváření sešitů můžete do vizualizací zahrnout také rozšíření znalostí, a to jejich přidáním z panelu Data.
Vytváření vlastních souborů s vlastními znalostmi
Při vytváření sémantických souborů postupujte podle těchto pokynů:
Požádejte správce, aby odeslal soubor vašich vlastních znalostí do služby Oracle Analytics.
Tento příklad ukazuje, jak lze do dat prodejů přidat časové rámce podniku a aktivovat analýzu prodeje podle zdaňovacího období, pokud původní datová sada neobsahuje fiskální data.