Wanneer u een gegevensset maakt, voert Oracle Analytics profielen op kolomniveau uit om een reeks semantische aanbevelingen te produceren om uw gegevens te repareren of te verrijken. Wanneer u werkmappen maakt, kunt u ook kennisverrijkingen opnemen in uw visualisaties door deze toe te voegen vanuit het deelvenster 'Gegevens'.
Deze aanbevelingen zijn gebaseerd op automatische detectie van een specifiek semantisch type tijdens de profielstap. Datasets gebaseerd op lokale onderwerpgebieden worden bijvoorbeeld geprofileerd met behulp van een eenvoudige Top N-monster.
Er zijn verschillende categorieën semantische soorten, zoals geografische locaties die door stedennamen worden aangegeven, herkenbare patronen zoals in creditcardnummers, e-mailadressen en burgerservicenummers, datums en terugkerende patronen. U kunt ook uw eigen aangepaste semantische typen maken.
Op diverse semantische typen wordt profilering toegepast.
Categorieën semantische typen worden geprofileerd voor het vaststellen van:
Aanbevelingen voor reparatie, verbetering of verrijking van de gegevensset worden gedaan op basis van het type gegevens.
Voorbeelden van aanbevelingen op basis van semantische typen:
Semantische typen worden geïdentificeerd op basis van patronen in uw gegevens.
Er worden aanbevelingen gedaan voor deze semantische typen:
Semantische typen worden herkend op basis van geladen referentie-informatie die bij de service wordt geleverd.
Voor de volgende semantische typen worden aanbevelingen op basis van referentie-informatie gedaan:
Aanbevolen verrijkingen zijn afhankelijk van de semantische typen.
Verrijkingen worden vastgesteld op basis van de hiërarchie van geografische locaties:
Bij het profileringsproces worden specifieke drempels gebruikt voor het nemen van beslissingen over specifieke semantische typen.
Een algemene regel is dat voor het bepalen van de classificatie 85% van de gegevenswaarden in de kolom aan de criteria voor één semantisch type moet voldoen. Een kolom die 70% voornamen en 30% 'overig' bevat, voldoet dus niet aan de drempelwaardevereisten. In dat geval worden er geen aanbevelingen gedaan.
Vergroot de kennis van het Oracle Analytics systeem met behulp van de aanbevelingen van aangepaste kennisbanken. Met behulp van aangepaste kennisbanken kan de semantische profiler van Oracle Analytics meer bedrijfsspecifieke semantische typen identificeren en relevantere, meer gerichte verrijkingsaanbevelingen doen. U kunt bijvoorbeeld een verwijzing van een aangepaste kennisbank toevoegen waarmee voorgeschreven medicatie wordt geclassificeerd in de USP-geneesmiddelcategorie 'Analgetica' of 'Opioïde'.