Quando si crea un data set, Oracle Analytics effettua il profiling a livello di colonna per generare un set di suggerimenti semantici finalizzato a riparare o arricchire i dati. Quando si creano cartelle di lavoro, è possibile includere gli arricchimenti Knowledge Base nelle visualizzazioni aggiungendole dal Pannello dati.
Tali suggerimenti si basano sul sistema di rilevamento automatico di un tipo di semantica specifica durante il passo di profilo. Ad esempio, per i data set basati su aree argomenti locali viene effettuato il profiling utilizzando un campione Primi N semplice.
Esistono categorie di tipi di semantica: aree geografiche identificate dai nomi di città, pattern riconoscibili come nelle carte di credito, indirizzi di posta elettronica e numeri di previdenza sociale, date e pattern ricorrenti. È inoltre possibile creare propri tipi di semantica personalizzati.
Ai vari tipi di semantica viene applicato il profiling.
Le categorie dei tipi di semantica vengono sottoposte a profiling per identificare:
I suggerimenti per correggere, migliorare o arricchire il data set dipendono dal tipo dei dati.
Esempi di suggerimenti per i tipi di semantica
I tipi di semantica vengono identificati in base ai pattern trovati nei dati.
Vengono forniti suggerimenti per i tipi di semantica seguenti:
Il riconoscimento dei tipi di semantica dipende dalla knowledge base di riferimento caricata fornita con il servizio.
Vengono forniti suggerimenti basati sui riferimenti per i tipi di semantica seguenti:
Gli arricchimenti consigliati si basano sui tipi di semantica.
Gli arricchimenti vengono determinati in base alla gerarchia delle posizioni geografiche:
Il processo di profiling utilizza soglie specifiche per le decisioni relative a determinati tipi di semantica.
Come regola generale, l'85% dei valori dei dati della colonna deve soddisfare i criteri per un solo tipo di semantica affinché il sistema possa determinare la classificazione. Una colonna che contiene il 70% di nomi e il 30% di informazioni di "altro" tipo, ad esempio, non soddisfa i requisiti di soglia, pertanto i suggerimenti non verrebbero generati.
Utilizzare i suggerimenti di Knowledge Base personalizzata per incrementare la Knowledge Base di sistema di Oracle Analytics. Una Knowledge Base personalizzata consente al profiler semantico di Oracle Analytics di identificare ulteriori tipi semantici relativi alle attività aziendali e di offrire suggerimenti di arricchimento più pertinenti e controllati. Ad esempio, è possibile aggiungere un riferimento a una Knowledge Base personalizzata che classifichi un medicinale vendibile su prescrizione nelle categorie della farmacopea statunitense (USP) Analgesici o Oppioide.