Le funzioni analitiche del database consentono di eseguire analisi avanzate e analisi di data mining, ad esempio il rilevamento di anomalie, la configurazione in cluster dei dati, il campionamento dei dati e l'analisi di affinità. Le funzioni analitiche sono disponibili quando ci si connette a un database Oracle o a Oracle Autonomous Data Warehouse.
Per visualizzare il passo Analitica del database nell'editor dei flussi di dati, è necessario connettersi a un database Oracle oppure a Oracle Autonomous Data Warehouse.
Tipi di funzione | Descrizione |
---|---|
Rilevamento anomalie dinamico |
Rileva eventuali anomalie nei dati di input senza un modello predefinito. Ad esempio, è possibile evidenziare transazioni finanziarie insolite. Quando si esegue questa funzione con data set di grandi dimensioni, configurare le colonne della partizione per ottimizzare le prestazioni. |
Configurazione cluster dinamica |
Consente di configurare in cluster i dati di input senza un modello predefinito. Ad esempio, è possibile contraddistinguere e reperire i segmenti dei clienti per scopi di marketing. Quando si esegue questa funzione con data set di grandi dimensioni, configurare le colonne della partizione per ottimizzare le prestazioni. |
Set di elementi frequente |
Consente di trovare le relazioni esistenti nei dati mediante l'identificazione dei set di elementi che appaiono spesso insieme. Questa tecnica di data mining è nota anche come apprendimento delle regole di associazione, analisi dell'affinità oppure, nel settore della vendita al dettaglio, come analisi del paniere. Se si utilizza un set di elementi frequente come strumento di analisi del paniere, si potrebbe constatare che i clienti che acquistano uno shampoo acquistano anche un balsamo per capelli. Questa operazione comporta un uso intenso delle risorse e le prestazioni ottenute dipendono da numerosi fattori, quali il volume del data set di input, la cardinalità dell'ID della transazione e la cardinalità della colonna Valore elemento. Per evitare il possibile peggioramento delle prestazioni nel database, provare un valore più alto della percentuale di supporto minimo (l'impostazione predefinita è 0,25) e ridurlo gradualmente per ottenere più itemset nell'output. |
Campionamento dei dati |
Seleziona una percentuale di campione casuale di dati da una tabella. È sufficiente specificare la percentuale di dati di cui si desidera effettuare il campionamento. Ad esempio, è possibile effettuare il campionamento in modo casuale del dieci percento dei dati. |
Tokenizzazione del testo |
Consente di analizzare i dati di testo mediante la suddivisione in parole distinte e il conteggio delle ricorrenze di ogni parola. Quando si esegue il flusso dati, Oracle Analytics crea nel database la tabella denominata DR$IndexName$I, che contiene il testo dei token e i dettagli relativi al conteggio dei token. Utilizzare la tabella DR$IndexName$I per creare un data set.
La connessione al database utilizzata per il flusso dati richiede privilegi di database speciali. Effettuare con l'amministratore le verifiche indicate di seguito.
|
Serie temporale |
Si tratta di una tecnica di data mining che prevede il valore di destinazione in base a una cronologia nota di valori di destinazione. L'input per l'analisi di serie temporali è una sequenza di valori di destinazione. Fornisce stime del valore di destinazione per ciascun periodo di una finestra temporale che può includere fino a 30 periodi oltre i dati cronologici. Il modello calcola anche varie statistiche che misurano la qualità dell'adattamento ai dati cronologici. Queste statistiche sono disponibili come data set di output aggiuntivo mediante un'impostazione di parametro. Nota: l'algoritmo Serie temporale è disponibile solo a partire dalla versione 18c del database Oracle. |
Annullamento del pivot dei dati |
Traspone i dati memorizzati in colonne in formato riga. Ad esempio, è possibile trasporre più colonne con un valore di metrica dei ricavi per ogni anno in una singola colonna dei ricavi con più righe di valori per la dimensione anno. È sufficiente selezionare le colonne della metrica da trasporre e specificare un nome per la nuova colonna. Si otterrà un nuovo data set con meno colonne e più righe. |
Nota: per utilizzare le funzioni analitiche, assicurarsi che l'amministratore le abbia abilitate (Console, Impostazioni di sistema, Prestazioni e compatibilità, Abilita nodo analitica del database in Flussi dati).