Creare e usare i modelli predittivi di Oracle Analytics

I modelli predittivi di Oracle Analytics utilizzano numerosi algoritmi di Oracle Machine Learning incorporati per estrarre i data set, prevedere un valore di destinazione o identificare classi di record. Usare l'editor dei flussi di dati per creare, addestrare e applicare i modelli predittivi ai dati.

Descrizione dei modelli predittivi di Oracle Analytics

Un modello predittivo di Oracle Analytics applica un algoritmo specifico a un data set per prevedere valori e classi o per identificare i gruppi nei dati.

È anche possibile utilizzare i modelli di Oracle Machine Learning per prevedere i dati.

Oracle Analytics include algoritmi che facilitano l'addestramento di modelli predittivi per vari scopi. Esempi di algoritmi sono le strutture ad albero di classificazione e regressione (CART), la regressione logistica e K-Means.

Dapprima si utilizza l'editor dei flussi di dati per addestrare un modello rispetto a un data set di addestramento. Dopo averlo addestrato, applicare il modello predittivo ai data set da prevedere.

È possibile rendere disponibile un modello addestrato per gli altri utenti, che potranno applicarlo ai propri dati per prevedere i valori. In alcuni casi, alcuni utenti addestrano i modelli e altri utenti applicano i modelli.

Nota:

Se non si è sicuri di cosa cercare nei dati, è possibile iniziare utilizzando Explain, che usa Machine Learning per identificare tendenze e pattern. Utilizzare quindi l'editor dei flussi di dati per creare e addestrare i modelli predittivi ed esaminare nei dettagli le tendenze e i pattern trovati da Explain.
Utilizzare l'editor dei flussi di dati per addestrare un modello attenendosi alla procedura riportata di seguito.
  • In primo luogo, creare un flusso dati e aggiungere il data set da utilizzare per addestrare il modello. Il data set di addestramento deve contenere i dati che si desidera prevedere (ad esempio, un valore quale vendite o età oppure una variabile quale un bucket di rischio di credito).
  • Se necessario, è possibile utilizzare l'editor dei flussi di dati per modificare il data set mediante l'aggiunta e la selezione di colonne, l'unione tramite join e così via.
  • Dopo aver verificato che i dati costituiscano effettivamente la base corretta pe l'addestramento del modello, aggiungere un passo di addestramento al flusso dati e scegliere un algoritmo di classificazione (binaria o multipla), regressione o configurazione cluster per addestrare un modello. Assegnare un nome al modello risultante, quindi salvare il flusso dati ed eseguirlo per creare e addestrare il modello.
  • Esaminare le proprietà degli oggetti Machine Learning per determinare la qualità del modello. Se necessario, è possibile ripetere il processo di addestramento finché il modello non avrà raggiunto la qualità desiderata.

Utilizzare il modello finito per valutare i dati sconosciuti o senza etichetta e generare un data set all'interno di un flusso dati o aggiungere una visualizzazione di previsione a una cartella di lavoro.

Esempio

Si supponga di voler creare e addestrare un modello di classificazione multipla per prevedere i pazienti che presentano un rischio di sviluppo delle malattie cardiache elevato.

  1. Fornire un data set di addestramento che contenga, per ogni singolo paziente, attributi quali l'età, il sesso e sintomi specifici, ad esempio dolori al petto, nonché metriche quale la pressione arteriosa, il livello di glicemia a digiuno, il colesterolo e la frequenza cardiaca massima. Il data set di addestramento deve inoltre contenere una colonna denominata "Probabilità" assegnata a uno dei valori seguenti: assente, poco probabile, probabile, molto probabile o presente.
  2. Scegliere l'algoritmo CART (Decision Tree) perché ignora le colonne ridondanti che non aggiungono alcun valore per la previsione, ma identifica e utilizza solo le colonne utili per prevedere l'obiettivo. Quando si aggiunge l'algoritmo al flusso dati, scegliere la colonna Probabilità per addestrare il modello. L'algoritmo utilizza Machine Learning per scegliere le colonne driver necessarie per l'esecuzione e restituire le previsioni e i data set correlati.
  3. Esaminare i risultati e perfezionare il modello di addestramento, quindi applicare il modello a un data set più ampio per prevedere i pazienti che hanno o possono sviluppare malattie cardiache con maggiore probabilità.

Come si sceglie l'algoritmo del modello predittivo?

In Oracle Analytics sono disponibili algoritmi per qualsiasi esigenza di modellazione con la funzionalità Machine Learning: previsione numerica, classificatore multiplo, classificatore binario e configurazione cluster.

La funzionalità Machine Learning Oracle è destinata agli analisti di dati esperti che hanno un'idea precisa di cosa cercare nei dati, conoscono i principi dell'analitica predittiva e capiscono le differenze tra i vari algoritmi.

Nota:

Se si utilizzano dati provenienti da Oracle Autonomous Data Warehouse, è possibile usare la funzionalità AutoML per creare con facilità e rapidità un modello predittivo, senza la necessità di competenze riguardanti l'apprendimento automatico. Vedere Creare un modello predittivo con AutoML in Autonomous Data Warehouse.

In genere gli utenti desiderano creare più modelli di previsione, confrontarli e scegliere quello che con maggiore probabilità darà risultati che soddisfano determinati criteri e requisiti. Questi criteri possono variare. Ad esempio, a volte gli utenti scelgono modelli con una migliore accuratezza globale, a volte modelli con il numero inferiore di errori di tipo I (falsi positivi) e tipo II (falsi negativi) e a volte modelli che restituiscono più velocemente i risultati e presentano un livello di accuratezza accettabile anche se i risultati non sono ideali.

In Oracle Analytics esistono più algoritmi di Machine Learning per ogni tipo di previsione o classificazione. Grazie a questi algoritmi, gli utenti possono creare più modelli, utilizzare parametri regolati diversi oppure utilizzare data set di addestramento di input differenti, quindi scegliere il modello migliore. L'utente può scegliere il modello migliore confrontando e valutando i modelli rispetto ai propri criteri. Per determinare il modello migliore, gli utenti possono applicare il modello e visualizzare i risultati dei calcoli per determinare l'accuratezza oppure aprire ed esplorare i data set correlati che Oracle Analytics ha utilizzato per l'output.

Consultare la tabella seguente per ottenere informazioni sugli algoritmi forniti.

Nome Tipo Categoria Funzione Descrizione
CART

Classificazione

Regressione

Classificatore binario

Classificatore multiplo

Numerica

- Utilizza gli alberi decisionali per prevedere i valori discreti e continui.

Da utilizzare con data set di grandi dimensioni.

Regressione lineare Elastic Net Regressione Numerica ElasticNet Modello di regressione avanzato. Fornisce informazioni aggiuntive (regolarizzazione) ed esegue la selezione delle variabili e le combinazioni lineari. Penalità dei metodi di regressione Lasso e Ridge.

Da utilizzare con un gran numero di attributi per evitare la collinearità (dove più attributi sono perfettamente correlati) e il sovradattamento.

Gerarchico Configurazione cluster Configurazione cluster AgglomerativeClustering Crea una gerarchia di configurazione cluster utilizzando il metodo bottom-up (ogni osservazione è un cluster e i cluster vengono uniti successivamente) o top-down (tutte le osservazioni iniziano come cluster unico) e le metriche delle distanze.

Da utilizzare quando il data set ha dimensioni limitate e non si conosce in anticipo il numero dei cluster.

K-Means Configurazione cluster Configurazione cluster K-Means Suddivide in modo iterativo i record in K cluster in cui ogni osservazione appartiene al cluster con la media più vicina.

Da utilizzare per la configurazione cluster delle colonne delle metriche e con una previsione impostata del numero di cluster necessari. Funziona bene con data set di grandi dimensioni. I risultati sono diversi a ogni esecuzione.

Regressione lineare Regressione Numerica Minimi quadrati ordinari

Ridge

Lasso

Approccio lineare per una relazione di modellazione tra la variabile di destinazione e altri attributi del data set.

Da utilizzare per prevedere i valori numerici quando gli attributi non sono perfettamente correlati.

Regressione logistica Regressione Classificatore binario LogisticRegressionCV Da utilizzare per prevedere il valore di una variabile dipendente da categorie. La variabile dipendente è una variabile binaria che contiene i dati codificati su 1 o 0.
Naive Bayes Classificazione

Classificatore binario

Classificatore multiplo

GaussianNB Classificazione probabilistica basata sul teorema di Bayes che presuppone l'assenza di dipendenze tra le funzioni.

Da utilizzare in presenza di un numero di dimensioni di input elevato.

Rete neurale Classificazione

Classificatore binario

Classificatore multiplo

MLPClassifier Algoritmo di classificazione iterativo che acquisisce informazioni mediante il confronto del risultato di classificazione con il valore effettivo e restituisce il risultato alla rete per la modifica in previsione di ulteriori iterazioni.

Da utilizzare per l'analisi di testo.

Foresta casuale Classificazione

Classificatore binario

Classificatore multiplo

Numerica

- Metodo di apprendimento Ensemble che costruisce più strutture ad albero decisionali e restituisce il valore che le rappresenta collettivamente tutte.

Da utilizzare per prevedere le variabili numeriche e di categoria.

SVM Classificazione

Classificatore binario

Classificatore multiplo

LinearSVC, SVC Classifica i record mappandoli nello spazio e costruendo iperpiani che possono essere utilizzati per la classificazione. I nuovi record (dati di punteggio) vengono mappati nello spazio e dovrebbero appartenere a una categoria basata sul lato dell'iperpiano in cui rientrano.

Creare un modello predittivo con AutoML in Oracle Autonomous Data Warehouse

Quando si utilizzano dati di Oracle Autonomous Data Warehouse, è possibile usare la funzionalità AutoML per consigliare e creare un modello predittivo. AutoML analizza i dati, calcola l'algoritmo migliore da usare e registra un modello di previsione in Oracle Analytics in modo da poter effettuare previsioni sui dati.

Usare la funzionalità AutoML significa che il modello di previsione viene creato in modo automatico da Oracle Autonomous Data Warehouse; sarà pertanto possibile distribuire il modello di previsione senza necessità di competenze nell'apprendimento automatico o nell'intelligenza artificiale. Il modello di previsione generato viene salvato nell'area Modelli della pagina Machine Learning. Per la previsione dei dati in base al nuovo modello, creare un flusso dati e usare il passo Applica modello.
Prima di iniziare effettuare le operazioni riportate di seguito.
  • Creare un data set basato sui dati in Oracle Autonomous Data Warehouse, sui quali si desidera effettuare previsioni. Ad esempio, dati sulla riduzione del personale, incluso un campo denominato ATTRITION con l'indicazione'Yes' o 'No' per la riduzione.
  • Assicurarsi che l'utente del database specificato nella connessione Oracle Analytics a Oracle Autonomous Data Warehouse disponga del ruolo OML_Developer e non sia un superutente 'admin'. In caso contrario, il flusso dati non funzionerà quando si tenta di salvarlo o eseguirlo.
  1. Nella Home page fare clic su Crea, quindi fare clic su Flusso dati.
  2. In Aggiungi data set selezionare il data set basato su Oracle Autonomous Data Warehouse che contiene i dati da analizzare.
  3. Fare clic su Aggiungi un passo, quindi fare clic su AutoML.
  4. Per Destinazione, fare clic su Selezionare una colonna e selezionare la colonna di dati contenente il valore che si sta tentando di prevedere.
    Ad esempio, per prevedere la riduzione del personale è possibile selezionare un campo denominato ATTRITION con l'indicazione 'TRUE' o 'FALSE' per indicare se i dipendenti hanno lasciato un'organizzazione o meno.

  5. Accettare il valore di Tipo di task e Metrica classifica modello consigliati da Oracle Analytics oppure selezionare un algoritmo diverso.
  6. Fare clic su Salva modello e specificare il nome del modello di previsione generato.
  7. Fare clic su Salva e specificare un nome per il flusso dati.
  8. Fare clic su Esegui per analizzare i dati e generare un modello predittivo.
  9. Nella home page fare clic su Naviga, fare clic su Machine Learning, quindi fare clic con il pulsante destro del mouse sul modello generato e selezionare Ispeziona.
È possibile individuare il modello generato da Oracle Analytics nella pagina Machine Learning della scheda Modelli. Ispezionare il modello per valutarne la qualità. Vedere Valutare la qualità di un modello predittivo. È inoltre possibile fare riferimento ai data set correlati che sono stati creati per i modelli generati da AutoML. Vedere Descrizione dei data set correlati di un modello predittivo.

Creare e addestrare un modello predittivo

Gli analisti di dati esperti creano e addestrano i modelli predittivi in modo da poterli utilizzare per distribuire gli algoritmi di Oracle Machine Learning al fine di estrarre i data set, prevedere un valore di destinazione o identificare classi di record. Usare l'editor dei flussi di dati per creare, addestrare e applicare i modelli predittivi ai dati.

Icona Esercitazione Sprint LiveLabs

La definizione di un modello accurato è un processo iterativo e un analista di dati esperto può provare modelli diversi, confrontarne i risultati e perfezionare i parametri in base alle prove e agli errori. Un analista di dati può utilizzare il modello predittivo accurato finalizzato per prevedere le tendenze in altri data set oppure aggiungere il modello alle cartelle di lavoro.

Nota:

Se si utilizzano dati provenienti da Oracle Autonomous Data Warehouse, è possibile usare la funzionalità AutoML per creare con facilità e rapidità un modello predittivo, senza la necessità di competenze riguardanti l'apprendimento automatico. Vedere Creare un modello predittivo con AutoML in Autonomous Data Warehouse.

In Oracle Analytics sono disponibili algoritmi per la previsione numerica, la classificazione multipla, la classificazione binaria e la configurazione cluster.

  1. Nella Home page fare clic su Crea, quindi selezionare Flusso dati.
  2. Selezionare il data set che si desidera utilizzare per addestrare il modello. Fare clic su Aggiungi.
  3. Nell'editor dei flussi di dati fare clic su Aggiungi passo (+).
    Dopo aver aggiunto un data set, è possibile utilizzare tutte le colonne del data set o selezionare solo le colonne pertinenti per generare il modello. La scelta delle colonne pertinenti richiede la comprensione del data set. Ignorare le colonne che si ritiene non influenzeranno il risultato o che contengono informazioni ripetitive. È possibile scegliere solo le colonne pertinenti aggiungendo il passo Seleziona colonne. Se non si è sicuri di quali siano le colonne pertinenti, utilizzare tutte le colonne.
  4. Selezionare uno dei passi di creazione del modello (ad esempio, Crea previsione numerica o Crea configurazione cluster).
  5. Selezionare un algoritmo e fare clic su OK.
  6. Se si utilizza un modello supervisionato, ad esempio di previsione o classificazione, fare clic su Destinazione e selezionare la colonna di cui si tenta di prevedere il contenuto. Ad esempio, se si sta creando un modello per prevedere il reddito di una persona, selezionare la colonna Reddito.
    Se si utilizza un modello non supervisionato, ad esempio di configurazione cluster, la colonna di destinazione non è necessaria.
  7. Modificare le impostazioni predefinite del modello per ottimizzare e migliorare l'accuratezza del risultato previsto. Queste impostazioni dipendono dal modello utilizzato.
  8. Fare clic sul passo Salva modello e fornire un nome e una descrizione.
  9. Fare clic su Salva, immettere il nome e la descrizione del flusso dati, quindi fare clic su OK per salvare il flusso dati.
  10. Fare clic su Esegui flusso dati per creare il modello predittivo in base al data set di input e alle impostazioni del modello forniti.

Passi del flusso dati per la creazione di modelli di apprendimento automatico

Oracle Analytics consente di creare modelli di apprendimento automatico mediante i passi dei flussi di dati. Dopo aver creato un modello di apprendimento automatico, applicarlo ai dati utilizzando il passo Applica modello.

Nome passo Descrizione
AutoML (richiede Oracle Autonomous Data Warehouse) Usare la funzionalità AutoML di Oracle Autonomous Data Warehouse per consigliare e creare un modello predittivo. Il passo AutoML analizza i dati, calcola l'algoritmo migliore da usare e registra un modello di previsione in Oracle Analytics.
Crea classificatore binario

Creare un modello Machine Learning per classificare i dati in una delle due categorie predefinite.

Crea configurazione cluster Creare un modello Machine Learning per separare i gruppi con caratteristiche simili e assegnarli in cluster.
Crea classificatore multiplo Creare un modello Machine Learning per classificare i dati in tre o più categorie predefinite.
Crea previsione numerica Creare un modello Machine Learning per prevedere un valore numerico in base a valori di dati noti.

Ispezionare un modello predittivo

Dopo aver creato il modello predittivo ed eseguito il flusso dati, è possibile esaminare le informazioni relative al modello per determinarne l'accuratezza. Utilizzare queste informazioni per regolare in modo iterativo le impostazioni del modello al fine di migliorarne l'accuratezza e prevedere risultati migliori.

Visualizzare i dettagli di un modello predittivo

Le informazioni dettagliate di un modello predittivo facilitano la comprensione del modello e consentono di determinare se è adatto per la previsione dei dati. I dettagli di un modello includono la classe, l'algoritmo, le colonne di input e le colonne di output.

  1. Nella Home page fare clic su Navigator, quindi fare clic su Machine Learning.
  2. Fare clic sull'icona del menu per un modello di addestramento e selezionare Ispeziona.
  3. Fare clic su Dettagli per visualizzare le informazioni del modello.

Valutare la qualità di un modello predittivo

Visualizzare le informazioni che consentono di comprendere la qualità di un modello predittivo. Ad esempio, è possibile rivedere le metriche di accuratezza quali accuratezza del modello, precisione, richiamo, valore F1, frequenza falsi positivi e così via.

In Oracle Analytics sono disponibili metriche simili che non dipendono dall'algoritmo utilizzato per creare il modello, pertanto il confronto tra modelli diversi risulta più agevole. Durante il processo di creazione del modello, il data set di input viene diviso in due parti per addestrare e sottoporre a test il modello in base al parametro Train Partition Percent. Il modello utilizza la parte test del data set per verificare l'accuratezza del modello creato.
In base ai risultati nella scheda Qualità potrebbe essere necessario adeguare i parametri del modello e addestrare di nuovo il modello.
  1. Nella Home page fare clic su Navigator, quindi fare clic su Machine Learning.
  2. Fare clic sull'icona del menu per un modello di addestramento e selezionare Ispeziona.
  3. Fare clic sulla scheda Qualità per rivedere le metriche di qualità del modello e valutare il modello. Ad esempio, rivedere il punteggio di Accuratezza modello.

Suggerimento: fare clic su Altro per rivedere i dettagli delle viste generate per il modello.

Descrizione dei data set correlati di un modello predittivo

Quando si esegue il flusso dati per creare il modello di addestramento del modello predittivo di Oracle Analytics, viene creato un set di data set correlati. È possibile aprire e creare cartelle di lavoro in questi data set per ottenere informazioni sull'accuratezza del modello.

A seconda dell'algoritmo scelto per il modello, i data set correlati contengono dettagli del modello quali le regole di previsione, le metriche di accuratezza, la matrice di confusione e gli elementi chiave per la previsione. È possibile utilizzare queste informazioni per ottimizzare il modello al fine di ottenere risultati migliori nonché utilizzare i data set correlati per confrontare i modelli e decidere quale modello è più accurato.

Ad esempio, è possibile aprire un data set Driver per individuare le colonne che più di altre influenzano negativamente o positivamente il modello. Dall'esame di queste colonne si evince che alcune colonne non vengono considerate come variabili del modello in quanto non costituiscono input realistici oppure presentano un livello di granularità troppo elevato per la previsione. L'editor dei flussi di dati è lo strumento da utilizzare per aprire il modello e, in base alle informazioni trovate, rimuovere le colonne irrilevanti o con livello di granularità troppo elevato e rigenerare il modello. Successivamente si controlla la scheda Qualità e risultati per verificare se l'accuratezza del modello è migliorata. Questo processo deve continuare finché non si sarà soddisfatti dell'accuratezza del modello e pronti a valutare un nuovo data set.

Algoritmi diversi generano data set correlati simili. I singoli parametri e i nomi delle colonne possono variare nel data set a seconda del tipo di algoritmo, ma la funzionalità del data set non cambia. Ad esempio, i nomi delle colonne in un data set Statistiche possono cambiare da Regressione lineare a Regressione logistica, ma il data set Statistiche contiene metriche di accuratezza del modello.

Data set correlati per i modelli AutoML

Quando si crea un modello predittivo con AutoML, Oracle Analytics crea data set aggiuntivi che contengono informazioni utili sul modello. Il numero di data set creati dipende dall'algoritmo del modello. Ad esempio, per i modelli Naive Bayes, Oracle Analytics crea un data set che fornisce informazioni sulle probabilità condizionali. Per un modello di albero decisionale, il data set fornisce informazioni sulle statistiche dell'albero decisionale. Quando si esamina un modello generato da AutoML utilizzando l'algoritmo GLM (Generalized Linear Model), è possibile vedere le voci precedute da GLM* per i data set specifici del modello che contengono informazioni sui metadati relativi al modello.
Segue la descrizione di GUID-1A190D76-82D5-4BEC-82C4-D881CFECA14D-default.png
.png

Data set correlati

Nota:

Oracle Analytics aggiunge il nome di output del flusso di dati al tipo di data set correlato. Ad esempio, per un modello CART se il nome dell'output del flusso dati è cart_model2, il nome del data set sarà cart_model2_CART.

CART

Oracle Analytics crea una tabella per il data set correlato a CART (Classification and Regression Tree) contenente colonne che rappresentano le condizioni e i criteri delle condizioni nella struttura ad albero decisionale, una previsione per ciascun gruppo e la confidenza di previsione. Utilizzare la visualizzazione diagramma ad albero per visualizzare questa struttura ad albero decisionale.

Il data set CART viene creato quando si selezionano le combinazioni di modello e algoritmo riportate di seguito.

Modello Algoritmo
Numerico CART per Previsione numerica
Classificazione binaria CART
Classificazione multipla CART

Report classificazione

Oracle Analytics crea una tabella per il data set correlato Report classificazione. Ad esempio, se la colonna di destinazione può avere due valori distinti Sì e No, questo data set mostra metriche di accuratezza quali F1, Precisione, Richiamo e Supporto (il numero di righe del data set di addestramento con questo valore) per ogni valore distinto della colonna di destinazione.

Il data set Classificazione viene creato quando si selezionano le combinazioni di modello e algoritmo riportate di seguito.

Modello Algoritmi
Classificazione binaria

Naive Bayes

Rete neurale

Support Vector Machine

Classificazione multipla

Naive Bayes

Rete neurale

Support Vector Machine

Matrice di confusione

Oracle Analytics crea una tabella pivot per il data set correlato Matrice di confusione, denominato anche matrice di errore. Ogni riga rappresenta un'istanza di una classe prevista e ogni colonna rappresenta un'istanza di una classe effettiva. La tabella indica il numero di falsi positivi, falsi negativi, veri positivi e veri negativi utilizzati per calcolare le metriche di accuratezza Precisione, Richiamo e F1.

Il data set Matrice di confusione viene creato quando si selezionano le combinazioni di modello e algoritmo riportate di seguito.

Modello Algoritmi
Classificazione binaria

Regressione logistica

CART (Decision Tree)

Naive Bayes

Rete neurale

Foresta casuale

Support Vector Machine

Classificazione multipla

CART (Decision Tree)

Naive Bayes

Rete neurale

Foresta casuale

Support Vector Machine

Driver

Oracle Analytics crea una tabella per il data set correlato Elementi contenente informazioni sulle colonne che determinano i valori della colonna di destinazione. Per identificare queste colonne vengono utilizzate regressioni lineari. A ogni colonna vengono assegnati i valori di coefficiente e correlazione. Il valore di coefficiente descrive la ponderazione della colonna utilizzata per determinare il valore della colonna di destinazione. Il valore di correlazione indica la direzione della relazione tra la colonna di destinazione e una colonna dipendente. Ad esempio, indica se il valore della colonna di destinazione aumenta o diminuisce in base alla colonna dipendente.

Il data set Elementi viene creato quando si selezionano le combinazioni di modello e algoritmo riportate di seguito.

Modello Algoritmi
Numerico

Regressione lineare

Regressione lineare Elastic Net

Classificazione binaria

Regressione logistica

Support Vector Machine

Classificazione multipla Support Vector Machine

Hitmap

Oracle Analytics crea una tabella per il data set correlato Hitmap contenente informazioni sui nodi foglia della struttura ad albero decisionale. Ogni riga della tabella rappresenta un nodo foglia e contiene informazioni che descrivono cosa rappresenta il nodo foglia, ad esempio la dimensione segmento, la confidenza e il numero di righe previsto. Ad esempio, il numero previsto di previsioni corrette è dato da questa formula: dimensione segmento * confidenza.

Il data set Hipmap viene creato quando si selezionano le combinazioni di modello e algoritmo riportate di seguito.

Modello Algoritmo
Numerico CART per Previsione numerica

Residui

Oracle Analytics crea una tabella per il data set correlato Residui contenente informazioni sulla qualità delle previsioni residue. Per residuo si intende la differenza tra il valore misurato e il valore previsto di un modello di regressione. Questo data set contiene un valore somma aggregato della differenza assoluta tra i valori effettivi e previsti per tutte le colonne del data set.

Il data set Residui viene creato quando si selezionano le combinazioni di modello e algoritmo riportate di seguito.

Modello Algoritmi
Valori numerici

Regressione lineare

Regressione lineare Elastic Net

CART per Previsione numerica

Classificazione binaria CART (Decision Tree)
Classificazione multipla CART (Decision Tree)

Statistiche

Oracle Analytics crea una tabella per il data set correlato Statistiche. Le metriche di questo data set dipendono dall'algoritmo utilizzato per generarle. Di seguito è riportata la lista delle metriche basate sugli algoritmi.

  • Regressione lineare, CART per previsione numerica, Regressione lineare Elastic Net: questi algoritmi contengono R-Square, R-Square Adjusted, Mean Absolute Error (MAE), Mean Squared Error (MSE), Relative Absolute Error (RAE), Related Squared Error (RSE), Root Mean Squared Error (RMSE).
  • CART (alberi di classificazione e regressione), Classificazione Naive Bayes, Rete neurale, Support Vector Machine (SVM), Foresta casuale, Regressione logistica: questi algoritmi contengono Accuracy, Total F1.

Questo data set viene creato quando si selezionano le combinazioni di modello e algoritmo riportate di seguito.

Modello Algoritmo
Numerico

Regressione lineare

Regressione lineare Elastic Net

CART per Previsione numerica

Classificazione binaria

Regressione logistica

CART (Decision Tree)

Naive Bayes

Rete neurale

Foresta casuale

Support Vector Machine

Classificazione multipla

Naive Bayes

Rete neurale

Foresta casuale

Support Vector Machine

Riepilogo

Oracle Analytics crea una tabella per il data set correlato Riepilogo contenente informazioni quali il nome della destinazione e il nome del modello.

Il data set Riepilogo viene creato quando si selezionano le combinazioni di modello e algoritmo riportate di seguito.

Modello Algoritmi
Classificazione binaria

Naive Bayes

Rete neurale

Support Vector Machine

Classificazione multipla

Naive Bayes

Rete neurale

Support Vector Machine

Trovare i data set correlati di un modello predittivo

I data set correlati vengono generati quando si addestra un modello predittivo.

A seconda dell'algoritmo, i data set correlati contengono dettagli relativi al modello, ad esempio le regole di previsione, le metriche di accuratezza, la matrice di confusione, gli elementi chiave per la previsione e così via. Questi parametri facilitano la comprensione delle regole utilizzate dal modello per determinare le previsioni e le classificazioni.
  1. Nella Home page fare clic su Navigator, quindi fare clic su Machine Learning.
  2. Fare clic sull'icona del menu per un modello di addestramento e selezionare Ispeziona.
  3. Fare clic sulla scheda Correlato per accedere ai data set correlati del modello.
  4. Fare doppio clic su un data set correlato per visualizzarlo o utilizzarlo in una cartella di lavoro.

Aggiungere un modello predittivo a una cartella di lavoro

Quando si crea uno scenario in una cartella di lavoro, si applica un modello predittivo al data set della cartella di lavoro per rivelare le tendenze e i pattern per il reperimento dei quali il modello è stato progettato.

Nota:

Non è possibile applicare un modello di Oracle Machine Learning ai dati di una cartella di lavoro.
Dopo l'aggiunta del modello alla cartella di lavoro e il mapping degli input del modello alle colonne del data set, il Pannello dati contiene gli oggetti del modello, che possono essere trascinati sullo sfondo. Machine Learning genera i valori del modello in base alle colonne dati corrispondenti della visualizzazione.
  1. Nella Home page fare clic su Crea, quindi fare clic su Cartella di lavoro.
  2. Selezionare il data set che si desidera utilizzare per creare la cartella di lavoro e fare clic su Aggiungi a cartella di lavoro.
  3. Nel riquadro Dati fare clic su Aggiungi e selezionare Crea scenario.
  4. Selezionare un modello nella finestra di dialogo Crea scenario - Seleziona modello e fare clic su OK.
    È possibile applicare solo un modello predittivo. Non è possibile applicare un modello di Oracle Machine Learning.
    Se non è possibile abbinare ogni input del modello a un elemento dati, viene visualizzata la finestra di dialogo Mappa dati al modello.
  5. Se la finestra di dialogo Mappa dati al modello viene visualizzata, selezionare il data set da utilizzare con il modello nel campo Data set.
  6. Definire opportunamente le corrispondenze dell'input del modello con gli elementi dati. Fare clic su Fine.
    Lo scenario viene visualizzato come data set nel riquadro Elementi dati.
  7. Trascinare gli elementi dal data set e dal modello rilasciandoli sullo sfondo Visualizza.
  8. Per perfezionare lo scenario, fare clic con il pulsante destro del mouse nel riquadro Elementi dati e selezionare Modifica scenario.
  9. Modificare il data set e aggiornare opportunamente il mapping tra l'input del modello e gli elementi dati.
  10. Fare clic su Salva per salvare la cartella di lavoro.