Usa modelli di Machine Learning (ML)

Data Transforms supporta l'uso del modello ML in un flusso di dati. Scopri come creare e utilizzare modelli di Machine Learning (ML) nei flussi di dati.

Argomenti

Creare un'entità dati modello ML nell'editor di Data Flow

Per utilizzare i modelli ML nelle trasformazioni dati, è necessario creare due flussi di dati. È innanzitutto necessario creare l'entità dati del modello ML utilizzando l'editor Data Flow, quindi è possibile utilizzare l'entità dati in un flusso di dati per estrarre i dati da una connessione di origine e caricarli in un server di destinazione.

Per creare un'entità dati modello ML nell'editor Data Flow,

  1. Trascinare l'entità dati su cui si desidera creare il modello ML sullo sfondo della progettazione.
  2. Selezionare il componente e fare clic sull'icona Aggiungi entità dati Icona Aggiungi entità dati presente nell'angolo in alto a destra del componente di destinazione.
  3. Viene visualizzata la pagina Aggiungi entità dati che consente di configurare i dettagli del componente di destinazione riportati di seguito.

    Scheda Generale

    • Nella casella di testo Nome immettere il nome dell'entità dati appena creata.
    • Nell'elenco a discesa Tipo di entità selezionare Modello ML come tipo di entità dati.
      Quando si seleziona questo tipo di entità, l'interfaccia utente cambia come indicato di seguito.
      • L'elenco a discesa Connessione elenca solo le connessioni Oracle create dall'utente.
      • La procedura guidata Aggiungi entità dati visualizza la scheda Proprietà, in cui è possibile selezionare il tipo di apprendimento, la funzione, l'algoritmo e configurare i parametri per definire il modello ML. Per ulteriori informazioni, vedere Proprietà entità dati modello ML.
    • Nell'elenco a discesa Tipo di connessione selezionare la connessione richiesta da cui si desidera aggiungere l'entità dati appena creata. Per le entità dati del modello ML, l'elenco a discesa Tipo di connessione elenca solo Oracle come opzione.
    • L'elenco a discesa Connessione viene popolato con le connessioni create con il tipo di connessione associato. Nell'elenco a discesa Connessione selezionare il nome del server in cui si desidera conservare l'entità dati del modello ML.
    • Nell'elenco a discesa Schema, tutti gli schemi corrispondenti alla connessione selezionata vengono elencati in due gruppi.
      • Nuovo schema di database (quelli da cui non è stata eseguita l'importazione) e
      • Schema di database esistente (quelle importate in precedenza e che potenzialmente stanno sostituendo le entità dati).
      Selezionare lo schema desiderato dall'elenco a discesa Schema.
    • Nella casella di testo Tag, immettere un tag a scelta. È possibile utilizzare le tag per filtrare le entità dati visualizzate nella pagina Entità dati.
    • Se si desidera contrassegnare questa entità dati come gruppo di funzioni, espandere Opzioni avanzate e fare clic sulla casella di controllo Tratta come gruppo di funzioni.
    • Fare clic su Avanti.

    Scheda Proprietà

    • Selezionare il tipo di apprendimento, la funzione e l'algoritmo che si desidera utilizzare per creare questa entità dati. Per ulteriori informazioni sulle opzioni, vedere Proprietà entità dati modello ML.
    • In base alle opzioni selezionate, la sezione Parametri viene popolata con l'elenco dei parametri contrassegnati come "Importanza" e "Alto". È possibile aggiungere altri parametri obbligatori utilizzando l'icona Icona Aggiungi parametri.

      È necessario specificare un valore per ciascun parametro in modo che il flusso dati possa essere eseguito correttamente.

    Scheda Colonne

    • Fare clic sull'icona Aggiungi colonne Icona Aggiungi colonne per aggiungere nuove colonne all'entità dati appena creata.

      Viene aggiunta una nuova colonna alla tabella visualizzata.

    • Le colonne presenti nella tabella sono riportate di seguito.
      • Nome
      • Tipo di dati: fare clic sulla cella per configurare il tipo di dati richiesto.
      • Ridimensiona
      • Length
      • Azioni: fare clic sull'icona a forma di croce per eliminare la colonna creata.
    • Per eliminare le colonne in blocco, selezionare le colonne e fare clic sull'icona Elimina Icona Elimina.
    • Per cercare i dettagli della colonna richiesti, nella casella di testo Cerca immettere il nome della colonna richiesto e fare clic su Invio. Vengono visualizzati i dettagli della colonna obbligatoria.
    • Fare clic su Avanti.

    Scheda Anteprima entità dati

    Viene visualizzata un'anteprima di tutte le colonne create e dei relativi dettagli configurati. Se l'entità dati appartiene a un database Oracle, è anche possibile visualizzare le statistiche della tabella. Per ulteriori informazioni, vedere Visualizza statistiche delle entità dati.

  4. Fare clic su Salva per salvare la configurazione e uscire dalla procedura guidata.
  5. Salvare ed eseguire il flusso dati.

    Viene creata la nuova entità dati. Viene visualizzata nella pagina Entità dati.

Proprietà entità dati modello ML

La scheda Proprietà della procedura guidata Aggiungi entità dati fornisce opzioni di data mining che è possibile utilizzare per definire l'entità dati del modello ML.

Questo argomento presuppone una conoscenza preliminare dei concetti di Oracle Machine Learning, come le funzioni e gli algoritmi di data mining. Per ulteriori informazioni, vedere Oracle Machine Learning for SQL API Guide.

Tipo di apprendimento Funzione Algoritmo
Con supervisione Classificazione DL (Decision Tree)
Analisi semantica esplicita
Modelli lineari generalizzati
Naive Bayes
Foresta casuale
Rete neurale
Support Vector Machines
Regressione Modelli lineari generalizzati
Rete neurale
Support Vector Machines
Serie temporale Livellamento esponenziale
Importanza attributi MDL (Minimum Description Length)
Ispettivo Associazione A priori
Importanza attributi Decomposizione matrice CUR
Rilevamento anomalie Macchine vettoriali di supporto di una classe
Configurazione cluster Massimizzazione prevista
k-medie
Clustering partizionamento ortogonale
Estrazione funzioni Analisi semantica esplicita
NMF (Non-Negative Matrix Factorization)
Scomposizione valore singolo

Usa modello ML in un flusso di dati

È possibile utilizzare la funzione di database Modello di previsione per eseguire algoritmi modello ML sui dati di origine e caricare l'output in un database di destinazione.

Prima di utilizzare un modello ML in un flusso di dati, è necessario creare il modello ML. Per istruzioni su come creare un modello ML, vedere Creare un'entità dati modello ML nell'editor di Data Flow.

Per utilizzare un modello ML in un flusso di dati:

  1. Seguire le istruzioni riportate in Crea un flusso dati per creare un nuovo flusso dati.
  2. Nell'Editor flussi di dati trascinare le tabelle che si desidera utilizzare come origine nel flusso di dati e rilasciarle sullo sfondo della progettazione.
  3. Nella barra degli strumenti Funzioni database, fare clic su Machine Learning e trascinare il componente di trasformazione Modello di previsione sullo sfondo della progettazione.
  4. Fare clic sul componente di trasformazione Modello di previsione per visualizzarne le proprietà.
  5. Nella scheda Generale, specificare quanto segue:
    • Connessione: nell'elenco a discesa sono elencate tutte le connessioni Oracle disponibili. Selezionare la connessione Oracle che si desidera utilizzare.
    • Schema: selezionare lo schema desiderato.
    • Modello ML: nell'elenco a discesa sono elencati tutti i modelli ML disponibili. Per istruzioni su come creare un modello ML, vedere Crea un'entità dati modello ML nell'editor Data Flow.
  6. Nella scheda Mapping colonne mappare la colonna di origine che si desidera incorporare all'attributo INPUT dell'operatore. L'unica colonna disponibile nei mapping delle colonne è prediction parameters. Trascinare una colonna di testo dalle colonne disponibili nella colonna Espressione.
  7. Trascinare la tabella che si desidera utilizzare come destinazione nel flusso di dati e rilasciarla sullo sfondo della progettazione.
  8. Salvare ed eseguire il flusso dati.

    Le trasformazioni dati eseguiranno il modello di previsione sui dati di origine e scriveranno l'output nella tabella di destinazione.