Informazioni sui flussi di dati

I flussi di dati consentono di organizzare e integrare i dati per generare data set accurati che possono essere visualizzati dagli utenti.

Usa i flussi di dati per manipolare visivamente i dati senza la necessità di competenze nella codifica manuale.

Ad esempio, è possibile utilizzare un flusso di dati per:

  • creare un data set
  • combinare dati da origini diverse
  • aggregare dati
  • creare modelli di apprendimento automatico o applicare un modello di apprendimento automatico predittivo ai dati.
  • eseguire il rilevamento degli oggetti, la classificazione delle immagini o il rilevamento del testo utilizzando l'intelligenza artificiale tramite il servizio OCI Vision.

Per creare i flussi di dati è possibile utilizzare l'editor dei flussi di dati.
Editor dei flussi di dati

Per creare un flusso di dati, è necessario aggiungere i passi. Ogni passo esegue una funzione specifica, ad esempio l'aggiunta di dati, l'unione di tabelle e colonne, la trasformazione e il salvataggio di dati. Utilizzare l'editor dei flussi di dati per aggiungere e configurare i passi desiderati. Ogni passo viene convalidato quando viene aggiunto o modificato. Dopo aver configurato il flusso di dati, è possibile eseguirlo per generare o aggiornare un data set.

Durante le fasi di aggiunta di colonne personalizzate o di trasformazione dei dati, è possibile utilizzare una vasta gamma di operatori SQL (ad esempio, BETWEEN, LIKE, IN), espressioni condizionali (ad esempio, CASE) e funzioni (ad esempio, Media, Mediana, Percentile).

Supporto del database per i flussi di dati

I flussi di dati consentono di esaminare i dati dei data set, delle aree argomenti o delle connessioni al database.

Utilizzare il passo Aggiungi dati per aggiungere dati a un flusso di dati e utilizzare il passo Salva dati per salvare i dati di output da un flusso di dati.

È possibile salvare i dati di output generati da un flusso di dati in un data set o in uno dei tipi di database supportati. Se il salvataggio viene eseguito in un database, è possibile trasformare l'origine dati sovrascrivendola con i dati del flusso di dati. Le tabelle dell'origine dati e del flusso di dati devono essere posizionate nello stesso database e avere lo stesso nome. Prima di iniziare, creare una connessione a uno dei tipi di database supportati.

Output dati

È possibile salvare i dati di output dai flussi di dati nei seguenti tipi di database:
  • Oracle Autonomous Data Warehouse
  • Oracle Autonomous Transaction Processing
  • Oracle Database
  • Apache Hive
  • Hortonworks Hive
  • MapR Hive
  • Spark

Input dati

È possibile immettere dati nei flussi di dati dalla maggior parte dei tipi di database (ad eccezione di Oracle Essbase ed EPM Cloud).