Informazioni sui flussi di dati

I flussi di dati consentono di organizzare e integrare i dati per generare data set accurati che possono essere visualizzati dagli utenti.

Usa i flussi di dati per manipolare visivamente i dati senza la necessità di competenze nella codifica manuale.

Ad esempio, è possibile utilizzare un flusso dati per:

  • creare un data set
  • combinare dati da origini diverse
  • aggregare dati
  • creare modelli di apprendimento automatico o applicare un modello di apprendimento automatico predittivo ai dati.
  • eseguire il rilevamento degli oggetti, la classificazione delle immagini o il rilevamento del testo utilizzando l'intelligenza artificiale tramite il servizio OCI Vision.

Per creare i flussi dati è possibile utilizzare il riquadro di progettazione dei flussi dati.
Segue la descrizione di GUID-2B831D4B-0478-4EAC-917D-EA910D9FFFE3-default.png
.png

Per creare un flusso dati, è necessario aggiungere i passi. Ogni passo esegue una funzione specifica, ad esempio l'aggiunta di dati, l'unione di tabelle e colonne, la trasformazione di dati. Utilizzare l'editor dei flussi di dati per aggiungere e configurare i passi desiderati. Ogni passo viene convalidato quando viene aggiunto o modificato. Dopo aver configurato il flusso dati, è possibile eseguirlo per creare o aggiornare un data set.

Durante le fasi di aggiunta di colonne personalizzate o di trasformazione dei dati, è possibile utilizzare una vasta gamma di operatori SQL (ad esempio, BETWEEN, LIKE, IN), espressioni condizionali (ad esempio, CASE) e funzioni (ad esempio, Media, Mediana, Percentile).

Aggiornamento dei data set generati dai flussi dati

È possibile eseguire di nuovo i flussi dati per mantenere aggiornati i data set.

Nota:

Quando si esegue di nuovo un flusso dati, tutte le trasformazioni applicate direttamente al data set di output al di fuori del flusso dati andranno perse. Il data set viene ricreato da zero.

Supporto del database per i flussi di dati

I flussi di dati consentono di esaminare i dati dei data set, delle aree argomenti o delle connessioni al database.

I flussi di dati possono essere eseguiti individualmente o in una sequenza. È possibile includere più origini dati in un flusso dati e specificarne la modalità di join.

Utilizzare il passo Aggiungi dati per aggiungere dati a un flusso dati e utilizzare il passo Salva dati per salvare i dati di output da un flusso dati.

È possibile salvare i dati di output generati da un flusso dati in un data set o in uno dei tipi di database supportati. Se il salvataggio viene eseguito in un database, è possibile trasformare l'origine dati sovrascrivendola con i dati del flusso dati. Le tabelle dell'origine dati e del flusso dati devono essere posizionate nello stesso database e avere lo stesso nome. Prima di iniziare, creare una connessione a uno dei tipi di database supportati.

Nota:

È possibile aggiungere dati da database remoti connessi con Data Gateway. Tuttavia, non è possibile salvare i dati in database remoti connessi con Data Gateway.

Output dati

È possibile salvare i dati di output dai flussi di dati nei seguenti tipi di database:
  • Oracle Autonomous Data Warehouse
  • Oracle Autonomous Transaction Processing
  • Oracle Database
  • Apache Hive
  • Hortonworks Hive
  • MapR Hive
  • Spark

Per informazioni sulla versione del database, vedere Origini dati supportate.

Input dati

È possibile immettere dati nei flussi di dati dalla maggior parte dei tipi di database (ad eccezione di Oracle Essbase ed EPM Cloud).