Informazioni sui flussi di dati

I flussi di dati consentono di organizzare e integrare i dati per generare data set accurati che possono essere visualizzati dagli utenti.

Usa i flussi di dati per manipolare visivamente i dati senza la necessità di competenze nella codifica manuale.

Ad esempio, è possibile utilizzare un flusso dati per:

  • creare un data set
  • combinare dati da origini diverse
  • aggregare dati
  • creare modelli di apprendimento automatico o applicare un modello di apprendimento automatico predittivo ai dati.
  • eseguire il rilevamento degli oggetti, la classificazione delle immagini o il rilevamento del testo utilizzando l'intelligenza artificiale tramite il servizio OCI Vision.

Per creare i flussi di dati è possibile utilizzare l'editor dei flussi di dati.
Editor dei flussi di dati

Per creare un flusso dati, è necessario aggiungere i passi. Ogni passo esegue una funzione specifica, ad esempio l'aggiunta di dati, l'unione di tabelle e colonne, la trasformazione e il salvataggio di dati. Utilizzare l'editor dei flussi di dati per aggiungere e configurare i passi desiderati. Ogni passo viene convalidato quando viene aggiunto o modificato. Dopo aver configurato il flusso dati, è possibile eseguirlo per generare o aggiornare un data set.

Durante le fasi di aggiunta di colonne personalizzate o di trasformazione dei dati, è possibile utilizzare una vasta gamma di operatori SQL (ad esempio, BETWEEN, LIKE, IN), espressioni condizionali (ad esempio, CASE) e funzioni (ad esempio, Media, Mediana, Percentile).

Supporto del database per i flussi di dati

I flussi di dati consentono di esaminare i dati dei data set, delle aree argomenti o delle connessioni al database.

I flussi di dati possono essere eseguiti individualmente o in una sequenza. È possibile includere più origini dati in un flusso dati e specificarne la modalità di join.

Utilizzare il passo Aggiungi dati per aggiungere dati a un flusso dati e utilizzare il passo Salva dati per salvare i dati di output da un flusso dati.

È possibile salvare i dati di output generati da un flusso dati in un data set o in uno dei tipi di database supportati. Se il salvataggio viene eseguito in un database, è possibile trasformare l'origine dati sovrascrivendola con i dati del flusso dati. Le tabelle dell'origine dati e del flusso dati devono essere posizionate nello stesso database e avere lo stesso nome. Prima di iniziare, creare una connessione a uno dei tipi di database supportati.

Nota:

È possibile aggiungere dati da database remoti connessi con Data Gateway. Tuttavia, non è possibile salvare i dati in database remoti connessi con Data Gateway.

Output dati

È possibile salvare i dati di output dai flussi di dati nei seguenti tipi di database:
  • Oracle Autonomous Data Warehouse
  • Oracle Autonomous Transaction Processing
  • Oracle Database
  • Apache Hive
  • Hortonworks Hive
  • MapR Hive
  • Spark

Per informazioni sulla versione del database, vedere Origini dati supportate.

Input dati

È possibile immettere dati nei flussi di dati dalla maggior parte dei tipi di database (ad eccezione di Oracle Essbase ed EPM Cloud).

Utilizzo dell'editor dei flussi di dati

Per preparare i dati per l'analisi è possibile creare flussi di dati nell'editor dei flussi di dati. Ad esempio, è possibile trasformare colonne, unire colonne o suddividere i dati in categorie in più bin. Di seguito viene descritto come usare l'editor dei flussi di dati per iniziare rapidamente a preparare i dati.

Utilizzo dell'editor dei flussi di dati

Nome Icona Descrizione
Dati

Icona del riquadro Dati

Visualizzare il riquadro Dati, in cui è possibile trascinare le colonne di dati nell'editor dei flussi di dati.

Passi flusso dati Icona del riquadro Passi flusso dati

Visualizzare il riquadro Passi, in cui è possibile trascinare i passaggi nell'editor dei flussi di dati.

Anteprima dati

Icona Anteprima dati

Nascondere o visualizzare il riquadro dell'anteprima delle colonne di dati facendo clic su Attiva/disattiva nell'angolo inferiore destro dell'editor dei flussi di dati. Questo riquadro viene aggiornato in modo automatico quando si apportano modifiche al flusso dati. Facendo clic su Applicazione automatica è possibile specificare se aggiornare automaticamente le modifiche apportate ai passi nel riquadro Anteprima dati.

Esegui flusso dati Esegui flusso dati Eseguire il flusso dati.
Mostra le funzioni disponibili/Nascondi funzioni

Icona Mostra le funzioni disponibili/Nascondi funzioni

Consente di visualizzare o nascondere la lista di selezione delle espressioni. Questa icona viene visualizzata solo per i passi che consentono di creare espressioni personalizzate, quale ad esempio il passo "Aggiungi colonne" o il passo "Trasforma colonna".

Editor passi

Icona dell'Editor passi

Nascondere o visualizzare l'editor passi facendo clic sull'icona Attiva/disattiva editor passi nell'angolo inferiore destro dell'editor dei flussi di dati.

Attiva/disattiva aggiornamento automatico Attiva/disattiva l'aggiornamento automatico per i dati nei flussi di dati Attivare l'aggiornamento dell'anteprima dei dati non appena si apportano modifiche al flusso dati. Ad esempio, se si dispone di un passo di trasformazione colonna che modifica il testo da minuscolo a maiuscolo, il testo maiuscolo viene visualizzato nell'anteprima dei dati. Se si disattiva, l'anteprima dei dati viene aggiornata solo se si fa clic su Aggiorna anteprima dati.