Utilizzare le entità dati

Un'entità dati è una rappresentazione in formato tabulare di una struttura dati.

Include tabelle o viste di database che possono essere utilizzate in un mapping come origine o destinazione. Sono semplicemente i metadati per le origini e le destinazioni. Vengono utilizzati per creare i flussi di dati.

È possibile aggiungere entità dati al progetto appena creato in uno dei due modi riportati di seguito.

Tutte le entità dati appena create o importate insieme ai relativi dettagli vengono visualizzate nella pagina Entità dati. I dettagli includono:

  • Nome dell'entità dati
  • Connessione per la quale è stata creata l'entità dati
  • Schema a cui è associata l'entità dati
  • Fare clic sull'icona Azioni (icona Azioni) accanto all'entità dati selezionata per eseguire le operazioni riportate di seguito.
    • Selezionare Modifica per modificare i dettagli esistenti.
    • Selezionare Anteprima per visualizzare l'anteprima dell'entità dati selezionata. Se l'entità dati appartiene a un database Oracle, è possibile visualizzare anche le statistiche della tabella. Per ulteriori dettagli, vedere Visualizza statistiche delle entità dati.
    • Selezionare Elimina per eliminare l'entità dati selezionata.
  • Per eliminare le entità dati in blocco, nella pagina Entità dati selezionare le caselle di controllo delle rispettive entità dati e fare clic su Elimina.
  • È inoltre possibile cercare l'entità dati necessaria per conoscerne i dettagli in base ai seguenti filtri:
    • Nome dell'entità dati
    • Connessione per la quale è stata creata l'entità dati
    • Schema a cui è associata l'entità dati
    • Tag associato all'entità dati

Argomenti

Importa entità dati

Il modo più semplice e comune per creare un'entità dati consiste nell'importare la struttura dal tipo di connessione (ad esempio, il database Oracle).

Per importare le entità dati esistenti:

  1. Nel riquadro sinistro della home page, fare clic sulla scheda Entità dati.

    Viene visualizzata la pagina Entità dati.

  2. Fare clic su Importa entità dati per importare le entità dati esistenti.

    Diapositive della pagina Importa entità dati.

  3. Selezionare la Connessione seguita da Schema, quindi selezionare infine il Tipo di oggetti da importare.

    Per le connessioni allo storage degli oggetti Oracle, l'elenco a discesa Schema elenca il nome del bucket specificato nell'URL al momento della creazione della connessione.

  4. [Solo per connessioni BICC (Oracle Business Intelligence Cloud Connector)] In Offerte da importare per la raccolta, scegliere le offerte di cui si desidera importare i data store. Selezionare almeno un'offerta per importare gli oggetti vista pubblici BICC (PVO).
    Nota

    L'importazione degli oggetti PVO BICC può richiedere molto tempo a seconda del numero di oggetti selezionati. Per migliorare le prestazioni, Oracle consiglia di utilizzare una maschera per filtrare e limitare il numero di PVO che si desidera importare.
  5. Scegliere un maschera/filtro se non si desidera importare tutti gli oggetti nello schema.

    A seconda del tipo di connessione, verranno visualizzate ulteriori opzioni per l'importazione.

    Nota

    Per le connessioni allo storage degli oggetti Oracle, questo valore fa distinzione tra maiuscole e minuscole. Se l'opzione Batch di file simili è impostata su True, tutti i file che corrispondono alla maschera e hanno la stessa struttura vengono raggruppati in una singola entità dati.
  6. [Solo per connessioni Oracle Financials Cloud] Dall'elenco nella sezione Risorse, selezionare gli elementi da importare. Al termine del processo di importazione, viene creata una tabella per ogni risorsa selezionata.
  7. [Solo per le connessioni al server REST] Nella sezione Risorse, effettuare le operazioni riportate di seguito.
    • Nel campo URI risorsa, immettere l'URL del servizio REST da cui si desidera importare le risorse.
    • Fare clic sull'icona +.
    • Nella colonna Nome immettere un identificativo per la risorsa.
    • Nella colonna URI operazione immettere l'URI della risorsa.
    • Fare clic su Test della risorsa per verificare se le voci sono valide.
  8. Fare clic su Avvia.

    Viene creato un job e viene visualizzato l'ID job corrispondente per tenere traccia della sessione. Fare clic sull'ID job per visualizzare i dettagli del job.

    Al completamento dell'esecuzione del job, vengono importate tutte le entità dati selezionate. Fare clic sull'icona Aggiorna Icona Aggiorna presente nell'angolo destro della pagina Entità dati per visualizzare le nuove entità dati importate.

Crea entità dati

È possibile creare o aggiornare manualmente le entità dati tramite l'interfaccia Oracle Data Transforms.

Le entità dati devono disporre degli oggetti corrispondenti nella connessione di origine da utilizzare come origine in un flusso di dati. Di solito il processo di importazione fa in modo che questi oggetti siano in coordinamento. Tuttavia, ogni volta che si creano o si aggiornano manualmente le entità dati, assicurarsi sempre di verificare se entrambe le definizioni sono in coordinamento tra loro.

Quando si utilizza un'entità dati come destinazione, questa non deve esistere in precedenza nella connessione di destinazione e può essere creata nell'ambito dell'esecuzione del flusso di dati.

Per creare una nuova entità dati:
  1. Nel riquadro sinistro della home page, fare clic sulla scheda Entità dati.

    Viene visualizzata la pagina Entità dati.

  2. Fare clic su Crea entità dati per creare una nuova entità dati.

    Viene visualizzata la pagina Crea entità dati.

  3. Nella casella di testo Nome immettere il nome della nuova entità dati che si sta creando.
  4. Nell'elenco a discesa Connessione selezionare la connessione richiesta dalla quale si desidera aggiungere l'entità dati appena creata.
    Nota

    Le connessioni a Oracle Financials Cloud non sono elencate qui perché non è possibile creare manualmente entità dati per tali connessioni. È possibile importare le entità dati dagli endpoint REST di Oracle Financials Cloud solo utilizzando la pagina Importa entità dati. Vedere Importa entità dati.
  5. Nell'elenco a discesa Schema, tutti gli schemi corrispondenti alla connessione selezionata sono elencati in due gruppi.
    • Nuovo schema di database (quello da cui non è stata eseguita l'importazione) e
    • Schema di database esistente (quelli da cui è stata eseguita l'importazione in precedenza e che potrebbero sostituire le entità dati).

    Nell'elenco a discesa Schema selezionare lo schema richiesto.

    Nota

    Per le connessioni allo storage degli oggetti Oracle, l'elenco a discesa Schema elenca il nome del bucket specificato nell'URL al momento della creazione della connessione.
  6. Nell'elenco a discesa Tipo, selezionare il tipo di entità dati.
    • Tabella: per definire la struttura della tabella per l'entità dati appena creata, fare clic sull'icona + per aggiungere le colonne. Per ogni colonna è possibile specificare parametri quali Nome, Tipo di dati, Lunghezza, Scale, Non nullo. Fare doppio clic sulla cella per configurare il valore.

      Fare clic sull'icona 'x' per eliminare una riga. Fare clic sulle frecce Su e Giù per ordinare le righe della tabella.

    • Vista in linea: per creare l'entità dati utilizzando il codice in linea, immettere l'istruzione Select nella scheda Query. Ad esempio, SELECT * FROM CUSTOMER. Fare clic su Convalida.

      Nella scheda Colonne viene visualizzata una lista di sola lettura delle colonne restituite dalla query. Fare clic sulla scheda Anteprima per visualizzare i dati delle colonne.

  7. Nella casella di testo Tag, immettere un tag a scelta. È possibile utilizzare le tag per filtrare le entità dati visualizzate nella pagina Entità dati.
  8. Per le connessioni allo storage degli oggetti Oracle, questa pagina visualizza le opzioni riportate di seguito.
    • Sommario: selezionare il file CSV contenente i dati da importare. I metadati visualizzati nella tabella di anteprima, ad esempio il tipo di dati e la lunghezza delle colonne, si basano sulla prima riga del file CSV. Assicurarsi che il file CSV abbia una riga di intestazione. L'intestazione deve contenere solo caratteri alfanumerici e nessun carattere speciale.
    • File di gruppo: selezionare questa casella di controllo se si desidera raggruppare i dati di più file CSV in un'unica entità dati. Ad esempio, si supponga di voler unire i dati da Employee_Data1.csv, Employee_Data2.csv e Employee_Data3.csv in una singola entità dati.

      Se si desidera caricare i file CSV utilizzando Windows, assicurarsi di convertire prima i file in formato Unix per evitare problemi di codifica dei caratteri durante il raggruppamento.

    • Nome risorsa: utilizzare questa opzione insieme a File di gruppo. Immettere il valore che si desidera utilizzare per identificare i file. Il nome della risorsa deve essere un'espressione regolare. Nel nome della risorsa è possibile utilizzare solo un asterisco (*). Ad esempio, Employee_Data*.csv.
  9. Per le connessioni al database Oracle, è possibile contrassegnare le entità dati come gruppo di funzioni. Espandere Opzioni avanzate e fare clic sulla casella di controllo Tratta come gruppo di funzioni.
  10. Fare clic su Salva.

    La nuova entità dati viene creata.

Crea entità dati nell'editor dei flussi di dati

Se l'entità dati di destinazione è già stata creata o importata, trascinare l'entità dati nell'area di creazione e completare i mapping e le opzioni delle colonne.

Per creare la definizione di un'entità nell'editor Flusso di dati,

  1. Trascinare l'entità dati sullo sfondo della progettazione.
  2. Selezionare il componente e fare clic sull'icona Aggiungi entità dati Icona Aggiungi entità dati presente nell'angolo in alto a destra del componente di destinazione.
  3. Viene visualizzata la pagina Aggiungi entità dati che consente di configurare i dettagli del componente di destinazione riportati di seguito.

    Scheda Generale

    • Nella casella di testo Nome, immettere il nome dell'entità dati appena creata.
    • Selezionare il tipo di entità dati dall'elenco a discesa Tipo di entità.
      • Tabella
      • Modello ML
        Quando si seleziona questo tipo di entità, l'interfaccia utente cambia come indicato di seguito.
        • L'elenco a discesa Tipo di connessione elenca solo Oracle come opzione. Di conseguenza, l'elenco a discesa Connessione elenca solo le connessioni Oracle create dall'utente.
        • La procedura guidata Aggiungi entità dati visualizza la scheda Proprietà, in cui è possibile selezionare il tipo di apprendimento, la funzione, l'algoritmo e configurare i parametri per definire il modello ML. Per informazioni dettagliate sulla creazione e l'utilizzo di un'entità dati modello ML, vedere Usa modelli di apprendimento automatico.
    • Nell'elenco a discesa Tipo di connessione selezionare la connessione richiesta da cui si desidera aggiungere l'entità dati appena creata. L'elenco a discesa Connessione viene popolato con le connessioni create con il tipo di connessione associato.
    • Nell'elenco a discesa Connessione selezionare il nome del server da cui si desidera aggiungere l'entità dati appena creata.
    • Nell'elenco a discesa Schema, tutti gli schemi corrispondenti alla connessione selezionata vengono elencati in due gruppi.
      • Nuovo schema di database (quelli da cui non è stata eseguita l'importazione) e
      • Schema di database esistente (quelle importate in precedenza e che potenzialmente stanno sostituendo le entità dati).
      Nell'elenco a discesa Schema selezionare lo schema richiesto.
      Nota

      Per le connessioni allo storage degli oggetti Oracle, l'elenco a discesa Schema elenca il nome del bucket specificato nell'URL al momento della creazione della connessione.
    • Nella casella di testo Tag, immettere un tag a scelta. È possibile utilizzare le tag per filtrare le entità dati visualizzate nella pagina Entità dati.
    • Per le connessioni al database Oracle, è possibile contrassegnare le entità dati come gruppo di funzioni. Espandere Opzioni avanzate e fare clic sulla casella di controllo Tratta come gruppo di funzioni.
    • Fare clic su Successivo.

    Scheda Colonne

    • Fare clic sull'icona Icona Aggiungi colonne Aggiungi colonne per aggiungere nuove colonne all'entità dati appena creata.

      Alla tabella visualizzata viene aggiunta una nuova colonna.

    • Le colonne presenti nella tabella sono riportate di seguito.
      • Nome
      • Tipo di dati: fare clic sulla cella per configurare il tipo di dati richiesto.
      • Scale
      • Lunghezza
      • Azioni: fare clic sull'icona a forma di croce per eliminare la colonna creata.
    • Per eliminare le colonne in blocco, selezionare le colonne e fare clic sull'icona Icona Elimina Elimina.
    • Per cercare i dettagli di colonna obbligatori, nella casella di testo Cerca immettere il nome di colonna desiderato e fare clic su Invio. Vengono visualizzati i dettagli della colonna richiesta.
    • Fare clic su Successivo.

    Scheda Anteprima entità dati

    Visualizza un'anteprima di tutte le colonne create e dei relativi dettagli configurati. Se l'entità dati appartiene a un database Oracle, è possibile visualizzare anche le statistiche della tabella. Per ulteriori informazioni, vedere Visualizza statistiche delle entità dati.

  4. Fare clic su Salva.

    La nuova entità dati di destinazione è stata creata.

  5. Espandere il pannello Proprietà nel riquadro destro per visualizzare le impostazioni dei componenti creati riportate di seguito.
    • Generale: visualizza il nome del componente insieme ai relativi dettagli di connessione e schema.
    • Attributi: visualizza i dettagli di tutti gli attributi associati al componente.
    • Mapping colonne: fare clic su Mapping automatico per mappare automaticamente tutte le colonne.
    • Anteprima: fare clic per avere un'anteprima del componente.
    • Opzioni: modificare le opzioni in base alle esigenze.

Visualizza statistiche delle entità dati

La scheda Anteprima visualizza le statistiche dettagliate di ogni entità dati.

Nota

Questa funzione è disponibile solo per le tabelle di database Oracle.
È possibile visualizzare le statistiche di un'entità dati selezionata in uno dei modi riportati di seguito.
  • Nell'elenco Entità dati, fare clic sull'icona Azioni (Icona Azioni) accanto all'entità dati e fare clic su Anteprima. Selezionare la scheda Statistiche per visualizzare le statistiche dell'entità dati selezionata.
  • In qualsiasi flusso di dati fare clic su qualsiasi entità dati di origine o di destinazione ed espandere il pannello delle proprietà nel riquadro destro. Fare clic su Anteprima.

I dati statistici sono presentati come segue:

  • Il numero totale di righe e colonne nell'entità dati viene visualizzato nella parte superiore.
  • Il pannello Statistiche visualizza i grafici di anteprima per ogni colonna con informazioni sui valori Min, Max, Distinct e Null.
  • In base all'istogramma vengono visualizzati due tipi di rappresentazioni di anteprima ridotta:
    • Un grafico a barre rappresenta i dati per gli istogrammi di frequenza e di frequenza superiore. Il grafico a barre mostra i primi 10 valori per il numero di righe nella tabella.
    • Una tabella elenca i dati per gli istogrammi ibridi e con bilanciamento dell'altezza. La tabella visualizza tutti i dati ed è scorrevole. Nella tabella viene visualizzato l'intervallo per i valori e la percentuale di righe in ciascun intervallo.
  • È possibile fare clic su ogni anteprima per visualizzare le statistiche della colonna in una nuova scheda del browser.
  • La vista dettagliata di ogni grafico mostra anche il tipo di istogramma.