Collegamento agli oggetti nello storage cloud

Quando crei un collegamento ai file in un bucket dell'area di memorizzazione cloud dal tuo database Oracle Autonomous, crei una tabella esterna che si collega ai file nell'area di memorizzazione cloud.

È possibile collegarsi ai file in questi formati: AVRO, CSV, JSON, GeoJSON, Parquet, ORC, TXT delimitato. Per informazioni sui formati di file supportati, vedere Specifiche formato per file JSON, AVRO e XML.

Configurare ed eseguire un job di collegamento dati dalla pagina Collega oggetto cloud. Per aprire la pagina:

  1. Aprire il launchpad di Database Actions, fare clic sulla scheda Data Studio e selezionare il menu Caricamento dati. Vedere Pagina Caricamento dati.
  2. Selezionare LINK DATA e CLOUD STORE.

Sul lato sinistro della pagina si trova un riquadro di navigazione, in cui è possibile scegliere una connessione all'area di memorizzazione cloud e le cartelle o i file contenenti i dati. A destra della pagina si trova il carrello di caricamento dati, in cui è possibile posizionare nell'area intermedia i file e le cartelle per il job di collegamento dati. È possibile impostare le opzioni per il job di collegamento dati prima di eseguirlo. Autonomous Database è dotato di condivisioni CPU/IO predefinite assegnate a gruppi di consumer diversi. È possibile impostare il gruppo di consumer su basso, medio o alto durante l'esecuzione di un job di caricamento dati a seconda del carico di lavoro.

Gestisci collegamenti storage cloud per job collegamento dati

Prima di poter eseguire il collegamento ai dati in un'area di memorizzazione cloud, è necessario stabilire una connessione all'area di memorizzazione cloud che si desidera utilizzare.

Nella pagina Collega oggetto cloud effettuare le operazioni riportate di seguito.

  1. Fare clic sull'icona Gestisci negozio cloud oltre al campo in cui si immette la posizione del negozio cloud. Selezionare + Crea posizione area di memorizzazione cloud.

  2. Immettere le informazioni nel riquadro Aggiungi posizione area di memorizzazione cloud. Vedere per aggiungere la posizione di storage cloud.

Vedere Gestione delle connessioni.

Per tornare alla pagina Collega oggetto cloud, fare clic su Caricamento dati negli indicatori di percorso nella parte superiore della pagina, quindi tornare alla pagina.

Prepara job collegamento dati

Potrebbe essere necessario modificare i dati di origine o la tabella di destinazione in modo che i dati di origine siano collegati correttamente alla tabella di destinazione esterna. Tenere presente quanto riportato di seguito.

  • Se si sta collegando a più file, è necessario assicurarsi che:

    • Tutti i file di origine sono dello stesso tipo, ad esempio CSV, JSON e così via.

    • Il numero, l'ordine e i tipi di dati delle colonne in tutti i file di origine corrispondono.

  • Se si desidera partizionare per data:

    • Il file di origine deve contenere dati in cui il tipo di dati è data o indicatore orario.

    • È necessario caricare una cartella contenente due o più origini dati.

    • I nomi dei file nella cartella devono indicare una data o date, ad esempio MAR-1999.csv o 2017-04-21.xlsx.

Aggiungi file o cartelle per il job di collegamento dati

Aggiungere file dall'area di memorizzazione cloud al carrello collegamenti dati, in cui è possibile modificare i dettagli del job di collegamento dati. Per aggiungere i file:

  1. Dall'elenco nella parte superiore del riquadro del Navigator a sinistra, selezionare il bucket con i dati di origine.

    La lista mostra i collegamenti creati nella pagina Gestisci storage cloud. Se non è ancora stata registrata l'area di memorizzazione cloud che si desidera utilizzare, fare clic sul pulsante Connessioni nel menu Caricamento dati della suite di strumenti Data Studio e registrare una connessione.

  2. Trascinare uno o più elementi dal Navigator file a sinistra e rilasciarli nel carrello a destra.

    • È possibile aggiungere file, cartelle o entrambi. Al carrello viene aggiunta una scheda per ogni file o cartella trascinata. La scheda elenca il nome del file o della cartella di origine e un nome proposto per la tabella di destinazione.

    • Se si aggiunge una cartella che contiene più file, tutti i file devono essere dello stesso tipo, ovvero CSV, TXT e così via.

      Quando si aggiunge la cartella al carrello, viene visualizzato un prompt che chiede se si desidera caricare tutti gli oggetti dai file di origine multipli in una singola tabella di destinazione. Per continuare, fare clic su oppure su No per annullare l'operazione.

    • Quando si aggiungono più file singoli o più cartelle al carrello, i dati rappresentati da ciascuna scheda verranno caricati in una tabella separata, ma tutti gli articoli nel carrello verranno elaborati come parte dello stesso processo di caricamento dati.

    • È possibile aggiungere file o cartelle da un altro bucket, ma in tal caso, viene richiesto di rimuovere tutti i file già presenti nel carrello prima di continuare. Per selezionare file da un altro bucket, selezionare il bucket dall'elenco a discesa nel riquadro del Navigator a sinistra, quindi aggiungere il file o i file, come descritto in precedenza.

    • È possibile rilasciare file o cartelle nel carrello di caricamento dati e quindi uscire dalla pagina Oggetto collegamento dati. Quando si torna alla pagina, tali elementi rimangono nella pagina, ma è possibile che venga visualizzato un messaggio "Rimuovi tutti gli elementi di collegamento dati". Per passare a un'altra posizione dell'area di storage cloud, sono necessari rimuovere tutti gli elementi dal processo di caricamento dati. Continuare?" Fare clic su per rimuovere gli articoli dal carrello. Fare clic su No per conservare gli articoli nel carrello. Poi si può continuare a lavorare.

È possibile rimuovere gli articoli dal carrello prima di eseguire il job di collegamento dati:

  • Per rimuovere un articolo dal carrello, selezionare Rimuovi nella scheda per la barra dei menu del carrello collegamento dati dell'articolo nella parte superiore del riquadro.

  • Per rimuovere tutti gli articoli dal carrello, fare clic su Rimuovi tutto nella barra dei menu del carrello del collegamento dati nella parte superiore del riquadro.

Immettere i dettagli per il job di collegamento dati

Immettere i dettagli relativi al job di collegamento dati nel riquadro Collega dati da storage cloud.

Nella scheda nel carrello dei collegamenti dati, fare clic su Impostazioni per aprire il riquadro Collega dati da storage cloud per il job. Il riquadro contiene:

Scheda Impostazioni - Sezione tabella

Impostare i dettagli sulla tabella di destinazione nella sezione Tabella.

  • Nome: il nome della tabella di destinazione.
  • Colonna di partizione:

    Elenca partizioni e partizioni basate su data sono i diversi tipi di partizioni disponibili nel collegamento dati.

    Il partizionamento degli elenchi è obbligatorio quando si desidera mappare in modo specifico le righe alle partizioni in base a valori discreti.

    Per eseguire il partizionamento in base a una colonna specifica, fare clic sull'elenco a discesa Colonna partizione e selezionare la colonna che si desidera utilizzare per il partizionamento.

    Avrai N file per valore di partizione, tutti partizionati dalla colonna di partizione selezionata.

    Nota

    • Per i file collegati (da tabelle esterne) è inoltre richiesto che per ogni file, la colonna di partizionamento elenco possa contenere solo un singolo valore distinto in tutte le righe.
    • Se un file è elencato partizionato, la chiave di partizionamento può essere costituita solo da una singola colonna della tabella.

    Il partizionamento basato sulla data è disponibile quando si collega una cartella contenente due o più origini dati con colonne contenenti dati di data o indicatore orario.

    Per eseguire il partizionamento in base alla data, fare clic sull'elenco a discesa Colonna partizione e selezionare la colonna DATE o TIMESTAMP da utilizzare per il partizionamento.

  • Tipo di convalida: la convalida esamina i file di origine, le informazioni facoltative sul partizionamento e segnala righe di report che non corrispondono alle opzioni di formato specificate. Selezionare Nessuno per non eseguire alcuna convalida; selezionare Esempio per eseguire la convalida in base a un campione dei dati oppure selezionare Completo per eseguire la convalida in base a tutti i dati.

  • Usa carattere jolly: questa casella di controllo consente di utilizzare caratteri jolly nella condizione di ricerca per recuperare un gruppo specifico di file corrispondente ai criteri di filtro.

    È possibile utilizzare un carattere jolly, ad esempio un asterisco (*) che esegue ricerche, filtra e specifica gruppi di file che rilevano e aggiungono nuovi file alla tabella esterna.

    Ad esempio, se si immette un file*, file01, file02, file03 e così via vengono considerati corrispondenti alla parola chiave. L'asterisco (*) corrisponde a zero o più caratteri delle possibilità, alla parola chiave.

    Nota

    Il supporto dei caratteri jolly non è compatibile con il partizionamento. La convalida del file di origine non riesce se si utilizzano caratteri jolly con dati partizionati.

Scheda Impostazioni - Sezione Proprietà

Specificare le opzioni per controllare la modalità di interpretazione, anteprima ed elaborazione dei dati di origine. Queste opzioni variano a seconda del tipo di dati di origine.

  • Codifica: selezionare un tipo di codifica caratteri dall'elenco. Questa opzione è disponibile quando il file collegato è in formato testo normale (CSV, TSV o TXT). La codifica predefinita è UTF-8.

  • Closure di testo: selezionare il carattere per l'inclusione del testo: " (carattere con virgoletta doppia), ' (carattere con virgoletta singola) o Nessuno. Questa opzione è visibile solo quando il file selezionato è in formato testo normale (CSV, TSV o TXT).

  • Delimitatore di campo: selezionare il carattere delimitatore utilizzato per separare le colonne nell'origine. Ad esempio, se il file di origine utilizza i punti e virgola per delimitare le colonne, selezionare Punto e virgola da questa lista. L'impostazione predefinita è Virgola. Questa opzione è visibile solo quando il file selezionato è in formato testo normale (CSV, TSV o TXT).

  • Avvio dell'elaborazione dei dati alla riga: specifica il numero di righe da saltare quando si collegano i dati di origine alla tabella esterna di destinazione:

    • Se si seleziona l'opzione Riga intestazione colonna in Nome colonna origine (vedere di seguito) e si immette un numero maggiore di 0 nel campo Avvia elaborazione dati alla riga, il numero di righe dopo la prima riga non viene collegato alla destinazione.

    • Se si deseleziona l'opzione Riga intestazione colonna in Nome colonna origine e si immette un numero maggiore di 0 nel campo Avvia elaborazione dati alla riga, il numero di righe, inclusa la prima riga, non sarà collegato alla destinazione.

  • Nome colonna di origine: selezionare la casella di controllo Riga intestazione colonna per utilizzare i nomi delle colonne nella tabella di origine nella tabella di destinazione.

    • Se si seleziona questa opzione, la prima riga del file viene elaborata come nomi di colonna. Le righe della sezione Mapping, riportata di seguito, vengono compilate con questi nomi (e con i tipi di dati esistenti, a meno che non vengano modificati).

    • Se si deseleziona questa opzione, la prima riga viene elaborata come dati. Per specificare manualmente i nomi delle colonne, immettere un nome per ogni colonna di destinazione nella sezione Mapping. (Dovrete anche inserire i tipi di dati.)

  • Colonna numerica: selezionare la casella di controllo Converti dati non validi in nulli per convertire un valore di colonna numerica non valido in un valore nullo.

  • Nuove righe incluse nei valori dati: selezionare questa opzione se sono presenti caratteri di nuova riga o se si torna all'inizio della riga corrente senza avanzare verso il basso nei campi dati. Se si seleziona questa opzione, il tempo impiegato per elaborare il caricamento aumenterà. Se non si seleziona questa opzione durante il caricamento dei dati, le righe con nuove righe nei campi verranno rifiutate. È possibile visualizzare la riga rifiutata nel pannello Report job.

Scheda Impostazioni - Sezione Mapping

Le impostazioni della sezione Mapping controllano il modo in cui i dati dei file di origine vengono collegati alle righe della tabella esterna di destinazione. Per ogni riga, i dati della colonna elencata in Colonna di origine verranno collegati alla colonna elencata in Colonna di destinazione.

  • Colonna di origine: elenca le colonne del file di origine.

    Se l'opzione Riga intestazione colonna in Proprietà è selezionata, in Colonna di origine vengono visualizzati i nomi delle colonne nel file di origine. Se l'opzione Riga intestazione colonna non è selezionata, vengono utilizzati nomi generici quali COLUMN_1, COLUMN_2 e così via. Questo campo è sempre di sola lettura.

    È possibile visualizzare due colonne di origine FILE$NAME e SYSTIMESTAMP. La colonna FILE$NAME consente di individuare il file di origine contenente un determinato record di dati. Ad esempio, si carica un file di origine contenente un elenco di file. I nomi dei file nell'elenco dei file fanno riferimento ai nomi dei reparti nell'organizzazione. Ad esempio, un file finance.txt contiene i dati del reparto finanziario. Nel mapping è possibile utilizzare tipi di dati stringa per estrarre il nome del reparto dall'output della colonna del nome file. È possibile utilizzare il nome del reparto estratto per elaborare i dati in modo diverso per ogni reparto.

    La colonna SYSTIMESTAMP consente di visualizzare l'indicatore orario corrente nel database.

    Nota

    • Le colonne di origine FILE$NAME e SYSTIMESTAMP non sono incluse per impostazione predefinita. Per visualizzare queste due colonne, è necessario selezionare la casella di controllo Includi ed eseguire il caricamento della tabella di destinazione.
    • Quando si crea un feed attivo, le colonne di origine FILE$NAME e SYSTIMESTAMP vengono visualizzate nella tabella Mapping per impostazione predefinita.
  • Colonna target: elenca le colonne nella tabella target.

    • Se l'opzione Riga intestazione colonna è selezionata, la Colonna di destinazione utilizza i nomi delle colonne nel file di origine. È possibile modificare il nome di una colonna di destinazione sostituendo il nome fornito con uno nuovo. È necessario assicurarsi che la colonna di destinazione non sia vuota. Il nome della colonna di destinazione non deve essere un duplicato di un'altra colonna di destinazione. Il nome della colonna di destinazione non può avere un nome duplicato come altra colonna di destinazione. La lunghezza della colonna di destinazione non deve superare i 128 byte. Il limite di 128 byte è un limite per il database.

    • Se l'opzione Riga intestazione colonna è non selezionata, vengono utilizzati nomi generici quali COLUMN_1, COLUMN_2 e così via. È possibile modificare il nome di una colonna di destinazione sostituendo il nome fornito con uno nuovo.

    Nota

    Se si collegano più file da una cartella in un singolo job di collegamento dati, solo il primo file verrà visualizzato nella sezione Mapping. Tuttavia, finché i nomi delle colonne e i tipi di dati corrispondono, i dati di tutti i file di origine verranno collegati.

  • Tipo di dati: elenca il tipo di dati da utilizzare per i dati in tale colonna. Il contenuto cambia a seconda che l'opzione Ottieni dall'intestazione del file sia selezionata.

    • Se l'opzione Riga intestazione colonna è selezionata, Tipo di dati mostra i tipi di dati delle colonne nel file di origine. Se si desidera modificare il tipo di dati per la destinazione, fare clic sul nome e selezionarne uno diverso dall'elenco.

    • Se l'opzione Riga intestazione colonna è non selezionata, in Tipo di dati vengono visualizzati tutti i tipi di dati disponibili. Selezionare dall'elenco il tipo di dati da utilizzare per la colonna di destinazione.

  • Lunghezza/Precisione (facoltativo): per le colonne in cui Tipo di dati è NUMBER, immettere la lunghezza/precisione per i numeri nella colonna. La precisione è il numero di cifre significative in un numero. La Precisione può variare da 1 a 38.

    Per le colonne in cui il tipo di dati è VARCHAR2, il valore Automatico nel campo Lunghezza/Precisione abilita la funzione Dimensione automatica.

    Con la funzione Dimensionamento automatico larghezza colonna, è possibile dimensionare automaticamente qualsiasi colonna per adattarla al valore più grande presente nella colonna. Selezionare Automatico dall'elenco a discesa Lunghezza/Precisione oppure selezionare un valore dall'elenco a discesa.

  • Scalabilità (facoltativo): per le colonne in cui il tipo di dati è NUMBER, immettere la scala per i numeri nella colonna. La scala rappresenta il numero di cifre a destra (positiva) o a sinistra (negativa) del separatore decimale. La bilancia può variare da -84 a 127 intervalli.

  • Formato: se il tipo di dati nella colonna Tipo di dati è DATE o uno dei tipi TIMESTAMP, selezionare un formato per tale tipo dall'elenco a discesa Formato.

Scheda Anteprima

Il menu Anteprima caricamento nella scheda Anteprima consente di visualizzare i dati di origine in formato tabulare. La visualizzazione riflette le impostazioni scelte nella sezione Proprietà. Il menu File visualizza i dati di origine con i nomi delle colonne.

Se è stata trascinata una cartella contenente più file nel carrello dei collegamenti dati e quindi è stato fatto clic su Impostazioni Impostazioni per la scheda, il riquadro Anteprima include un elenco a discesa Anteprima oggetto (file) nella parte superiore del riquadro in cui sono elencati tutti i file della cartella. Selezionare il file di origine che si desidera visualizzare in anteprima dall'elenco.

Scheda Tabella

Nella scheda Tabella viene visualizzato l'aspetto previsto per la tabella di destinazione dopo il collegamento dei dati.

Scheda SQL

Nella scheda SQL vengono visualizzati i comandi SQL che verranno eseguiti per completare questo job di collegamento dati.

Nota

È possibile visualizzare il codice SQL anche prima della creazione della tabella.

Pulsante Close (Chiudi) - Salva e chiudi il riquadro

Dopo aver immesso tutti i dettagli per il job di collegamento dati, fare clic su Chiudi nella parte inferiore della pagina. In questo modo vengono salvati i dettagli immessi e si torna al riquadro Collega dati da storage cloud.

Esegui job collegamento dati

Dopo aver aggiunto le origini dati al carrello dei collegamenti dati e aver inserito i dettagli relativi al job di collegamento dati, è possibile eseguire il job.

Per eseguire il job, procedere come segue.

  1. Se non lo si è già fatto, fare clic sul pulsante Chiudi nel riquadro Collega dati da storage cloud per salvare le impostazioni e chiudere il riquadro. Se una qualsiasi delle impostazioni non è valida, un messaggio di errore segnala il problema. Risolvere il problema, quindi fare clic su Chiudi.
  2. Fare clic su Inizio Avvia nella barra dei menu del carrello del collegamento dati. Per arrestare il job di collegamento dati, fare clic su Interrompi Arresta.

    Al termine del job di collegamento dati, nella pagina Dashboard caricamento dati vengono visualizzati i risultati del job nella sezione Carichi tabella e vista.

    Una volta avviato il job di collegamento dati, è possibile visualizzare l'avanzamento del job nel dashboard Caricamento dati.

Visualizza dettagli sul job di collegamento dati dopo l'esecuzione

È possibile visualizzare l'avanzamento del job nel dashboard Caricamento dati.

Al termine del job di caricamento dati, nella pagina del dashboard Caricamento dati vengono visualizzati i risultati del job. Nella parte superiore dell'intestazione del caricamento della tabella, è possibile visualizzare il nome della tabella insieme alle colonne totali presenti nella tabella.

Fare clic su Report job per visualizzare il numero totale di righe elaborate correttamente e il conteggio delle righe rifiutate. È inoltre possibile visualizzare l'ora di inizio. Nel riquadro SQL del report job viene visualizzato il codice SQL equivalente del job.

Per visualizzare informazioni su un elemento del job, fare clic sull'icona Azioni sul caricamento tabella.

Per visualizzare un log dell'operazione di caricamento, fare clic sull'icona Log. È possibile salvare il log, cancellarlo o aggiornarlo. Fare clic su OK per chiudere il log.

Visualizzare la tabella risultante dal job di collegamento dati

Dopo aver eseguito un job di collegamento dati, è possibile visualizzare la tabella creata dal job di collegamento dati nel dashboard Caricamento dati.

Correggere il job di caricamento dati. Dopo il job di caricamento dati, è possibile che vengano visualizzati errori che si desidera correggere oppure, dopo l'ispezione, che si desidera assegnare un nome diverso a una colonna. In questi casi, fare clic sull'opzione Ricarica nel caricamento tabella selezionato per ricaricare le schede dal carrello recente e modificarle come prima del primo tentativo. L'icona Ricarica ricarica i dati di origine con le correzioni suggerite dallo strumento. Fare clic sull'icona Azioni nell'intestazione della tabella, fare clic su Tabella e selezionare Modifica per apportare eventuali modifiche al job di caricamento dati, ad esempio modificare un nome di colonna.