Collegamento agli oggetti nello storage cloud
Quando si crea un collegamento ai file in un bucket dell'area di memorizzazione cloud da Oracle Autonomous Database, si crea una tabella esterna che si collega ai file nell'area di memorizzazione cloud.
È possibile collegare i file in questi formati: AVRO, CSV, JSON, GeoJSON, Parquet, ORC, Delimited TXT. Per informazioni sui formati di file supportati, vedere Format Specifications for JSON, AVRO e XML Files.
Configurare ed eseguire un job di collegamento dati dalla pagina Collega oggetto cloud. Per aprire la pagina:
- Aprire il Launchpad Database Actions , fare clic sulla scheda Data Studio e selezionare il menu Caricamento dati. Vedere Pagina Caricamento dati.
- Selezionare LINK DATA e CLOUD STORE.
Sul lato sinistro della pagina è disponibile un riquadro di navigazione, in cui è possibile scegliere una connessione all'area di memorizzazione cloud e le cartelle o i file che contengono i dati. A destra della pagina si trova il caricamento dati cart, in cui posizionare i file e le cartelle nell'area intermedia per il job di collegamento dati. È possibile impostare le opzioni per il job di collegamento dati prima di eseguirlo. Autonomous Database viene fornito con condivisioni CPU/IO predefinite assegnate a diversi gruppi di consumer. Puoi impostare il gruppo di consumer su basso, medio o alto durante l'esecuzione di un job di caricamento dati a seconda del carico di lavoro.
- Gestire i collegamenti allo storage cloud per i job dei collegamenti dati
Prima di poter eseguire il collegamento ai dati in un'area di memorizzazione cloud, è necessario stabilire una connessione all'area di memorizzazione cloud che si desidera utilizzare. - Preparazione del job collegamento dati
- Aggiungere file o cartelle per il job Collegamento dati
- Immettere i dettagli per il job Collegamento dati
Immettere i dettagli sul job Collegamento dati nel riquadro Memoria cloud. - Eseguire il job Collegamento dati
Una volta aggiunte origini dati al carrello Collegamento dati e immessi i dettagli sul job Collegamento dati, è possibile eseguire il job. - Visualizza dettagli sul job di collegamento dati dopo l'esecuzione
È possibile visualizzare lo stato di avanzamento del job nel dashboard Caricamento dati. - Visualizzare i risultati della tabella dal job Collegamento dati
Dopo aver eseguito un job Collegamento dati, è possibile visualizzare la tabella creata dal job Collegamento dati nel dashboard Caricamento dati.
Argomento padre: Collegamento dei dati
Gestisci collegamenti memoria cloud per job collegamento dati
Prima di poter eseguire il collegamento ai dati in un'area di memorizzazione cloud, è necessario stabilire una connessione all'area di memorizzazione cloud che si desidera utilizzare.
Nella pagina Collega oggetto cloud:
-
Fare clic sull'icona Gestisci area di memorizzazione cloud oltre al campo in cui si immette la posizione dell'area di memorizzazione cloud. Selezionare + Crea posizione area di memorizzazione cloud.
-
Immettere le informazioni nel riquadro Aggiungi posizione area di memorizzazione cloud. Vedere per aggiungere la posizione di memorizzazione cloud.
Vedere Gestione delle connessioni.
Per tornare alla pagina Collega oggetto cloud, fare clic su Caricamento dati negli indicatori di percorso nella parte superiore della pagina, quindi tornare alla pagina.
Argomento padre: collegamento agli oggetti nello storage cloud
Prepara job collegamento dati
Potrebbe essere necessario modificare i dati di origine o la tabella di destinazione in modo che i dati di origine si colleghino correttamente alla tabella di destinazione esterna. Considera:
-
Se si sta collegando a più file, è necessario assicurarsi che:
-
Tutti i file di origine sono dello stesso tipo, ad esempio CSV, JSON e così via.
-
Il numero, l'ordine e i tipi di dati delle colonne in tutti i file di origine corrispondono.
-
-
Se si desidera eseguire la partizione per data:
-
Il file di origine deve contenere dati con tipo di dati data o indicatore orario.
-
È necessario caricare una cartella contenente due o più origini dati.
-
I nomi dei file nella cartella devono indicare una o più date, ad esempio
MAR-1999.csv
o2017-04-21.xlsx
.
-
Argomento padre: collegamento agli oggetti nello storage cloud
Aggiungi file o cartelle per il job Collegamento dati
Aggiungere file dall'area di memorizzazione cloud al carrello dei collegamenti dati, in cui è possibile modificare i dettagli del job di collegamento dati. Per aggiungere i file:
-
Dall'elenco nella parte superiore del riquadro del Navigator a sinistra, selezionare il bucket con i dati di origine.
L'elenco mostra i collegamenti creati nella pagina Gestisci storage cloud. Se l'area di memorizzazione cloud che si desidera utilizzare non è stata ancora registrata, fare clic sul pulsante Connessioni sotto il menu Caricamento dati nella suite di strumenti di Data Studio e registrare una connessione.
-
Trascinare uno o più elementi dal Navigator file a sinistra e rilasciarli nel carrello a destra.
-
È possibile aggiungere file, cartelle o entrambi. Al carrello viene aggiunta una scheda per ogni file o cartella trascinata. La scheda elenca il nome del file o della cartella di origine e un nome proposto per la tabella di destinazione.
-
Se si aggiunge una cartella contenente più file, tutti i file devono essere dello stesso tipo, ovvero CSV, TXT e così via.
Quando si aggiunge la cartella al carrello, viene visualizzato un prompt che chiede se si desidera caricare tutti gli oggetti dai file di origine multipli in una singola tabella di destinazione. Fare clic su Sì per continuare o su No per annullare.
-
Quando si aggiungono più singoli file o più cartelle al carrello, i dati rappresentati da ciascuna scheda verranno caricati in una tabella separata, ma tutti gli articoli nel carrello verranno elaborati come parte dello stesso processo di caricamento dei dati.
-
È possibile aggiungere file o cartelle da un bucket diverso, ma in questo caso viene richiesto di rimuovere tutti i file già presenti nel carrello prima di continuare. Per selezionare i file da un bucket diverso, selezionare il bucket dall'elenco a discesa nel riquadro del Navigator a sinistra, quindi aggiungere i file, come descritto in precedenza.
-
È possibile eliminare file o cartelle nel carrello di caricamento dati e quindi uscire dalla pagina Oggetto collegamento dati. Quando si torna alla pagina, tali elementi rimangono nella pagina, ma è possibile che venga visualizzato il messaggio "Rimuovi tutti gli elementi collegamento dati". Per passare a un'altra posizione della memoria cloud, è necessario rimuovere tutti gli elementi dal job di caricamento dati. Continuare?" Fare clic su Sì per rimuovere gli articoli dal carrello. Fai clic su No per conservare gli articoli nel carrello. Quindi puoi continuare a lavorare.
-
È possibile rimuovere gli articoli dal carrello prima di eseguire il job di collegamento dati:
-
Per rimuovere un articolo dal carrello, selezionare Rimuovi nella scheda per la barra dei menu del carrello Collegamento dati dell'articolo nella parte superiore del riquadro.
-
Per rimuovere tutti gli articoli dal carrello, fare clic su Rimuovi tutto nella barra dei menu del carrello del collegamento dati nella parte superiore del riquadro.
Argomento padre: collegamento agli oggetti nello storage cloud
Immettere i dettagli per il job di collegamento dati
Immettere i dettagli sul job di collegamento dati nel riquadro Collega dati da memorizzazione cloud.
Nella scheda del carrello collegamenti dati, fare clic su Impostazioni per aprire il riquadro Collega dati da storage cloud per il job. Il riquadro contiene:
Scheda Impostazioni - Sezione tabella
Impostare i dettagli sulla tabella di destinazione nella sezione Tabella.
- Nome: il nome della tabella di destinazione.
-
Colonna di partizione:
Le partizioni elenco e le partizioni basate su data sono i diversi tipi di partizioni disponibili nel collegamento dati.
Il partizionamento elenco è obbligatorio quando si desidera mappare le righe alle partizioni in base a valori discreti.
Per eseguire la partizione in base a una colonna specifica, fare clic sull'elenco a discesa Partition Column e selezionare la colonna che si desidera utilizzare per il partizionamento.
Avrai N file per valore di partizione, tutti partizionati dalla colonna di partizione selezionata.
Nota
- Per i file collegati (da tabelle esterne) è inoltre necessario che per ogni file la colonna di partizionamento elenco possa contenere un solo valore distinto in tutte le righe.
- Se un file è partizionato in elenco, la chiave di partizionamento può essere costituita solo da una singola colonna della tabella.
Il partizionamento basato su data è disponibile quando si collega una cartella contenente due o più origini dati con colonne contenenti dati di data o indicatore orario.
Per eseguire la partizione in base alla data, fare clic sull'elenco a discesa Partition Column e selezionare la colonna DATE o TIMESTAMP che si desidera utilizzare per il partizionamento.
-
Tipo di convalida: la convalida esamina i file di origine, le informazioni facoltative sul partizionamento e le righe di report che non corrispondono alle opzioni di formato specificate. Selezionare Nessuno per non eseguire alcuna convalida; selezionare Esempio per eseguire la convalida in base a un campione di dati; oppure selezionare Completo per eseguire la convalida in base a tutti i dati.
- Usa carattere jolly: questa casella di controllo consente di utilizzare i caratteri jolly nella condizione di ricerca per recuperare un gruppo specifico di file che corrisponde ai criteri di filtro.
È possibile utilizzare un carattere jolly, ad esempio un asterisco (*) che consente di cercare, filtrare e specificare gruppi di file che rilevano e aggiungono nuovi file alla tabella esterna.
Ad esempio, se si immette file*, vengono considerati corrispondenti alla parola chiave file01, file02, file03 e così via. L'asterisco (*) corrisponde a zero o più caratteri delle possibilità, alla parola chiave.
Nota
Il supporto dei caratteri jolly non è compatibile con il partizionamento. La convalida del file di origine non riesce se si utilizzano caratteri jolly con dati partizionati.
Scheda Impostazioni - Sezione Proprietà
Specificare le opzioni per controllare la modalità di interpretazione, anteprima ed elaborazione dei dati di origine. Queste opzioni variano a seconda del tipo di dati di origine.
-
Codifica: selezionare un tipo di codifica dei caratteri dall'elenco. Questa opzione è disponibile quando il file collegato è in formato testo normale (CSV, TSV o TXT). Il tipo di codifica predefinito è UTF-8.
-
Cenclosure testo: selezionare il carattere per racchiudere il testo: " (carattere con virgolette doppie), ' (carattere con virgolette singole) o Nessuno. Questa opzione è visibile solo quando il file selezionato è in formato testo normale (CSV, TSV o TXT).
-
Delimitatore di campo: selezionare il carattere delimitatore utilizzato per separare le colonne nell'origine. Ad esempio, se il file di origine utilizza punti e virgola per delimitare le colonne, selezionare Punto e virgola da questa lista. L'impostazione predefinita è virgola. Questa opzione è visibile solo quando il file selezionato è in formato testo normale (CSV, TSV o TXT).
-
Avviare l'elaborazione dei dati alla riga: specifica il numero di righe da saltare quando si collegano i dati di origine alla tabella esterna di destinazione.
-
Se si seleziona l'opzione Riga intestazione colonna in Nome colonna di origine (vedere di seguito) e si immette un numero maggiore di 0 nel campo Avvia elaborazione dati alla riga, il numero di righe dopo la prima riga non verrà collegato alla destinazione.
-
Se si deseleziona l'opzione Riga intestazione colonna in Nome colonna di origine e si immette un numero maggiore di 0 nel campo Avvia elaborazione dati alla riga, il numero di righe, inclusa la prima riga, non verrà collegato alla destinazione.
-
-
Nome colonna di origine: selezionare la casella di controllo Riga intestazione colonna per utilizzare i nomi delle colonne della tabella di origine nella tabella di destinazione.
-
Se si seleziona questa opzione, la prima riga del file viene elaborata come nomi di colonna. Le righe nella sezione Mapping, riportata di seguito, vengono compilate con tali nomi e con i tipi di dati esistenti, a meno che non vengano modificati.
-
Se si deseleziona questa opzione, la prima riga viene elaborata come dati. Per specificare manualmente i nomi delle colonne, immettere un nome per ogni colonna di destinazione nella sezione Mapping. (Dovrai anche inserire i tipi di dati.)
-
-
Colonna numerica: selezionare la casella di controllo Converti dati non validi in nulli per convertire un valore di colonna numerico non valido in un valore nullo.
-
Nuove righe incluse nei valori dati: selezionare questa opzione se sono presenti caratteri di nuova riga o se si torna all'inizio della riga corrente senza avanzare verso il basso nei campi dati. Selezionando questa opzione si aumenterà il tempo impiegato per elaborare il caricamento. Se non si seleziona questa opzione durante il caricamento dei dati, le righe con nuove righe nei campi verranno rifiutate. È possibile visualizzare la riga rifiutata nel pannello Report job.
Scheda Impostazioni - Sezione mapping
Le impostazioni della sezione Mapping controllano il modo in cui i dati dei file di origine vengono collegati alle righe della tabella esterna di destinazione. Per ogni riga, i dati della colonna elencata nella colonna di origine verranno collegati alla colonna elencata nella colonna di destinazione.
-
Colonna Origine: elenca le colonne dal file di origine.
Se l'opzione Riga intestazione colonna in Proprietà è selezionata, la colonna di origine mostra i nomi delle colonne nel file di origine. Se l'opzione Riga intestazione colonna non è selezionata, vengono utilizzati nomi generici quali COLUMN_1, COLUMN_2 e così via. Questo campo è sempre di sola lettura.
È possibile visualizzare due colonne di origine
FILE$NAME
eSYSTIMESTAMP
. La colonnaFILE$NAME
consente di individuare il file di origine contenente un determinato record di dati. Ad esempio, si carica un file di origine contenente un elenco di file. I nomi dei file nell'elenco dei file fanno riferimento ai nomi dei reparti nell'organizzazione. Ad esempio, un file finance.txt contiene i dati del reparto finanziario. Nel mapping è possibile utilizzare tipi di dati stringa per estrarre il nome del reparto dall'output della colonna del nome file. È possibile utilizzare il nome del reparto estratto per elaborare i dati in modo diverso per ogni reparto.La colonna
SYSTIMESTAMP
consente di visualizzare l'indicatore orario corrente nel database.Nota
- Le colonne di origine
FILE$NAME
eSYSTIMESTAMP
non sono incluse per impostazione predefinita. È necessario selezionare la casella di controllo Includi ed eseguire il caricamento per la tabella di destinazione per visualizzare queste due colonne. - Quando si crea un feed attivo, le colonne di origine
FILE$NAME
eSYSTIMESTAMP
vengono visualizzate nella tabella Mapping per impostazione predefinita.
- Le colonne di origine
-
Colonna di destinazione: elenca le colonne nella tabella di destinazione.
-
Se l'opzione Riga intestazione colonna è selezionata, la colonna di destinazione utilizza i nomi delle colonne nel file di origine. È possibile modificare il nome di una colonna di destinazione sostituendo il nome fornito con uno nuovo. È necessario assicurarsi che la colonna di destinazione non sia vuota. Il nome della colonna di destinazione non deve essere un duplicato di un'altra colonna di destinazione. Il nome della colonna di destinazione non può avere un nome duplicato come altra colonna di destinazione. La lunghezza della colonna di destinazione non deve superare i 128 byte. Il limite di 128 byte è un limite del database.
-
Se l'opzione Riga intestazione colonna è non selezionata, vengono utilizzati nomi generici quali COLUMN_1, COLUMN_2 e così via. È possibile modificare il nome di una colonna di destinazione sostituendo il nome fornito con uno nuovo.
Nota
Se si collegano più file da una cartella in un singolo job di collegamento dati, nella sezione Mapping verrà visualizzato solo il primo file. Tuttavia, a condizione che i nomi delle colonne e i tipi di dati corrispondano, i dati di tutti i file di origine verranno collegati.
-
-
Tipo di dati: elenca il tipo di dati da utilizzare per i dati nella colonna. Il contenuto cambia a seconda che l'opzione Ottieni da intestazione file sia selezionata.
-
Se l'opzione Riga intestazione colonna è selezionata, Tipo di dati mostra i tipi di dati delle colonne nel file di origine. Se si desidera modificare il tipo di dati per la destinazione, fare clic sul nome e selezionarne uno diverso dall'elenco.
-
Se l'opzione Riga intestazione colonna è non selezionata, Tipo di dati mostra tutti i tipi di dati disponibili. Selezionare il tipo di dati da utilizzare per la colonna di destinazione dalla lista.
-
-
Lunghezza/Precisione (Facoltativo): per le colonne in cui Tipo dati è NUMBER, immettere la lunghezza/precisione per i numeri nella colonna. La precisione è il numero di cifre significative in un numero. La precisione può variare da 1 a 38.
Per le colonne in cui Tipo di dati è VARCHAR2, il valore Automatico nel campo Lunghezza/Precisione abilita la funzione Dimensione automatica.
Con la funzionalità Dimensionamento automatico larghezza colonna, è possibile dimensionare automaticamente qualsiasi colonna per adattarla al valore più grande nella colonna. Selezionare Automatico dai valori dell'elenco a discesa Lunghezza/Precisione oppure scegliere un valore dall'elenco a discesa.
-
Scale (facoltativo): per le colonne in cui Tipo dati è NUMBER, immettere la scala per i numeri nella colonna. La scala rappresenta il numero di cifre a destra (positivo) o a sinistra (negativo) della virgola decimale. La scala può essere compresa tra -84 e 127.
-
Formato: se il tipo di dati nella colonna Tipo di dati è DATE o uno dei tipi TIMESTAMP, selezionare un formato per tale tipo dall'elenco a discesa Formato.
Scheda Anteprima
Nel menu Anteprima caricamento della scheda Anteprima vengono visualizzati i dati di origine in formato tabulare. La visualizzazione riflette le impostazioni scelte nella sezione Proprietà. Nel menu File vengono visualizzati i dati di origine con i nomi delle colonne.
Se nel carrello dei collegamenti dati è stata trascinata una cartella contenente più file, quindi è stato fatto clic su Impostazioni per la scheda, il riquadro Anteprima include un elenco a discesa Anteprima oggetto (file) nella parte superiore del riquadro in cui sono elencati tutti i file della cartella. Selezionare il file di origine da visualizzare in anteprima dall'elenco.
Scheda Tabella
Nella scheda Tabella viene visualizzato l'aspetto previsto della tabella di destinazione dopo il collegamento dei dati.
Scheda SQL
Nella scheda SQL vengono visualizzati i comandi SQL che verranno eseguiti per completare questo job di collegamento dati.
È possibile visualizzare il codice SQL anche prima della creazione della tabella.
Pulsante Chiudi - Salva e chiudi il riquadro
Dopo aver immesso tutti i dettagli per il job di collegamento dati, fare clic su Chiudi nella parte inferiore della pagina. In questo modo vengono salvati i dettagli immessi e si torna al riquadro Collega dati da storage cloud.
Argomento padre: collegamento agli oggetti nello storage cloud
Eseguire il job di collegamento dati
Dopo aver aggiunto le origini dati al carrello dei collegamenti dati e aver immesso i dettagli relativi al job di collegamento dati, è possibile eseguire il job.
Per eseguire il job:
- Se non è già stato fatto, fare clic sul pulsante Chiudi nel riquadro Collega dati da storage cloud per salvare le impostazioni e chiudere il riquadro. Se una qualsiasi delle impostazioni non è valida, un messaggio di errore segnala il problema. Correggere il problema e fare clic su Close.
-
Fai clic su
Avvia nella barra dei menu del carrello dei collegamenti dati. Per arrestare il job di collegamento dati, fare clic su
Arresta.
Al termine del job di collegamento dati, nella pagina Dashboard caricamento dati vengono visualizzati i risultati del job nella sezione Carichi tabella e vista.
Una volta avviato il job di collegamento dati, è possibile visualizzare lo stato di avanzamento del job nel dashboard Caricamento dati.
Argomento padre: collegamento agli oggetti nello storage cloud
Visualizza dettagli sul job di collegamento dati dopo l'esecuzione
È possibile visualizzare lo stato di avanzamento del job nel dashboard Caricamento dati.
Al termine del job di caricamento dati, nella pagina del dashboard Caricamento dati vengono visualizzati i risultati del job. Nella parte superiore dell'intestazione del caricamento della tabella è possibile visualizzare il nome della tabella insieme alle colonne totali presenti nella tabella.
Fare clic su Report job per visualizzare il numero totale di righe elaborate correttamente e il conteggio delle righe rifiutate. È inoltre possibile visualizzare l'ora di inizio. Nel riquadro SQL del report job viene visualizzato il codice SQL equivalente del job.
Per visualizzare le informazioni su un elemento nel job, fare clic sull'icona Azioni nel caricamento tabella.
Per visualizzare un log dell'operazione di caricamento, fare clic sull'icona Log. È possibile salvare il log, cancellarlo o aggiornarlo. Fare clic su OK per chiudere il log.
Argomento padre: collegamento agli oggetti nello storage cloud
Visualizza la tabella risultante dal job Collegamento dati
Dopo aver eseguito un job di collegamento dati, è possibile visualizzare la tabella creata dal job di collegamento dati nel dashboard Caricamento dati.
Correggere il job di caricamento dati. Dopo il job di caricamento dei dati, è possibile che vengano visualizzati gli errori che si desidera correggere oppure, al momento dell'ispezione, che si desidera assegnare un nome diverso a una colonna. In questi casi, fare clic sull'opzione Ricarica nel caricamento tabella selezionato per ricaricare le schede dal carrello recente e modificarle come si era fatto prima del primo tentativo. L'icona Ricarica ricarica i dati di origine con le correzioni suggerite dallo strumento. Fare clic sull'icona Azioni nell'intestazione della tabella, fare clic su Tabella e selezionare Modifica per apportare eventuali modifiche al job di caricamento dati (ad esempio, modificare il nome di una colonna).
Argomento padre: collegamento agli oggetti nello storage cloud