Tabelle
Le tabelle definiscono la struttura dei dati.
È possibile caricare nuovi dati nelle tabelle o dati di riferimento in una posizione esistente. È possibile definire autorizzazioni di controllo dell'accesso con filtro per le tabelle creando autorizzazioni per le tabelle.
Le tabelle possono essere esterne o gestite.
Tabelle esterne
Una tabella esterna definisce una struttura per i dati memorizzati in una posizione non gestita da Oracle AI Data Platform Workbench. Quando si crea una tabella esterna in AI Data Platform Workbench, il ciclo di vita dei metadati viene gestito da AI Data Platform Workbench. Quando si elimina una tabella esterna, viene eliminata solo la definizione della tabella. I dati a cui fa riferimento la tabella esterna non sono stati eliminati.
Assicurarsi che gli utenti dispongano dei criteri IAM seguenti necessari per creare tabelle esterne:
allow group <GroupName> to read buckets in compartment id <external-data-CompartmentId>
allow group <GroupName> to inspect objects in compartment id <external-data-CompartmentId>Per le tabelle esterne sono necessari criteri IAM aggiuntivi. Per ulteriori informazioni, vedere Policy IAM per Oracle AI Data Platform Workbench.
Tabelle gestite
Una tabella gestita definisce una struttura per i dati memorizzati all'interno di AI Data Platform e accessibili solo agli utenti di AI Data Platform Workbench.
Quando si elimina una tabella gestita, la definizione della tabella e i dati della tabella vengono eliminati.
Formati tabella supportati
| Formato | Descrizione | Utilizzo |
|---|---|---|
| Valori CSV (comma-separated-values) | I dati vengono memorizzati come file di testo con un formato file basato su riga specificato per strutturare i dati. In genere, la prima riga del file è una riga di intestazione che contiene i nomi delle colonne per i dati. | Utilizzato per scambiare dati tabulari tra sistemi. Ogni riga del file è una riga di una tabella. |
| JavaScript Object Notation (JSON) | I dati vengono memorizzati in un formato standard basato su testo per rappresentare i dati strutturati in base alla sintassi dell'oggetto JavaScript. JSON supporta liste di oggetti o strutture gerarchiche. | Utilizzato nelle applicazioni di flusso. JSON semplifica lo storage dei dati correlati con relazioni complesse in un singolo documento ed evita la conversione caotica degli elenchi in un modello di dati relazionale. Si noti che JSON non è frazionabile. |
| Avro | I dati vengono memorizzati in un formato binario basato su righe mentre lo schema viene memorizzato in formato JSON per ridurre al minimo le dimensioni dei file e massimizzare l'efficienza. Avro ha un supporto affidabile per l'evoluzione dello schema gestendo i campi aggiunti, mancanti e modificati. Ciò consente al vecchio software di leggere nuovi dati e al nuovo software di leggere i vecchi dati. Conosciuto anche come sistema di serializzazione dei dati. | Utilizzato per l'archiviazione dei dati in quanto i file avro sono divisibili e comprimibili. Lo storage serializzato basato su righe è ideale per transazioni di scrittura complesse, come l'inserimento di dati in AI Data Platform. Avro è anche una buona scelta quando l'evoluzione dello schema è critica durante le scritture ad alta velocità. |
| Parquet | I dati vengono memorizzati in un formato di dati colonnari ed è altamente comprimibile e divisibile. Parquet è ottimizzato per il paradigma Write Once Read Many (WORM). Scrive lentamente ma legge incredibilmente rapidamente, soprattutto quando si accede solo a un sottoinsieme di colonne. | Utilizzato per risolvere i problemi dei Big Data poiché gli algoritmi di compressione funzionano meglio con il formato dei dati colonnari. È possibile memorizzare i Big Data in vari formati, ad esempio immagini, video, documenti e tabelle di dati strutturati. Parquet è una buona scelta per carichi di lavoro pesanti durante la lettura di porzioni di dati. Ad esempio, quando il set di dati contiene molte colonne, ma si desidera accedere solo a un subset di colonne. Ideale quando si è dipendenti da Spark o quando si desidera che più servizi accedano agli stessi dati memorizzati nello storage degli oggetti. |
| ORC (Optimized Row Columnar) | I dati vengono memorizzati in raccolte di righe in un singolo file in formato colonnare. | Utilizzato per l'elaborazione parallela delle raccolte di righe in un cluster. Ideale quando le transazioni di lettura sono più di transazioni di scrittura o quando la compressione è la priorità. |
| Delta | I dati vengono memorizzati in un formato a colonne che estende i file di dati Parquet con un log delle transazioni basato su file JSON per le transazioni ACID e la gestione scalabile dei metadati. | Utilizzato per il supporto delle transazioni. |
Limitazioni
Le seguenti limitazioni si applicano alle tabelle di Oracle AI Data Platform:
- Non è possibile definire una tabella esterna in file di dati o directory all'interno di un volume.
- Impossibile definire una tabella esterna in un bucket e/o la relativa directory già utilizzata per un'altra tabella esterna o volume esterno
- Impossibile visualizzare/elencare le viste nel catalogo principale.
Crea tabella esterna
È possibile creare una tabella esterna con dati nello storage degli oggetti OCI.
Modifica di una tabella
È possibile modificare i dettagli delle tabelle gestite.
- Passare allo schema.
- Selezionare la scheda Tabelle.
- Avanti alla tabella che si desidera modificare, fare clic su
Azioni.- Fare clic su Rinomina per modificare il nome della tabella. Immettere un nuovo nome, quindi premere Invio.
- Fare clic su Modifica descrizione per modificare la descrizione della tabella. Fornire la nuova descrizione e fare clic su Salva.
Visualizza dettagli tabella
È possibile visualizzare i dettagli delle tabelle nello schema.
- Passare allo schema. Fare clic sulla scheda Tabelle.
- Fare clic sul nome del volume per il quale si desidera visualizzare i dettagli. È inoltre possibile fare clic su
Azioni accanto al volume, quindi fare clic su Visualizza. - Fare clic sulla scheda Dettagli.

