Tableaux
Les tables définissent la structure de vos données.
Vous pouvez charger de nouvelles données dans vos tables ou référencer des données dans un emplacement existant. Vous pouvez définir des droits d'accès de contrôle d'accès de niveau fin sur les tables en créant des droits d'accès de table.
Les tables peuvent être externes ou gérées.
Tables externes
Une table externe définit une structure pour les données stockées dans un emplacement non géré par Oracle AI Data Platform Workbench. Lorsque vous créez une table externe dans AI Data Platform Workbench, le cycle de vie des métadonnées est géré par AI Data Platform Workbench. Lorsque vous supprimez une table externe, seule la définition de la table est supprimée. Les données référencées par la table externe ne sont pas supprimées.
Assurez-vous que les stratégies IAM suivantes sont requises pour créer des tables externes aux utilisateurs :
allow group <GroupName> to read buckets in compartment id <external-data-CompartmentId>
allow group <GroupName> to inspect objects in compartment id <external-data-CompartmentId>Des stratégies IAM supplémentaires sont requises pour les tables externes. Pour plus d'informations, reportez-vous à Stratégies IAM pour Oracle AI Data Platform Workbench.
Tables gérées
Une table gérée définit une structure pour les données stockées dans AI Data Platform et accessibles uniquement par les utilisateurs d'AI Data Platform Workbench.
Lorsque vous supprimez une table gérée, la définition et les données de la table sont supprimées.
Formats de table pris en charge
| Format | Description | Utilisation |
|---|---|---|
| Valeurs séparées par des virgules (CSV) | Les données sont stockées sous forme de fichier texte avec un format de fichier basé sur une ligne spécifique pour structurer les données. En général, la première ligne du fichier est une ligne d'en-tête qui contient les noms de colonne des données. | Utilisé pour échanger des données tabulaires entre les systèmes. Chaque ligne du fichier est une ligne d'une table. |
| JavaScript Object Notation (JSON) | Les données sont stockées dans un format texte standard pour représenter des données structurées en fonction de la syntaxe d'objet JavaScript. JSON prend en charge les listes d'objets ou les structures hiérarchiques. | Utilisé dans les applications de flux. JSON simplifie le stockage des données associées avec des relations complexes dans un seul document et évite la conversion chaotique des listes en un modèle de données relationnel. Notez que JSON n'est pas splittable. |
| Avro | Les données sont stockées dans un format binaire basé sur des lignes, tandis que le schéma est stocké au format JSON afin de réduire la taille du fichier et d'optimiser l'efficacité. Avro offre une prise en charge fiable de l'évolution des schémas en gérant les champs ajoutés, manquants et modifiés. Cela permet aux anciens logiciels de lire de nouvelles données et aux nouveaux logiciels de lire d'anciennes données. Egalement appelé système de sérialisation des données. | Utilisé pour le stockage de données car les fichiers avro sont divisibles et compressibles. Le stockage en ligne sérialisé est idéal pour les transactions d'écriture lourdes, telles que l'insertion de données dans AI Data Platform. Avro est également un bon choix lorsque l'évolution du schéma est critique lors des écritures à grande vitesse. |
| Parquet | Les données sont stockées dans un format de données en colonnes et sont hautement compressibles et séparables. Parquet est optimisé pour le paradigme Write Once Read Many (WORM). Il écrit lentement mais se lit incroyablement rapidement, surtout lorsque vous accédez uniquement à un sous-ensemble de colonnes. | Utilisé pour résoudre les problèmes de Big Data car les algorithmes de compression fonctionnent mieux avec le format de données en colonnes. Vous pouvez stocker le Big Data dans différents formats, tels que des images, des vidéos, des documents et des tables de données structurées. Parquet est un bon choix pour les charges de travail lourdes lors de la lecture de parties de données. Par exemple, lorsque l'ensemble de données comporte de nombreuses colonnes, mais que vous souhaitez uniquement accéder à un sous-ensemble de colonnes. Idéal lorsque vous dépendez de Spark ou que vous voulez que plusieurs services accèdent aux mêmes données stockées dans Object Storage. |
| Colonne de ligne optimisée (ORC) | Les données sont stockées dans des ensembles de lignes dans un fichier unique au format colonne. | Utilisé pour le traitement parallèle des ensembles de lignes dans un cluster. Idéal lorsque les transactions de lecture sont plus que des transactions d'écriture ou lorsque la compression est prioritaire. |
| Delta | Les données sont stockées dans un format en colonnes qui étend les fichiers de données Parquet avec un journal de transactions basé sur un fichier JSON pour les transactions ACID et la gestion évolutive des métadonnées. | Utilisé pour la prise en charge des transactions. |
Limites
Les limitations suivantes s'appliquent aux tables d'Oracle AI Data Platform :
- Vous ne pouvez pas définir de table externe sur des fichiers de données ou des répertoires dans/sur un volume.
- Vous ne pouvez pas définir une table externe sur un bucket et/ou son répertoire qui est déjà utilisé pour une autre table externe ou un autre volume externe
- Les vues ne peuvent pas être affichées/répertoriées dans le catalogue principal.
Créer une table externe
Vous pouvez créer une table externe avec des données dans OCI Object Storage.
Modifier un tableau
Vous pouvez modifier les détails des tables que vous gérez.
- Accédez à votre schéma.
- Sélectionnez l'onglet Tables.
- En regard de la table à modifier, cliquez sur
Actions.- Cliquez sur Renommer pour modifier le nom de la table. Saisissez un nouveau nom, puis appuyez sur Entrée.
- Cliquez sur Modifier la description pour modifier la description de votre table. Fournissez la nouvelle description et cliquez sur Enregistrer.
Visualiser les détails de la table
Vous pouvez visualiser les détails des tables du schéma.
- Accédez à votre schéma. Cliquez sur l'onglet Tables.
- Cliquez sur le nom du volume pour lequel afficher les détails. Vous pouvez également cliquer sur
Actions en regard du volume, puis sur Visualiser. - Cliquez sur l'onglet Détails.

