Partie II Gestion des données

Oracle AI Data Platform Workbench permet aux entreprises de gérer efficacement toutes leurs données et métadonnées dans OCI Object Storage et d'autres sources externes telles qu'Autonomous Database, Kafka, etc. Elle fournit des métadonnées centralisées dans l'ensemble de votre parc de données et permet aux entreprises de définir un contrôle d'accès unifié pour leurs données structurées, semi-structurées et non structurées.

AI Data Platform Workbench aide les entreprises à résoudre leurs cas d'utilisation de la gestion des données en toute transparence. Divers personnages travaillent en tandem dans une organisation pour offrir de la valeur aux chefs d'entreprise.

  • Les architectes de données doivent découvrir les ressources et les entités de données pour comprendre où se trouvent les données, comment elles sont structurées et utilisées, gérant ainsi efficacement le cycle de vie des données/métadonnées.
  • Les administrateurs de données organisent les données dans des catalogues, des schémas, des tables et des volumes, afin de garantir un stockage, une organisation et une extraction efficaces et sécurisés des données.
  • Les ingénieurs et les analystes de données doivent partager des données avec d'autres analystes ou chefs d'entreprise pour exploiter la véritable valeur des données

Repérer les données

Toutes les ressources de données d'AI Data Platform Workbench peuvent être repérées en toute transparence à l'aide des éléments suivants :

  • Explorateur de catalogue principal
  • Catalog Explorer dans Workspace lors de l'utilisation de blocs-notes, de fichiers SQL/python
  • Grammaire SQL telle que SHOW, LIST et DESCRIBE
  • API

Organiser les données

Vous pouvez organiser les données dans des catalogues, des schémas, des tables et des volumes :

  • Catalogue standard : un catalogue standard est un conteneur logique pour les schémas (bases de données), les utilisateurs peuvent créer des tables, des vues et des volumes dans un schéma. Les catalogues standard gèrent le cycle de vie des métadonnées de tous les objets enfant.
  • Catalogue externe : un catalogue externe est soutenu par des sources de données externes telles qu'Autonomous Database. Dans le cas d'un catalogue externe, les seules métadonnées sont synchronisées à partir de la source externe et les utilisateurs peuvent interroger les données résidant dans une source externe à l'aide du nom en 3 parties, tel que catalog_name.schema.name.table_name. Dans le cas d'un catalogue externe, le cycle de vie des métadonnées est géré par la source externe et le catalogue maître conserve une copie des métadonnées. External Catalog collecte uniquement les métadonnées de la source externe, les données ne sont pas copiées dans votre plate-forme de données AI.

Vous pouvez choisir de laisser AI Data Platform Workbench gérer le cycle de vie des métadonnées en créant les éléments suivants :

  • tables externes, en définissant une table, son schéma et en faisant référence à un emplacement dans OCI Object Storage, ou
  • Volume externe, en définissant un volume faisant référence à un emplacement dans OCI Object Storage, puis en stockant davantage les fichiers et dossiers dans le volume

Vous pouvez également choisir de laisser AI Data Platform Workbench gérer le cycle de vie des données et des métadonnées, en créant les éléments suivants :

  • Table gérée et AI Data Platform Workbench gèrent l'emplacement OCI Object Storage dans la location du client
  • Le volume géré et AI Data Platform Workbench gèrent l'emplacement OCI Object Storage dans la location du client afin que les utilisateurs puissent stocker des fichiers et des dossiers (données semi-structurées ou non structurées) dans le volume

Partage de données

Le partage de données dans AI Data Platform Workbench permet aux utilisateurs de partager des ressources de données avec des utilisateurs de l'organisation ainsi qu'en dehors de l'organisation. Le partage de données dans AI Data Platform Workbench est basé sur le protocole Delta Share open source et pour garantir que les données sont partagées de manière sécurisée, vous pouvez appliquer des autorisations sur les personnes autorisées à partager et à créer des destinataires.

Renseigner automatiquement

La fonctionnalité d'alimentation automatique simplifie la gestion des métadonnées en détectant et en créant automatiquement des entités de données dans un catalogue standard sélectionné. Cela automatise le processus de création manuelle d'un grand nombre de tables en permettant aux utilisateurs de créer des extracteurs de métadonnées en pointant vers l'emplacement des données dans OCI Object Storage.