Partie II Gestion des données
L'atelier de plate-forme de données d'Oracle AI Data Platform Workbench permet aux organisations de gérer efficacement toutes leurs données et métadonnées sur OCI Object Storage et d'autres sources externes telles qu'Autonomous Database, Kafka, etc. Il fournit des métadonnées centralisées pour l'ensemble de votre parc de données et permet aux entreprises de définir un contrôle d'accès unifié pour leurs données structurées, semi-structurées et non structurées.
AI Data Platform Workbench aide les entreprises à résoudre leurs cas d'utilisation de gestion de données en toute transparence. Diverses personnalités travaillent en tandem dans une organisation pour offrir de la valeur aux chefs d'entreprise.
- Les intendants des données doivent découvrir les ressources et les entités de données pour comprendre où se trouvent les données, comment elles sont structurées et utilisées, et ainsi gérer efficacement le cycle de vie des données/métadonnées.
- Les administrateurs de données organisent les données dans des catalogues, des schémas, des tables et des volumes pour assurer un stockage, une organisation et une extraction de données efficaces et sécurisés.
- Les ingénieurs et les analystes de données doivent partager des données avec d'autres analystes ou chefs d'entreprise pour libérer la vraie valeur des données
Détecter les données
Toutes les ressources de données dans AI Data Platform Workbench peuvent être découvertes de façon transparente à l'aide de :
- Explorateur de catalogue principal
- Explorateur de catalogue dans l'espace de travail lors de l'utilisation de carnets, fichiers SQL/python
- Grammaire SQL comme SHOW, LIST et DESCRIBE
- API
Organiser les données
Vous pouvez organiser les données dans des catalogues, des schémas, des tables et des volumes :
- Catalogue standard : Un catalogue standard est un conteneur logique pour les schémas (bases de données). Les utilisateurs peuvent créer des tables, des vues et des volumes dans un schéma. Les catalogues standard gèrent le cycle de vie des métadonnées de tous les objets enfants.
- Catalogue externe : Un catalogue externe est soutenu par des sources de données externes telles qu'Autonomous Database. Dans le cas d'un catalogue externe, les seules métadonnées sont synchronisées à partir de la source externe et les utilisateurs peuvent interroger les données résidant dans une source externe à l'aide du nom en 3 parties : catalog_name.schema.name.table_name. Dans le cas d'un catalogue externe, le cycle de vie des métadonnées est géré par la source externe et le catalogue principal conserve une copie des métadonnées. Le catalogue externe collecte uniquement les métadonnées de la source externe. Les données ne sont pas copiées dans votre plate-forme de données d'intelligence artificielle.
Vous pouvez choisir de laisser AI Data Platform Workbench gérer le cycle de vie des métadonnées, en créant :
- Tables externes, en définissant une table, son schéma et en faisant référence à un emplacement dans le service de stockage d'objets OCI, ou
- Volume externe, en définissant un volume faisant référence à un emplacement dans le stockage d'objets OCI, puis en stockant davantage de fichiers et de dossiers dans le volume
Vous pouvez également choisir de laisser AI Data Platform Workbench gérer le cycle de vie des données et des métadonnées, en créant :
- Table gérée et AI Data Platform Workbench gère l'emplacement du stockage d'objets OCI dans la location du client
- L'atelier Volume géré et AI Data Platform Workbench gère l'emplacement du stockage d'objets OCI dans la location du client afin que les utilisateurs puissent stocker des fichiers et des dossiers (données semi-structurées ou non structurées) dans le volume
Partage de données
Le partage de données dans AI Data Platform Workbench permet aux utilisateurs de partager des ressources de données avec des utilisateurs de l'organisation ainsi qu'à l'extérieur de l'organisation. Le partage de données dans AI Data Platform Workbench est construit sur le protocole Delta Share open source et pour garantir que les données sont partagées de manière sécurisée, vous pouvez appliquer des autorisations sur qui peut partager et créer des destinataires.
Alimentation automatique
La fonction d'alimentation automatique simplifie la gestion des métadonnées en détectant et en créant automatiquement des entités de données dans un catalogue standard sélectionné. Cela automatise le processus de création manuelle d'un grand nombre de tables en permettant aux utilisateurs de créer des extracteurs de métadonnées en pointant vers l'emplacement de données dans le service de stockage d'objets pour OCI.