3 Caractéristiques de l'atelier de plate-forme de données d'Oracle AI

Oracle AI Data Platform Workbench est une plate-forme de données moderne conçue pour simplifier les opérations d'ingestion, de traitement et d'analyse des données à grande échelle. La solution offre une intégration transparente des capacités de calcul, de stockage et de catalogage afin de permettre une gestion efficace des données.

Les principales caractéristiques de AI Data Platform Workbench sont les suivantes :

Espace de travail

Un espace de travail dans AI Data Platform Workbench agit comme un environnement isolé où les utilisateurs peuvent gérer et organiser leurs ressources de lac de données, y compris les flux de travail, les carnets et les bibliothèques. Les espaces de travail permettent une collaboration et une gouvernance efficaces en maintenant les ressources regroupées de manière logique.

Calcul

AI Data Platform Workbench fournit des ressources de calcul évolutives d'UC et de processeur graphique pour l'exécution des charges de travail de traitement et d'analyse de données. Les utilisateurs peuvent tirer parti des environnements d'exécution basés sur Spark pour un traitement haute performance prenant en charge les charges de travail par lots et interactives.

Carnet

AI Data Platform Workbench comprend des blocs-notes en tant qu'environnement de développement interactif pour l'écriture et l'exécution de code. Il prend en charge Python et SparkSQL, ce qui permet aux utilisateurs de transformer, d'analyser et de visualiser des données directement dans AI Data Platform.

Flux de travail

Le composant de flux de travail permet aux utilisateurs de définir et d'orchestrer des pipelines de données constitués de carnets, de tâches Python, de tâches if-else et d'autres tâches de travail. Les utilisateurs peuvent créer, programmer et surveiller les flux de travail pour l'extraction, la transformation et le chargement, les transformations de données et l'automatisation des analyses.

Catalogue principal

Le catalogue principal sert de référentiel de métadonnées central pour tous les jeux de données structurés et non structurés au sein d'un AI Data Platform Workbench. Il fournit une gouvernance et une détection de données unifiées, permettant aux utilisateurs de rechercher et de gérer des jeux de données dans différents schémas et emplacements de stockage.

Catalogue

Un catalogue dans un atelier de plate-forme de données d'intelligence artificielle est un regroupement logique de schémas, de tables, de volumes et de modèles, offrant une façon structurée d'organiser les jeux de données. Les utilisateurs peuvent créer plusieurs catalogues pour différents projets ou équipes afin d'assurer une segmentation efficace des données.

Schéma

Un schéma définit la structure d'un catalogue, en organisant les tables et les vues sous un espace de noms commun. Les schémas facilitent la structuration logique des données pour différentes applications et charges de travail d'analyse.

Table

Un tableau d'un atelier de plate-forme de données d'intelligence artificielle représente des jeux de données structurés qui peuvent être interrogés et traités. Les tables prennent en charge divers formats de stockage, notamment Delta Uniform, ce qui garantit la compatibilité avec plusieurs moteurs d'interrogation.

Voir

Une vue est une table virtuelle dans un atelier AI Data Platform Workbench qui fournit une représentation interrogeable des données stockées dans des tables sous-jacentes. Les vues permettent un accès simplifié aux jeux de données transformés sans duplication des données.

Volume

Un volume est une abstraction de stockage dans un atelier de plate-forme de données d'intelligence artificielle qui fournit un espace géré pour la persistance des données brutes, traitées et organisées. Il prend en charge l'accès efficace aux données et l'intégration à Object Storage.

Alimentation automatique

La fonction Alimentation automatique simplifie la gestion des métadonnées en détectant et en enregistrant automatiquement les nouveaux jeux de données situés dans le stockage d'objets OCI. Cela réduit les tâches manuelles de mise à jour des catalogues de données.

Contrôles d'accès basés sur les rôles (RBAC)

AI Data Platform met en oeuvre RBAC pour assurer un contrôle d'accès détaillé sur différentes ressources. Les utilisateurs peuvent définir des rôles et des autorisations pour les espaces de travail, les catalogues et les jeux de données afin d'assurer une collaboration sécurisée.

Journal de vérification

Les journaux de vérification d'Oracle AI Data Platform Workbench saisissent des enregistrements détaillés des activités des utilisateurs. Ces journaux aident à surveiller l'utilisation, à assurer la conformité et à enquêter sur des problèmes tels que les accès non autorisés ou les modifications de configuration.

Espace de noms à trois parties

AI Data Platform Workbench adopte un espace de noms en trois parties (Catalog.Schema.Table) pour accéder aux jeux de données, ce qui permet un moyen structuré et cohérent de référencer les données sur l'ensemble de la plate-forme. Cette normalisation améliore l'interopérabilité et la facilité d'accès.