1 Présentation d'Oracle AI Data Platform and Workbench
Ce chapitre fournit des informations et des procédures pour les nouveaux utilisateurs qui commencent à utiliser Oracle AI Data Platform Workbench.
A quoi sert Oracle AI Data Platform Workbench ?
Oracle AI Data Platform Workbench fournit un environnement intégré pour la création, l'orchestration et la mise en œuvre de workflows de données et d'IA.
- Rationalisation du repérage et de la gouvernance des données : AI Data Platform Workbench fournit un référentiel de métadonnées centralisé (catalogue maître) qui améliore la facilité de recherche et la gouvernance des données structurées et non structurées.
- Activer la collaboration sécurisée des données : grâce au contrôle d'accès basé sur RBAC, AI Data Platform Workbench permet à différentes équipes de travailler sur des ensembles de données partagés tout en maintenant des stratégies de sécurité strictes.
- Accélérer la préparation et le traitement des données : grâce aux blocs-notes intégrés et à l'orchestration des workflows, les utilisateurs peuvent nettoyer, transformer et enrichir efficacement les données.
- Prise en charge des analyses avancées et de l'IA/ML : AI Data Platform Workbench s'intègre à Apache Spark, ce qui permet aux data scientists et aux analystes d'exécuter des calculs complexes et un entraînement de modèle directement dans leur lac de données.
- Assurer une intégration transparente entre les sources de données : AI Data Platform Workbench prend en charge les catalogues externes provenant d'Autonomous Database (ADB), d'Object Storage (OS) et de sources de données tierces, ce qui permet aux utilisateurs d'interroger et d'analyser les données sans duplication.
Intégration gérée avec Open Source
Oracle AI Data Platform Workbench exploite et étend les technologies open source pour fournir une expérience puissante mais gérée.
- Apache Spark : la couche de calcul d'AI Data Platform Workbench est optimisée par Spark, ce qui permet un traitement des données distribué et évolutif.
- Prise en charge de Delta Lake : AI Data Platform Workbench tire parti de Delta Lake pour améliorer la fiabilité des données, les transactions ACID et l'évolution des schémas.
- Compatibilité Iceberg et Hudi via Delta Uniform : via Delta Uniform, AI Data Platform Workbench étend la prise en charge d'Apache Iceberg et d'Apache Hudi, ce qui permet l'interopérabilité entre différents formats de stockage. Cela permet aux utilisateurs d'adopter une stratégie de format de table unifié tout en maintenant une exécution efficace des requêtes et une gouvernance des données.
- Intégration JDBC pour les outils BI : AI Data Platform Workbench fournit des pilotes JDBC, permettant une connectivité transparente avec des outils BI externes tels qu'Oracle Analytics Cloud (OAC) et des plates-formes de visualisation tierces.
Personas pour les utilisateurs d'Oracle AI Data Platform
Oracle AI Data Platform sert une variété d'utilisateurs à travers différents rôles au sein d'une entreprise, chacun avec des besoins et des exigences uniques.
- Ingénieurs de données - Les ingénieurs de données travaillent avec des pipelines de données à grande échelle, transformant les données brutes en formats utilisables pour l'analyse. Ils s'appuient sur les fonctionnalités robustes d'AI Data Platform pour concevoir et gérer les workflows de données, ingérer des données provenant de différentes sources et garantir la qualité des données. Ils se concentrent particulièrement sur l'automatisation des processus, l'optimisation des ressources de calcul et l'intégration transparente de différents systèmes de données.
- Analystes de données - Les analystes de données utilisent la plateforme de données d'IA pour découvrir, analyser et générer des informations à partir des données. Ils nécessitent une interface intuitive et des outils pour interroger et analyser des ensembles de données volumineux. AI Data Platform leur permet de disposer de blocs-notes interactifs et d'une intégration transparente avec des outils décisionnels, ce qui les aide à transformer les données brutes en informations exploitables pour les décideurs.
- Experts en données - Les data scientists tirent parti des fonctionnalités de calcul évolutives d'AI Data Platform pour les tâches d'apprentissage automatique et d'analyse avancée. Ils ont besoin d'accéder à divers ensembles de données, à de puissants outils de traitement et à la possibilité d'exécuter des modèles complexes. Les blocs-notes alimentés par Spark d'AI Data Platform, l'intégration de l'IA/ML et la prise en charge des bibliothèques open source permettent aux data scientists de créer, tester et déployer des modèles au sein de la plate-forme.
- Data Stewards - Ces utilisateurs veillent à ce que toutes les données soient gérées conformément aux réglementations du secteur et aux politiques de l'entreprise. Ils se concentrent sur le maintien de la confidentialité des données, l'audit de l'accès et la surveillance de l'utilisation des données dans toute l'entreprise. AI Data Platform les aide à gérer les métadonnées, à appliquer des contrôles d'accès basés sur les rôles (RBAC) et à garantir une gouvernance appropriée grâce au catalogage, au suivi du lignage et aux stratégies de sécurité.
Cas d'utilisation courants pour Oracle AI Data Platform
Oracle AI Data Platform répond à divers cas d'utilisation dans différents secteurs et fonctions métier.
Architecture de Medallion
- Implémentez une architecture médaillon avec des couches de bronze, d'argent et d'or.
- Utilisez Delta Uniform et Iceberg pour un stockage efficace des données et une optimisation des requêtes.
- Offrez un accès sans copie aux sources de données externes pour des analyses transparentes.
ETL et ingénierie des données
- Utilisez des workflows et des blocs-notes basés sur Spark pour traiter, transformer et enrichir les données brutes.
- Automatisez les pipelines de données avec l'orchestration de workflow low code/no code.
- Gérer le traitement par lots à grande échelle et l'assimilation des données en temps réel.
Apprentissage automatique, IA et data science
- Entraînez et déployez des modèles de machine learning à l'aide de blocs-notes alimentés par Spark.
- Activer l'ingénierie des fonctionnalités et la transformation des données à grande échelle.
- Fournir des environnements d'exécution gérés pour les charges globales Python et PySpark.
- Créez des agents d'IA conversationnelle pour aider à extraire et à développer des données.
Enterprise Data Catalog & Governance, partage Delta
- Gestion centralisée des métadonnées pour les données structurées et non structurées.
- Contrôle d'accès basé sur les rôles (RBAC) pour un accès sécurisé aux données et une collaboration.
- Intégration avec des catalogues externes, notamment Autonomous Database (ADB) et Object Storage.
- Oracle AI Data Platform prend en charge le partage delta, ce qui permet un partage de données sécurisé, en temps réel et régi au-delà des limites de l'entreprise.
Analytique, Business Intelligence et reporting
- Connectez OCI Oracle Analytics Cloud (OAC) et des outils BI tiers via JDBC, comme Tableau, Power BI.
Intégration de données multicloud et hybride
- Activez l'exécution de requêtes fédérées sur plusieurs services OCI.
- Intégrer aux bases de données et au stockage cloud tiers pour les analyses hybrides.
- Maintenir la souveraineté et la conformité des données dans plusieurs environnements.