1 Aperçu de la plate-forme et de l'atelier de données d'Oracle AI

Ce chapitre fournit des informations et des procédures pour les nouveaux utilisateurs qui commencent avec Oracle AI Data Platform Workbench.

Dans quel cas l'atelier Plate-forme de données d'Oracle AI est-il utilisé?

Oracle AI Data Platform Workbench fournit un environnement intégré pour la création, l'orchestration et l'opérationnalisation des données et des flux de travail de l'IA.

L'atelier de plate-forme de données d'Oracle AI Data est conçu pour les entreprises qui doivent :
  • Rationaliser la détection et la gouvernance des données : AI Data Platform Workbench fournit un référentiel de métadonnées centralisé (catalogue principal) qui améliore la possibilité de recherche et la gouvernance des données structurées et non structurées.
  • Activer la collaboration sécurisée des données : Grâce au contrôle d'accès basé sur RBAC, AI Data Platform Workbench permet à différentes équipes de travailler sur des jeux de données partagés tout en respectant des politiques de sécurité strictes.
  • Accélérer la préparation et le traitement des données : Grâce aux carnets intégrés et à l'orchestration des flux de travail, les utilisateurs peuvent nettoyer, transformer et enrichir les données efficacement.
  • Prise en charge de l'analyse avancée et de l'intelligence artificielle/l'apprentissage automatique : AI Data Platform Workbench s'intègre à Apache Spark, ce qui permet aux scientifiques et aux analystes des données d'exécuter des calculs complexes et de modéliser l'entraînement directement dans leur lac de données.
  • Assurer une intégration transparente entre les sources de données : AI Data Platform Workbench prend en charge les catalogues externes à partir d'Autonomous Database (ADB), du stockage d'objets (OS) et de sources de données de tierce partie, ce qui permet aux utilisateurs d'interroger et d'analyser les données sans duplication.

Intégration gérée avec Open Source

L'atelier de plate-forme de données d'Oracle AI exploite et étend les technologies à code source libre afin de fournir une expérience puissante mais gérée.

Voici quelques intégrations clés :
  • Apache Spark : La couche de calcul de l'atelier Plate-forme de données d'IA est alimentée par Spark, ce qui permet un traitement de données réparti et évolutif.
  • Prise en charge de Delta Lake : AI Data Platform Workbench tire parti de Delta Lake pour améliorer la fiabilité des données, les transactions ACID et l'évolution des schémas.
  • Compatibilité Iceberg & Hudi avec Delta Uniform : Grâce à Delta Uniform, AI Data Platform Workbench étend la prise en charge d'Apache Iceberg et d'Apache Hudi, ce qui permet l'interopérabilité entre différents formats de stockage. Ainsi, les utilisateurs peuvent adopter une stratégie de format de table unifiée tout en assurant une exécution efficace des interrogations et une gouvernance des données.
  • Intégration JDBC pour les outils BI : AI Data Platform Workbench fournit des pilotes JDBC, ce qui permet une connectivité transparente avec des outils BI externes tels qu'Oracle Analytics Cloud (OAC) et des plates-formes de visualisation de tierce partie.

Personas pour les utilisateurs de la plate-forme de données d'Oracle AI

La plateforme de données d'Oracle AI sert une variété d'utilisateurs à différents rôles au sein d'une organisation, chacun avec des besoins et des exigences uniques.

Voici un aperçu général des principales personnes qui interagissent avec les plateformes de données d'IA :
  • Ingénieurs de données - Les ingénieurs de données travaillent avec des pipelines de données à grande échelle, transformant les données brutes en formats utilisables pour l'analyse. Ils s'appuient sur les solides capacités d'IA Data Platform pour concevoir et gérer des flux de travail de données, ingérer des données provenant de diverses sources et assurer la qualité des données. Ils se concentrent principalement sur l'automatisation des processus, l'optimisation des ressources de calcul et l'intégration transparente de différents systèmes de données.
  • Analystes de données - Les analystes de données utilisent la plate-forme de données d'IA pour découvrir, analyser et générer des informations à partir des données. Ils ont besoin d'une interface intuitive et d'outils pour interroger et analyser de grands jeux de données. AI Data Platform leur permet de profiter de calepins électroniques interactifs et d'une intégration transparente avec des outils de veille stratégique, ce qui les aide à transformer les données brutes en informations exploitables pour les décideurs.
  • Scientifiques des données - Les scientifiques des données tirent parti des capacités de calcul évolutives de la plate-forme de données d'IA pour les tâches d'apprentissage automatique et d'analyse avancée. Ils ont besoin d'un accès à divers jeux de données, de puissants outils de traitement et de la capacité d'exécuter des modèles complexes. Les blocs-notes alimentés par Spark, l'intégration d'intelligence artificielle et d'apprentissage automatique de la plate-forme et la prise en charge des bibliothèques à code source libre permettent aux scientifiques des données de créer, de tester et de déployer des modèles au sein de la plate-forme.
  • Gestionnaires de données - Ces utilisateurs veillent à ce que toutes les données soient traitées conformément aux réglementations de l'industrie et aux politiques organisationnelles. Ils se concentrent sur le maintien de la confidentialité des données, la vérification des accès et la surveillance de l'utilisation des données dans l'ensemble de l'organisation. AI Data Platform les aide à gérer les métadonnées, à appliquer les contrôles d'accès basés sur les rôles et à assurer une gouvernance appropriée grâce au catalogue, au suivi du lignage et aux politiques de sécurité.

Cas d'utilisation communs pour la plate-forme de données d'Oracle AI

La plateforme de données d'Oracle AI sert une variété de cas d'utilisation dans toutes les industries et les fonctions d'affaires.

Architecture Médaillon

  • Implémentez une architecture Medallion avec des couches de bronze, d'argent et d'or.
  • Utilisez Delta Uniform et Iceberg pour un stockage efficace des données et une optimisation des requêtes.
  • Permettre un accès à zéro copie aux sources de données externes pour des analyses transparentes.

ETL et ingénierie des données

  • Utilisez des flux de travail et des carnets basés sur Spark pour traiter, transformer et enrichir des données brutes.
  • Automatisez les pipelines de données avec une orchestration de flux de travail avec codage réduit ou sans codage.
  • Gérer le traitement par lots à grande échelle et l'ingestion de données en temps réel.

Apprentissage automatique, intelligence artificielle et science des données

  • Entraînez et déployez des modèles d'apprentissage automatique à l'aide de blocs-notes alimentés par Spark.
  • Activer l'ingénierie des fonctions à grande échelle et la transformation des données.
  • Fournir des environnements d'exécution gérés pour les charges de travail Python et PySpark.
Création d'agents d'intelligence artificielle tirant parti des données d'entreprise
  • Créez des agents conversationnels d'IA pour faciliter l'extraction et le développement de données.

Catalogue de données d'entreprise et gouvernance, Delta Sharing

  • Gestion centralisée des métadonnées pour les données structurées et non structurées.
  • Contrôle d'accès basé sur les rôles (RBAC) pour un accès sécurisé aux données et une collaboration.
  • Intégration avec des catalogues externes, notamment Autonomous Database (ADB) et le service de stockage d'objets.
  • La plateforme de données d'Oracle AI prend en charge Delta Sharing, ce qui permet un partage de données sécurisé, en temps réel et gouverné au-delà des frontières organisationnelles.

Analyses, intelligence d'affaires et rapports

  • Connecter OCI Oracle Analytics Cloud (OAC) et des outils d'intelligence d'affaires tiers au moyen de JDBC tels que Tableau, Power BI.

Intégration de données multicloud et hybride

  • Activer l'exécution d'une interrogation fédérée sur plusieurs services OCI.
  • Intégrez au stockage et aux bases de données en nuage de tierce partie pour l'analyse hybride.
  • Préservez la souveraineté et la conformité des données dans plusieurs environnements.