Utilisation du lac de données avec Autonomous Database

Découvrez les avantages de l'utilisation du lac de données avec Autonomous Database.

A propos du lac de données avec Autonomous Database

Oracle Autonomous Database est une solution polyvalente qui s'adapte à tous les types de données et de charges de travail.

Autonomous Database fournit un stockage rentable, avec un coût par To comparable aux banques d'objets, tout en prenant en charge divers types de données tels que JSON, Graph et Vector. Avec Autonomous Database, les entreprises peuvent consolider leurs données sur une seule plate-forme. Ils peuvent tirer parti de fonctionnalités convergentes telles qu'Oracle Machine Learning (OML), Graph, Spatial, Vector et Blockchain pour gérer leurs données de manière exhaustive.

Pour les entreprises qui disposent déjà de lacs de données sur d'autres plates-formes, Oracle Autonomous Database s'intègre de manière transparente, ce qui permet aux entreprises de bénéficier des fonctionnalités avancées d'Autonomous Database sans perturber leurs configurations actuelles.

Pour en savoir plus, essayez LiveLabs Créer un lac de données avec Autonomous Data Warehouse.

Qu'est-ce qu'un lac de données ?

Les lacs de données sont des référentiels centralisés conçus pour stocker de grandes quantités de données brutes dans leur format natif jusqu'à ce que les données soient nécessaires à l'analyse.

Ils sont hautement flexibles et évolutifs, ce qui en fait un complément puissant aux entrepôts de données traditionnels en permettant aux entreprises de stocker et de traiter divers types de données, y compris structurées, semi-structurées et non structurées.

Attributs clés d'un lac de données :
  • Ouvrir les formats de fichier et de table

    Les lacs de données stockent les données dans des formats de fichier ouverts, tels que CSV, Parquet et des formats de table comme Iceberg. Cela garantit l'interopérabilité et la flexibilité du traitement des données en permettant à plusieurs moteurs d'écrire et de lire ces ensembles de données.

  • Prise en charge de plusieurs moteurs de traitement des données

    Les lacs de données sont compatibles avec divers moteurs de traitement de données, tels qu'Apache Spark, Presto et Hive, permettant des charges de travail analytiques diverses.

  • Schéma en lecture

    Les lacs de données utilisent souvent une approche de schéma en lecture, ce qui signifie qu'il n'est pas nécessaire de définir un schéma à l'avance. Cela permet une ingestion rapide des données, où les données peuvent être chargées sans structuration préalable, tout comme les banques d'objets qui "capturent les données maintenant et posent des questions plus tard".

  • Prise en charge des données non structurées

    Au-delà des données structurées, les data lakes peuvent stocker des données non structurées telles que des images (JPG), des documents (PDF, Word) et d'autres données binaires, offrant ainsi une solution de stockage complète.

Principales fonctionnalités d'Autonomous Database pour les lacs de données

Oracle Autonomous Database est conçu pour prendre en charge de manière transparente les charges de travail des lacs de données, éliminant ainsi le besoin de gestion ou d'installation. Il offre des fonctionnalités robustes pour gérer différents formats de données dans différents environnements cloud, garantissant une analyse flexible et complète des données.

Prêt pour les charges globales de lac de données

Oracle Autonomous Database est entièrement prêt pour les charges de travail de lac de données prêtes à l'emploi, ne nécessitant aucun composant supplémentaire. Cette préparation s'étend aux tâches clés du lac de données telles que la transformation des données, la gestion des métadonnées et l'intégration aux outils de lac de données populaires, le tout disponible dès le premier jour sans configuration supplémentaire.

Cette disponibilité complète fait ressortir Autonomous Database, offrant une expérience intégrée et sans tracas qui accélère le délai d'analyse des workloads de lac de données. Cela signifie que les utilisateurs peuvent immédiatement commencer à gérer les tâches de lac de données sans aucune configuration, ce qui en fait une véritable solution plug-and-play pour les environnements de lac de données. Cette fonctionnalité intégrée simplifie les opérations, réduit les coûts de maintenance et garantit une fiabilité accrue avec moins d'erreurs.

Autonomous Database fournit un ensemble d'outils pour tous les types d'utilisateur, des développeurs aux analystes métier, rendant la plate-forme universelle et accessible.

Les développeurs peuvent utiliser des outils tels que l'API PL/SQL pour les opérations avancées, les scripts et l'automatisation, ce qui permet une intégration transparente aux outils existants et la création efficace de solutions de base de données personnalisées. Pour plus d'informations, reportez-vous à Référence de package fourni avec Autonomous Database.

Pour les utilisateurs professionnels, Data Studio peut être utilisé : une interface Web pour simplifier l'interaction, l'exploration et la visualisation des données. Data Studio permet aux utilisateurs non techniques de générer des informations, de créer des rapports et de collaborer efficacement, réduisant ainsi la complexité et prenant en charge une prise de décision éclairée. Pour plus d'informations, reportez-vous à Page Aperçu de Data Studio.

Support multi-Cloud Support

Pour les entreprises qui disposent déjà de lacs de données sur d'autres plates-formes, Autonomous Database s'intègre de manière transparente, ce qui permet aux entreprises de bénéficier des fonctionnalités avancées d'Autonomous Database sans perturber leurs configurations actuelles.

Fournissez à Autonomous Database l'accès à votre lac de données en accordant les privilèges et l'accès nécessaires pour que votre lac de données soit connecté à Autonomous Database. Une fois que vous avez fourni les informations d'identification nécessaires, Autonomous Database peut se connecter de manière transparente aux lacs de données dans divers environnements cloud, y compris AWS, Azure, Google Cloud et la banque d'objets Oracle OCI.

Cette fonctionnalité vous permet d'accéder à vos données et de les gérer en toute sécurité, en tirant parti des fonctionnalités de sécurité natives de chaque fournisseur cloud. Grâce à cette prise en charge multicloud, vous bénéficiez de la flexibilité nécessaire pour déployer et faire évoluer votre lac de données sur différentes plates-formes cloud tout en conservant un environnement unifié et sécurisé.

Oracle Autonomous Database prend en charge la sécurité native pour les autres clouds. Pour en savoir plus, reportez-vous à Utilisation des noms de ressource Amazon pour accéder aux ressources AWS, à Utilisation du principal de service Azure pour accéder aux ressources Azure et à Utilisation du compte de service Google pour accéder aux ressources Google Cloud Platform pour la plate-forme cloud correspondante.

Prise en charge des formats de données de bout en bout

Oracle Autonomous Database est conçu avec la flexibilité nécessaire pour gérer un large éventail de formats de données, ce qui en fait une solution universelle pour diverses sources de données et charges de travail.

Que vos données résident dans des formats structurés, semi-structurés ou non structurés, Autonomous Database les prend en charge de manière transparente dans divers environnements cloud. Cela permet aux entreprises d'ingérer, de stocker et d'analyser des données sans se soucier de la compatibilité des formats.

Autonomous Database fournit une prise en charge native des formats traditionnels tels que CSV et JSON, ainsi que des formats avancés tels qu'AVRO, Parquet et ORC. Pour plus d'informations, reportez-vous à Interrogation de données externes avec Autonomous Database. Autonomous Database prend en charge les formats de fichier suivants : CSV, JSON, XML, AVRO, ORC, Parquet, Partage delta, Iceberg, Word, PDF.

Grâce à la prise en charge du format de table Iceberg, Autonomous Database offre des fonctionnalités améliorées pour les environnements de lac de données à grande échelle. Iceberg permet des requêtes optimisées et hautes performances, un meilleur contrôle des versions et une gestion des données plus facile, ce qui en fait un bon choix pour les ensembles de données volumineux et évolutifs. Pour plus d'informations, reportez-vous à Interrogation des tables Apache Iceberg.

Fonctionnalités améliorées : Autonomous Database pour la gestion des données non structurées

Bien qu'Oracle Database soit reconnu pour son puissant traitement de données structurées et semi-structurées, Autonomous Database étend ses capacités à gérer également les ensembles de données non structurés.

Ces fonctionnalités comprennent la gestion et l'analyse d'un large éventail de formats tels que JPG, PDF, documents Word, etc. Grâce à ces avancées, Autonomous Database apporte une solution complète aux entreprises qui traitent avec des sources de données non structurées.
  • Informations basées sur l'IA avec génération augmentée d'extraction (RAG) : Autonomous Database intègre des modèles d'IA avancés, permettant ainsi la recherche vectorielle de données non structurées. Cela permet une récupération efficace des informations pertinentes sur des ensembles de données massifs à l'aide de l'IA, améliorant ainsi la précision et la vitesse des recherches. Pour plus d'informations, reportez-vous à Sélection d'IA avec génération augmentée de récupération (RAG).
  • Indexation de texte intégral : Autonomous Database prend en charge la création d'index de texte intégral sur des fichiers non structurés, ce qui permet d'effectuer des recherches de texte avancées sur des documents tels que des PDF, des fichiers Word, etc. Cette fonctionnalité améliore considérablement la façon dont le contenu non structuré peut être interrogé, indexé et analysé. Reportez-vous à Utilisation de la recherche de texte intégral sur des fichiers dans Object Storage.
  • Analyser et charger des données non structurées : les fonctionnalités améliorées d'analyse et d'ingestion de données d'Autonomous Database permettent aux utilisateurs de charger des données non structurées de manière transparente, en les transformant automatiquement en tableau, prêtes à être chargées dans la base de données. Pour plus d'informations, reportez-vous à Exécution de l'extraction de table à partir d'une image.
  • L'IA en tant que source de données (de l'invite à la table) : grâce à l'IA, Autonomous Database active les fonctionnalités d'invite à la table, permettant aux utilisateurs de générer des données directement à partir de modèles d'IA et de les charger dans des tables. Cela ouvre la possibilité d'extraire des informations précieuses à partir des résultats générés par l'IA et de les utiliser comme nouvelle source de données structurées. Reportez-vous à Chargement des données à partir d'une source AI

Ces fonctionnalités étendues positionnent Autonomous Database comme un outil puissant pour gérer les demandes croissantes de données non structurées, tout en exploitant les solutions alimentées par l'IA, ce qui en fait une plate-forme polyvalente et pérenne pour les défis de données modernes.

Gestion flexible des métadonnées

Oracle Autonomous Database offre aux utilisateurs diverses façons de définir les métadonnées de leurs ensembles de données, ce qui rend la gestion des données plus adaptable et plus efficace.

  • Intégration de métadonnées basée sur un catalogue

    Les utilisateurs peuvent centraliser les métadonnées de différents catalogues, ce qui facilite le contrôle et le maintien de la cohérence des données au sein de l'entreprise. Les catalogues pris en charge sont les suivants :

    • OCI Data Catalog : outil au sein d'Oracle Cloud Infrastructure (OCI) qui aide les utilisateurs à découvrir, organiser et gérer les ressources de données. Il offre une vue claire de toutes les ressources de données, aidant les utilisateurs à maintenir la conformité, à garantir la qualité des données et à faciliter la collaboration entre les équipes. Pour plus d'informations, reportez-vous à Exemple : scénario MovieStream.

    • Colle AWS : service ETL géré (extraction, transformation, chargement) à partir d'Amazon Web Services, qui inclut un catalogue de données pour l'organisation et la gestion des métadonnées. Pour plus d'informations, reportez-vous à Interrogation de données externes avec AWS Glue Data Catalog.

  • Définition de métadonnées manuelles

    Les utilisateurs peuvent également définir des métadonnées directement au niveau de la table pour les ensembles de données dans les banques d'objets, telles qu'Oracle Cloud Infrastructure (OCI) Object Storage ou Amazon S3. Cela permet une organisation personnalisée des données pour des fichiers individuels ou des groupes de fichiers, adaptée aux besoins des utilisateurs. Autonomous Database peut également inférer automatiquement des métadonnées, telles que des noms de colonne et des types de données, pour gagner du temps et réduire les erreurs. Par exemple, lors du chargement d'un fichier CSV, le système peut détecter automatiquement les en-têtes en tant que noms de colonne et affecter les types de données appropriés, tels que number ou varchar2, en fonction du contenu. Cela aide les utilisateurs à préparer rapidement leurs données pour analyse sans intervention manuelle, réduisant ainsi le temps de configuration et minimisant les risques d'erreur.

Prise en charge des métadonnées fédérées

Autonomous Database prend en charge un catalogue de métadonnées fédéré, permettant aux utilisateurs d'unifier les métadonnées de différentes sources dans une vue unique, fournissant ainsi une interface unifiée pour la gestion des métadonnées.

Cette approche simplifie la gestion des métadonnées dans divers environnements en connectant les sources de données sur plusieurs clouds et plates-formes. Que vous utilisiez des métadonnées basées sur un catalogue ou que vous les définissiez manuellement, toutes les informations sont disponibles dans un catalogue unifié pour une navigation facile. Par exemple, une organisation peut utiliser cette vue fédérée pour gérer les ressources de données à partir d'AWS et d'Oracle Cloud, garantissant ainsi une gouvernance et une découverte cohérentes entre les plates-formes.

Collaboration

Une fois que les utilisateurs ont terminé leur analyse, ils doivent souvent partager leurs résultats avec d'autres. Oracle Autonomous Database facilite le partage en offrant plusieurs façons de collaborer, offrant des avantages uniques par rapport aux autres bases de données, tels que des fonctionnalités de sécurité intégrées, des protocoles ouverts et une connectivité cloud transparente.

Ces options sont conçues pour être flexibles et sécurisées, de sorte qu'elles répondent à différents besoins de collaboration :

  • Protocole de partage Delta : cette option vous permet de partager des données en dehors d'Oracle à l'aide d'un protocole ouvert appelé Delta Sharing. Il prend en charge le partage sécurisé des données avec des partenaires externes, sans nécessiter d'intégration complexe, ce qui le rend idéal pour les analyses inter-cloud et inter-plateformes. De cette façon, les données peuvent être utilisées en douceur dans différents outils d'analyse qui ne font pas partie d'Oracle. Pour plus d'informations, reportez-vous à Partage de versions de données à l'aide d'Object Storage.

  • Liens cloud : vous pouvez partager des données entre différentes instances Autonomous Database à l'aide de liens cloud sécurisés. Par exemple, les liens cloud sont particulièrement efficaces pour connecter différentes bases de données. Cela garantit une disponibilité cohérente des données et réduit la latence pour les applications nécessitant un accès rapide et fiable aux données sur plusieurs bases de données, sans avoir à copier ni dupliquer. La collaboration reste fluide pour les équipes réparties et qui ont besoin de travailler ensemble. Reportez-vous à Partage de données réelles à l'aide d'une connexion directe.

  • Hyperliens de table : vous pouvez partager des données directement en créant des URL spéciales qui donnent accès aux données sans avoir besoin d'une connexion distincte. Les utilisateurs peuvent contrôler les autorisations et définir des délais d'expiration pour ces URL, garantissant ainsi des options de partage sécurisées et flexibles. Cette fonctionnalité est spécialement conçue pour les clients REST. Pour plus d'informations, reportez-vous à Génération d'un lien hypertexte de table pour une table ou une vue.

Grande compatibilité avec les outils Oracle Database

L'environnement Autonomous Database est entièrement compatible avec un large éventail d'outils de base de données Oracle.

Tout outil que vous utilisez déjà pour interagir avec les bases de données Oracle, que ce soit pour la visualisation des données, l'analyse, l'ETL ou l'administration, peut également être utilisé de manière transparente pour analyser les ensembles de données au sein d'Autonomous Database. Cette compatibilité garantit une expérience fluide, permettant aux utilisateurs d'intégrer Autonomous Database dans leurs workflows existants sans avoir à adopter de nouveaux outils ou processus, optimisant ainsi l'efficacité et réduisant la courbe d'apprentissage.

Pour plus d'informations sur quelques-uns des outils disponibles à utiliser avec les bases de données Oracle, reportez-vous à Page Aperçu de Data Studio.