Utilisation du lac de données avec Autonomous Database
Découvrez les avantages de l'utilisation d'un lac de données avec Autonomous Database.
- A propos du lac de données avec Autonomous Database
Oracle Autonomous Database est une solution polyvalente pour prendre en charge tous les types de données et de charge globale. - Qu'est-ce qu'un data lake ?
Les lacs de données sont des référentiels centralisés conçus pour stocker de grandes quantités de données brutes dans leur format natif jusqu'à ce que les données soient nécessaires à l'analyse. - Fonctionnalités clés du lac de données d'Autonomous Database
Oracle Autonomous Database est conçu pour prendre en charge de manière transparente les charges globales du lac de données, éliminant ainsi le besoin de gestion ou d'installation. Il offre des fonctionnalités robustes pour gérer différents formats de données dans différents environnements cloud, garantissant ainsi une analyse flexible et complète des données.
Rubrique parent : Fonctionnalités
A propos du lac de données avec Autonomous Database
Oracle Autonomous Database est une solution polyvalente adaptée à tous les types de données et de charge de travail.
Autonomous Database fournit un stockage économique, avec un coût par To comparable aux banques d'objets, tout en prenant en charge divers types de données tels que JSON, Graph et Vector. Avec Autonomous Database, les entreprises peuvent consolider leurs données sur une seule plate-forme. Ils peuvent tirer parti des fonctionnalités convergées telles qu'Oracle Machine Learning (OML), Graph, Spatial, Vector et Blockchain pour gérer leurs données de manière complète.
Pour les entreprises qui ont déjà des lacs de données existants sur d'autres plates-formes, Oracle Autonomous Database s'intègre de manière transparente, ce qui permet aux entreprises de bénéficier des fonctionnalités avancées d'Autonomous Database sans perturber leurs configurations actuelles.
Pour en savoir plus, essayez la page LiveLabs Créer un lac de données avec Autonomous Data Warehouse.
Rubrique parent : Utilisation d'un lac de données avec Autonomous Database
Qu'est-ce qu'un data lake ?
Les lacs de données sont des référentiels centralisés conçus pour stocker de grandes quantités de données brutes dans leur format natif jusqu'à ce que les données soient nécessaires à l'analyse.
Ils sont extrêmement flexibles et évolutifs, ce qui en fait un complément puissant aux entrepôts de données traditionnels en permettant aux entreprises de stocker et de traiter divers types de données, notamment structurées, semi-structurées et non structurées.
-
Ouvrir les formats de fichier et de table
Les lacs de données stockent les données dans des formats de fichier ouverts, tels que CSV, Parquet et de table, comme Iceberg. Cela garantit l'interopérabilité et la flexibilité dans le traitement des données en permettant à plusieurs moteurs d'écrire et de lire ces ensembles de données.
-
Prise en charge de plusieurs moteurs de traitement des données
Les lacs de données sont compatibles avec divers moteurs de traitement des données, tels qu'Apache Spark, Presto et Hive, permettant ainsi diverses charges de travail analytiques.
-
Schéma en lecture
Les lacs de données utilisent souvent une approche de type schéma sur lecture, ce qui signifie qu'il n'est pas nécessaire de définir un schéma à l'avance. Cela permet une assimilation rapide des données, où les données peuvent être chargées sans structure préalable, tout comme les banques d'objets qui "capturent les données maintenant et posent des questions plus tard".
-
Prise en charge des données non structurées
Au-delà des données structurées, les lacs de données peuvent stocker des données non structurées telles que des images (JPG), des documents (PDF, Word) et d'autres données binaires, offrant une solution de stockage complète.
Rubrique parent : Utilisation d'un lac de données avec Autonomous Database
Caractéristiques clés des lacs de données d'Autonomous Database
Oracle Autonomous Database est conçu pour prendre en charge de manière transparente les charges de travail des lacs de données, éliminant ainsi le besoin de gestion ou d'installation. Il offre des fonctionnalités robustes pour gérer différents formats de données dans différents environnements cloud, garantissant ainsi une analyse flexible et complète des données.
- Prêt pour les charges de travail de lac de données
Oracle Autonomous Database est entièrement prêt pour les charges de travail de lac de données prêtes à l'emploi, ne nécessitant aucun composant supplémentaire. Cette disponibilité s'étend aux tâches clés du lac de données telles que la transformation des données, la gestion des métadonnées et l'intégration aux outils de lac de données populaires, le tout disponible dès le premier jour sans configuration supplémentaire. - Multi-Cloud Support
Pour les entreprises qui ont déjà des lacs de données existants sur d'autres plates-formes, Autonomous Database s'intègre en toute transparence, ce qui permet aux entreprises de bénéficier des fonctionnalités avancées d'Autonomous Database sans interrompre leurs configurations actuelles. - Prise en charge des formats de données de bout en bout
Oracle Autonomous Database est conçu avec la flexibilité nécessaire pour gérer un large éventail de formats de données, ce qui en fait une solution universelle pour diverses sources de données et charges de travail. - Fonctionnalités améliorées : Autonomous Database pour la gestion des données non structurées
Alors qu'Oracle Database est reconnu pour son traitement puissant des données structurées et semi-structurées, Autonomous Database étend ses capacités pour gérer également les ensembles de données non structurés. - Gestion flexible des métadonnées
Oracle Autonomous Database fournit aux utilisateurs différentes façons de définir des métadonnées pour leurs ensembles de données, ce qui rend la gestion des données plus adaptable et efficace. - Prise en charge des métadonnées fédérées
Autonomous Database prend en charge un catalogue de métadonnées fédéré, permettant aux utilisateurs d'unifier les métadonnées de différentes sources dans une vue unique, fournissant une interface unifiée pour la gestion des métadonnées. - Collaboration
Une fois l'analyse terminée, les utilisateurs doivent souvent partager leurs résultats avec d'autres utilisateurs. Oracle Autonomous Database facilite le partage en offrant plusieurs façons de collaborer, offrant des avantages uniques par rapport aux autres bases de données, tels que des fonctionnalités de sécurité intégrées, des protocoles ouverts et une connectivité cloud transparente. - Large compatibilité avec les outils Oracle Database
L'environnement Autonomous Database est entièrement compatible avec un large éventail d'outils de base de données Oracle.
Rubrique parent : Utilisation d'un lac de données avec Autonomous Database
Prêt pour les charges globales de lac de données
Oracle Autonomous Database est entièrement prêt pour les charges de travail de lac de données prêtes à l'emploi, ne nécessitant aucun composant supplémentaire. Cette disponibilité s'étend aux tâches clés du lac de données telles que la transformation des données, la gestion des métadonnées et l'intégration aux outils de lac de données populaires, le tout disponible dès le premier jour sans configuration supplémentaire.
Cette préparation complète fait qu'Autonomous Database se démarque, offrant une expérience intégrée et sans tracas qui accélère le délai d'analyse des charges de travail des lacs de données. Cela signifie que les utilisateurs peuvent immédiatement commencer à gérer les tâches de lac de données sans aucune configuration, ce qui en fait une véritable solution plug-and-play pour les environnements de lac de données. Cette fonctionnalité intégrée simplifie les opérations, réduit les coûts de maintenance et garantit une fiabilité accrue avec moins d'erreurs.
Autonomous Database fournit un ensemble d'outils pour tous les types d'utilisateur, des développeurs aux analystes métier, ce qui rend la plate-forme universelle et accessible.
Les développeurs peuvent utiliser des outils tels que l'API PL/SQL pour les opérations avancées, les scripts et l'automatisation, ce qui permet une intégration transparente avec les outils existants et la création efficace de solutions de base de données personnalisées. Pour plus d'informations, reportez-vous à Référence de package fourni par Autonomous Database.
Pour les utilisateurs professionnels, Data Studio peut être utilisé : une interface Web pour simplifier l'interaction, l'exploration et la visualisation des données. Data Studio permet aux utilisateurs non techniques de générer des informations, de créer des rapports et de collaborer efficacement, réduisant ainsi la complexité et prenant en charge une prise de décision éclairée. Pour plus d'informations, reportez-vous à Page Aperçu de Data Studio.
Rubrique parent : Fonctionnalités clés du lac de données d'Autonomous Database
Support multi-Cloud Support
Pour les entreprises qui ont déjà des lacs de données existants sur d'autres plates-formes, Autonomous Database s'intègre de manière transparente, ce qui permet aux entreprises de bénéficier des fonctionnalités avancées d'Autonomous Database sans perturber leurs configurations actuelles.
Fournissez l'accès Autonomous Database à votre lac de données en accordant les privilèges et l'accès nécessaires pour que votre lac de données soit connecté à Autonomous Database. Une fois que vous avez fourni les informations d'identification nécessaires, Autonomous Database peut se connecter facilement aux lacs de données dans divers environnements cloud, y compris AWS, Azure, Google Cloud et la banque d'objets Oracle OCI.
Cette fonctionnalité vous permet d'accéder à vos données et de les gérer en toute sécurité, en tirant parti des fonctionnalités de sécurité natives de chaque fournisseur cloud. Grâce à cette prise en charge multicloud, vous bénéficiez de la flexibilité nécessaire pour déployer et faire évoluer votre lac de données sur différentes plates-formes cloud tout en conservant un environnement unifié et sécurisé.
Oracle Autonomous Database prend en charge la sécurité native pour les autres clouds. Pour en savoir plus, reportez-vous à Utilisation des noms de ressource Amazon pour accéder aux ressources AWS, à Utilisation du principal de service Azure pour accéder aux ressources Azure et à Utilisation du compte de service Google pour accéder aux ressources de la plate-forme Google Cloud pour la plate-forme cloud correspondante.
Rubrique parent : Fonctionnalités clés du lac de données d'Autonomous Database
Prise en charge des formats de données de bout en bout
Oracle Autonomous Database est conçu avec la flexibilité nécessaire pour gérer un large éventail de formats de données, ce qui en fait une solution universelle pour diverses sources de données et charges de travail.
Que vos données résident dans des formats structurés, semi-structurés ou non, Autonomous Database les prend en charge de manière transparente dans divers environnements cloud. Cela permet aux entreprises d'ingérer, de stocker et d'analyser des données sans se soucier de la compatibilité des formats.
Autonomous Database fournit une prise en charge native des formats traditionnels tels que CSV et JSON, ainsi que des formats avancés tels que AVRO, Parquet et ORC. Pour plus d'informations, reportez-vous à Requête de données externes avec Autonomous Database. Autonomous Database prend en charge les formats de fichier suivants : CSV, JSON, XML, AVRO, ORC, Parquet, Delta Sharing, Iceberg, Word, PDF.
Avec la prise en charge supplémentaire du format Iceberg Table, Autonomous Database offre des fonctionnalités améliorées pour les environnements de lac de données à grande échelle. Iceberg permet d'effectuer des requêtes optimisées et hautes performances, d'améliorer le contrôle des versions et de faciliter la gestion des données, ce qui en fait un bon choix pour les grands ensembles de données en évolution. Pour plus d'informations, reportez-vous à Interrogation des tables d'iceberg Apache.
Rubrique parent : Fonctionnalités clés du lac de données d'Autonomous Database
Fonctionnalités améliorées : Autonomous Database pour la gestion de données non structurées
Bien qu'Oracle Database soit reconnu pour son traitement puissant des données structurées et semi-structurées, Autonomous Database étend ses capacités pour gérer également les ensembles de données non structurés.
- Informations basées sur l'IA avec la génération augmentée de récupération (RAG) : Autonomous Database intègre des modèles d'IA avancés, permettant à Vector Search de rechercher des données non structurées. Cela permet une récupération efficace des informations pertinentes dans des ensembles de données massifs à l'aide de l'IA, améliorant ainsi la précision et la vitesse de recherche. Pour plus d'informations, reportez-vous à Sélectionner une IA avec la génération augmentée d'extraction (RAG).
- Indexation de texte complet : Autonomous Database prend en charge la création d'index de texte complet sur des fichiers non structurés, ce qui permet d'effectuer des recherches de texte avancées sur des documents tels que des PDF, des fichiers Word, etc. Cette fonctionnalité améliore considérablement la façon dont le contenu non structuré peut être interrogé, indexé et analysé. Reportez-vous à Utilisation de la recherche de texte intégral sur des fichiers dans Object Storage
- Analyser et charger des données non structurées : les fonctionnalités améliorées d'analyse et d'assimilation des données d'Autonomous Database permettent aux utilisateurs de charger des données non structurées en toute transparence, de les transformer automatiquement en un format tabulaire, prêt à être chargé dans la base de données. Pour plus d'informations, reportez-vous à Exécution d'une extraction de table à partir d'une image.
- L'IA en tant que source de données (invite à table) : tirant parti de l'IA, Autonomous Database permet des fonctionnalités d'invite à table, permettant aux utilisateurs de générer des données directement à partir de modèles d'IA et de les charger dans des tables. Cela ouvre la possibilité d'extraire des informations précieuses des sorties générées par l'IA et de les utiliser comme une nouvelle source de données structurées. Reportez-vous à Chargement de données à partir d'une source d'IA
Ces fonctionnalités étendues positionnent Autonomous Database comme un outil puissant pour gérer les demandes croissantes de données non structurées, tout en exploitant les solutions basées sur l'IA, ce qui en fait une plate-forme polyvalente et pérenne pour les défis de données modernes.
Rubrique parent : Fonctionnalités clés du lac de données d'Autonomous Database
Gestion flexible des métadonnées
Oracle Autonomous Database offre aux utilisateurs différentes façons de définir des métadonnées pour leurs ensembles de données, ce qui rend la gestion des données plus adaptable et efficace.
- Intégration des métadonnées basées sur le catalogue
Les utilisateurs peuvent regrouper les métadonnées de différents catalogues dans une vue centralisée, ce qui facilite le contrôle et le maintien de la cohérence des données au sein de l'entreprise. Catalogues pris en charge :
-
OCI Data Catalog : outil d'Oracle Cloud Infrastructure (OCI) qui aide les utilisateurs à repérer, organiser et gérer les ressources de données. Il offre une vue claire de toutes les ressources de données, aidant les utilisateurs à maintenir la conformité, à garantir la qualité des données et à faciliter la collaboration entre les équipes. Pour plus d'informations, reportez-vous à Exemple : MovieStream Scenario.
-
AWS Glue : service ETL géré (extraction, transformation, chargement) d'Amazon Web Services qui inclut un catalogue de données pour l'organisation et la gestion des métadonnées. Pour plus d'informations, reportez-vous à Interrogation des données externes avec AWS Glue Data Catalog.
-
- Définition manuelle des métadonnées
Les utilisateurs peuvent également définir des métadonnées directement au niveau de la table pour les ensembles de données dans les banques d'objets telles qu'Oracle Cloud Infrastructure (OCI) Object Storage ou Amazon S3. Cela permet une organisation personnalisée des données pour des fichiers individuels ou des groupes de fichiers, adaptée aux besoins des utilisateurs. Autonomous Database peut également inférer automatiquement les métadonnées, telles que les noms de colonne et les types de données, afin de gagner du temps et de réduire les erreurs. Par exemple, lors du téléchargement d'un fichier CSV, le système peut automatiquement détecter les en-têtes en tant que noms de colonne et affecter les types de données appropriés tels que le nombre ou varchar2 en fonction du contenu. Les utilisateurs peuvent ainsi préparer rapidement leurs données pour analyse sans intervention manuelle, ce qui réduit le temps de configuration et réduit les risques d'erreur.
Rubrique parent : Fonctionnalités clés du lac de données d'Autonomous Database
Prise en charge des métadonnées fédérées
Autonomous Database prend en charge un catalogue de métadonnées fédéré, permettant aux utilisateurs d'unifier les métadonnées de différentes sources dans une vue unique, fournissant une interface unifiée pour la gestion des métadonnées.
Cette approche simplifie la gestion des métadonnées dans différents environnements en connectant les sources de données entre plusieurs clouds et plates-formes. Qu'il s'agisse d'utiliser des métadonnées basées sur un catalogue ou de les définir manuellement, toutes les informations sont disponibles dans un catalogue unifié pour faciliter la navigation. Par exemple, une entreprise peut utiliser cette vue fédérée pour gérer les ressources de données d'AWS et d'Oracle Cloud, ce qui garantit une gouvernance et une découverte cohérentes entre les plates-formes.
Rubrique parent : Fonctionnalités clés du lac de données d'Autonomous Database
Collaboration
Une fois l'analyse terminée, les utilisateurs doivent souvent partager leurs résultats avec d'autres utilisateurs. Oracle Autonomous Database facilite le partage en offrant plusieurs façons de collaborer, offrant des avantages uniques par rapport aux autres bases de données, tels que des fonctionnalités de sécurité intégrées, des protocoles ouverts et une connectivité cloud transparente.
Ces options sont conçues pour être flexibles et sécurisées, afin qu'elles répondent à différents besoins de collaboration :
-
Protocole de partage Delta : permet de partager des données en dehors d'Oracle à l'aide d'un protocole ouvert appelé Partage Delta. Il prend en charge le partage de données sécurisé avec des partenaires externes, sans nécessiter d'intégration complexe, ce qui en fait un outil idéal pour les analyses inter-cloud et multi-plateformes. De cette façon, les données peuvent être utilisées en douceur dans différents outils d'analyse qui ne font pas partie d'Oracle. Pour plus d'informations, reportez-vous à Partage de versions de données à l'aide d'Object Storage.
-
Liens cloud : vous pouvez partager des données entre différentes instances Autonomous Database à l'aide de liens cloud sécurisés. Par exemple, les Cloud Links sont particulièrement efficaces pour connecter différentes bases de données. Cela garantit une disponibilité des données cohérente et réduit la latence pour les applications qui ont besoin d'un accès rapide et fiable aux données de plusieurs bases de données, sans avoir à les copier ou les dupliquer. La collaboration est fluide pour les équipes qui sont réparties et qui doivent travailler ensemble. Reportez-vous à Partage de données réelles à l'aide d'une connexion directe
-
Liens hypertexte de table : vous pouvez partager des données directement en créant des URL spéciales qui donnent accès aux données sans avoir besoin d'une connexion distincte. Les utilisateurs peuvent contrôler les autorisations et définir des délais d'expiration pour ces URL, garantissant ainsi des options de partage sécurisées et flexibles. Cette fonctionnalité est spécialement conçue pour les clients REST. Pour plus d'informations, reportez-vous à Générer un lien hypertexte de table pour une table ou une vue.
Rubrique parent : Fonctionnalités clés du lac de données d'Autonomous Database
Compatibilité étendue avec les outils Oracle Database
L'environnement Autonomous Database est entièrement compatible avec un large éventail d'outils de base de données Oracle.
Tout outil que vous utilisez déjà pour interagir avec les bases de données Oracle, que ce soit pour la visualisation des données, l'analyse, l'ETL ou l'administration, peut également être exploité de manière transparente pour analyser les ensembles de données dans Autonomous Database. Cette compatibilité garantit une expérience fluide, permettant aux utilisateurs d'intégrer Autonomous Database dans leurs workflows existants sans avoir à adopter de nouveaux outils ou processus, optimisant ainsi l'efficacité et réduisant la courbe d'apprentissage.
Pour plus d'informations sur quelques-uns des outils disponibles à utiliser avec les bases de données Oracle, reportez-vous à Page Aperçu de Data Studio.
Rubrique parent : Fonctionnalités clés du lac de données d'Autonomous Database