Interroger des données externes sur Oracle Compute Cloud at Customer

Décrit les packages et les outils permettant aux déploiements de base de données d'IA autonome sur Exadata Cloud@Customer de charger, d'interroger et de gérer des données non structurées en créant des tables externes et des tables partitionnées externes à partir d'objets dans les lacs de données.

Vous pouvez utiliser le package DBMS_CLOUD pour configurer des déploiements de base de données d'IA autonome sur Exadata Cloud@Customer afin d'accéder aux données non structurées stockées sur le bucket Object Storage Oracle Compute Cloud at Customer (C3).

Présentation

Vous avez besoin d'une plateforme de données capable d'extraire des informations commerciales à partir de données structurées et non structurées. La combinaison des données structurées disponibles dans un entrepôt de données et des données non structurées disponibles dans un lac de données est appelée data lakehouse.

Un data lakehouse autonome permet l'analyse des données sur des données structurées et non structurées. Les données structurées sont stockées dans un lakehouse Autonomous AI, tandis que les données non structurées sont stockées dans un lac de données configuré sur des buckets C3 Object Storage. Le lakehouse Autonomous AI peut interroger, charger et gérer des objets dans le lac de données à l'aide d'un package de base de données appelé DBMS_CLOUD. Ce package permet à la base de données Autonomous AI de créer des tables partitionnées externes et externes sur des objets de lac de données tels que des fichiers csv, txt, Avro et Parquet. Vous pouvez créer des data lakehouses autonomes en combinant les fonctionnalités des déploiements de base de données d'IA autonome sur Exadata Cloud@Customer et Oracle C3.

Un data lakehouse autonome comporte deux composants principaux : un lakehouse d'IA autonome et un data lake. Le lakehouse Autonomous AI est construit à l'aide de déploiements de base de données Autonomous AI sur Exadata Cloud@Customer, tandis que le lac de données est construit à l'aide de buckets C3 Object Storage. La base de données Autonomous AI héberge les données relationnelles structurées, tandis que le lac de données héberge des collections de données non structurées sous la forme de txt, csv, Avro, Parquet et d'autres types de fichier. Vous pouvez interroger la base de données d'IA autonome et la base de données détermine où trouver les résultats, que ce soit dans les données structurées, les données non structurées ou une combinaison des deux. Vous pouvez utiliser le package DBMS_CLOUD pour configurer des déploiements de base de données Autonomous AI sur Exadata Cloud@Customer afin de charger, d'interroger et de gérer des données non structurées en créant des tables partitionnées externes et externes à partir d'objets dans les lacs de données.

Prérequis

Suivez les étapes ci-dessous pour configurer des buckets C3 Object Storage et provisionner divers composants de base de données Autonomous AI. Vous devez terminer ces étapes avant de configurer la base de données Autonomous AI pour communiquer avec les buckets C3 Object Storage.

Configuration d'une base de données Autonomous AI pour communiquer avec le bucket Object Storage C3

Vous devez effectuer les deux tâches suivantes pour que la base de données Autonomous AI communique avec le bucket Object Storage C3 :

Dans les bases de données Autonomous AI, vous ne pouvez pas effectuer les deux tâches ci-dessus en tant qu'utilisateur standard. Oracle Cloud Operations doit exécuter ces deux tâches pour le compte de l'utilisateur standard. Vous devez vous connecter à My Oracle Support (MOS) pour créer une demande d'assistance pour les opérations Oracle Cloud afin d'effectuer les deux tâches. Vous devez ajouter les informations suivantes au ticket. Vous obtiendrez ces valeurs une fois que vous aurez terminé les étapes dans .

Une fois que Cloud Operations a terminé les tâches ci-dessus, connectez-vous à la base de données Autonomous AI. Utilisez la procédure DBMS_CLOUD.CREATE_CREDENTIAL pour fournir à la base de données Autonomous AI les informations d'authentification requises pour la connexion au bucket Object Storage C3. Pour plus d'informations, reportez-vous à CREATE_CREDENTIAL.