Interroger des données externes sur Oracle Compute Cloud at Customer

Décrit les ensembles et les outils permettant aux déploiements d'Autonomous AI Database sur Exadata Cloud@Customer de charger, interroger et gérer des données non structurées en créant des tables externes et des tables partitionnées externes à partir d'objets dans les lacs de données.

Vous pouvez utiliser l'ensemble DBMS_CLOUD pour configurer les déploiements d'Autonomous AI Database sur Exadata Cloud@Customer afin d'accéder aux données non structurées stockées dans le seau de stockage d'objets Oracle Compute Cloud at Customer (C3).

Aperçu

Vous avez besoin d'une plateforme de données qui peut extraire des renseignements commerciaux de données structurées et non structurées. La combinaison de données structurées disponibles dans un entrepôt de données et de données non structurées disponibles dans un lac de données est appelée entrepôt avec lac de données.

Un entrepôt avec lac de données autonome permet l'analyse de données sur des données structurées et non structurées. Les données structurées sont stockées dans un entrepôt avec lac de données de l'IA autonome, tandis que les données non structurées sont stockées dans un lac de données configuré sur les seaux de stockage d'objets C3. L'entrepôt avec lac de données autonome avec intelligence artificielle peut interroger, charger et gérer des objets dans le lac de données à l'aide d'un ensemble de base de données nommé DBMS_CLOUD. Cet ensemble permet à la base de données Autonomous AI Database de créer des tables partitionnées externes et externes sur des objets de lac de données tels que des fichiers csv, txt, Avro et Parquet. Vous pouvez créer des entrepôts de données autonomes en combinant les capacités des déploiements de base de données autonome sur intelligence artificielle sur Exadata Cloud@Customer et Oracle C3.

Un entrepôt avec lac de données autonome comporte deux composants principaux : un entrepôt avec lac de données autonome d'IA et un lac de données. L'entrepôt avec lac de données autonome sur l'IA est créé à l'aide des déploiements de base de données autonome sur l'IA sur Exadata Cloud@Customer, tandis que le lac de données est créé à l'aide des seaux de stockage d'objets C3. La base de données autonome sur l'IA héberge les données relationnelles structurées, tandis que le lac de données héberge des collections de données non structurées sous forme de txt, csv, Avro, Parquet et d'autres types de fichier. Vous pouvez interroger la base de données autonome sur l'IA et la base de données détermine où trouver les résultats, que ce soit dans les données structurées, les données non structurées ou une combinaison des deux. Vous pouvez utiliser l'ensemble DBMS_CLOUD pour configurer des déploiements Autonomous AI Database sur Exadata Cloud@Customer afin de charger, d'interroger et de gérer des données non structurées en créant des tables partitionnées externes et externes à partir d'objets dans les lacs de données.

Conditions requises

Suivez les étapes ci-dessous pour configurer les seaux de stockage d'objets C3 et provisionner divers composants de base de données autonome sur l'IA. Vous devez terminer ces étapes avant de configurer le service Base de données d'IA autonome pour communiquer avec les seaux de stockage d'objets C3.
  • Créez un seau de stockage d'objets C3.
  • Créer un utilisateur et un groupe. Ajoutez l'utilisateur au groupe et configurez les politiques requises pour lui permettre de gérer les fichiers (ajout/lecture/suppression) du seau de stockage d'objets C3.
    Exemple :
    Allow group <group_name> to manage objects in tenancy where
    target.bucket.name='<new_bucket_name_created>'
  • Créez une clé d'API pour l'utilisateur créé. Dans le processus de génération de clé d'API, notez les informations suivantes : user_ocid, tenancy_ocid, fingerprint, region. En outre, enregistrez les fichiers de clés PEM publiques et privées créés lors du processus de génération de clés d'API. Ces informations sont requises pour configurer l'ensemble DBMS_CLOUD plus tard.
  • Téléchargez la chaîne d'autorité de certification https comme indiqué ci-dessous. Cette chaîne d'autorité de certification permet aux applications clients d'authentifier le seau de stockage d'objets C3 au moyen du protocole https. Les certificats https sont généralement enregistrés dans un fichier crt, par exemple c3_ca.crt. Obtenez la chaîne d'autorité de certification en pointant un navigateur vers l'URL suivante : https://iaas.domainname/cachain, où domainname est le nom du domaine DNS configuré lors du déploiement de l'infrastructure C3.
  • Créez une nouvelle machine virtuelle de calcul. Une fois la nouvelle machine virtuelle démarrée, copiez dans la machine virtuelle le fichier de clé PEM privée et le fichier de certificat https C3 créés au cours des étapes ci-dessus.
  • Créer une ressource d'infrastructure Exadata.
  • Créez une grappe de machines virtuelles autonomes.
  • Créer une base de données conteneur autonome.
  • Créer une base de données d'IA autonome.

Configuration de la base de données Autonomous AI Database pour communiquer avec le seau de stockage d'objets C3

Vous devez effectuer les deux tâches suivantes pour la base de données d'intelligence artificielle autonome afin de communiquer avec le seau de stockage d'objets C3 :
  • Ajoutez le certificat https du service de stockage d'objets C3 au portefeuille TCPS de Autonomous VM Cluster Grid Infrastructure. Par exemple, l'emplacement du portefeuille est /var/opt/oracle/dbaas_acfs/grid/tcps_wallets. Cela est nécessaire pour que la base de données Autonomous AI Database puisse authentifier la connexion https au service de stockage d'objets C3.
  • Ajoutez une entrée à la table C##CLOUD$SERVICE_dbms_cloud_store sur la base de données conteneur autonome créée ci-dessus. Cela indique à l'ensemble DBMS_CLOUD que le seau de stockage d'objets C3 est un magasin en nuage valide. Voici un exemple de commande SQL :
    SQL>INSERT INTO C##CLOUD$SERVICE.dbms_cloud_store VALUES('ORACLE_BMC','<objectstorage.mydomain.com>',null,1);
Dans les bases de données autonomes d'IA, vous ne pouvez pas effectuer les deux tâches ci-dessus en tant qu'utilisateur ordinaire. Oracle Cloud Operations doit exécuter ces deux tâches au nom de l'utilisateur ordinaire. Vous devez vous connecter à My Oracle Support (MOS) pour créer une nouvelle demande de soutien pour les opérations Oracle Cloud afin d'effectuer les deux tâches. Vous devez ajouter les informations suivantes au ticket. Vous obtiendrez ces valeurs une fois les étapes effectuées dans .
  • OCID de la ressource d'infrastructure Exadata
  • OCID de la grappe de machines virtuelles autonome
  • OCID de la base de données conteneur autonome
  • C3 URL du stockage d'objets
  • Fichier de certificat https du service de stockage d'objets C3

Une fois que Cloud Operations a terminé les tâches ci-dessus, connectez-vous à la base de données Autonomous AI Database. Utilisez la procédure DBMS_CLOUD.CREATE_CREDENTIAL pour fournir à la base de données d'intelligence artificielle autonome les informations d'authentification requises pour la connexion au seau de stockage d'objets C3. Pour plus de détails, consultez CREATE_CREDENTIAL.