Interrogation de données externes avec Autonomous AI Database

Décrit les packages et les outils permettant d'interroger et valider des données avec Autonomous AI Database.

Les données externes ne sont pas gérées par la base de données, mais vous pouvez utiliser les procédures DBMS_CLOUD pour interroger ces données externes. Bien que les requêtes sur les données externes ne soient pas aussi rapides que les requêtes sur les tables de base de données, vous pouvez adopter cette approche pour lancer rapidement l'exécution des requêtes sur les fichiers source externes et les données externes. Selon le type de table externe, vous pouvez valider des données externes à l'aide des procédures de validation DBMS_CLOUD. Les procédures de validation des données vous permettent de valider les fichiers source pour une table externe afin de permettre d'identifier les problèmes, et de corriger ces données ou d'exclure les données non valides avant d'utiliser les données.

Remarque

Si vous ne recourez pas à l'utilisateur ADMIN, assurez-vous que l'utilisateur dispose des privilèges nécessaires pour les opérations qu'il doit effectuer. Pour plus d'informations, reportez-vous à Gestion des privilèges utilisateur sur une base de données Autonomous AI - Connexion à un outil client.

Requête de données externes
Pour interroger des données dans des fichiers dans le cloud, vous devez d'abord stocker vos informations d'identification de stockage d'objet dans votre base de données Autonomous AI, puis créer une table externe à l'aide de la procédure PL/SQL DBMS_CLOUD.CREATE_EXTERNAL_TABLE.
Interrogation de données JSON dans Object Storage à l'aide de tables externes
Avec Autonomous AI Database, vous pouvez accéder aux documents JSON stockés dans Oracle Cloud Infrastructure Object Storage à l'aide de tables externes.
Requête de données externes avec des fichiers source ORC, Parquet ou Avro
La base de données Autonomous AI facilite l'accès aux données ORC, Parquet ou Avro stockées dans la banque d'objets à l'aide de tables externes. Les sources ORC, Parquet et Avro contiennent des métadonnées intégrées et la procédure DBMS_CLOUD.CREATE_EXTERNAL_TABLE peut utiliser ces métadonnées pour simplifier la création de tables externes.
Interrogation de tables externes avec partitionnement implicite
Sur la base de données Autonomous AI, vous pouvez créer des tables externes partitionnées implicites à partir de données partitionnées de style Hive ou de données partitionnées de dossier simples stockées dans votre banque d'objets cloud.
Requête de tables externes avec partitionnement spécifié dans les fichiers source
Si vous souhaitez interroger plusieurs fichiers de données dans la banque d'objets en tant que table externe unique et que les fichiers peuvent être représentés en tant que partitions logiques multiples, il est fortement recommandé d'utiliser une table partitionnée externe. L'utilisation d'une table partitionnée externe préserve le partitionnement logique de vos fichiers de données pour l'accès aux requêtes.
Requête de données partitionnées externes (avec clause de partitionnement)
Si vous voulez interroger plusieurs fichiers de données dans la banque d'objets en tant que table externe unique et que les fichiers peuvent être représentés en tant que partitions logiques multiples, il est fortement recommandé d'utiliser une table partitionnée externe. L'utilisation d'une table partitionnée externe préserve le partitionnement logique de vos fichiers de données pour l'accès aux requêtes. Utilisez la procédure DBMS_CLOUD.CREATE_EXTERNAL_PART_TABLE pour créer une table partitionnée externe.
Données de requête qui utilisent la source de lien hypertexte de table
Vous pouvez créer une table externe sur un lien hypertexte de table de base de données Autonomous AI.
Requête de données partitionnées hybrides
Si vous voulez interroger des données internes et plusieurs fichiers de données dans la banque d'objets en tant que table logique unique, vous pouvez utiliser une table partitionnée hybride pour représenter les données en tant qu'objet unique. Utilisez la procédure DBMS_CLOUD.CREATE_HYBRID_PART_TABLE pour créer une table partitionnée hybride.
Requête de fichiers dump Data Pump externes
Vous pouvez également interroger les fichiers dump Oracle Data Pump dans le cloud en créant une table externe à l'aide de DBMS_CLOUD.CREATE_EXTERNAL_TABLE.
Interrogation des données Big Data Service Hadoop (HDFS) à partir d'une base de données d'IA autonome
Vous pouvez créer des liens de base de données vers Oracle Big Data Service à partir d'une base de données d'IA autonome.
Interrogation de données externes avec Data Catalog
Oracle Cloud Infrastructure Data Catalog est le service de gestion des métadonnées pour Oracle Cloud qui vous aide à repérer les données et à prendre en charge la gouvernance des données. Il fournit un inventaire des ressources, un glossaire métier et un metastore commun pour les lacs de données.
Requête de données externes avec AWS Glue Data Catalog
Autonomous AI Database prend en charge un système de synchronisation avec une instance Amazon AWS Glue Data Catalog.
Interrogation des tables d'iceberg Apache
Autonomous AI Database prend en charge l'interrogation des tables d'iceberg Apache.
Validation des données externes
Pour valider une table externe, vous pouvez utiliser la procédure DBMS_CLOUD.VALIDATE_EXTERNAL_TABLE.
Validation des données partitionnées externes
Pour valider une table partitionnée externe, vous pouvez utiliser la procédure DBMS_CLOUD.VALIDATE_EXTERNAL_PART_TABLE. Cette procédure inclut un paramètre qui vous permet de spécifier une partition spécifique à valider.
Validation des données partitionnées hybrides
Pour valider une table partitionnée hybride, vous pouvez utiliser la procédure DBMS_CLOUD.VALIDATE_HYBRID_PART_TABLE. Cette procédure inclut un paramètre qui vous permet de spécifier une partition spécifique à valider.
Affichage des journaux pour la validation des données
Pour valider une table externe, utilisez les procédures DBMS_CLOUD.VALIDATE_EXTERNAL_TABLE, DBMS_CLOUD.VALIDATE_EXTERNAL_PART_TABLE et DBMS_CLOUD.VALIDATE_HYBRID_PART_TABLE.

Rubrique parent : Lier les données

Documentation Oracle Cloud Infrastructure

Interrogation de données externes avec Autonomous AI Database