Interrogation de données externes avec Autonomous Database
Décrit les packages et les outils permettant d'interroger et de valider des données avec Autonomous Database.
Les données externes ne sont pas gérées par la base de données, mais vous pouvez utiliser les procédures DBMS_CLOUD
pour interroger ces données externes. Bien que les requêtes sur les données externes ne soient pas aussi rapides que les requêtes sur les tables de base de données, vous pouvez adopter cette approche pour lancer rapidement l'exécution des requêtes sur les fichiers source externes et les données externes. Selon le type de table externe, vous pouvez valider des données externes à l'aide des procédures de validation DBMS_CLOUD
. Les procédures de validation des données vous permettent de valider les fichiers source pour une table externe afin de permettre d'identifier les problèmes, et de corriger ces données ou d'exclure les données non valides avant d'utiliser les données.
Si vous ne recourez pas à l'utilisateur
ADMIN
, assurez-vous que l'utilisateur dispose des privilèges nécessaires pour les opérations qu'il doit effectuer. Pour plus d'informations, reportez-vous à Gestion des privilèges utilisateur sur Autonomous Database - Connexion à un outil client.
- Requête de données externes
Pour interroger des données dans des fichiers du cloud, vous devez d'abord stocker vos informations d'identification de stockage d'objet dans votre instance Autonomous Database, puis créer une table externe à l'aide de la procédure PL/SQLDBMS_CLOUD.CREATE_EXTERNAL_TABLE
. - Requête de données externes avec des fichiers source ORC, Parquet ou Avro
Autonomous Database facilite l'accès aux données ORC, Parquet ou Avro stockées dans la banque d'objets à l'aide de tables externes. Les sources ORC, Parquet et Avro contiennent des métadonnées intégrées et la procédureDBMS_CLOUD.CREATE_EXTERNAL_TABLE
peut utiliser ces métadonnées pour simplifier la création de tables externes. - Interrogation de tables externes avec partitionnement implicite
Sur Autonomous Database, vous pouvez créer des tables externes partitionnées implicites à partir de données partitionnées de style Hive ou de données partitionnées de dossier simples stockées dans la banque d'objets cloud. - Requête de tables externes avec partitionnement spécifié dans les fichiers source
Si vous souhaitez interroger plusieurs fichiers de données dans la banque d'objets en tant que table externe unique et que les fichiers peuvent être représentés en tant que partitions logiques multiples, il est fortement recommandé d'utiliser une table partitionnée externe. L'utilisation d'une table partitionnée externe préserve le partitionnement logique de vos fichiers de données pour l'accès aux requêtes. - Requête de données partitionnées externes (avec clause de partitionnement)
Si vous voulez interroger plusieurs fichiers de données dans la banque d'objets en tant que table externe unique et que les fichiers peuvent être représentés en tant que partitions logiques multiples, il est fortement recommandé d'utiliser une table partitionnée externe. L'utilisation d'une table partitionnée externe préserve le partitionnement logique de vos fichiers de données pour l'accès aux requêtes. Utilisez la procédureDBMS_CLOUD.CREATE_EXTERNAL_PART_TABLE
pour créer une table partitionnée externe. - Requête de données utilisant la source de lien hypertexte de table
Vous pouvez créer une table externe via un lien hypertexte de table Autonomous Database. - Requête de données partitionnées hybrides
Si vous voulez interroger des données internes et plusieurs fichiers de données dans la banque d'objets en tant que table logique unique, vous pouvez utiliser une table partitionnée hybride pour représenter les données en tant qu'objet unique. Utilisez la procédureDBMS_CLOUD.CREATE_HYBRID_PART_TABLE
pour créer une table partitionnée hybride. - Requête de fichiers dump Data Pump externes
Vous pouvez également interroger les fichiers dump Oracle Data Pump dans le cloud en créant une table externe à l'aide deDBMS_CLOUD.CREATE_EXTERNAL_TABLE
. - Interrogation des données Hadoop (HDFS) Big Data Service à partir d'Autonomous Database
Vous pouvez créer des liens de base de données vers Oracle Big Data Service à partir d'Autonomous Database. - Interrogation de données externes avec Data Catalog
Oracle Cloud Infrastructure Data Catalog est le service de gestion des métadonnées pour Oracle Cloud qui vous aide à repérer les données et à prendre en charge la gouvernance des données. Il fournit un inventaire des ressources, un glossaire métier et un metastore commun pour les lacs de données. - Requête de données externes avec AWS Glue Data Catalog
Autonomous Database prend en charge un système de synchronisation avec une instance Amazon AWS Glue Data Catalog. - Interrogation des tables d'iceberg Apache
Autonomous Database prend en charge l'interrogation des tables d'iceberg Apache. - Validation des données externes
Pour valider une table externe, vous pouvez utiliser la procédureDBMS_CLOUD.VALIDATE_EXTERNAL_TABLE
. - Validation des données partitionnées externes
Pour valider une table partitionnée externe, vous pouvez utiliser la procédureDBMS_CLOUD.VALIDATE_EXTERNAL_PART_TABLE
. Cette procédure inclut un paramètre qui vous permet de spécifier une partition spécifique à valider. - Validation des données partitionnées hybrides
Pour valider une table partitionnée hybride, vous pouvez utiliser la procédureDBMS_CLOUD.VALIDATE_HYBRID_PART_TABLE
. Cette procédure inclut un paramètre qui vous permet de spécifier une partition spécifique à valider. - Affichage des journaux pour la validation des données
Pour valider une table externe, utilisez les procéduresDBMS_CLOUD.VALIDATE_EXTERNAL_TABLE
,DBMS_CLOUD.VALIDATE_EXTERNAL_PART_TABLE
etDBMS_CLOUD.VALIDATE_HYBRID_PART_TABLE
.
Rubrique parent : Lier les données