Interroger des données externes avec Autonomous AI Database
Décrit des ensembles et des outils pour interroger et valider des données à l'aide d'une base de données d'intelligence artificielle autonome.
Les données externes ne sont pas gérées par la base de données; toutefois, vous pouvez utiliser les procédures DBMS_CLOUD pour interroger vos données externes. Bien que les interrogations sur des données externes ne soient pas aussi rapides que les interrogations sur des tables de base de données, vous pouvez utiliser cette approche pour commencer rapidement à exécuter des interrogations sur vos fichiers sources externes et vos données externes. Selon le type de table externe, vous pouvez valider les données externes à l'aide des procédures de validation DBMS_CLOUD. Les procédures de validation des données vous permettent de valider les fichiers sources d'une table externe afin de pouvoir identifier les problèmes et corriger les données dans la table externe ou exclure les données non valides avant d'utiliser les données.
Si vous n'utilisez pas l'utilisateur
ADMIN, assurez-vous que l'utilisateur dispose des privilèges nécessaires pour les opérations que l'utilisateur doit effectuer. Pour plus d'informations, voir Gérer les privilèges d'utilisateur sur une base de données autonome avec intelligence artificielle - Connexion à un outil client.
- Interroger les données externes
Pour interroger les données des fichiers dans le nuage, vous devez d'abord stocker vos données d'identification de stockage d'objets dans votre base de données d'intelligence artificielle autonome, puis créer une table externe à l'aide de la procédure PL/SQLDBMS_CLOUD.CREATE_EXTERNAL_TABLE. - Interroger les données JSON dans le stockage d'objets à l'aide de tables externes
Avec Autonomous AI Database, vous pouvez accéder aux documents JSON stockés dans Oracle Cloud Infrastructure Object Storage à l'aide de tables externes. - Interroger des données externes avec des fichiers sources ORC, Parquet ou Avro
La base de données autonome de l'IA facilite l'accès aux données ORC, Parquet ou Avro stockées dans le magasin d'objets à l'aide de tables externes. Les sources ORC, Parquet et Avro comportent des métadonnées et la procédureDBMS_CLOUD.CREATE_EXTERNAL_TABLEpeut utiliser ces métadonnées pour simplifier la création de tables externes. - Interroger les tables externes avec partitionnement implicite
Dans Autonomous AI Database, vous pouvez créer des tables externes partitionnées implicites à partir de données partitionnées de style Hive ou à partir de données partitionnées de dossier simple stockées dans votre magasin d'objets en nuage. - Interroger les tables externes avec un partitionnement spécifié dans les fichiers sources
Si vous voulez interroger plusieurs fichiers de données dans le magasin d'objets en tant que table externe unique et que les fichiers peuvent être représentés en tant que plusieurs partitions logiques, il est fortement recommandé d'utiliser une table partitionnée externe. L'utilisation d'une table partitionnée externe préserve le partitionnement logique de vos fichiers de données pour l'accès aux interrogations. - Interroger les données partitionnées externes (avec clause de partitionnement)
Si vous voulez interroger plusieurs fichiers de données dans le magasin d'objets en tant que table externe unique et que les fichiers peuvent être représentés en tant que plusieurs partitions logiques, il est vivement recommandé d'utiliser une table partitionnée externe. L'utilisation d'une table partitionnée externe préserve le partitionnement logique de vos fichiers de données pour l'accès aux interrogations. Utilisez la procédureDBMS_CLOUD.CREATE_EXTERNAL_PART_TABLEpour créer une table partitionnée externe. - Interroger les données qui utilisent la source d'hyperlien de table
Vous pouvez créer une table externe sur un hyperlien de table de base de données du service d'intelligence artificielle autonome. - Interroger les données partitionnées hybrides
Si vous voulez interroger des données internes et plusieurs fichiers de données dans le magasin d'objets en tant que table logique unique, vous pouvez utiliser une table partitionnée hybride pour représenter les données en tant qu'objet unique. Utilisez la procédureDBMS_CLOUD.CREATE_HYBRID_PART_TABLEpour créer une table partitionnée hybride. - Interroger les fichiers de vidage d'extraction de données externes
Vous pouvez également interroger les fichiers de vidage d'Oracle Data Pump dans le nuage en créant une table externe à l'aide deDBMS_CLOUD.CREATE_EXTERNAL_TABLE. - Interroger les données Hadoop (HDFS) du service de mégadonnées à partir d'une base de données autonome d'IA
Vous pouvez créer des liens de base de données vers Oracle Big Data Service à partir d'une base de données autonome d'IA. - Interroger les données externes à l'aide du catalogue de données
Oracle Cloud Infrastructure Data Catalog est le service de gestion des métadonnées pour Oracle Cloud, qui vous aide à détecter les données et à prendre en charge la gouvernance des données. Il fournit un inventaire des ressources, un glossaire d'entreprise et un magasin de métadonnées commun pour les lacs de données. - Interroger des données externes avec AWS Glue Data Catalog
Autonomous AI Database prend en charge un système de synchronisation avec une instance Amazon AWS Glue Data Catalog. - Interroger les tables Apache Iceberg
Autonomous AI Database prend en charge l'interrogation des tables Apache Iceberg. - Valider les données externes
Pour valider une table externe, vous pouvez utiliser la procédureDBMS_CLOUD.VALIDATE_EXTERNAL_TABLE. - Valider les données partitionnées externes
Pour valider une table partitionnée externe, vous pouvez utiliser la procédureDBMS_CLOUD.VALIDATE_EXTERNAL_PART_TABLE. Cette procédure comprend un paramètre qui vous permet de spécifier une partition spécifique à valider. - Valider les données partitionnées hybrides
Pour valider une table partitionnée hybride, vous pouvez utiliser la procédureDBMS_CLOUD.VALIDATE_HYBRID_PART_TABLE. Cette procédure comprend un paramètre qui vous permet de spécifier une partition spécifique à valider. - Voir les journaux pour la validation des données
Pour valider une table externe, utilisez les procéduresDBMS_CLOUD.VALIDATE_EXTERNAL_TABLE,DBMS_CLOUD.VALIDATE_EXTERNAL_PART_TABLEetDBMS_CLOUD.VALIDATE_HYBRID_PART_TABLE.
Rubrique parent : Lier des données