Exporter des données au format Parquet vers un répertoire

Affiche les étapes d'exportation des données de table de votre base de données d'intelligence artificielle autonome vers un répertoire en tant que données Parquet en spécifiant une interrogation.

  1. Connectez-vous à votre instance de base de données Autonomous AI Database.

    Pour plus d'informations, voir Se connecter à Autonomous AI Database.

  2. Créer un répertoire.

    Exemple :

    CREATE DIRECTORY export_dir AS 'export_dir';
    Pour plus d'informations, voir Créer un répertoire dans Autonomous AI Database.
  3. Exécutez DBMS_CLOUD.EXPORT_DATA et spécifiez le paramètre format type avec la valeur json pour exporter les résultats en tant que fichiers Parquet dans un répertoire. N'incluez pas le paramètre credential lors de l'envoi de la sortie vers un répertoire.
    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => 'export_dir:sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    Le nom du répertoire est sensible à la casse lorsque le nom du répertoire est entre guillemets doubles. Exemple :

    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => '"export_dir":sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    Pour des informations détaillées sur les paramètres, voir ProcédureEXPORT_DATA.

    Pour des informations détaillées sur les paramètres format disponibles que vous pouvez utiliser avec DBMS_CLOUD.EXPORT_DATA, voir Options de format d'ensemble DBMS_CLOUD pour EXPORT_DATA.

    Les paramètres sont les suivants :

    • file_uri_list : Liste délimitée par des virgules des fichiers d'exportation. L'utilisation de caractères génériques et de caractères de substitution n'est pas prise en charge dans file_uri_list.

    • format : Spécifie le paramètre type requis. Les valeurs valides sont datapump, json, xml, csv et parquet et définit également facultativement les options que vous pouvez spécifier pour l'exportation avec le pilote d'accès ORACLE_DATAPUMP.

    • query : Spécifie un énoncé SELECT afin que seules les données requises soient exportées. L'interrogation détermine le contenu des fichiers dump.

    Pour des informations détaillées sur les paramètres, voir ProcédureEXPORT_DATA.

Notes pour l'exportation avec DBMS_CLOUD.EXPORT_DATA :

  • Le paramètre query que vous fournissez peut être une interrogation avancée, si nécessaire, telle qu'une interrogation incluant des jointures ou des sous-interrogations.

  • Spécifiez le paramètre format avec l'option compression pour compresser les fichiers de sortie.

  • Voir Mappage du type de données Oracle à Parquet de l'ensemble DBMS_CLOUD pour plus de détails sur le mappage du type Oracle au type Parquet.

    Les types suivants ne sont pas pris en charge ou leur prise en charge pour l'exportation de Parquet avec DBMS_CLOUD.EXPORT_DATA est limitée :

    Type Oracle Notes

    BFILE

    Non pris en charge

    BLOB

    Non pris en charge

    DATE

    Prise en charge de la limitation suivante : Le format DATE prend en charge uniquement la date, le mois et l'année. Les heures, les minutes et les secondes ne sont pas prises en charge.

    Voir DBMS_CLOUD Ensemble de mappage de type de données Oracle à Parquet pour plus de détails sur les limitations de format NLS pour l'exportation de DATE à Parquet.

    INTERVAL DAY TO SECOND

    Pris en charge et traité comme une chaîne en interne

    INTERVAL YEAR TO MONTH

    Pris en charge et traité comme une chaîne en interne

    LONG

    Non pris en charge

    LONG RAW

    Non pris en charge

    NUMBER

    Pris en charge avec les limitations suivantes :

    • Peut avoir une précision maximale de 38 et une échelle inférieure à la précision.
    • Si aucune précision et échelle n'est fournie pour le type de colonne NUMBER, la précision par défaut 38 et l'échelle 20 sont utilisées.
    • L'échelle négative n'est pas prise en charge pour les types NUMBER.

    Object Types

    Non pris en charge

    TIMESTAMP

    Pris en charge avec les limitations suivantes :

    • S'il existe plusieurs colonnes avec une précision différente, la plus grande précision sera prise.
    • TIMESTAMP WITH TIME ZONE Le type de données Oracle utilisera uniquement l'horodatage.

    Voir DBMS_CLOUD Ensemble de mappage de type de données Oracle à Parquet pour plus de détails sur les limitations de format NLS pour l'exportation de TIMESTAMP à Parquet.