Export de données au format Parquet vers un répertoire

Présente les étapes d'export des données de table de votre instance Autonomous Database vers un répertoire en tant que données Parquet en indiquant une requête.

  1. Connectez-vous à votre instance Autonomous Database.

    Pour plus d'informations, reportez-vous à Connexion à Autonomous Database.

  2. Créer un répertoire.

    Par exemple :

    CREATE DIRECTORY export_dir AS 'export_dir';
    Pour plus d'informations, reportez-vous à Création d'un répertoire dans Autonomous Database.
  3. Exécutez DBMS_CLOUD.EXPORT_DATA et indiquez le paramètre format type avec la valeur json pour exporter les résultats en tant que fichiers Parquet vers un répertoire. N'incluez pas le paramètre credential lors de l'envoi de la sortie vers un répertoire.
    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => 'export_dir:sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    Le nom de répertoire est sensible à la casse lorsque le nom de répertoire est placé entre guillemets doubles. Par exemple :

    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => '"export_dir":sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    Pour obtenir des informations détaillées sur les paramètres, reportez-vous à la procédure EXPORT_DATA.

    Pour plus d'informations sur les paramètres format disponibles que vous pouvez utiliser avec DBMS_CLOUD.EXPORT_DATA, reportez-vous à DBMS_CLOUD Options de format de package pour EXPORT_DATA.

    Les paramètres sont les suivants :

    • file_uri_list : liste délimitée par des virgules des fichiers d'export. L'utilisation de caractères génériques et de caractères de substitution n'est pas prise en charge dans file_uri_list.

    • format : indique le paramètre type requis. Les valeurs valides sont datapump, json, xml, csv et parquet. Vous pouvez également définir les options que vous pouvez indiquer pour l'export avec le pilote d'accès ORACLE_DATAPUMP.

    • query : indique une instruction SELECT de sorte que seules les données requises soient exportées. L'interrogation détermine le contenu du ou des fichiers dump.

    Pour obtenir des informations détaillées sur les paramètres, reportez-vous à la procédure EXPORT_DATA.

Notes pour l'exportation avec DBMS_CLOUD.EXPORT_DATA :

  • Le paramètre query que vous fournissez peut être une requête avancée, si nécessaire, telle qu'une requête qui inclut des jointures ou des sous-requêtes.

  • Indiquez le paramètre format avec l'option compression pour compresser les fichiers de sortie.

  • Reportez-vous à DBMS_CLOUD Mise en correspondance du type de données Oracle avec le parquet pour plus d'informations sur la mise en correspondance du type Oracle avec le type de parquet.

    Les types suivants ne sont pas pris en charge ou leur prise en charge de l'export de Parquet avec DBMS_CLOUD.EXPORT_DATA est limitée :

    Type Oracle Remarques

    BFILE

    Non pris en charge

    BLOB

    Non pris en charge

    DATE

    Prise en charge avec la limitation suivante : le format DATE ne prend en charge que la date, le mois et l'année. Les heures, minutes et secondes ne sont pas prises en charge.

    Reportez-vous à DBMS_CLOUD Package Oracle Data Type to Parquet Mapping pour plus d'informations sur les limites de format NLS pour l'export de DATE vers Parquet.

    INTERVAL DAY TO SECOND

    Pris en charge et traité en tant que chaîne en interne

    INTERVAL YEAR TO MONTH

    Pris en charge et traité en tant que chaîne en interne

    LONG

    Non pris en charge

    LONG RAW

    Non pris en charge

    NUMBER

    Prise en charge avec les limitations suivantes :

    • Peut avoir une précision maximale de 38 et une échelle inférieure à la précision.
    • Si aucune précision et échelle n'est fournie pour le type de colonne NUMBER, la précision par défaut est 38 et l'échelle 20.
    • L'échelle négative n'est pas prise en charge pour les types NUMBER.

    Object Types

    Non pris en charge

    TIMESTAMP

    Prise en charge avec les limitations suivantes :

    • S'il y a plusieurs colonnes avec une précision différente, la précision la plus élevée sera prise.
    • TIMESTAMP WITH TIME ZONE Le type de données Oracle utilise uniquement l'horodatage.

    Reportez-vous à DBMS_CLOUD Package Oracle Data Type to Parquet Mapping pour plus d'informations sur les limites de format NLS pour l'export de TIMESTAMP vers Parquet.