Esporta dati come parquet in una directory

Mostra i passi per esportare i dati della tabella da Autonomous Database in una directory come dati Parquet specificando una query.

  1. Connettersi all'istanza di Autonomous Database.

    See Connect to Autonomous Database for more information.

  2. Crea una directory.

    Ad esempio:

    CREATE DIRECTORY export_dir AS 'export_dir';
    Per ulteriori informazioni, vedere Crea directory in Autonomous Database.
  3. Eseguire DBMS_CLOUD.EXPORT_DATA e specificare il parametro format type con il valore json per esportare i risultati come file Parquet in una directory. Non includere il parametro credential durante l'invio dell'output a una directory.
    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => 'export_dir:sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    Il nome della directory fa distinzione tra maiuscole e minuscole quando il nome della directory è racchiuso tra virgolette doppie. Ad esempio:

    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => '"export_dir":sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    Per informazioni dettagliate sui parametri, vedere EXPORT_DATA Procedure.

    Per informazioni dettagliate sui parametri format disponibili, è possibile utilizzare DBMS_CLOUD.EXPORT_DATA, vedere DBMS_CLOUD Package Format Options for EXPORT_DATA.

    Di seguito sono riportati i parametri disponibili.

    • file_uri_list: è una lista delimitata da virgole dei file di esportazione. L'uso dei caratteri jolly e di sostituzione non è supportato in file_uri_list.

    • format: specifica il parametro type richiesto. I valori validi sono datapump, json, xml, csv e parquet e, facoltativamente, definisce anche le opzioni che è possibile specificare per l'esportazione con il driver di accesso ORACLE_DATAPUMP.

    • query: specifica un'istruzione SELECT in modo che vengano esportati solo i dati richiesti. La query determina il contenuto dei file di dump.

    Per informazioni dettagliate sui parametri, vedere EXPORT_DATA Procedure.

Note per l'esportazione con DBMS_CLOUD.EXPORT_DATA:

  • Il parametro query fornito può essere una query avanzata, se necessario, ad esempio una query che include join o subquery.

  • Specificare il parametro format con l'opzione compression per comprimere i file di output.

  • Per informazioni dettagliate sul mapping tra tipo Oracle e tipo di parquet, vedere DBMS_CLOUD Mapping tra tipo di dati Oracle e tipo di parquet.

    I seguenti tipi non sono supportati o hanno limitazioni sul supporto per l'esportazione di Parquet con DBMS_CLOUD.EXPORT_DATA:

    Tipo specifico Oracle Note

    BFILE

    Non supportato

    BLOB

    Non supportato

    DATE

    Supportato con la seguente limitazione: il formato DATE supporta solo data, mese e anno. Ora, minuto e secondi non sono supportati.

    Per i dettagli sulle limitazioni del formato NLS per l'esportazione di DATE in Parquet, vedere DBMS_CLOUD Package Oracle Data Type to Parquet Mapping.

    INTERVAL DAY TO SECOND

    Supportato e trattato internamente come stringa

    INTERVAL YEAR TO MONTH

    Supportato e trattato internamente come stringa

    LONG

    Non supportato

    LONG RAW

    Non supportato

    NUMBER

    Supportato con le seguenti limitazioni:

    • Può avere una precisione massima di 38 e una scala uguale a meno della precisione.
    • Se non viene fornita alcuna precisione e scala per il tipo di colonna NUMBER, per impostazione predefinita viene utilizzata la precisione 38 e la scala 20.
    • La scala negativa non è supportata per i tipi NUMBER.

    Object Types

    Non supportato

    TIMESTAMP

    Supportato con le seguenti limitazioni:

    • Se ci sono più colonne con precisione diversa, verrà presa la massima precisione.
    • TIMESTAMP WITH TIME ZONE Il tipo di dati Oracle utilizzerà solo l'indicatore orario.

    Per i dettagli sulle limitazioni del formato NLS per l'esportazione di TIMESTAMP in Parquet, vedere DBMS_CLOUD Package Oracle Data Type to Parquet Mapping.