Esportazione di dati come parquet in una directory

Mostra i passi per esportare i dati delle tabelle da Autonomous Database in una directory come dati Parquet specificando una query.

  1. Connettersi all'istanza di Autonomous Database.

    Per ulteriori informazioni, consulta la sezione relativa alla connessione ad Autonomous Database.

  2. Crea una directory.

    Ad esempio:

    CREATE DIRECTORY export_dir AS 'export_dir';
    Per ulteriori informazioni, vedere Crea directory in Autonomous Database.
  3. Eseguire DBMS_CLOUD.EXPORT_DATA e specificare il parametro format type con il valore json per esportare i risultati come file Parquet in una directory. Non includere il parametro credential quando si invia l'output a una directory.
    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => 'export_dir:sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    Per il nome della directory viene fatta distinzione tra maiuscole e minuscole quando il nome della directory è racchiuso tra virgolette. Ad esempio:

    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => '"export_dir":sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    Per informazioni dettagliate sui parametri, vedere EXPORT_DATA Procedura.

    Per informazioni dettagliate sui parametri format disponibili che è possibile utilizzare con DBMS_CLOUD.EXPORT_DATA, vedere DBMS_CLOUD Opzioni formato pacchetto per EXPORT_DATA.

    Di seguito sono riportati i parametri.

    • file_uri_list: è una lista delimitata da virgole dei file di esportazione. L'uso dei caratteri jolly e di sostituzione non è supportato nel file file_uri_list.

    • format: specifica il parametro type richiesto. I valori validi sono datapump, json, xml, csv e parquet e, facoltativamente, definisce anche le opzioni che è possibile specificare per l'esportazione con il driver di accesso ORACLE_DATAPUMP.

    • query: specifica un'istruzione SELECT in modo che vengano esportati solo i dati richiesti. La query determina il contenuto dei file di dump.

    Per informazioni dettagliate sui parametri, vedere EXPORT_DATA Procedura.

Note per l'esportazione con DBMS_CLOUD.EXPORT_DATA:

  • Il parametro query fornito può essere una query avanzata, se necessario, ad esempio una query che include join o subquery.

  • Specificare il parametro format con l'opzione compression per comprimere i file di output.

  • Per informazioni dettagliate sul mapping tra tipo Oracle e tipo di parquet, vedere DBMS_CLOUD Mapping tra tipo di dati Oracle e tipo di parquet.

    I seguenti tipi non sono supportati o prevedono limitazioni per il supporto per l'esportazione di Parquet con DBMS_CLOUD.EXPORT_DATA:

    Tipo Oracle Note

    BFILE

    Non supportata

    BLOB

    Non supportata

    DATE

    Supportato con la seguente limitazione: il formato DATE supporta solo data, mese e anno. Ora, minuti e secondi non sono supportati.

    Per informazioni dettagliate sulle limitazioni del formato NLS per l'esportazione di DATE in Parquet, vedere DBMS_CLOUD Package Oracle Data Type to Parquet Mapping.

    INTERVAL DAY TO SECOND

    Supportato e considerato come stringa internamente

    INTERVAL YEAR TO MONTH

    Supportato e considerato come stringa internamente

    LONG

    Non supportata

    LONG RAW

    Non supportata

    NUMBER

    Supportato dalle seguenti limitazioni:

    • Può avere una precisione massima di 38 e una scala inferiore alla precisione.
    • Se per la colonna NUMBER non sono disponibili precisione e scala, per impostazione predefinita viene utilizzata la precisione 38 e la scala 20.
    • La scala negativa non è supportata per i tipi NUMBER.

    Object Types

    Non supportata

    TIMESTAMP

    Supportato dalle seguenti limitazioni:

    • Se sono presenti più colonne con precisione diversa, verrà eseguita la massima precisione.
    • TIMESTAMP WITH TIME ZONE Il tipo di dati Oracle utilizzerà solo l'indicatore orario.

    Per informazioni dettagliate sulle limitazioni del formato NLS per l'esportazione di TIMESTAMP in Parquet, vedere DBMS_CLOUD Package Oracle Data Type to Parquet Mapping.