Exportar Dados como Parquet para um Diretório

Mostra as etapas para exportar dados da tabela do seu Autonomous Database para um diretório como dados do Parquet especificando uma consulta.

  1. Conecte-se à sua instância do Autonomous Database.

    Consulte Estabelecer Conexão com o Autonomous Database para obter mais informações.

  2. Criar um diretório.

    Por exemplo:

    CREATE DIRECTORY export_dir AS 'export_dir';
    Consulte Criar Diretório no Autonomous Database para mais informações.
  3. Execute DBMS_CLOUD.EXPORT_DATA e especifique o parâmetro format type com o valor json para exportar os resultados como arquivos Parquet para um diretório. Não inclua o parâmetro credential ao enviar a saída para um diretório.
    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => 'export_dir:sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    O nome do diretório faz distinção entre maiúsculas e minúsculas quando o nome do diretório está entre aspas duplas. Por exemplo:

    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => '"export_dir":sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    Para obter informações detalhadas sobre os parâmetros, consulte ProcedimentoEXPORT_DATA.

    Para obter informações detalhadas sobre os parâmetros format disponíveis que você pode usar com o DBMS_CLOUD.EXPORT_DATA, consulte DBMS_CLOUD Package Format Options for EXPORT_DATA.

    Os parâmetros são:

    • file_uri_list: é uma lista delimitada por vírgulas dos arquivos de exportação. O uso de caracteres curinga e de substituição não é suportado no file_uri_list.

    • format: especifica o parâmetro type necessário. Os valores válidos são datapump, json, xml, csv e parquet e também, opcionalmente, define as opções que você pode especificar para a exportação com o Driver de Acesso ORACLE_DATAPUMP.

    • query: especifica uma instrução SELECT para que somente os dados necessários sejam exportados. A consulta determina o conteúdo dos arquivos de dump.

    Para obter informações detalhadas sobre os parâmetros, consulte ProcedimentoEXPORT_DATA.

Observações para exportação com DBMS_CLOUD.EXPORT_DATA:

  • O parâmetro query que você fornece pode ser uma consulta avançada, se necessário, como uma consulta que inclui junções ou subconsultas.

  • Especifique o parâmetro format com a opção compression para compactar os arquivos de saída.

  • Consulte DBMS_CLOUD Package Oracle Data Type to Parquet Mapping para obter detalhes sobre o mapeamento de Tipo Oracle para Tipo Parquet.

    Os seguintes tipos não são suportados ou têm limitações no suporte para exportar Parquet com DBMS_CLOUD.EXPORT_DATA:

    Tipo Oracle Observações

    BFILE

    Não suportado

    BLOB

    Não suportado

    DATE

    Suportado com a seguinte limitação: o formato DATE suporta apenas data, mês e ano. Não há suporte para hora, minuto e segundos.

    Consulte DBMS_CLOUD Package Oracle Data Type to Parquet Mapping para obter detalhes sobre as limitações de formato NLS para exportar DATE para Parquet.

    INTERVAL DAY TO SECOND

    Suportado e tratado como string internamente

    INTERVAL YEAR TO MONTH

    Suportado e tratado como string internamente

    LONG

    Não suportado

    LONG RAW

    Não suportado

    NUMBER

    Suportado com as seguintes limitações:

    • Pode ter precisão máxima de 38 e escala igual a menos de precisão.
    • Se nenhuma precisão e escala forem fornecidas para o tipo de coluna NUMBER, por padrão, será usada a precisão de 38 e a escala de 20.
    • A escala negativa não é suportada para tipos NUMBER.

    Object Types

    Não suportado

    TIMESTAMP

    Suportado com as seguintes limitações:

    • Se houver várias colunas com precisão diferente, a maior precisão será obtida.
    • TIMESTAMP WITH TIME ZONE O tipo de dados Oracle usará somente o timestamp.

    Consulte DBMS_CLOUD Package Oracle Data Type to Parquet Mapping para obter detalhes sobre as limitações de formato NLS para exportar TIMESTAMP para Parquet.