Exportar Dados como Parquet para um Diretório

Mostra as etapas para exportar dados de tabelas do Autonomous Database para um diretório como dados Parquet especificando uma consulta.

  1. Conecte-se à instância do Autonomous Database.

    Consulte Conectar-se ao Autonomous Database para obter mais informações.

  2. Criar um diretório

    Por exemplo:

    CREATE DIRECTORY export_dir AS 'export_dir';
    Consulte Criar Diretório no Autonomous Database para obter mais informações.
  3. Execute DBMS_CLOUD.EXPORT_DATA e especifique o parâmetro format type com o valor json para exportar os resultados como arquivos Parquet para um diretório. Não inclua o parâmetro credential ao enviar a saída para um diretório.
    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => 'export_dir:sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    O nome do diretório faz distinção entre maiúsculas e minúsculas quando o nome do diretório está entre aspas duplas. Por exemplo:

    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => '"export_dir":sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    Para obter informações detalhadas sobre os parâmetros, consulte Procedimento EXPORT_DATA.

    Para obter informações detalhadas sobre os parâmetros format disponíveis que você pode usar com DBMS_CLOUD.EXPORT_DATA, consulte Opções de Formato do Pacote DBMS_CLOUD para EXPORT_DATA.

    Os parâmetros são:

    • file_uri_list: é uma lista delimitada por vírgulas do(s) arquivo(s) de exportação. o uso de caracteres curinga e de substituição não é suportado no file_uri_list.

    • format: especifica o parâmetro type necessário. Os valores válidos são datapump, json, xml, csv e parquet e também, opcionalmente, define as opções que você pode especificar para a exportação com o Driver de Acesso ORACLE_DATAPUMP.

    • query: especifica uma instrução SELECT para que apenas os dados necessários sejam exportados. A consulta determina o conteúdo do(s) arquivo(s) de dump.

    Para obter informações detalhadas sobre os parâmetros, consulte Procedimento EXPORT_DATA.

Observações para exportação com DBMS_CLOUD.EXPORT_DATA:

  • O parâmetro query fornecido poderá ser uma consulta avançada, se necessário, como uma consulta que inclui junções ou subconsultas.

  • Especifique o parâmetro format com a opção compression para compactar os arquivos de saída.

  • Consulte DBMS_CLOUD Mapeamento do Tipo de Dados Oracle para Parquet do Pacote Oracle para obter detalhes sobre o mapeamento do Tipo Oracle para Parquet.

    Os seguintes tipos não são suportados ou têm limitações em seu suporte para exportar Parquet com DBMS_CLOUD.EXPORT_DATA:

    Tipo Oracle Observações

    BFILE

    Sem suporte

    BLOB

    Sem suporte

    DATE

    Suportado com a seguinte limitação: o formato DATE suporta apenas data, mês e ano. Hora, minuto e segundos não são suportados.

    Consulte DBMS_CLOUD Package Oracle Data Type to Parquet Mapping para obter detalhes sobre limitações de formato NLS para exportar DATE para Parquet.

    INTERVAL DAY TO SECOND

    Suportado e tratado como string internamente

    INTERVAL YEAR TO MONTH

    Suportado e tratado como string internamente

    LONG

    Sem suporte

    LONG RAW

    Sem suporte

    NUMBER

    Suportado com as seguintes limitações:

    • Pode ter a precisão máxima de 38 e escala igual a menos do que a precisão.
    • Se nenhuma precisão e escala forem fornecidas para o tipo de coluna NUMBER, por padrão, a precisão de 38 e a escala de 20 serão usadas.
    • A escala negativa não é suportada para tipos NUMBER.

    Object Types

    Sem suporte

    TIMESTAMP

    Suportado com as seguintes limitações:

    • Se houver várias colunas com precisão diferente, a maior precisão será obtida.
    • TIMESTAMP WITH TIME ZONE O tipo de dados Oracle usará apenas o timestamp.

    Consulte DBMS_CLOUD Package Oracle Data Type to Parquet Mapping para obter detalhes sobre limitações de formato NLS para exportar TIMESTAMP para Parquet.