Exportación de datos como Parquet a un directorio

Muestra los pasos para exportar datos de tabla de la base de datos de IA autónoma a un directorio como datos de Parquet especificando una consulta.

  1. Conéctese a su instancia de base de datos de IA autónoma.

    Consulte Conexión a una base de datos de IA autónoma para obtener más información.

  2. Cree un directorio.

    Por ejemplo:

    CREATE DIRECTORY export_dir AS 'export_dir';

    Consulte Creación de directorio en base de datos de IA autónoma para obtener más información.

  3. Ejecute DBMS_CLOUD.EXPORT_DATA y especifique el parámetro format type con el valor json para exportar los resultados como archivos de Parquet a un directorio. No incluya el parámetro credential al enviar la salida a un directorio.

    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => 'export_dir:sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /

    El nombre del directorio distingue entre mayúsculas y minúsculas cuando el nombre del directorio está entre comillas dobles. Por ejemplo:

    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => '"export_dir":sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /

    Para obtener información detallada sobre los parámetros, consulte Procedimiento EXPORT_DATA.

    Para obtener información detallada sobre los parámetros format disponibles que puede utilizar con DBMS_CLOUD.EXPORT_DATA, consulte DBMS_CLOUD Package Format Options for EXPORT_DATA.

    Los parámetros son:

    • file_uri_list: es una lista delimitada por comas de los archivos de exportación. El uso de caracteres comodín y de sustitución no está soportado en file_uri_list.

    • format: especifica el parámetro type necesario. Los valores válidos son datapump, json, xml, csv y parquet, y también define opcionalmente las opciones que puede especificar para la exportación con el controlador de acceso ORACLE_DATAPUMP.

    • query: especifica una sentencia SELECT para que solo se exporten los datos necesarios. La consulta determina el contenido de los archivos de volcado.

    Para obtener información detallada sobre los parámetros, consulte Procedimiento EXPORT_DATA.

Notas para exportar con DBMS_CLOUD.EXPORT_DATA:

  • El parámetro query que proporcione puede ser una consulta avanzada, si es necesario, como una consulta que incluya uniones o subconsultas.

  • Especifique el parámetro format con la opción compression para comprimir los archivos de salida.

  • Consulte Asignación de tipo de dato de Oracle a Parquet de paquete DBMS_CLOUD para obtener más información sobre la asignación de tipo de Oracle a tipo de parquet.

    Los siguientes tipos no están soportados o tienen limitaciones en su soporte para exportar Parquet con DBMS_CLOUD.EXPORT_DATA:

    Type Oracle Notas
    BFILE No admitido
    BLOB No admitido
    DATE

    Soportado con la siguiente limitación: el formato DATE solo admite fecha, mes y año. La hora, el minuto y los segundos no están soportados.

    Consulte Asignación de tipo de datos de Oracle a Parquet del paquete DBMS_CLOUD para obtener más información sobre las limitaciones de formato NLS para exportar DATE a Parquet.

    INTERVAL DAY TO SECOND Soportado y se trata como cadena internamente
    INTERVAL YEAR TO MONTH Soportado y se trata como cadena internamente
    LONG No admitido
    LONG RAW No admitido
    NUMBER

    Se admite con las siguientes limitaciones:

    • Puede tener una precisión máxima de 38 y una escala igual a menos de precisión.
    • Si no se proporciona precisión y escala para el tipo de columna NUMBER, se utiliza por defecto una precisión de 38 y una escala de 20.
    • No se admite la escala negativa para los tipos NUMBER.
    Object Types No admitido
    TIMESTAMP

    Se admite con las siguientes limitaciones:

    • Si hay varias columnas con diferente precisión, se tomará la mayor precisión.
    • El tipo de dato Oracle TIMESTAMP WITH TIME ZONE solo utilizará el registro de hora.

    Consulte Asignación de tipo de datos de Oracle a Parquet del paquete DBMS_CLOUD para obtener más información sobre las limitaciones de formato NLS para exportar TIMESTAMP a Parquet.