Exportación de datos como Parquet a un directorio
Muestra los pasos para exportar datos de tabla de la base de datos de IA autónoma a un directorio como datos de Parquet especificando una consulta.
-
Conéctese a su instancia de base de datos de IA autónoma.
Consulte Conexión a una base de datos de IA autónoma para obtener más información.
-
Cree un directorio.
Por ejemplo:
CREATE DIRECTORY export_dir AS 'export_dir';Consulte Creación de directorio en base de datos de IA autónoma para obtener más información.
-
Ejecute
DBMS_CLOUD.EXPORT_DATAy especifique el parámetroformattypecon el valorjsonpara exportar los resultados como archivos de Parquet a un directorio. No incluya el parámetrocredentialal enviar la salida a un directorio.BEGIN DBMS_CLOUD.EXPORT_DATA( file_uri_list => 'export_dir:sales.parquet', format => JSON_OBJECT('type' value 'parquet'), query => 'SELECT * FROM sales' ); END; /El nombre del directorio distingue entre mayúsculas y minúsculas cuando el nombre del directorio está entre comillas dobles. Por ejemplo:
BEGIN DBMS_CLOUD.EXPORT_DATA( file_uri_list => '"export_dir":sales.parquet', format => JSON_OBJECT('type' value 'parquet'), query => 'SELECT * FROM sales' ); END; /Para obtener información detallada sobre los parámetros, consulte Procedimiento EXPORT_DATA.
Para obtener información detallada sobre los parámetros
formatdisponibles que puede utilizar conDBMS_CLOUD.EXPORT_DATA, consulte DBMS_CLOUD Package Format Options for EXPORT_DATA.Los parámetros son:
-
file_uri_list: es una lista delimitada por comas de los archivos de exportación. El uso de caracteres comodín y de sustitución no está soportado enfile_uri_list. -
format: especifica el parámetrotypenecesario. Los valores válidos sondatapump,json,xml,csvyparquet, y también define opcionalmente las opciones que puede especificar para la exportación con el controlador de accesoORACLE_DATAPUMP. -
query: especifica una sentenciaSELECTpara que solo se exporten los datos necesarios. La consulta determina el contenido de los archivos de volcado.
Para obtener información detallada sobre los parámetros, consulte Procedimiento EXPORT_DATA.
-
Notas para exportar con DBMS_CLOUD.EXPORT_DATA:
-
El parámetro
queryque proporcione puede ser una consulta avanzada, si es necesario, como una consulta que incluya uniones o subconsultas. -
Especifique el parámetro
formatcon la opcióncompressionpara comprimir los archivos de salida. -
Consulte Asignación de tipo de dato de Oracle a Parquet de paquete DBMS_CLOUD para obtener más información sobre la asignación de tipo de Oracle a tipo de parquet.
Los siguientes tipos no están soportados o tienen limitaciones en su soporte para exportar Parquet con
DBMS_CLOUD.EXPORT_DATA:Type Oracle Notas BFILENo admitido BLOBNo admitido DATESoportado con la siguiente limitación: el formato
DATEsolo admite fecha, mes y año. La hora, el minuto y los segundos no están soportados.Consulte Asignación de tipo de datos de Oracle a Parquet del paquete DBMS_CLOUD para obtener más información sobre las limitaciones de formato NLS para exportar
DATEa Parquet.INTERVAL DAY TO SECONDSoportado y se trata como cadena internamente INTERVAL YEAR TO MONTHSoportado y se trata como cadena internamente LONGNo admitido LONG RAWNo admitido NUMBERSe admite con las siguientes limitaciones:
- Puede tener una precisión máxima de 38 y una escala igual a menos de precisión.
- Si no se proporciona precisión y escala para el tipo de columna
NUMBER, se utiliza por defecto una precisión de 38 y una escala de 20. - No se admite la escala negativa para los tipos
NUMBER.
Object TypesNo admitido TIMESTAMPSe admite con las siguientes limitaciones:
- Si hay varias columnas con diferente precisión, se tomará la mayor precisión.
- El tipo de dato Oracle
TIMESTAMP WITH TIME ZONEsolo utilizará el registro de hora.
Consulte Asignación de tipo de datos de Oracle a Parquet del paquete DBMS_CLOUD para obtener más información sobre las limitaciones de formato NLS para exportar
TIMESTAMPa Parquet.