Exportación de datos como Parquet al almacenamiento de objetos en la nube
Muestra los pasos para exportar datos de tabla de la base de datos de IA autónoma a Cloud Object Storage como datos de Parquet especificando una consulta.
Este método de exportación soporta todos los almacenes de objetos en la nube soportados por la base de datos de IA autónoma, y puede utilizar una entidad de recurso de Oracle Cloud Infrastructure para acceder a Oracle Cloud Infrastructure Object Store, Amazon Resource Names (ARN) a Acceda a AWS Simple Storage Service (S3), un principal de servicio de Azure para acceder al almacenamiento BLOB de Azure o a Azure Data Lake Storage, o a una cuenta de servicio de Google para acceder a los recursos de Google Cloud Platform (GCP).
-
Conéctese a su instancia de base de datos de IA autónoma.
Consulte Conexión a una base de datos de IA autónoma para obtener más información.
-
Almacene su credencial de Cloud Object Storage mediante
DBMS_CLOUD.CREATE_CREDENTIAL.Por ejemplo:
BEGIN DBMS_CLOUD.CREATE_CREDENTIAL( credential_name => 'DEF_CRED_NAME', username => 'user1@example.com', password => 'password' ); END; /Los valores que proporcione para
usernameypassworddependen del servicio de Cloud Object Storage que utilice.No es necesario crear una credencial para acceder al almacén de objetos de Oracle Cloud Infrastructure si activa las credenciales de entidad de recurso. Consulte Uso de la entidad de recurso para acceder a recursos de Oracle Cloud Infrastructure para obtener más información.
-
Ejecute
DBMS_CLOUD.EXPORT_DATAy especifique el parámetroformattypecon el valorparquetpara exportar los resultados como archivos de parquet en Cloud Object Storage.Para generar los archivos de salida de parquet, hay dos opciones para el parámetro
file_uri_list:-
Defina el valor
file_uri_listen la URL de un cubo existente en Cloud Object Storage. -
Defina el valor
file_uri_listen la URL de un cubo existente en Cloud Object Storage e incluya un prefijo de nombre de archivo que se utilizará al generar los nombres de archivo para los archivos de parquet exportados.
Si no incluye el prefijo de nombre de archivo en
file_uri_list,DBMS_CLOUD.EXPORT_DATAproporciona un prefijo de nombre de archivo. Consulte Nombre de archivo para salida de texto (CSV, JSON, Parquet o XML) para obtener más información.Por ejemplo, a continuación se muestra
DBMS_CLOUD.EXPORT_DATAcon un prefijo de nombre de archivo especificado enfile_uri_list:BEGIN DBMS_CLOUD.EXPORT_DATA( credential_name => 'DEF_CRED_NAME', file_uri_list => 'https://objectstorage.us-phoenix-1.oraclecloud.com/n/namespace-string/b/bucketname/o/dept_export', query => 'SELECT * FROM DEPT', format => JSON_OBJECT('type' value 'parquet', 'compression' value 'snappy')); END; /En este ejemplo,
namespace-stringes el espacio Oracle Cloud Infrastructure Object Storage Namepace, ybucketnamees el nombre del cubo. Consulte Descripción de los espacios de nombres de Object Storage para obtener más información.Para obtener información detallada sobre los parámetros, consulte Procedimiento EXPORT_DATA.
Para obtener información detallada sobre los parámetros
formatdisponibles que puede utilizar conDBMS_CLOUD.EXPORT_DATA, consulte DBMS_CLOUD Package Format Options for EXPORT_DATA. -
Notas para exportar con DBMS_CLOUD.EXPORT_DATA:
-
El parámetro
queryque proporcione puede ser una consulta avanzada, si es necesario, como una consulta que incluya uniones o subconsultas. -
Especifique el parámetro
formatcon la opcióncompressionpara comprimir los archivos de salida. El valor por defecto decompressionparatype parquetessnappy. -
Cuando ya no necesite los archivos que exporte, utilice el procedimiento
DBMS_CLOUD.DELETE_OBJECTo utilice comandos nativos de Cloud Object Storage para suprimir los archivos. -
Consulte Asignación de tipo de dato de Oracle a Parquet de paquete DBMS_CLOUD para obtener más información sobre la asignación de tipo de Oracle a tipo de parquet.
Los siguientes tipos no están soportados o tienen limitaciones en su soporte para exportar Parquet con
DBMS_CLOUD.EXPORT_DATA:Type Oracle Notas BFILENo admitido BLOBNo admitido DATESoportado con la siguiente limitación: el formato
DATEsolo admite fecha, mes y año. La hora, el minuto y los segundos no están soportados.Consulte Asignación de tipo de datos de Oracle a Parquet del paquete DBMS_CLOUD para obtener más información sobre las limitaciones de formato NLS para exportar
DATEa Parquet.INTERVAL DAY TO SECONDSoportado y se trata como cadena internamente INTERVAL YEAR TO MONTHSoportado y se trata como cadena internamente LONGNo admitido LONG RAWNo admitido NUMBERSe admite con las siguientes limitaciones:
- Puede tener una precisión máxima de 38 y una escala igual a menos de precisión.
- Si no se proporciona precisión y escala para el tipo de columna
NUMBER, se utiliza por defecto una precisión de 38 y una escala de 20. - No se admite la escala negativa para los tipos
NUMBER.
Object TypesNo admitido TIMESTAMPSe admite con las siguientes limitaciones:
- Si hay varias columnas con diferente precisión, se tomará la mayor precisión.
- El tipo de dato Oracle
TIMESTAMP WITH TIME ZONEsolo utilizará el registro de hora.
Consulte Asignación de tipo de datos de Oracle a Parquet del paquete DBMS_CLOUD para obtener más información sobre las limitaciones de formato NLS para exportar
TIMESTAMPa Parquet.