DBMS_CLOUD Opciones de formato de paquete para Avro, ORC o Parquet

El argumento de formato de DBMS_CLOUD especifica el formato de los archivos de origen.

Las dos formas de especificar el argumento de formato son:

format => '{"format_option" : “format_value” }'  

Y:

format => json_object('format_option' value 'format_value'))

Ejemplos:

format => json_object('type' VALUE 'CSV')

Para especificar varias opciones de formato, separe los valores con una ",".

Por ejemplo:

format => json_object('ignoremissingcolumns' value 'true', 'removequotes' value 'true', 'dateformat' value 'YYYY-MM-DD-HH24-MI-SS', 'blankasnull' value 'true')
Opción de Formato Descripción Sintaxis

regexuri

Cuando el valor de regexuri se define en TRUE, puede utilizar comodines y expresiones regulares en los nombres de archivo en los URI de archivo de origen de Cloud.

Los caracteres "*" y "?" se consideran caracteres comodín cuando el parámetro regexuri se define en FALSE. Cuando el parámetro regexuri se define en TRUE, los caracteres "*" y "?" forman parte del patrón de expresión regular especificado.

Los patrones de expresión regular sólo están soportados para el nombre de archivo o la ruta de subcarpeta en los URI y la coincidencia de patrones es idéntica a la realizada por la función REGEXP_LIKE. Los patrones de expresión regular no están soportados para los nombres de directorio.

Para tablas externas, esta opción solo está soportada con las tablas que se crean en un archivo de Object Storage.

Por ejemplo:

format => JSON_OBJECT('regexuri' value TRUE)

Consulte Condición REGEXP_LIKE para obtener más información sobre la condición REGEXP_LIKE.

regexuri: True

Valor por defecto: False

type

Especifica el tipo de archivo.

type : avro | orc | parquet

schema

Cuando el esquema se define en first u all, las columnas de tabla externa y los tipos de datos se derivan automáticamente de los metadatos del archivo Avro, ORC o Parquet.

Los nombres de columna coincidirán con los que se encuentran en Avro, ORC o Parquet. Los tipos de datos se convierten de los tipos de datos de Avro, ORC o Parquet a los tipos de datos de Oracle. Se agregan todas las columnas a la tabla.

El valor first especifica que se utilicen los metadatos del primer archivo Avro, ORC o Parquet de file_uri_list para generar automáticamente las columnas y sus tipos de datos. Utilice first si todos los archivos tienen el mismo esquema.

El valor all especifica que se utilicen los metadatos de todos los archivos Avro, ORC o Parquet de file_uri_list para generar automáticamente las columnas y sus tipos de datos. Utilice all (más lento) si los archivos pueden tener esquemas diferentes.

Por defecto: si se especifica column_list, se ignora el valor schema, si se especifica. Si no se especifica column_list, el valor por defecto schema es first.

Nota: Para los archivos de formato Avro, ORC o Parquet, la opción de formato schema no está disponible y el parámetro column_list se debe especificar para las tablas externas particionadas mediante el procedimiento DBMS_CLOUD.CREATE_EXTERNAL_PART_TABLE.

schema : first | all