DBMS_CLOUD Avro、ORCまたはParquetのパッケージ・フォーマット・オプション

DBMS_CLOUDのformat引数では、ソース・ファイルのフォーマットを指定します。

format引数を指定するには:

format => '{"format_option" : “format_value” }'  

および:

format => json_object('format_option' value 'format_value'))

例:

format => json_object('type' VALUE 'CSV')

複数のフォーマット・オプションを指定するには、値を","で区切ります。

たとえば:

format => json_object('ignoremissingcolumns' value 'true', 'removequotes' value 'true', 'dateformat' value 'YYYY-MM-DD-HH24-MI-SS', 'blankasnull' value 'true')
書式オプション 説明 構文

regexuri

regexuriの値がTRUEに設定されている場合、クラウド・ソース・ファイルURIのファイル名にワイルドカードおよび正規表現を使用できます。

regexuriパラメータがFALSEに設定されている場合、文字"*"および"?"はワイルドカード文字とみなされます。regexuriパラメータがTRUEに設定されている場合、文字"*"および"?"は指定された正規表現パターンの一部です。

正規表現パターンは、URI内のファイル名またはサブフォルダ・パスでのみサポートされ、パターン一致はREGEXP_LIKE関数によって実行されるものと同じです。ディレクトリ名では正規表現パターンはサポートされていません。

外部表の場合、このオプションは、オブジェクト・ストレージのファイルに作成された表でのみサポートされます。

たとえば:

format => JSON_OBJECT('regexuri' value TRUE)

REGEXP_LIKE条件の詳細は、REGEXP_LIKE条件を参照してください。

regexuri: True

デフォルト値: False

type

ファイル・タイプを指定します。

type : avro | orc | parquet

schema

スキーマがfirstまたはallに設定されている場合、外部表の列とデータ型はAvro、ORCまたはParquetファイルから自動的に導出されます。

列名は、Avro、 ORC、 or Parquetに含まれるものと一致します。データ型は、Avro、ORCまたはParquetデータ型からOracleデータ型に変換されます。すべての列が表に追加されます。

firstは、file_uri_list内の最初のAvro、ORCまたはParcetファイルのメタデータを使用して列とそのデータ型を自動生成することを指定します。すべてのファイルのスキーマが同じ場合は、firstを使用します。

allは、列とそのデータ型を自動生成するためにfile_uri_list内のすべてのAvro、ORCまたはParquetファイルのメタデータを使用するように指定します。各ファイルのスキーマが異なる可能性がある場合は、all (遅い)を使用します。

デフォルト: column_listが指定されている場合、schemaの値(指定した場合)は無視されます。column_listが指定されていない場合、schemaのデフォルト値はfirstです。

ノート: Avro、ORCまたはParquetフォーマット・ファイルの場合、schemaフォーマット・オプションは使用できません。また、DBMS_CLOUD.CREATE_EXTERNAL_PART_TABLEプロシージャを使用して、パーティション化された外部表にcolumn_listパラメータを指定する必要があります。

schema : first | all