機械翻訳について

「Avro、ORCまたはParquet」用のDBMS_CLOUDパッケージ形式オプション

DBMS_CLOUDのformat引数は、ソース・ファイルの形式を指定します。

format引数を指定するには、次の2つの方法があります。

format => '{"format_option" : “format_value” }'  

および:

format => json_object('format_option' value 'format_value'))

例:

format => json_object('type' VALUE 'CSV')

複数のフォーマット・オプションを指定するには、値を,で区切ります。

たとえば:

format => json_object('ignoremissingcolumns' value 'true', 'removequotes' value 'true', 'dateformat' value 'YYYY-MM-DD-HH24-MI-SS', 'blankasnull' value 'true')
書式オプション 説明 構文

maxvarchar

Avro、ORCまたはParquetフォーマット・ファイルで外部表を作成する際の、文字列の最大varchar2()長のデフォルトを制御します。 オプションは次のとおりです。

  • standard: varchar2()列の長さ制限が4000バイトであることを指定します。 これは、MAX_STRING_SIZE = standardのシステムでautoと同等です。

    MAX_STRING_SIZE = extendedのシステムでは、Avro、ORCまたはParquetで外部表を作成し、maxvarcharstandardとして指定すると、文字列がvarchar2(4000)に短縮されます。

  • extended: varchar2()列の長さ制限が32767バイトであることを指定します。 これは、MAX_STRING_SIZE = extendedのシステムでautoと同等です。 この値は、MAX_STRING_SIZE = standardのシステムでエラーが発生します。

  • auto: MAX_STRING_SIZE値に基づいて、varchar2()の最大バイト・サイズが自動的に選択されます。 autoは、maxvarcharのデフォルト値です。

maxvarchar: standard | extended | auto

デフォルト値:auto

regexuri

regexuriの値がTRUEに設定されている場合、クラウド・ソース・ファイルURIのファイル名にワイルドカードと正規表現を使用できます。

regexuriパラメータがFALSEに設定されている場合、文字"*"および"?"はワイルドカード文字とみなされます。 regexuriパラメータがTRUEに設定されている場合、文字"*"および"?"は指定された正規表現パターンの一部です。

正規表現パターンは、URI内のファイル名またはサブフォルダ・パスでのみサポートされ、パターン一致はREGEXP_LIKEファンクションで実行されるものと同じです。 正規表現パターンは、ディレクトリ名ではサポートされていません。

外部表の場合、このオプションは、オブジェクト・ストレージのファイルに作成される表でのみサポートされます。

たとえば:

format => JSON_OBJECT('regexuri' value TRUE)

REGEXP_LIKE条件の詳細は、「REGEXP_LIKE条件」を参照してください。

regexuri: True

デフォルト値:False

type

ファイル・タイプを指定します。

type : avro | orc | parquet

schema

スキーマがfirstまたはallに設定されている場合、外部表の列およびデータ型は「Avro、ORCまたはParquet」ファイル・メタデータから自動的に導出されます。

列名は、「Avro、ORCまたはParquet」で検出される名前と一致します。 データ型は、「Avro、ORCまたはParquet」データ型からOracleデータ型に変換されます。 すべての列が表に追加されます。

firstは、file_uri_listの最初の「Avro、ORCまたはParquet」ファイルのメタデータを使用して列とそのデータ型を自動生成することを指定します。 すべてのファイルのスキーマが同じ場合は、firstを使用します。

allは、file_uri_list内のすべての「Avro、ORCまたはParquet」ファイルのメタデータを使用して列とそのデータ型を自動生成することを指定します。 ファイルに異なるスキーマが含まれている可能性がある場合は、all (遅い)を使用します。

デフォルト: column_listを指定した場合、schema値は無視されます。 column_listが指定されない場合、schemaのデフォルト値はfirstです。

ノート: Avro、ORCまたはParquet形式のファイルの場合、schema形式オプションは使用できず、DBMS_CLOUD.CREATE_EXTERNAL_PART_TABLEプロシージャを使用してパーティション化された外部表にcolumn_listパラメータを指定する必要があります。

schema : first | all