8 ORCイベント・ハンドラの構成

プロパティ・ファイルを使用して、ORCハンドラの操作を構成します。これらのプロパティは、Javaアダプタ・プロパティ・ファイルにあります(Replicatプロパティ・ファイルにはありません)。

ORCイベント・ハンドラは、ファイル・ライター・ハンドラと組み合せてのみ機能します。

ORCハンドラの選択を有効にするには、まずgg.eventhandler.name.type=orcおよびその他のORCプロパティを次のように指定してハンドラ・タイプを構成する必要があります。

表8-1 ORCイベント・ハンドラの構成プロパティ

プロパティ 必須/オプション 有効な値 デフォルト 説明

gg.eventhandler.name.type

必須

ORC

なし

ORCイベント・ハンドラを選択します。

gg.eventhandler.name.writeToHDFS

オプション

true | false

false

ORCフレームワークを使用すると、HDFSに直接書き込むことができます。ローカル・ファイル・システムに書き込むには、falseに設定します。HDFSに直接書き込むには、trueに設定します。

gg.eventhandler.name.pathMappingTemplate

必須

ファイルを書き込むORCバケットのパスを動的に生成するために使用される、解決可能なキーワードと定数を含む文字列。

なし

定数とともにインタレースされるキーワードを使用して、一意のORCパス名を実行時に動的に生成します。パス名は、通常、/ogg/data/${groupName}/${fullyQualifiedTableName}の形式に従います。

gg.eventhandler.name.fileMappingTemplate

オプション

実行時にORCファイル名を動的に生成するために使用される、解決可能なキーワードと定数を含む文字列。

なし

実行時にORCデータ・ファイル名を動的に生成するために使用される、解決可能なキーワードと定数を使用します。設定しない場合、アップストリームのファイル名が使用されます。

gg.eventhandler.name.compressionCodec

オプション

LZ4 | LZO | NONE | SNAPPY | ZLIB

NONE

生成されたORCファイルの圧縮コーデックを設定します。

gg.eventhandler.name.finalizeAction

オプション

none | delete

none

ファイナライズ・アクションでORCデータ・ファイルをそのままにするには、noneを設定します。ファイナライズ・アクションでORCデータ・ファイルを削除するには、deleteを設定します。

gg.eventhandler.name.kerberosPrincipal

オプション

Kerberosプリンシパル名。

なし

HDFSに直接書き込み、Kerberos認証が有効になっている場合は、Kerberosプリンシパルを設定します。

gg.eventhandler.name.kerberosKeytabFile

オプション

Kerberos keytabファイルのパス。

none

HDFSに直接書込み、HDFS Kerberos認証が有効になっている場合は、Kerberos keytabファイルのパスを設定します。

gg.eventhandler.name.blockPadding

オプション

true | false

true

生成されたORCファイルでブロック埋込みを有効にするには、falseを設定し、無効にするには、trueを設定します。

gg.eventhandler.name.blockSize

オプション

long

ORCのデフォルト。

生成されたORCファイルのブロック・サイズを設定します。

gg.eventhandler.name.bufferSize

オプション

integer

ORCのデフォルト。

生成されたORCファイルのバッファ・サイズを設定します。

gg.eventhandler.name.encodingStrategy

オプション

COMPRESSION | SPEED

ORCのデフォルト。

ORCエンコーディング方式が圧縮または高速化のいずれのために最適化されるかを設定します。

gg.eventhandler.name.paddingTolerance

オプション

浮動小数点数で表されるパーセント。

ORCのデフォルト。

生成されたORCファイルの埋込み許容度のパーセントを設定します。

gg.eventhandler.name.rowIndexStride

オプション

integer

ORCのデフォルト。

生成されたORCファイルの行インデックス・ストライドを設定します。

gg.eventhandler.name.stripeSize

オプション

integer

ORCのデフォルト。

生成されたORCファイルのストライプ・サイズを設定します。

gg.eventhandler.name.eventHandler

オプション

子イベント・ハンドラを相互参照する一意の文字列識別子。

イベント・ハンドラは構成されない。

ファイル・ロール・イベントで呼び出されるイベント・ハンドラ。イベント・ハンドラは、S3またはHDFSへのファイルのロードなどのファイル・ロール・イベント・アクションを実行できます。

gg.eventhandler.name.bloomFilterFpp

オプション

偽陽性の確率はゼロより大きく、1より小さくする必要があります。たとえば、.25.75はどちらも有効な値ですが、01は無効です。

Apache ORCのデフォルト。

ブルーム・フィルタ索引の問合せの偽陽性を設定し、検索対象の値がブロック内にあるという結果が示されますが、値は実際にはブロック内にありません。

ブルーム・フィルタを設定する表および列を設定する必要があります。次の構成構文を使用して、ブルーム・フィルタを設定する表および列を選択します。

gg.eventhandler.orc.bloomFilter.QASOURCE.TCUSTMER=CUST_CODE
gg.eventhandler.orc.bloomFilter.QASOURCE.TCUSTORD=CUST_CODE,ORDER_DATE

QASOURCE.TCUSTMERおよびQASOURCE.TCUSTORDは、ソース表の完全修飾名です。構成値は、ブルーム・フィルタを構成する1つ以上の列です。列名はカンマで区切ります。

gg.eventhandler.name.bloomFilterVersion

オプション

ORIGINAL | UTF8

ORIGINAL

ORCブルーム・フィルタのバージョンを設定します。