D コンポーネント・ナレッジ・モジュール

この付録では、フラット化および不規則コンポーネント用のナレッジ・モジュールについて説明します。

この付録の内容は次のとおりです。

XKM Oracle Flatten

指定のオプションに基づいて複合データをネスト解除します。

注意:

フラット化コンポーネントは、Spark 1.3でのみサポートされます。

次の表は、XKM Oracle Flattenのオプションについて説明します。

表D-1 XKM Oracle Flatten

オプション 説明

NESTED_TABLE_ALIAS

ネストされた表の式に対して使用される別名。

デフォルトはNSTです。

DEFAULT_EXPRESSION

nullのネストされた表オブジェクトのデフォルト式。例: rating_table(obj_rating('-1', 'Unknown'))。

XKM Oracle Flatten XML

指定のオプションに基づいてXMLファイル内の複合データをネスト解除します。

次の表は、XKM Oracle Flatten XMLのオプションについて説明します。

表D-2 XKM Oracle Flatten XML

オプション 説明

XML_XPATH

XMLTABLE関数のXMLパスを指定します。例: '/ratings/rating'。

XML_IS_ATTRIBUTE

データがレコード・タグの属性値として保存される場合はTrueに設定します。例: <row attribute1=..." /> "

XML_TABLE_ALIAS

XMLTABLE式で使用される別名。

デフォルトはXMLTです。

DEFAULT_EXPRESSION

nullのXMLTYPEオブジェクトのデフォルト式。例: <row> < attribute1/><row/>

nullの各XMLTYPEオブジェクトに対してデフォルト値が設定された行を返すのに使用されます。

XKM Spark Flatten

指定のオプションに基づいて複合データをネスト解除します。

次の表は、XKM Spark Flattenのオプションについて説明します。

表D-3 XKM Spark Flatten

オプション 説明

デフォルト式

nullのネストされた表オブジェクトのデフォルト式。例: rating_table(obj_rating('-1', 'Unknown'))。

nullの各ネストされた表オブジェクトに対するデフォルト値が設定された行を返すのに使用されます。

CACHE_DATA

TRUEに設定すると、Sparkのデフォルト・ストレージ・レベルを使用して結果を永続化します。

デフォルトはFALSEです。

XKM Jagged

不規則コンポーネントKMは、メタ・ピボットを使用して非構造化データを処理します。key-valueではない形式で表されるソース・データは、データベース表やファイル構造にロードするためにより構造化されたエンティティに変換されます。不規則コンポーネントには、コンポーネントの構成に基づいて1つの入力グループと1つまたは複数の出力グループがあります。入力グループは、key-valueまたはid-key-value構造を持つソース・コンポーネントに関連付けられます。出力グループは、データがより構造的に保存されるターゲット・コンポーネントに関連付けられます。つまり、キーが列名になり、値が表の行として保存されます。Jagged KMはソース・データを解析し、出力グループ属性に一致するキー・データを検索します。関連キーが識別されると、対応するデータが行に保存されます。key-valueソースの場合、データ・インジケータの終わりとしてマークされたキーによって各受信レコードが区切られます。id-key-valueソースの場合、受信レコードはIDとして定義されたそのシーケンスの新しい値によって区切られます。「一意索引」属性プロパティに基づいて重複を削除することにより、ターゲット・レコードを統合できます。一部の属性には必須としてラベル付けすることが可能です。その場合は必須キーのいずれかが存在しないときに、新規レコードが保存されなくなります。一部の欠落キーに対してはデフォルト値を定義できます。

次の表は、XKM Jaggedのオプションについて説明します。

表D-4 XKM Jagged

オプション 説明

TMP_DIR

一時ファイルのディレクトリ。

FIELD_DELIMITER

一時ファイルのフィールド・デリミタ。

DELETE_TEMPORARY_OBJECTS

マッピングの最後に一時オブジェクトを削除します。