D コンポーネント・ナレッジ・モジュール
この付録では、フラット化および不規則コンポーネント用のナレッジ・モジュールについて説明します。
この付録の内容は次のとおりです。
XKM Oracle Flatten
注意:
フラット化コンポーネントは、Spark 1.3でのみサポートされます。次の表は、XKM Oracle Flattenのオプションについて説明します。
表D-1 XKM Oracle Flatten
オプション | 説明 |
---|---|
NESTED_TABLE_ALIAS |
ネストされた表の式に対して使用される別名。 デフォルトはNSTです。 |
DEFAULT_EXPRESSION |
nullのネストされた表オブジェクトのデフォルト式。例: rating_table(obj_rating('-1', 'Unknown'))。 |
XKM Oracle Flatten XML
指定のオプションに基づいてXMLファイル内の複合データをネスト解除します。
次の表は、XKM Oracle Flatten XMLのオプションについて説明します。
表D-2 XKM Oracle Flatten XML
オプション | 説明 |
---|---|
XML_XPATH |
XMLTABLE関数のXMLパスを指定します。例: '/ratings/rating'。 |
XML_IS_ATTRIBUTE |
データがレコード・タグの属性値として保存される場合はTrueに設定します。例: <row attribute1=..." /> " |
XML_TABLE_ALIAS |
XMLTABLE式で使用される別名。 デフォルトはXMLTです。 |
DEFAULT_EXPRESSION |
nullのXMLTYPEオブジェクトのデフォルト式。例: <row> < attribute1/><row/> nullの各XMLTYPEオブジェクトに対してデフォルト値が設定された行を返すのに使用されます。 |
XKM Spark Flatten
指定のオプションに基づいて複合データをネスト解除します。
次の表は、XKM Spark Flattenのオプションについて説明します。
表D-3 XKM Spark Flatten
オプション | 説明 |
---|---|
デフォルト式 |
nullのネストされた表オブジェクトのデフォルト式。例: rating_table(obj_rating('-1', 'Unknown'))。 nullの各ネストされた表オブジェクトに対するデフォルト値が設定された行を返すのに使用されます。 |
CACHE_DATA |
TRUEに設定すると、Sparkのデフォルト・ストレージ・レベルを使用して結果を永続化します。 デフォルトはFALSEです。 |
XKM Jagged
不規則コンポーネントKMは、メタ・ピボットを使用して非構造化データを処理します。key-valueではない形式で表されるソース・データは、データベース表やファイル構造にロードするためにより構造化されたエンティティに変換されます。不規則コンポーネントには、コンポーネントの構成に基づいて1つの入力グループと1つまたは複数の出力グループがあります。入力グループは、key-valueまたはid-key-value構造を持つソース・コンポーネントに関連付けられます。出力グループは、データがより構造的に保存されるターゲット・コンポーネントに関連付けられます。つまり、キーが列名になり、値が表の行として保存されます。Jagged KMはソース・データを解析し、出力グループ属性に一致するキー・データを検索します。関連キーが識別されると、対応するデータが行に保存されます。key-valueソースの場合、データ・インジケータの終わりとしてマークされたキーによって各受信レコードが区切られます。id-key-valueソースの場合、受信レコードはIDとして定義されたそのシーケンスの新しい値によって区切られます。「一意索引」属性プロパティに基づいて重複を削除することにより、ターゲット・レコードを統合できます。一部の属性には必須としてラベル付けすることが可能です。その場合は必須キーのいずれかが存在しないときに、新規レコードが保存されなくなります。一部の欠落キーに対してはデフォルト値を定義できます。
次の表は、XKM Jaggedのオプションについて説明します。
表D-4 XKM Jagged
オプション | 説明 |
---|---|
TMP_DIR |
一時ファイルのディレクトリ。 |
FIELD_DELIMITER |
一時ファイルのフィールド・デリミタ。 |
DELETE_TEMPORARY_OBJECTS |
マッピングの最後に一時オブジェクトを削除します。 |