Group and Merge |
「Group and Merge」プロセッサを使用すると、属性(1つまたは複数)を使用してレコードをグループ化し、これらのレコードをマージして、選択したグループ化属性が重複しないレコードを出力することにより、レコードの重複を簡単に除去できます。他のマッチ・プロセッサと異なり、複雑なマッチ処理を構成する機能は備えていません。レコードは、選択したグループ化属性の完全一致によって単純にグループ化されます。
「Group and Merge」を使用すると、属性(1つまたは複数)の重複しない値を簡単かつ効率的に出力できます。
たとえば、データ抽出でEDQを使用すると、実際には、複数のデータベース表の間の結合として抽出が生成される場合があります。これは、キー列に多数の重複値がある場合に発生します。この場合は、重複しないキー値を持つデータのセットを作成することで、データの結合解除に役立つ場合があります。
また、「Group and Merge」は、EDQプロセスで参照データを生成する際にも大変役立ちます。たとえば、すべての「Forename」(名)値が重複せず、いくつかのチェックを通過したデータのセットを作成するのに役立ちます。チェックを通過したレコードは「Group and Merge」に入力でき、「Forename」属性を使用してレコードをグループ化できます。次に、出力された重複しない「Forename」値は、ステージング・データに書き込まれて参照データに変換されたり、参照で直接使用できます。出力された「MatchGroupSize」属性は、各値が発生した回数のカウントとして機能することに注意してください。
同じ属性値のすべてのレコードを合計する場合など、その他の理由でレコードをグループ化する場合があります。これを行うために、「Group and Merge」はカスタム出力セレクタを作成する機能と組み合せて使用できます。
「Group and Merge」はマッチ・プロセッサの1タイプです。マッチ・プロセッサはいくつかのサブプロセッサで構成されており、各サブプロセッサは個別に構成する必要があります。「Group and Merge」プロセッサは次のサブプロセッサで構成されています。
各ステップの詳細、および構成手順については、サブプロセッサをクリックしてください。
アイコン |
サブプロセッサ |
説明 |
グループ化するデータ・ストリームから属性を選択します。 |
||
レコードのグループ化基準となる属性を選択します。 |
||
ルールを使用して、グループ化されたレコードをマージします。 |
「Group and Merge」プロセッサは、配列を除くすべてのタイプの入力属性を受け入れます。他のマッチ・プロセッサと同様に、入力された属性のみが出力されます。
入力は「Input」サブプロセッサで構成できます。
すべてのオプションは前述のサブプロセッサ内で構成されます。
マージされた出力データ・ストリームは、前述の「Merge」サブプロセッサで構成されます。
「Group and Merge」プロセッサはリアルタイム応答プロセスで使用できますが、プロセスに含めることができるのは1つのマッチ・プロセッサのみです。ただし、同じ入力メッセージ内ではレコードのグループ化およびマージのみ実行されます。
実行モード |
サポート |
バッチ |
Yes |
リアルタイム・モニタリング |
Yes |
リアルタイム応答 |
Yes |
「Group and Merge」プロセッサでは、次に示す結果のビューが作成されます。
「Groups」ビュー
「Groups」ビューでは、グループがサイズ別に集計されます。
統計 |
意味 |
Group size |
グループ・サイズ(レコード数) |
Count |
リストされたサイズのグループの数。件数をドリルダウンすると、各グループのマージ済レコードが表示されます。 |
「Merged Output」ビュー
「Merged Output」は、「Group and Merge」プロセッサからのマージ済出力(つまり、グループ化されたレコードがマージされた後のレコード・セット)のデータ・ビューです。出力されるレコードとその属性は、「Merge」サブプロセッサで設定するオプションに応じて異なります。
「Group and Merge」プロセッサには「Merged」出力フィルタがあります。これは、前述の「Merged Output」に対応します。
この例では、「Group and Merge」を使用して、氏名、生年月日およびEメール・アドレスが同一のすべてのレコードをグループ化してマージします。
「Groups」ビュー
このケースでは、2レコードのグループが3つ作成されてマージされます。
2レコードの3つのグループをドリルダウンすると、各グループのマージ済レコードが表示されます。
Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.