グループとマージ

「グループとマージ」プロセッサは、属性を使用してレコードをグループ化し、これらのレコードをマージし、選択したグループ化属性で固有のレコードを出力して、レコードを容易に重複解除できます。他の照合プロセッサとは異なり、これには複雑な照合を構成する機能がありません。レコードは、選択されたグループ化属性による完全一致で単純にグループ化されます。

「グループとマージ」をシンプルで効率的な方法として使用し、属性の固有の値を出力します。

たとえば、EDQをデータの抽出で使用する場合、実際に多数のデータベース表の結合として抽出データが生成されることがあります。これにより、キー列に重複した値が多数存在するかどうかがわかります。この場合、データ・セットを固有のキー値で作成して、データの結合を解除すると便利です。

「グループとマージ」は、EDQプロセスで参照データの生成時にも便利です。たとえば、多数のチェックを渡す、すべての固有のForename値でデータ・セットを作成する場合に便利なことがあります。チェックを渡すレコードは、レコードのグループ化に使用するForename属性とともに「グループとマージ」に挿入できます。出力された固有のForename値は、ステージング済データに書き込み、参照データに変換され、直接ルックアップで使用できます。MatchGroupSize属性は各値が発生する回数として機能することに注意してください。

レコードをグループ化する他の理由として、すべてのレコードを同じ属性値で合計するためにグループ化することもあります。これを実行するために、カスタム出力セレクタを作成する機能と組み合せて、「グループとマージ」を使用できます。

サブプロセッサ 説明

入力

グループ化するデータ・ストリームから属性を選択します。

グループ

レコードのグループ化基準となる属性を選択します。

マージ

ルールを使用して、グループ化されたレコードをマージします。

次の表に、構成オプションを示します。

構成 説明

入力

「グループとマージ」プロセッサは、配列を除くすべてのタイプの入力属性を受け入れます。他の照合プロセッサと同様に、入力された属性のみが出力されます。

入力は入力サブプロセッサで構成できます。

オプション

すべてのオプションは前述のサブプロセッサで構成されます。

「グループとマージ」は、グループ化用の選択した属性の単純な連結を使用し、セパレータなしで値を連続して区切って、レコードをグループ化することに注意してください。これは、グループ化属性で同じデータを持つが異なる構造でグループ化される、次の2つの例のようなレコードが存在する可能性があるということです。

「グループとマージ」で、グループ化に基準として使用するすべての属性で完全に同じデータ値でレコードをグループ化する必要がある場合、連結プロセッサを使用して、グループ化キー属性を作成し、データ値に存在しないパイプ文字などの区切り文字を使用してデータ属性を区切ることをお薦めします。このキー属性を使用して、「グループとマージ」でレコードをグループ化できます。

出力

マージ済出力データ・ストリームは、マージサブプロセッサで構成されます。

リアルタイム・レスポンス・プロセスに照合プロセッサが1つしかない場合、このプロセスで「グループとマージ」プロセッサを使用できます。ただし、同じ入力メッセージ内ではレコードのグループ化およびマージのみ実行されます。

「グループとマージ」プロセッサでは、次に示す結果のビューが作成されます。

「グループ」ビュー

「グループ」ビューでは、グループがサイズ別にまとめられます。

統計 説明

グループ・サイズ

グループ・サイズ(レコード数)

カウント

リストされたグループの数。「件数」をドリルダウンすると、グループごとにマージされたレコードが表示されます。

「マージ済出力」ビュー

「マージ済出力」は、「グループとマージ」プロセッサからマージされた出力のデータ・ビューです。つまり、グループ化されたレコードがマージされた後のレコード・セットです。出力されるレコードとその属性は、マージ・サブプロセッサで設定するオプションに応じて異なります。

出力フィルタ

「グループとマージ」プロセッサには、1つの出力フィルタ(マージ済)があります。これは、前述の「マージ済出力」に対応しています。

たとえば、「グループとマージ」を使用して、氏名、生年月日および電子メール・アドレスが同一のすべてのレコードをグループ化してマージします。2レコードのグループが3つ作成されてマージされます。2レコードの3つのグループをドリルダウンすると、各グループのマージ済レコードが表示されます。