Input

マッチ・プロセッサの「Input」サブプロセッサは、入力データ・ストリームからマッチ・プロセッサに属性をマップするために使用します。

用途

「Input」サブプロセッサはマッチ処理に不可欠な部分で、マッチ・プロセスで使用するデータの管理に使用します。

通常、マッチ・プロセスには、各入力データ・ストリームのすべての属性が含まれています。ただし、マッチ処理で使用する属性は変更でき、マッチ対象の属性、マッチ候補のレビューで使用する属性、または出力選択で使用する属性のみを含めることができます。

注意: 7.0より古いバージョンのEDQでは、手動のマッチ判定の再適用(保持)に使用されるすべての入力属性が判定キーに含まれるため、入力属性の選択も慎重に構成する必要があります。ただし、現在は、判定キーでどの入力属性を使用するかを構成できます。「マッチ・プロセッサの詳細オプション」を参照してください。

たとえば、一般的な顧客表からは、次の属性をマッチ・プロセスに含めることができます。

目的

属性

マッチ処理で必要

First_name

Surname

Birth_date

Address_1

Postcode

Email

Home_tel_number

マッチの可能性があるレコードのレビューで必要

Title

Address_2

Town

County

Customer_type

データ更新のために特定のレコードを識別するのに必要

Customer_ID

出力を決定するのに必要(たとえば、最新レコードを選択する場合)

Last_modified_date

Has_active_account

ソース・データ内のこれ以外の属性は、マッチ・プロセスから除外できます。

構成

データをマッチ処理に入力するには、最初にキャンバス上でデータ・ストリーム(1つまたは複数)をマッチ・プロセッサに接続する必要があります。プロセッサが受け入れるデータ・ストリームの数とタイプは、次に示すように、プロセッサのタイプによって決まることに注意してください。

マッチ・プロセッサ・タイプ

受け入れる入力データ・ストリーム

Group and Merge

1つの作業データ・ストリーム

Deduplicate

1つの作業データ・ストリーム

Enhance

1つの作業データ・ストリーム、および任意の数の参照データ・ストリーム

Link

任意の数の作業データ・ストリームおよび参照データ・ストリーム

Consolidate

任意の数の作業データ・ストリーム

Advanced match

任意の数の作業データ・ストリームおよび参照データ・ストリーム

 

データ・ストリームは、マッチ・プロセッサに、リーダーから直接または他のプロセッサの出力フィルタから接続されます。

次の例では、3つのデータ・ストリーム(1つの作業データ・ストリームと2つの参照データ・ストリーム)が「Enhance」プロセッサに接続されています。

データ・ストリームが接続されると、「Inputs」ダイアログを使用して属性を選択できます(方法はすべてのプロセッサで同じです)。接続された各データ・ストリームのタブが表示されることに注意してください。

マッチ・プロセッサ(「Group and Merge」を除く)のオプションを構成するときは、2つの追加オプションが表示されます。

Compare against self - このオプションを使用すると、マッチ・プロセッサが該当するデータ・ストリーム内(データ・ストリーム間ではなく)でマッチを検索するかどうかを変更できます。このオプションは、ほとんどの場合、マッチ・プロセッサのタイプに応じたデフォルトに設定されます。作業データ・ストリームは常に相互に比較され、参照データ・ストリームは相互に比較されることはないことに注意してください。

Enabled - このオプションを使用すると、入力データ・ストリームの構成は保持されますが、それをマッチ・プロセスで使用するかどうかのオン/オフは切り替えることができます。たとえば、構成された参照データ・ストリームの一部(全部ではない)と作業データの一部を照合できます。

Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.