|
Input |
マッチ・プロセッサの「Input」サブプロセッサは、入力データ・ストリームからマッチ・プロセッサに属性をマップするために使用します。
「Input」サブプロセッサはマッチ処理に不可欠な部分で、マッチ・プロセスで使用するデータの管理に使用します。
通常、マッチ・プロセスには、各入力データ・ストリームのすべての属性が含まれています。ただし、マッチ処理で使用する属性は変更でき、マッチ対象の属性、マッチ候補のレビューで使用する属性、または出力選択で使用する属性のみを含めることができます。
注意: 7.0より古いバージョンのEDQでは、手動のマッチ判定の再適用(保持)に使用されるすべての入力属性が判定キーに含まれるため、入力属性の選択も慎重に構成する必要があります。ただし、現在は、判定キーでどの入力属性を使用するかを構成できます。「マッチ・プロセッサの詳細オプション」を参照してください。 |
たとえば、一般的な顧客表からは、次の属性をマッチ・プロセスに含めることができます。
目的 |
属性 |
マッチ処理で必要 |
First_name Surname Birth_date Address_1 Postcode Home_tel_number |
マッチの可能性があるレコードのレビューで必要 |
Title Address_2 Town County Customer_type |
データ更新のために特定のレコードを識別するのに必要 |
Customer_ID |
出力を決定するのに必要(たとえば、最新レコードを選択する場合) |
Last_modified_date Has_active_account |
ソース・データ内のこれ以外の属性は、マッチ・プロセスから除外できます。
データをマッチ処理に入力するには、最初にキャンバス上でデータ・ストリーム(1つまたは複数)をマッチ・プロセッサに接続する必要があります。プロセッサが受け入れるデータ・ストリームの数とタイプは、次に示すように、プロセッサのタイプによって決まることに注意してください。
マッチ・プロセッサ・タイプ |
受け入れる入力データ・ストリーム |
Group and Merge |
1つの作業データ・ストリーム |
Deduplicate |
1つの作業データ・ストリーム |
1つの作業データ・ストリーム、および任意の数の参照データ・ストリーム |
|
Link |
任意の数の作業データ・ストリームおよび参照データ・ストリーム |
Consolidate |
任意の数の作業データ・ストリーム |
Advanced match |
任意の数の作業データ・ストリームおよび参照データ・ストリーム |
データ・ストリームは、マッチ・プロセッサに、リーダーから直接または他のプロセッサの出力フィルタから接続されます。
次の例では、3つのデータ・ストリーム(1つの作業データ・ストリームと2つの参照データ・ストリーム)が「Enhance」プロセッサに接続されています。
データ・ストリームが接続されると、「Inputs」ダイアログを使用して属性を選択できます(方法はすべてのプロセッサで同じです)。接続された各データ・ストリームのタブが表示されることに注意してください。
マッチ・プロセッサ(「Group and Merge」を除く)のオプションを構成するときは、2つの追加オプションが表示されます。
Compare against self - このオプションを使用すると、マッチ・プロセッサが該当するデータ・ストリーム内(データ・ストリーム間ではなく)でマッチを検索するかどうかを変更できます。このオプションは、ほとんどの場合、マッチ・プロセッサのタイプに応じたデフォルトに設定されます。作業データ・ストリームは常に相互に比較され、参照データ・ストリームは相互に比較されることはないことに注意してください。
Enabled - このオプションを使用すると、入力データ・ストリームの構成は保持されますが、それをマッチ・プロセスで使用するかどうかのオン/オフは切り替えることができます。たとえば、構成された参照データ・ストリームの一部(全部ではない)と作業データの一部を照合できます。
Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.