1.3.3.11.1 入力
照合プロセッサの入力サブプロセッサは、入力データ・ストリームから照合プロセッサに属性をマップするために使用します。
入力サブプロセッサは照合処理に不可欠な部分で、照合プロセスで使用するデータの管理に使用します。
通常、照合プロセスには、各入力データ・ストリームのすべての属性が含まれています。ただし、照合処理で使用する属性は変更でき、照合対象の属性、照合候補のレビューで使用する属性、または出力選択で使用する属性のみを含めることができます。
ノート:
7.0より古いバージョンのEDQでは、手動の照合決定の再適用(保持)に使用されるすべての入力属性が決定キーに含まれるため、入力属性の選択も慎重に構成する必要があります。ただし、現在は、決定キーでどの入力属性を使用するかを構成できます。
たとえば、一般的な顧客表からは、次の属性を照合プロセスに含めることができます。
目的 | 属性 |
---|---|
照合に必要 |
First_name 姓 Birth_date Address_1 Postcode Home_tel_number |
可能性のある照合レコードのレビューに必要 |
敬称 Address_2 Town 郡 Customer_type |
データ更新のための特定のレコードを特定するために必要 |
Customer_ID |
出力の決定(たとえば、最新のレコードなど)に必要 |
Last_modified_date Has_active_account |
ソース・データ内のこれ以外の属性は、照合プロセスから除外できます。
データを照合処理に入力するには、最初にキャンバス上でデータ・ストリーム(1つまたは複数)を照合プロセッサに接続する必要があります。プロセッサが受け入れるデータ・ストリームの数とタイプは、次に示すように、プロセッサのタイプによって決まることに注意してください。
照合プロセッサのタイプ | アクセスする入力データ・ストリーム |
---|---|
グループとマージ |
単一の作業データ・ストリーム |
重複除外 |
単一の作業データ・ストリーム |
拡張 |
単一の作業データ・ストリーム、および任意の数の参照データ・ストリーム |
リンク |
任意の数の作業データ・ストリームと参照データ・ストリーム |
統合 |
任意の数の作業データ・ストリーム |
拡張照合 |
任意の数の作業データ・ストリームと参照データ・ストリーム |
データ・ストリームは、照合プロセッサに、リーダーから直接または他のプロセッサの出力フィルタから接続されます。
データ・ストリームが接続されると、「入力」ダイアログを使用して属性を選択できます(方法はすべてのプロセッサで同じです)。
照合プロセッサ(グループとマージを除く)のオプションを構成するときは、2つの追加オプションが表示されます。
自身と比較 - このオプションを使用すると、照合プロセッサが該当するデータ・ストリーム内(データ・ストリーム間ではなく)で一致を検索するかどうかを変更できます。このオプションは、ほとんどの場合、照合プロセッサのタイプに応じたデフォルトに設定されます。作業データ・ストリームは常に相互に比較され、参照データ・ストリームは相互に比較されることはないことに注意してください。
有効 - このオプションを使用すると、入力データ・ストリームの構成は保持されますが、それを照合プロセスで使用するかどうかのオン/オフは切り替えることができます。