マッチ判定のインポート

EDQでは、判定データをインポートし、マッチ・プロセッサ内のマッチ候補に判定データを適用できる機能が用意されています。

判定のインポートは、1回かぎりのアクティビティの場合と、マッチ・プロセスの継続的な部分である場合があります。たとえば、別のアプリケーションからEDQにマッチ・プロセスを移行する場合は、以前のすべての判定が移行の一部として含まれていることが望まれます。あるいは、レビュー・プロセスが外部で実施される場合は、判定のインポートを定期的に使用して、外部での判定をEDQに戻入れできます。

たとえば、同じデータを処理する別のマッチ・プロセスなど、EDQの別のプロセスまたはインスタンスからエクスポートされたマッチ判定をインポートすることも可能です。

EDQのすべてのマッチ判定では、マッチ候補レコードのペアを参照します。したがって、インポートした判定を適用するためには、レビュー・ルールを備えたマッチ・プロセッサにより作成された関係とその判定ついてマッチが見込まれる必要があります。プロセッサが確定一致と識別した、または完全に不一致と識別したレコードのペアの判定をインポートすると、その判定は、マッチ・ロジックが変更されないかぎり(変更されるまでは)適用されないため、レコードに対してレビュー関係が作成されます。

判定をインポートして、かつCase Management(またはマッチ・レビュー)を使用して手動判定を作成できることに注意してください。関係の手動判定より後の日付/時間の判定をインポートした場合は、その判定が最新の判定とみなされます。手動判定とまったく同じ日付/時間の判定をインポートした場合は、インポートした判定より手動判定が優先されます。

このヘルプ・トピックでは、これ以降、マッチ判定をインポートするためのガイドを順に説明します。

ステップ1 - マッチ・プロセッサへの判定データの接続

マッチ判定をインポートするには、リーダーを使用して、インポートした判定データを読み取り、判定入力ポートにあるデータをマッチ・プロセッサに接続します。

注意: グループ化およびマージではマッチ候補に対する手動判定は認められないため、判定入力ポートはありません。

このデータには、EDQマッチ・プロセスの対応する関係に対してデータを照合するために必要な、関係に関するすべての識別情報(つまり、関係双方のレコードについて、マッチ・プロセッサの構成可能な判定キーに含まれる各属性に対する属性)と、判定、レビュー・ユーザーおよびレビュー日付/時間のフィールドが必要です。マッチ候補のレビュー時に作成されたコメントもインポートできます。

ステップ2 - 新規判定データを保持する属性の指定

一連の判定データがマッチ・プロセッサに接続されている場合(前述の説明を参照)は、マッチ・プロセッサを開いたときに追加のサブプロセッサが表示されます。

判定データをマッチ・プロセスにマップするには、「Decisions」サブプロセッサをダブルクリックします。

最初のタブを使用して、接続された判定データのフィールドに、インポートする実際の判定とコメントの値、およびユーザー名や日付/時間などの詳細を設定できます。

次のスクリーンショットは、マッチ判定データをインポートするための正しい構成例を示しています。

前述のスクリーンショットの最初のセクションにはインポートした判定データの属性が表示されており、これが判定データの取得に使用されます。コメントのフィールドはすべてオプションです。「Auto Map」ボタンを使用すると、フィールドのデフォルト名が検索され、これらのフィールドの自動マッピングが試みられます。フィールドのデフォルト名(EDQのマッチ・プロセッサからの関係の書込み時に作成される名称)は、次のとおりです。

判定フィールド

デフォルト(自動)名

Decision Field

RuleDecision

Decision User Field

ReviewedBy

Decision Timestamp Field

ReviewDate

Comment Field

Comment

Comment User Field

CommentBy

Comment Timestamp Field

CommentDate

Data Stream Name

DataStreamName

Related Data Stream Name

RelatedDataStreamName

Match Rule Name

MatchRule

State Expiry Timestamp

ExpiryDate

これは、レビューする関係を生成した同じマッチ・プロセッサに判定データをインポートして戻入れている場合は、「Auto Map」を使用することで、すべての判定フィールドが自動的にマップされることを意味します。

注意: 「State Expiry Timestamp」フィールドは、Case Managementを使用してレビューを処理するプロセッサにのみ表示されます。

最初のタブの2番目のセクションでは、構成された「Decision」フィールドの実際の判定値(前述の例の「ManualDecision」)と、それらをEDQが理解する判定値にマップする方法を指定します。前述の場合、フィールド値はEDQで使用された値と同じです(「Match」、「No Match」、「Possible Match」および「Pending」)。

3番目のセクションでは、マッチ・プロセッサで使用されるデータ・ストリームの判定データに予想される名称値を指定できます。これは、データ・セットが複数あるマッチ・プロセッサが、インポートされた各判定を正しいデータ・ストリームからの正しいレコードとマッチ処理するために特に重要です。前述の場合、マッチ・プロセッサは単一のデータ・ストリームを処理する「Deduplicate」プロセッサです。これは、すべてのレコード(各関係双方のレコード)が同じデータ・ストリーム(Customer Data)からのものであることを意味します。「Customer Data」という名称が指定されたため、インポートされるすべての判定データは、DataStream属性とRelatedDataStream属性の両方に「Customer Data」という値が指定される必要があります。

ステップ3 - 判定データ・フィールドのマッピング

次に、「Decisions」サブプロセッサの「Mapped Fields」タブを使用して、インポートした判定データのフィールドをマッチ関係の必要なフィールドにマップします。このマッピングの要件は、マッチ候補の処理にマッチ・レビューを使用するか、Case Managementを使用するかによって異なります。

次のスクリーンショットは、単純な「Deduplicate」マッチ・プロセッサの判定キーに対して「Decision」データの属性を構成する例を示しています。

判定データには、関係双方のレコード(この場合はレコードおよび関連レコード)の属性が必要であることに注意してください。

ステップ4 - 判定のインポート

「Decisions」サブプロセッサを正しく構成した後は、「OK」ボタンをクリックして構成を保存します。その後、マッチ・プロセスを実行してマッチ判定をインポートできます。

判定のインポートを1回かぎりで実行している場合は、判定が正しくインポートされたことを確認し、判定データのリーダーを削除します。

定期的なマッチ・プロセスの実行の一環として判定を継続的にインポートする場合は、判定データのリーダーを接続したままにします。判定データは、スナップショットを再実行するか、データをマッチ・プロセスに直接ストリーミングすることで、EDQの他のデータ・ソースと同様にリフレッシュできます。判定がすでにインポートされた場合は、判定データにその判定が存在しても再インポートされないことに注意してください。

インポートされた判定は、EDQを使用した判定と同様にみなされるため、Case Management(またはマッチ・レビュー・アプリケーション)に表示され、マッチ・プロセッサの「Review Status」サマリーにも反映されます。

Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.