マッチ・レビューの使用

EDQでのマッチ・レビュー・アプリケーションの使用には、複数の側面があります。次のリンクをクリックすると、関連するヘルプの項にジャンプします。

マッチ・レビューの概念

マッチ・レビュー・アプリケーションを理解するための主要な用語は、次のとおりです。

イシュー

イシューは、マッチ・レビュー・アプリケーションで使用されるレビュー作業の単位です。割当担当ユーザーがイシューを作成し、特定ユーザーまたはユーザーのグループに割り当てます。イシューにはマッチ・レビューを開く際に使用できるURLが含まれているため、レビュー担当ユーザーがEDQ自体にアクセスする必要はありません。

イシューは、EDQのより一般的な追跡メカニズムとしても使用されます。詳細は、「イシュー」を参照してください。

レビュー・グループ

レビュー・グループは、マッチ・プロセッサに定義されたマッチ・ルールに従って相互に関係するレコードのネットワークです。詳細は、「レビュー・グループとは」を参照してください。

マッチ・グループ

マッチ・グループは、マッチ・プロセッサにより確定一致が判定されたことで、またはマッチ候補をマッチ判定として決定することで、関連があると明確に確認されたレコードのネットワークです。 

判定キー

判定キーは、結果の新しいセットに手動マッチ判定を再適用する際に使用される入力属性のセットです。あるマッチ・プロセスの実行から次の実行までの間に、これらの属性のいずれかのデータが変更された場合、手動マッチ判定は再適用されず、関連する関係の再レビューがトリガーされます。判定キーには、データに対する重要な変更を見逃さないように十分な属性を指定する必要がありますが、マッチ判定に影響しない属性は指定しないでください。

レビューするマッチ結果の割当

マッチ・プロセッサの開発を完了すると(つまり、自動マッチ処理のルールが完成してマッチ・プロセッサが実行された場合)、レビューのために複数のユーザーにマッチ結果を割り当てることができます。レビュー・プロセスには、レコード間のマッチ候補についてマッチまたはノー・マッチを決定する関係レビューと、マッチ・レコードをマージする場合に、ユーザーが最終的な出力レコードの形成方法をチェックして変更できるマージ・レビューという2つの部分があります。

レビュー・プロセスのこの2つのステージは、同時にまたは単独で実行されます。ただし、指定のレビュー・グループに対して、レビュー・グループから形成されるマッチ・グループ(1つまたは複数)の最終的な構造を確定するために、自動マッチ処理ルールを使用して形成される関係は、常にマッチまたはノー・マッチとして決定する必要があります。マージ済出力は、グループの構造が変化しないと信頼してマッチ・グループごとにレビューされます。

場合によっては、マッチ・プロセスの設計者が、レビューするマッチ・プロセスの関係を割り当て、関係レビュー・プロセスが完了するまでレビューするマージ済出力を割り当てないことで、この2つを形式的に区分できます。あるいは、レコードがマッチするかどうかを確認するのと同時に一連のマッチ・レコードの最適な出力を判断するようがよい場合もあります。

マッチ・プロセッサで形成された関係をレビュー用に割り当てる手順は、次のとおりです。

「Deduplicate」、「Enhance」、「Consolidate」または「Advanced Match」プロセッサからのマージ済出力をレビュー用に割り当てる手順は、次のとおりです。

「Link」マッチ・プロセッサではレコードのマージが発生しないため、このオプションは使用できません。

いずれのオプションの場合も、新しいイシューを作成するダイアログが表示されます。EDQのワークフロー管理を利用して他の場合と同様にイシューに対応し、解決できるように、マッチ・プロセッサの関係の割当またはマージ済出力がイシューとして作成されます。イシューを割り当てられたユーザーは、マッチ・プロセッサの結果に直接リンクできるようになります。

たとえば、レビュー用にマッチ・プロセッサで関係を割り当てるときに、次のイシューを作成できます。

「Issue Description」の1行目にWebリンクが自動的に挿入されます。スタッフの他のメンバーがレビューできるように、このリンクを送信できます(後述の「結果のレビュー」を参照)。

イシューは、単一のユーザーまたはユーザーのグループに割り当てることができます。同じユーザー・グループではない複数のユーザーが結果をレビューする必要がある場合は、結果のレビューを担当する各ユーザーに対して1回ずつ割当プロセスを繰り返すことで、複数のイシューを割り当てることができます。

結果のレビュー

レビュー・アプリケーションにアクセスするには、ユーザーがすでにEDQにログインしているか、イシュー・アプリケーションへのログイン権限が付与されている必要があります。指定のマッチ・プロセッサから、レビューする必要がある結果にアクセスするには3つの方法があります。

最初の2つの方法は、通常、本番システムで作業するレビュー担当者が使用します。これらのユーザーには、マッチ・プロセスを表示または変更する権限がない可能性があります。

3番目の方法は、通常、マッチ・プロセスの開発者がプロセスの開発が完了する前に結果をチェックする際に使用します。

レビュー・グループのナビゲーション

レビュー画面には、次のようにマッチ・レコードがレビュー・グループに編成されて表示されます。レビュー・グループの詳細は、「レビュー・グループとは」を参照してください。

レビューには、すべての(確定一致とマッチ候補の両方の)レビュー・グループを使用できます。グループをフィルタ処理するには、フィルタ・アイコンをクリックし、フィルタ基準を選択します。たとえば、マッチ候補と判定された関係が含まれているグループのみを表示するようにグループをフィルタ処理するには、次のようにします。

また、特定のマッチ・ルールによって形成された関係があるグループのみを表示するようにグループをフィルタ処理するには、次のようにします。

複数のフィルタを組み合せて使用することもできます。複数のフィルタを使用するには、プラス・ボタンをクリックし、別のフィルタを追加します。デフォルトでは、両方のフィルタ基準を満たすグループのみが表示されます(つまり、AND論理が使用されます)。ただし、「Use OR logic」チェック・ボックスを選択することで、いずれかのフィルタ基準を満たすグループが表示されるように選択できます。たとえば、次のフィルタは、「Decision」が「Match」である関係を保持するすべてのグループと、「Forename stand, surname exact, address exact」マッチ・ルールによって作成された関係を保持するすべてのグループを検索します。

デフォルトでは、グループのフィルタ処理に指定されたオプションは、単に表示を、基準を満たす一連のグループにフィルタ処理することに注意してください。多くの関係が含まれている大規模なレビュー・グループの場合は、1つまたは2つの関係についてのみレコードを比較するように、グループそのものをフィルタ処理すると便利です。これを実行するには、ペインの下部にある各グループで関係を手動で選択するか、記載したフィルタ基準(たとえば、特定のマッチ・ルールに従って作成された基準)を満たす関係のみが自動的に選択されるように「Auto-select relationships based on search」オプションを選択します。

これらのオプションを使用する場合は、同じレビュー・グループ内で現在は表示されていない他のレコードが存在する可能性のあることに注意してください(ただし、これらのレコードをレビュー・グループに結合する関係は下部ペインに表示されています)。たとえば、次のスクリーンショットでは、レビュー・グループには3つのレコードがありますが、自動選択オプションが選択されているために、「Name and Postcode」ルールを使用してマッチした2つのレコードのみが表示されています。

 

手動によるマッチ判定

「Matching Records Review」画面では、結果が「Awaiting Review」のマッチ・ルールを使用して照合されたレコードの各ペアに対して、「Match」または「No Match」の手動判定を行うことで、すべてのマッチ候補を最終的に判定できます。判定を「Pending」に設定することも可能ですが、この場合は、手動によるマッチワークフローで、関係をレビューした上で最終的に判定していないことを示すための追加の手順が必要になります。

注意: マッチ判定および判定遷移は、特定のワークフロー要件をサポートするようにカスタマイズ可能です。これには、ユーザーのグループでのみ判定できるように、特定の判定遷移を制限する機能も含まれています。マッチ判定をカスタマイズした場合は、異なる値が「Decision」ドロップダウンに表示される可能性があります。マッチ判定のカスタマイズは、EDQサーバーの管理者によって実行されます。

マッチしたレコードが変更されないかぎり、すべての手動判定はマッチ・プロセッサが存在する後続プロセスの実行で保持されます。したがって、各マッチ候補について、確定一致とみなすかどうかを判定する必要があるのは1回のみです。

マッチ候補を「Match」「No Match」または「Pending」のいずれかに決定するには、関係の「Decision」を変更します。

レビュー・プロセスでエラーの発生が判明した場合は、確定した判定(「Match」または「No Match」の判定)を「Possible Match」(または「Pending」)に戻すことも可能です。

関係の「Review Status」「User Reviewed」に変更され、レコードが相互に明確に関連または明確に関連していないことで、マッチ・グループの構造が変化することに注意してください。これは、レビュー・グループの表示に使用する色と、レビュー・グループのレコードのマッチ・グループIDに反映されます。判定したユーザーおよび日付/時間は、自動的に追加されます。

たとえば、手動マッチ判定に至った過程の詳細を保存するなど、関係にはコメントも追加できます。コメントを追加するには、吹出しアイコンの下にある緑色のプラス・アイコンを使用します。

関係にコメントを追加すると、緑色のプラスアイコンは吹出しアイコンに変わります。関係に対するコメントをすべて表示したり、コメントを追加または削除するには、吹出しをクリックします。

「Review Status」が「User Reviewed」のグループが表示されるようにフィルタを変更することで、実施したすべての手動判定を表示できます。

関係が別のユーザーによってロックされていないレビュー・グループの場合は、関係に対する以前のマッチ判定を変更できます。

EDQには、関係に対するすべての判定の完全な履歴が保存されます。この履歴を参照するには、関係のカレンダ・アイコンをクリックします。

手動による出力決定

レビュー画面の「Review Merged Output」タブでは、必要な出力を選択または指定することで、各マッチ・グループのマージ済出力レコードの自動選択で検出されたエラーを手動で解決できます。自動出力ルールで最善の出力データが選択されていないと判断できる場合は、自動生成された出力を却下できます。

最終的な出力でレコードをマージする必要がない場合、このプロセスは「Link」プロセッサまたは他のマッチ・プロセスに関連しないことに注意してください。

マージ済出力は、「Merge」サブプロセッサに指定されたルールを使用して自動的に生成されます。ただし、そのルールでは、出力選択時に(たとえば、属性に最多値がないために)エラーが発生する可能性があります。マッチ・グループに1つ以上のエラーがある場合は、失敗となります。これらのグループの出力値は、手動で指定する必要があります。

失敗となった出力グループに出力を指定する手順は、次のとおりです。

画面の下半分で、マッチ・グループに作成されたマージ済出力レコードをレビューできます。実施する必要がある決定をすばやく確認できるように、選択エラーがある1つ以上の属性が強調表示されます。

必要な出力値を手動で指定するには、値をグリッドに単純に入力します。あるいは、上に表示されているグループのマッチ・レコードから値をコピーおよび貼付けできます。

出力を手動で決定する場合は、たとえば、決定に至った過程を記録するなど、コメントも追加できます。最新のコメントは、マージ済出力レコードの右側のウィンドウに表示されます。コメントを追加するには、このウィンドウの上にある省略記号のボタンをクリックします。

自動生成された出力の却下

自動出力ルールでの生成に失敗した出力の解決に加え、マッチ・グループについて自動生成された出力をレビューして却下することもできます。そのためには、使用可能なフィルタを使用してマッチ・グループに単純にナビゲートし、セルを手動でクリックし、自動生成された出力を上書きします。

以前の出力決定はいつでも変更できます。

一括レビュー・ルールの構成

自動化された単一の操作で大量の手動マッチ判定を実施することは、レビューの管理者にとって都合がよい場合があります。

たとえば、手動マッチ判定のプロセスを高速化するために、確定一致のみを判定するように決定できます。レビューが完了すると、残りのレビュー判定はすべて事実上「No Match」とみなされます。したがって、一連のマッチ結果のレビュー・プロセスが完了した場合に、残りのすべてのレビュー判定を「No Match」に設定することは、管理者にとって好都合です。次に、一連の大量のデータに対してマッチ・プロセスを再実行する場合は、すでにレビューしたマッチ候補を再度レビューする必要はありません。

一括レビュー判定は、マッチ・プロセッサを開いた状態で「Configure Bulk Review Rules」リンクを選択することで構成されます。

「New Match Status」に更新する判定は、「Rule」、「Review Status」および「Match Status」でフィルタ処理できます。たとえば、あるルールのすべての判定を「Review」にリセットし、別のルールのすべての「Pending」判定を「No Match」に設定するなど、複数の一括レビュー・ルールを適用することもできます。

次のスクリーンショットは、「Match Status」が現在「Pending」であるすべての手動判定を「No Match」に設定する場合の例を示しています。

構成された一括レビュー・ルールは、マッチ・プロセッサが含まれているプロセスの次回実行時に適用されます。ただし、一括レビュー判定は1回かぎりの操作として適用するとみなされるため、マッチ・プロセッサのその後の実行では再適用されません。

Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.