リアルタイム・マッチ

EDQには、異なる2タイプのリアルタイム・マッチが用意されています。

このトピックでは、EDQでのリアルタイム・マッチの動作について一般的なガイドを提供します。リアルタイム・マッチを実装する必要がある場合、マッチ処理する新規レコードのソースの統合に関する詳細は、サポートに連絡してください。

注意: Oracle Siebel UCMまたはCRMでリアルタイム重複防止やデータ・クレンジングのためにOracle EDQを使用する場合は、専用の標準コネクタがあります。詳細は顧客担当に連絡してください。

リアルタイム重複防止

EDQのリアルタイム重複防止機能は、マッチ処理するデータが動的で、定期的に変更されることを前提にしています(たとえば、広く一般に使用されているCRMシステムの顧客データ)。この理由により、EDQでは作業データをコピーしません。かわりに、マッチ・プロセッサで使用されるクラスタリング・ルールと同じルールを使用して、ソース・システムでデータが索引付けされます。

リアルタイム重複防止は、クラスタリンググループ処理の2つのステージで発生します。

クラスタリング

クラスタリング・ステージでは、リアルタイム実行が有効になっているプロセスの「Deduplicate」マッチ・プロセッサのクラスタリング構成を使用して、EDQがリアルタイム・インタフェースで新規レコードを受信し、そのレコードにクラスタ・キーを割り当てます。レコードのクラスタ・キーはライターを使用して返されます。次に、ソース・システムがこのメッセージを受信し、同じクラスタ・キーを保持する一連のレコードすべてをEDQにフィードバックします。

グループ処理

EDQは、入力レコードと同じクラスタ・キーのレコードが含まれているメッセージを受信します。次に、マッチ候補レコードの新しいレコードに対して確定一致およびマッチの可能性を選択します。マッチ結果は2番目のライターを使用して返されます。その後、この応答はシステムの更新方法を判断するために外部で処理されます。可能性のある応答には、新規(重複)レコードの却下、新規レコードとその重複レコードのマージ、または新規レコードの追加がありますが、重複レコード(1つまたは複数)にはリンクが挿入されます。

異なる応答を可能にするために別の出力フィルタに接続しているライターを使用し、同じプロセスが、レコードのクラスタリングとマッチ処理の両方を実行することに注意してください。次に、リアルタイム重複防止の例を示します。

注意: Siebelコネクタの場合、EDQはSiebel Data Qualityインタフェースの制約に準拠しているため、Siebelの問合せ式を構成することでクラスタリングが実行されます。したがって、EDQではリアルタイム重複防止のグループ処理ステージのみを実行し、Siebelによって特定された駆動レコードとマッチ候補を取得し、駆動レコードとのマッチの可能性をスコアとともに(候補が駆動レコードとマッチしたマッチ・ルールに基づいて)返します。

リアルタイム参照マッチ

EDQのリアルタイム参照マッチの実装では、1つまたは複数の参照セットに対して新規のレコードをマッチ処理します。参照セットのデータは動的でないとみなされます。つまり、更新は定期的に実施されますが、複数のユーザーが常にアクセスして更新しているわけではありません(たとえば、CRMデータではなくウォッチリスト)。参照マッチ処理は単一ステージのプロセスです。稼動中のリアルタイム・ソースからの受信レコードは、1つ以上のステージからの参照レコードのスナップショットに対してマッチ処理されます。次に、プロセスのライターは、マッチ・プロセッサの出力を呼出し側システムに返します。返された出力は、マッチ・プロセッサからの出力の形式になります。新規レコードを参照セットに単にリンクするのみの場合は、関係出力をライトバックできます。マッチ参照レコードからのデータでマージすることにより新規レコードを拡張する場合は、「Enhance」プロセッサのマージ・ルールを使用して、拡張されたデータ出力をライトバックできます。

次に、参照レコードへのリンクの書込みの例を示します。

リアルタイム参照マッチのプロセスの準備

リアルタイム参照マッチ・プロセスを正しく実行するには、最初に準備モードで実行する必要があります。これにより、参照セットに対してインバウンド・レコードを速やかに比較でき、応答を発行できます。プロセスを準備モードで実行すると、参照データ・セットのすべてのクラスタ・キーが確実に作成されます。

プロセスを準備モードで実行するには、ジョブを設定し、関連するプロセスにタスクとして追加します。プロセスをクリックし、構成の詳細を設定します。「Run Mode」タブをクリックし、「Prepare」を選択します。

参照データの再準備

リアルタイム・マッチでは、参照データをキャッシュして準備したコピーが使用されます。これは、参照データが更新された場合は、スナップショットを再実行してデータを再準備した後、更新内容をマッチ・プロセスに伝播する必要があることを意味します。

参照データの再準備には、次の操作が含まれます。

他のジョブを起動および停止できるトリガーを使用すると、前述のすべてのフェーズを含む単一のジョブを作成できます。そのジョブ(Stop, re-prepare and restart)は、次のように表示されます。

このジョブは3つのフェーズで構成されます。第1フェーズでは、リアルタイムマッチ・プロセスを停止し、参照データ・スナップショットを再実行します。第2フェーズでは、マッチ・プロセスを準備モードで実行します。第3フェーズでは、リアルタイムマッチ・プロセスを間隔モードで再起動します。

トリガーは、フェーズの開始時または終了時のいずれかに実行するように構成されているため、第1フェーズの開始時に停止トリガーを配置したように、第2フェーズの終了時に再起動トリガーを挿入できます。一方、再起動トリガーを独自のフェーズに配置することは、再準備フェーズが正常に完了した場合にのみ再起動フェーズを実行するように構成できることを意味します。

トリガーの詳細は、「トリガーの使用」を参照してください。

リアルタイム・マッチの有効化

リアルタイム・マッチを有効化するためには、「Deduplicate」または「Enhance」プロセッサが格納されたプロセスを構成する必要があります。プロセスには、他のプロセッサを格納できますが、マッチ・プロセッサが1つのみ含まれている必要があります。

通常、リアルタイム・プロセスは間隔モードで実行します。つまり、継続ベースで実行し、定期的に結果データベースに結果を書き込みます。「実行オプション」を参照してください。

また、JMSまたはWebサービスを使用して外部システムと通信するには、リアルタイム・コンシューマとリアルタイム・プロバイダのインタフェースを構成する必要があります。

注意: Webサービスを介したリアルタイム参照マッチでは、EDQのWebサービス機能を使用して、リアルタイム・コンシューマとリアルタイム・プロバイダのインタフェースを自動的に生成できます。リアルタイム重複防止では、クラスタリングおよびレコードマッチ処理の個別の呼出しを処理するために、通常はインタフェースを手動で記述する必要があります。Siebelコネクタを使用している場合は、事前構成されたWebサービスが用意されています。

Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.