GNR Search |
「GNR Search」プロセッサは最も重要なGNRプロセッサで、問合せデータ(顧客名など)を参照データ(ウォッチリストの個人名など)と照合するために使用します。「GNR Search」プロセッサには、NameHunterパッケージの様々なGNR APIが含まれています。
「GNR Search」は、文化に依存する言語ルールを使用して、データ・セット間で氏名を照合します。「GNR Search」では、元の文化が広範囲にわたる氏名のバリアントに関する大規模ディクショナリにアクセスできます。「GNR Search」には、異なる文字で表現されている氏名間で照合できるように、ロシア、ギリシャおよびアラビアの音訳ルールも含まれています。
「GNR Search」プロセッサでは、リアルタイム実行とバッチ実行の両方で機能する単一プロセッサを提供するために、EDQの標準参照データ機能を使用して参照データ(「検索リスト」)をメモリーに読み取り、レコードごとに問合せの氏名を照合することに注意してください。
「GNR Search」プロセッサでは、最適な文化値が追加された入力名(つまり、次の特定の入力属性)が必要です。
「GNR Search」を実行するには、その前に「GNR Get Best Culture」を使用して必要な文化値を氏名に追加し、「GNR Parse」または「Parse」プロセッサの構成を使用して、構造化されていない氏名を「Given Name」と「Surname」の構造に分割します(必要な場合)。
オプション |
タイプ |
目的 |
デフォルト値 |
Configuration |
選択 |
構成ファイルを使用して「GNR Search」プロセッサの構成オプションを設定します。 |
デフォルトの構成ファイル(「Default」と呼ばれる)が提供されています。 追加の構成ファイルは、管理者がサーバーに追加できます。 |
Maximum number of matches |
整数 |
単一の入力レコードに対して返す最大マッチ数を設定します。これは、非常に緩やかなマッチ構成が使用されている場合のパフォーマンスを保護するためです。 |
なし(最大数なし) |
Search List |
参照データ |
検索操作で使用する参照データのセットを指定します。後述の注意を参照してください。 |
なし |
注意: 検索リスト・データには特定の構造が設定されている必要があり、このデータは通常、EDQプロセスによって書き込まれたステージング・データの参照となります。EDQプロセスは、検索に必要なデータを必要な構造に処理(「GNR Get Best Culture」を使用して必要な文化値を参照データ名に追加するなど)します。 |
必要な構造は次のとおりです。
この構造は順序に依存するため、使用する参照データまたは参照の列は前述の順序で構成されている必要があります。
次に示すように、検索リストのマッチ・レコードが配列属性でデータに追加されます。出力が配列であるのは、検索リスト内に各入力レコードに対するマッチが複数存在する場合があるためです。
データ属性 |
タイプ |
値 |
GivenNames |
文字列配列 |
検索リスト内の名のマッチ・レコード |
Surnames |
文字列配列 |
検索リスト内の姓のマッチ・レコード |
Tokens |
文字列配列 |
検索リスト内のトークン(レコード識別子)のマッチ・レコード |
GivenNameScores |
数値配列 |
名のマッチ・スコア |
SurnameScores |
数値配列 |
姓のマッチ・スコア |
FullNameScores |
数値配列 |
氏名のマッチの全体スコア。これは通常、名スコアと姓スコアから計算されます。 |
フラグ |
目的 |
可能性のある値 |
SearchSuccess |
各レコードの高レベルな検索結果を示すフラグで、検索リストのレコードがマッチしたかどうかを示します。 |
Y - 入力レコードが検索リスト内のレコードと1つ以上マッチした場合 N - 入力レコードが検索リスト内のレコードとマッチしなかった場合 |
ResultsTruncated |
構成された最大マッチ数を超えているために、結果が切り捨てられたレコードを示すフラグ。 |
Y - 入力レコードが構成された最大マッチ数を超えている場合 N - 構成された最大数を超えていない場合 |
実行モード |
サポート |
バッチ |
Yes |
リアルタイム・モニタリング |
Yes |
リアルタイム応答 |
Yes |
サマリー・ビューには、検索結果が成功別または失敗別に集計されて表示されます。
統計 |
意味 |
Successful |
検索リストのデータと照合して1つ以上のマッチが検出されたレコード数 |
Unsuccessful |
検索リストのデータと照合してマッチが検出されなかったレコード数 |
「GNR Search」プロセッサからは、次の出力フィルタが使用可能です。
この例では、「GNR Search」を使用して、顧客レコードを認可リストの個人に関する検索リストと照合しています。
サマリー・ビュー
データ・ビュー
Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.