GNR Parse |
「GNR Parse」プロセッサでは、GNRのパースAPIを使用して、構造化されていない氏名(「Full Name」フィールド)を読み取り、その氏名の構成部分を最もよく把握できるようにパースします。
「GNR Parse」は、既知の名と姓の構造を持たないグローバル氏名データで使用します。
氏名のパースは通常、名と姓の氏名構造が必要な「GNR Search」を使用する前に実行します。
「GNR Parse」プロセッサでは、入力として1つ以上の氏名属性が必要です。複数の属性が入力された場合、このプロセッサでは、単純に値を連結してその結果を氏名として処理します。
オプション |
タイプ |
目的 |
デフォルト値 |
Reparse threshold |
整数 |
再パースによって単一の入力名に対して別のパースの検索を試行する最大回数を決定します。0の値は、再パースを試行しないことを意味します。1以上の値は、再パースを試行することを意味します。再パースは、最初のパースの出力を使用して氏名を再びパースするプロセスであることに注意してください。これによって、同じ氏名についてより信頼値の高い別のパースが提供される場合があります。したがって、再パースのしきい値の値を高く設定すると、パースが成功するレコード数が増加する可能性があります。 |
0 |
Confidence threshold |
整数 |
成功とみなす氏名パース結果を決定します。この信頼しきい値を下回る氏名パースは抑制されます。入力名のパースがこのしきい値を上回らない場合、パースは成功しないためパース名は出力されません。 |
60 |
パース名は、配列属性としてデータに追加されます。これは、同じ氏名について複数のパースが出力されたり、同じ入力名から複数の氏名が認識される場合(あるいはその両方)があるためです。たとえば、「Stephen Martin」という氏名では2つの別のパース名が同一の個人に対して生成され、「Mr and Mrs Alan and Susan Collins」という氏名では複数の氏名が2人の個人に対して生成されます。
配列値は、他の標準のEDQプロセッサによってさらに処理できます。たとえば、「Split Records from Array」を使用すると、氏名の別のパースおよび複数のパースを別のレコードに分割できます。
gnr.NameIndex属性は、パース名が別のパースの氏名(つまり、別の氏名)であるかどうかを示します。gnr.NameIndex値が同じである出力名は同一の個人を表します。
すべての属性は配列ですが、これは、APIによって返されるパース名が複数の場合があるため(同じ氏名に別のパースがあったり、入力名に複数の氏名があるため)です。
データ属性 |
タイプ |
値 |
gnr.GivenName |
文字列配列 |
入力名からパースされた名 |
gnr.Surname |
文字列配列 |
入力名からパースされた姓 |
gnr.Qualifier |
文字列配列 |
入力名からパースされた修飾子 |
gnr.Title |
文字列配列 |
入力名からパースされた敬称 |
gnr.Confidence |
文字列配列 |
GNRパースAPIによるパース名の信頼度 |
gnr.NameIndex |
文字列配列 |
氏名が別のパースかどうかを示す索引値 |
フラグ |
目的 |
可能性のある値 |
gnr.ParseSuccess |
構成された信頼しきい値に基づいて入力名のパースが成功か失敗かを示します。 |
Y - 氏名パースが成功した場合 N - 氏名パースが失敗した場合 |
実行モード |
サポート |
バッチ |
Yes |
リアルタイム・モニタリング |
Yes |
リアルタイム応答 |
Yes |
サマリー・ビューには、(構成された信頼しきい値に基づいて)パース結果が成功別または失敗別に集計されて表示されます。
統計 |
意味 |
Successful |
入力名は、構成されたしきい値を上回る信頼値で1つ以上の出力名に正常にパースされました。 |
Unsuccessful |
入力名は、構成されたしきい値を上回る信頼値でパースできませんでした。 |
「GNR Parse」プロセッサからは、次の出力フィルタが使用可能です。
次の例は、「GNR Parse」によって、氏名が構造化された氏名形式にパースされている様子を示しています。
サマリー・ビュー
データ・ビュー
Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.