GNR Parse

「GNR Parse」プロセッサでは、GNRのパースAPIを使用して、構造化されていない氏名(「Full Name」フィールド)を読み取り、その氏名の構成部分を最もよく把握できるようにパースします。

用途

「GNR Parse」は、既知の名と姓の構造を持たないグローバル氏名データで使用します。

氏名のパースは通常、名と姓の氏名構造が必要な「GNR Search」を使用する前に実行します。

構成

入力

「GNR Parse」プロセッサでは、入力として1つ以上の氏名属性が必要です。複数の属性が入力された場合、このプロセッサでは、単純に値を連結してその結果を氏名として処理します。

オプション

オプション

タイプ

目的

デフォルト値

Reparse threshold

整数

再パースによって単一の入力名に対して別のパースの検索を試行する最大回数を決定します。0の値は、再パースを試行しないことを意味します。1以上の値は、再パースを試行することを意味します。再パースは、最初のパースの出力を使用して氏名を再びパースするプロセスであることに注意してください。これによって、同じ氏名についてより信頼値の高い別のパースが提供される場合があります。したがって、再パースのしきい値の値を高く設定すると、パースが成功するレコード数が増加する可能性があります。

0

Confidence threshold

整数

成功とみなす氏名パース結果を決定します。この信頼しきい値を下回る氏名パースは抑制されます。入力名のパースがこのしきい値を上回らない場合、パースは成功しないためパース名は出力されません。

60

出力

パース名は、配列属性としてデータに追加されます。これは、同じ氏名について複数のパースが出力されたり、同じ入力名から複数の氏名が認識される場合(あるいはその両方)があるためです。たとえば、「Stephen Martin」という氏名では2つの別のパース名が同一の個人に対して生成され、「Mr and Mrs Alan and Susan Collins」という氏名では複数の氏名が2人の個人に対して生成されます。

配列値は、他の標準のEDQプロセッサによってさらに処理できます。たとえば、「Split Records from Array」を使用すると、氏名の別のパースおよび複数のパースを別のレコードに分割できます。

gnr.NameIndex属性は、パース名が別のパースの氏名(つまり、別の氏名)であるかどうかを示します。gnr.NameIndex値が同じである出力名は同一の個人を表します。

データ属性

すべての属性は配列ですが、これは、APIによって返されるパース名が複数の場合があるため(同じ氏名に別のパースがあったり、入力名に複数の氏名があるため)です。

データ属性

タイプ

gnr.GivenName

文字列配列

入力名からパースされた名

gnr.Surname

文字列配列

入力名からパースされた姓

gnr.Qualifier

文字列配列

入力名からパースされた修飾子

gnr.Title

文字列配列

入力名からパースされた敬称

gnr.Confidence

文字列配列

GNRパースAPIによるパース名の信頼度

gnr.NameIndex

文字列配列

氏名が別のパースかどうかを示す索引値

フラグ

フラグ

目的

可能性のある値

gnr.ParseSuccess

構成された信頼しきい値に基づいて入力名のパースが成功か失敗かを示します。

Y - 氏名パースが成功した場合

N - 氏名パースが失敗した場合

実行

実行モード

サポート

バッチ

Yes

リアルタイム・モニタリング

Yes

リアルタイム応答

Yes

結果ブラウザの表示

サマリー・ビューには、(構成された信頼しきい値に基づいて)パース結果が成功別または失敗別に集計されて表示されます。

統計

意味

Successful

入力名は、構成されたしきい値を上回る信頼値で1つ以上の出力名に正常にパースされました。

Unsuccessful

入力名は、構成されたしきい値を上回る信頼値でパースできませんでした。

出力フィルタ

「GNR Parse」プロセッサからは、次の出力フィルタが使用可能です。

次の例は、「GNR Parse」によって、氏名が構造化された氏名形式にパースされている様子を示しています。

サマリー・ビュー

データ・ビュー

Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.