1.3.3.9.17 照合変換: 置換
「置換」変換を使用すると、クラスタリングまたは照合の目的でデータを標準化するために、参照データ・マップを使用できます。
この変換は、EDQのメインの置換プロセッサとまったく同様に機能します。このヘルプ・ページでは、照合の際の「置換」変換の一般的な使用方法について説明します。
「置換」変換は、ユーザーがフリー・テキスト・フィールドによく入力する同じ値のバリエーションを解決する場合に非常に便利です。
同じ値がいくつかの異なる方法で表現される場合が多くあります。たとえば、「Bill」、「William」および「Billy」はすべて同じ名前の異なる形式であり、「Hse」、「House」および「Ho.」はすべて「House」という単語の形式です。参照データ・マップを使用すると、このようなシノニムを1つの値表現方法に標準化できます。
たとえば、次のエントリが参照データ・マップ内に存在し、照合目的で名前を標準化するためにこれらを使用するとします。
表1-89 「置換」変換の例
値 | 標準化 |
---|---|
Bill |
William |
Billy |
William |
Willy |
William |
Mike |
Michael |
Mick |
Michael |
Mickey |
Michael |
Dave |
David |
Jim |
James |
次の表に、構成オプションを示します。
構成 | 説明 |
---|---|
オプション |
次のオプションを指定します。
|
例
この例では、「置換」変換を使用して、照合の目的で名前を標準化します。
サンプル構成
参照データ:
表1-90 参照データの例
値 | マップ | アクティブ |
---|---|---|
Bill |
William |
はい |
Billy |
William |
はい |
Willy |
William |
はい |
Will |
William |
はい |
Mike |
Michael |
はい |
Micheal |
Michael |
いいえ |
Mickey |
Michael |
はい |
Dave |
David |
はい |
Steven |
Stephen |
はい |
Steve |
Stephen |
はい |
Jim |
James |
はい |
最初に最長の値に一致: いいえ
大文字/小文字を区別しない: はい
一致基準: 全体の値
デリミタ: <space>
変換例
次の表に、前述の構成を使用した「置換」変換の例を示します。
表1-91 「置換」変換の例
値 | 変換済の値 |
---|---|
Steven Lewis |
Stephen Lewis |
Stephen Lewis |
Stephen Lewis |
David Stevens |
David Stevens |
David Steven |
David Stephen |
Mike Davis |
Michael Davis |
Micheal Lewis |
Micheal Lewis |
Mickey Lewis |
Michael Lewis |
Jim Jones |
James Jones |
James Jones |
James Jones |
Bill Taylor |
William Taylor |
Will Taylor |
William Taylor |