照合変換: 置換

「置換」変換を使用すると、クラスタリングまたは照合の目的でデータを標準化するために、参照データ・マップを使用できます。

この変換は、EDQのメインの置換プロセッサとまったく同様に機能します。このヘルプ・ページでは、照合の際の「置換」変換の一般的な使用方法について説明します。

「置換」変換は、ユーザーがフリー・テキスト・フィールドによく入力する同じ値のバリエーションを解決する場合に非常に便利です。

同じ値がいくつかの異なる方法で表現される場合が多くあります。たとえば、「Bill」、「William」および「Billy」はすべて同じ名前の異なる形式であり、「Hse」、「House」および「Ho.」はすべて「House」という単語の形式です。参照データ・マップを使用すると、このようなシノニムを1つの値表現方法に標準化できます。

たとえば、次のエントリが参照データ・マップ内に存在し、照合目的で名前を標準化するためにこれらを使用するとします。

表1-89 「置換」変換の例

標準化

Bill

William

Billy

William

Willy

William

Mike

Michael

Mick

Michael

Mickey

Michael

Dave

David

Jim

James

次の表に、構成オプションを示します。

構成 説明

オプション

次のオプションを指定します。

  • 参照データ: 属性値をマップ内のルックアップ列と照合します。一致があると、一致する値が右側の列の値で置換されます。タイプ: 参照データ。デフォルト値: なし。

  • 最初に最長の値に一致: マップとの一致が複数存在する場合に、「次で始まる」、「後方から一致する」または「次を含む」のうちどの置換を実行するかを制御します。タイプ: はい/いいえ。デフォルト値: いいえ。

  • 大文字/小文字を区別しない: マップのルックアップ列と照合するときに、大/小文字を無視するかどうかを決定します。タイプ: はい/いいえ。デフォルト値: はい。

  • 一致基準: マップと照合する方法、および元の値のどの部分を置換するかを決定します。タイプ: 選択(全体の値/次で始まる/次で終わる/次を含む/区切り文字の一致)。デフォルト値: 全体の値。

  • 区切り文字: 区切り文字を使用してデータを区切ってから値をマップと照合する場合は、使用する区切り文字を指定できます。タイプ: フリー・テキスト・エントリ。デフォルト値: スペース。

この例では、「置換」変換を使用して、照合の目的で名前を標準化します。

サンプル構成

参照データ:

表1-90 参照データの例

マップ アクティブ

Bill

William

はい

Billy

William

はい

Willy

William

はい

Will

William

はい

Mike

Michael

はい

Micheal

Michael

いいえ

Mickey

Michael

はい

Dave

David

はい

Steven

Stephen

はい

Steve

Stephen

はい

Jim

James

はい

最初に最長の値に一致: いいえ

大文字/小文字を区別しない: はい

一致基準: 全体の値

デリミタ: <space>

変換例

次の表に、前述の構成を使用した「置換」変換の例を示します。

表1-91 「置換」変換の例

変換済の値

Steven Lewis

Stephen Lewis

Stephen Lewis

Stephen Lewis

David Stevens

David Stevens

David Steven

David Stephen

Mike Davis

Michael Davis

Micheal Lewis

Micheal Lewis

Mickey Lewis

Michael Lewis

Jim Jones

James Jones

James Jones

James Jones

Bill Taylor

William Taylor

Will Taylor

William Taylor