照合変換: 単語の削除
「単語の削除」照合変換を使用すると、クラスタリングまたは比較の前に、文字列値から特定の単語を削除できます。これは、メインの「単語の削除」プロセッサとまったく同様に機能します。
「単語の削除」変換は、値の識別には必要ない特定単語の様々な形式が多数含まれるテキスト値をクラスタリングまたは比較する場合に非常に便利です。たとえば、会社名を照合する場合、識別子値の意味のある部分のみを照合するために、"LIMITED"、"LTD"、"GRP"、"GROUP"、"PLC"などの接尾辞を削除できます。
例
この例では、比較内で会社名識別子に対して「単語の削除」変換を使用します。
サンプル構成
使用する参照データの一番左の列に、次の単語が含まれています。
CORP、CORPORATION、LIMITED、LTD、PLC、GROUP、GRP
区切り文字参照データ: *区切り文字
区切り文字: なし
大文字/小文字を区別しない: はい
変換例
次の表に、「単語の削除」変換の前述の構成を使用した変換例を示します。
表1-97 「単語の削除」変換の例
値 | 変換済の値 |
---|---|
ORACLE CORP |
ORACLE |
ORACLE CORPORATION |
ORACLE |
INTERCHANGE GROUP LIMITED |
INTERCHANGE |
INTERCHANGE GROUP |
INTERCHANGE |
INTERCHANGE GRP LTD |
INTERCHANGE |