単語の削除

単語の削除変換プロセッサは、参照データリストと一致するすべての単語を属性値から削除します。

単語の削除は、多くの場合、照合する値を作成する目的で、属性から無関係な単語を削除するために使用されます。たとえば、Company Nameフィールドを使用して会社を照合するときに、LTD、LIMITED、UK、PLCなど様々な形式で発生したり、一部の値でのみ発生するあまり重要でない単語を削除するのに役立ちます。

次の表に、構成オプションを示します。

構成 説明

入力

単語を削除する文字型または文字配列型の属性を指定します。数値属性および日付属性は有効な入力ではありません。

配列属性を入力すると、変換はすべての配列要素に適用され、1つの配列属性が出力されます。

オプション

次のオプションを指定します。

  • 参照データ: 属性値から削除する単語のリスト。参照データとして指定します。デフォルト値: None

  • 区切り文字: 値を単語に分割するためのデリミタ文字の標準的で再使用可能なセットを指定でき、制御文字をデリミタとして使用できます。単一の文字のみ(文字や文字列でなく)区切り文字として使用できます。複数文字の区切り文字は無視されます。参照データとして指定します。デフォルト値: *Delimiters

  • 区切り文字リスト: スペースやカンマなどの単純なデリミタの場合は、参照データを作成せずに、使用するデリミタを指定できます。 参照リストに加えてこれらを使用すると、両方のオプションで指定されたすべての区切り文字を使用してデータが分割されます。フリー・テキスト・エントリとして指定します。デフォルト値: スペース

  • 大文字/小文字を区別しない: 削除する単語のリストを照合するときに、大/小文字を無視するかどうかを決定します。Specified as 「はい」/「いいえ」で指定します。デフォルト値: はい

出力

データ属性またはフラグ属性の出力を記述します。

データ属性

次のデータ属性が出力されます。

  • StrippedNumbers: 参照リストと一致するすべての単語が削除された、元の属性値から導出された新しい属性。入力値に使用された当初の区切り文字は保持されます。

フラグ

なし。

単語の削除トランスフォーマでは、処理に関するサマリー統計は表示されません。

「データ」ビューには、各入力属性が、その右に数値が削除され新しく導出された属性とともに表示されます。

出力フィルタ

なし。

この例では、単語の削除を使用して、会社名が含まれるフィールドから、「Limited」、「Ltd.」、「Services」、「Associates」などの比較的重要性の低い単語を削除します。

BUSINESS Business.StrippedWords

Kamke & Ellis Ltd.

Kamke & Ellis

Sanford Electrical Co

Sanford Electrical

C T V Services

C T V

W F Electrical Contractors Limited

W F Electrical Contractors

Eco-Systems Group

Eco-Systems

Milbourne Associates

Milbourne