ノイズ削除

「ノイズ削除」プロセッサは、テキスト属性からユーザー定義のノイズ文字を削除し、その値を新しい出力属性で返します。

ノイズ文字のリストは、画面上でリストとして入力するか、参照リストを使用できます(両方を使用することも可能です)。

一貫していない書式、句読点、誤った制御文字など、データ内で一貫性のない値をマスクできます。

テキスト属性に「リスト・チェック」を実行する前など、他の処理の実行前に「ノイズ削除」プロセッサを使用して、これらのノイズ文字をテキスト属性から削除します。

次の表に、構成オプションを示します。

構成 説明

入力

ノイズを削除する文字列または文字列配列型の属性を指定します。数値属性および日付属性は有効な入力ではありません。

配列属性を入力すると、変換はすべての配列要素に適用され、1つの配列属性が出力されます。

オプション

次のオプションを指定します。

  • ノイズ文字参照データ: ノイズ文字のリスト。参照データとして指定します。デフォルト値: *ノイズ文字

  • ノイズ文字: 追加のノイズ文字。フリー・テキストとして指定します。デフォルト値: None

出力

データ属性またはフラグ属性の出力を記述します。

データ属性

次のデータ属性が出力されます。

  • [Attribute Name].Denoise: 属性値に対してノイズを削除したバージョン。入力属性に応じて、文字列または配列になります。値は、元の属性値からノイズを削除して導出されます。

フラグ

なし。

「ノイズ削除」トランスフォーマでは、処理に関するサマリー統計は表示されません。データ・ビューには、各入力属性とともに、右側に新しく導出されたノイズを削除した属性が表示されます。

出力フィルタ

なし。

この例では、「ノイズ削除」プロセッサを使用して、NAME属性からハッシュ文字(#)をすべて削除します。

NAME (昇順) NAME.Denoise

# MCAULAY

MCAULAY

# RAE

RAE

# SWAN

SWAN

# WILLIAM

WILLIAM

A Test

A Test

Abigail Anderson

Abigail Anderson