ノイズ削除
「ノイズ削除」プロセッサは、テキスト属性からユーザー定義のノイズ文字を削除し、その値を新しい出力属性で返します。
ノイズ文字のリストは、画面上でリストとして入力するか、参照リストを使用できます(両方を使用することも可能です)。
一貫していない書式、句読点、誤った制御文字など、データ内で一貫性のない値をマスクできます。
テキスト属性に「リスト・チェック」を実行する前など、他の処理の実行前に「ノイズ削除」プロセッサを使用して、これらのノイズ文字をテキスト属性から削除します。
次の表に、構成オプションを示します。
構成 | 説明 |
---|---|
入力 |
ノイズを削除する文字列または文字列配列型の属性を指定します。数値属性および日付属性は有効な入力ではありません。 配列属性を入力すると、変換はすべての配列要素に適用され、1つの配列属性が出力されます。 |
オプション |
次のオプションを指定します。
|
出力 |
データ属性またはフラグ属性の出力を記述します。 |
データ属性 |
次のデータ属性が出力されます。
|
フラグ |
なし。 |
「ノイズ削除」トランスフォーマでは、処理に関するサマリー統計は表示されません。データ・ビューには、各入力属性とともに、右側に新しく導出されたノイズを削除した属性が表示されます。
出力フィルタ
なし。
例
この例では、「ノイズ削除」プロセッサを使用して、NAME
属性からハッシュ文字(#)をすべて削除します。
NAME (昇順) | NAME.Denoise |
---|---|
# MCAULAY |
MCAULAY |
# RAE |
RAE |
# SWAN |
SWAN |
# WILLIAM |
WILLIAM |
A Test |
A Test |
Abigail Anderson |
Abigail Anderson |