Denoise

「Denoise」プロセッサでは、テキスト属性からユーザー定義の「ノイズ」文字を削除し、その値を新しい出力属性で返します。

ノイズ文字のリストは、画面上でリストとして入力するか、参照リストを使用できます(両方を使用することも可能です)。

用途

一貫していない書式、句読点、誤った制御文字など、データ内で一貫性のない値をマスクできます。

テキスト属性に「List Check」を実行する前など、他の処理の実行前に「Denoise」プロセッサを使用して、これらのノイズ文字をテキスト属性から削除します。

構成

入力

ノイズを除去する文字列または文字列配列型の属性。数値属性および日付属性は有効な入力ではありません。

配列属性を入力すると、変換はすべての配列要素に適用され、単一の配列属性が出力されます。

オプション

オプション

タイプ

目的

デフォルト値

Noise characters Reference Data

参照データ

ノイズ文字のリスト

*Noise Characters

Noise characters

自由形式テキスト

追加のノイズ文字

なし

出力

データ属性

データ属性

タイプ

目的

[Attribute Name].Denoise

導出

属性値に対してノイズを除去したバージョン。

入力属性に応じて、文字列または配列になります。

元の属性がノイズ除去された値。

フラグ

なし

実行

実行モード

サポート

バッチ

Yes

リアルタイム・モニタリング

Yes

リアルタイム応答

Yes

結果ブラウザの表示

「Denoise」トランスフォーマでは、処理に関するサマリー統計は表示されません。

データ・ビューには、各入力属性とともに、右側に新しく導出されたノイズを除去した属性が表示されます。

出力フィルタ

なし

この例では、「Denoise」プロセッサを使用して、「NAME」属性からハッシュ文字(#)をすべて削除します。

Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.