Denoise |
「Denoise」プロセッサでは、テキスト属性からユーザー定義の「ノイズ」文字を削除し、その値を新しい出力属性で返します。
ノイズ文字のリストは、画面上でリストとして入力するか、参照リストを使用できます(両方を使用することも可能です)。
一貫していない書式、句読点、誤った制御文字など、データ内で一貫性のない値をマスクできます。
テキスト属性に「List Check」を実行する前など、他の処理の実行前に「Denoise」プロセッサを使用して、これらのノイズ文字をテキスト属性から削除します。
ノイズを除去する文字列または文字列配列型の属性。数値属性および日付属性は有効な入力ではありません。
配列属性を入力すると、変換はすべての配列要素に適用され、単一の配列属性が出力されます。
オプション |
タイプ |
目的 |
デフォルト値 |
参照データ |
ノイズ文字のリスト |
*Noise Characters |
|
Noise characters |
自由形式テキスト |
追加のノイズ文字 |
なし |
データ属性 |
タイプ |
目的 |
値 |
[Attribute Name].Denoise |
導出 |
属性値に対してノイズを除去したバージョン。 入力属性に応じて、文字列または配列になります。 |
元の属性がノイズ除去された値。 |
なし
実行モード |
サポート |
バッチ |
Yes |
リアルタイム・モニタリング |
Yes |
リアルタイム応答 |
Yes |
「Denoise」トランスフォーマでは、処理に関するサマリー統計は表示されません。
データ・ビューには、各入力属性とともに、右側に新しく導出されたノイズを除去した属性が表示されます。
なし
この例では、「Denoise」プロセッサを使用して、「NAME」属性からハッシュ文字(#)をすべて削除します。
Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.