Normalize Whitespace

「Normalize Whitespace」プロセッサでは、文字列値の中の空白文字をすべて正規化して、単語間の複数のスペースを1つのスペース文字に正規化します。さらに、先頭および末尾の空白文字も削除します。

EDQでは、空白文字は次のように定義されています。

用途

「Normalize Whitespace」は、すべての値が通常のスペース設定になるように、自由形式テキスト・フィールドをパースする前によく使用されます。また、余分なスペースが残存している可能性がある他の変換の後にもよく使用されます。たとえば、テキスト・フィールドから単語または数値を除去した場合は、単語間に余分なスペースが残っている可能性があります。

構成

入力

空白文字を正規化する文字列または文字列配列型の属性。数値属性および日付属性は有効な入力ではありません。

配列属性を入力すると、変換はすべての配列要素に適用され、単一の配列属性が出力されます。

オプション

なし

出力

データ属性

データ属性

タイプ

目的

[Attribute Name].WhitespaceNormalized

導出

単語間のスペース設定が正規化された新しい属性。

元の属性に対して空白文字が正規化された値。

フラグ

なし

実行

実行モード

サポート

バッチ

Yes

リアルタイム・モニタリング

Yes

リアルタイム応答

Yes

結果ブラウザの表示

「Normalize Whitespace」トランスフォーマでは、処理に関するサマリー統計は表示されません。

データ・ビューには、各入力属性とともに、右側に新しく導出された、空白文字を正規化した属性が表示されます。

出力フィルタ

なし

この例では、「Normalize Whitespace」プロセッサを使用して、住所の1行目にある属性の単語間のスペースを正規化します。

Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.