数値の削除
「数値の削除」プロセッサを使用すると、テキスト属性からすべての数値を速やかに削除できます。
数値の削除は通常、照合用のデータを準備するために(または照合プロセッサでの照合変換として)使用されます。テキスト・データに不要な数値が含まれている場合、照合する前にそれらを削除するときに便利です。
たとえば、商品説明を照合するときに、一部の説明に非常に長いシリアル番号が含まれていることがあります。これらを削除して、説明文のみを使用できます。
また、電話番号など、大半が数値だと思われるテキスト属性内で数値以外の文字列や文字を見つけるときにも使用できます。これはデータの解析や、標準化のときに役立ちます。
次の表に、構成オプションを示します。
構成 | 説明 |
---|---|
入力 |
数値を削除する文字列型または文字配列型の属性を指定します。数値属性および日付属性は有効な入力ではありません。 配列属性を入力すると、変換はすべての配列要素に適用され、1つの配列属性が出力されます。 |
オプション |
なし。 |
出力 |
データ属性またはフラグ属性の出力を記述します。 |
データ属性 |
次のデータ属性が出力されます。
|
フラグ |
なし。 |
「数値の削除」トランスフォーマは、処理に関するサマリー統計を表示しません。
「データ」ビューには、各入力属性が、その右に数値が削除され新しく導出された属性とともに表示されます。
出力フィルタ
なし。
例
この例では、電話番号を含む属性からすべての数値が削除されます。これにより、電話番号に関する追加情報を示す様々な方法がデータに含まれていることがわかります。それらの追加情報は標準化し、たとえば電話帳に表示されない(ex-directory)番号を示すためのフラグを新しい属性内に設定するために使用する必要がある場合もあります。
PhoneNumber | PhoneNumber.StrippedNumbers (降順) |
---|---|
01240 904346(w) |
(w) |
043408 37440(landlord'sno) |
(landlord'sno) |
01266 310270(ex directory) |
(ex directory) |
01266 317153(ex directory) |
(ex directory) |
01266 371080(ex directory) |
(ex directory) |
01918441231 (H) |
(H) |