文字の切捨て

「文字の切捨て」プロセッサでは、指定のオプションに従って、文字列または文字配列属性を元の値の左、中央または右から設定された文字数に切り捨てます。

切捨て結果は追加属性として出力されます。

「文字の切捨て」は、テキスト値を設定された文字数に切り捨てるために使用します。たとえば、照合する前にデータを操作したり、ある属性の最初の数文字と別の属性の最後の数文字で構成された新しい照合クラスタを作成できます。この場合、「文字の切捨て」を2度使用することになり、1度目で属性の最初の数文字を取得し、2度目で別の属性の最後の数文字を取得します。

複数の属性にまったく同じ切捨て操作を実行する場合は、「文字の切捨て」プロセッサの1回の使用で実行できます。

次の表に、構成オプションを示します。

構成 説明

入力

設定された文字数に切り捨てる、文字列または文字配列型の属性を指定します。数値および日付属性は、標準的な単一のテキスト表現がないため、有効な入力ではありません。日付属性または数値属性を切り捨てる場合は、最初に「数値を文字列に変換」または「日付を文字列に変換」を使用して、文字列データ型の標準的な表現(たとえば、日付の場合はDD/MM/YYYY)に変換する必要があります。

配列属性を入力すると、変換はすべての配列要素に適用され、1つの配列属性が出力されます。

オプション

次のオプションを指定します。

  • 結果の長さ: 切捨て後に残す文字数。数値で指定します。デフォルト値: 1

  • 開始位置: 値の左または右から文字数でカウントした切捨て操作の開始位置。1は、左からカウントする場合は先頭の文字を意味し、右からカウントする場合は最後の文字を意味します。空白文字および制御文字はこのカウントに含まれるため、これらを考慮しないようにする場合は削除しておく必要があります。数値で指定します。デフォルト値: 1

  • 左から右: 切捨て開始位置の判断方法、つまり、保持する文字数を値の左または右からカウントします。選択して指定します(左/右)。デフォルト値:

出力

データ属性またはフラグ属性の出力を記述します。

データ属性

次のデータ属性が出力されます。

  • Substring: 指定のオプションを使用して切り捨てられた属性値。

フラグ

なし。

「文字の切捨て」トランスフォーマでは、処理に関するサマリー統計は表示されません。

「データ」ビューには、各入力属性が、その右に数値が削除され新しく導出された属性とともに表示されます。

出力フィルタ

なし。

この例では、「文字の切捨て」プロセッサを使用して、顧客表のDT_PURCHASED属性の日付の日部分(最初の2文字)が返されます。

ここでは、DT_PURCHASED 属性はすでに文字列属性として格納されています。必要な場合は、日付を文字列に変換プロセッサを使用してDATE属性を文字列に変換します。

変換の結果を次に示します。

DT_PURCHASED DT_PURCHASED.Substring

03/01/2000

03

06/01/2000

06

10/01/2000

10

14/01/2000

14

16/01/2000

16

16/01/2000

16

23/01/2000

23

23/01/2000

23