データなしの正規化

「データなしの正規化」プロセッサを使用すると、データの属性に存在する様々なタイプの空白値をNull値または独自に選択した特定の値に正規化できます。これは、データなしの値を一貫して処理するために重要です。たとえば、空白文字のみが格納された属性がある場合、他のプロセッサ(「一致」プロセッサによる比較など)では、これらの値がNULL値に正規化されていないかぎりデータなしとして処理されません。

「データなしの正規化」プロセッサでは、「データ処理なし」と同じ機能(Nullに正規化する場合)を実行できますが、実行できるのは1つのプロセス内のみです。これは、プロファイリング時にソースに存在する様々なタイプのデータなしを把握しておく必要がある一方で、後続のプロセッサでは引き続き空白値(Null)として処理する場合や、空白文字のみの構成になるまで値を値のノイズ削除やトリミングを行うなど、他の変換を介して属性内に空白値が生じ、これらをNullとして処理する必要がある場合に便利です。

「データなしの正規化」プロセッサは、空白文字のみが格納された属性値があることをパターン・プロファイリングで検出し、結果的に使用するデータがないとみなす必要がある場合に使用します。後続のプロセッサには、これらの値をNullとして処理することが保証されます。たとえば、「一致」プロセッサによる比較で、Null文字列とデータ値を比較した場合は、データなしの比較結果が返されます。

あるいは、元からNull (正規化前)であった値と区別するために、データなし値を独自に選択した値に明確に変換できます。

次の表に、構成オプションを示します。

構成 説明

入力

データなし値をNullまたは特定の値に正規化する任意の数の文字列または文字配列属性を指定します。

配列属性を入力すると、変換はすべての配列要素に適用され、1つの配列属性が出力されます。

オプション

次のオプションを指定します。

  • データ処理参照データなし: データなし文字として処理する文字のセットをリストします。これらの文字と空の文字列ですべて構成される値がNullまたは指定の値に正規化されます。参照データ(「データ処理なし」カテゴリ)として指定します。デフォルト値: *データ処理なし

  • データなしを次に正規化: データなし値をNullまたは選択したカスタム文字列値(後述のオプションで指定)のどちらに正規化するかを決定します。選択して指定します(Null値/カスタム文字列)。デフォルト値: Null値

  • カスタム文字列: Null値に正規化しない場合にデータ値なしを正規化するカスタム文字列値。フリー・テキストとして指定します。デフォルト値: いいえ

出力

データ属性またはフラグ属性の出力を記述します。

データ属性

次のデータ属性が出力されます。

  • [Attribute Name].NoDataNormalized: データなし値が正規化された後の新しい属性値を保持します。値は、これがNull、空の文字列またはデータなし文字のみが含まれていた場合に、指定の参照データ・リストを使用して、Null値またはカスタム文字列に変換された元の属性値です。

フラグ

なし。

「データなしの正規化」トランスフォーマでは、処理に関するサマリー統計は表示されません。

「データ」ビューには、各入力属性とともに、右側に新しく正規化された属性が表示されます。

出力フィルタ

なし。

この例では、データなしノーマライザを使用して、TITLE属性のすべての空白値をカスタム文字列’#NO DATA#’に正規化します。

TITLE TITLE.NoDataNormalized

Ms

Ms

[Null]

#NO DATA#

Mr

Mr

Miss

Miss

[Null]

#NO DATA#

Ms

Ms

[Null]

#NO DATA#