データなしの正規化
「データなしの正規化」プロセッサを使用すると、データの属性に存在する様々なタイプの空白値をNull値または独自に選択した特定の値に正規化できます。これは、データなしの値を一貫して処理するために重要です。たとえば、空白文字のみが格納された属性がある場合、他のプロセッサ(「一致」プロセッサによる比較など)では、これらの値がNULL値に正規化されていないかぎりデータなしとして処理されません。
「データなしの正規化」プロセッサでは、「データ処理なし」と同じ機能(Nullに正規化する場合)を実行できますが、実行できるのは1つのプロセス内のみです。これは、プロファイリング時にソースに存在する様々なタイプのデータなしを把握しておく必要がある一方で、後続のプロセッサでは引き続き空白値(Null)として処理する場合や、空白文字のみの構成になるまで値を値のノイズ削除やトリミングを行うなど、他の変換を介して属性内に空白値が生じ、これらをNullとして処理する必要がある場合に便利です。
「データなしの正規化」プロセッサは、空白文字のみが格納された属性値があることをパターン・プロファイリングで検出し、結果的に使用するデータがないとみなす必要がある場合に使用します。後続のプロセッサには、これらの値をNullとして処理することが保証されます。たとえば、「一致」プロセッサによる比較で、Null文字列とデータ値を比較した場合は、データなしの比較結果が返されます。
あるいは、元からNull (正規化前)であった値と区別するために、データなし値を独自に選択した値に明確に変換できます。
次の表に、構成オプションを示します。
構成 | 説明 |
---|---|
入力 |
データなし値をNullまたは特定の値に正規化する任意の数の文字列または文字配列属性を指定します。 配列属性を入力すると、変換はすべての配列要素に適用され、1つの配列属性が出力されます。 |
オプション |
次のオプションを指定します。
|
出力 |
データ属性またはフラグ属性の出力を記述します。 |
データ属性 |
次のデータ属性が出力されます。
|
フラグ |
なし。 |
「データなしの正規化」トランスフォーマでは、処理に関するサマリー統計は表示されません。
「データ」ビューには、各入力属性とともに、右側に新しく正規化された属性が表示されます。
出力フィルタ
なし。
例
この例では、データなしノーマライザを使用して、TITLE
属性のすべての空白値をカスタム文字列’#NO DATA#’に正規化します。
TITLE | TITLE.NoDataNormalized |
---|---|
Ms |
Ms |
[Null] |
#NO DATA# |
Mr |
Mr |
Miss |
Miss |
[Null] |
#NO DATA# |
Ms |
Ms |
[Null] |
#NO DATA# |