データ型チェック

データ型チェック・プロセッサは、文字列属性または文字配列属性の値が一貫性のあるデータ型に準拠しているかどうかチェックし、想定したデータ型以外の値を持つレコードを無効として分類します。

数値属性と日付属性のデータ型は定義上100%一貫しているため、チェックできません。

データ型チェックは、ユーザー・アプリケーションで誤ったフィールドに入力された値(通常は、テキスト値のみが想定されるフィールドに入力された数値または日付)をすばやく検出するのに便利な手段です。

文字列属性に日付または数値を想定して、想定した型以外の値を無効として分類できることに注意してください。この機能が提供されているのは、日付と数値はデータ・ソースのスキーマから読み取れる制御されたデータ型の属性に必ずしも格納されていないためです。

次の表に、構成オプションを示します。

構成 説明

入力

データ型の一貫性をチェックする1つ以上の文字列属性または文字配列属性を指定します。

オプション

次のオプションを指定します。

  • 予期したデータ型: 入力データに対して想定した(有効な)データ型を指定します。想定した型以外の検出されたデータは、無効として分類されます。選択して指定します(テキスト/数値/日付)。デフォルト値: None

  • Nullを有効として解釈: チェックでNull値を有効として解釈するかどうかを決定します。使用可能な値: はい/いいえ。デフォルト値: はい

  • 認識済日付書式のリスト: 様々な書式の日付を認識します。参照データ(日付書式カテゴリ)として指定します。デフォルト値: はい

出力

データ属性またはフラグ属性の出力を記述します。

データ属性

なし。

フラグ

属性入力ごとに、新しい属性が次の形式で作成されます。

  • [Attribute Name].DateTypeValidDetail: データのどの要素がデータ型チェックに合格したかを示します。使用可能な値はYまたはNです。

  • [Attribute Name].DateTypeValid: データがデータ型チェックに合格したかどうかを示します。使用可能な値はYまたはNです。

次の表に、このプロファイラによって生成される統計情報を示します。

データ型チェックで使用する日付書式参照データは、標準のJava 1.6.0以降のSimpleDateFormat APIに準拠している必要があります。

統計 説明

有効

入力属性に対して想定されたデータ型のデータが格納されているレコード。

無効

入力属性に対して想定されていないデータ型のデータが格納されているレコード。

「追加情報」ボタンをクリックすると、前述の統計が、分析対象レコードの総数に対するパーセンテージとして表示されます。

出力フィルタ

データ型チェックでは、次の出力フィルタが生成されます。

  • 有効レコード

  • 無効レコード

この例では、NAME属性のすべての値がテキスト書式である場合に、データ型チェックを使用します。この場合、null値は無効として処理されます。

入力属性 有効/無効

Michael

有効

John Smith

有効

<Null>

無効

19-Aug-2012

無効