1.3.2.3 データ型チェック
データ型チェック・プロセッサは、文字列属性または文字配列属性の値が一貫性のあるデータ型に準拠しているかどうかチェックし、想定したデータ型以外の値を持つレコードを無効として分類します。
数値属性と日付属性のデータ型は定義上100%一貫しているため、チェックできません。
データ型チェックは、ユーザー・アプリケーションで誤ったフィールドに入力された値(通常は、テキスト値のみが想定されるフィールドに入力された数値または日付)をすばやく検出するのに便利な手段です。
文字列属性に日付または数値を想定して、想定した型以外の値を無効として分類できることに注意してください。この機能が提供されているのは、日付と数値はデータ・ソースのスキーマから読み取れる制御されたデータ型の属性に必ずしも格納されていないためです。
次の表に、構成オプションを示します。
構成 | 説明 |
---|---|
入力 |
データ型の一貫性をチェックする1つ以上の文字列属性または文字配列属性を指定します。 |
オプション |
次のオプションを指定します。
|
出力 |
データ属性またはフラグ属性の出力を記述します。 |
データ属性 |
なし。 |
フラグ |
属性入力ごとに、新しい属性が次の形式で作成されます。
|
次の表に、このプロファイラによって生成される統計情報を示します。
データ型チェックで使用する日付書式参照データは、標準のJava 1.6.0以降のSimpleDateFormat APIに準拠している必要があります。
統計 | 説明 |
---|---|
有効 |
入力属性に対して想定されたデータ型のデータが格納されているレコード。 |
無効 |
入力属性に対して想定されていないデータ型のデータが格納されているレコード。 |
「追加情報」ボタンをクリックすると、前述の統計が、分析対象レコードの総数に対するパーセンテージとして表示されます。
出力フィルタ
データ型チェックでは、次の出力フィルタが生成されます。
-
有効レコード
-
無効レコード
例
この例では、NAME属性のすべての値がテキスト書式である場合に、データ型チェックを使用します。この場合、null値は無効として処理されます。
入力属性 | 有効/無効 |
---|---|
Michael |
有効 |
John Smith |
有効 |
<Null> |
無効 |
19-Aug-2012 |
無効 |