最大/最小プロファイラ
最大/最小プロファイラは、各属性のデータの極値を調べて、次の値を返します。
-
最短値
-
最長値
-
最低値
-
最高値
最大/最小プロファイラは、最初にデータの概要を把握するために使用します。最大/最小プロファイラを使用すると、データがその長さや有効値の制限に準拠しているかどうかについて概要をすばやく把握できます。これにより、たとえば想定より大きい/小さい数値、想定より早い/遅い日付値、「#」などの無効な文字のみで構成されたテキスト値、「aaa」や「zzz」のような不正データなどの外れ値(明らかに範囲外の値)を検出できます。
次の表に、構成オプションを示します。
構成 | 説明 |
---|---|
入力 |
データの最大値および最小値検出の対象にする属性を指定します。 |
オプション |
なし。 |
出力 |
データ属性またはフラグ属性の出力を記述します。 |
データ属性 |
なし。 |
フラグ |
次のフラグが出力されます。
|
最大/最小プロファイラでは、有益な統計を生成するためにレコードのバッチが必要です。したがって、処理が完了するまで結果が生成されないため、これはリアルタイム・レスポンスが必要なプロセスには適していません。
リアルタイム・データ・ソースからのトランザクションのバッチに対して実行した場合、リーダー・プロセッサで構成されたコミット・ポイント(トランザクションまたは制限時間)に到達すると処理が終了します。
次の表に、このプロファイラによって各属性ごとに生成される統計を示します。
統計 | 説明 |
---|---|
最小長 |
属性の最短値の文字数。 |
最大長 |
属性の最長値の文字数。 |
最小値 |
属性の最低値。 数値属性の場合は、最小の数値です。 日付属性の場合は、最早日付です。 テキスト属性の場合は、アルファベット順の最初の値です。 この分析ではNull値は無視されますが、その他のタイプの非データ(たとえばスペースのみで構成された値)は無視されません。 |
最大値 |
属性の最高値。 数値属性の場合は、最大の数値です。 日付属性の場合は、最新日付です。 テキスト属性の場合は、アルファベット順の最後の値です。 この分析ではNull値は無視されますが、その他のタイプの非データ(たとえばスペースのみで構成された値)は無視されません。 |
「追加情報」ボタンをクリックすると、前述の統計とともに、最短値、最長値、最小値および最大値を含むレコードの数とパーセンテージが表示されます。
例
この例では、顧客レコード表のすべての属性に対して最大/最小プロファイラを実行しています。
表1-122 最大/最小プロファイラ
入力フィールド | 合計数 | 最小長 | 最大長 | 最小値 | 最大値 |
---|---|---|---|---|---|
CU_NO |
2010 |
2 |
6 |
10 |
875825 |
CU_ACCOUNT |
2010 |
7 |
12 |
00-0-XX |
OO-24282-LR |
TITLE |
2010 |
1 |
12 |
1 |
The Reverend |
NAME |
2010 |
4 |
29 |
# ADAMS |
aaaaaaaaa |
GENDER |
2010 |
1 |
1 |
1 |
M |
BUSINESS |
2010 |
2 |
41 |
Stoke Newington Town Hall |
e-sites.co.uk |
ADDRESS1 |
2010 |
1 |
50 |
(Brassfounders) LD, Coursington Road |
kjhkg |
ADDRESS2 |
2010 |
1 |
31 |
WARRINGTON |
jhgfhj |
ADDRESS3 |
2010 |
1 |
22 |
Aberdeen |
jhvgj |
POSTCODE |
2010 |
1 |
8 |
1P1 3HS |
gjhgj |
AREA_CODE |
2010 |
1 |
4 |
0 |
2920 |
TEL_NO |
2010 |
1 |
7 |
1 |
4227051 |
電子メール |
2010 |
1 |
50 |
5 |
zoe.peckham@btopenworld.com |
ACC_MGR |
2010 |
2 |
3 |
22 |
WH |
DT_PURCHASED |
2010 |
5 |
10 |
01/01/1995 |
Brian |
DT_ACC_OPEN |
2010 |
5 |
10 |
01/01/1995 |
Brian |
DT_LAST_PAYMENT |
2010 |
19 |
19 |
01-Jan-1970 00:00:00 |
21-Mar-2004 00:00:00 |
DT_LAST_PO_RAISED |
2010 |
19 |
19 |
01-Jan-1970 00:00:00 |
14-Feb-2004 00:00:00 |
BALANCE |
2010 |
1 |
10 |
-999999 |
410.5 |