1.3.6.5 等しい属性プロファイラ

等しい属性プロファイラは、複数の属性があるレコードで、値が等しい頻度が高い属性のペアを検索します。たとえば、 FirstName属性とGivenName属性の両方が格納されている場合、これらの値は通常は同じです。しきい値オプションを使用して、各属性の値が同一であるケースのパーセンテージに基づき、属性のペアに関連があるかどうかを判断します。

等しい属性プロファイラは、冗長である可能性がある属性、または、通常は値が等しいが異なる場合もある属性のペアを見つけるために使用します。等しい属性プロファイラは、関連する2つの属性で、その2つの値が相互に関連している必要があるが実際には関連していない誤ったデータを検索する場合にも役立ちます。

次の表に、構成オプションを示します。

構成 説明

入力

等価属性の関連性の調査対象にする属性を指定します。

オプション

指定できるオプションを記述します。

等しい属性のしきい値

2つの属性に関連があるとみなされて結果に表示されるために必要な、2つの属性の値の同一率を制御します。パーセントで指定します。デフォルトは80%です。指定できる値は、50%以上、100%以下です。

nullを等しいものとして処理しますか。

Null値のペアを等しいとみなすかどうか、つまり、前述の等しい属性のしきい値を評価する際に対象とするかどうかを制御します。「はい」または「いいえ」で指定します。デフォルトは「はい」です。

出力

データ属性またはフラグ属性の出力を記述します。

データ属性

なし。

フラグ

なし。

等しい属性プロファイラでは、統計を生成するためにレコードのバッチが必要です。つまり、属性のペアに意味のある関係があることを検出するには、完了まで実行される必要があります。したがって、データ・セット全体が処理されるまで結果が生成されないため、このプロセッサはリアルタイム・レスポンスが必要なプロセスには適していません。

リアルタイム・データ・ソースからのトランザクションのバッチに対して実行した場合、リーダー・プロセッサで構成されたコミット・ポイント(トランザクションまたは制限時間)に到達すると処理が終了します。

等しい属性プロファイラでは、値が等しい場合のパーセンテージが高い属性のペアについてサマリー・ビューが表示されます。次の表に、関連する(等しい)属性の各ペアに関する統計を示します。

統計 説明

等しい

関連する両方の属性の値が同じであるレコードの数。

Nullペア

関連する両方の属性の値がnullであるレコードの数。

ノート: 「nullを等しいものとして処理しますか。」オプションを選択した場合は、nullのペアが「等しい」統計に含まれるため、この統計はゼロになります。

等しくない

関連する属性の値が同じでないレコードの数。

「追加データ」ボタンをクリックすると、前述の統計が、分析対象レコードに対するパーセンテージとして表示されます。

属性のペアが完全に一致したレコードの数をドリルダウンすると、一致した各値の出現頻度の明細が表示されます。再度ドリルダウンすると、当該のレコードが表示されます。

あるいは、属性のペアが等しくないレコードの数をドリルダウンすると、当該のレコードが直接表示されます。属性の間に関係が存在する必要がある場合、それらのレコードでは関係が壊れています。

この例では、デフォルト構成を使用して顧客表を分析し、相互に等しい頻度が高い属性があるかどうかを調べます。等しい属性プロファイラは、DT_PURCHASED属性とDT_ACC_OPEN属性が通常は等しいことを検出しています。

フィールド1 フィールド2 等しい Nullペア 等しくない

DT_PURCHASED

DT_ACC_OPEN

1983

16

11

2つのフィールドが等しいレコードの数をドリルダウンすると、値が等しいすべてのペアを表示できます。

DT_ACC_OPEN DT_PURCHASED カウント

03/02/1997

03/02/1997

5

30/11/1993

30/11/1993

4

09/08/1996

09/08/1996

4

10/09/1993

10/09/1993

4

07/12/1992

07/12/1992

4

07/08/1996

07/08/1996

4

25/05/1993

25/05/1993

4

24/02/1994

24/02/1994

4

21/11/1996

21/11/1996

4

17/12/1996

17/12/1996

4

13/11/1992

13/11/1992

4

27/08/1992

27/08/1992

4

05/10/1992

05/10/1992

4

27/09/1992

27/09/1992

3