Equal Attributes Profiler |
「Equal Attributes Profiler」では、複数の属性があるレコードで、値が等しい頻度が高い属性のペアを検索します。たとえば、「FirstName」属性と「GivenName」属性の両方が格納されている場合、通常、これらの値は同じです。しきい値オプションを使用して、各属性の値が同一であるパーセントに基づき、属性のペアに関連があるかどうかを決定します。
「Equal Attributes Profiler」は、冗長である可能性がある属性、または、通常は値が同じだが異なる場合もある属性のペアを検索するために使用します。「Equal Attributes Profiler」は、関連する2つの属性で、その2つの値は相互に関連する必要があるが実際には関連していない誤ったデータを検索する場合も役立ちます。
同等属性の関連性を調べる属性。
オプション |
タイプ |
目的 |
デフォルト値 |
Equal attribute threshold |
パーセント |
2つの属性に関連があるとみなされて結果に表示されるために必要な、2つの属性の値の同一率を制御します。 |
80% 値は50%から100%の間である必要があります。 |
Treat nulls as equal? |
Yes/No |
Null値のペアを等しいとみなすかどうか、つまり、前述の「Equal attribute threshold」を評価する際に対象とするかどうかを制御します。 |
Yes |
なし
なし
実行モード |
サポート |
バッチ |
Yes |
リアルタイム・モニタリング |
Yes |
リアルタイム応答 |
No |
「Equal Attributes Profiler」では、統計を作成するためにレコードのバッチが必要です。つまり、属性のペアに意味のある関係があることを検出するには、完了まで実行される必要があります。したがって、データ・セット全体が処理されるまで結果を使用できないため、このプロセッサはリアルタイム応答が必要なプロセスには適していません。
リアルタイム・データ・ソースからのトランザクションのバッチに対して実行した場合、「Reader」プロセッサで構成されたコミット・ポイント(トランザクションまたは時間制限)に到達すると処理が終了します。
「Equal Attributes Profiler」では、値が等しいパーセントが高い属性のペアについてサマリー・ビューが表示されます。最上位レベルのビューには、関連する(等しい)属性の各ペアに関する次の統計が表示されます。
統計 |
意味 |
|
Equal |
関連する両方の属性の値が同じであるレコードの数。 |
|
Null pairs |
関連する両方の属性の値がnullであるレコードの数。
|
|
Not equal |
関連する両方の属性の値が同じでないレコードの数。 |
追加データ
「Additional Data」ボタンをクリックすると、前述の統計が、分析対象レコードに対するパーセントとして表示されます。
属性のペアが完全にマッチしたレコードの数をドリルダウンすると、マッチした各値の出現頻度の明細が表示されます。再度ドリルダウンすると、レコードが表示されます。
あるいは、属性のペアが等しくないレコードの数をドリルダウンすると、レコードが直接表示されます。属性の間に関係があると考えられる場合、それらのレコードは関係が壊れています。
この例では、デフォルト構成を使用して顧客表を分析し、相互に等しい頻度が高い属性があるかどうかを調べます。「Equal Attributes Profiler」では、「DT_PURCHASED」属性と「DT_ACC_OPEN」属性が等しい頻度が高いことを検出します。
サマリー・ビュー
2つのフィールドが等しいレコードの数をドリルダウンすると、値が等しいすべてのペアを表示できます。
Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.