含まれる属性プロファイラ
含まれる属性プロファイラは、複数の属性があるレコードで、一方の属性値にもう一方の属性値が含まれることが多い属性のペアを検索します。しきい値オプションを使用して、一方の属性値にもう一方の属性値が含まれるレコードのパーセンテージに基づき、属性のペアに関連があるかどうかを判断します。
含まれる属性プロファイラは、関連がある属性、または関連がある必要がある属性を検索するために使用します。属性に強い関連性がある場合は、冗長な属性である可能性があります。
または、属性に関連があると考えられるが、その関係が壊れている場合、つまり、一方の列値は空白だが、もう一方の列値から導出できる場合もあります。
次の表に、構成オプションを示します。
| 構成 | 説明 |
|---|---|
|
入力 |
包含属性の関連性の調査対象にする属性を指定します。 |
|
オプション |
なし。 |
|
含まれる属性のしきい値(%) |
「次を含む」を使用して2つの属性を照合し、2つの属性に関連があるとみなされて結果に表示されるために必要な値の一致率を制御します。パーセントで指定します。デフォルト値は |
|
大文字/小文字を区別しない |
一方の属性値にもう一方の属性値が含まれるかどうかをチェックするときに、大文字と小文字の別を無視するかどうかを制御します。 |
|
出力 |
データ属性またはフラグ属性の出力を記述します。 |
|
データ属性 |
なし。 |
|
フラグ |
なし。 |
含まれる属性プロファイラでは、統計を生成するためにレコードのバッチが必要です。つまり、属性のペアに意味のある関係があることを検出するには、完了まで実行される必要があります。したがって、データ・セット全体が処理されるまで結果が生成されないため、このプロセッサはリアルタイム・レスポンスが必要なプロセスには適していません。
リアルタイム・データ・ソースからのトランザクションのバッチに対して実行した場合、リーダー・プロセッサで構成されたコミット・ポイント(トランザクションまたは制限時間)に到達すると処理が終了します。
含まれる属性プロファイラでは、高頻度で一方の属性値にもう一方の属性値が含まれ、それぞれの値が関連しているパーセンテージが高い属性のペアについて、サマリー・ビューが表示されます。次の表に、最上位レベルのビューに表示される関連する属性の各ペアに関する統計を示します。
| 統計 | 説明 |
|---|---|
|
含まれる |
関連する両方の属性の値が同じであるレコードの数。 |
|
含まれない |
関連する属性の値が同じでないレコードの数。 |
「追加データ」ボタンをクリックすると、前述の統計が、分析対象レコードに対するパーセンテージとして表示されます。
属性のペアが完全に一致したレコードの数をドリルダウンすると、一致した各値の出現頻度の明細が表示されます。再度ドリルダウンすると、当該のレコードが表示されます。
あるいは、属性のペアが等しくないレコードの数をドリルダウンすると、当該のレコードが直接表示されます。属性の間に関係が存在する必要がある場合、それらのレコードでは関係が壊れています。
例
この例では、複数の属性の包含関係をチェックしています。EmailAddressにはFirstNameが含まれることが多いため、FirstName属性とEmailAddress属性の間に関係が検出されています。サマリー・データは次のとおりです。
| フィールド1 | フィールド2 | 含まれる(降順) | 含まれない |
|---|---|---|---|
|
EmailAddress |
FirstName |
1829 |
172 |
EmailAddress属性にFirstName属性が含まれる1829個のレコードをドリルダウンすると、次のビューに、関係が検出されたレコードの各ペアがすべて表示されます。
| EmailAddress | FirstName | カウント |
|---|---|---|
|
LINDA.COOKSON@M-AND-I.COM |
LINDA |
2 |
|
PAUL.MARKAR@DISCOUNT-FEVER.COM |
PAUL |
2 |
|
SHEILA.ROBINSON@SUNRISE-HOLIDAYS.COM |
SHEILA |
2 |
|
NORMAN.SCANLON@ECA.COM |
NORMAN |
2 |
|
TONY.GIBSON@TOMBURN.COM |
TONY |
2 |
|
PAULINE.BEEDHAM@BLUEYONDER.CO.UK |
PAULINE |
2 |
|
ROWLAND.BROWN@BTINTERNET.COM |
ROWLAND |
2 |
|
JOHN@DARWINS.COM |
JOHN |
2 |
|
TEST@TEST.COM |
TEST |
2 |
|
EILEEN_BEARD@WILSONS_PENARTH.COM |
EILEEN |
1 |
|
BRIGETTE.WALLACE@UNIQUE-INTERIORS.COM |
BRIGETTE |
1 |
|
MICHAEL.CONNOLLY@GEMINI-VISUALS.COM |
MICHAEL |
1 |
|
JOYCE.AITKEN@RDM-ELECTRONICS.COM |
JOYCE |
1 |
|
JOANNA.TEMLETT@BTOPENWORLD.COM |
JOANNA |
1 |
|
MAHAJAN.DEBELLOTT@NTLWORLD.COM |
MAHAJAN |
1 |