重複チェック

重複チェック・プロセッサを使用すると、1つまたは複数の属性間で重複値を簡単にチェックできます。

重複チェックは、データ移行の際に問題を引き起こす可能性がある重複値(キー属性の値など)を識別するために使用したり、データ内の重複レコードを検出する初期チェックとして使用します。

次の表に、構成オプションを示します。

構成 説明

入力

重複チェックで考慮する属性をすべて指定します。レコードは、すべての入力属性において同一である場合に重複として識別されます。

オプション

次のオプションを指定します。

  • すべてのデータなしを重複とみなす: すべての属性にデータがない値を重複とみなすかどうかを決定します。使用可能な値: はい/いいえ。デフォルト値: はい

  • 大文字/小文字を区別しない: 重複チェックで大文字と小文字を区別するかどうかを決定します。使用可能な値: はい/いいえ。デフォルト値: No

出力

データ属性またはフラグ属性の出力を記述します。

データ属性

なし。

フラグ

次のフラグが出力されます。

  • DateTypeValid: どのデータがデータ型チェックに合格したかを示します。使用可能な値はYまたはNです。

重複チェックでは、レコードのバッチについて重複を評価します。したがって、処理が完了するまで結果が生成されないため、これはリアルタイム・レスポンスが必要なプロセスには適していません。

リアルタイム・データ・ソースからのトランザクションのバッチに対して実行した場合、リーダー・プロセッサで構成されたコミット・ポイント(トランザクションまたは制限時間)に到達すると処理が終了します。返される統計は、トランザクションのバッチ内でのみの重複数を示します。

次の表に、このプロファイラによって生成される統計情報を示します。

統計 説明

重複

入力属性に重複があったレコード。ドリルダウンすると、すべての固有値とそれぞれの発生回数が表示されます。再度ドリルダウンすると、レコードが表示されます。

重複なし

入力属性に重複がなかったレコード。

出力フィルタ

重複チェックからは、次の出力フィルタを使用できます。

  • 重複レコード

  • 重複なしのレコード

この例では、重複チェック・プロセッサを使用して、BUSINESS属性内の重複する会社名を検索します。

重複 重複なし

41

1970

重複値をドリルダウンできます。

ビジネス カウント

テスト

3

Zircom

2

Darwins

2

Tamlite Group

2

BSA Guns (UK) Limited

2

Permanent Pest Control

2

Gemini Visuals

2

Northern Water Utilities

2

Attitude Flooring

2

N S News & Confectionery

2

Send Group

2

Press Patterns

2