Duplicate Check

「Duplicate Check」プロセッサを使用すると、1つまたは複数の属性間で重複値を簡単にチェックできます。

用途

「Duplicate Check」は、データ移行の際に問題が発生する可能性がある重複値を識別するために使用するか（例: キー属性の値）、またはデータ内の重複レコードに対する初期チェックとして使用します。

重複チェックで考慮するすべての属性。レコードは、すべての入力属性において同一である場合に重複として識別されます。

タイプ

目的

デフォルト値

Consider all no data as duplicates?

Yes/No

すべての属性にデータがない値を重複とみなすかどうかを決定します。

Yes

Ignore case?

Yes/No

重複チェックで大/小文字を区別するかどうかを決定します。

なし

フラグ属性	目的	可能性のある値
DuplicateFlag	どのデータが「Duplicate Check」に合格したかを示します。	Y/N

「Duplicate Check」の結果は、ダッシュボードに公開できます。

次の結果解釈がデフォルトで使用されます。

結果

ダッシュボード解釈

Not duplicated

合格

Duplicate

アラート

「Duplicate Check」では、レコードのバッチで重複を評価します。したがって、結果を使用するには完了まで実行される必要があり、リアルタイム応答が必要なプロセスには適していません。

リアルタイム・データ・ソースからのトランザクションのバッチに対して実行した場合、「Reader」プロセッサで構成されたコミット・ポイント（トランザクションまたは時間制限）に到達すると処理が終了します。返される統計は、トランザクションのバッチ内のみの重複数を示します。

「Duplicate Check」では、結果のサマリー・ビューが作成され、次の統計が表示されます。

統計	意味
Duplicated	入力属性に重複があったレコード。ドリルダウンすると、各個別値、およびその発生回数が表示されます。再度ドリルダウンすると、レコードが表示されます。
Not duplicated	入力属性で重複がなかったレコード。

「List Check」からは、次の出力フィルタが使用可能です。

この例では、「Duplicate Check」プロセッサを使用して、「BUSINESS」属性内の重複会社名を検索します。

サマリー・ビュー

「Duplicated」値のドリルダウン