Duplicate Check

「Duplicate Check」プロセッサを使用すると、1つまたは複数の属性間で重複値を簡単にチェックできます。

用途

「Duplicate Check」は、データ移行の際に問題が発生する可能性がある重複値を識別するために使用するか(例: キー属性の値)、またはデータ内の重複レコードに対する初期チェックとして使用します。

構成

入力

重複チェックで考慮するすべての属性。レコードは、すべての入力属性において同一である場合に重複として識別されます。

オプション

オプション

タイプ

目的

デフォルト値

Consider all no data as duplicates?

Yes/No

 

すべての属性にデータがない値を重複とみなすかどうかを決定します。

Yes

 

Ignore case?

 

Yes/No

 

重複チェックで大/小文字を区別するかどうかを決定します。

No

 

出力

データ属性

なし

フラグ

フラグ属性

目的

可能性のある値

DuplicateFlag

どのデータが「Duplicate Check」に合格したかを示します。

Y/N

ダッシュボードへの公開

「Duplicate Check」の結果は、ダッシュボードに公開できます。

次の結果解釈がデフォルトで使用されます。

結果

ダッシュボード解釈

Not duplicated

 

合格

Duplicate

アラート

実行

実行モード

サポート

バッチ

Yes

リアルタイム・モニタリング

Yes

リアルタイム応答

No

「Duplicate Check」では、レコードのバッチで重複を評価します。したがって、結果を使用するには完了まで実行される必要があり、リアルタイム応答が必要なプロセスには適していません。

リアルタイム・データ・ソースからのトランザクションのバッチに対して実行した場合、「Reader」プロセッサで構成されたコミット・ポイント(トランザクションまたは時間制限)に到達すると処理が終了します。返される統計は、トランザクションのバッチ内のみの重複数を示します。

結果ブラウザの表示

「Duplicate Check」では、結果のサマリー・ビューが作成され、次の統計が表示されます。

統計

意味

Duplicated

入力属性に重複があったレコード。ドリルダウンすると、各個別値、およびその発生回数が表示されます。再度ドリルダウンすると、レコードが表示されます。

Not duplicated

入力属性で重複がなかったレコード。

出力フィルタ

「List Check」からは、次の出力フィルタが使用可能です。

この例では、「Duplicate Check」プロセッサを使用して、「BUSINESS」属性内の重複会社名を検索します。

サマリー・ビュー

「Duplicated」値のドリルダウン

 

Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.