|
Duplicate Check |
「Duplicate Check」プロセッサを使用すると、1つまたは複数の属性間で重複値を簡単にチェックできます。
「Duplicate Check」は、データ移行の際に問題が発生する可能性がある重複値を識別するために使用するか(例: キー属性の値)、またはデータ内の重複レコードに対する初期チェックとして使用します。
重複チェックで考慮するすべての属性。レコードは、すべての入力属性において同一である場合に重複として識別されます。
オプション |
タイプ |
目的 |
デフォルト値 |
Consider all no data as duplicates? |
Yes/No
|
すべての属性にデータがない値を重複とみなすかどうかを決定します。 |
Yes
|
Ignore case?
|
Yes/No
|
重複チェックで大/小文字を区別するかどうかを決定します。 |
No
|
なし
フラグ属性 |
目的 |
可能性のある値 |
DuplicateFlag |
どのデータが「Duplicate Check」に合格したかを示します。 |
Y/N |
「Duplicate Check」の結果は、ダッシュボードに公開できます。
次の結果解釈がデフォルトで使用されます。
結果 |
|
Not duplicated
|
合格 |
Duplicate |
アラート |
実行モード |
サポート |
バッチ |
Yes |
リアルタイム・モニタリング |
Yes |
リアルタイム応答 |
No |
「Duplicate Check」では、レコードのバッチで重複を評価します。したがって、結果を使用するには完了まで実行される必要があり、リアルタイム応答が必要なプロセスには適していません。
リアルタイム・データ・ソースからのトランザクションのバッチに対して実行した場合、「Reader」プロセッサで構成されたコミット・ポイント(トランザクションまたは時間制限)に到達すると処理が終了します。返される統計は、トランザクションのバッチ内のみの重複数を示します。
「Duplicate Check」では、結果のサマリー・ビューが作成され、次の統計が表示されます。
統計 |
意味 |
Duplicated |
入力属性に重複があったレコード。ドリルダウンすると、各個別値、およびその発生回数が表示されます。再度ドリルダウンすると、レコードが表示されます。 |
Not duplicated |
入力属性で重複がなかったレコード。 |
「List Check」からは、次の出力フィルタが使用可能です。
この例では、「Duplicate Check」プロセッサを使用して、「BUSINESS」属性内の重複会社名を検索します。
サマリー・ビュー
「Duplicated」値のドリルダウン
Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.