重複識別バッチの作成とサブセット・ルールの定義
重複識別バッチを作成し、サブセット・ルールを定義して、レコードのサブセットを取得し、バッチ内またはデータベース内の重複を識別できます。
サブセット・ルールはバッチ選択基準ルールとも呼ばれ、重複識別バッチでレコードのサブセットを取得するための基準を指定します。 データ品質エンジンは、次のいずれかのルールに基づいて、レコードのこのサブセットから潜在的な重複を識別します。
-
すべてのキーワードに一致: このオプションを選択するとAND演算が行われます。
-
いずれかのキーワードに一致: このオプションを選択するとOR演算が行われます。
タスクの概要について見てきました。まずレジストリ内で重複する個人を識別するための重複識別バッチを作成し、個人名にJohn、住所にRedwoodが含まれるレコードのサブセットを取得するルールを作成します。 事前定義済属性またはカスタム属性を使用できます。
-
を選択して、「重複識別」作業領域に移動します。
-
「作成」メニュー・オプションまたはボタンをクリックします。 「重複識別バッチの作成」ページが表示されます。
-
バッチの名前と説明を入力します。
ノート:もう1つの方法は、既存の重複識別バッチをコピーし、そこから新しいバッチをすばやく作成することです。 このバッチの詳細は、発行する前に変更できます。
-
「レジストリに対して」または「バッチ内」などのバッチ照合モードを指定します。
バッチ内照合モードでは、重複識別は、サブセット・ルール条件を満たすバッチ内のレコードに制限されます。 「レジストリに対して」バッチ照合モードでは、プロセスはバッチ内のサブセット・ルール条件を満たすレコードを集計し、これらのレコードは、相互に照合され、さらにデータベース内の他のレコードとも照合されます。
-
「パーティ・タイプ」で「個人」を指定します。
-
重複する個人をマージするために、「自動処理」オプションで「マージ要求の作成」を指定します。
-
バッチ・オプションを指定します。 使用可能なバッチ・オプションは、選択した 自動処理オプションによって異なります。 「マージ要求の作成」が「自動処理オプション」として選択されている場合、次のオプションを使用できます。
-
「クラスタ・キー・レベル」に適切な値(「通常」など)を選択します。
-
「しきい値と一致」に、1から101までの間の値(70など)を入力します。
-
「自動マージしきい値」に、1から101までの間の値(75など)を入力します。
ノート:「バッチ・オプション」領域で指定した「自動マージしきい値」および「自動リンクしきい値」値は、「顧客ハブ・プロファイル・オプションの管理」ページで設定した値を上書きすることに留意する必要があります。
-
「通知の送信」を選択すると、重複識別バッチのステータスを開始者や発行者などのすべての関係者に通知します。 これらのステータスの詳細は、「関連トピック」の項の「重複レコードのマージ方法」を参照してください。 「通知の送信」フィールドのデフォルト値は、「顧客データ管理オプションの管理」設定および保守タスクの「マージ要求通知」オプションを使用して設定されます。 すべての通知を無効にするように「マージ要求通知」オプションが設定されている場合は、「通知の送信」フィールドの値は設定できません。 マージ要求通知の詳細は、「関連項目」の項の「重複解決簡易プロファイル・オプションの設定方法」トピックを参照してください。
-
-
「重複識別バッチ: 選択基準」の下の「追加」メニュー・オプションまたはボタンをクリックします。
-
「ルールの適用」オプションで「いずれかのキーワードに一致」を選択します。
-
「重複識別バッチ: 選択基準」に次のサンプル情報を入力します。
オブジェクト
属性
演算子
値
個人
名前
次で始まる
John
住所
住所行1
次を含む
Redwood
-
要件に合わせて、「保存してクローズ」または「スケジュール」をクリックします。