機械翻訳について

エンタープライズ・データ品質照合構成

エンタープライズ・データ品質(EDQ)照合構成は、エンティティのリアルタイムおよびバッチ照合用の属性とパラメータで構成され、重複入力を防止し、既存の重複を識別します。 EDQリアルタイムおよびバッチ照合は、アカウントおよび担当者エンティティに対して使用できます。

事前定義済のすぐに利用できる構成を使用するか、それをコピーして住所照合要件に適合させるオプションがあります。 リアルタイムとバッチの両方の照合に適用される事前定義済のEDQ照合構成は次のとおりです。

  • アカウント重複識別

  • 担当者重複識別

これらの構成は、重複するアカウントおよび担当者エントリを識別するために使用されます。 これらの事前定義済の照合構成をレビューおよび編集して、ニーズに合わせて照合機能を最適化できます。

EDQ照合プロセス

EDQ照合プロセスでは、比較のためにアプリケーションに追加または更新されるレコードは、ドライバ・レコードと呼ばれます。 また、ドライバ・レコードと比較されるレコードは、候補レコードと呼ばれます。 ドライバ・レコードは相互に比較されますが、候補レコードは他の候補と比較されません。 EDQリアルタイム照合プロセスでは、1つのドライバ・レコードが多数の候補に対して比較され、照合属性およびしきい値に基づいて予想される重複レコードが返されます。 バッチ照合プロセスでは、アカウントや担当者など、同じタイプのすべてのドライバ・レコードが比較され、これらの一連のレコード内で予想されるすべての一致が識別されます。

バッチ照合プロセスは、全体バッチと増分バッチという2つのモードで実行されます。 全体バッチ・モードではすべてのレコードが相互に照合されるのに対し、増分モードではレコードのサブセットが、選択されたすべての候補に対して照合されます。 バッチ照合では、様々な照合ルールを指定できる個別の照合テンプレートが提供されます。 たとえば、フロント・エンド・アプリケーションでの顧客追加のユーザー介入を最小限にして、定期的に完全照合を実行する場合があります。

リアルタイムおよびバッチ照合のEDQ照合プロセスでは、重複識別のためにEDQクラスタ・キー生成サービスとEDQ照合サービスが実行されます。 EDQクラスタ・キー生成サービスは、アプリケーションでレコードが追加または更新されるたびに呼び出されます。 このサービスでは、アプリケーションで追加されたレコードおよび更新されたレコードに対してキーが生成されます。 これらの生成されたキーはアプリケーションに格納され、アプリケーション内のデータと一致する可能性がある候補レコードを選択するために使用されます。

選択された候補レコードはドライバ・レコードとともにEDQ照合サービスに返されます。 次に、このサービスによってレコードが調べられ、どの候補レコードが処理レコードと適切に一致するかが決定されます。 EDQ照合サービスが最適な一致に到達すると、一致の強さに基づいて識別されたすべての重複レコードにスコアが割り当てられます。

EDQ照合プロセスの詳細は、次の場所にある『Oracle Enterprise Data Qualityカスタマ・データ・サービス・パック照合ガイド』を参照してください

http://docs.oracle.com/cd/E48549_01/doc.11117/e40737/toc.htm

照合属性

照合属性によって、アカウントおよび担当者エンティティのリアルタイムおよびバッチ照合に使用される属性が定義され、重複エントリが識別されます。 照合には次の2つのタイプの属性を使用します。

  • 照合識別子: 照合に使用するEDQ属性を指定します

  • アプリケーション属性: 照合に使用するアプリケーション属性を指定します

対応するEDQ属性を使用してアプリケーション内の属性をマップし、属性マッピングを作成できます。 たとえば、名前EDQ属性について、対応する組織属性としてOrg.OrganizationNameを選択して、マッピングを作成できます。 このような属性マッピングをリアルタイム照合、バッチ・データ照合またはその両方で定義できます。

対応するEDQ属性を使用してアプリケーションの属性をマップするときに、重複エントリを識別するために照合構成設定を作成します。 これらの設定は、照合キーとしてアプリケーションに格納されます。 属性マッピングを変更するたびに、新規または更新されたアカウントおよび担当者の照合キーの値を再生成する必要があります。 照合キーの値は、「照合構成の編集」ページの「キーの再作成」オプションを使用して再生成できます。

照合構成パラメータ

照合構成パラメータは、データ品質照合サービスの複数の側面を制御するシステムレベル・パラメータです。

次のパラメータによって、データベース内、データベースとデータ・セットの間(インポート・バッチなど)、またはデータ・セット内で、アカウントや担当者などの重複エントリの識別のための照合操作が制御され、それらはマージまたはリンクから解決されます。

スコアしきい値

  • パラメータ値: 0から100まで。 デフォルト値: 90

  • パラメータ説明: スコアを指定します。このスコアを超えると、一致レコードが照合サービスによって返されます。 スコア以上のレコードは一致とみなされ、しきい値未満のスコアのレコードは拒否されます。

照合結果表示しきい値

ノート: この照合構成パラメータはリアルタイム照合の場合のみ有効にできます。
  • パラメータ値: 0から100まで。 デフォルト値: 10

  • パラメータ説明: リアルタイム照合によって返される一致レコード数を制御します。

構成のプレビュー

「構成のプレビュー」オプションを使用すると、キーを再作成しなくても、次のパラメータを入力して、重複する一致レコードをリアルタイムで識別して表示できます。

  • クラスタ・キー・レベル: クラスタ・キー・レベルに基づいてレコードを返します。 このパラメータには3つのオプションがあります:
    • 限定: 一意のレコードの識別に役立ちます。 例: 正確な名前、電話番号、住所および郵便番号。
    • 通常: 多数のレコード間でレコードを絞り込むのに役立ちます。 例: 住所と市区町村、名前と郵便番号。
    • 完全: レコードを大まかに識別するのに役立ちます。 例: 郵便番号。
  • スコアしきい値: スコアしきい値に基づいてレコードを返します。

  • 最大候補: 最大候補に基づいてレコードを返します。

  • 照合結果表示しきい値: 照合結果表示しきい値に基づいてレコードを返します。

構成結果のレビュー

「構成結果のレビュー」オプションを使用すると、「照合構成の編集」ページで照合のために入力された入力アカウントまたは担当者が、キーの再作成後に予期される照合済アカウントまたは担当者を返すかどうかを確認できます。 または、「構成結果のレビュー」ページで、照合する次の照合構成パラメータの1つ以上の属性情報を入力できます。

  • クラスタ・キー・レベル: クラスタ・キー・レベルに基づいてレコードを返します。
    • 限定: 一意のレコードの識別に役立ちます。 レコードを一意に識別するオプションを指定する必要があります。 次に例を示します。
      • 正確な名前
      • 電話番号
      正確な名前または電話番号のいずれかを指定する必要があります。
    • 通常: 多数のレコード間でレコードを絞り込むのに役立ちます。 レコードを絞り込むオプションの組合せを指定する必要があります。 名前のみの使用は照合の対象とはみなされないことに注意してください。 一致を検索するには、Eメール、電話番号または住所などの追加値を指定する必要があります。 次に例を示します。
      • 住所と市区町村の組合せ
      • 名前と郵便番号の組合せ
    • 完全: レコードを大まかに識別するのに役立ちます。 たとえば、郵便番号です。
  • スコアしきい値: スコアしきい値に基づいてレコードを返します。

  • 最大候補: 最大候補に基づいてレコードを返します。

  • 照合結果表示しきい値: 照合結果表示しきい値に基づいてレコードを返します。

間接レベルの管理方法

ユーザー定義のプロファイル・オプションORA_ZCQ_LEVEL_OF_INDIRECTIONを使用して、ドライバ・レコードの間接重複のレベルおよび数を制御できます。 このプロファイル・オプションを使用すると、間接重複を含めることができます。 たとえば、次のような、可能性のあるドライバA、Cと候補B、Dを含む重複セットについて考えます。

A - B

A - C

C - D

ここで、重複ペアC-Dは、その勝者CがA-Cの一致レコードであるため削除されます。 このため、Dは潜在的な重複から除外されます。 これが重複として識別される可能性があるのは、次のバッチ実行のときのみです。 ただし、DはAの間接重複であることがわかります。 プロファイル・オプションORA_ZCQ_LEVEL_OF_INDIRECTIONの値を1として設定した場合、値Dを最初のバッチ実行自体で一致レコードとして考慮できます。 したがって、重複セットは次のようになります。

A - B

A - C

A - D (DはAの間接重複であるため)。

ここでは、重複ペアがA-B、A-C、C-D、D-EおよびE-Fの別の例を挙げて、間接重複のレベルをプロファイル・オプションORA_ZCQ_LEVEL_OF_INDIRECTIONがどのように制御するかについて考えます。 この場合、プロファイル・オプション値を1として設定すると、間接重複の最初のレベル(C-D)のみがAの重複セットの一部とみなされるため、A-Dペアが形成されます。 ただし、プロファイル・オプション値を2として設定した場合は、2番目の間接レベルにも拡張されます。 したがって、間接の順序がA-C、C-DおよびD-Eになるため、識別される重複ペアは、A-DとA-Eになります。

プロファイル・オプションORA_ZCQ_LEVEL_OF_INDIRECTIONを使用して、ドライバ・レコードの間接重複のレベルとそれに応じた数を制御するには、次のステップを実行します。

  1. 「設定および保守」作業領域で、「管理者プロファイル値の管理」タスクに移動します。

  2. 「管理者プロファイル値の管理」ページで、プロファイル・オプションを検索して設定します。

  3. 「プロファイル値」セクションで、「追加」をクリックします。 次の条件を指定する新しい行が追加されます。

    • プロファイル・レベル: プロファイル値を設定するレベルを指定します。 「サイト」を選択します。

    • プロファイル値: 必要な間接レベルに応じて、1または2などの値を選択または入力します。

  4. 「保存してクローズ」をクリックします。

    ノート: プロファイルの値に対する変更は、ユーザーが次回サインインするときに反映されます