3 EDQ-PDSの一般的な用途

EDQ-PDSは、製品データのプロファイリング、データ抽出、照合を実行するためのツールキットおよび初期プロジェクトとして設計されています。とりわけプロファイリングおよび照合に関しては、特別な設定なしですぐに使用できます。抽出と標準化のユースケースについては、たとえば製品説明をいくつかの標準属性に解析して標準化する際に、EDQでは有用なプロセッサを多数使用できます。製品データはその性質上変動性が非常に高いため、データを適切に抽出および標準化するためのプロセスを設計する作業が必要になります。次の項では、EDQのProduct Data Servicesを使用できるシナリオについて説明します。

EDQ-PDSプロジェクトを使用する方法

照合サービスのアタッチによる提供

EDQ-PDSは、製品データ・レコードが格納されるアプリケーションまたはハブに照合サービス(バッチおよびリアルタイムの両方)をアタッチして提供するのに使用できます。用意されている照合サービスは構造化または非構造化製品データ・レコードに対して適切に機能するよう設計されており、精度向上のために必要に応じてさらに調整およびチューニングできます。次の開始点をお薦めします。

  • インタフェース、とりわけ製品データのフィールドをマッピングする製品入力インタフェースに注目します。詳細は、EDQ-PDSデータ・インタフェースを参照してください。

データの照合の最適化

よくあるユースケースは、プロジェクトが初期プロジェクトとして使用されるものの、ユーザーがデータを探索してプロジェクトに大幅な変更を加えることを前提としているという場合です。この場合、次の開始点をお薦めします。

  • 製品入力インタフェースのデータ・インタフェースを表示し、製品データを入力およびマッピングして、EDQ-PDSプロファイリング・プロセスにおいて実行することにより、データを探索して照合を最適化する方法(たとえば意味のない値やトークンの削除、短縮形の標準化、照合に役立つ可能性のあるキー属性の抽出など)を探ります。プロファイリングによりデータについての最初の理解を得ることと、バッチ照合プロセス'raw'によりデータを実行して照合の改善方法を判断することの両方が有用であることに注意してください。

  • 製品データの標準化で用意されている機能について確認し、照合およびキー生成のために製品データを整えます。このプロセスについてはデフォルトの参照データが提供されており、必要に応じて変更できます。

  • 提供されているキー・メソッド、および特にキー生成のために入力データの準備に使用される参照データの詳細について、キー生成を確認します。

  • 提供されている照合機能について、照合を確認します。必要に応じてこれは、特別な設定なしでそのまま使用することも、複合比較の重み付けや一致しきい値などを変更して調整することも、あるいはただ照合機能の開始点として使用することもできます。

製品データのプロファイリング、抽出および標準化のためのツールキットの提供

  • PDSでは製品データとともに使用するよう設計されたいくつかの公開済プロセッサが提供されています。これはデータから情報を抽出するためのもので、プロジェクトにより提供されるデフォルト・データが付属しています。そのため、必要に応じて関連データを変更できるように、ゼロから開始する場合であってもプロジェクトを全体として開始することをお薦めします。

  • EDQには、属性の抽出や解析、配列からレコードを分割、属性の配列の作成など、製品データとともに使用できるいくつかの有効なプロセッサが含まれています。詳細は、http://docs.oracle.com/en/middleware/にあるOracle Enterprise Data QualityドキュメントのOracle Enterprise Data Qualityオンライン・ヘルプでプロセッサ・ライブラリを参照してください。

  • 作業対象の製品データ・セットをプロファイリングすることは、ゼロから構成された標準のEDQプロファイラを使用する場合であっても、提供されているプロファイリング・プロセス(製品説明など、鍵となる一般的な製品データ属性を分析する方法の例が提供されています)によりデータを実行する場合であっても、常にお薦めします。これにより製品データについての有用なインサイトが得られるとともに、これはデータの抽出または再構築の開始点となります。データ準備の詳細は、データ準備を参照してください。