3 EDQ-PDSの一般的な用途
EDQ-PDSは、製品データのプロファイリング、データ抽出、照合を実行するためのツールキットおよび初期プロジェクトとして設計されています。とりわけプロファイリングおよび照合に関しては、特別な設定なしですぐに使用できます。抽出と標準化のユースケースについては、たとえば製品説明をいくつかの標準属性に解析して標準化する際に、EDQでは有用なプロセッサを多数使用できます。製品データはその性質上変動性が非常に高いため、データを適切に抽出および標準化するためのプロセスを設計する作業が必要になります。次の項では、EDQのProduct Data Servicesを使用できるシナリオについて説明します。
EDQ-PDSプロジェクトを使用する方法
照合サービスのアタッチによる提供
EDQ-PDSは、製品データ・レコードが格納されるアプリケーションまたはハブに照合サービス(バッチおよびリアルタイムの両方)をアタッチして提供するのに使用できます。用意されている照合サービスは構造化または非構造化製品データ・レコードに対して適切に機能するよう設計されており、精度向上のために必要に応じてさらに調整およびチューニングできます。次の開始点をお薦めします。
-
インタフェース、とりわけ製品データのフィールドをマッピングする製品入力インタフェースに注目します。詳細は、EDQ-PDSデータ・インタフェースを参照してください。
-
データ統合をどのように実行するか検討します。EDQ-PDSには外部データ・ソースが用意されており、外部Oracleデータベース表からデータ入力を読み取るのに使用できます。このデータ・ストアおよび表の詳細は実行プロファイルで変更できます。外部統合のためのバッチ・ステージング領域の構成を参照してください。
-
プロセスを変更せずに変更可能な照合およびキー生成の設定を確認するには、EDQ-PDS実行プロファイルおよびメッセージ・ヘッダーのオプションの構成を参照してください。
データの照合の最適化
よくあるユースケースは、プロジェクトが初期プロジェクトとして使用されるものの、ユーザーがデータを探索してプロジェクトに大幅な変更を加えることを前提としているという場合です。この場合、次の開始点をお薦めします。
-
製品入力インタフェースのデータ・インタフェースを表示し、製品データを入力およびマッピングして、EDQ-PDSプロファイリング・プロセスにおいて実行することにより、データを探索して照合を最適化する方法(たとえば意味のない値やトークンの削除、短縮形の標準化、照合に役立つ可能性のあるキー属性の抽出など)を探ります。プロファイリングによりデータについての最初の理解を得ることと、バッチ照合プロセス'raw'によりデータを実行して照合の改善方法を判断することの両方が有用であることに注意してください。
-
プロジェクトの構造を見て何があるかを確認します。EDQ-PDSプロジェクトの構造を参照してください。
製品データのプロファイリング、抽出および標準化のためのツールキットの提供
-
PDSでは製品データとともに使用するよう設計されたいくつかの公開済プロセッサが提供されています。これはデータから情報を抽出するためのもので、プロジェクトにより提供されるデフォルト・データが付属しています。そのため、必要に応じて関連データを変更できるように、ゼロから開始する場合であってもプロジェクトを全体として開始することをお薦めします。
-
EDQには、属性の抽出や解析、配列からレコードを分割、属性の配列の作成など、製品データとともに使用できるいくつかの有効なプロセッサが含まれています。詳細は、
http://docs.oracle.com/en/middleware/
にあるOracle Enterprise Data QualityドキュメントのOracle Enterprise Data Qualityオンライン・ヘルプでプロセッサ・ライブラリ
を参照してください。
-
作業対象の製品データ・セットをプロファイリングすることは、ゼロから構成された標準のEDQプロファイラを使用する場合であっても、提供されているプロファイリング・プロセス(製品説明など、鍵となる一般的な製品データ属性を分析する方法の例が提供されています)によりデータを実行する場合であっても、常にお薦めします。これにより製品データについての有用なインサイトが得られるとともに、これはデータの抽出または再構築の開始点となります。データ準備の詳細は、データ準備を参照してください。