ヘッダーをスキップ
Oracle® Fusion Middleware Oracle Enterprise Data Qualityの理解
12c (12.1.3)
E59396-01
  目次へ移動
目次

前
 
次
 

1 Oracle Enterprise Data Qualityの概要

この章では、Oracle Fusion MiddlewareおよびOracle Enterprise Data Qualityの概要について説明します。

この章の内容は次のとおりです。

1.1 Oracle Fusion Middlewareの概要

Oracle Fusion Middlewareは規格に基づくソフトウェア製品の集まりで、Java EEや開発ツールから統合サービス、ビジネス・インテリジェンスおよびコラボレーションまで、様々なツールやサービスが含まれます。Oracle Fusion Middlewareは、アプリケーションの開発、デプロイおよび管理を完全にサポートします。Oracle Fusion Middlewareコンポーネントは、Oracle Enterprise Manager Fusion Middleware Controlコンソールを使用して実行時にモニターされます。

1.2 Oracle Enterprise Data Qualityについて

EDQでは、データ品質の把握、改善、保護および制御に使用される、包括的なデータ品質管理環境を提供します。EDQは、ベスト・プラクティスのマスター・データ管理、データ統合、ビジネス・インテリジェンスおよびデータ移行イニシアティブを容易にします。EDQは、カスタマ・リレーションシップ・マネジメントおよび他のアプリケーションに統合されたデータ品質を提供します。

EDQの主な機能は次のとおりです。

1.3 ソフトウェア・コンポーネントについて

EDQは、Javaサーブレット・エンジン、Java Web Startグラフィカル・ユーザー・インタフェース、およびStructured Query Language (SQL)を利用したリレーショナル・データベース管理システム(RDBMS)によるデータ・ストレージを使用するJava Webアプリケーションです。

EDQはクライアント・サーバー・アーキテクチャです。グラフィカル・ユーザー・インタフェース(GUI)、1つのデータ・リポジトリおよび1つのビジネス・レイヤーである複数のクライアント・アプリケーションから構成されます。この項では、これらのコンポーネントのアーキテクチャ、そのデータ・ストレージ、データ・アクセスおよびI/O要件について、詳細に説明します。

1.3.1 クライアント・アプリケーションについて

EDQでは、この製品を構成および操作するために使用される多くのクライアント・アプリケーションを提供します。そのほとんどはJava Web Startアプリケーションであり、それ以外は簡単なWebページです。次の表に、すべてのクライアント・アプリケーションとその開始方法およびそれぞれの機能をリストします。

アプリケーション名 開始 目的

ディレクタ

Web開始

データ品質処理を設計し、テストします

サーバー・コンソール

Web開始

ジョブを操作し、監視します

一致レビュー

Web開始

一致結果をレビューして、手動で一致を決定します

ダッシュボード

ブラウザ

データ品質のキー・パフォーマンス・インジケータおよびトレンドを監視します

ケース管理

Web開始

構成可能なワークフローを通じてデータの問題を詳細に調査します

ケース管理の管理

Web開始

ケース管理のワークフローおよび権限を構成します

Webサービス・テスター

ブラウザ

EDQ Webサービスをテストします

構成分析

Web開始

構成に関するレポートを作成し、複数のバージョンの構成の差分を取得します

問題マネージャ

Web開始

DQの問題のリストを管理します

管理

ブラウザ

EDQサーバーを管理します(ユーザー、グループ、拡張機能、Launchpadの構成)

パスワードの変更

ブラウザ

パスワードの変更

構成分析

Web開始

プロジェクトの構成を分析し、差分を報告します


クライアント・アプリケーションには、EDQサーバーのEDQ Launchpadからアクセスできます。クライアントがJava Web Startアプリケーションのいずれか(ディレクタなど)を起動すると、そのアプリケーションはクライアント・マシンにダウンロードされ、インストールされて実行されます。アプリケーションはEDQサーバーと通信して、変更をインスタンス化し、サーバーからのメッセージを受信します(実行中のタスクに関する情報、他のユーザーによる変更など)。

EDQは拡張可能なシステムであるため、特定のユースケースに対応するために、インストール時にさらにユーザー・アプリケーションを追加して拡張することができます。たとえば、Oracle Watchlist ScreeningでEDQを拡張すると、監視リストに関してデータをスクリーニングするユーザー・アプリケーションが追加されます。


注意:

多くのクライアント・アプリケーションは、個別で使用する(専用の用途)ことも、別のアプリケーション内で使用することもできます。たとえば、構成分析、一致レビューおよび問題マネージャ・アプリケーションは、ディレクタ内からでも使用できます。


1.3.1.1 データの格納場所

クライアント・コンピュータには、クライアント・アプリケーションを表示するためのユーザー・プリファレンスのみが格納され、その他のすべての情報はEDQサーバーに格納されます。

1.3.1.2 ネットワーク通信

クライアント・アプリケーションは、起動時のアプリケーション構成により決定される、ハイパーテキスト転送プロトコル(HTTP)またはセキュアなハイパーテキスト転送プロトコル(HTTPS)接続のいずれかで通信します。このドキュメントではこれ以降、説明を簡単にするために、この接続を「HTTP接続」と呼びます。

1.3.2 データのEDQリポジトリへの格納方法

EDQは、2つのデータベース・スキーマ(ConfigスキーマおよびResultsスキーマ)を含むリポジトリを使用します。


注意:

各EDQサーバーは、そのサーバー専用のConfigスキーマおよびResultsスキーマを持つ必要があります。複数のサーバーを高可用性アーキテクチャにデプロイする場合に、2つのサーバーが同一のスキーマをポイントするようにして構成を共有することはできません。


1.3.2.1 Configスキーマについて

Configスキーマは、EDQの構成データを格納します。通常は、多くのWebアプリケーションに共通の一般的なトランザクション方式で使用されます(問合せを実行して少数のレコードにアクセスし、必要に応じて更新します)。

通常、このスキーマには少量のデータのみが保持されます。簡単な実装の場合は、数MB程度であることがほとんどです。例外的に大規模なEDQシステムでは、特にケース管理の使用頻度が高い場合は、ストレージ要件が10GBに達する可能性があります。

Configスキーマに保持されたデータへのアクセスは、他のリレーショナル・データベース管理システム(RDBMS)アプリケーションでの構成データの典型です。ほとんどのデータベース・アクセスは読取りリクエストの形式であり、それに比較的少量のデータ更新および挿入リクエストも付随します。

1.3.2.2 Resultsスキーマについて

Resultsスキーマには、スナップショット・データ、ステージング済データおよび結果データが格納されます。これは高度に動的で、サーバーで動作中のプロセッサで処理されるデータを格納するために、必要に応じて表が作成および削除されます。プロセス実行中に、使用可能なメモリーに保持できない作業データを格納するために、一時的な作業表も作成および削除されます。

Resultsスキーマに保持されるデータ量は時間とともに大幅に変化し、データのキャプチャおよび処理ではデータが数GBに及ぶ可能性があります。また、プロセスまたはジョブの実行中に、データが一時的に結果データベースに格納されることもあります。ジョブについては、処理中に複数のバージョンのデータがデータベースに書き込まれる場合があります。

Resultsスキーマは、Configスキーマとはまったく異なるデータ・アクセス・プロファイルを持ち、従来のWebベースのデータベース・アプリケーションとは大きく異なります。通常、Resultsスキーマの表は次の特徴を持ちます。

  • オンデマンドでの作成

  • バルクJDBCアプリケーション・プログラミング・インタフェース(API)を使用したデータの移入

  • プロセス実行をサポートするために、完全表スキャンを使用して問合せが実行されます。

  • Indexed

  • クライアント・アプリケーションでのユーザーの対話に応答して、複雑なSQL文を使用した問合せの実行

  • 関連付けられているプロセスまたはスナップショットが再度実行されると削除されます。

このような動的性質を持つため、このスキーマは慎重に取り扱う必要があります。たとえば、REDOログ・ファイルを別のディスクにマウントすることをお薦めします。

1.3.3 EDQによる作業データのディスク上の格納場所

EDQでは、プログラム・ファイルが含まれるインストール・ディレクトリとは別の、2つの構成ディレクトリを使用します。そのディレクトリは次のとおりです。

  • ベース構成ディレクトリ: このディレクトリにはデフォルトの構成データが含まれます。このディレクトリの名前は、Oracle WebLogicインストールではoedq.homeですが、Apache Tomcatインストールでは任意の名前にすることができます。

  • ローカル構成ディレクトリ: このディレクトリには、拡張パック用のデータやデフォルト設定のオーバーライドなど、ベース構成のオーバーライドが含まれます。EDQは最初にこのディレクトリでオーバーライドがあるかどうかを調べて、ローカル・ディレクトリで必要なデータが検出されない場合は、ベース・ディレクトリを調べます。ローカル・ディレクトリの名前は、Oracle WebLogicインストールではoedq.local.homeですが、Apache Tomcatインストールでは任意の名前にすることができます。

ファイルベースのデータ・ストアとの間でデータが処理されるときに、構成ディレクトリのいくつかのファイルが使用されます。その他のファイルは、どの機能パックが有効になるか、EDQのリポジトリ・データベースへの接続方法、およびその他の重要な情報などの、サーバーの構成プロパティを格納するために使用されます。

ホームおよびローカル・ホーム・ディレクトリの名前と場所は、テンプレートまたはその他の個別のコンポーネントへの手動更新を実行する必要があることをイベントで知るために重要です。

これらのディレクトリはEDQのインストール時に作成されます。詳細は、『Oracle Fusion Middleware Enterprise Data Qualityのインストールと構成』を参照してください。

1.3.4 ビジネス・レイヤーについて

ビジネス・レイヤーでは、主に次の3つの機能があります。

  • クライアント・アプリケーションがシステムの他の部分とやり取りするために使用するAPIを提供します。

  • クライアント・アプリケーションにクライアント・アプリケーションの更新が必要なサーバー・イベントを通知します。

  • データをキャプチャして処理するプロセスを実行します。

ビジネス・レイヤーはConfigスキーマに構成データを格納し、Resultsスキーマに作業データと結果を格納します。

クライアント・アプリケーションとの間でデータの受け渡し中に、ビジネス・レイヤーは、従来のJava Webアプリケーションの大部分に共通な方法で動作します。ビジネス・レイヤーは小規模なデータベース・トランザクションを作成し、HTTP接続を使用してフロントエンドに少量の情報を送信します。このアプリケーション・フロントエンドの大部分がブラウザよりも豊富なGUIを持つという点において、これは幾分変わっています。そのため、このクライアント・アプリケーションに送信されるデータのほとんどは、従来のHTMLではなく、シリアライズJavaオブジェクトで構成されます。

ただし、プロセスの実行時およびスナップショットの作成時には、このビジネス・レイヤーの動作は従来のバッチ・アプリケーションに近づきます。デフォルト構成では、非常に大規模なデータ量でも処理できるように、複数のスレッドおよびデータベース接続を生成し、使用可能なCPUコアおよびデータベースI/O容量をすべて使用します。

使用可能なリソースの使用を制限するようにEDQを構成できますが、明らかにパフォーマンスに影響を与えます。詳細は、EDQのインストレーション・ガイドおよびEDQの管理者ガイドを参照してください。