この章では、Oracle Fusion MiddlewareおよびOracle Enterprise Data Qualityの概要について説明します。
この章の内容は次のとおりです。
Oracle Fusion Middlewareは規格に基づくソフトウェア製品の集まりで、Java EEや開発ツールから統合サービス、ビジネス・インテリジェンスおよびコラボレーションまで、様々なツールやサービスが含まれます。Oracle Fusion Middlewareは、アプリケーションの開発、デプロイおよび管理を完全にサポートします。Oracle Fusion Middlewareコンポーネントは、Oracle Enterprise Manager Fusion Middleware Controlコンソールを使用して実行時にモニターされます。
EDQでは、データ品質の把握、改善、保護および制御に使用される、包括的なデータ品質管理環境を提供します。EDQは、ベスト・プラクティスのマスター・データ管理、データ統合、ビジネス・インテリジェンスおよびデータ移行イニシアティブを容易にします。EDQは、カスタマ・リレーションシップ・マネジメントおよび他のアプリケーションに統合されたデータ品質を提供します。
EDQの主な機能は次のとおりです。
統合されたデータ・プロファイリング、監査、クレンジングおよび照合
ブラウザベースのクライアント・アクセス
すべてのタイプのデータを処理できる機能(たとえば、顧客、製品、資産、会計、操作)
Java Database Connectivity (JDBC)準拠データ・ソースおよびターゲットへの接続
マルチユーザーのプロジェクト・サポート(ロールベースのアクセス、問題追跡、プロセス注釈、およびバージョン制御)
サービスとして外部アプリケーションに公開される可能性のある、設計プロセスのためのServices Oriented Architecture (SOA)サポート
大量のデータの処理用に設計
共有アクセスを使用した、収集された統計とプロジェクト追跡情報とともにデータを保持する単一リポジトリ
実際の情報品質の問題を迅速に解決するために設計された直観的なグラフィカル・ユーザー・インタフェース
検証および変換ルールの、容易でデータ主導の作成および拡張
必要なカスタム処理を挿入できる、完全に拡張可能なアーキテクチャ
EDQは、Javaサーブレット・エンジン、Java Web Startグラフィカル・ユーザー・インタフェース、およびStructured Query Language (SQL)を利用したリレーショナル・データベース管理システム(RDBMS)によるデータ・ストレージを使用するJava Webアプリケーションです。
EDQはクライアント・サーバー・アーキテクチャです。グラフィカル・ユーザー・インタフェース(GUI)、1つのデータ・リポジトリおよび1つのビジネス・レイヤーである複数のクライアント・アプリケーションから構成されます。この項では、これらのコンポーネントのアーキテクチャ、そのデータ・ストレージ、データ・アクセスおよびI/O要件について、詳細に説明します。
EDQでは、この製品を構成および操作するために使用される多くのクライアント・アプリケーションを提供します。そのほとんどはJava Web Startアプリケーションであり、それ以外は簡単なWebページです。次の表に、すべてのクライアント・アプリケーションとその開始方法およびそれぞれの機能をリストします。
アプリケーション名 | 開始 | 目的 |
---|---|---|
ディレクタ | Web開始 | データ品質処理を設計し、テストします |
サーバー・コンソール | Web開始 | ジョブを操作し、監視します |
一致レビュー | Web開始 | 一致結果をレビューして、手動で一致を決定します |
ダッシュボード | ブラウザ | データ品質のキー・パフォーマンス・インジケータおよびトレンドを監視します |
ケース管理 | Web開始 | 構成可能なワークフローを通じてデータの問題を詳細に調査します |
ケース管理の管理 | Web開始 | ケース管理のワークフローおよび権限を構成します |
Webサービス・テスター | ブラウザ | EDQ Webサービスをテストします |
構成分析 | Web開始 | 構成に関するレポートを作成し、複数のバージョンの構成の差分を取得します |
問題マネージャ | Web開始 | DQの問題のリストを管理します |
管理 | ブラウザ | EDQサーバーを管理します(ユーザー、グループ、拡張機能、Launchpadの構成) |
パスワードの変更 | ブラウザ | パスワードの変更 |
構成分析 | Web開始 | プロジェクトの構成を分析し、差分を報告します |
クライアント・アプリケーションには、EDQサーバーのEDQ Launchpadからアクセスできます。クライアントがJava Web Startアプリケーションのいずれか(ディレクタなど)を起動すると、そのアプリケーションはクライアント・マシンにダウンロードされ、インストールされて実行されます。アプリケーションはEDQサーバーと通信して、変更をインスタンス化し、サーバーからのメッセージを受信します(実行中のタスクに関する情報、他のユーザーによる変更など)。
EDQは拡張可能なシステムであるため、特定のユースケースに対応するために、インストール時にさらにユーザー・アプリケーションを追加して拡張することができます。たとえば、Oracle Watchlist ScreeningでEDQを拡張すると、監視リストに関してデータをスクリーニングするユーザー・アプリケーションが追加されます。
注意: 多くのクライアント・アプリケーションは、個別で使用する(専用の用途)ことも、別のアプリケーション内で使用することもできます。たとえば、構成分析、一致レビューおよび問題マネージャ・アプリケーションは、ディレクタ内からでも使用できます。 |
EDQは、2つのデータベース・スキーマ(ConfigスキーマおよびResultsスキーマ)を含むリポジトリを使用します。
注意: 各EDQサーバーは、そのサーバー専用のConfigスキーマおよびResultsスキーマを持つ必要があります。複数のサーバーを高可用性アーキテクチャにデプロイする場合に、2つのサーバーが同一のスキーマをポイントするようにして構成を共有することはできません。 |
Configスキーマは、EDQの構成データを格納します。通常は、多くのWebアプリケーションに共通の一般的なトランザクション方式で使用されます(問合せを実行して少数のレコードにアクセスし、必要に応じて更新します)。
通常、このスキーマには少量のデータのみが保持されます。簡単な実装の場合は、数MB程度であることがほとんどです。例外的に大規模なEDQシステムでは、特にケース管理の使用頻度が高い場合は、ストレージ要件が10GBに達する可能性があります。
Configスキーマに保持されたデータへのアクセスは、他のリレーショナル・データベース管理システム(RDBMS)アプリケーションでの構成データの典型です。ほとんどのデータベース・アクセスは読取りリクエストの形式であり、それに比較的少量のデータ更新および挿入リクエストも付随します。
Resultsスキーマには、スナップショット・データ、ステージング済データおよび結果データが格納されます。これは高度に動的で、サーバーで動作中のプロセッサで処理されるデータを格納するために、必要に応じて表が作成および削除されます。プロセス実行中に、使用可能なメモリーに保持できない作業データを格納するために、一時的な作業表も作成および削除されます。
Resultsスキーマに保持されるデータ量は時間とともに大幅に変化し、データのキャプチャおよび処理ではデータが数GBに及ぶ可能性があります。また、プロセスまたはジョブの実行中に、データが一時的に結果データベースに格納されることもあります。ジョブについては、処理中に複数のバージョンのデータがデータベースに書き込まれる場合があります。
Resultsスキーマは、Configスキーマとはまったく異なるデータ・アクセス・プロファイルを持ち、従来のWebベースのデータベース・アプリケーションとは大きく異なります。通常、Resultsスキーマの表は次の特徴を持ちます。
オンデマンドでの作成
バルクJDBCアプリケーション・プログラミング・インタフェース(API)を使用したデータの移入
プロセス実行をサポートするために、完全表スキャンを使用して問合せが実行されます。
Indexed
クライアント・アプリケーションでのユーザーの対話に応答して、複雑なSQL文を使用した問合せの実行
関連付けられているプロセスまたはスナップショットが再度実行されると削除されます。
このような動的性質を持つため、このスキーマは慎重に取り扱う必要があります。たとえば、REDOログ・ファイルを別のディスクにマウントすることをお薦めします。
EDQでは、プログラム・ファイルが含まれるインストール・ディレクトリとは別の、2つの構成ディレクトリを使用します。そのディレクトリは次のとおりです。
ベース構成ディレクトリ: このディレクトリにはデフォルトの構成データが含まれます。このディレクトリの名前は、Oracle WebLogicインストールではoedq.home
ですが、Apache Tomcatインストールでは任意の名前にすることができます。
ローカル構成ディレクトリ: このディレクトリには、拡張パック用のデータやデフォルト設定のオーバーライドなど、ベース構成のオーバーライドが含まれます。EDQは最初にこのディレクトリでオーバーライドがあるかどうかを調べて、ローカル・ディレクトリで必要なデータが検出されない場合は、ベース・ディレクトリを調べます。ローカル・ディレクトリの名前は、Oracle WebLogicインストールではoedq.local.home
ですが、Apache Tomcatインストールでは任意の名前にすることができます。
ファイルベースのデータ・ストアとの間でデータが処理されるときに、構成ディレクトリのいくつかのファイルが使用されます。その他のファイルは、どの機能パックが有効になるか、EDQのリポジトリ・データベースへの接続方法、およびその他の重要な情報などの、サーバーの構成プロパティを格納するために使用されます。
ホームおよびローカル・ホーム・ディレクトリの名前と場所は、テンプレートまたはその他の個別のコンポーネントへの手動更新を実行する必要があることをイベントで知るために重要です。
これらのディレクトリはEDQのインストール時に作成されます。詳細は、『Oracle Fusion Middleware Enterprise Data Qualityのインストールと構成』を参照してください。
ビジネス・レイヤーでは、主に次の3つの機能があります。
クライアント・アプリケーションがシステムの他の部分とやり取りするために使用するAPIを提供します。
クライアント・アプリケーションにクライアント・アプリケーションの更新が必要なサーバー・イベントを通知します。
データをキャプチャして処理するプロセスを実行します。
ビジネス・レイヤーはConfigスキーマに構成データを格納し、Resultsスキーマに作業データと結果を格納します。
クライアント・アプリケーションとの間でデータの受け渡し中に、ビジネス・レイヤーは、従来のJava Webアプリケーションの大部分に共通な方法で動作します。ビジネス・レイヤーは小規模なデータベース・トランザクションを作成し、HTTP接続を使用してフロントエンドに少量の情報を送信します。このアプリケーション・フロントエンドの大部分がブラウザよりも豊富なGUIを持つという点において、これは幾分変わっています。そのため、このクライアント・アプリケーションに送信されるデータのほとんどは、従来のHTMLではなく、シリアライズJavaオブジェクトで構成されます。
ただし、プロセスの実行時およびスナップショットの作成時には、このビジネス・レイヤーの動作は従来のバッチ・アプリケーションに近づきます。デフォルト構成では、非常に大規模なデータ量でも処理できるように、複数のスレッドおよびデータベース接続を生成し、使用可能なCPUコアおよびデータベースI/O容量をすべて使用します。
使用可能なリソースの使用を制限するようにEDQを構成できますが、明らかにパフォーマンスに影響を与えます。詳細は、EDQのインストレーション・ガイドおよびEDQの管理者ガイドを参照してください。