Oracle® Fusion Middleware Oracle Data Integratorスタート・ガイド 11g リリース1(11.1.1) B65041-01 |
|
前 |
次 |
この章では、Oracle Data Integratorの概要、技術アーキテクチャおよびこのスタート・ガイドの内容を示します。
この章の構成は、次のとおりです。
広く使用されているデータ統合ソフトウェア製品であるOracle Data Integratorには、データ変換と統合プロセスを定義するための新しい宣言的な設計方法が用意されており、開発とメンテナンスを短時間で簡単に行えます。Oracle Data Integratorは、固有のE-LTアーキテクチャ(Extract - Load Transform)に基づいて、データの変換および検証プロセスの実行での最高レベルのパフォーマンスを保証するだけでなく、現在使用可能な最も費用効果の高いソリューションでもあります。
Oracle Data Integratorは、データおよびアプリケーションの統合プロジェクトを効率化する統合インフラストラクチャを提供します。
ますます加速する現在のビジネス環境では、より特化したソフトウェア・アプリケーションを使用することが必要とされます。また、異なるハードウェア・プラットフォームやシステムにこれらのアプリケーションを共存させ、アプリケーションやシステム間でデータを共有できるようにする必要もあります。これらの統合を実行するプロジェクトは、仕様どおり、かつ期限および予算内で提供される必要があります。
Oracle Data Integratorでは、データ統合に宣言的設計方法が使用され、宣言的ルールと実装の詳細とが分離されます。Oracle Data Integratorは、固有のE-LT (Extract - Load Transform)アーキテクチャにも基づいており、スタンドアロンETLサーバーと専用エンジンが不要になります。かわりに、RDBMSエンジンに備わった機能が利用されます。この組合せによって、開発とメンテナンスの両方で生産性が最大限に高まり、データの変換と検証のプロセスの実行で最高のパフォーマンスを得られます。
データ統合にOracle Data Integratorが選ばれる主な理由は次のとおりです。
開発およびメンテナンスの時間短縮と簡略化: データ統合に対する宣言的ルール主導のアプローチにより、短期間で製品を習得でき、開発者の生産性が大幅に向上します。また、継続的なメンテナンスが簡単になります。このアプローチでは、プロセスの定義と実際の実装とが分離され、宣言的ルール(what)とデータ・フロー(how)とが分離されます。
データ品質のファイアウォール: Oracle Data Integratorでは、ターゲット・アプリケーションに挿入する前に、不良データが自動的に検出され、リサイクルされます。これは、ターゲット・アプリケーションとOracle Data Integratorの両方で定義されているデータの整合性ルールと制約に従って行われ、プログラミングの必要はありません。
実行パフォーマンスの向上: 従来型のデータ統合ソフトウェア(ETL)は、行ごとにデータ変換を行う専用エンジンに基づいているため、パフォーマンスに限りがあります。E-LTアーキテクチャを実装し、既存のRDBMSエンジンとSQLに基づくことで、ターゲット・サーバーで設定に基づいたレベルでデータ変換を行えるため、より高いパフォーマンスが得られます。
より単純で効率的なアーキテクチャ: E-LTアーキテクチャにより、ソースとターゲット・サーバーの間にETLサーバーを置く必要がなくなります。ソースとターゲット・サーバーを利用して複雑な変換を行いますが、大半はバッチ・モードで、エンドユーザー問合せの処理でサーバーがビジーでないときに行われます。
プラットフォーム非依存: Oracle Data Integratorでは、同一のソフトウェアであらゆるプラットフォーム、ハードウェアおよびOSがサポートされます。
データの接続性: Oracle Data Integratorでは、すべての主要なデータ・ウェアハウジング・プラットフォーム(Oracle、Exadata、Teradata、IBM DB2、Netezza、Sybase IQなど)を含むすべてのRDBMSと他の多くのテクノロジ(フラット・ファイル、ERP、LDAP、XMLなど)がサポートされます。
コスト削減: ETLサーバーとETLエンジンを使用しないことで、ハードウェアおよびソフトウェアの初期購入コストとメンテナンス・コストの両方が削減されます。習得時間の短縮および開発者の生産性向上により、プロジェクト全体の人件費、および継続的な拡張の費用が削減されます。
Oracle Data Integratorプラットフォームは、広義のFusion Middlewareプラットフォームに統合され、このスタックの主要なコンポーネントになります。Oracle Data Integratorにはランタイム・コンポーネントがJava EEアプリケーションとして含まれ、Oracle WebLogicアプリケーション・サーバーの機能が十分に活用されるよう強化されています。Oracle Data Integratorコンポーネントには、エンタープライズ規模のデプロイメント、高可用性、スケーラビリティおよび強固なセキュリティのための独自の機能が含まれています。図1-1に、ODIコンポーネントのアーキテクチャを示します。
アーキテクチャの核となるコンポーネントは、Oracle Data Integratorリポジトリです。このリポジトリには、ITインフラストラクチャに関する構成情報、すべてのアプリケーションのメタデータ、プロジェクト、シナリオおよび実行ログが格納されています。複数のリポジトリのインスタンスがITインフラストラクチャに共存できます(開発、QA、ユーザー受入れ、本番など)。リポジトリのアーキテクチャは、メタデータやシナリオを交換する複数の別々の環境(例: 開発、テスト、保守および本番の各環境)を許容するように設計されています。リポジトリは、バージョン管理システムとしても機能し、この場合、オブジェクトはアーカイブされ、バージョン番号が割り当てられます。
Oracle Data Integratorリポジトリは、1つのマスター・リポジトリと複数の作業リポジトリで構成されます。ユーザー・インタフェースを使用して開発または構成されたオブジェクトは、これらのリポジトリ・タイプの1つに格納されます。
通常、次の情報を格納するマスター・リポジトリが1つ存在します。
ODIプラットフォームのユーザー、プロファイルおよび権限などのセキュリティ情報
テクノロジ、サーバー定義、スキーマ、コンテキスト、言語などのトポロジ情報
バージョニングしたオブジェクトおよびアーカイブしたオブジェクト
作業リポジトリは、開発した実際のオブジェクトが格納されるリポジトリです。同じODIインストールに複数の作業リポジトリが共存可能です(たとえば、別々の環境を使用するため、または特定のバージョニング・ライフ・サイクルと一致させるため)。作業リポジトリには、次の情報が格納されます。
モデル: スキーマ定義、データストア構造とメタデータ、フィールドと列の定義、データ品質制約、相互参照、データ系統などが含まれます。
プロジェクト: ビジネス・ルール、パッケージ、プロシージャ、フォルダ、ナレッジ・モジュール、変数などが含まれます。
シナリオ実行: シナリオ、スケジューリング情報およびログが含まれます。
作業リポジトリは、その中に実行情報(通常は本番のための情報)のみが含まれる場合は、実行リポジトリと呼ばれます。
管理者、開発者およびオペレータは、Oracle Data Integrator Studioを使用してリポジトリにアクセスします。このFusionクライアント・プラットフォーム(FCP)ベースのUIは、インフラストラクチャ(セキュリティおよびトポロジ)の管理、メタデータのリバースエンジニアリング、プロジェクトの開発、実行のスケジューリング、操作および監視に使用されます。
ODI Studioには、ODI統合プロジェクトの様々な側面やステップを管理するための4つのナビゲータが用意されています。
デザイナ・ナビゲータは、次のようなデータ整合性チェックの設計および変換の作成に使用されます。
既存のアプリケーションまたはデータベースの自動リバースエンジニアリング
変換および統合インタフェースのグラフィカルな開発および保守
インタフェース内のデータ・フローの視覚化
ドキュメントの自動生成
生成されたコードのカスタマイズ
オペレータ・ナビゲータは、本番の管理および監視ツールです。IT本番オペレータ用に設計されています。オペレータ・ナビゲータを使用すると、セッションのインタフェース実行、および本番のシナリオを管理できます。
トポロジ・ナビゲータは、情報システムの物理アーキテクチャと論理アーキテクチャを記述するデータを管理するために使用されます。トポロジ・ナビゲータを使用すると、情報システムのトポロジ、テクノロジとそのデータ型、これらのテクノロジにリンクされているデータ・サーバーとその中に含まれているスキーマ、コンテキスト、言語とエージェント、リポジトリを管理できます。サイト、マシンおよびデータ・サーバーの記述によって、Oracle Data Integratorでは様々な物理環境で同じ統合インタフェースの実行が可能になります。
セキュリティ・ナビゲータは、Oracle Data Integrator内のセキュリティ情報を管理するためのツールです。セキュリティ・ナビゲータを使用すると、ユーザーとプロファイルを作成し、汎用オブジェクト(データ・サーバー、データ型など)に対するメソッド(編集、削除など)に関するユーザー権限を割り当て、オブジェクト・インスタンス(サーバー1、サーバー2など)に対してこれらの権限を微調整できます。
Oracle Data Integratorには、これらの実行時操作と設計時操作を行うためのJava APIも含まれています。このOracle Data Integrator Software Development Kit (SDK)は、スタンドアロンJavaアプリケーションとアプリケーション・サーバーに使用できます。
設計時に、開発者は、設計したビジネス・ルールからシナリオを生成します。これらのシナリオのコードは、ランタイム・エージェントによってリポジトリから取得されます。コードの取得後、このエージェントは、データ・サーバーに接続して、これらのサーバー上でコード実行を調整します。また、実行に関するリターン・コードやメッセージおよびリポジトリ内のその他のログ情報(処理レコード数、実行時間など)を取得します。エージェントには2種類あります。
Java EEエージェントは、Webアプリケーションとしてデプロイでき、アプリケーション・サーバーの機能を利用できます。
スタンドアロン・エージェントは、単純なJavaマシンで実行され、統合フローの実行に必要な場合にデプロイできます。
これらのエージェントはマルチスレッドJavaプログラムであり、ロード・バランシングをサポートし、情報システム全体に配布できます。このエージェントには、独自の実行スケジュールが保持されています。実行スケジュールはOracle Data Integratorで定義でき、外部スケジューラから呼び出すこともできます。また、Java APIまたはWebサービス・インタフェースから呼び出すこともできます。
ビジネス・ユーザー(および開発者、管理者、オペレータ)にはリポジトリに対する読取りアクセス権限があり、Oracle Data Integratorコンソールと呼ばれるWebベースのUIを使用して、トポロジ構成および本番操作を実行できます。このWebアプリケーションは、Oracle WebLogicなどのJava EEアプリケーションにデプロイできます。
Java EEエージェント、スタンドアロン・エージェントおよびODIコンソールを管理および監視するために、Oracle Fusion Middleware Controlコンソールに統合された新しいプラグインがOracle Data Integratorに用意されています。
表1-1に、このガイドの内容を簡単に示します。
表1-1 内容の要約
この章 | 内容 |
---|---|
第2章「Oracle Data Integratorとデモンストレーション環境のインストール」 |
Oracle Data Integratorとデモンストレーション環境をインストールします。 |
|
Oracle Data Integrator Studioに含まれたデモンストレーション環境の概要を示します。 |
第4章「Oracle Data Integratorの起動」 |
デモンストレーション環境とOracle Data Integrator Studioを起動します。 |
|
データ品質管理を実装します。 |
|
Oracle Data Integratorで統合インタフェースを作成し、使用します。 |
|
Oracle Data Integratorでパッケージを作成し、使用します。 |
|
開発物の実行、実行の追跡および実行結果の解釈を行います。 |
|
ODIパッケージを本番環境で自動的に実行します。 |
第10章「Oracle Data Integratorのその他の情報」 |
Oracle Data Integratorで高度なタスクを実行します。 |