Oracle Business Intelligence Data Warehouse Administration Consoleユーザーズ・ガイド リリース10.1.3.4 B51055-01 |
|
![]() 戻る |
![]() 次へ |
DACは、データ・ウェアハウス実装におけるライフ・サイクル全体のフレームワークとなります。これにより、パフォーマンスの高いパラレル環境において、モジュール化されたデータ・ウェアハウス・アプリケーションの作成、構成、実行およびモニターができます。DACプロセスのライフ・サイクルの詳細は、「DACプロセスのライフ・サイクルについて」を参照してください。
DACによりInformatica ETLプラットフォームが補完されます。アプリケーション固有の機能が用意されていますが、これはETLプラットフォームにはビルトインされていません。たとえば、ETLプラットフォームでは、データ・ウェアハウスにポピュレートされているサブジェクトエリアのセマンティクスにも、それらをポピュレートする方法にも対応していません。DACでは、ETL実行プラットフォームの上にある抽象化レイヤーにおいて次のアプリケーション機能が用意されています。
サブジェクトエリアと実行プランを動的に生成する機能
パラレル処理とロードバランシングを動的に設定する機能
ユーザー定義スコアと算出スコアに基づいたインテリジェント型タスク・キュー・エンジン
完全モードと増分モードへの自動対応
ETLとクエリーのパフォーマンスのインデックス管理
埋込み型でパフォーマンスが高いSiebel OLTPチェンジ・キャプチャ手法
どの障害発生時点においても処理を再開できる機能
ETLのボトルネックを特定するフェーズベース型分析ツール
重要なDAC機能により、次のことを実行できます。
インストール、設定および構成の所要時間の短縮
データ・ウェアハウスにおける物理データモデルの作成
言語や通貨などの設定
サブジェクトエリアの設計と実行プランの構築
メタデータ・ドリブンの依存性と関係の管理
カスタムETL実行プランの生成
Siebelトランザクション・データベースでのチェンジ・キャプチャの自動化
削除されたレコードのキャプチャ
インデックス管理の支援
実行プランの予行演習とテストの実行
レポート処理とモニターによるボトルネックの特定
エラーのモニターと電子メールによる警告の実行
構造化されたETL分析とレポート処理の実行
パフォーマンス実行手法の利用
完全モードと増分モードによる最適化ルールの自動化
Informaticaセッションの同時実行レベルの設定
複数のInformaticaサーバー間でのロードバランシング
障害発生時点からの処理の再開
パフォーマンスのためのタスク実行キュー(図3-1を参照)
DACでは、メタデータ・ドリブンの優先順位と実行時に算出されたスコアに基づいてタスク実行キューが管理されます。この組合せにより、柔軟で最適化された実行が可能になります。依存の数、ソースの数および平均期間に基づいて、優先順位がタスクに動的に割り当てられます。
様々なユーザー・グループがDACを使用して、実行プランの設計、実行、モニターおよび診断を行います。図3-2に示すように、これらのフェーズにより、DACプロセスのライフ・サイクルが構成されます。
プロセスとアクションのフェーズは、次のものに関連付けられています。
設定
データベース接続の設定
ETLプロセス(Informatica)の設定
電子メールの受取人の設定
設計
アプリケーション・オブジェクトの定義
実行プランの設計
実行
スケジュール・パラメータの定義による実行プランの実行
ランタイム・コントロールのアクセスによる実行中スケジュールの再開や停止
モニター
データ・ウェアハウス・アプリケーションのランタイム実行のモニター
ユーザー、DACリポジトリおよびアプリケーションのメンテナンス・ジョブのモニター
ソース・システム・コンテナには、特定のソース・システムに対応するリポジトリオブジェクトが格納されます。様々なリポジトリオブジェクトの詳細は、「ソース・システム・コンテナ内のDACリポジトリオブジェクトについて」を参照してください。
独自のソース・システム・コンテナを作成するには、事前構成されたソース・システム・コンテナを使用する必要があります。事前構成されたコンテナのコピーとして作成した独自のソース・システム・コンテナにあるオブジェクトは、DACクライアントで変更できます。これにより、新しく作成されたオブジェクト、変更されたオブジェクト、そのまま使用されているオブジェクトなどのカスタマイズ内容の追跡管理が、DACクライアントで可能になります。
注意: DACクライアントを介したり、DACリポジトリに対してSQL文を直接使用して、事前に構成済のソース・システム・コンテナにあるオブジェクトを変更しないでください。変更するには、事前に構成済のコンテナをコピーする必要があります。 |
新しいソース・システム・コンテナを作成する手順や既存のコンテナをコピーする手順については、「ソース・システム・コンテナの作成またはコピー」を参照してください。
すべてのDACリポジトリオブジェクトは、ソース・システム・コンテナに関連付けられています。ソース・システム・コンテナの詳細は、「ソース・システム・コンテナについて」と「DACでのオブジェクト所有権について」を参照してください。
DACリポジトリでは、データ・ウェアハウス・アプリケーションを定義する階層フレームワークにアプリケーション・オブジェクトが格納されます。DACでは、指定したソース・システム・コンテナに基づいて、リポジトリのアプリケーション・オブジェクトを表示できます。ソース・システム・コンテナでは、作業しているソース・システムに対応するメタデータが格納されます。
データ・ウェアハウス・アプリケーションには、次のようなリポジトリオブジェクトが含まれますが、これらに限定されません。
サブジェクトエリア: 特定のサブジェクトやアプリケーションのコンテキストに関連したテーブルを論理的にグループ化したものです。テーブルに関連付けられたタスクや、テーブルのロードに必要なタスクも同様に含まれます。サブジェクトエリアは実行プランに割り当てられますが、完全ロードや増分ロード用にスケジュールすることができます。
テーブル: データベース・スキーマに定義されている物理データベース・テーブルです。トランザクション・データベースのテーブルとデータ・ウェアハウスのテーブルがあります。テーブルのタイプは、ファクト、次元、階層、集計などにできます。また、フラット・ファイルはソースにもターゲットにもできます。
インデックス: データベース・スキーマに定義されている物理データベース・インデックスです。これらのインデックスにより、ETLプロセスやレポート目的のクエリーが効率良く実行されます。
タスク: 1つ以上のテーブルをロードするために行う作業の単位です。タスクは、ソースやターゲットのテーブル、フェーズ、実行タイプ、切捨てプロパティ、完全ロードや増分ロード用のコマンドで構成されます。サブジェクトエリアをアセンブルすると、DACでは自動的にタスクが割り当てられます。DACによってサブジェクトエリアに自動的に割り当てられたタスクは、「Subject Areas」タブの「Tasks」サブタブに「Autogenerated」フラグで示されます。
タスク・グループ: 特定の順序で実行するために定義したタスクのグループです。タスク・グループは、特別なタスクとみなされます。
実行プラン: サブジェクトエリアに定義されたデータ変換プランで、所定の頻度で変換が必要です。データ・ウェアハウスのロードが必要になるタイミングに関するビジネス要件に基づいて、実行プランは定義されます。実行プランは、実行する順序が設定されたタスク、インデックス、タグ、パラメータ、ソース・システム・フォルダおよびフェーズで構成されます。
スケジュール: スケジュールにより、実行プランの実行頻度を指定します。複数のスケジュールを定義することで、実行プランを様々な頻度で実行したり繰り返して実行するようにスケジュールできます。
オブジェクトが生成されるソース・システム・コンテナが、所有者コンテナです。DACの「Design」ビューのタブには、様々なリポジトリオブジェクトの所有者が表示されます。オブジェクトを参照することで、様々なソース・システム・コンテナ間でオブジェクトを再利用できます。参照は、シンボリック・リンクやショートカットのように動作します。参照先オブジェクトは、参照元オブジェクトと同様に使用できますが、オブジェクトの所有権は変わりません。
たとえば、W_INVOICE_Fは、データ・ウェアハウスのソース・システム・コンテナを所有者とする要素テーブルです。W_INVOICE_Fは、参照することによって、他のコンテナで再利用できます。
オブジェクトはその所有者コンテナから参照できます。また、別のソース・システム・コンテナによってすでに参照されているオブジェクトを参照することもできます。
参照先のオブジェクトを変更すると、変更されたオブジェクトはクローンになり、所有権は変更を行ったソース・システム・コンテナに変更されます。
他のコンテナによって参照されている参照元オブジェクトを変更すると、参照元オブジェクトの更新内容が参照先オブジェクトにすぐに反映されます。参照元オブジェクトを削除すると、参照先オブジェクトもすべて削除されます。
参照元オブジェクトの子オブジェクトを変更しても、参照先オブジェクトの子オブジェクトには自動的に反映されません。右クリック・コマンドを使用して「Ownership」→「Push to References」を選択すると、参照先オブジェクトの子オブジェクトに変更内容がプッシュされます。また、逆に、参照元オブジェクトへの変更内容を参照先オブジェクトにインポートすることもできます。この機能は「再参照」と呼ばれます。
「Design」ビューの右クリック・メニューで使用可能な所有権機能の詳細は、「表6-6 「Design」ビューでの右クリック・メニュー・コマンド」を参照してください。