Oracle Warehouse Builderは、様々なタイプのデータ統合方針を設計および配布できる柔軟なツールです。Warehouse Builderを使用して実装された通常のプロジェクトには、重要なオペレーション・システム、移行シナリオ、異なる運用システムの統合、および従来のデータ・ウェアハウスが含まれています。この章では、Warehouse Builderの使用について概説します。この章は、ユーザーがWarehouse Builderを初めて使用する際の開始点となり、マニュアルのロード・マップとしての役割を果します。
Oracle Database 2日でデータ・ウェアハウス・ガイドをすでに読んでいる場合、ここで同じ内容をより幅広く理解できます。また、データ・ウェアハウスのみでなく一般的なデータ統合ソリューションの長期的な計画およびメンテナンスの追加情報も確認できます。
この章の内容は次のとおりです。
Oracle Warehouse Builderは一連のグラフィカル・ユーザー・インタフェースで構成され、データ統合ソリューションの実装に役立ちます。ソリューションの設計の過程で、ワークスペースと呼ばれる集中リポジトリにメタデータとして格納される様々なオブジェクトを作成します。
ワークスペースは、Oracle Database上にホストされます。一般ユーザーにはワークスペースへの完全なアクセス権はありませんが、アクセスを許可されているワークスペースであればアクセスできます。
主要なグラフィカル・ユーザー・インタフェースであるデザイン・センターを起動してワークスペースにログインします。デザイン・センターを使用してソース・オブジェクトをインポートし、マッピングなどのETLプロセスを設計して最後に統合ソリューションを定義します。
マッピングはソースからターゲットへのデータ・フローを定義するオブジェクトです。マッピング設計に基づいて、Warehouse BuilderによりETLロジックの実装に必要なコードが生成されます。たとえば、データ・ウェアハウス・プロジェクトでは統合ソリューションがターゲット・ウェアハウスです。この場合、デザイン・センターで作成するマッピングは最後にターゲット・ウェアハウスを定義します。
マッピングの設計を完了し、Warehouse Builderにコードの生成を要求したら、次にマッピングを配布します。配布は、デザイン・センターで生成した関連するメタデータおよびコードをターゲット・スキーマにコピーするプロセスです。ターゲット・スキーマはデザイン・センターで設計したETLロジックを実行するOracle Databaseとして汎用的に定義されます。特に、従来のデータ・ウェアハウスの実装では、データ・ウェアハウスはターゲット・スキーマであり、2つの用語には互換性があります。
図2-1は、Warehouse Builderのコンポーネントを示しています。
前述したように、デザイン・センターは主要なユーザー・インタフェースです。また、これはコントロール・センター・マネージャを含むすべてのクライアント・ベースのツールを起動できる中央インタフェースです。二次的なユーザー・インタフェースはWebベースのリポジトリ・ブラウザです。設計メタデータの参照および実行データの監査に加えて、レポートを表示および作成できます。
この画像では、ターゲット・スキーマとリポジトリが同じOracle Database上に存在しますが、実際にはターゲット・スキーマはしばしば別のデータベース上に存在します。設計オブジェクトを配布し、後で生成されたコードを実行するには、コントロール・センター・マネージャを使用します。コントロール・センター・マネージャは、コントロール・センター・サービスを介してターゲット・スキーマと対話するクライアント・インタフェースです。
Warehouse Builderは、データ・ウェアハウスを作成するために使用します。次に推奨する順序を示します。
Warehouse Builderクライアント・コンポーネントを使用する前に、最初にWarehouse Builderのワークスペースへのアクセス権があることを確認してください。
Warehouse Builderの使用を開始するには、次の手順を実行します。
Oracle Warehouse Builderインストレーションおよび管理ガイドの説明に従って、Warehouse Builderソフトウェアをインストールし、必要なワークスペースを作成します。
管理者がすでにインストールを完了している場合は、管理者に連絡して必要な接続情報を入手します。
デザイン・センターを起動します。
Windowsプラットフォームの場合は、「スタート」メニューから「プログラム」を選択します。Warehouse Builderがインストールされている「Oracleホーム」から「Warehouse Builder」→「デザイン・センター」の順に選択します。
Linuxプラットフォームの場合は、Warehouse Builder用のOracleホームのowb/bin/unixディレクトリにあるowbclient.sh
を実行します。
図2-2に、3つのエクスプローラで最上位レベル・フォルダがそれぞれ展開されているデザイン・センターを示します。
プロジェクト・エクスプローラを使用して、特定のワークスペース内の設計オブジェクトを管理できます。設計オブジェクトは、プロジェクトに編成されていて、セキュリティおよび再利用性のあるオブジェクトを構成します。各プロジェクトには、ユーザーが作成またはインポートできる設計オブジェクトの各タイプにノードが含まれます。
接続エクスプローラを使用して、Warehouse Builderワークスペースとデータベース、データファイル、アプリケーションとの間の接続を確立します。
グローバル・エクスプローラを使用して、ワークスペース内のすべてのプロジェクトに共通のオブジェクトの管理およびセキュリティの管理を行います。「セキュリティ」ノードは、Oracle Warehouse Builderインストレーションおよび管理ガイドの説明にあるように、管理者ロールのあるユーザーに対して表示されることに注意してください。
デザイン・センターを準備するには、次の手順を実行してください。
プロジェクト・エクスプローラで、使用するプロジェクトを指定します。
1つのデフォルトのプロジェクトのMY_PROJECTに問題がない場合は、次の手順に進みます。
または、MY_PROJECTの名前を変更したり、より多くのプロジェクトを定義できます。定義した各プロジェクトはデータベース、ファイル、アプリケーションなどのノードで同じ形式で組織されます。異なる組織の場合は、「コレクションの定義」の説明に従って、オプションのコレクションを作成することも考慮します。
ソース・データ・オブジェクトとターゲット・データ・オブジェクトに接続します。
接続エクスプローラでは、これらの接続はロケーションを定義して確立します。「ロケーション」ノードと、そのノード内の各ノードを開いて、Warehouse Builderからアクセスできるソースおよびターゲットのタイプを全般的に理解します。
ロケーションを作成するには、適切なノードを右クリックして「新規」を選択します。必要な接続情報を入力して「接続テスト」を選択します。この手順では、ソースおよびターゲットへの接続のみを確立します。後続の手順を実行するまで、データまたはメタデータを移動しないでください。
ロケーションの詳細は、「ロケーションの概要」を参照してください。
ターゲット・スキーマを指定します。
フラット・ファイルをターゲットとして使用できますが、最も一般的で推奨するシナリオは、Oracle Databaseのターゲット・スキーマとしての使用です。
ターゲット・スキーマを定義するには、モジュールを作成します。モジュールはプロジェクト・エクスプローラにあるグループ化機能で、接続エクスプローラにあるロケーションに対応しています。Oracleターゲット・モジュールは、Warehouse Builderでユーザーが作成するモジュールの1つです。
プロジェクト・エクスプローラで「データベース」ノードを開きます。「Oracle」を右クリックして、「新規」を選択します。モジュールの作成ウィザードが表示されます。モジュール・タイプを「ウェアハウス・ターゲット」に設定し、モジュールが環境内で使用されるか、品質保証、生産を指定します。このモジュール・ステータスは説明のみであり、次に実行する手順とは関係がありません。
このウィザードを完了すると、ターゲット・モジュールが複数のノードを伴って表示されます。これらのノードは、マッピング、変換、表、キューブおよびターゲット・ウェアハウスの設計に利用する他の様々なタイプのオブジェクトに対するノードです。
データ・ソース用に個別のOracleモジュールを作成します(オプション)。
必要に応じて、別のOracleモジュールを作成してOracleソース・データを格納できます。または、次の手順に進みます。
実行環境を指定します。
また、接続エクスプローラの下にある「コントロール・センター」ノードに注意してください。「コントロール・センター」はOracle Databaseスキーマです。このスキーマは、後続の手順に従ってデザイン・センターで設計するETLジョブの実行を管理します。
インストール時に、Warehouse Builderでは、ワークスペースとして同じデータベース上にDEFAULT_CONTROL_CENTER
スキーマが作成されます。
デフォルトの実行環境を使用する場合は、次の手順に進みます。または、新しい「コントロール・センター」を随時定義できます。詳細および手順は、「ターゲット・スキーマへの配布およびETLロジックの実行」を参照してください。
開発、テストおよび本番の各環境を準備します(オプション)。
ここまでの手順では、単一の実行環境に対応した単一プロジェクトの作成について説明しました。ただし、このプロジェクトの論理設計は、テスト環境や本番環境など、異なる物理環境で再使用できます。
追加の構成を作成して、単一のデータ・システムを複数の異なるホスト・システムまたは様々な環境に配布します。
関連項目: 追加構成の作成の詳細は、Oracle Warehouse Builderインストレーションおよび管理ガイドを参照してください。 |
クライアント・プリファレンスの設定を必要に応じて調整するか、デフォルトのプリファレンスの設定を受け入れて次の手順に進みます。
デザイン・センターのメイン・メニューから「ツール」→「プリファレンス」の順に選択します。
新規ユーザーの場合は、必要に応じて、「環境プリファレンス」、「外観プリファレンス」にある「ロケール」および「ネーミング・プリファレンス」にある「ネーミング・モード」を設定します。すべてのプリファレンスの詳細は、「プリファレンスの設定」を参照してください。
メタデータをインポートする設計オブジェクトの各タイプのモジュールを作成します。
プロジェクト・エクスプローラで、「ファイル」などのノードを選択します。選択したノードで、最後にデータを抽出するロケーションを決定します。ノードを右クリックして関連する各ロケーションにモジュールを作成し、「新規」を選択します。
様々なデータ・ソースからメタデータをインポートします。
モジュールを右クリックし、「インポート」を選択して、関連するロケーションからメタデータを抽出します。ウィザードが表示され、データをインポートするプロセスを説明します。
データ・オブジェクトのインポートの例および詳細は、「データ・ソースの識別およびメタデータのインポート」を参照してください。
インポートしたメタデータに対応するデータをプロファイリングします(オプション)。
次の手順に進む前に、データ品質を確認するためにデータ・プロファイリングのオプションを使用することを検討してください。詳細は、「データの品質管理の理解」を参照してください。
信頼性が確かであれば、データを実用的な情報に変換するだけです。データをターゲット・システムにロードする前に、まずデータの構造と意味を理解し、品質を査定する必要があります。
データ・プロファイリングを使用してソース・データの品質をより深く理解することを検討します。次に、ソース・データを修正し、今後の負荷において発生する可能性のあるエラーを検出し、修正する手段を確立します。データ・プロファイリングおよびデータ品質の詳細は、「データ品質管理の理解」を参照してください。
Oracleターゲット・モジュールにデータ・オブジェクトを作成して設計します。
前の手順で、既存のターゲット・オブジェクトはすでにインポートしています。新規のターゲット・オブジェクトについては、表13-1にリストされているディメンション・オブジェクトまたはリレーショナル・オブジェクトを設計します。
データ・オブジェクトを作成するには、適切なウィザードを起動するか、またはデータ・オブジェクト・エディタを使用できます。ウィザードを使用するには、目的のオブジェクトのノードを右クリックし、「新規」を選択します。ウィザードを使用した後、オブジェクトはエディタで変更できます。その場合は、該当するオブジェクトを右クリックし、「エディタを開く」を選択します。
詳細は、「ターゲット・スキーマの設計」を参照してください。
オブジェクトを設計する際は、設計オブジェクトを頻繁に検証してください。
オブジェクトは、作成時に検証することも、オブジェクトのグループでまとめて検証することもできます。プロジェクト・エクスプローラで、1つ以上のオブジェクトまたはモジュールを選択して「検証」アイコンをクリックします。
検証結果ウィンドウのメッセージを確認します。エラーを修正して再度検証を試みます。
最新の検証結果を後で再表示するには、「表示」メニューから「検証メッセージ」を選択します。
詳細は、「データ・オブジェクトの検証」を参照してください。
データ・オブジェクトを構成します。
データ・オブジェクトを構成すると、オブジェクトの物理プロパティが設定されます。物理プロパティ値を指定せずにデータ・オブジェクトを生成して配布しないでください。
データ・オブジェクトを作成すると、Warehouse Builderにより、オブジェクトのタイプに基づいてデフォルトの構成プロパティ値が割り当てられます。ほとんどの場合、このデフォルト値で十分です。オブジェクトの構成プロパティ値は環境に応じて編集および変更できます。たとえば、表を構成して、その表の作成先となる表領域の名前を指定します。
データ・オブジェクトを構成するには、プロジェクト・エクスプローラでデータ・オブジェクトを選択して「構成」アイコンをクリックします。または、プロジェクト・エクスプローラでデータ・オブジェクトを右クリックして「構成」を選択します。
ターゲット・オブジェクトの設計に問題がなければ、コードを生成します。
生成により、DDLまたはPL/SQLスクリプトが作成され、これらはターゲット・スキーマ内のデータ・オブジェクトを作成するために後の手順で使用されます。生成の詳細は、「データ・オブジェクトの生成」を参照してください。
データ・オブジェクト・エディタでは、「生成」アイコンをクリックすると単一のオブジェクトのコードを生成できます。
プロジェクト・エクスプローラで、1つ以上のオブジェクトまたはモジュールを選択し、「生成」アイコンをクリックします。生成結果ウィンドウでメッセージを確認します。後で最新の生成結果を再度表示するには、「表示」メニューで「生成済スクリプト」を選択します。
生成されたスクリプトをファイルとして保存でき、オプションで、Warehouse Builderを外部に配布できます。
ソースからターゲット・オブジェクトへのデータ・フローを定義するマッピングを設計します。
プロジェクト・エクスプローラで、Oracleターゲット・モジュールを開き、「マッピング」ノードを右クリックして「新規」を選択します。
マッピング・エディタを使用すると、データのフローを視覚的に定義できます。キャンバス上に演算子をドラッグ・アンド・ドロップし、演算子をつなぐ線を描きます。演算子は、データ・オブジェクトおよびフィルタリング、集計などの機能の両方を表します。
マッピングを定義する手順に従って、最後にマッピングのコードを生成します。
マッピング間の依存性を管理するには、「プロセス・フローの設計」を参照してください。
配布は、デザイン・センターで生成した関連するメタデータおよびコードをターゲット・スキーマにコピーするプロセスです。この手順は、ターゲット・スキーマがマッピングなどのETLロジックの実行の有効化に必要です。
配布および実行するには、次のステップを実行してください。
デザイン・センターまたはコントロール・センター・マネージャのいずれかからオブジェクトを配布します。
この時点で、ターゲット・スキーマにオブジェクトを定義します。この操作は1回のみ行います。
最も単純なアプローチは、オブジェクトを選択し、「配布」アイコンをクリックして、デザイン・センターから直接配布することです。この場合、Warehouse Builderではデフォルトの配布設定を使用してオブジェクトを配布できます。
または、Warehouse Builderがオブジェクトを配布する方法をより正確に制御し、フィードバックを得るには、デザイン・センターのメニューで「ツール」を選択し、「コントロール・センター・マネージャ」を選択します。
デザイン・センターまたはコントロール・センター・マネージャからオブジェクトを配布する場合、すべての関連付けられたオブジェクトを配布する必要があります。たとえば、マッピングを配布する場合、定義した表などのターゲット・データ・オブジェクトや関連付けられたプロセス・フロー、またはその他のマッピングにも配布します。
詳細は、「ターゲット・スキーマへの配布およびETLロジックの実行」を参照してください。
ETLロジックを実行し、ターゲット・ウェアハウスを移入します。
この時点で、データを初めて移動します。ターゲットを新しいデータでリフレッシュするたびにこの手順を繰り返します。
マッピングおよびプロセス・フローでETLロジックを実行するには2つのオプションがあります。「スケジュールの定義および使用のプロセス」の説明に従って、スケジュールを作成および配布できます。または、「ETLジョブの開始」の説明に従って、手動でジョブを実行することもできます。
データ・ウェアハウスに入力されるデータの品質を長期的に確保することは非常に重要です。データ監査を行うと、入力データをデータ・ルールのセットと照らし合せて検証し、データ・ウェアハウスに対して定義されたビジネス・ルールにデータが準拠しているかどうかを判別することにより、入力データの品質を監視できます。データ監査とデータ・ルールの詳細は、「データの品質管理の理解」を参照してください。
コントロール・センター・マネージャには配布と実行の履歴が表示されますが、Warehouse Builderの操作の監視およびレポート作成の優先インタフェースはリポジトリ・ブラウザです。詳細は、「配布と実行の監査」を参照してください。