ビジネス・インテリジェンス・ソリューションの実装には、情報テクノロジ(IT)専門家から経営者、各種業務の担当マネージャまで、組織内の様々な人がかかわってきます。しかし、通常、BIソリューションの技術的な面を設計し、実装するのはIT専門家です。この章では、そのようなIT専門家を対象に説明します。
この章では、Oracle Business Intelligenceがどのようにビジネス・インテリジェンス・ソリューションの実装をサポートしているかについて説明します。この章の構成は次のとおりです。
Oracle Business Intelligenceを使用すると、トランザクション・システムから直接レポートを作成できますが、ビジネス・インテリジェンスでは、通常、履歴データや様々なソースからのデータを収集し、そのデータを分析用に構造化する必要があります。つまり、ビジネス・インテリジェンス・ソリューションでは、データ・ウェアハウスが基盤となります。
OracleBI Warehouse Builderは、ソース・データの識別からレポート用のメタデータの作成に至るまで、データ・ウェアハウスの設計、開発プロセスをサポートします。OracleBI Warehouse Builderは、Oracle Databaseの強力なデータ・ウェアハウス機能を活用します。また、OracleBI Warehouse Builderのインタフェースは、レポート用にデータを統合する作業や、データ・ウェアハウスを配置した後の保守作業に役立ちます。
データ・ウェアハウスは、通常、様々なソースのデータを統合します。
業務系データは、レポートを作成するための主要なデータ・ソースです。このデータは、組織のビジネス・トランザクションから生成され、通常は、1つ以上のリレーショナル・システムに保存されます。トランザクション・データは、Oracle Databaseだけでなく、他のシステムに保存される場合もあります。たとえば、現在のデータはOracle Databaseに保存されていても、履歴データはレガシー・システムに保存されていることがあります。また、他の企業を吸収合併した場合に、その企業のデータがOracle以外のデータベースに保存されていることもあります。
OracleBI Warehouse Builderは、次のような様々なデータベース・ソースのメタデータを読み取ることができます。
ビジネス・インテリジェンス・システムには、自社の業務系データ以外のデータが必要になる場合があります。たとえば、分析する目的によっては、サード・パーティ・ベンダーから提供される人口統計データが必要になる場合があります。このようなデータは、ODBCを介してフラット・ファイルやスプレッドシート・ファイル形式で提供されることがあります。
OracleBI Warehouse Builderでは、外部テーブルを使用してフラット・ファイルをリレーショナル形式で表すことができます。外部テーブルは、読取り専用のOracle Databaseテーブルであり、OracleBI Warehouse Builderの通常のソース・テーブルと同様に機能します。これらのテーブルのメタデータはOracleBI Warehouse Builderリポジトリに保存しておき、ソース・データの変換を設計する場合に使用できます。また、OracleBI Warehouse Builderでは、スプレッドシート・データを自社のデータ・ウェアハウスに取り込むこともできます。
様々なソースにあるデータを統合するには、ソース・データからターゲットのデータ・ウェアハウスへの抽出、変換、ロード(ETL)を設計し、実装します。
抽出時には、必要なデータを各種のソースから識別し、抽出します。通常は、最終的に必要となるデータよりも多めに抽出します。これは、実際に使用するデータを正確に判断するのが難しいためです。そのため、データの抽出時には、データベースのスケーラビリティが重要になります。データ・ウェアハウスには履歴データが保存されるため、そのデータ量は急激に増加します。Oracle Data Warehousingには、いくつかのスケーラビリティ機能があり、OracleBI Warehouse Builderはこれらの機能を活用しています。
データ・ウェアハウスでは、様々なソースにあるデータが統合されるため、レポートに正確で一貫したデータが表示されるように、データを変換する必要があります。OracleBI Warehouse Builderには、変換をモデル化するためのグラフィカルな環境が備わっており、ソース・データを容易にターゲット・データにマッピングできます。OracleBI Warehouse Builderには、名前およびアドレス・クレンジングのためのソリューションが用意されています。このソリューションでは、名前およびアドレス・データの一般的なエラーや非一貫性が自動的に修正されます。また、OracleBI Warehouse Builderには、Match-Merge演算子が用意されており、ビジネス・ルールに基づいて、ソース・データ内の重複するレコードを統合できます。
抽出し、変換したデータは、ターゲットのデータ・ウェアハウスにロードします。ターゲット・ウェアハウス・オブジェクトはOracleBI Warehouse Builderで作成できます。ターゲット・オブジェクトには、「データ・アクセスのためのメタデータ・モデル」に記載されているように、リレーショナルとディメンショナルがあります。
OracleBI Warehouse Builderでは、マッピングによって一連のETL操作が記述されます。そのため、マッピングの作成時に、操作を定義できます。OracleBI Warehouse Builderでは、マッピング・エディタを使用してこれらの操作をグラフィカルに定義することも、スクリプティング・インタフェースを使用してマッピングを作成することもできます。
図2-1に、マッピング・エディタ画面を示します。ここでは、2つのソース・テーブルから連結および変換されたデータを、ターゲットの「Sales」テーブルに移入する方法を定義しています。
OracleBI Warehouse Builderでは、マッピングとともにプロセス・フローを作成します。プロセス・フローでは、マッピングをいつ実行するか、およびマッピングの実行が成功または失敗した後のアクションを指定します。たとえば、電子メール通知を送信したり、FTPコマンドやオペレーティング・システムの実行可能ファイルを実行できます。
トランザクション・データを保存するシステムは、データを収集する目的で設計されています。ビジネス・インテリジェンスは、そのデータを利用し、分析する目的で設計されています。BIのデータ・モデルはソースのデータ・モデルとは異なります。この項では、2つのモデルを比較して説明します。
トランザクション・モデルは、オンライン・トランザクション処理(OLTP)システムで使用されるモデルで、通常は第3正規形(3NF)のリレーショナル・テーブルを中心に構築されます。
OLTPシステムは、トランザクションの保存と処理用にチューニングされています。これらのシステムは、個々のレコードの追加、削除、変更を容易に行える必要があります。また、データベースを効率的かつ正確に更新できるように、システムは正規化されます。トランザクション・モデルはデータを収集するためのモデルです。
ディメンショナル・モデルは、データを収集する目的ではなく、データを意図する方法で取得する目的で設計されます。ディメンショナル・モデルの目的は、データをビジネス・ユーザーに理解できる形で表すことです。ユーザーのデータに対する見方は、ディメンションで捉えることができます。たとえば、セールス・マネージャが「製品、地域、四半期ごとの売り上げデータを見たい」と言う場合があります。ディメンショナル・モデルは、このようなユーザーのビジネスに対する観点を再現します。
ディメンション・データは、「データ構造」に記載されたように、リレーショナル・テーブルにも、マルチディメンション・キューブにも格納できますが、コンセプトは同じです。
ディメンションとは、ビジネス・ユーザーの観点に基づいたデータのカテゴリ化です。たとえば、ユーザーが数値を「〜別」に、または「〜全体」で見たいと言う場合、これはデータのディメンションを特定していることになります。一般的なディメンションは地理、製品、顧客、時間です。
個々の地理的な位置、製品、顧客、時間は、ディメンション値またはディメンション・メンバーと呼ばれます。
Oracle Business Intelligenceは、レポートに応じて様々なデータ構造をサポートします。レポートはトランザクション・データに基づいて作成できますが、分析には、通常、ディメンション・データが必要になります。この項では、トランザクショナル・データとディメンション・データの格納に使用する構造について説明します。
トランザクション・データはリレーショナル・テーブルに格納されます。各テーブルは、顧客、製品、現金出納、取引きなどのリレーショナル・エンティティを表します。エンティティの属性は、テーブル列に格納され、行には個々のレコードが格納されます。たとえば、顧客テーブルでは、顧客の名前と電話番号が別々の列に保存されます。各行には、顧客別のデータが保存されます。
別々のテーブルのデータを結合するには、キー属性を使用します。たとえば、顧客テーブルのデータと、取引きテーブルのデータを結合するには、顧客IDを使用できます。
オンライン・トランザクション処理(OLAP)システムでは、データはこのようなリレーショナル・テーブルに格納されます。データ・ウェアハウスでは、クレンジングされたバージョンのトランザクション・データが第3正規形(3NF)の実表に格納されます。これらの表に格納されるのは、詳細データです。
この詳細データは、データ・ウェアハウスでは直接更新されません。詳細データへの変更は、ETLコードを介して取り込まれます。変更が反映されるのは、ウェアハウスがOLTPシステムからリフレッシュされたときです。
第3正規形は、データが頻繁に更新されるトランザクション・システムで、データの整合性をとるのに適しています。しかし、3NFは、頻繁にクエリーが行われたり、複雑な方法でクエリーが行われるデータには適していません。ビジネス・インテリジェンス・システムは、データの取得用にチューニングされているため、正規化されていない多数のテーブルやビューが含まれています。正規化されていないテーブルでは、クエリーに必要な結合の数を減らすため、最も頻繁に結合する必要がある情報が組み合されています。
スター・スキーマは、ディメンショナル・モデルをリレーショナルに実装したものです。ディメンション・テーブルはディメンション値を保持し、その属性はテーブルの各列に格納されます。ファクト・テーブルには、売上や費用データなどのファクト・データが含まれます。ファクト・テーブルには各ディメンションの外部キーがあり、すべての外部キーのコンポジットがファクト・テーブルの主キーになります。図2-2に、スター・スキーマの構造を示します。
ファクト・テーブルには、通常、詳細データが含まれます。サマリー・データは、通常、非正規形のサマリー・テーブルまたはマテリアライズド・ビューに格納されます。他のリレーショナル・データと同様に、索引によってテーブルに速くアクセスできます。
スター・スキーマはデータ・マートと呼ばれることもあるように、スター・スキーマの作成はデータ・ウェアハウスを作成するうえでの一般的なタスクです。
スター・スキーマはOracleBI Warehouse Builderで作成できます。
アナリティック・ワークスペースでは、ディメンション・モデルの多次元な実装を構成します。この多次元の構造では、ディメンションがキューブのエッジに格納され、キューブの本体にはメジャーとしてのデータが格納されます。図2-3に、キューブの構造を示します。
キューブには、詳細データとサマリー・データが格納され、格納されたデータは解決済または事前計算済であるとみなされます。キューブとは、同じディメンジョンと集計プランを持つメジャーのセットです。
アナリティック・ワークスペースでは、ディメンションはメジャーに対する索引として機能するため、別の索引をデータに作成する必要はありません。ディメンションとメジャーは同じ構造内にあるため、アナリティック・ワークスペースで結合する必要はありません。
アナリティック・ワークスペースは、Analytic Workspace ManagerまたはOracleBI Warehouse Builderを使用して作成できます。キューブの構造を定義し、キューブのソース・データを指定します。スター・スキーマは、アナリティック・ワークスペースのソースとして使用できますが、他のリレーショナル・テーブル、フラット・ファイル、または他のソースを使用して、アナリティック・ワークスペースを移入することもできます。
Oracle Data Miningを使用してデータの隠れたパターンを見つけたり、予測分析を実行する場合は、データ・マイニング分析で考慮されるすべての属性を持った単一のリレーショナル・テーブルまたはビューが必要になります。このテーブルは、他のテーブルと同様に、OracleBI Warehouse Builderを使用して作成できます。
データ・マイニング・テーブルでは、各ケースは、テーブル内の1つの行によって表され、各属性はテーブルの列で表されます。このテーブルのデータは、Oracle Data Miningでサポートされているいずれかのデータ型を持っている必要があります。サポートされる型には、ネスト列やテキスト、およびINTEGER、FLOAT、NUMBER、VARCHAR32、CHARなどの標準のデータ型があります。
また、データ・マイニング・アルゴリズムには、通常、アルゴリズムを起動する前に、データの準備が必要になります。Oracle Data Miningには、次のようなデータ・マイニング固有の変換を実行する変換が含まれます。
極値(上位5%の値など)をすべて極値以下の値(95パーセンタイルの値など)に設定したり、削除するなどの極値の操作
属性の個別値の数を減らすための、関連値のグループ化
属性値が異なる範囲によって不適切な重み付けを受けないように、属性値を共通の範囲に変換する正規化
データ・マイニング・アプリケーションに必要な準備は、データに適用されるモデルの種類によって異なります。
データ・マイニングのためのデータ準備に関する詳細は、『Oracle Data Mining概要』または『Oracle Data Miningアプリケーション開発者ガイド』を参照してください。
データ・ウェアハウスに必要なデータを収集するだけでは十分ではありません。ユーザーがデータを理解でき、ナビゲートできるようなメタデータを提供し、データをサマライズすることによって、レポート用のデータを準備する必要があります。
メタデータの管理は、BI開発における重要なアクティビティです。レポートの作成者がデータを理解したり、ナビゲートしたりできない場合、データのクエリーを適切に行えません。データ・ウェアハウスにクリーンで高品質なデータが含まれていても、適切なメタデータがなければ、どのデータ構造をクエリーに使用すればよいかがわかりません。2人のビジネス・ユーザーがデータに同じ質問を行っても、異なる答えが返ってきます。
ビジネス・インテリジェンスは、サマリーまたは集計データを使用して、ビジネス・ユーザーに最適なクエリー・パフォーマンスを提供します。ビジネス・インテリジェンスでは、どのデータをサマライズし、サマライズしたデータをどのように格納するかを決定します。サマライズするデータは、ビジネス・ユーザーのニーズによって異なります。
サマライズしたデータの構造は、レポートに使用するメタデータ・モデルによって異なります。リレーショナル・データ・ウェアハウスを使用する場合、サマリー・データは、通常は詳細データとは別のマテリアライズド・ビューに格納できます。Oracle OLAPを使用する場合、サマリー・データは、サマライズするデータも含まれたアナリティック・ワークスペースに格納できます。
OracleBI Warehouse Builderは、メタデータの作成と管理、およびサマリーの作成のためのサポートを提供します。また、Analytic Workspace Managerは、サマリー・データが含まれたアナリティック・ワークスペースの作成をサポートします。リレーショナル・レポートの場合、OracleBI Discoverer Administratorが、メタデータの作成と、サマリー・データの管理をサポートします。
リレーショナル・データにOracleBI Discoverer Plus RelationalまたはOracleBI Discoverer Viewerを使用した場合、リレーショナル・メタデータを使用してデータにアクセスし、そのデータをスター・スキーマ、3NFテーブル、または他のリレーショナル・テーブルに格納できます。Discovererマネージャは、そのメタデータにEnd User Layer(EUL)を作成します。
EULによって、ユーザーはデータベースの複雑さから解放されます。EULには、ビジネスエリアが含まれ、これによって、特定のユーザーのためのフォルダがグループ化されます。ビジネスエリアのフォルダは、レポート作成時の結果セットを表します。フォルダは、テーブル、テーブルのセット、またはクエリーを表すことができます。フォルダのアイテムは、結果セットの列を表します。
EULには、次のものも含まれます。
ドリル・ナビゲーションのための階層
テーブルまたはビューを接続する結合
レポート用にデータをフィルタする条件
ビジネス・ユーザー用に作成されるユーザー定義アイテム
OracleBI Discoverer Administratorを使用すると、EULを作成、管理したり、様々なビジネスエリアへのアクセスを制御できます。また、OracleBI Warehouse Builderでリレーショナル・メタデータを作成したり、そのメタデータを、OracleBI Discoverer Administratorが読み取れるEULにエクスポートできます。
EULの作成および管理の詳細は、『Oracle Business Intelligence Discoverer管理ガイド』を参照してください。
OracleBI Discoverer Plus OLAP、OracleBI Spreadsheet Add-In、またはOracleBI Beansが含まれたカスタム・アプリケーションを使用する場合は、OLAPメタデータを使用して、通常はアナリティック・ワースクペースに格納されるディメンション・データにアクセスできます。ディメンション・データ以外に、アナリティック・ワークスペースは、OLAPメタデータを格納し、このメタデータで、ユーザーに使用可能なディメンションやメジャーを定義できます。キューブとは、同じディメンジョンと集計プランを持つメジャーのセットです。
OLAPメタデータには、次のものが含まれます。
集計やドリル・ナビゲーションのための階層
レポートでデータをフィルタする保存済選択
ビジネス・ユーザーのためのユーザー定義アイテム
「データ構造」に記載しているように、アナリティック・ワークスペースには結合が必要ありません。
OracleBI Warehouse BuilderまたはAnalytic Workspace Managerを使用すると、アナリティック・ワークスペースを作成できます。
ディメンション・データがスター・スキーマ内にある場合、OLAPメタデータはOLAPカタログに格納できます。このメタデータは、OracleBI Warehouse Builderを使用して作成できます。OLAPメタデータを使用するほとんどのビジネス・インテリジェンス・システムでは、パフォーマンスを向上させ、より多くのアナリティック機能を使用するために、アナリティック・ワークスペースが使用されます。
アナリティック・ワークスペースとOLAPカタログの詳細は、『Oracle OLAP アプリケーション開発者ガイド』を参照してください。
Oracle Business Intelligenceでは、リレーショナル・メタデータやOLAPメタデータを介してデータにアクセスできます。選択するモデルは、要因の数によって異なります。この項では、2つのモデルの基本的な違い、およびこれらの違いの意味について説明します。
リレーショナル・モデルでは、階層には高い柔軟性があります。リレーショナル・テーブルまたはビューの属性は、階層内のレベルとして機能します。階層内の値は複数の親を持てるため、階層レベル間で多対多(M:M)の関係を持つことが可能です。たとえば、図2-4に示すように、年から四半期へドリルできます。
また、リレーショナル階層では、図2-5に示すように、ユーザーは四半期から年にドリルできます。
この階層の柔軟性により、属性をクロス集計レポートの任意の場所に配置できます。たとえば、図2-6のようなレポートを作成できます。
OLAPモデルでは、階層はさらに厳密な構造になります。OLAP階層では、すべてのレベルは同じディメンションにある必要があり、しかも1つのディメンションに対して複数の階層を定義できても、各ディメンション値は階層内で1つの親しか持つことができません。親は、子の集計を表します。OLAP階層では、1対多(1:M)の関係しか持てません。
OLAPモデルの構造化階層では、階層レベルの配置が制限されます。たとえば、すべての時間レベルは、クロス集計の1つのエッジに配置する必要があります。図2-4のようなレポートを作成できますが、OLAPモデルを使用する場合は、図2-5や図2-6の示ようなレポートは作成できません。また、時間レベルから地理レベル、さらに別の時間レベルへとドリルできません。
この厳密なOLAP階層により、OLAPエンジンは強力な分析機能を効率的に実行できます。OLAP階層は、特に時系列分析やシェア計算に適しています。
データ集計はクエリーの一部として行ったり、データを事前集計したりできます。集計には時間がかかるため、集計を行うと、ロード時間やクエリー時間に影響します。事前集計によって、データ構造を移入する時間が長くなりますが、クエリーがデータを返す時間が短くなります。また、事前集計には、集計されたデータを格納する領域も必要です。
リレーショナル・モデルでは、事前集計データは、サマリー・テーブルとマテリアライズド・ビューに格納されます。リレーショナル階層は柔軟性が高いため、異なる種類のサマリーはほぼ無制限に生成できます。実際には、事前集計されたサマリー・テーブルまたはマテリアライズド・ビューによってサポートされるのは、特定のクエリーやクエリーのグループであるのがほとんどです。自動サマリー管理は、Oracle DatabaseまたはOracleBI Discoverer Administratorによって調整できます。自動サマリー管理では、最も頻繁に実行されるクエリーに基づいて、サマリーは自動的に作成されます。
階層の柔軟性が低いOLAPモデルでは、サマリーが作成される可能性は少なく、可能性のあるサマリーはすべてアナリティック・ワークスペースに作成されます。集計プランでは、どれくらいの集計をアナリティック・ワークスペースに格納し、どれくらいの集計をクエリー時に実行するかを決定します。レポート・ツールに対しては、アナリティック・ワークスペースは事前集計とみなされます。通常、OLAP実装には、完全に事前集計されたアナリティック・ワークスペースが使用されます。
オラクル社では、ロード・パフォーマンスとクエリー・パフォーマンスのどちらも継続的に改善していますが、様々な構成を行ってテストすることで、パフォーマンスにどのようなトレードオフがあるかを確認できます。
これ以外の集計の違いによる影響は、あまり明白ではありません。レポートにおける階層データの表示には関係があります。リレーショナル・モデルでは、集計はクエリーの一部として行われるため、データをフィルタし、フィルタ済データにのみ基づいてその結果を集計できます。
表2-1に、データがフィルタされ、集計されたクエリーの結果を示します。選択した都市の売上合計は、地域値に集計されています。米国東部の売上値($35,000)は、選択した米国東部地域の都市の売上値(ニューヨークシティの$20,000、アトランタの$15,000)の合計です。同様に、米国中部の売上値($40,000)は、選択した米国中部地域の都市の売上値(シカゴの$18,000、ヒューストンの$9,000、カンザスシティの$13,000)の合計です。
表2-1 集計前のフィルタ処理の例
地域と都市 | 売上 |
---|---|
米国東部 |
$35,000 |
ニューヨーク |
$20,000 |
アトランタ |
$15,000 |
米国中部 |
$40,000 |
シカゴ |
$18,000 |
ヒューストン |
$9,000 |
カンザスシティ |
$13,000 |
OLAPモデルの事前集計データでは、階層内の特定のレベルのデータ値は、常に、そのレベルの子すべての値の合計であり、レポートに表示される子にはかかわりません。表2-2に、事前集計されたデータに対する同じ種類のクエリーの結果を示します。このテーブルでは、米国東部の売上は、ボストン、フィラデルフィア、バルチモアなど、その地域のすべての都市の売上合計として事前集計されます。同様に、米国中部の合計には、レポートに表示されていない都市の売上値が含まれています。
表2-2 ファイルタ処理前の集計の例
地域と都市 | 売上 |
---|---|
米国東部 |
$129,000 |
ニューヨーク |
$20,000 |
アトランタ |
$15,000 |
米国中部 |
$85,000 |
シカゴ |
$18,000 |
ヒューストン |
$9,000 |
カンザスシティ |
$13,000 |
OracleBI Discoverer Plus Relationalのレポートでは、SQLクエリーを作成し、ユーザーがデータのドリルやソートを行わない静的レポートで、データを最初に集計してからフィルタすることが可能です。OracleBI Discoverer Plus OLAPでのレポートの場合、レポートに表示されるディメンション値のみの小計の行または列を追加して、ユーザーがレポートの回転やドリルを行えるようにできます。
リレーショナル・モデルでは、集計と同様にユーザー定義アイテムはクエリーで定義します。計算の結果は、サマリー・テーブルまたはマテリアライズド・ビューに格納できます。Discovererマネージャはユーザー定義アイテムをEULで作成し、複数のユーザーがユーザー定義アイテムを利用できるようにできます。また、レポートの作成者は、OracleBI Discoverer Plus Relationalでユーザー定義アイテムを作成できます。
OLAPモデルでは、ユーザー定義アイテムはメジャーであり、他のメジャーと同様に扱われます。ユーザー定義アイテムは、他のメジャーと同様に作成できます。また、レポートの作成者は、OracleBI Discoverer Plus OLAP、OracleBI Spreadsheet Add-In、およびOracleBI Beansで作成されるアプリケーションでユーザー定義アイテムを作成することもできます。
特に、時系列分析やシェア計算などの高度なユーザー定義アイテムでは、OLAPモデルでの作成が容易になり、実行も速くなります。リレーショナル・モデルでは、これらのユーザー定義アイテムには、データに複数のパスが必要になります。
また、OLAPエンジンは、what-if分析、予測および割当てのために高度なモデリングをサポートします。
Oracle Data Miningでは、大量のデータを分析して、データ内の隠れたパターンを見つけたり、データから新しい観点を見つけたりできます。Oracle Data Miningでは、ビジネス・ユーザーは、最も利益の高い顧客の特性を見つけたり、不正を検出したり、顧客が解約する傾向を予測できます。
Oracle Data Miningでは、データ分析者とアプリケーション開発者は、データ・マイニング・モデルを作成し、特定の分析を実行できます。異なる分析には異なるアルゴリズムによって、異なるデータマイニング・モデルを生成する必要があります。これらのモデルには、データ内で見つかったパターンや、データから起こりえる結果を予測するパターンが含まれます。
モデルの開発は、反復プロセスです。モデルがデプロイされた後でも、新しいデータや追加データによって作成しなおす場合があります。
Oracle Data Miningは、次のようなデータ・マイニング機能をサポートします。
分類: アイテムを別々のクラスにグループ化し、ケースがどのクラスに属すかを予測します。たとえば、価値の高い顧客に属したり、解約の可能性のある顧客に属す場合があります。
異常検出: 正常なデータの特性を満たさないアイテム(異常値)を特定します。これには、Oracle Database 10.2が必要です。
特徴抽出: 5000個の変数セットを管理しやすい50個の変数セットに減らすなど、元の属性の組合せとして数の少ない新しい属性(特徴)のセットを作成します。
Oracle Data Minerにより、データ・モデルとデータ・マイニング・アプリケーションの作成が容易になります。Oracle Data Minerでは、ウィザードの指示に従って、データの準備、モデルの作成と評価、およびモデル・スコアリングを行えます。Oracle Data Minerでは、分析者がデータ・マイニング・モデルを作成するためにSQLやJavaを学ぶ必要がなくなります。分析者はデータ・マイニング・プロセスを通してマイニング・アクティビティを学べます。
レポートを作成するツールの選択は、ビジネス・インテリジェンスの実装の成功に大きな影響を与えます。ビジネス・ユーザーが必要とする最も高度なレポートを作成できる強力なツールを選ぶ必要があります。また、ビジネス・ユーザーが自分でレポートを作成できるツールを選ぶことも必要です。
Oracle Business Intelligenceには、最も高度な企業レポートから、誰でも作成できる簡単なワークシートまで、レポートを作成するための様々なツールが用意されています。この項では、これらのツールについて説明します。
Oracle Reportsは、各種のデータ・ソースから用途に応じた高品質なレポートを作成できる強力な企業レポーティング・ツールです。Oracle Reportsを使用すると、あらゆるビジネス・アクティビティに関する様々なレポートを作成できます。たとえば、Oracle Reportsを使用して、請求書、定型レター、梱包表、出荷ラベル、財務諸表、営業報告書のほか、年次報告書のような高品質なプレゼンテーション資料を作成できます。
Reports Builderは、Oracle Reportsの開発コンポーネントです。これにより、レポート・スペシャリストは、レポートのフォーマットや出力を詳細に設定し、入力情報として様々なデータ・ソースを利用できます。Reports Builderでは、JDBCやXMLなどのプラッガブル・データ・ソース(PDS)によって、ほぼどのようなデータ・フォーマットにもアクセスできます。
Reports Builderは、異なるフォーマットのテーブルやグラフ、テキスト、イメージ、バー・コードなど、数多くのレポート・オブジェクトを提供します。エディタも用意されているため、レポート・スペシャリストはペーパー・レポート・レイアウトをWYSIWYGモデルで変更できます。ウィザードとデフォルトのレポート・テンプレートを使用すると、迅速なレポートの作成が可能になります。また、テンプレートはカスタマイズできるため、最大限の柔軟性を得ることができます。
Oracle Reportsでは、HTML、HTMLCSS、XML、PDF、PCL、PostScript、ASCIIなどの数多くの出力フォーマットをサポートしているため、ユーザーが希望するどのようなフォーマットでもレポートを出力できます。
Oracle Reportsは強力なレポート・ツールです。通常、Oracle Reportsを使用してレポートを作成、管理し、作成したレポートをビジネス・ユーザーに配布する作業は、IT部門のレポート・スペシャリストが担当します。
OracleBI Discoverer Plusは、直感的でわかりやすいデータ分析およびレポート作成ツールです。OracleBI Discoverer Plusでは、ユーザーがデータを分析したり、組織内の他のユーザーと共有したりすることが簡単に行えます。OracleBI Discoverer Plusで作成したレポートは、OracleBI Discoverer ViewerやOracleAS Portalダッシュボードのポートレットとして、Webブラウザで簡単に表示できます。また、OracleBI Discoverer Plusレポートは、Microsoft Excelに出力したり、エクスポートする操作も簡単に行えます。
OracleBI Discoverer Plusレポートは、ワークシートとして、ユーザーが共有するワークブックに編成できます。ワークシートには、テーブルやクロス集計、グラフのほか、タイトルや説明用テキストを追加できます。
対話型モデルであるため、レポートのレイアウトやコンテンツを変更する場合は、データを直接操作できます。レポートの作成者と受信者は、データのドリル、ピボット、ソートを行えるため、ユーザーがビジネス・インテリジェンスに期待するスライス・アンド・ダイス機能が可能になります。ウィザードが用意されているため、新しいユーザーでもクエリーの作成やレポート作成タスクを簡単に行うことができます。
OracleBI Discoverer Plusには、ストップライト・フォーマットのように、条件付フォーマットをデータに適用する機能など、強力な分析機能が備わっています。OracleBI Discoverer Plusでは、同じワークシートにデータを数値的に表示したり、グラフィック的に表示できます。テーブルとグラフ、またはクロス集計とグラフは、同じクエリーを共有します。また、数値フォームのみを表示したり、グラフのみを表示できます。
OracleBI Discoverer Plus Relationalでは、レポート・スペシャリストは、パラメータをレポートに追加できるため、同じレポートでも、関心のあるデータを選択できるようにパラメータを設定すれば、異なる顧客に使用することができます。
OracleBI Discoverer Plus OLAPでは、ユーザーはOLAPエンジンにアクセスし、高度な時系列分析やシェア計算などを実行できます。
OracleBI Discoverer Plus RelationalとOracleBI Discoverer Plus OLAPのどちらを使用しても、ユーザー・インタフェースはほとんど変わりません。
図2-7に、Discoverer Plus Relationalによって生成されるレポートを示します。このレポートでは、円グラフやテーブルを横並びで使用できます。
図2-7 Discoverer Plus Relationalのテーブルおよび円グラフのサンプル
図2-8に、Discoverer Plus OLAPで作成したレポートのサンプルを示します。このレポートにはクロス集計があり、その下にはグラフがあります。
OracleBI Discoverer Plusは、レポート・スペシャリストが他のユーザーのために高度な分析レポートを作成できる強力なツールですが、使い方が簡単であるため、ビジネス・ユーザーが自分自身のレポートを作成することもできます。直感的なユーザー・インタフェースにより、ビジネス・ユーザーはデータを選択、調整したり、スポットライト・レポートなどの条件付フォーマットを適用したりできます。
OracleBI Spreadsheet Add-Inにより、分析者は、Microsoft Excelでディメンション・データを操作できます。Add-Inは、アナリティック・ワークスペースへのアクティブな接続を介してデータをフェッチし、そのデータをスプレッドシートに表示します。分析者は、このAdd-Inを使用して、ドリル、回転、データ選択などのOLAP操作を実行できます。
OracleBI Spreadsheet Add-Inでは、ユーザー定義アイテムをアナリティック・ワークスペースで定義し、ユーザー・コミュニティーで共有できます。OLAP計算はデータベース内で素早く効率的に実行されるため、大量のデータをExcelにダウンロードする必要はありません。
図2-9に、Excelスプレッドシートに挿入したOracleデータを示します。OracleBIメニューがメニュー・バーに追加されていることに注意してください。
OracleBI Spreadsheet Add-Inは、OracleBI Discoverer Plus OLAPと同じクエリー・ウィザードと計算ウィザードを使用します。分析者は、これらのウィザードを使用して、リストからデータを選択したり、例外データを選択できます。また、カスタム・メジャーを作成することもできます。
分析者は、通常のスプレッドシート・データと同様にOracleデータを処理できます。たとえば、式およびグラフをExcelで作成できます。その結果、Oracle OLAPの強力な分析機能とExcelの標準的な計算および書式設定が結合されます。
Oracle Spreadsheet Add-In for Predictive Analyticsでは、簡易化されたユーザー・インタフェースを介して、Microsoft Excelで自動データ・マイニングによる分析を行うことができます。ビジネス・ユーザーは、簡単な予測および説明機能を使用して、OracleやExcelのデータをマイニングできます。予測分析により、データ・マイニングを簡単にする、自動化された方法が実行できます。
説明機能により、ユーザーは、「価値の高い顧客」などのターゲット属性に対して最も大きな影響を持つ属性を識別して、データの分析力を深めることができます。説明は、このような属性のデータを検索し、検索したデータを順位別にランキングし、その結果をExcelで表示します。説明を使用すると、たとえば、価値の高い顧客や、競合者に切り替わる顧客などに最も関連した属性を識別できます。
予測機能では、ユーザーが観察したデータやデータの隠れたパターンに基づいて予測を立てることができます。この予測によって、データを掘り下げ、予測モデルを作成し、そのモデルをデータに適用できます。予測を使用すると、テーブルやExcelスプレッドシートのレコードが、製品を購入する可能性のある顧客などの特定のクラスに属すかどうかを予測できます。また、予測を使用すると、どの顧客が組織に対して最も高いライフタイム価値を持っているか、またはどの人が最も不正を行いやすいかなどを予測することもできます。
Oracle Spreadsheet Add-In for Predictive Analyticsは、ビジネス分析者の間で幅広く使用されています。
Oracle Business Intelligenceのレポート作成ツールは、幅広いレポートを網羅しています。ただし、場合によっては、カスタム・アプリケーションが必要になることもあります。たとえば、Webアプリケーションのコーポレート・ルック・アンド・フィールに合せたレポートが必要になる場合があります。あるいは、予測、what-if分析、割当てなど、OracleBI Discoverer Plus OLAPでは公開されない高度なOLAP機能へのアクセスが必要になる場合もあります。
OracleBI Beansは、JavaベースやWebベースのアプリケーション開発のために、Oracle JDeveloperに統合された標準ベースのJavaBeansのセットです。アプリケーション開発環境には、Java Server Pages(JSP)用の豊富なタグ・セットが含まれており、分析用のWebアプリケーションを容易に作成できます。これらのアプリケーションには、対話型ユーザー・インタフェースや詳細なレポートへのドリル、Oracle OLAP分析機能などの高度な機能を取り入れることができます。
図2-10に、OracleBI Beansを使用して作成したカスタム・ダッシュボード・アプリケーションを示します。アプリケーションには2つのグラフがあります。
バブル・グラフは利益幅分析を示します。バブルのサイズは販売収益を示します。
折れ線グラフは、いくつかの異なる予測を示しています。各折れ線グラフは、異なる予測方法を示しています。予測には、Oracle OLAPの分析エンジンを使用しています。
OracleBI Beansで作成したWebアプリケーションは、IBM WebSphereなどの様々なWebサーバーに配置できます。また、OracleBI Beansを使用してJavaアプリケーションを作成することもできます。
OracleBI Beansは、Oracle JDeveloperとシームレスに統合し、カスタム・ビジネス・インテリジェンス・アプリケーションを作成するための生産性の高い開発環境を提供します。JDeveloperとBI Beansを使用すると、インターネット・アプリケーションを素早く簡単に作成できます。
Oracle Business Intelligenceは、BIソリューションをデプロイする様々な方法をサポートします。レポートは印刷物、Web、電子メールなどを介して配布できます。カスタマイズ可能なポータル・ページを作成して、他のソースの株価などのデータとともに、様々なソースのBIデータを表示することもできます。
この項では、BIレポートを配布するためにOracle Business Intelligenceから提供されている各種オプションについて説明します。
OracleAS Portalは、統合された企業ポータルを作成、配置、管理できるOracle Application Serverのコンポーネントです。OracleAS Portalにより、セルフサービス型コンテンツ管理と公開、ウィザードベースの開発のほか、拡張可能なフレームワークでのWebサービスのデプロイ、公開、利用が可能になります。
OracleBI Discoverer Portlet Providerにより、OracleBI DiscovererレポートをOracleAS Portalのダッシュボードに簡単に配布できます。OracleBI Discoverer Portlet Providerを使用すると、OracleBI Discoverer Plusで作成したワークシートを表示できます。また、OracleBI Discoverer Portlet Providerを介して、データをゲージとして表示することもできます。
OracleBI Discoverer Portlet Providerは、OracleAS Portalにポートレットを提供します。提供するポートレットには次の3種類があります。
ワークシートのリスト・ポートレットは、OracleBI Discovererワークブックやワークシートへのリンクのリストを表示します。ユーザーがワークシート・リンクをクリックすると、OracleBI Discoverer Viewerにワークシートが表示され、対話型分析を行うことができます。
ワークシート・ポートレットは、ワークシートの実際のコンテンツをポータル・ページに配置します。ワークシート・ポートレットには、数値データ(テーブルまたはクロス集計)やグラフ、またはその両方を表示できます。ユーザーが分析リンクをクリックすると、OracleBI Discoverer Viewerにワークシートが表示され、対話型分析を行うことができます。
ゲージ・ポートレットは、ポータル・ページにゲージを表示できます。ゲージを使用すると、キー・パフォーマンス・インジケータが設定された範囲内のどの位置にあるかを簡単に表示できます。また、分析リンクもゲージに利用できます。
図2-11に、OracleAS Portalのダッシュボードに表示されたワークシートとゲージのサンプルを示します。
図2-11 OracleBI Discoverer Portletを使用したOracleAS Portalダッシュボード
OracleBI Discoverer Viewerは、ビジネス・ユーザーがプラグインやアプレット・コードをダウンロードしなくても、OracleBI Discovererワークブックに対話型のアクセスを行えるHTML Webアプリケーションです。
OracleBI Discoverer Viewerでは、ビジネス・ユーザーは、他のユーザーがOracleBI Discoverer Plusで作成したレポートと対話できます。ユーザーは、クロス集計やグラフをドリルして基本的なデータを表示および分析できるため、ビジネスの傾向や異常を識別できます。レポートに使用されているグラフの種類を変更したり、データをピボットしたり、スポットライト・フォーマットを追加して傾向を判断することもできます。また、レポートの都市の選択を変更して、特定の都市(ニューヨークなど)の上位5製品を表示するなど、パラメータが指定されているレポートをカスタマイズできます。
OracleBI Discoverer Viewerでは、ビジネス・ユーザーがExcel、HTML、PDFまたは他の一般的なファイル・フォーマットでレポートをエクスポートし、これらのファイルをOracleBI Discoverer Viewer内から電子メールの添付として送信することで、分析結果を共有できます。
OracleBI Discoverer Viewerは、OracleAS Portalと統合されているため、ユーザーはOracleBI Discovererポートレットから容易にアクセスできます。ダッシュボードからOracleBI Discoverer Viewerにドリルダウンして、詳細な分析を実行できます。
図2-12に、OracleBI Discoverer Viewerに現在表示されている図2-11のダッシュボードからのクロス集計を示します。
図2-12 ユーザー設定可能なパラメータを使用したOracleBI Discoverer Viewerレポート
Oracle Reportsを使用すると、レポートを様々なフォーマットで配布できます。あらゆるOracle Business Intelligenceツールの中でも、Oracle Reportsは最も豊富な出力フォーマットを備えています。高品質な出力レポートや高品質なWebレポートを作成できます。Oracle Reportsは、HTML、HTMLCSS、XML、PDF、PCL、PostScript、ASCIIなどの標準の出力フォーマットをサポートしています。
Oracle Reportsでは、同じレポートを複数のフォーマットで配布したり、レポートを1回実行するだけで複数の宛先に配布できます。配布する場合は、レポート全体を配布したり、レポートの個別のセクションを配布できます。たとえば、レポートを1回実行するだけで、HTML出力を生成し、PostScriptバージョンをプリンタに出力し、レポートの一部または全部のセクションを配布リストに電子メールで送信できます。
XMLを使用したレポートの配布は、Oracle Reportsのダイアログや、コマンド・ライン・インタフェースを使用して定義できます。