用語集
分析ビュー
ファクト・データの集計、計算および結合をカプセル化するビューのタイプ。分析ビューは、ディメンション・モデルを使用してデータを編成します。これらを使用すると、集計および計算をデータ・セットに簡単に追加でき、比較的単純なSQLで問い合せることができるデータをビューに表示できます。
属性ディメンション
データ・ソース、および属性ディメンションの属性であるデータ・ソースの列を指定します。メンバーのレベルを指定して、レベル間の属性リレーションシップを決定します。属性ディメンションは、階層および分析ビューによって使用されます。
カーディナリティ
OLTPの観点では、表内の行数を指します。データ・ウェアハウスの観点では、一般に、列内の個別値の数を指します。データ・ウェアハウスのほとんどのDBAにとっては、カーディナリティ度のほうがより重要な問題点です。
コモン・ウェアハウス・メタデータ(CWM)
Oracleデータ・ウェアハウスおよび意思決定支援で使用される標準リポジトリ。CWMリポジトリ・スキーマは他の製品が共有できるスタンドアロン製品で、それぞれ、その製品が作成するCWMリポジトリ内のオブジェクトのみを所有します。
クロス積
複数セットの要素群を組み合せる方法。たとえば、2つの列がある場合、最初の列の各要素は2番目の列の各要素と組み合せられます。単純例を次に示します。
Col1 Col2 Cross Product ---- ---- ------------- a c ac b d ad bc bd
クロス積は、グルーピング・セットの連結時に行われます。データ・ウェアハウスにおける集計のためのSQLを参照してください。
データ・マート
販売、マーケティング、金融など、特定のビジネス分野に対して設計されたデータ・ウェアハウス。依存型のデータ・マートの場合、データは企業全体のデータ・ウェアハウスから導出されます。非依存型のデータ・マートの場合、データはソースから直接収集されます。
データ・ウェアハウス
トランザクション処理用ではなく、問合せおよび分析用に設計されたリレーショナル・データベース。データ・ウェアハウスには、通常、トランザクション・データから導出された履歴データが含まれますが、別のソースからのデータを含めることもできます。データ・ウェアハウスにより、分析ワークロードとトランザクション・ワークロードを分離できます。また企業は、複数のソースのデータを統合できるようになります。
データ・ウェアハウス環境は、リレーショナル・データベースに加え、ETLソリューション、分析SQLエンジン、クライアント分析ツール、およびデータ収集とビジネス・ユーザーへのデータ配信の処理を管理するその他のアプリケーションで構成されることが多いです。
カーディナリティ度
表内の列の個別値の数を表内の行の合計数で割ったものです。これは、作成する索引を決定する際に特に重要です。通常、カーディナリティ度の低い列にはビットマップ索引、カーディナリティ度の高い列にはBツリー索引を使用します。原則として、カーディナリティ度が1%未満の場合にビットマップ索引を使用します。
ディメンション
一般に、2通りの方法で使用されます。
-
データセットのメンバーを指定するために使用される特性を示す一般的な用語。売上指向のデータ・ウェアハウスにおける最も一般的なディメンションは、時間、地理および製品の3つです。ほとんどのディメンションが階層を持ちます。
-
問合せがディメンションをナビゲートできるようにデータベース内に定義されたオブジェクト。Oracle Database 10gの場合、ディメンションは、1組の列セット間の階層(親/子)関係を定義するデータベース・オブジェクトです。Oracle Expressの場合、ディメンションは値リストで構成されるデータベース・オブジェクトです。
ELT
ELTは、Extraction(抽出)、Loading(ロード)、Transformation(変換)およびTransportation(転送)の略です。これは、古いETLの最新バージョンです。
ETL
ETLは、Extraction(抽出)、Transformation(変換)およびLoading(ロード)の略です。ETLとは、ソース・データにアクセスして操作を行い、データ・ウェアハウスへロードする方法を意味します。これらの処理の実行順序は様々です。
ETLのかわりに、ETT(extraction, transformation, transportation)やETM(extraction, transformation, move)が使用される場合もあります。
ファクト
調査や分析の対象となるデータで、通常は数値データや加算的データ。たとえば、販売価格、原価、収益などがこれに該当します。ファクトとメジャーは同じ意味で、ファクトは主にリレーショナル環境で使用され、メジャーは主に多次元環境で使用されます。導出ファクト(またはメジャー)は、算術演算やデータ変換を使用して既存のデータから生成されます。
階層
データを編成する手段として順序付けされたレベルを使用する論理構造。データ集計を定義するために使用できます。たとえば、時間ディメンションでは、階層を使用して月レベルから四半期レベル、年レベルへとデータを集計できます。階層は、Oracleでディメンション・オブジェクトの一部として定義できます。また、ドリル操作のナビゲーション・パスの定義にも使用できますが、この場合、階層内のレベルは必ずしも集計された合計を示している必要はありません。
階層は、属性ディメンションのレベル間の階層関係を定義するビューのタイプであるデータ・ディクショナリ・オブジェクトである場合もあります。属性ディメンションおよび階層は、分析ビューのディメンション・メンバーを提供します。
マテリアライズド・ビュー・ログ
特定のマテリアライズド・ビューに関する詳細を記録するログ。高速リフレッシュを使用するにはマテリアライズド・ビュー・ログが必要ですが、パーティション・チェンジ・トラッキング・リフレッシュの場合は例外です。
メタデータ
データおよびその他の構造(オブジェクト、ビジネス・ルール、ビジネス・プロセスなど)を記述するデータ。たとえば、データ・ウェアハウスのスキーマ設計は、通常、メタデータとしてリポジトリに格納され、データ・ウェアハウスの作成と移入に使用するスクリプトを生成するために使用されます。メタデータはリポジトリに含まれます。
データの例: ソースからターゲットへの変換に関する定義、データ・ウェアハウスの作成と移入に使用されます。情報の例: 表、列、関連項目の定義、関連するモデル・ツール内に格納されます。ビジネス・ルールの例: 1,000個を販売した後10パーセントの値引を行います。
正規化
リレーショナル・データベースにおいて、データを複数の表に分離することによりデータの冗長性を取り除くプロセス。「非正規化」と対比してください。
データを複数の表に分割し、データの冗長性を排除する処理。
オンライン・トランザクション処理(OLTP)
オンライン・トランザクション処理。OLTPシステムは、高速で信頼性の高いトランザクション処理用に最適化されています。データ・ウェアハウス・システムに比べると、ほとんどのOLTPシステムには、比較的少数の行と多数の表のグループが含まれます。
スキーマ
関連するデータベース・オブジェクトの集まり。リレーショナル・スキーマは、データベース・ユーザーIDでグルーピングされ、表やビューなどのオブジェクトを含みます。このマニュアルでは、sh
というサンプル・スキーマを使用しています。特殊なタイプのスキーマとして、スノーフレーク・スキーマおよびスター・スキーマの2つがあります。
スライスおよびダイス
データの取得および操作を指す非公式用語。データ・ウェアハウスは、それぞれの軸がディメンションを表したデータのキューブ(立方体)と見ることができます。データをスライスするとは、ディメンションの一部または全部のメジャーと値を指定してキューブのピース(スライス)を取得することです。データ・スライスの取得時に、スライスを細切れ(ダイス)したように多数の小さなピースにし、データ列と行を移動したり並べ替えることもできます。適切にスライスおよびダイスされたシステムでは、大量のデータのナビゲーションが容易になります。
SQLアクセス・アドバイザ
SQLアクセス・アドバイザは、ユーザーが目標とするパフォーマンスを実現できるように、特定のワークロードに適切なマテリアライズド・ビューのセット、マテリアライズド・ビュー・ログ、パーティション、索引を推奨します。Oracle Enterprise ManagerのGUIであり、DBMS_ADVISOR
パッケージと同様の機能を持ちます。
第3正規形スキーマ
OLTPシステムで一般的に使用されているものと同じ種類の正規化を使用するスキーマ。大規模なデータ・ウェアハウス、特に、データのロード要求が多く、データ・マートへのデータの入力および長時間実行問合せの実行に使用される環境用として選択されることがあります。「スノーフレーク・スキーマ」および「スター・スキーマ」と比較してください。