Essbaseデータ・ロードのステージ

データ・ロード・プロセスのステージを理解し、タスクを最適化および並列化する方法を習得すると、Essbaseブロック・ストレージ(BSO)キューブへのデータ・ロードのパフォーマンスを向上させることができます。

この項は、集約ストレージ・キューブには適用されません。

Essbaseキューブに大量のデータをロードすると、時間がかかる場合があります。Essbaseがソース・データの読取りおよび解析に費やす時間、およびキューブに対する読取りおよび書込みに費やす時間を最小化して、プロセスを短縮できます。

Essbaseでは、データはブロックごとにロードされます。疎ディメンション・メンバーの一意の組合せごとに、1つのデータ・ブロックにすべての密ディメンションの組合せのデータが含まれます(少なくとも1つのセルにデータが含まれていることが前提です)。ブロックの場所へのアクセスを高速化するために、Essbaseではインデックスが使用されます。インデックスの各エントリは、1つのデータ・ブロックに対応します。疎ディメンションと密ディメンション密ディメンションと疎ディメンションの選択および密と疎の選択のシナリオを参照してください。

Essbaseは、5つのステージのパイプラインでデータ・ロードを処理します。

フリー・フォームのデータ・ロードの場合、ステージは次のとおりです。

  1. 入力Essbaseが、ファイルまたはSQL接続から入力を収集します

  2. トークン化Essbaseが、レコードから入力フィールドを分離して、トークンを作成します

  3. 変換Essbaseが、トークンをメンバー・アイテムに変換します

  4. 準備Essbaseが、データをブロックに振り分ける準備として、データを整理します

  5. 書込みEssbaseが、データをメモリーのブロックに振り分けて、疎の交差に基づくポインタで構成されるインデックスを使用してディスク上の正しいブロックを見つけ、ブロックをディスクに書き込みます

ルール・ファイル・ベースのデータ・ロードの場合、ステージは次のとおりです。

  1. 入力Essbaseが、ファイルまたはSQL接続から入力を収集します

  2. 事前ルールEssbaseがデータ・ロード・レコードを読み取ります

  3. ルールEssbaseが、ルール・ファイルに埋め込まれたルールをデータ・ロード・レコードに適用します

  4. 準備Essbaseが、データをブロックに振り分ける準備として、データを整理します

  5. 書込みEssbaseが、データをメモリーのブロックに振り分けて、疎の交差に基づくポインタで構成されるインデックスを使用してディスク上の正しいブロックを見つけ、ブロックをディスクに書き込みます

ノート:

集約ストレージ・データベースでは、5番目のステージは適用されません。

このプロセスは、すべてのデータがロードされるまで繰り返されます。各ステージで1つ以上の処理スレッドを使用することで、Essbaseではいくつかのプロセスを並列で実行できます。「並列データ・ロード」を参照してください。

この章の例は、「データ・ソース」のトピックに示した情報を十分に理解していることを前提としています。