Essbaseデータ・ロードのステージ
データ・ロード・プロセスのステージを理解し、タスクを最適化および並列化する方法を習得すると、Essbaseブロック・ストレージ(BSO)キューブへのデータ・ロードのパフォーマンスを向上させることができます。
この項は、集約ストレージ・キューブには適用されません。
Essbaseキューブに大量のデータをロードすると、時間がかかる場合があります。Essbaseがソース・データの読取りおよび解析に費やす時間、およびキューブに対する読取りおよび書込みに費やす時間を最小化して、プロセスを短縮できます。
Essbaseでは、データはブロックごとにロードされます。疎ディメンション・メンバーの一意の組合せごとに、1つのデータ・ブロックにすべての密ディメンションの組合せのデータが含まれます(少なくとも1つのセルにデータが含まれていることが前提です)。ブロックの場所へのアクセスを高速化するために、Essbaseではインデックスが使用されます。インデックスの各エントリは、1つのデータ・ブロックに対応します。疎ディメンションと密ディメンション、密ディメンションと疎ディメンションの選択および密と疎の選択のシナリオを参照してください。
Essbaseは、5つのステージのパイプラインでデータ・ロードを処理します。
フリー・フォームのデータ・ロードの場合、ステージは次のとおりです。
-
入力—Essbaseが、ファイルまたはSQL接続から入力を収集します
-
トークン化—Essbaseが、レコードから入力フィールドを分離して、トークンを作成します
-
変換—Essbaseが、トークンをメンバー・アイテムに変換します
-
準備—Essbaseが、データをブロックに振り分ける準備として、データを整理します
-
書込み—Essbaseが、データをメモリーのブロックに振り分けて、疎の交差に基づくポインタで構成されるインデックスを使用してディスク上の正しいブロックを見つけ、ブロックをディスクに書き込みます
ルール・ファイル・ベースのデータ・ロードの場合、ステージは次のとおりです。
-
入力—Essbaseが、ファイルまたはSQL接続から入力を収集します
-
事前ルール—Essbaseがデータ・ロード・レコードを読み取ります
-
ルール—Essbaseが、ルール・ファイルに埋め込まれたルールをデータ・ロード・レコードに適用します
-
準備—Essbaseが、データをブロックに振り分ける準備として、データを整理します
-
書込み—Essbaseが、データをメモリーのブロックに振り分けて、疎の交差に基づくポインタで構成されるインデックスを使用してディスク上の正しいブロックを見つけ、ブロックをディスクに書き込みます
ノート:
集約ストレージ・データベースでは、5番目のステージは適用されません。
このプロセスは、すべてのデータがロードされるまで繰り返されます。各ステージで1つ以上の処理スレッドを使用することで、Essbaseではいくつかのプロセスを並列で実行できます。「並列データ・ロード」を参照してください。
この章の例は、「データ・ソース」のトピックに示した情報を十分に理解していることを前提としています。