並列データ・ロード
並列データ・ロードとは、データ・ロード・パイプラインの5つのステージを最適化するために使用できる並列スレッド処理方法を指します。また、複数のデータ・ファイルを同時にインポートすることも指します。
データ・ロード・パイプラインのスレッドの並列化
並列データ・ロードには、DLTHREADSPREPAREおよびDLTHREADSWRITE構成設定を使用してパイプラインの最適化を実現できるという特徴があります。データのロードに割り当てられる最小でデフォルトのスレッド数は5 (パイプラインのステージごとに1つのスレッド)ですが、これらの設定により、パイプライン内の選択したステージにスレッドを追加できます。たとえば、次のように構成することで、PrepareステージおよびWriteステージで使用されるスレッド数をそれぞれ1から4に増やすことができます。
DLSINGLETHREADPERSTAGE Sample Basic FALSE
DLTHREADSPREPARE Sample Basic 4
DLTHREADSWRITE Sample Basic 4
前述の構成では、データ・ロードは11個のスレッドを使用して実行するように設定されます。
ノート:
並列データ・ロード操作では、スレッドは動的には作成されません。かわりに、設定されている数のスレッドが、事前作成済のスレッドのプールから使用されます。スレッド・プールのサイズをカスタマイズできます。詳細は、WORKERTHREADSを参照してください。
データ・ファイルの同時インポート
並列データ・ロードのもう1つの特徴は、Essbaseキューブへの複数のデータ・ファイルの同時ロードです。大規模なデータ・セット(2GBの10ファイルのセットなど)を操作する場合、データソースを同時にロードすることで、複数のプロセッサと高パフォーマンスのストレージ・サブシステムを備えた最新サーバーのCPUリソースやI/Oチャネルを十分に活用できます。
また、複数ファイルのデータ・ロードに使用されるスレッド数を調節できます。たとえば、前述の構成を使用して、2つのデータ・ファイルを指定すると、それぞれ11個のスレッドを持つデータ・ロード・パイプラインが作成されます。
データを並列にロードするには、オプションを選択します:
-
Essbase Webインタフェースでジョブを使用します。データのロードを参照してください。
-
キューブ・デザイナを使用します。キューブ・デザイナでのデータのロードを参照してください。
-
MaxLを使用し、ワイルドカード文字(
*
または?
、あるいはその両方)を使用してimport data文に複数のデータ・ファイルを指定して、使用するすべてのデータ・ソース・ファイルと照合します。必要に応じて、using max_threads句を使用して、並列データ・ロードによって生成されるスレッドの数を制御します。