BDDは多くの異なるクラスタ構成をサポートしますが、ほとんどの構成には次のようなノードが含まれています。
前述の図は、3つの基本タイプのBDDノードを示しています。BDDで必要となるがBDDはそのノード上では実行されないHadoopクラスタのノード(ZooKeeperおよびHadoopクラスタ・マネージャを実行するノードなど)は含まれません。
- ノード1では、BDDデータ処理ライブラリ、およびDPが機能するために必要なYARN NodeManagerサービス、Spark on YARN、HDFSが実行されています。一般的な本番クラスタには、複数のデータ処理ノードが含まれています。高可用性を維持するために、少なくとも3つのノードを使用することをお薦めします。
- ノード2では、Dgraph、Dgraph HDFSエージェント、DP CLI、およびHadoop HDFS DataNodeサービス(DgraphデータベースがHDFSに格納されるため必要となります)が実行されています。(DgraphデータベースはNFS (ネットワーク・ファイル・システム)に格納することもできます。その場合、DgraphノードでHDFSは必要となりません。詳細は、Dgraphデータベースを参照してください。)一般的な本番クラスタには、そのようなノードが複数含まれており、Dgraphの高可用性が保証されます。
- ノード3では、StudioとDgraph Gateway (WebLogic Managed Server内)、変換サービスとワークフロー・マネージャ・サービス(Jettyコンテナ内)、DP CLIおよびHive表ディテクタが実行されています。一般的なクラスタには、同時問合せを行うエンド・ユーザーの数に応じて、1つ以上のStudioノードが含まれています。複数のStudioノードがあるクラスタでは、ワークフロー・マネージャ・サービスおよびHive表ディテクタは、それらのうちの1つのみにそれぞれインストールします。
前に説明したとおり、前述の構成にしなければならないわけではありません。同じノードに異なるBDDおよびHadoopコンポーネントを併置でき、クラスタには任意の数の各タイプのノードを含めることができます。クラスタの構成およびコンポーネントの併置の詳細は、インストレーション・ガイドを参照してください。
また、Dgraphノードおよびデータ処理ノードは、インストール後に必要に応じて追加および削除できます。手順の詳細は、BDDノードの追加および削除を参照してください。BDDに影響を与えずに、Hadoopクラスタの非BDDノードを追加および削除することもできます。