グリッドのホストおよびデータ・インスタンスの数の計算
K-Safety (k
)の値に対して定義するデータのコピー数は、グリッドの作成に必要なデータ・インスタンスおよびホストの数の要因となります。k
を2
に設定してデータの複製コピーを定義する場合は、k
を1
に設定してデータのコピーが1つ必要な場合よりも2倍の数のデータ・インスタンスおよびホストが必要になります。
ノート:
5
は、k
の値として割り当てることができる最大数です。
作成するデータ・インスタンスの数の計算
作成するデータ・インスタンスの数は、次の2つの要因によって異なります。
-
k
の値:k
を1に設定した場合、作成するデータ・インスタンスの数は、各データベースに必要な要素の数と等しくなります。k
を2
以上に設定した場合、k倍の数のデータ・インスタンスを作成する必要があります。データ・インスタンスの各セットで、k個のデータ領域グループのうちの1つに含まれている各データベース・コピーが管理されます。 -
データを分散するレプリカ・セットの数: 作成するデータ・インスタンスの数は、すべてのレプリカ・セット内の要素の数によって決定されます。これは、各データ・インスタンスが各データベースの1つの要素を管理するためです。
データベースの1つのコピーを構成するすべての要素が、データ領域内で割り当てられます。データベースのコピーを3つにするために
k
を3
に設定すると、各レプリカ・セットに3つの要素が含まれ、各要素はそのレプリカ・セット内の他の要素の正確なコピーになります。各データ領域には、各レプリカ・セットのレプリカ要素のいずれか1つが含まれます。ノート:
各データ領域には、論理的に、データベースのデータの完全コピーが含まれます。データのコピーがk個あるため、k個のデータ領域があります。
データ・インスタンスは、ホストがデータ領域グループにどのように割り当てられるかに基づいてデータ領域に割り当てられます。
データを分散するレプリカ・セットの数を計算するには、次の2つの最大値を決定します。
-
データベース・サイズとホスト・メモリー・サイズ。各ホストのデータベースのサイズおよびメモリーの量によって、必要なレプリカ・セットの数が決定されます。たとえば、それぞれ512 GBのメモリーでホストする2 TBのデータベースがある場合、すべてのデータを保持するには、少なくとも4のレプリカ・セットが必要です。各ホスト上のすべてのメモリーをデータに使用できないため、5つのホストを必要とする可能性が高くなります。
-
スループット。データベースが1つのホストのメモリーに収まるくらい小さい場合でも、1つのホストが、アプリケーションに必要な秒当たりのトランザクション数を処理できない場合は、複数のホストにデータを分散する必要があります。
-
レプリカ・セットの数を決定したら、データ・インスタンスの数を計算できます。
必要なデータ・インスタンスの数を確認する式では、rはレプリカ・セット(各レプリカ・セットに1つ以上の要素が含まれている)の数を表し、kは、データのコピーの数となる、また後に各レプリカ・セット内の要素の数となる、K-safety値を表します。十分なデータ・インスタンスを作成するには、k * r個のデータ・インスタンスを作成する必要があります。
number of data instances = k * r
たとえば、データベースのコピーを3つにするためにk
を3
に設定し、データベースの各コピーを2つのレプリカ・セットに分散する場合は、6つのデータ・インスタンス(3つのデータ領域それぞれに2つのデータ・インスタンスが含まれる)を作成する必要があります。
「K-Safety」を参照してください。
データ・インスタンスのサポートに必要なホストの数の計算
グリッドの本番デプロイメントの物理システムまたは仮想システムの数を計算する場合は、次の点を考慮します。
-
メンバーシップ・サーバーのホスト。「メンバーシップ・サービスとしてのApache ZooKeeperの使用方法」を参照してください。
-
管理インスタンスのホスト。「スタンバイ管理インスタンスの追加」を参照してください。
-
データ・インスタンスのホスト。このトピックでは、グリッド内のデータ・インスタンスの数をサポートするために必要なホストの数を説明します。
必要なホストの数は、各ホストにインストールするデータ・インスタンスの数によって異なります。次の内容は、データ・インスタンスで説明されています。
データの可用性を最大限に高め、ホストの1つに障害が発生した場合のデータ損失を防ぐために、各データ・インスタンスは、通常は、別々のホストにあります。ただし、次のような場合は、1つのホストで複数のデータ・インスタンスを実行することもできます。
-
グリッド内のホストに大量のコンピューティング・リソースが含まれている。
-
デプロイメント前のより大きなグリッドの実験のために、少数のホストでより大きなグリッド構成をテストする。
次のように、ホストの数を決定します。
-
ホストごとに1つのデータ・インスタンスをインストールする場合、必要なホストの数は、グリッド内のデータ・インスタンスの数と同じです。たとえば、6つのデータ・インスタンスがある場合は、6つのホストを作成する必要があります。
-
ホストごとに複数のデータ・インスタンスをインストールする場合、必要なホストの数は、各ホストのデータ・インスタンスの数によって異なります。たとえば、8つのデータ・インスタンスがあり、各ホストに2つのデータ・インスタンスをインストールする場合は、4のホストのみが必要です。
データ・インスタンスのホストを作成した後は、データ領域グループに割り当てます。「データ領域グループへのホストの割当て」を参照してください。