ここでは、Sun Cluster HA for Sun Grid Engine のインストールと構成の計画について説明します。
次に進む前に、使用する Sun Grid Engine のマニュアルを参照して、構成の制約や要件 (Sun Cluster ソフトウェアによる制約や要件以外のもの) がないか調べてください。
以降の項で説明する構成の制限は Sun Cluster HA for Sun Grid Engine だけに適用されます。
これらの制限事項を守らないと、データサービスの構成がサポートされない場合があります。
Sun Grid Engine シャドウデーモンは使用しないでください。Sun Grid Engine シャドウデーモンは、障害から回復するためのオプション機構を提供します。この機構は、Sun Cluster が提供する自動障害回復と干渉します。
Berkley DB スプールサーバーを使用するオプションは選択しないでください。「クラシック」スプールメソッドまたはローカル Berkley DB スプールメソッドを選択してください。現時点では、Sun Cluster フレームワークで Berkley DB スプールサーバーを高可用対応に構成することはできません。
Sun Grid Engine をインストールするときには、「ブート時に起動」オプションを選択しないでください。Sun Cluster HA for Sun Grid Engine が障害監視と自動障害回復を確実に提供できるようにするには、Sun Grid Engine を Sun Cluster だけから起動する必要があります。
ここで説明する構成の制約は Sun Cluster HA for Sun Grid Engine だけに適用されます。
これらの要件を満たしていないデータサービス構成は、サポートされない場合があります。
Sun Grid Engine バージョン 6.0 を使用します。Sun Grid Engine ソフトウェアに必ず最新のパッチを適用してください。
Sun Grid Engine バージョン 5.3 の提供は完了しましたが、Sun Cluster HA for Sun Grid Engine は現在もこのバージョンをサポートしています。Sun Grid Engine バージョン 5.3 を使用している場合は、Sun Grid Engine バージョン 6.0 にアップグレードすることをお勧めします。
このマニュアル内の操作説明は、Sun Grid Engine バージョン 6.0 だけを対象にしています。Sun Grid Engine バージョン 5.3 を使用して Sun Cluster HA for Sun Grid Engine のインストールと構成を行う方法については、Sun Cluster 3.1 9/04 の『Sun Cluster Data Service for Sun Grid Engine Guide for Solaris OS』を参照してください。
Sun Cluster 3.1 9/04 がリリースされたため、sge_config ファイル内のキーワードは次のように変更されました。
RG はMASTERRG に変更されました。
LH は MASTERLH に変更されました。
PORT は MASTERPORT に変更されました。
SGE_VER が追加されました。
これらのキーワードの説明については、sge_config ファイル内のコメントを参照してください。
Sun Grid Engine 管理層は Sun Cluster ノードで実行する必要があります。Sun Cluster が動作するのは Solaris オペレーティングシステムだけであるため、Sun Grid Engine 管理層も Solaris オペレーティングシステムで実行する必要があります。しかし、Sun Grid Engine はほかのオペレーティングシステムもサポートします。したがって、この要件は管理層だけに適用され、グリッド内にある個々の実行ノードには適用されません。
Sun Grid Engine マスターを実行しようと計画しているクラスタノードで十分な空きメモリーが利用できることを確認します。
各クラスタノードに必要な空きメモリー量は、グリッドで動作しているジョブの数によって変わります。次に例を示します。
100 個のジョブが動作している場合、10M バイトの空きメモリーが必要になります。
10,000 個のジョブが動作している場合、1G バイトの空きメモリーが必要になります。
Sun Grid Engine ファイルシステムと各ノードのローカルディスクに十分なディスク容量があることを確認します。
次の表に、Sun Grid Engine ファイルシステムのファイルまたはディレクトリの種類ごとに必要なディスク容量要件を示します。
ファイルの種類またはディレクトリの種類 |
必要なディスク容量 |
---|---|
バイナリファイル |
アーキテクチャーごとに 15M バイト |
スプールディレクトリ |
30M 〜 200M バイト |
インストール tar ファイル |
40M バイト |
各ノードのローカルディスクには、10M 〜 20M バイトのディスク容量が必要です。Sun Grid Engine ソフトウェアをノードのローカルディスクにインストールしている場合、そのバイナリファイル用に、さらに 15M バイトのディスク容量が必要です。
Sun Cluster HA for Sun Grid Engine は、フェイルオーバーデータサービスとして構成する必要があります。Sun Cluster HA for Sun Grid Engine をスケーラブルデータサービスとして構成することはできません。詳細については、以下を参照してください。
Sun Grid Engine ファイルシステムは、多重ホストディスクに存在する必要があります。このディスクは、Sun Grid Engine 管理サービスとして使用される、ほかのクラスタノードにも利用できる必要があります。
Sun Grid Engine ファイルシステムをクラスタ以外のノードにエクスポートするには、NFS を使用する必要があります。このファイルシステムをエクスポートする NFS サーバーも障害から保護する必要があります。NFS サーバーを障害から保護するには、Sun Cluster HA for NFS データサービスを使用します。このデータサービスの詳細は、『Sun Cluster Data Service for Network File System (NFS) ガイド (Solaris OS 版)』を参照してください。
同じリソースグループ内にある Sun Grid Engine 管理層のリソースを NFS 用のリソースとして構成します。詳細は、「Sun Cluster HA for Sun Grid Engine で使用するための Sun Cluster HA for NFS の構成」を参照してください。
次の表に、Sun Grid Engine コンポーネント間の依存関係を示します。
表 3 Sun Grid Engine コンポーネント間の依存関係
Sun Grid Engine コンポーネント |
依存関係 |
---|---|
Sun Grid Engine 待ち行列マスターデーモン (sge_qmaster) |
SUNW.HAStoragePlus リソース |
Sun Grid Engine スケジューリングデーモン (sge_schedd) |
Sun Grid Engine 待ち行列マスターデーモン (sge_qmaster) リソース |
これらの依存関係は、Sun Cluster HA for Sun Grid Engine を登録および構成するときに設定されます。詳細は、「Sun Cluster HA for Sun Grid Engine の登録と構成」を参照してください。
Sun Cluster HA for Sun Grid Engine のインストールと構成では、構成に関する以下の点を考慮する必要があります。
Sun Grid Engine をインストールできる場所は、次のうちの 1 つです。
高可用性ローカルファイルシステム
クラスタファイルシステム
Sun Grid Engine バイナリファイルを高可用性ローカルファイルシステムまたはクラスタファイルシステムにインストールする場合の利点と欠点については、『Sun Cluster データサービスの計画と管理 (Solaris OS 版)』の「Sun Cluster データサービス構成のガイドライン」を参照してください。
ファイルシステムの種類をマウントポイントから識別できるようにするには、ファイルシステムの種類を示す接頭辞を次のように使用します。
マウントポイントが高可用性ローカルファイルシステムにある場合は、/local 接頭辞を使用します
マウントポイントがクラスタファイルシステムにある場合は、/global 接頭辞を使用します。
スプールディレクトリとバイナリファイルをファイルシステムに適切に分散できるかどうかは、グリッドの構成によって変わります。次の表を参照してください。
グリッドの構成 |
ファイルシステムの構成 |
---|---|
実行層に含まれるホストは 200 台未満です。 |
スプールディレクトリとバイナリファイル用に、Sun Grid Engine ファイルシステムのルートの下にある単一の共有 NFS ファイルシステムを使用します。 |
実行層に含まれるホストが約 200 台であるか、アプリケーションがディスクに頻繁にアクセスします。 |
スプールディレクトリ用に、NFS ファイルシステムにある別の領域を使用します。 |
実行層に含まれるホストが 200 台を超えているか、NFS の性能に問題があります。 |
代替のグリッド構成については、Sun Grid Engine のマニュアルを参照してください。 |
Sun Cluster HA for Sun Grid Engine のインストールと構成を計画するときには、この項の質問を使用します。これらの質問の回答を、『Sun Cluster データサービスの計画と管理 (Solaris OS 版)』の「構成のワークシート」にあるデータサービスワークシートに書き込みます。
論理ホスト名リソース
HAStoragePlus リソース
NFS リソース
Sun Grid Engine アプリケーションリソース
この質問の回答は、次の手順を行うときに必要になります。
Sun Grid Engine リソースの論理ホスト名は何ですか。クライアントは、この論理ホスト名経由でデータサービスにアクセスします。
この質問の回答は、「Sun Grid Engine をクラスタで実行するには」の手順を実行するときに使用されます。
Sun Grid Engine のコンポーネントにはどのリソースを使用しますか。
次に示すコンポーネントごとに 1 つのリソースが必要です。
待ち行列マスターデーモン
スケジューリングデーモン
この質問の回答は、「Sun Cluster HA for Sun Grid Engine リソース用の構成パラメータの指定」の手順を実行する際に使用されます。
クラスタファイルシステムではなく、ローカルファイルシステムを使用する場合の利点と欠点については、『Sun Cluster データサービスの計画と管理 (Solaris OS 版)』の「Sun Cluster データサービス構成のガイドライン」を参照してください。