Sun N1 Grid Engine 6.1 インストールガイド

第 1 章 ソフトウェアのインストールの準備

この章では、 N1TM Grid Engine 6.1 ソフトウェア (Grid Engine ソフトウェア) のインストール前に実行するべき手順について説明します。

この章の内容は、次のとおりです。

インストールの計画

以前のバージョンの Grid Engine ソフトウェアがインストールされている場合もそうでない場合も、ソフトウェアを抽出し、インストールを開始する前に、いくつかの計画を立てる必要があります。この節では、計画段階で行う意思決定の内容について説明します。また、意思決定の助けになる基準があれば、それも紹介します。

意思決定の内容

インストールの計画を行う前に、次の項目について決定する必要があります。

必要な情報の収集

Grid Engine ソフトウェアをインストールする前に、ユーザーの環境に適した結果を得るために計画を立てます。この節の内容は、今後の手順に影響を及ぼす意思決定に役立ちます。次のような表を用意して、インストール計画を書き込んでください。

パラメータ 

値 

sge-root ディレクトリ

 

セル名 

 

管理ユーザー 

 

sge_qmaster ポート番号

6444 を推奨

sge_execd ポート番号

6445 を推奨

マスターホスト 

 

シャドウマスターホスト 

 

実行ホスト 

 

管理ホスト 

 

発行ホスト 

 

ジョブのグループ ID 範囲 

 

スプール方式 (Berkeley DB スプールまたは従来のスプール) 

 

Berkeley DB サーバーホスト (マスターホスト、またはその他のホスト) 

 

データベースサーバー上の Berkeley DB スプールディレクトリ 

 

スケジューラチューニングプロファイル (Normal、High、Max) 

 

インストール方式 (対話型、セキュリティー強化、自動、アップグレード) 

 

Windows システムに N1 Grid Engine 6.1 をインストールする場合は、Microsoft Services For UNIX を入手してインストールする必要があります。詳細については、付録 A 「Microsoft Windows Services For UNIX」 を参照してください。

 

Windows システムに N1 Grid Engine 6.1 をインストールする場合は、必要な Certificate Security Protocol (CSP) 証明書を作成してから N1GE をインストールする必要があります。CSP 証明書についての詳細は、「CSP のセキュリティー保護されたシステムをインストールする方法」で確認してください。

 

その他の問題点について、付録 C 「その他の N1 Grid Engine インストールに関する問題」を確認してください。

 

必要なディスク容量

Grid Engine ソフトウェアディレクトリツリーに必要なディスク容量は、次のように固定されています。

Grid Engine システムスプールディレクトリ用の推奨ディスク容量は次のとおりです。

マスターホストおよび実行ホストのスプールディレクトリの構成は変更できます。デフォルトのスプールディレクトリは sge-root ですが、それ以外の構成も可能です。


注 –

Windows オペレーティングシステムが動作しているホストに N1 Grid Engine をインストールする場合は、Windows 固有のいくつかの前提条件を満たす必要があります。コンピュータに追加ソフトウェアのインストールが必要になることがあります。その場合、ディスク容量の追加が必要になる場合があります。付録 A 「Microsoft Windows Services For UNIX」 を参照してください。


sge-root インストールディレクトリ

配布媒体のコンテンツを読み込むディレクトリを作成します。このディレクトリを「ルートディレクトリ」または「sge-root」と呼びます。このディレクトリには、Grid Engine システムの実行時に、現在のクラスタ構成と、ディスクにスプールするその他のデータが格納されます。


注 –

スプール領域は sge-root の下である必要はありません。実際、効率上の理由から、この場所に格納されないこともあります。


すべてのホストからネットワーク経由でアクセスできる、有効なディレクトリパス名を指定してください。たとえば、オートマウンタを使ってファイルシステムをマウントする場合、sge-root には /usr/N1GE6 を指定します。/tmp_mnt/usr/N1GE6 を指定してはいけません。このマニュアルでは、sge-root 変数でインストールディレクトリを示します。

sge-root は、Grid Engine ソフトウェアディレクトリツリーのトップレベルのディレクトリです。セル内の Grid Engine システムコンポーネントはそれぞれ、起動時に sge-root/cell/common ディレクトリを読み取る必要があります。Grid Engine ソフトウェアをシングルクラスタとしてインストールした場合、cell の値は default になります。

インストールと管理の容易性の点から、Grid Engine ソフトウェアインストール手順を実行するすべてのホストから読み取り可能なディレクトリを指定する必要があります。たとえば、NFS などのネットワークファイルシステム全体で使用可能なディレクトリを指定します。ホストのローカルファイルシステムを指定する場合は、特定のマシンのインストール手順を開始する前に、各ホストにインストールディレクトリをコピーしてください。必要なアクセス権については、「ファイルアクセス権」を参照してください。

ディレクトリの編成

ディレクトリの編成時には、次の項目について決定する必要があります。


注 –

インストールディレクトリやスプールディレクトリを変更するには、システムをインストールし直す必要があります。したがって、インストールディレクトリは、あらかじめ慎重に選択する必要があります。なお、以前のインストールで使用した重要な情報はすべて保持されます。


デフォルトのインストール手順では、図 1–1 に示すように、インストールディレクトリの下のディレクトリ階層に、Grid Engine ソフトウェア、マニュアル、スプール領域、および構成ファイルがインストールされます。このデフォルトの手順を使用する場合、「ファイルアクセス権」で説明されているアクセス権を割り当てられたディレクトリをインストールまたは選択します。

最初のインストール時に、スプール領域を別の場所に配置することもできます。具体的な手順は『Sun N1 Grid Engine 6.1 管理ガイド』「キューの構成」を参照してください。

図 1–1 ディレクトリ階層のサンプル

セル

Grid Engine システムは、シングルクラスタか、疎結合された複数のクラスタの集合として設定できます。後者を「セル」と呼びます。SGE_CELL 環境変数は、参照されるクラスタを示します。Grid Engine システムをシングルクラスタとしてインストールした場合、 $SGE_CELL は設定されません。default がセル値と見なされます。

ユーザー名

ジョブを送信するユーザーが適切な実行ホスト上でジョブの送信権を持っているかどうかを Grid Engine システムによって検証するには、使用する送信ホストと実行ホスト上で同一のユーザー名を使用する必要があります。このため、一部のマシンでユーザー名を変更する必要があるかもしれません。Grid Engine システムのユーザーは、システムユーザーアカウントに直接マップされているからです。


注 –

マスターホスト上のユーザー名は、アクセス権チェックには使用されません。これらのユーザー名が一致している必要はありません。存在していないユーザー名でもかまいません。


インストールアカウント

Grid Engine ソフトウェアは、root ユーザーとして、または特権のないユーザーとして (たとえばユーザー固有のアカウントを使用して) インストールできます。ただし、特権のないユーザーとしてソフトウェアをインストールした場合、このユーザーしか Grid Engine システムのジョブを実行できなくなります。その他の全アカウントのアクセスは拒否されます。この問題を回避するには、root アカウントでインストールを行います。ただし、すべてのインストール手順を実行するには、root のアクセス権が必要です。このほか、特権のないユーザーとしてインストールした場合は、qrshqtcshqmake の各コマンドを実行できない、緊密に結合された並列ジョブを実行できないなどの制約もあります。

ファイルアクセス権

root としてログインしてソフトウェアをインストールする場合は、共有ファイルシステム上のすべてのホストで root の読み取り/書き込み権の設定に問題が発生する可能性があります。その結果、ネットワーク全体のファイルシステムに sge-root を配置できない場合があります。

Grid Engine ソフトウェアに、すべての Grid Engine システムコンポーネントを root 管理ユーザーアカウント以外 (たとえば sgeadmin など) で実行させることもできます。この設定では、このユーザーに必要なのは共有 sge-root ファイルシステムの読み取り/書き込み権だけです。

インストール時に、管理ユーザーアカウントをファイルの作成者兼所有者にするかどうか確認するメッセージが表示されます。「Yes」と答えて有効なユーザー名を入力すると、このユーザーがファイルの作成者になります。それ以外の場合、インストール手順を実行しているユーザーがファイルの作成者になります。管理ユーザーを作成し、この質問には「Yes」と答えてください。

どの場合でも、すべてのホストのファイル処理用のアカウントには、sge-root ディレクトリの読み取り/書き込み権が必要です。また、ユーザーが Grid Engine ソフトウェア配布媒体にアクセスするホストは、sge-root ディレクトリへの書き込みを許可されているものと見なされます。


注 –

Windows ホスト上の root ユーザー名は、Windows オペレーティングシステムのシステム言語に依存します。root ユーザーの名前を変更することもできます。多くの言語で、デフォルトの名前は Administrator です。

Windows ホストが Windows ドメインのメンバーになっている場合は、ローカルの Administrator だけroot ユーザーになります。Administrators グループのメンバー、ドメインの Administrator、Domain Admins グループのメンバーのいずれも、root ユーザーになりません。Windows ホストのユーザーの詳細については、付録 B 「Windows ホストでの N1GE のユーザー管理」を参照してください。


ネットワークサービス

サイトのネットワークサービスを NIS データベースに定義するか、各ワークステーションのローカルの /etc/services ファイルに定義するかを決定します。NIS を使用する場合、NIS サービスマップにエントリを追加するため、NIS サーバーのホスト名を確認します。

Grid Engine システムサービスには、sge_execdsge_qmaster があります。NIS マップにサービスを追加するには、予約された未使用のポート番号を選択します。次に、sge_qmaster エントリと sge_execd エントリの例を示します。


sge_qmaster 6444/tcp

sge_execd 6445/tcp

マスターホスト

マスターホストは、Grid Engine システムを制御するホストです。マスターデーモン sge_qmaster とスケジューリングデーモン sge_schedd を実行します。

マスターホストの要件は次のとおりです。


注 –

Windows ホストはマスターホストとしては使用できません。


シャドウマスターホスト

シャドウマスターホストは、マスターホストやマスターデーモンに障害が発生したとき、sge_qmaster の機能をバックアップするホストです。シャドウマスターホストの要件は次のとおりです。


注 –

インストール時にセル名を指定しないと、cell の値は default になります。


これらの要件が満たされると、シャドウマスターホストの機能がアクティブになります。あるホストをシャドウマスターホストにするために、Grid Engine システムデーモンを再起動する必要はありません。


注 –

Windows ホストはマスターホストとしては使用できません。


ルートディレクトリの下のスプールディレクトリ

マスターホストのインストール時に、スプールディレクトリの場所を指定する必要があります。このディレクトリは、ローカルスプールディレクトリを持たない実行ホストからのジョブのスプールに使用されます。


注 –

インストール時にセル名を指定しないと、cell の値は default になります。


これらのディレクトリを別のマシンへエクスポートする必要はありません。しかし、sge-root ツリー全体をエクスポートし、マスターホストとすべての実行可能ホストに書き込み権を許可すれば、管理性が向上します。

従来のスプールとデータベーススプール

インストール時に、従来のスプール方式と Berkeley DB スプール方式のいずれかを選択します。Berkeley DB スプールを選択した場合は、さらにスプール先として、ローカルディレクトリと独立したホスト (Berkeley DB スプールサーバー) のいずれかを選択します。

従来のスプール方式も選択できますが、より優れたパフォーマンスを得たい場合は Berkeley DB スプールサーバーを選択します。これは、従来のスプール方式ではテキストファイルへのブロック書き込みを行う必要があるのに対して、Berkeley DB スプール方式ではマスターホストからデータベースへブロックなしで書き込みを行えるからです。2 つのスプール方式は、ファイル形式とデータの整合性の点でも異なっています。Berkeley DB に書き込むと、テキストファイルに書き込む場合よりもはるかに高いレベルのデータ整合性が得られます。一方、ファイル形式に注目すると、テキストファイルには、人間が読んだり編集したりできる形式でデータを格納できるという利点があります。通常、これらのファイルを読む必要はありません。しかし、スプールディレクトリにはシステムデーモンからのメッセージが格納されているので、ファイルを読むことができれば、その内容をデバッグに役立てることができます。

データベースサーバーとスプールホスト

Berkeley DB スプールデータベースには、マスターホストの構成と状態情報を格納できます。このスプールデータベースは、マスターサーバー上か、独立したホスト上に配置できます。マスターホストのローカルディレクトリに Berkeley DB をスプールすると、パフォーマンスが向上します。シャドウマスターホストを設定する場合は、独立した Berkeley DB スプールサーバー (ホスト) を使用する必要があります。この場合、RPC サービスが構成されたホストを選択してください。マスターホストは、RPC を介して Berkeley DB に接続します。

この構成では、高可用性 (HA) ソリューションは得られません。たとえば、保留中のジョブのスクリプトは BDB スプールサーバーでスプールされないので、シャドウマスターで利用できないためです。

SolarisTM 10 オペレーティングシステムでは NFS4 ソフトウェアが採用されたため、ネットワークファイルシステム (NFS) で Berkeley DB スプールを使用できます。以前のバージョンの NFS では Berkeley DB スプールを使用できませんでした。このことから、追加の Berkeley DB スプールサーバーを用意しなくても、シャドウホストを Berkeley DB にスプールすることができます。


注 –

シャドウマスターホストは信頼性の面で優れていますが、独立した Berkeley DB スプールホストを使用するので、潜在的なセキュリティホールが存在します。Berkeley DB による RPC 通信は、外部からの脅威に対して脆弱です。ユーザーのサイトが安全で、ユーザーが Berkeley DB スプールホストに TCP/IP 経由でアクセスできる信頼されたユーザーである場合以外は、この方法を選択するべきではありません。


Berkeley DB スプール方式をシャドウマスターなしで利用する場合、別途スプールサーバーを用意する必要はありません。また、Berkeley DB 以外のスプール方式を使用する場合は、別のスプールサーバーを用意せずにシャドウマスターホストを設定できます。

独立したスプールサーバーが必要かどうかを決定したら、スプールディレクトリの場所も決定する必要があります。スプールサーバーに対してローカルなスプールディレクトリを指定してください。スプールディレクトリのデフォルトの場所は、インストール時に推奨値として表示されます。ただし、ファイルサーバーがマスターホストと異なる場合、このデフォルトの値は適切ではありません。

次に、Berkeley DB スプールホストの要件を示します。この要件は、マスターホストの要件とよく似ています。

実行ホスト

実行ホストは、ユーザーから Grid Engine システムに発行されたジョブを実行します。実行ホストは、最初は管理ホストとして設定する必要があります。各実行ホストで、インストールスクリプトを実行できます。

グループ ID

ジョブに対して動的に割り当てられる ID の範囲を規定する必要があります。単一のホストで同時に実行できる最大数の Grid Engine システムジョブに対応できるだけの範囲が必要です。

グループ ID は、Grid Engine システムジョブのリソース使用率を監視する目的で、各ジョブに割り当てられます。各ジョブの実行時に、独自の ID が割り当てられます。たとえば範囲が 20000 から 20100 に設定されている場合、単一ホストで同時に 100 個のジョブを実行できます。クラスタ構成のグループ ID 範囲はいつでも変更できますが、UNIX グループ ID 範囲内の値は使用してはなりません。

管理ホスト

Grid Engine システムのオペレータとマネージャーは、管理ホストを使用して、待ち行列の再構成、Grid Engine システムユーザーの追加といったさまざまな管理タスクを実行します。

マスターホストは、マスターホストインストールスクリプトにより、自動的に管理ホストになります。その他の管理ホストは、マスターホストのインストール中に追加できます。また、管理ホストは、インストール後にいつでもマスターホストに手動で追加できます。

発行ホスト

ジョブの送信および制御は、発行ホストから実行できます。マスターホストは、マスターホストインストールスクリプトにより、自動的に発行ホストになります。

クラスタキュー

インストール中に、システムに適したデフォルトのクラスタキューの構造が作成されます。このデフォルトのキューは、インストール後に削除できます。


注 –

管理者は、ソフトウェアのインストールディレクトリの指定とは関係なく、インストール中に作成された設定の大部分を変更できます。こうした変更は、システムの実行中も可能です。


待ち行列の構造を決定するときは、次の点を考慮してください。

クラスタ待ち行列の管理の詳細については、『Sun N1 Grid Engine 6.1 管理ガイド』「キューの構成」を参照してください。

スケジューラプロファイル

インストール時に、normalhigh、および max のいずれかのスケジューラプロファイルを選択できます。これらの定義済みプロファイルを叩き台にして、グリッドエンジンのチューニングを行うことができます。

これらのプロファイルを利用した場合、次のような点でスケジューラを最適化することができます。

選択可能なスケジューラプロファイルは、次の 3 種類です。

スケジューリングの構成方法の詳細は、『Sun N1 Grid Engine 6.1 管理ガイド』「スケジューラの管理」を参照してください。

インストール方式

Grid Engine ソフトウェアは、複数の方式でインストールできます。

インストール方式は、次の点を考慮して決定します。

その他のインストールの問題に関する付録の確認

N1 Grid Engine を Linux システムまたは IPMP を使用しているシステムにインストールする場合は、付録 C 「その他の N1 Grid Engine インストールに関する問題」を参照して重要な情報を確認してください。

ワークステーションへの配布ファイルの読み込み

N1 Grid Engine 6.1 ソフトウェアは CD-ROM と電子的なダウンロード方式で配布されています。CD-ROM のアクセス方法については、システム管理者に問い合わせるか、お手元のシステムマニュアルを参照してください。CD-ROM ディストリビューションには、N1_Grid_Engine_6_1 という名前のディレクトリがあります。製品ディストリビューションは、tar.gz 形式と pkgadd 形式で、このディレクトリに格納されています。pkgadd 形式は Solaris オペレーティングシステム (Solaris OS) 向けです。tar.gz 形式はその他のサポートオペレーティングシステム向けです。

Procedure配布ファイルをワークステーションに読み込む方法

始める前に

「ファイルアクセス権」に定義されているアクセス権を設定して、Grid Engine ソフトウェアのディストリビューションとスプールファイルおよび構成ファイルの格納先となるファイルシステムおよびディレクトリを適切に設定します。

  1. 配布媒体にアクセスします。

    ソフトウェアを CD-ROM から読み込むのではなくダウンロードする場合は、5 つのファイルをディレクトリに解凍します。350M バイト以上の空き領域のあるファイルシステム上のディレクトリを選択してください。

  2. システムにログインします。できれば、ファイルサーバーに直接アクセスできるシステムがよいでしょう。

  3. sge-root インストールディレクトリ」の説明に従って、インストールディレクトリを作成します。


    # mkdir /opt/n1ge6
    

    このマニュアルでは、インストールディレクトリを sge-root で表します。

  4. Grid Engine システムクラスタ内のマスターホスト、実行ホスト、および発行ホストが利用するすべてのバイナリアーキテクチャー用に、バイナリをインストールします。

    pkgadd 方式または tar 方式を使用できます。

    • pkgadd 方式

      pkgadd 方式は、Solaris オペレーティングシステムを対象としています。リモートインストールを容易にするため、pkgadd ディレクトリは zip ファイルの形式でも提供されています。

      次のパッケージをインストールできます。

      • SUNWsgeec – アーキテクチャー独立ファイル

      • SUNWsgeed – マニュアル

      • SUNWsgee – Solaris 7、Solaris 8、および Solaris 9 オペレーティングシステム用の Solaris (SPARC® プラットフォーム) 32 ビットバイナリ

      • SUNWsgeex – Solaris 7、Solaris 8、および Solaris 9 オペレーティングシステム用の Solaris (SPARC プラットフォーム) 64 ビットバイナリ

      • SUNWsgeei — Solaris 8 および Solaris 9 オペレーティングシステム用の Solaris (x86 プラットフォーム) バイナリ

      • SUNWsgeeax - Solaris 10 オペレーティングシステム用の Solaris (x64 プラットフォーム) バイナリ

      • SUNWsgeea - Solaris および Linux オペレーティングシステム用のアカウンティングおよび報告コンソール (ARCo) パッケージ

      次のコマンドを入力します。基本ディレクトリ sge-root と管理ユーザーについて質問が表示されるので、必要な情報を準備しておいてください。スクリプトは、このインストールの計画段階で選択した内容の入力を求めます。「意思決定の内容」を参照してください。

      コマンドプロンプトに次のコマンドを入力し、各質問に回答します。


      # cd cdrom_mount_point/N1_Grid_Engine_6u4
      # pkgadd -d ./Common/Packages/SUNWsgeec
      # pkgadd -d ./Docs/Packages/SUNWsgeed
      

      必要な Solaris のバイナリに応じて、次のいずれかのコマンドを入力します。


      # pkgadd -d ./Solaris_sparc/Packages/SUNWsgee 
      # pkgadd -d ./Solaris_sparc/Packages/SUNWsgeex 
      # pkgadd -d ./Solaris_x86/Packages/SUNWsgeei 
      # pkgadd -d ./Solaris_x64/Packages/SUNWsgeeax 
      
    • tar 方式

      tar.gz 形式はその他のサポートオペレーティングシステム向けです。

      次の表のファイルは、すべてのプラットフォームに共通の必須ファイルです。

      ファイル 

      説明 

      Common/tar/n1ge-6_1-common.tar.gz

      アーキテクチャー独立ファイル 

      プラットフォーム固有のバイナリが格納されている tar ファイルの名前は、n1ge-6_1-bin-architecture.tar.gz の形式になっています。次の表に、プラットフォーム固有のバイナリを示します。サポート対象の各プラットフォームにファイルをインストールする必要があります。プラットフォーム固有のディレクトリは、N1_Grid_Engine_6_1 ディレクトリの下にあります。

      プラットフォーム固有のファイル 

      プラットフォーム 

      Solaris_sparc/tar/n1ge-6_1-bin-solaris.tar.gz

      Solaris 7、Solaris 8、Solaris 9 オペレーティングシステム用の Solaris (SPARC プラットフォーム) 32 ビットバイナリ 

      Solaris_sparc/tar/n1ge-6_1-bin-solaris-sparcv9.tar.gz

      Solaris 7、Solaris 8、Solaris 9 オペレーティングシステム用の Solaris (SPARC プラットフォーム) 64 ビットバイナリ 

      Solaris_x86/tar/n1ge-6_1-bin-solaris-i586.tar.gz

      Solaris 8 および Solaris 9 オペレーティングシステム用の Solaris (x86 プラットフォーム) バイナリ 

      Solaris_x64/tar/n1ge-6_1-bin-solaris-x64.tar.gz

      Solaris 10 オペレーティングシステム用の Solaris (x64 プラットフォーム) 64 ビットバイナリ 

      Gemm/tar/n1ge-6_1-gemm.tar.gz

      Grid Engine Management Module (SCS 2.2.1 とともにインストールされる) 

      Windows/tar/n1ge-6_1-bin-win32-x86.tar.gz

      Windows 2000、XP、および Windows Server 2003 用の Microsoft Windows (x86 プラットフォーム) 32 ビットバイナリ 

      Linux24_i586/tar/n1ge-6_1-bin-linux24-i586.tar.gz

      2.4 カーネル用の Linux (x86 プラットフォーム) バイナリ 

      Linux24_amd64/tar/n1ge-6_1-bin-linux24-amd64.tar.gz

      2.4 カーネル用の Linux (AMD プラットフォーム) バイナリ 

      MacOSX/tar/n1ge-6_1-bin-darwin.tar.gz

      Apple Mac OS/X 

      HPUX11/tar/n1ge-6_1-bin-hp11.tar.gz

      Hewlett Packard HP-UX 11 

      Aix51/tar/n1ge-6_1-bin-irix65.tar.gz

      SGI Irix 6.5 

      Aix43/tar/n1ge-6_1-bin-aix51.tar.gz

      IBM AIX 5.1 

      Irix65/tar/n1ge-6_1-bin-aix43.tar.gz

      IBM AIX 4.3 

      コマンドプロンプトに次のコマンドを入力します。なお、入力例中の basedir は、完全ディレクトリ cdrom-mount-point/N1_Grid_Engine_6_1 の略です。


      % su 
      # cd sge-root
      # gzip -dc basedir/Common/tar/n1ge-6_1-common.tar.gz | tar xvpf -
      # gzip -dc basedir/Solaris_sparc/tar/n1ge-6_1-bin-solsparc32.tar.gz | tar xvpf -
      # gzip -dc basedir/Solaris_sparc/tar/n1ge-6_1-bin-solsparc64.tar.gz | tar xvpf -
      # SGE_ROOT=sge-root; export SGE_ROOT
      # util/setfileperm.sh $SGE_ROOT