Sun N1 Grid Engine 6.1 インストールガイド

付録 C その他の N1 Grid Engine インストールに関する問題

Linux Motif ライブラリの確認

コンパイル済みの Linux qmon バイナリが実行できないという理由から、必ずしも最新の Linux システムに libXm.so.2 Motif ライブラリがインストールされているとは限りません。

この問題を修正するには、次の手順に従います。

ProcedureLinux Motif ライブラリのインストール

  1. 次のコマンドを使用して、ライブラリがすでにインストールされているかどうかを確認します。


    % ls -l /usr/X11R6/lib/libXm*

    /usr/X11R6/lib/libXm.so.2 libXm.so.2.x バージョンを指していれば、新たにインストールする必要はありません。/usr/X11R6/lib/libXm.so.3 へのシンボリックリンクでは正常に動作しないことに注意してください。

    ライブラリがインストールされていない場合は、次の手順を続けます。

  2. http://www.ist.co.uk/DOWNLOADS/motif_download.html または SUSE 9.1 ディストリビューション (openmotif21-* という追加の rpm ファイルが使用可能) から対応する openmotif ライブラリをダウンロードします。

  3. root になり、必要なライブラリをインストールします。Suse 9.1 では、openmotif21-* をほかのパッケージと同様にインストールします。http://www.ist.co.uk からダウンロードしたパッケージでは、次の例に従ってライブラリをインストールしてください。


    # rpm -i --prefix /tmp/test --force \
          openmotif-2.1.31-2_IST-JDS2003.i386.rpm
       # cd /tmp/test/OpenMotif-2.1.31/lib
       # cp libXm.so.2.1 /usr/X11R6/lib
       # cd /usr/X11R6/lib
       # ln -s libXm.so.2.1 libXm.so.2
  4. qmon をテストします。


    % ldd `which qmon`

IPMP を使用するシステムへの N1 Grid Engine のインストール

Solaris オペレーティング環境の IP マルチパス (IPMP) テクノロジを使用しているホストに、Grid Engine ソフトウェアをインストールする方法について説明します。

IP マルチパスとは

IP マルチパスは、フェイルオーバーや負荷均衡の目的で TCP/IP インタフェースをグループ化するテクノロジです。IP マルチパスグループ内のインタフェースで問題が発生すると、そのインタフェースは使用不可になり、使用していた IP アドレスはグループ内のほかのインタフェースに再配置されます。アウトバウンド IP トラフィックは、グループのすべてのインタフェースに分散されます。IP マルチパスの詳細は、http://docs.sun.com/db/doc/806-4075/6jd69oabu?a=view で Solaris オペレーティング環境に関するマニュアルを参照してください。IPMP 機能の概要は、http://wwws.sun.com/software/solaris/ds/ds-netmultipath/index.html で参照できます。

IPMP と Grid Engine の問題

主要インタフェースが IPMP グループに属しているマシン上で Grid Engine デーモン実行時にエラーメッセージが発生するという、唯一の問題があります。この状態は、IPMP 負荷均衡によってグループ内のインタフェースすべてに接続が分散されるときに発生します。そのため、主要インタフェースに関連するホスト以外のホストから IP パケットが届いたときに、受信側に IP パケットが届くことになります。たとえば、マシン上に qfe0qfe1、および qfe3 という 3 つのインタフェースがあり、これらのインタフェースの IP アドレスがそれぞれ 10.1.1.1、10.1.1.2、および 10.1.13 である場合、IPMP はテスト用にインタフェースごとの追加のアドレスを必要とします。ただし、この例では要件は無視されています。各アドレスには、関連するホスト名があります。次に、ホストテーブルの例を示します。


10.1.1.1 sge
    10.1.1.2 sge-qfe1
    10.1.1.3 sge-qfe2

マシンのホスト名は sge です。sge から別のマシンへの接続を確立するとき、sgesge-qfe1、または sge-qfe2 を経由します。インストール時には、Grid Engine は sge のみを認識します。Grid Engine は、sge-qfe2 から接続要求を受け取った場合、認証されていない (不明の) ノードからの要求として、接続を閉じます。

この問題は、host_aliases ファイルを使用して解決します (詳細は、sge_h_aliases のマニュアルページを参照)。このファイルを使用して、Grid Engine に sgesge1、および sge-qfe2 がすべて同じマシンのノードであることを認識させることができます。次に、この場合の host_aliases ファイルの例を示します。


sge sge-qfe1 sge-qfe2

$SGE_ROOT/$SGE_CELL/common/host_aliases ファイルを変更した場合は、動作中のすべての Grid Engine デーモン (sge_qmastersge_scheduler、および sge_execd) を停止して再起動する必要があります。デーモンを停止および再起動するには、すべての Grid Engine ホストに root でログインして、次のコマンドを実行します。


/etc/init.d/sgemaster stop
/etc/init.d/sgeexecd stop
    /etc/init.d/sgemaster start
/etc/init.d/sgeexecd start

IPMP を使用する Grid Engine マスターノードのインストール

この問題の修正には、2 つの方法が使用できます。1 つは、インストール中にエラーメッセージを無視する方法です。この方法はオペレーティングシステムに依存します (MS Windows を除く)。もう 1 つは、マシンのホスト名に関連付けられているインタフェース上の IPMP を一時的に使用不可にする方法です。この方法は、Solaris 8 以降のオペレーティングシステムでのみ有効です。

    エラーメッセージを無視する方法を次に示します。

  1. デーモンの起動中、エラーメッセージを無視して inst_sge -m コマンドを実行します。

  2. /etc/init.d/sgemaster stop および /etc/init.d/sgemaster stop コマンドで、デーモンを停止します。ネットワークエラーによってデーモンの停止に失敗した場合は、kill -9 コマンドを使用してデーモンを終了する必要があります。停止に失敗したデーモンは、ps -e | grep sge_ コマンドを使用して確認できます。

  3. host_aliases ファイルを $SGE_ROOT/$SGE_CELL/common ディレクトリにインストールします。

  4. /etc/init.d/sgemaster start および /etc/init.d/sgeexecd start コマンドを使用して、デーモンを再起動します。

一時的に使用不可にする方法を次に示します。

  1. マシンのホスト名に関連付けられているインタフェースを確認します。

  2. ifconfig <<interface>> | grep groupname コマンドを使用して、インタフェースで IPMP が使用可能になっていることを確認します。

  3. グループ名をメモします。

  4. ifconfig <<interface>> group "" コマンドで、IPMP を使用不可にします。

  5. Grid Engine マスターノードをインストールします。

  6. host_aliases ファイルを $SGE_ROOT/$SGE_CELL/common ディレクトリにインストールします。

  7. /etc/init.d/rcsge start コマンドを使用して、デーモンを再起動します。

  8. ifconfig <<interface>> group <<IPMP group>> コマンドを使用して、IPMP を使用可能にします。

IPMP を使用する実行ホストへの Grid Engine のインストール

host_aliases ファイルをインストールし、Grid Engine デーモンを再起動したら、特に問題なく実行ホストを起動できます。

IPMP を使用した管理ホストおよび発行ホストの有効化

IPMP を使用したこれらのホストを使用可能にするには、2 つの方法があります。