Sun N1 System Manager 1.3 Grid Engine プロビジョニングおよび監視マニュアル

第 2 章 管理対象サーバーへの N1 Grid Engine のプロビジョニング

この章では、N1SM の CLI のコマンドを使用して N1 Grid Engine をプロビジョニング (インストール) および管理する方法について説明します。N1SM の CLI を使用して、次の作業を行うことができます。

Sun Control Station Grid Engine 管理モジュール (GEMM) のほとんどの機能が N1SM の CLI のコマンドを複製したものです。たとえば、次の機能があります。

N1SM を使用した N1 Grid Engine のインストール

管理対象サーバーに N1GE をインストールする大まかな手順は、次のとおりです。

  1. Sun Download Center またはその他のメディアをソースとして使用して、N1GE ソフトウェアを N1SM 管理サーバーにコピーします。「N1 Grid Engine ソフトウェアを管理サーバーにダウンロードする」を参照してください。

  2. これらのファイルを使用して N1GE のバージョンを作成します。「N1GE のバージョンを作成する」を参照してください。

  3. バージョンに関連付けられた N1GE アプリケーションプロファイルを作成します。「N1GE のアプリケーションプロファイルを作成する」を参照してください。

  4. アプリケーションプロファイルを管理対象サーバーにロードし、各サーバーの N1GE のロールを定義します。「サーバーへの N1 Grid Engine のインストール」を参照してください。

N1 Grid Engine のバージョンの作成と管理

ここでは、次の作業を行うコマンドについて説明します。

N1GE のバージョンとは

N1GE のバージョンとは、OS 固有の N1GE のtar.gz ファイルと n1ge-6_0u4–common.tar.gz ファイルの組み合わせです。たとえば、Solaris、Linux、および MS-Windows 固有のサーバーごとに異なる N1GE のバージョンが必要です。次の表に、Sun Download Center (SDLC) からダウンロードできる OS 固有の N1GE のバージョンをいくつか示します。この表に示すバージョンが、N1SM でサポートされているバージョンです。ほかのオペレーティングシステムの N1GE のバージョンもあり、N1SM で使用できる場合もありますが、正式にサポートはされていません。

N1GE のプラットフォーム固有のファイル

プラットフォーム

Solaris_sparc/tar/n1ge-6_0u4-bin-solaris.tar.gz

Solaris 7、Solaris 8、Solaris 9 オペレーティングシステム用の Solaris (SPARC プラットフォーム) 32 ビットバイナリ。N1SM は Solaris 7 と Solaris 8 をサポートしていません。 

Solaris_sparc/tar/n1ge-6_0u4-bin-solaris-sparcv9.tar.gz

Solaris 7、Solaris 8、Solaris 9 オペレーティングシステム用の Solaris (SPARC プラットフォーム) 64 ビットバイナリ。N1SM は Solaris 7 と Solaris 8 をサポートしていません。 

Solaris_x86/tar/n1ge-6_0u4-bin-solaris-i586.tar.gz

Solaris 8 および Solaris 9 オペレーティングシステム用の Solaris (x86 プラットフォーム) バイナリ 

Solaris_x64/tar/n1ge-6_0u4-bin-solaris-x64.tar.gz

Solaris 10 オペレーティングシステム用の Solaris (x64 プラットフォーム) 64 ビットバイナリ 

Windows/tar/n1ge-6_0u4-bin-win32-x86.tar.gz

Microsoft Windows (Windows 2000、XP、および Windows Server 2003 用の x86 プラットフォーム 32 ビットバイナリ)。N1SM は Windows 2000 をサポートしていません。 

Linux24_i586/tar/n1ge-6_0u4-bin-linux24-i586.tar.gz

2.4 カーネル用の Linux (x86 プラットフォーム) バイナリ 

Linux24_amd64/tar/n1ge-6_0u4-bin-linux24-amd64.tar.gz

2.4 カーネル用の Linux (AMD プラットフォーム) バイナリ 

サポートする OS に固有の N1GE tar ファイルと n1ge-6_0u4–common.tar.gz ファイルをコピーする必要があります。


注 –

N1GE モジュールでは、tar.gz 形式のファイル だけを使用できます。


ProcedureN1 Grid Engine ソフトウェアを管理サーバーにダウンロードする

N1GE のバージョンを作成する前に、バージョンを管理対象サーバーにプロビジョニングするのに使用する管理サーバーが、N1GE のアプリケーションファイルにアクセスできるようにしてください。使用可能な tar ファイルは、前述の表に示しています。

    目的の tar ファイルをソースのある場所から N1SM 管理サーバーにコピーします。

ProcedureN1GE のバージョンを作成する

始める前に

N1GE の tar ファイルが管理サーバーで使用可能になったら、これらのファイルを使用して N1SM N1GE のバージョンを作成できます。

  1. N1SM の CLI にアクセスします (「N1SM の CLI のアクセス」を参照)。

  2. N1 Grid Engine ソフトウェアのバージョンの作成には、create application コマンドを使用します。このコマンドの構文は、次のとおりです。


    create application application file [file, file...] type GridEngine
    application

    N1GE のバージョンの一意の名前です。例: N1GE6_U4

    file

    コピーする N1GE ファイルの絶対パスです。N1GE アプリケーションの *.tar.gz インストールファイルを指定できます。各 N1GE アプリケーションには n1ge-6_0u4–common.tar.gz ファイルが必要です。

    type

    アプリケーションの種類です。この場合は GridEngine です。


    注 –

    OS プロファイルの場合とは異なり、N1GE を N1 System Manager にコピーしたときにデフォルトのアプリケーションプロファイルは自動的に作成されません。プロファイルは、create applicationprofile コマンドを使用して自身で作成する必要があります。



例 2–1 N1 Grid Engine のバージョンの作成

グリッドが Solaris 9 SPARC ホストから構成される場合は、バージョンに次のファイルを含める必要があります。


N1-ok>create application N1GE6_U4 file Solaris_sparc/tar/n1ge-6_0u4-bin-solaris.tar.gz,n1ge-6_0u4–n1ge-6_0u4–common.
tar.gz type GridEngine

Procedure使用可能な N1GE のバージョンを表示する

使用可能なすべての N1GE のバージョンを一覧表示するか、ファイル一覧など、特定のバージョンに関する詳細情報を表示するには、show application コマンドを使用します。

  1. N1SM の CLI にアクセスします (「N1SM の CLI のアクセス」を参照)。

  2. 使用可能なすべての N1GE のバージョンを一覧表示するには、次のコマンドを使用します。


    show application all type GridEngine
  3. 特定の N1GE のバージョンに関する詳細情報を表示するには、次のコマンドを使用します。


    show application application type GridEngine
    all

    使用可能なすべての N1GE のバージョンを一覧表示します。

    application

    N1GE のバージョンの名前です。

    type

    アプリケーションの種類です。この場合は GridEngine です。


例 2–2 N1GE のバージョンの表示


N1-ok>show application all type GridEngine

N1-ok>show application N1GE6_U4 type GridEngine

ProcedureN1GE のバージョンを削除する

始める前に

サーバーに配備されている N1GE のバージョンは削除できません。配備を取り消すには、unload group コマンドまたは unload server コマンドを使用してアプリケーションプロファイルを先に削除します。


unload group group applicationprofile applicationprofile type GridEngine

unload server server applicationprofile applicationprofile type GridEngine
  1. N1SM の CLI にアクセスします (「N1SM の CLI のアクセス」を参照)。

  2. N1 System Manager から N1GE のバージョンを削除するには、次のコマンドを使用します。


    delete application application type GridEngine
    application

    N1GE のバージョンの名前です。Create Application コマンドで指定したものです。

    type

    プロファイルのアプリケーションの種類です。この場合は GridEngine です。


例 2–3 N1GE のバージョンの削除


N1-ok>delete application N1GE6_U4 type GridEngine

次の作業

N1GE のバージョンを作成したら、バージョンをサーバーにプロビジョニングする前に、アプリケーションプロファイルを作成し、特定のバージョンに関連付ける必要があります。この作業を行う方法については、次の節で説明します。

N1GE のアプリケーションプロファイルの作成と管理

ここでは、N1GE のアプリケーションプロファイルを作成および管理する方法について説明します。アプリケーションプロファイルは、N1GE のバージョンの配備と機能の属性を示します。この節では、次の作業について説明します。

ProcedureN1GE のアプリケーションプロファイルを作成する

始める前に

N1GE のバージョンを作成したら、アプリケーションプロファイルを作成してバージョンに関連付けます。このプロファイルは、N1GE のバージョンの構成ファイルのようなものですが、実際には一連のデータベース値です。プロファイルでは、N1GE の execd デーモンに使用する TCP ポートや、警告を発生させるしきい値などの属性を指定します。

バージョンには複数のアプリケーションプロファイルを関連付けることができますが、グリッドで一度にアクティブにできるのは 1 つだけです。N1GE を管理対象サーバーに配備するときに指定するのはアプリケーションプロファイルです。


ヒント –

この機能は、GEMM アプリケーションの「Settings」メニュー項目と似ています。



注 –

グリッド内でのサーバーの実際のロール (マスターホストなど) は、アプリケーションプロファイルの属性ではありません。このロールは、アプリケーションプロファイルを目的のサーバーにロードするときに定義します。


  1. N1SM の CLI にアクセスします (「N1SM の CLI のアクセス」を参照)。

  2. 次のコマンドを使用してアプリケーションプロファイルを作成します。デフォルトの N1GE 属性で問題がない場合は、属性を明示的に指定する必要はありません。このコマンドの構文は、次のとおりです。


    create applicationprofile applicationprofile application application type GridEngine
    [N1GE-Attribute attributevalue, N1GE-Attribute attributevalue, ...]
    applicationprofile

    さまざまな N1GE サーバーのプロビジョニングに使用するアプリケーションプロファイルの一意の名前です。

    application

    このアプリケーションプロファイルに関連付ける N1GE の特定のバージョンの名前です。この値は、create application コマンドで指定した名前です。

    type

    プロファイルのアプリケーションの種類です。この場合は GridEngine です。

    N1GE-Attribute

    定義する N1GE 属性です。

    N1GE の属性 — これらの属性は、アプリケーションバージョンを配備する方法を定義し、プロファイルがアクティブになったときに機能します。アプリケーションプロファイルは複数作成できますが、グリッドで一度にアクティブにできるのは 1 つだけです。

    • adminhomedirN1GE の管理ユーザーのホームディレクトリです。デフォルト値は /gridware/sge です。

    • adminuidN1GE の管理ユーザーの UID です。デフォルト値は 218 です。

    • adminusernameN1GE の管理ユーザーのユーザー名です。デフォルト値は sgeadmin です。

    • execdportN1GE の execd デーモンに使用する TCP ポートです。デフォルト値は 837 です。

    • instversion計算ホストと送信ホストに配備する N1GE のバージョンです。デフォルト値は存在しません。

    • lnxnfsmtoptscommon ディレクトリを Linux の計算ホストまたは送信ホストにマウントするときに使用するオプションです。このフィールドの値は、nfsservername:nfsmountpoint nfsmountpoint nfs lnxnfsmtopts 0 0 として、各ホストの Linux の /etc/fstab ファイルに挿入されます。デフォルト値は intr,softload です。この値に空白を含めることはできません。

    • loadcriticalこのパラメータを使用して負荷の重大しきい値を指定します。このしきい値を超えると、負荷の重大警告がモニターに表示されます。負荷警告パラメータと同様に、このパラメータは、CPU 数に基づくシステム負荷で設定します。デフォルト値は 3.00 です。

    • loadwarningこのパラメータを使用して負荷警告のしきい値を指定します。このしきい値を超えると、負荷警告がモニターに表示されます。値は、OS で報告されたシステム負荷を CPU 数で割ったものです。デフォルト値は 1.00 です。

    • masterportN1GE の qmaster デーモンに使用する TCP ポートです。デフォルト値は 836 です。

    • maxpendtimeこのパラメータを使用して、ジョブが保留されてからジョブ保留警告をモニターに表示するまでの時間を指定します。値は時間単位で設定します。デフォルト値は 24 です。

    • memcriticalこのパラメータを使用して、メモリーの重大しきい値を設定します。値がこのしきい値を下回ると、メモリーの重大警告がモニターに表示されます。値は M バイト単位で仮想メモリーの空き容量を設定します。デフォルト値は 10 です。

    • memwarningこのパラメータを使用してメモリー警告のしきい値を設定します。値がこのしきい値を下回ると、メモリー警告がモニターに表示されます。パラメータの値は M バイト単位で仮想メモリーの空き容量を設定します。デフォルト値は 100 です。

    • nfsmountpointNFS サーバーから N1GE の common ディレクトリ用にマウントされるディレクトリです。この値は、N1GE を使用してマスターホストを配備するときに自動的に sgeroot/ sgecell/common に設定されます。マスターホストを配備したら、この値は編集できなくなり、計算ホストと送信ホストのその後のすべての配備に有効です。この設定を再設定するには、マスターホストをアンインストールする必要があります。デフォルト値は /gridware/sge/default/common です。

    • nfsservernameNFS サーバーの名前。すべての計算ホストと送信ホストは、NFS サーバーを中継して N1GE の「common」ディレクトリをマウントします。このパラメータは、N1GE を使用してマスターホストを配備するときに自動的にマスターホストに設定されます。マスターホストを配備したら、この値は編集できなくなり、計算ホストと送信ホストのその後のすべての配備に有効です。この設定を再設定するには、マスターホストをアンインストールする必要があります。デフォルト値は存在しません。

    • proxyhost監視コマンドを実行するホストを指定します。マスターホストが以前に N1GE を使用して配備された場合は、プロキシホストがこのホストに設定され、マスターをアンインストールするまで変更できません。選択するホストは N1GE の管理ホストである必要があります。管理ホストではなかった場合、ほかのホストのインストールとアンインストール、および監視に失敗する可能性があります。デフォルト値は存在しません。

    • sgecell配備に使用する N1GE のセル名です。デフォルト値は default です。

    • sgerootN1GE のファイルをインストールするルートディレクトリです。ファイルはすべてのホストでこのディレクトリにインストールされます。デフォルト値は /gridware/sge です。

    • solnfsmtopts「common」ディレクトリを Solaris の計算ホストまたは送信ホストにマウントするときに使用するオプションです。このフィールドの値は、nfsservername:nfsmountpoint nfsmountpoint nfs -yes solnfsmtopts として、各ホストの Solaris の /etc/vfstab ファイルに挿入されます。デフォルト値は存在しません。この値に空白を含めることはできません。


例 2–4 アプリケーションプロファイルの作成


N1-ok>create applicationprofile N1GE6_U4_Profile application GE6U4 type GridEngine

Procedure使用可能な N1GE のアプリケーションプロファイルを表示する

使用可能なすべてのアプリケーションプロファイルを一覧表示するか、特定のアプリケーションプロファイルに関する詳細情報を一覧表示するには、show applicationprofile コマンドを使用します。

  1. N1SM の CLI にアクセスします (「N1SM の CLI のアクセス」を参照)。

  2. 使用可能なすべての N1GE アプリケーションプロファイルを一覧表示する場合は、次のコマンドを使用します。


    show applicationprofile all type GridEngine
  3. 特定の N1GE アプリケーションプロファイルの詳細情報を一覧表示する場合は、次のコマンドを使用します。


    show applicationprofile applicationprofile type GridEngine
    all

    使用可能なすべての N1GE アプリケーションプロファイルを一覧表示します。

    applicationprofile

    特定の N1GE アプリケーションプロファイルの名前です。

    type

    プロファイルのアプリケーションの種類です。この場合は GridEngine です。


例 2–5 アプリケーションプロファイルの表示


N1-ok>show applicationprofile [all] type GridEngine

N1-ok>show applicationprofile N1GE6_U4_Profile type GridEngine

show applicationprofile コマンドによって表示されるアプリケーションプロファイルの典型的な例を次に示します。


Name:             p1
Application Name:
Type:             GridEngine
Active:           false
adminhomedir:     /gridware/sge
adminuid:         218
adminusername:    sgeadmin
execdport:        837
instversion:
lnxnfsmtopts:     defaults
loadcritical:     3
loadwarning:      1
masterhost:
masterport:       836
masterready:
maxpendtime:      24
memcritical:      10
memwarning:       100
nfsmountpoint:    /gridware/sge/default/common
nfsservername:
proxyhost:
proxyisadmin:
sgecell:          default
sgeroot:          /gridware/sge
solnfsmtopts:

ProcedureN1GE のアプリケーションプロファイルを削除する

始める前に

N1GE のアプリケーションプロファイルを削除するには、そのプロファイルを使用してインストールしたマスターホストを先にアンインストールする必要があります。N1GE をマスターホストから削除するには、unload server コマンドを使用します。

  1. N1SM の CLI にアクセスします (「N1SM の CLI のアクセス」を参照)。

  2. delete applicationprofile コマンドを使用して N1GE のアプリケーションプロファイルを削除します。コマンド構文は次のとおりです。


    delete applicationprofile applicationprofile type GridEngine
    applicationprofile

    削除する N1GE のアプリケーションプロファイルの名前です。

    type

    プロファイルのアプリケーションの種類です。この場合は GridEngine です。


例 2–6 N1GE のアプリケーションプロファイルの削除


N1-ok>delete applicationprofile N1GE6_U4_Profile type GridEngine

次の作業

N1GE のバージョンのアプリケーションプロファイルを作成したら、そのプロファイルを使用して Grid Engine システムをプロビジョニングできます。「サーバーへの N1 Grid Engine のインストール」を参照してください。

N1GE の設定の管理

N1GE の設定は、特定のアプリケーションプロファイルの属性を反映するグローバル値です。アプリケーションプロファイルは複数作成できますが、グリッドで一度にアクティブにできるのは 1 つだけです。設定は、create applicationprofile コマンドの属性セクションにあります。特定のプロファイルの設定を表示するには、次のコマンドを使用します。


show applicationprofile applicationprofile type GridEngine

ここで applicationprofile は設定を表示するプロファイルの名前です。

show applicationprofile コマンドで出力されるアプリケーションプロファイルの典型的な例を次に示します。


Name:             p1
Application Name:
Type:             GridEngine
Active:           false
adminhomedir:     /gridware/sge
adminuid:         218
adminusername:    sgeadmin
execdport:        837
instversion:
lnxnfsmtopts:     defaults
loadcritical:     3
loadwarning:      1
masterhost:
masterport:       836
masterready:
maxpendtime:      24
memcritical:      10
memwarning:       100
nfsmountpoint:    /gridware/sge/default/common
nfsservername:
proxyhost:
proxyisadmin:
sgecell:          default
sgeroot:          /gridware/sge
solnfsmtopts:

アプリケーションプロファイルの設定の変更

アクティブなアプリケーションプロファイルは、マスターホストのインストール時に使用したプロファイルです。アプリケーションプロファイルがアクティブ状態のときに一部のグローバル設定を変更できます。変更すると、グリッド全体に適用されます。ただし、特定のサーバーの設定を変更することはできません。アクティブではないプロファイルについては、任意の設定を変更できます。

マスターホストを N1SM で管理しているときは、アクティブなプロファイルの次の設定だけを変更できます。

マスターホストが外部ホストのとき (プロキシホストを使用している場合) は、アクティブなプロファイルの次の設定だけを変更できます。

Procedureアプリケーションプロファイルの設定を変更する

  1. N1SM の CLI にアクセスします (「N1SM の CLI のアクセス」を参照)。

  2. 変更するプロファイルが現在アクティブ状態の場合は、プロファイルをアンロードします (「管理対象サーバーから N1GE をアンロードする」を参照)。

  3. プロファイルを編集して変更します。

  4. プロファイルを再ロードします (「管理対象サーバーに N1GE をロードする」を参照)。

サーバーへの N1 Grid Engine のインストール

N1GE のバージョンは、管理対象サーバーのグループまたは個々のサーバーにインストールできます。インストールするには、アプリケーションプロファイルをサーバーにロードすると同時にサーバーの N1GE のロールを指定します。


注 –

マスターホストは、load group コマンドでインストールできません。N1GE のマスターホストを作成するには、load server コマンドを使用します。


Procedure管理対象サーバーのグループに N1GE をロードする

始める前に

N1GE を配備するには、特定の N1GE のバージョンを指定してアプリケーションを作成し、インストールパラメータを指定して、関連付けられたアプリケーションプロファイルを作成しておいてください。

  1. N1SM の CLI にアクセスします (「N1SM の CLI のアクセス」を参照)。

  2. load group コマンドを使用して、N1GE のバージョンをサーバーのグループにインストールします。コマンド構文は次のとおりです。


    load group group applicationprofile applicationprofile 
    type GridEngine hosttype [hosttype]
    group

    サーバーグループの名前です。サーバーグループを作成するには、N1SM の create group コマンドを使用します。

    applicationprofile

    ロードする N1GE のアプリケーションプロファイルの名前です。

    type

    プロファイルのアプリケーションの種類です。この場合は GridEngine です。

    hosttype

    インストールする N1 Grid Engine のホストの種類です。有効な値は compute (実行ホストともいう) と submit (アクセスホストともいう) です。


例 2–7 サーバーグループへの N1GE のロード


N1-ok>load group MyComputeServers applicationprofile N1GE6_U4_profile type GridEngine hosttype compute

Procedure管理対象サーバーに N1GE をロードする

  1. N1SM の CLI にアクセスします (「N1SM の CLI のアクセス」を参照)。

  2. load server コマンドを使用して、N1GE を 1 つまたは複数の管理対象サーバーにインストールします。コマンド構文は次のとおりです。


    load server server[,server...] applicationprofile applicationprofile type GridEngine hosttype [hosttype]
    server

    サーバーの管理名です。

    applicationprofile

    ロードする N1GE のアプリケーションプロファイルの名前です。

    type

    プロファイルのアプリケーションの種類です。この場合は GridEngine です。

    hosttype

    インストールする N1 Grid Engine のホストの種類です。有効な値は compute (実行ホストともいう)、submit (アクセスホストともいう)、および master です。


例 2–8 マスターホストへの N1GE のロード


N1-ok>load server MyMasterHost applicationprofile N1GE6_U4_profile 
type GridEngine hosttype master

Procedure管理対象サーバーのグループから N1GE をアンロードする

始める前に

unload group コマンドを使用してN1GE のマスターホストをアンインストールすることはできません。unload server コマンドを使用する必要があります。

  1. N1SM の CLI にアクセスします (「N1SM の CLI のアクセス」を参照)。

  2. unload group コマンドを使用して、サーバーグループから N1GE をアンインストールします。コマンド構文は次のとおりです。


    unload group group applicationprofile applicationprofile type GridEngine
    group

    サーバーグループの名前です。サーバーグループの作成方法については、N1SM の create group コマンドを参照してください。

    applicationprofile

    アンロードする N1GE のアプリケーションプロファイルの名前です。

    type

    プロファイルのアプリケーションの種類です。この場合は GridEngine です。


例 2–9 管理対象サーバーのグループからの N1GE のアンロード


N1-ok>unload group MyComputeServers applicationprofile N1GE6_U4_profile type GridEngine

Procedure管理対象サーバーから N1GE をアンロードする

  1. N1SM の CLI にアクセスします (「N1SM の CLI のアクセス」を参照)。

  2. unload server コマンドを使用して、1 つまたは複数のサーバーから N1GE をアンインストールします。コマンド構文は次のとおりです。


    unload server server[,server...] applicationprofile applicationprofile type GridEngine
    server

    サーバーの管理名です。

    applicationprofile

    アンロードする N1GE のアプリケーションプロファイルの名前です。

    type

    プロファイルのアプリケーションの種類です。この場合は GridEngine です。


例 2–10 管理対象サーバーからのプロファイルのアンロード


N1-ok>unload server MyMasterHost applicationprofile N1GE6_U4_profile type GridEngine