Sun N1 Grid Engine 6.1 管理ガイド

ホストの構成

N1 Grid Engine 6.1 ソフトウェアは、マスターホスト用を除き、すべてのタイプのホストのオブジェクトリストを維持しています。管理ホストオブジェクトと発行ホストオブジェクトのリストは、あるホストが管理アクセス権と発行アクセス権のどちらを持っているかを示しています。実行ホストオブジェクトにはそのほかのパラメータも含まれています。これらのパラメータの中には、ホスト上で実行中の sge_execd により報告される負荷情報や、管理者により定義された負荷パラメータのスケーリング係数があります。

ホストオブジェクトの構成は、QMON を使用するか、コマンド行から行うことができます。

QMON Host Configuration」ダイアログボックスには次の 4 つのタブがあります。

qconf コマンドは、ホストオブジェクトを管理するためのコマンド行インタフェースを提供します。

QMON を使用した実行ホストの構成

実行ホストを構成する前に、『Sun N1 Grid Engine 6.1 インストールガイド』「実行ホストをインストールする方法」の説明に従って、実行ホストにソフトウェアをインストールしてください。

実行ホストを構成するには、「QMON Main Control」ウィンドウで「Host Configuration」ボタンをクリックしてから、「Execution Host」タブをクリックします。「Execution Host」タブは次の図のようになっています。

図 1–1 「Execution Host」タブ


注 –

実行ホストから管理または発行コマンドが使用できるのは、実行ホストも管理または発行ホストとして宣言されている場合のみです。QMON を使用した管理ホストの構成」および QMON を使用した発行ホストの構成」を参照してください。


「Hosts」リストには、すでに定義されている実行ホストが表示されます。

「Load Scaling」リストには、選択した実行ホストに対して現在構成されている負荷スケーリング係数が表示されます。負荷パラメータの詳細については、「負荷パラメータ」を参照してください。

「Access Attributes」リストにはアクセス権が表示されます。アクセス権の詳細については、第 4 章「ユーザーアクセスの管理」を参照してください。

「Consumables/Fixed Attributes」リストには、ホストと関連付けられている消費可能リソース属性および固定リソース属性の、リソースの可用性が表示されます。リソース属性の詳細については、「コンプレックスリソース属性」を参照してください。

「Reporting Variables」リストには、実行ホストから負荷レポートが受信された場合に、レポートファイルに書き込まれる変数が表示されます。レポート変数の詳細については、「レポート変数の定義」を参照してください。

「Usage Scaling」リストには、さまざまなマシンの個別の使用率メトリック CPU、メモリー、および I/O の現在のスケーリング係数が表示されます。リソースの使用率は、現在実行中の各ジョブに関して、sge_execd によって定期的に報告されます。スケーリング係数は、ジョブを実行中のユーザーまたはプロジェクトに関して、特定のマシンでのリソース使用率の相対的なコストを示しています。たとえばこれらの係数は、400 MHz プロセッサでの 1 秒の CPU 時間のコストを、600 MHz CPU と比較することに使用できます。「Usage Scaling」ウィンドウに表示されないメトリックのスケーリング係数は 1 です。

実行ホストの追加または変更

実行ホストを追加または変更するには、「Add」または「Modify」をクリックします。「Add/Modify Exec Host」ダイアログボックスが表示されます。

「Add/Modify Exec Host」ダイアログボックスでは、実行ホストに関連付けられているすべての属性を変更できます。「Host」フィールドには、既存の実行ホストの名前が表示されます。

新しい実行ホストを追加する場合は、「Host」フィールドに名前を入力します。

スケーリング係数の定義

スケーリング係数を定義するには、「Scaling」タブをクリックします。

「Load Scaling」テーブルの「Load」カラムには使用可能なすべての負荷パラメータが表示され、「Scale Factor」カラムには、対応するスケーリングの定義が表示されます。「Scale Factor」カラムは編集できます。有効なスケーリング係数は、固定小数点または科学的記数法形式の正の浮動小数点数です。

「Usage Scaling」テーブルの「Usage」カラムには、使用率メトリック CPU、メモリー、および I/O の現在のスケーリング係数が表示されます。「Scale Factor」カラムには、対応するスケーリングの定義が表示されます。「Scale Factor」カラムは編集できます。有効なスケーリング係数は、固定小数点または科学的記数法形式の正の浮動小数点数です。

リソース属性の定義

リソース属性を定義してホストと関連付けるには、「Consumables/Fixed Attributes」タブをクリックします。

ホストと関連付けられているリソース属性は、「Consumables/Fixed Attributes」テーブルに表示されます。

現在のコンプレックス構成に関する詳細な情報が必要な場合、またはその情報を変更したい場合は、「Complex Configuration」ダイアログボックスを使用します 。コンプレックスリソース属性の詳細については、「コンプレックスリソース属性」を参照してください。

「Consumables/Fixed Attributes」テーブルには、値が現在定義されている対象であるすべてのリソース属性が表示されます。「Name」または「Value」カラム名のいずれかをクリックすることで、リストを拡張できます。「Attribute Selection」ダイアログボックスが表示されます。このダイアログボックスには、コンプレックスで定義されているすべてのリソース属性が含まれています。

図 1–2 「Attribute Selection」ダイアログボックス

「Consumables/Fixed Attributes」テーブルに属性を追加するには、属性を選択してから「OK」をクリックします。

属性値を変更するには、「Value」フィールドをダブルクリックしてから値を入力します。

属性を削除するには、属性を選択してから Control + D キーを押すか、マウスボタン 3 をクリックします。「OK」をクリックして、その属性を削除することを確認します。

アクセス権の定義

以前に構成したユーザーアクセスリストに基づいて実行ホストに対するユーザーのアクセス権を定義するには、「User Access」タブをクリックします。

以前に構成したプロジェクトに基づいて実行ホストに対するプロジェクトのアクセス権を定義するには、「Project Access」タブをクリックします。

レポート変数の定義

レポート変数を定義するには、「Reporting Variables」タブをクリックします。

「Available」リストには、実行ホストから負荷レポートが受信された場合にレポートファイルに書き込み可能なすべての変数が表示されます。

「Available」リストからレポート変数を選択してから赤い右矢印をクリックし、選択した変数を「Selected」リストに追加します。

「Selected」リストからレポート変数を削除するには、変数を選択してから赤い左矢印をクリックします。

実行ホストの削除

実行ホストを削除するには、「QMON Main Control」ウィンドウで「Host Configuration」ボタンをクリックしてから、「Execution Host」タブをクリックします。

「Execution Host」ダイアログボックスで、削除するホストを選択してから「Delete」をクリックします。

実行ホストデーモンの停止

実行ホストデーモンを停止するには、「QMON Main Control」ウィンドウで「Host Configuration」ボタンをクリックしてから、「Execution Host」タブをクリックします。

「Execution Host」ダイアログボックスで、ホストを選択してから「Shutdown」をクリックします。

コマンド行からの実行ホストの構成

コマンド行から実行ホストを構成するには、qconf コマンドで次の引数を使用します。

QMON を使用した管理ホストの構成

QMON Main Control」ウィンドウで「Host Configuration」ボタンをクリックします。「Administration Host」タブとともに「Host Configuration」ダイアログボックスが表示されます。「Administration Host」タブは次の図のようになっています。

図 1–3 「Administration Host」タブ


注 –

「Host Configuration」ボタンをはじめてクリックすると、デフォルトでは「Administration Host」タブが表示されます。


「Administration Host」タブを使用して、管理コマンドが使用可能なホストを構成します。「Host」リストには、すでに管理アクセス権が設定されているホストが表示されます。

管理ホストの追加

新しい管理ホストを追加するには、「Host」フィールドに名前を入力してから、「Add」をクリックするか、Return キーを押します。

管理ホストの削除

リストから管理ホストを削除するには、ホストを選択してから「Delete」をクリックします。

コマンド行からの管理ホストの構成

コマンド行から管理ホストを構成するには、qconf コマンドで次の引数を使用します。

QMON を使用した発行ホストの構成

ホストが管理ホストとしても宣言されている場合を除き、発行ホストから管理コマンドを実行することはできません。詳細については、QMON を使用した管理ホストの構成」を参照してください。

発行ホストを構成するには、「QMON Main Control」ウィンドウで「Host Configuration」ボタンをクリックしてから、「Submit Host」タブをクリックします。次の図に「Submit Host」 タブを示します。

図 1–4 「Submit Host」タブ

「Submit Host」タブを使用して、ジョブの発行、監視、および制御を行うことができるホストを宣言します。「Host」リストには、すでに発行アクセス権が設定されているホストが表示されます。

発行ホストの追加

発行ホストを追加するには、「Host」フィールドに名前を入力してから、「Add」をクリックするか、Return キーを押します。

発行ホストの削除

発行ホストを削除するには、発行ホストを選択してから「Delete」をクリックします。

コマンド行からの発行ホストの構成

コマンド行から発行ホストを構成するには、qconf コマンドで次の引数を使用します。

QMON を使用したホストグループの構成

ホストグループを使用すると、1 つの名前を使用して複数のホストを参照できます。同じようなホストは、ホストグループにグループ化してまとめることができます。ホストグループは、複数の個別ホストだけでなく、そのほかのホストグループを含むこともできます。別のホストグループのメンバーであるホストグループは、そのホストグループのサブグループになります。

たとえば、次のメンバーを含む @bigMachines というホストグループを定義できます。

@solaris64

@solaris32

fangorn

balrog

最初の @ 記号は、その名前がホストグループであることを示します。ホストグループ @bigMachines には、2 つのサブグループ @solaris64 および @solaris32 のメンバーであるすべてのホストが含まれます。また、@bigMachines には 、2 つの個別ホスト fangorn および balrog も含まれます。

QMON Main Control」ウィンドウで「Host Configuration」ボタンをクリックします。「Host Configuration」ダイアログボックスが表示されます。

「Host Groups」タブをクリックします。「Host Groups」タブは次の図のようになっています。

図 1–5 「Host Groups」タブ

ホストグループを構成するには、「Host Groups」タブを使用します。「Hostgroup」リストには、現在構成されているホストグループが表示されます。「Members」リストには、選択したホストグループのメンバーであるすべてのホストが表示されます。

ホストグループの追加または変更

ホストグループを追加するには「Add」をクリックし、ホストグループを変更するには「Modify」をクリックします。「Add/Modify Host Group」ダイアログボックスが表示されます。

新しいホストグループを追加する場合、「Hostgroup」フィールドにホストグループ名を入力します。ホストグループ名は「@」記号で始まる必要があります。

既存のホストグループを変更する場合は、「Hostgroup」フィールドにホストグループ名が入力されています。

現在構成中のホストグループにホストを追加するには、「Host」フィールドにホスト名を入力してから赤い矢印をクリックし、「Members」リストに名前を追加します。ホストグループをサブグループとして追加するには、「Defined Host Groups」リストからホストグループ名を選択してから赤い矢印をクリックし、その名前を「Members」リストに追加します。

「Members」リストからホストまたはホストグループを削除するには、ホストまたはホストグループを選択してから、ゴミ箱のアイコンをクリックします。

変更を保存するには「Ok」をクリックし、ダイアログボックスを閉じます。変更を保存せずにダイアログボックスを閉じるには、「Cancel」をクリックします。

ホストグループの削除

ホストグループを削除するには、「Hostgroup」リストからホストグループを選択してから「Delete」をクリックします。

コマンド行からのホストグループの構成

コマンド行からホストグループを構成するには、qconf コマンドで次の引数を使用します。

qhost を使用した実行ホストの監視

実行ホストの状態の概要をすばやく取得するには、次のように qhost コマンドを使用します。


% qhost

このコマンドにより、次の例のような出力が作成されます。


例 1–1 qhost の出力例


HOSTNAME                ARCH         NCPU  LOAD  MEMTOT  MEMUSE  SWAPTO  SWAPUS
-------------------------------------------------------------------------------
global                  -               -     -       -       -       -       -
arwen                   aix43           1     -       -       -       -       -
baumbart                irix65          2  0.00    1.1G   91.5M  128.0M     0.0
boromir                 hp11            1     -  128.0M       -  256.0M       -
carc                    lx24-amd64      2  0.00    3.8G  989.8M    1.0G     0.0
denethor                aix51           1 4.54G       -       -       -       -
durin                   lx24-x86        1  0.37  123.1M   46.5M  213.6M   26.6M
eomer                   sol-sparc64     1  0.13  256.0M  248.0M  513.0M   93.0M
lolek                   tru64           1  0.02    1.0G  790.0M    1.0G    8.0K
mungo                   lx22-alpha      1  1.00  248.9M   78.8M  129.8M    2.5M
nori                    sol-x86         2  0.38 1023.0M  372.0M  512.0M   37.0M
pippin                  darwin          1  0.00  640.0M  264.0M     0.0     0.0
smeagol                 hp11            1  0.35  512.0M  425.0M    1.0G   95.0M

出力形式とそのほかのオプションの詳細については、qhost(1) のマニュアルページを参照してください。

無効なホスト名

無効、予約済みなどにより使用できないホスト名のリストを次に示します。

global

template

all

default

unknown

none

コマンド行からのデーモンの終了

コマンド行から Grid Engine システムデーモンを終了するには、次のいずれかのコマンドを使用します。


% qconf -ke[j] {hostname,... | all}
% qconf -ks
% qconf -km

これらのコマンドを使用するには、管理者特権またはオペレータ特権が必要です。管理者特権およびオペレータ特権の詳細については、第 4 章「ユーザーアクセスの管理」を参照してください。

停止手続きを実行する前にすべてのアクティブなジョブが終了するのを待機したい場合は、すでに説明した qconf シーケンスを実行する前に、各クラスタキュー、キューインスタンス、またはキュードメインに対して qmod -dq コマンドを使用します。 クラスタキュー、キューインスタンス、およびキュードメインの詳細については、「キューの構成」を参照してください。


% qmod -dq {cluster-queue | queue-instance | queue-domain}

qmod -dq コマンドは、新しいジョブが、使用不可のキューインスタンスに対してスケジュールされることを防ぎます。デーモンを終了する前には、キューインスタンス内で実行中のジョブがなくなるまで待機する必要があります。

コマンド行からのデーモンの再起動

Grid Engine システムデーモンを再起動するマシンに、ルートとしてログインします。

次のコマンドを入力して、起動スクリプトを実行します。


% sge-root/cell/common/sgemaster
% sge-root/cell/common/sgeexecd

これらのスクリプトは、このホストで通常は実行中であるデーモンを探し、対応するデーモンを起動します。