Sun N1 Grid Engine 6.1 管理ガイド

キューの構成

キューとは、さまざまなカテゴリのジョブのコンテナです。キューは、同じカテゴリに属する複数のジョブの並行実行のための、対応するリソースを提供します。

N1 Grid Engine 6 では、1 つのキューは、1 つまたは複数のホストと関連付けることができます。キューは複数のホストにまたがることができるため、そのようなキューはクラスタキューと呼ばれます。クラスタキューを使用すると、1 つのクラスタキューの構成で実行ホストのクラスタを管理できます。

クラスタキューに関連付けられている各ホストは、そのホスト上に存在する、そのクラスタキューのインスタンスを受け取ります。本ガイドでは、このようなインスタンスをキューインスタンスと呼びます。クラスタキュー内では、各キューインスタンスを別々に構成できます。個別のキューインスタンスを構成することで、1 つのクラスタキュー構成で、実行ホストの異機種システム混在クラスタを管理できます。

あるクラスタキューを変更する場合、そのキューインスタンスのすべては同時に変更されます。1 つのクラスタキュー内で、複数のキューインスタンスの構成の違いを指定できます。その結果、一般的な設定には少数のクラスタキューのみが含まれ、これらのクラスタキューにより制御されるキューインスタンスは、大部分がバックグラウンドのままになります。


注 –

クラスタキューとキューインスタンスの区別は重要です。たとえば、ジョブは常にキューインスタンスで実行され、クラスタキューでは実行されません。


クラスタキューを構成する際には、次のホストオブジェクトの任意の組み合わせを、クラスタキューに関連付けることができます。


注 –

並列環境でキューが正しく動作できるようにするには、キューを並列環境に関連付けます。この関連付けによって、リソースのより多くの制御が可能になり、並列作業負荷の処理に特定のキューを割り当てることができます。

queue_conf(5) pe_list 属性を使用して、適した並列環境を特定してください。次に、QMON ユーティリティーか次の形式の qconf コマンドを使用して、並列環境とキューを関連付けます。


# qconf -mq <queue_name>

ホストグループは、まとめて同じものとして扱うことができるホストのグループです。ホストグループを使用すると、1 つのホストグループ構成によって複数のホストを管理することができます。ホストグループの詳細については、QMON を使用したホストグループの構成」を参照してください。

個別ホストをクラスタキューに関連付ける場合、各ホスト上で結果として作成されるキューインスタンスの名前は、クラスタキュー名とホスト名を結び付けたものです。クラスタキュー名とホスト名は、@ 記号で区切ります。たとえば、ホスト myexechost とクラスタキュー myqueue を関連付ける場合、myexechost 上のキューインスタンスの名前は myqueue@myexechost になります。

ホストグループとクラスタキューを関連付ける場合は、キュードメインと呼ばれるものを作成します。キュードメインを使用すると、同じクラスタキューの一部であり、割り当てられたホストが同じホストグループの一部である、キューインスタンスのグループを管理できます。キュードメイン名は、@ を区切り記号として、クラスタキュー名とホストグループ名を結合したものです。たとえば、ホストグループ myhostgroup をクラスタキュー myqueue と関連付ける場合は、キュードメインの名前は myqueue@@myhostgroup になります。


注 –

すべてのホストグループ名は @ 記号で始まるため、キュードメイン名には常に 2 つの @ 記号が含まれます。


ジョブは、キューインスタンス内では待機しません。ジョブは、振り分けられるとすぐに実行を開始します。スケジューラの保留中のジョブのリストは、ジョブの唯一の待機領域です。

キューを構成すると、sge_qmaster にキュー属性が登録されます。キューは構成されるとすぐに、クラスタ全体と、Grid Engine システムに属する全ホスト上の全ユーザーに表示されるようになります。

詳細については、queue_conf(5) のマニュアルページを参照してください。

QMON を使用したキューの構成

QMON Main Control」ウィンドウで「Queue Control」ボタンをクリックします。「Cluster Queues」ダイアログボックスが表示されます。

クラスタキューとキューインスタンスの状態を監視および操作するための、「Cluster Queues」ダイアログボックスとその機能は、『Sun N1 Grid Engine 6.1 ユーザーズガイド』「QMON によるキューの監視と制御」で説明されています。

新しいクラスタキューを追加するには、「Add」をクリックします。

既存のクラスタキューを変更するには、「Cluster Queue」リストからクラスタキューを選択してから「Modify」をクリックします。

「Clone」ボタンを使用すると、既存のクラスタキューのすべてのパラメータをインポートできます。既存のキューのリストから、複製するキューを選択します。

「Add」をクリックすると「Queue Configuration – Add」ダイアログボックスが表示されます。「Modify」をクリックすると「Modify キュー名」ダイアログボックスが表示されます。「Queue Configuration」ダイアログボックスがはじめて表示される際には、「General Configuration」タブが表示されます。

図 2–1 「Queue Configuration」–「General Configuration」タブ

既存のキューを変更する場合、「Queue Name」フィールドにキューの名前が表示されます。キューインスタンスが存在するホストが、「Hostlist」フィールドに表示されます。

新しいクラスタキューを追加する場合、キューの名前と、キューインスタンスが存在するホストの名前を指定する必要があります。

「Hostlist」フィールドでは、個別のホストの名前を指定できます。また、以前に定義したホストグループの名前も指定できます。このクラスタキューのキューインスタンスは、(すべてのホストサブグループのメンバーを含む) ユーザーが指定するホストグループのすべての個別ホストとすべてのメンバー上に存在します。ホストグループの詳細については、QMON を使用したホストグループの構成」を参照してください。

パラメータのセットを指定するための次の 11 のタブは、キューの定義に使用できます。

クラスタキューのデフォルトのパラメータを設定するには、「Attributes for Host/Hostgroup」リストで「@/」を選択してから、設定するパラメータが含まれるタブをクリックします。

デフォルトのパラメータは、「Hostlist」に表示されるすべてのホスト上のすべてのキューインスタンスに対して設定されます。ユーザーは、ユーザーが指定するホストまたはホストグループのデフォルトのパラメータの値を無効にすることができます。ホストまたはホストグループの override パラメータを設定するには、まず「Attributes for Host/Hostgroup」リストから名前を選択します。続いて設定するパラメータを含むタブをクリックします。ユーザーが設定したパラメータの値は、選択したホストまたはホストグループ上の、クラスタキューのデフォルトのパラメータを無効にします。

ホスト固有のパラメータを設定するには、まず構成に対してパラメータを使用可能にする必要があります。設定するパラメータの左側にある錠前のアイコンをクリックしてから、そのパラメータの値を変更します。

「Refresh」ボタンをクリックすると、 「Queue Configuration」ダイアログボックスが開かれていた間に変更されたそのほかのオブジェクトの設定が読み込まれます。

すべてのキュー構成の変更を sge_qmaster に登録するには、「OK」をクリックしてダイアログボックスを閉じます。変更を保存せずにダイアログボックスを閉じるには、「Cancel」をクリックします。

一般的なパラメータの構成

一般的なパラメータを構成するには、「General Configuration」タブをクリックします。図 2–1 に「General Configuration」タブを示します。

次のパラメータを指定できます。

これらのパラメータの詳細については、queue_conf(5) のマニュアルページを参照してください。

実行方法パラメータの構成

実行方法パラメータを構成するには、「Execution Method」タブをクリックします。次の図に「Execution Method」タブを示します。

次のパラメータを指定できます。

これらのパラメータの詳細については、queue_conf(5) のマニュアルページを参照してください。

チェックポイント設定パラメータの構成

チェックポイント設定パラメータを構成するには、「Checkpointing」タブをクリックします。次の図に「Checkpointing」タブを示します。

次のパラメータを指定できます。

キューからチェックポイント設定環境を参照するには、「Available」リストからチェックポイント設定環境の名前を選択し、右矢印をクリックしてそれを「Referenced」リストに追加します。

「Referenced」リストからチェックポイント設定環境を削除するには、それを選択してから左矢印をクリックします。

チェックポイント設定環境を追加または変更するには、赤い矢印の下にあるボタンをクリックして、「Checkpointing Configuration」ダイアログボックスを開きます。詳細については、QMON を使用したチェックポイント設定環境の構築」を参照してください。

これらのパラメータの詳細については、queue_conf(5) のマニュアルページを参照してください。

並列環境の構成

並列環境を構成するには、「Parallel Environment」タブをクリックします。次の図に「Parallel Environment」タブを示します。

次のパラメータを指定できます。

キューから並列環境を参照するには、「Available PEs」リストから並列環境の名前を選択し、右矢印をクリックしてそれを「Referenced PEs」リストに追加します。

「Referenced PEs」リストからチェックポイント環境を削除するには、それを選択してから左矢印をクリックします。

並列環境を追加または変更するには、赤い矢印の下にあるボタンをクリックして、「Parallel Environment Configuration」ダイアログボックスを開きます。詳細については、QMON を使用した並列環境の構成」を参照してください。

このパラメータの詳細については、queue_conf(5) のマニュアルページを参照してください。

負荷および一時停止しきい値の構成

負荷および一時停止しきい値を構成するには、「Load/Suspend Thresholds」タブをクリックします。次の図に「Load/Suspend Thresholds」タブを示します。

次のパラメータを指定できます。

これらのパラメータの詳細については、queue_conf(5) のマニュアルページを参照してください。

制限の構成

制限のパラメータを構成するには、「Limits」タブをクリックします。次の図に「Limits」 タブを示します。

次のパラメータを指定できます。

制限値を変更するには、値を変更するフィールドの右側にあるボタンをクリックします。Memory または Time 制限値のいずれかを入力できるダイアログボックスが表示されます。

制限パラメータと、さまざまなオペレーティングシステムアーキテクチャーにおけるそれらの解釈の詳細については、queue_conf(5) および setrlimit(2) のマニュアルページを参照してください。

コンプレックスリソース属性の構成

リソース属性を構成するには、「Complex」タブをクリックします。次の図に「Complex」 タブを示します。

次のパラメータを指定できます。

これらの属性の詳細については、queue_conf(5) のマニュアルページを参照してください。

ユーザー定義リソース属性をキューに関連付ける前、またはキューからユーザー定義リソース属性を切り離す前には、「Complex Configuration」ダイアログボックスを使用して、現在のコンプレックス構成を確認または変更します。「Complex Configuration」ダイアログボックスにアクセスするには、「QMON Main Control」ウィンドウの「Complex Configuration」ボタンをクリックします。例は、図 3–1 を参照してください。

従属キューの構成

従属キューを構成するには、「Subordinates」タブをクリックします。次の図に「Subordinates」 タブを示します。

従属キューの機能を使用して、高優先順位および低優先順位のキューだけでなく、スタンドアロンキューを実装します。

次のパラメータを指定できます。

これらのパラメータの詳細については、queue_conf(5) のマニュアルページを参照してください。

ユーザーアクセスパラメータの構成

ユーザーアクセスパラメータを構成するには、「User Access」タブをクリックします。次の図に「User Access」 タブを示します。

次のパラメータを指定できます。

ユーザーアクセスリストを追加または変更するには、「Available Access Lists」と「Allow Access」および「Deny Access」リストの間にあるボタンをクリックして、 「User Configuration」ダイアログボックスを開きます。詳細については、QMON を使用したユーザーアクセスリストの構成」を参照してください。

これらのパラメータの詳細については、queue_conf(5) のマニュアルページを参照してください。

プロジェクトアクセスパラメータの構成

プロジェクトアクセスパラメータを構成するには、「Project Access」タブをクリックします。次の図に「Project Access」 タブを示します。

次のパラメータを指定できます。

プロジェクトアクセス権を追加または変更するには、「Available Projects」リストと「Allow Project Access」および「Deny Project Access」リストの間にあるボタンをクリックして、 「Project Configuration」ダイアログボックスを開きます。詳細については、QMON を使用したプロジェクトの定義」を参照してください。

これらのパラメータの詳細については、queue_conf(5) のマニュアルページを参照してください。

所有者パラメータの構成

所有者パラメータを構成するには、「Owners」タブをクリックします。次の図に「Owners」 タブを示します。

次のパラメータを指定できます。

これらのパラメータの詳細については、queue_conf(5) のマニュアルページを参照してください。

コマンド行からのキューの構成

コマンド行からキューを構成するには、適切なオプションを使用して次のコマンドを入力します。


# qconf オプション

qconf コマンドには次のオプションがあります。

qconf コマンドには次のオプションのセットがあり、これらを使用すると特定のキュー属性を変更できます。

-aattr – 属性の追加

-Aattr – ファイルからの属性の追加

-dattr – 属性の削除

-Dattr – ファイルに表示されている属性の削除

-mattr – 属性の変更

-Mattr – ファイルからの属性の変更

-rattr – 属性の置換

-Rattr – ファイルからの属性の置換

-sobjl – 構成オブジェクトのリストの表示

これらのオプションの使用法の説明と、その使用例については、「ファイルを使用した、キュー、ホスト、および環境の変更」を参照してください。これらのオプションの詳細については、qconf(1) のマニュアルページを参照してください。