Sun N1 Grid Engine 6.1 ユーザーズガイド

コマンド行からのジョブの監視と制御

この節では、コマンド qstat qdel、および qmod によるコマンド行からのジョブの監視、削除、および変更方法について説明します。

qstat によるジョブの監視

ジョブを監視するには、次の節で詳述されている情報を参考に、次のコマンドのいずれかを入力します。


qstat
qstat -f
qstat -ext

オプションのない qstat では、発行したジョブだけの概要が提供されます。qstat -f では、さらに現在構成されているキューに関する情報も含まれます。qstat -ext を指定すると、ジョブの使用率の最新情報やジョブに割り当てられたチケットなどの詳細も含まれます。

最初の書式では、ヘッダ行が列の意味を示します。ほとんどの列の目的は、それ自体で説明できなければなりません。ただし、「state」列には次の意味の 1 文字のコードが含まれます。実行中は r、一時停止は s 、キュー内は q、待機は w で表されます。qstat の出力形式の詳細は、qstat(1) のマニュアルページを参照してください。

2 番目の書式は 2 つのセクションに分けられます。1 番目のセクションは、すべての使用可能なキューのステータスを表示します。PENDING JOBS というタイトルの 2 番目のセクションは、 sge_qmaster ジョブスプール空間のステータスを表示します。キューセクションの 1 行目では、リストされているキューに対する列の意味が定義されています。キューは水平線で区切られています。キュー内でジョブが実行される場合、1 番目の書式の qstat コマンドと同じ書式で、関連するキューの下にそのジョブ名が表示されます。2 番目の出力セクションの保留中のジョブは、qstat の 1 番目の書式と同じように表示されます。

キュー説明の列は、次の情報を提供します。

qstat(1) のマニュアルページにはqstat の出力形式の詳しい説明が記載されています。

3 番目の形式では、使用率およびジョブに割り当てられたチケットの値が次の列に表示されます。

さらに、期限の開始時が適宜「deadline」列に表示されます。「share」列には、クラスタ内のすべてのジョブによって発生する使用量を基準にした各ジョブの現在のリソース配分が示されます。詳細は、qstat(1) のマニュアルページを参照してください。

qstat コマンドのさまざまな追加オプションは、機能性を拡張します。発行したジョブのリソース要件を表示するには、-r オプションを使用します。さらに、出力を特定のユーザーまたはキューに限定することもできます。「リソース要件の定義」で説明されているとおり、-l オプションを使用して qsub コマンドのリソース要件を指定できます。リソース要件を使用すると、qstat によって指定されたリソース要件に一致するキューおよびそれらのキューで実行されているジョブだけが表示されます。


注 –

qstat コマンドは、管理者およびユーザーが有用なオプションを含めたファイルを定義できるように拡張されました。sge_qstat(5) のマニュアルページを参照してください。クラスタ全体の sge_qstat ファイルは、 $xxQS_NAME_Sxx_ROOT/$xxQS_NAME_Sxx_CELL/common/sge_qstat に置くことができます。ユーザー専用のファイルは、$HOME/.sge_qstat で処理されます。ホームディレクトリ要求ファイルの優先順位がもっとも高く、次がクラスタグローバルファイルです。コマンド行を使用すると、ファイルに指定したフラグよりも優先されます。


例 4–1例 4–2 に、qstatqstat -f コマンドの出力例を示します。


例 4–1 qstat -f の出力例


queuename                  qtype  used/free   load_avg   arch         states     

dq                         BIP    0/1         99.99      sun4         au     

durin.q                    BIP    2/2         0.36       sun4          
  231     0    hydra              craig       r          07/13/96     20:27:15    MASTER
  232     0    compile            penny       r          07/13/96     20:30:40    MASTER

dwain.q                    BIP    3/3         0.36       sun4          
  230     0    blackhole          don         r          07/13/96     20:26:10    MASTER
  233     0    mac                elaine      r          07/13/96     20:30:40    MASTER
  234     0    golf               shannon     r          07/13/96     20:31:44    MASTER

fq                         BIP    0/3         0.36       sun4          

################################################################################

- PENDING JOBS - PENDING JOBS - PENDING JOBS - PENDING JOBS - PENDING JOBS -

################################################################################

  236     5    word               elaine      qw         07/13/96     20:32:07

  235     0    andrun             penny       qw         07/13/96     20:31:43


例 4–2 qstat の出力例


job-ID   prior   name         user      state   submit/start at     queue      function
231      0       hydra        craig     r       07/13/96            durin.q    MASTER 
                                                20:27:15
232      0       compile      penny     r       07/13/96            durin.q    MASTER 
                                                20:30:40
230      0       blackhole    don       r       07/13/96            dwain.q    MASTER 
                                                20:26:10
233      0       mac          elaine    r       07/13/96            dwain.q    MASTER 
                                                20:30:40
234      0       golf         shannon   r       07/13/96            dwain.q    MASTER 
                                                20:31:44
236      5       word         elaine    qw      07/13/96           
                                                20:32:07
235      0       andrun       penny     qw      07/13/96 20:31:43 

qdel および qmod によるジョブの制御

コマンド行からジョブを制御するには、次のいずれかのコマンドに適切な引数を指定して実行します。


% qdel arguments
% qmod arguments

ジョブが実行中なのかスプール状態なのかに関わらず、ジョブを取り消すには qdel コマンドを使用します。すでに実行中のジョブを一時停止および再開 (一時停止を解除) するには、qmod コマンドを使用します。

両方のコマンドでジョブ識別番号が必要です。ジョブ識別番号は、qsub コマンドを正常に実行すると返されます。番号を忘れた場合は、qstat で取り出すことができます。qstat によるジョブの監視」を参照してください。

次のリストに、qdel および qmod コマンドの例をいくつか示します。


% qdel job-id
% qdel -f job-id1, job-id2
% qmod -s job-id
% qmod -us -f job-id1, job-id2
% qmod -s job-id.task-id-range

ジョブを削除、一時停止、または再開するには、ジョブの所有者、Grid Engine 管理者、またはオペレータでなければなりません。「管理者、オペレータ、および所有者」を参照してください。

どちらのコマンドでも、-f (force) オプションを使用すると、sge_execd に影響することなくジョブステータスの変更を sge_qmaster に登録することができます。強制実行オプションは、たとえばネットワーク問題などが原因で sge_execd を実行できない場合などに使用してください。 -f オプションは、管理者だけが使用できます。ただし、 qdel でクラスタ構成 qmaster_params エントリの ENABLE_FORCED_QDEL フラグが設定されている場合は、自分自身のジョブは強制削除することができます。詳細は、sge_conf(5) のマニュアルページを参照してください。