「ジョブ」の「割り当て」タブには、ジョブが享受する振り分け優先度に寄与し、スケジューリングポリシーを構成している要素に関する情報が表示されます。この表示を使用して、優先度のポリシーが実際に効果があるかどうかを確認し、キュー内のジョブの全体的な優先順位を決定しているコンポーネントのトラブルシューティングを行うことができます。
ジョブの優先順位は次の 3 つのポリシーに基づいて決定されます。
チケットポリシー
カスタム (POSIX) ポリシー
緊急度ポリシー
計算式の最初の部分であるチケットは、設定されている権利指向型のスケジューリングポリシーを実装するためにスケジューラによって行われる計算を示します。チケットから、スケジューラ内部の論理的な処理がわかります。この機能によって、自分が望んでいるポリシーがどんなものであっても、実際にそれに従っていることを容易に確認できます。また、問題や予期しなかった動作の診断にも使用できます。
上位レベルからジョブに割り当てられたチケット数は、ジョブの権利に正比例します。数が多いほど権利が多くなります。権利が多いジョブは通常は優先度が高いですが、総合的な優先順位はほかの 2 つの要素の影響も受けます。ただし、緊急度ポリシーとカスタムポリシーを意図的に無効にした場合は、権利付与 (チケット) ポリシーだけが有効になります。
優先順位の計算式の 2 つめの部分はカスタム (POSIX) 優先度です。管理者はこの値を使用して特定のジョブの優先度を自由に上げることができます。
優先順位の公式の 3 つめの部分である緊急度は、ジョブの所有者ではなく、ジョブの個々の特性だけから計算されます。緊急度の値は、次の 3 つの情報の合計から得られます。期限、待機時間、およびリソース要件です。
N1GE のスケジューリングポリシーおよび振り分け優先度の詳細は、sge_priority のマニュアルページと『Scheduler Policies for Job Prioritization in the Sun N1 Grid Engine 6 System』(www.sun.com/blueprints/1005/819-4325.html) を参照してください。
状態 – ジョブの状態が、次の各文字で示されます。
d (削除) – qdel(1) を使用してジョブが削除されたことを示します。
r (実行中) – ジョブが実行されようとしているところか、すでに実行中であることを示します。
R (再起動) – ジョブが再起動されたことを示します。この状態は、ジョブの移行、または qsub(1) コマンドの -r セクションに示す理由の一つが原因です。
s (一時停止) – すでに実行を開始したジョブが、qmod(1) を使用して一時停止されたことを示します。
S (一時停止) – すでに実行を開始したジョブが属しているキューが一時停止されたために、そのジョブも一時停止されたことを示します。
t (転送中) – ジョブが実行されようとしているところか、すでに実行中であることを示します。
T (しきい値) – 対応するキューの 1 つ以上の一時停止しきい値を超えたために、すでに実行を開始しているあるジョブが一時停止状態になっており (queue_conf(5) のマニュアルページを参照)、その結果、そのジョブが一時停止されていることを示します。
w (待機中) – 重要なリソースまたは指定された条件を待つためにジョブが一時停止されたことを示します。
これらの状態については、qstat のマニュアルページを参照してください。また、『N1 Grid Engine ユーザーズガイド』の「ジョブとキューの監視と制御」も参照してください。
ID – ジョブ ID は一意の識別情報であり、「ジョブの詳細」ページにアクセスする手段でもあります。
名前 – ジョブの名前です。ジョブに名前を割り当てると、ジョブ ID だけを使用するよりもわかりやすく、追跡が容易になります。
チケット – ジョブのチケットの合計数です。ジョブに割り当てられているチケット数が多いほど、ジョブの優先順位が高くなります。この値は、標準化される前の「生の」値です。
優先指定– 優先指定チケット数です。優先指定チケットを割り当てることで、緊急度ポリシーの優先度の割り当てに影響を与えずに権利を変更できます。
Func – 機能チケット数です。
ツリー – 共有ツリーのチケット数です。共有ツリーは、ユーザーとプロジェクト、およびユーザーとプロジェクトから構成される任意のグループ階層の長期的なリソースの権利を定義します。
POSIX – POSIX の優先度です。この機能によって、ジョブの優先順位を上げることができます。この値は、標準化される前の「生の」値です。
緊急度 – 期限、待機時間、およびリソース要件から構成される、ジョブの合計緊急度です。この値は、標準化される前の「生の」値です。
リソース – 緊急度に寄与するリソース条件です。
待機 – 緊急度に寄与する待機時間です。
Ddln – 緊急度に寄与する期限です。
タスク – 現在実行中のタスクです。一部のジョブは、単一のタスクで構成されます。この場合、タスク ID は常に 1 です。並列ジョブや配列ジョブはそれぞれ複数のタスクで構成されます。タスクは通常、1 から昇順で番号が付けられます。ジョブの送信方法によっては、1、3、5、のように番号がとばされる場合もあります。ジョブの実行時には、各タスクは別々に実行されるため、別個の構成情報、環境、およびトレースがあります。タスク番号をクリックすると、タスクに関する詳細情報が「Task Details」ページに表示されます。
チケット、POSIX、および緊急度の標準化された値は「ジョブ」の「使用状況」タブで確認できます。
各列の意味については、qmon のマニュアルページを参照してください。