Sun N1 Grid Engine 6.1 ユーザーズガイド

用語集

アクセスリスト

キュー、ホストなどのリソースへのアクセスを許可または拒否されたユーザーおよび UNIX グループのリスト。ユーザーやグループは複数のアクセスリストに所属できます。また、同じアクセスリストを複数のコンテキストで使用できます。

移行

ジョブの実行が再開される前に、チェックポイント設定ジョブを別のホストへ移すプロセス。

一時停止

実行中のジョブを実行ホストに格納して停止するプロセス。チェックポイント設定のように、ジョブが「中止」されるわけではありません。ジョブを一時停止しても、スワップメモリーやファイル空間などの一部のリソースは引き続き消費されます。

エンタイトルメント

共有」と同義。特定のジョブ、ユーザー、ユーザーグループ、またはプロジェクトによって消費される予定のリソースの量を示します。

オペレータ

管理者と同じコマンドを実行できるユーザー。ただし、構成を変更することはできません。オペレータの役割は、操作を維持することです。

管理者

あらゆる局面で Grid Engine ソフトウェアを操作できるユーザー。マスターホストおよび管理ホストとして宣言されるその他のマシンのスーパーユーザーであり、管理者の特権を持っています。管理者の特権は、root ユーザー以外にも割り当て可能です。

管理ホスト

Grid Engine システムの管理作業の実行権を持つホスト。

機能ポリシー

ジョブ、ユーザー、ユーザーグループ、およびプロジェクトに対して、特定のレベルの重要度を割り当てます。これにより、たとえば、優先順位の高いプロジェクトとそのプロジェクトのすべてのジョブには、優先順位の低いプロジェクトより高いリソース配分が割り当てられます。

キャンパスグリッド

組織内の複数のプロジェクトまたは部署による計算リソースの共有を可能にするグリッド。

共有

エンタイトルメント」と同義。特定のジョブ、ユーザー、またはプロジェクトによって消費される予定のリソースの量を表します。

共有ツリー

共有ベースポリシーの階層定義。

共有ベースポリシー

ユーザー、プロジェクト、および任意のグループのエンタイトルメントを階層的に定義するポリシー。たとえば会社は、課、部門、部門内でアクティブになっているプロジェクト、これらのプロジェクトに関わるユーザーグループ、そしてこのユーザーグループに所属するユーザーに区分できます。共有ベースの階層を「共有ツリー」と呼びます。共有ツリーを定義すると、Grid Engine ソフトウェアは自動的にエンタイトルメントを実装します。

クラスタ

「ホスト」と呼ばれるマシンの集合。Grid Engine システム機能は、このクラスタ上にあります。

クラスタキュー

同時実行可能な複数のジョブのクラスを格納するコンテナ。キューは、特定のジョブ属性、たとえば移動可能なジョブかどうかを特定します。実行中のジョブは、実行が終了するまでキューに関連付けられています。キューに関連付けられていることで、ジョブで発生する事象の一部が影響を受けます。たとえば、キューが一時停止されると、そのキューに関連付けられたすべてのジョブが一時停止されます。

クラスタグリッド

もっとも単純な形式のグリッド。連携して機能し、単一のプロジェクトまたは部署内のユーザーに単一のアクセスポイントを提供する複数のコンピュータホストで構成されます。

グリッド

タスクを実行する複数の計算リソースの集合。ユーザーは、グリッドを単一の計算リソースとして使用します。

グループ

UNIX グループ

グローバルグリッド

複数のキャンパスグリッドの集合。組織の境界を越え、非常に大規模な仮想システムを構築することができます。

コンプレックス

リソース属性定義のセット。キュー、ホスト、またはクラスタ全体に関連付けることができます。

実行ホスト

Grid Engine システムジョブの実行権を持つシステム。キューインスタンスをホストし、実行デーモン sge_execd を実行します。

使用率

「消費リソース」の別称。消費される CPU 時間、利用に伴って占有されるメモリー、I/O 実行量の管理者が構成できる値です。

ジョブ

ユーザーからの要求。グリッドに計算リソースを要求します。

ジョブクラス

何らかの共通点があり、同じように取り扱われる複数のジョブのセット。ジョブクラスは、類似したジョブ群に共通する同一の要件と、これらのジョブに適したキューの特性によって定義されます。

所有者

所有するキューの一時停止、再開、無効化、有効化を実行できるユーザー。通常、ユーザーは、自分のワークステーション上のキューのインスタンスの所有者になります。

セル

それぞれ構成およびマスターマシンが異なる独立したクラスタ。複数の独立した管理ユニットを疎結合するために使用されます。

ソフトリソース要件

ジョブが必要とするリソース。ただし、ジョブの開始前に割り当てる必要はありません。利用できるときに割り当てます。「ハードリソース要件」の対語になります。

対話型ジョブ

qrshqsh、または qlogin コマンドで開始されるセッション。ユーザーとの対話用に xterm ウィンドウを表示します。または、リモートログインセッションのようなものを提供します。

チェックポイント設定

あるジョブの実行ステータスをチェックポイントに保存する手続き。情報とすでに完了した作業の内容を維持したまま、中止したジョブをあとで再開することができます。中止したジョブの実行を再開する前にチェックポイントを別のホストに移した場合は「移行」と呼びます。

チェックポイント設定環境

特定のチェックポイント設定方法に関連付けられたイベント、インタフェース、およびアクションを定義する Grid Engine システムの構成要素。

チケット

リソース配分定義の一般的な単位。ジョブ、ユーザー、プロジェクト、またはその他のコンポーネントが持つチケットの配分が多いほど、より重要性が高いということになります。たとえば、ほかのジョブの 2 倍チケットを持っているジョブは、ほかのジョブの 2 倍のリソースを使用する権利があります。

ハードリソース要件

ジョブの開始前に割り当てなければならないリソース。対語として「ソフトリソース要件」があります。

配列ジョブ

それぞれ独立した同一のタスクの範囲を構成するジョブ。 各タスクは、単独のジョブとして機能します。配列ジョブタスクは、一意のタスク識別子 (整数値) によってのみ区別されます。

発行ホスト

バッチジョブのみを発行し、制御するホスト。 発行ホストにログインしているユーザーは、qsub コマンドでジョブを発行し、qstat コマンドでジョブのステータスを制御します。また、Grid Engine システム OSF/1 Motif グラフィカルユーザーインタフェース QMON を利用できます。

バッチジョブ

UNIX シェルスクリプト。ユーザーの介入なしで実行できます。また、端末へのアクセスも不要です。

部署

同様の職務を持つと見なされるユーザーおよびグループのリスト。Grid Engine システム のスケジューリングポリシーより優先されます。ユーザーやグループが複数の部署に所属することはできません。

プロジェクト

Grid Engine システムプロジェクト。

並列環境

Grid Engine システム構成。並列ジョブを正常に処理するために Grid Engine ソフトウェアに必要なインタフェースを定義します。

並列ジョブ

複数の密接に関連したタスクで構成されるジョブ。タスクは、複数のホストに分散されます。並列ジョブは、通常、共有メモリーやメッセージ受け渡し (MPI、PVM) などの通信ツールを使用して、タスクの同期や関連付けを行います。

ホスト

Grid Engine システム機能が置かれたシステム。

ポリシー

管理者が Grid Engine システムの動作を定義するために使用する規則および構成のセット。ポリシーは、システムによって自動的に実装されます。

マスターホスト

クラスタアクティビティー全体の中枢。マスターデーモン sge_qmaster とスケジューラデーモン sge_schedd を実行します。デフォルトでは、マスターホストが管理ホストでもあり発行ホストでもあります。

ユーザー

1 台以上の発行ホストおよび実行ホストでの有効なログイン ID を持っている場合、グリッドにジョブを発行し、実行することができるユーザー。

ユーザーセット

アクセスリスト 」または「部署」。

優先順位

あるジョブとその他のジョブを比較したときの重要度のレベル。

優先ポリシー

一般に、機能ポリシーおよび共有ベースポリシーのリソースエンタイトルメント管理の自動化を無効にするために使用されます。クラスタ管理者は、ポリシーの自動実装を変更し、ジョブ、ユーザー、ユーザーグループ、およびプロジェクトを無効にすることができます。

リソース

実行ジョブによって消費または占有される計算デバイス。典型的な例として、メモリー、CPU、I/O 帯域幅、ファイル空間、ソフトウェアライセンスなどがあります。