Sun N1 System Manager 1.3 Grid Engine プロビジョニングおよび監視マニュアル

第 4 章 N1 Grid Engine の監視

この章では、グリッドのパフォーマンスのスナップショットを取得する方法、またクラスタキューや N1 Grid Engine のさまざまな種類の警告に関する詳細情報を表示する方法について説明します。これらの機能はすべて N1 Grid Engine 監視の GUI から使用できます。


注 –

N1GE を使用して実際にアプリケーションを管理するには、N1GE 自体のさまざまなツールやコマンドを使用します。たとえば、N1GE 監視 GUI を使用して、送信済みのジョブのステータスを表示することはできますが、この GUI からジョブを実際に送信することはできません。


グリッドのパフォーマンスの確認

グリッドの健全性を簡単に確認するには、「概要」タブを使用します。このタブには監視の「概要」ページが表示され、このページには、状態の概要、クラスタキューの情報、キュー、ホスト、およびジョブの警告の総計を示す 3 つの表があります。


注 –

このページの情報を最新にするには、再読み込みを行なってください。


図 4–1 N1 Grid Engine の「概要」ページ

状態の概要、クラスタキューの状態、すべての警告を示す「概要」ページ

「ステータスの概要」表

「ステータスの概要」表には、グリッド内で保留中、実行中、一時停止などの状態にあるジョブの合計数が表示されます。また、計算ホストあたりの平均負荷や、すべての計算ホストで使用および設置されているメモリーの合計容量も表示されます。

「クラスタキュー」表

実行中のジョブは、存続するかぎり、そのキューに関連付けられています。キューは、複数のホストに適用されるさまざまなジョブ実行パラメータを定義する方法です。N1GE のキューは、ジョブのクラスのコンテナ、または説明と考えることができます。複数の実行ホストにまたがるキューをクラスタキューとよぶことがあります。

「クラスタキュー」表は、グリッドで構成されているすべてのクラスタキューの状態の概要を示します。スロットは、全般的なパフォーマンスを示します。状態は、エラー状態になる可能性があるキューを示します。次のフィールドがあります。

クラスタキューについては、『N1 Grid Engine 6 ユーザーズガイド』の「キューの監視と制御」と qmon のマニュアルページを参照してください。キューの状態については、「キューのアラート」を参照してください。

「アラート」表

「アラート」表では、グリッドで発生する可能性がある問題、または実際に発生している問題を一覧表示できます。これらのカテゴリで警告またはエラーが生成されるか、カテゴリが無効になったときにアラートが通知されます。カテゴリをクリックすると、そのカテゴリの「アラート」ページに、警告の詳細情報を示す表が表示されます。次のカテゴリがあります。

並べ替えとページの操作方法

項目は 10 行ずつ表示されます。表の下部にあるページ操作のコントロールを使用して、全一覧を表示できます。デフォルトでは、行はジョブ ID の順番に表示されますが、任意の列を使用して行の順序を変更できます。列のヘッダーをクリックすると、その列の値に従って行が並べ替えられます。列のヘッダーをもう一度クリックすると、逆の順序で並べ替えられます。ページ操作のボタンをクリックすると、並べ替えの設定はほかのページでも維持されます。