N1 Grid Engine 6.1 ソフトウェアは、マスターホスト用を除き、すべてのタイプのホストのオブジェクトリストを維持しています。管理ホストオブジェクトと発行ホストオブジェクトのリストは、あるホストが管理アクセス権と発行アクセス権のどちらを持っているかを示しています。実行ホストオブジェクトにはそのほかのパラメータも含まれています。これらのパラメータの中には、ホスト上で実行中の sge_execd により報告される負荷情報や、管理者により定義された負荷パラメータのスケーリング係数があります。
ホストオブジェクトの構成は、QMON を使用するか、コマンド行から行うことができます。
「QMON Host Configuration」ダイアログボックスには次の 4 つのタブがあります。
「Administration Host」タブ。図 1–3 を参照してください。
「Submit Host」タブ。図 1–4 を参照してください。
「Host Groups」タブ。図 1–5 を参照してください。
「Execution Host」タブ。図 1–1 を参照してください。
qconf コマンドは、ホストオブジェクトを管理するためのコマンド行インタフェースを提供します。
実行ホストを構成する前に、『Sun N1 Grid Engine 6.1 インストールガイド』の「実行ホストをインストールする方法」の説明に従って、実行ホストにソフトウェアをインストールしてください。
実行ホストを構成するには、「QMON Main Control」ウィンドウで「Host Configuration」ボタンをクリックしてから、「Execution Host」タブをクリックします。「Execution Host」タブは次の図のようになっています。
実行ホストから管理または発行コマンドが使用できるのは、実行ホストも管理または発行ホストとして宣言されている場合のみです。「QMON を使用した管理ホストの構成」および 「QMON を使用した発行ホストの構成」を参照してください。
「Hosts」リストには、すでに定義されている実行ホストが表示されます。
「Load Scaling」リストには、選択した実行ホストに対して現在構成されている負荷スケーリング係数が表示されます。負荷パラメータの詳細については、「負荷パラメータ」を参照してください。
「Access Attributes」リストにはアクセス権が表示されます。アクセス権の詳細については、第 4 章「ユーザーアクセスの管理」を参照してください。
「Consumables/Fixed Attributes」リストには、ホストと関連付けられている消費可能リソース属性および固定リソース属性の、リソースの可用性が表示されます。リソース属性の詳細については、「コンプレックスリソース属性」を参照してください。
「Reporting Variables」リストには、実行ホストから負荷レポートが受信された場合に、レポートファイルに書き込まれる変数が表示されます。レポート変数の詳細については、「レポート変数の定義」を参照してください。
「Usage Scaling」リストには、さまざまなマシンの個別の使用率メトリック CPU、メモリー、および I/O の現在のスケーリング係数が表示されます。リソースの使用率は、現在実行中の各ジョブに関して、sge_execd によって定期的に報告されます。スケーリング係数は、ジョブを実行中のユーザーまたはプロジェクトに関して、特定のマシンでのリソース使用率の相対的なコストを示しています。たとえばこれらの係数は、400 MHz プロセッサでの 1 秒の CPU 時間のコストを、600 MHz CPU と比較することに使用できます。「Usage Scaling」ウィンドウに表示されないメトリックのスケーリング係数は 1 です。
実行ホストを追加または変更するには、「Add」または「Modify」をクリックします。「Add/Modify Exec Host」ダイアログボックスが表示されます。
「Add/Modify Exec Host」ダイアログボックスでは、実行ホストに関連付けられているすべての属性を変更できます。「Host」フィールドには、既存の実行ホストの名前が表示されます。
新しい実行ホストを追加する場合は、「Host」フィールドに名前を入力します。
スケーリング係数を定義するには、「Scaling」タブをクリックします。
「Load Scaling」テーブルの「Load」カラムには使用可能なすべての負荷パラメータが表示され、「Scale Factor」カラムには、対応するスケーリングの定義が表示されます。「Scale Factor」カラムは編集できます。有効なスケーリング係数は、固定小数点または科学的記数法形式の正の浮動小数点数です。
「Usage Scaling」テーブルの「Usage」カラムには、使用率メトリック CPU、メモリー、および I/O の現在のスケーリング係数が表示されます。「Scale Factor」カラムには、対応するスケーリングの定義が表示されます。「Scale Factor」カラムは編集できます。有効なスケーリング係数は、固定小数点または科学的記数法形式の正の浮動小数点数です。
リソース属性を定義してホストと関連付けるには、「Consumables/Fixed Attributes」タブをクリックします。
ホストと関連付けられているリソース属性は、「Consumables/Fixed Attributes」テーブルに表示されます。
現在のコンプレックス構成に関する詳細な情報が必要な場合、またはその情報を変更したい場合は、「Complex Configuration」ダイアログボックスを使用します 。コンプレックスリソース属性の詳細については、「コンプレックスリソース属性」を参照してください。
「Consumables/Fixed Attributes」テーブルには、値が現在定義されている対象であるすべてのリソース属性が表示されます。「Name」または「Value」カラム名のいずれかをクリックすることで、リストを拡張できます。「Attribute Selection」ダイアログボックスが表示されます。このダイアログボックスには、コンプレックスで定義されているすべてのリソース属性が含まれています。
「Consumables/Fixed Attributes」テーブルに属性を追加するには、属性を選択してから「OK」をクリックします。
属性値を変更するには、「Value」フィールドをダブルクリックしてから値を入力します。
属性を削除するには、属性を選択してから Control + D キーを押すか、マウスボタン 3 をクリックします。「OK」をクリックして、その属性を削除することを確認します。
以前に構成したユーザーアクセスリストに基づいて実行ホストに対するユーザーのアクセス権を定義するには、「User Access」タブをクリックします。
以前に構成したプロジェクトに基づいて実行ホストに対するプロジェクトのアクセス権を定義するには、「Project Access」タブをクリックします。
レポート変数を定義するには、「Reporting Variables」タブをクリックします。
「Available」リストには、実行ホストから負荷レポートが受信された場合にレポートファイルに書き込み可能なすべての変数が表示されます。
「Available」リストからレポート変数を選択してから赤い右矢印をクリックし、選択した変数を「Selected」リストに追加します。
「Selected」リストからレポート変数を削除するには、変数を選択してから赤い左矢印をクリックします。
実行ホストを削除するには、「QMON Main Control」ウィンドウで「Host Configuration」ボタンをクリックしてから、「Execution Host」タブをクリックします。
「Execution Host」ダイアログボックスで、削除するホストを選択してから「Delete」をクリックします。
実行ホストデーモンを停止するには、「QMON Main Control」ウィンドウで「Host Configuration」ボタンをクリックしてから、「Execution Host」タブをクリックします。
「Execution Host」ダイアログボックスで、ホストを選択してから「Shutdown」をクリックします。
コマンド行から実行ホストを構成するには、qconf コマンドで次の引数を使用します。
-ae オプション (実行ホストの追加) を使用すると、実行ホストの構成テンプレートが含まれるエディタが表示されます。このエディタは、デフォルトの vi エディタか、EDITOR 環境変数に対応するエディタのいずれかです。すでに構成されている実行ホストの名前である exec-host を指定すると、この実行ホストの構成がテンプレートとして使用されます。実行ホストの構成は、テンプレートを変更してディスクに保存することで行います。変更すべきテンプレートエントリの詳細については、host_conf(5) のマニュアルページを参照してください。
-de オプション (実行ホストの削除) を使用すると、実行ホストのリストから、指定したホストが削除されます。実行ホスト構成のすべてのエントリは失われます。
-me オプション (実行ホストの変更) を使用すると、指定した実行ホストの構成をテンプレートとして含むエディタが表示されます。このエディタは、デフォルトの vi エディタか、EDITOR 環境変数に対応するエディタのいずれかです。実行ホスト構成の変更は、テンプレートを変更してディスクに保存することで行います。変更すべきテンプレートエントリの詳細については、host_conf(5) のマニュアルページを参照してください。
-Me オプション (実行ホストの変更) を使用すると、実行ホストの構成テンプレートとして filename の内容が使用されます。指定したファイルの構成では、既存の実行ホストを参照する必要があります。この実行ホストの構成は、ファイルの内容により置き換えられます。-Me オプションは手動による対話が不要であるため、qconf オプションは cron ジョブなどでのオフライン実行ホストの構成の変更に便利です。
-se オプション (実行ホストを表示) を使用すると、host_conf で定義されている指定の実行ホストの構成が表示されます。
-sel オプション (実行ホストのリストの表示) を使用すると、実行ホストとして構成されているホストのリストが表示されます。
「QMON Main Control」ウィンドウで「Host Configuration」ボタンをクリックします。「Administration Host」タブとともに「Host Configuration」ダイアログボックスが表示されます。「Administration Host」タブは次の図のようになっています。
「Host Configuration」ボタンをはじめてクリックすると、デフォルトでは「Administration Host」タブが表示されます。
「Administration Host」タブを使用して、管理コマンドが使用可能なホストを構成します。「Host」リストには、すでに管理アクセス権が設定されているホストが表示されます。
新しい管理ホストを追加するには、「Host」フィールドに名前を入力してから、「Add」をクリックするか、Return キーを押します。
リストから管理ホストを削除するには、ホストを選択してから「Delete」をクリックします。
コマンド行から管理ホストを構成するには、qconf コマンドで次の引数を使用します。
ホストが管理ホストとしても宣言されている場合を除き、発行ホストから管理コマンドを実行することはできません。詳細については、「QMON を使用した管理ホストの構成」を参照してください。
発行ホストを構成するには、「QMON Main Control」ウィンドウで「Host Configuration」ボタンをクリックしてから、「Submit Host」タブをクリックします。次の図に「Submit Host」 タブを示します。
「Submit Host」タブを使用して、ジョブの発行、監視、および制御を行うことができるホストを宣言します。「Host」リストには、すでに発行アクセス権が設定されているホストが表示されます。
発行ホストを追加するには、「Host」フィールドに名前を入力してから、「Add」をクリックするか、Return キーを押します。
発行ホストを削除するには、発行ホストを選択してから「Delete」をクリックします。
コマンド行から発行ホストを構成するには、qconf コマンドで次の引数を使用します。
ホストグループを使用すると、1 つの名前を使用して複数のホストを参照できます。同じようなホストは、ホストグループにグループ化してまとめることができます。ホストグループは、複数の個別ホストだけでなく、そのほかのホストグループを含むこともできます。別のホストグループのメンバーであるホストグループは、そのホストグループのサブグループになります。
たとえば、次のメンバーを含む @bigMachines というホストグループを定義できます。
@solaris64 |
@solaris32 |
fangorn |
balrog |
最初の @ 記号は、その名前がホストグループであることを示します。ホストグループ @bigMachines には、2 つのサブグループ @solaris64 および @solaris32 のメンバーであるすべてのホストが含まれます。また、@bigMachines には 、2 つの個別ホスト fangorn および balrog も含まれます。
「QMON Main Control」ウィンドウで「Host Configuration」ボタンをクリックします。「Host Configuration」ダイアログボックスが表示されます。
「Host Groups」タブをクリックします。「Host Groups」タブは次の図のようになっています。
ホストグループを構成するには、「Host Groups」タブを使用します。「Hostgroup」リストには、現在構成されているホストグループが表示されます。「Members」リストには、選択したホストグループのメンバーであるすべてのホストが表示されます。
ホストグループを追加するには「Add」をクリックし、ホストグループを変更するには「Modify」をクリックします。「Add/Modify Host Group」ダイアログボックスが表示されます。
新しいホストグループを追加する場合、「Hostgroup」フィールドにホストグループ名を入力します。ホストグループ名は「@」記号で始まる必要があります。
既存のホストグループを変更する場合は、「Hostgroup」フィールドにホストグループ名が入力されています。
現在構成中のホストグループにホストを追加するには、「Host」フィールドにホスト名を入力してから赤い矢印をクリックし、「Members」リストに名前を追加します。ホストグループをサブグループとして追加するには、「Defined Host Groups」リストからホストグループ名を選択してから赤い矢印をクリックし、その名前を「Members」リストに追加します。
「Members」リストからホストまたはホストグループを削除するには、ホストまたはホストグループを選択してから、ゴミ箱のアイコンをクリックします。
変更を保存するには「Ok」をクリックし、ダイアログボックスを閉じます。変更を保存せずにダイアログボックスを閉じるには、「Cancel」をクリックします。
ホストグループを削除するには、「Hostgroup」リストからホストグループを選択してから「Delete」をクリックします。
コマンド行からホストグループを構成するには、qconf コマンドで次の引数を使用します。
qconf -ahgrp [host-group-name]
-ahgrp オプション (ホストグループの追加) を使用すると、ホストグループのリストに新しいホストグループが追加されます。構成の書式の詳細な説明については、hostgroup(5) のマニュアルページを参照してください。
-Ahgrp オプション (ファイルからのホストグループの追加) を使用すると、filename で定義されているホストグループ構成を含むエディタが表示されます。このエディタは、デフォルトの vi エディタか、EDITOR 環境変数に対応するエディタのいずれかです。ホストグループを構成するには、構成を変更してディスクに保存します。
-dhgrp オプション (ホストグループの削除) を使用すると、ホストグループのリストから、指定したホストグループが削除されます。ホストグループ構成のすべてのエントリは失われます。
-mhgrp オプション (ホストグループの変更) を使用すると、テンプレートとして、指定したホストグループの構成を含むエディタが表示されます。このエディタは、デフォルトの vi エディタか、EDITOR 環境変数に対応するエディタのいずれかです。ホストグループ構成の変更は、テンプレートを変更してディスクに保存することで行います。
-Mhgrp オプション (ファイルからのホストグループの変更) を使用すると、filename の内容をホストグループの構成テンプレートとして使用します。指定したファイルの構成は、既存のホストグループを参照する必要があります。このホストグループの構成は、ファイルの内容により置き換えられます。
-shgrp オプション (ホストグループの表示) を使用すると、指定したホストグループの構成が表示されます。
qconf -shgrp_tree host-group-name
-shgrp_tree オプション (ツリーとしてホストグループを表示) を使用すると、指定したホストグループとそのサブホストグループの構成がツリーとして表示されます。
qconf -shgrp_resolved host-group-name
-shgrp_resolved オプション (解釈処理されたホストリストとともにホストグループを表示) を使用すると、解釈処理されたホストリストとともに、指定したホストグループの構成が表示されます。
-shgrpl オプション (ホストグループリストの表示) を使用すると、すべてのホストグループのリストが表示されます。
実行ホストの状態の概要をすばやく取得するには、次のように qhost コマンドを使用します。
% qhost |
このコマンドにより、次の例のような出力が作成されます。
HOSTNAME ARCH NCPU LOAD MEMTOT MEMUSE SWAPTO SWAPUS ------------------------------------------------------------------------------- global - - - - - - - arwen aix43 1 - - - - - baumbart irix65 2 0.00 1.1G 91.5M 128.0M 0.0 boromir hp11 1 - 128.0M - 256.0M - carc lx24-amd64 2 0.00 3.8G 989.8M 1.0G 0.0 denethor aix51 1 4.54G - - - - durin lx24-x86 1 0.37 123.1M 46.5M 213.6M 26.6M eomer sol-sparc64 1 0.13 256.0M 248.0M 513.0M 93.0M lolek tru64 1 0.02 1.0G 790.0M 1.0G 8.0K mungo lx22-alpha 1 1.00 248.9M 78.8M 129.8M 2.5M nori sol-x86 2 0.38 1023.0M 372.0M 512.0M 37.0M pippin darwin 1 0.00 640.0M 264.0M 0.0 0.0 smeagol hp11 1 0.35 512.0M 425.0M 1.0G 95.0M |
出力形式とそのほかのオプションの詳細については、qhost(1) のマニュアルページを参照してください。
無効、予約済みなどにより使用できないホスト名のリストを次に示します。
global |
template |
all |
default |
unknown |
none |
コマンド行から Grid Engine システムデーモンを終了するには、次のいずれかのコマンドを使用します。
% qconf -ke[j] {hostname,... | all} % qconf -ks % qconf -km |
これらのコマンドを使用するには、管理者特権またはオペレータ特権が必要です。管理者特権およびオペレータ特権の詳細については、第 4 章「ユーザーアクセスの管理」を参照してください。
qconf –ke コマンドは、実行デーモンを停止します。ただし、アクティブなジョブは取り消しません。システム上で sge_execd が実行中でない間に終了するジョブは、sge_execd が再起動するまで、sge_qmaster に報告されません。ただし、ジョブのレポートは失われません。
qconf -kej コマンドは、現在アクティブなすべてのジョブを終了し、すべての実行デーモンをダウンさせます。
クラスタ内のすべての実行ホストを停止するには、停止させる実行ホストから成る、コンマで区切られたリストを使用するか、all を指定します。
qconf -ks コマンドは、スケジューラ sge_schedd を停止します。
qconf -km コマンドは、強制的に sge_qmaster プロセスを終了させます。
停止手続きを実行する前にすべてのアクティブなジョブが終了するのを待機したい場合は、すでに説明した qconf シーケンスを実行する前に、各クラスタキュー、キューインスタンス、またはキュードメインに対して qmod -dq コマンドを使用します。 クラスタキュー、キューインスタンス、およびキュードメインの詳細については、「キューの構成」を参照してください。
% qmod -dq {cluster-queue | queue-instance | queue-domain} |
qmod -dq コマンドは、新しいジョブが、使用不可のキューインスタンスに対してスケジュールされることを防ぎます。デーモンを終了する前には、キューインスタンス内で実行中のジョブがなくなるまで待機する必要があります。
Grid Engine システムデーモンを再起動するマシンに、ルートとしてログインします。
次のコマンドを入力して、起動スクリプトを実行します。
% sge-root/cell/common/sgemaster % sge-root/cell/common/sgeexecd |
これらのスクリプトは、このホストで通常は実行中であるデーモンを探し、対応するデーモンを起動します。