この章は、過去の SSP リリースの DR ユーザーマニュアルに記載されていた解説部分で構成されています。また、過去の DR ユーザーマニュアルに記載されていた DR モデル 2.0 の使い方についての手順も説明しています。
DR モデル 2.0は、基本的に、DR デーモンである dr_daemon(1M) を使用して DR 操作を制御しています。このモデルでは、addboard(1M)、deleteboard(1M)、moveboard(1M) など DR の自動化 (ADR) コマンドを使用することができます。ADR コマンドの使い方は、「DR モデル 3.0 の操作手順」で説明します。
DR モデル 2.0 は、drshell(1M) および Hostview の DR メニュー機能により実行される DR コマンドもサポートしています。
Hostview GUI または dr(1M) シェルアプリケーションを使用して、SSP から DR 操作を行うことができます (詳細については、hostview(1M) と dr(1M) に関するマニュアルページを参照してください)。DR は、以下の機能をサポートしています。
DR Attach - 任意のドメインで動作しているオペレーティングシステムに、システムボードを論理的に接続します。システムボードは、そのボードの資源 (プロセッサ、メモリー、および入出力アダプタ) がドメインの一部として構成され、Solaris オペレーティング環境がそれを使用できるようになった時点で、論理的に接続されたことになります。ただし、接続できるのは、どのドメインにも属していない電源が入った既存のシステムボードに限ります。通常システムボードの接続が必要になるのは、システムボードを装着して電源を入れた後、または別のドメインからシステムボードを切り離した後です。
DR Detach - 任意のシステムボードを、ドメインから論理的に切り離します。システムボードは、ボードのリソース (プロセッサ、メモリー、および入出力アダプタ) がドメイン構成から削除され、ドメインがそれを使用できなくなった時点で、論理的に切り離されたことになります。通常、システムボードの切り離しが必要になるのは、ボードを他のドメインに移動するとき、またはボードを取り外すときのどちらかです。
ドメイン内で DR 操作が実行されている間、dr_daemon(1M) (『Sun Enterprise 10000 Dynamic Reconfiguration リファレンスマニュアル』を参照) およびオペレーティング環境によって、状態や例外処理に関するメッセージがドメインの syslog メッセージバッファー (/var/adm/messages) および SSP メッセージファイル ($SSPOPT/adm/ドメイン名/messages および $SSPOPT/adm/messages) に書き込まれます。これらのメッセージは、Hostview および dr (1M) シェルアプリケーションによって表示される状態および例外処理情報とともに、DR 要求の状態を判断するのに役立ちます。
同じプラットフォーム上で、同時に複数の DR 操作を実行することはできません。完了途中の DR 操作を最後まで終了させないと、同じドメイン内で次の DR 操作を実行することはできません。ただし、ドメインが異なっていれば、あるドメインに部分的に完了してから取り消された DR 操作があっても、別のドメインで新たな DR 操作を開始できます。
複数のシステムボードにインタリーブされているメモリーを使用している場合、それらのシステムボードを切り離すことはできません。これは、DR がまだボード間のインタリーブをサポートしていないためです。デフォルトでは、hpost(1M) はメモリーがインタリーブされているボードをセットアップしません。hpost(1M) ファイルの .postrc (postrc(4) を参照) から、以下の行を見つけてください。
mem_board_interleave_ok |
mem_board_interleave_ok という行が記述されていると、メモリーのインタリーブを使用するボードを切り離せない可能性があります。
ボードを切り離す前に、オペレーティングシステムによってそのボードのメモリーが空にされている必要があります。ボードを空にするということは、ボードのページング可能なメモリーをスワップ領域にフラッシュし、ページング不可能なメモリー (すなわち、カーネルおよび OpenBootTM PROM (OBP) メモリー) を別のメモリーボードにコピーするということです。ページング不可能なメモリーを再配置するためには、そのドメインのオペレーティング環境を一時的に停止する、すなわち休止する必要があります。一時停止させる時間は、そのドメインの入出力構成と現在の作業負荷によって異なります。オペレーティング環境を一時停止するのは、ページング不可能なメモリーを持つボードを切り離すときだけです。したがって、ドメインの操作に重大な影響を及ぼさないためには、ページング不可能なメモリーが常駐する場所を把握する必要があります。ボードに常駐メモリーがある場合、オペレーティング環境は、コピー先のメモリーを他に確保する必要があります。
ボード上のメモリーがページング可能であるかどうかを調べるには、以下のように、 drshow(1M) コマンドを使用します。
% dr dr> drshow ボード番号 mem |
またボード上のメモリーがページング可能かどうかは、DR Memory Configuration ウィンドウからも確認できます。DR Memory Configuration ウィンドウは、Hostview の中で切り離し操作を実行すると表示されます。DR Memory Configuration ウィンドウについては、Solaris 8 10/01 バージョンの「Sun Hardware Collection - Japanese」に収録されている『Sun Enterprise 10000 DR 構成マニュアル』で説明しています。
常駐メモリーを切り離すとき、DR はメモリーのコピー先となる、ターゲットメモリー領域を選択します。DR ソフトウェアは、自動的に規則の遵守合計をチェックします。遵守合計を確認できない場合、DR ソフトウェアは DR メモリー操作の継続を無効にします。DR メモリー操作が無効になった場合は、以下の理由が考えられます。
ページング不可能なメモリーのコピーを保存できるだけの十分な容量がドメインにない
ドメインが他のボードのメモリーとインターリーブされている
Solaris 7、およびこれと互換性のある Solaris 7 以降のリリースの Solaris オペレーティング環境では、ターゲットボードが見つからない場合は切り離し操作が拒否され、DR はエラーメッセージを表示します(DR のエラーメッセージについての詳細は、付録 A、付録 A 「DRのエラーメッセージ」を参照してください。
修正可能なメモリーエラーとは、システムボード上のメモリー (すなわち単一または複数の DIMM (Dual Inline Memory Module) やハードウェアの相互接続部分) に障害があり、修復が必要な状態を示しています。SSP が修正可能なメモリーのエラーを検出した場合は、診断データの保存を目的としたレコード停止ダンプの取得を開始するため、DR Detach 操作に影響が出る場合があります。修正可能なメモリーのエラーによりレコード停止が発生した場合、レコード停止ダンプ処理が完了してから、DR 切り離し操作を開始することを推奨します。
障害の発生した構成要素によって修正可能なメモリーのエラーに関するメッセージが繰り返し表示された場合、SSP はレコード停止ダンプを複数取得します。この複数のダンプ取得が発生したときは、SSP 上のダンプ検出機能を一時的に停止します。実行中のダンプ取得が終了してから、DR Detach 操作を開始します。DR Detach 操作が完了したら、ダンプ検出機能を再開します。
切り離し操作が終了したら、ダンプ検出機能を再度、使用可能に設定する必要があります。
SSP に ssp ユーザーとしてログインします。
レコード停止ダンプ検出機能を停止します。
ssp% edd_cmd -x stop |
このコマンドは全ドメインで稼働するすべてのイベント検出機能を中断します。
実行中のレコード停止ダンプを確認します。
ssp% ps -ef | grep hpost |
grep(1) コマンドで出力された hpost の -D オプションは、レコード停止ダンプが取得中であることを示します。
DR Detach 操作を実行します。
イベント検出機能を開始します。
ssp% edd_cmd -x start |
IDN 機能は、標準 TCP/IP プロトコルで相互接続されたドメイン間で通信することを可能にします。この機能を実現するために、IDN はハードウェア構成についての詳細な情報を保持し、ドメインの各メンバーのハードウェア構成を監視しています。
DR 機能は、ユーザーがオペレーティングシステムを停止せずに、ハードウェアを再構成することを可能にします。IDN が一貫した最新情報を保持するために、DR の実現には、IDN にハードウェア構成の変更をつねに認知させておく必要があります。
DR は、IDN からドメインへのリンクを切り離し、ハードウェアを再構成して、ドメインを IDN に再リンクすることによって、この機能を実現します。
ドメインのリンク切り離しと再リンクは、DR 処理の完全な取り付けと完全な切り離しの段階で行われます。DR はドメインが IDN のメンバーであるかどうかを調べ、この段階でドメインの切り離しと再リンクを行います。ユーザーによるなんらかの操作は必要ありません。ただし、メンバーであるドメインが認識されない状態である場合、特に、ドメインが無応答状態にある場合、リンク切り離し処理はできません。ユーザーが DR 操作を実行しようとしたときに、1 つ以上のドメインが認識されない状態である場合、IDN 内部にあるすべての認識されないドメインに対してリンク切り離しを 1 回の手順で実行する必要があります (これは、domain_unlink(1M) コマンドに認識されないドメインの名前をすべて列記して実行することを意味します)。
ドメインが IDN にリンクされていない間は、そのドメインに対する、またはそのドメインからのデータ転送はできません。ドメインは、SSP の domain_config(4) ファイルで定義された IDN のメンバーであり続けます。また、domain_status(1M) コマンドを使用した場合、IDN のメンバーとしてもリストに保持され続けます。
DR と IDN 間の相互通信のために、いかなる場合も、単一の Sun Enterprise 10000 システムにおいては、ただ 1 つだけの DR または IDN 操作が許可されます。
ある条件において、コマンドの強制オプションを使用する必要があるかもしれません。DR 操作の流れにおいて、domain_unlink(1M) に対して強制オプションを使用することもできます。IDN のメンバーであるドメインを使用している場合は、強制オプションの使用には十分な注意が必要です。強制オプションの詳細については、『Sun Enterprise 10000 InterDomain Networks ユーザーマニュアル』を参照してください。
それぞれのドメインで動作する dr_daemon(1M) は、Hostview や dr(1M) シェルアプリケーション (どれも SSP で動作します) との相互処理を、遠隔手続き呼び出し (RPC) を使って行います。
RPC の時間切れや接続障害についての詳細は、『Sun Enterprise 10000 DR 構成マニュアル』を参照してください。
この節では、DR モデル 2.0 の機能と使用手順について説明します。
DR 操作の前後のドメインの構成や再構成などの情報や操作方法については、Solaris 8 10/01 リリースの「Sun Hardware Collection - Japanese」に収録されている『Sun Enterprise 10000 DR 構成マニュアル』お読みください。
この節では、DR Attach を実行した場合に発生する動作の概要を示します。GUI を使用した詳細な手順については、「Hostview を使用してボードを接続する」を参照してください。または、「コマンド行インタフェース (CLI) を使用してボードを接続する」を参照してください。
接続できるシステムボードは、マシンに装着済みで、電源が入っているアクティブドメインに属さない (すなわち、オペレーティング環境が使用していない) システムボードです。これら未接続のボードの例として、ドメインの起動後にホットスワップによってシステムに装着されたボード、ドメインの起動時にブラックリストに登録されたボード、他のドメインから切り離されたボードがあります。
システムボードが、ホットスワップを使用してドメインに装着したボードの場合は、ボードの電源を入れた直後に、thermcal_config(1M) コマンドを実行してください。
ボードの接続を開始する前には、そのボード上で診断操作が行われます。そのため、ボードにはブラックリストに登録されていないプロセッサが最低 1 つは必要です。最適なボードとターゲットドメインを選択すると、DR Attach 操作によって Init Attach と Complete Attach の 2 つの操作が実行されます。
Init Attach 操作では、DR が選択されたボードを診断して構成し、そのボードと関連デバイスをオペレーティング環境に接続するための準備を行います。DR は以下の処理を実行します。
SSP 上の domain_config(4) ファイルにあるターゲットドメインのボードリストにボードを追加します。
hpost -H をボード上で実行して、ボードを構成します。hpost(1M) は、Sun Enterprise 10000 システムのセンタープレーンのボードを、単一ボードのハードウェアドメインに配置することによって切り離します (hpost(1M) のマニュアルページを参照してください)。
ボード上のメモリーと入出力デバイスの有無によって、後続の Attach 操作用の hpost テストレベルが異なる場合があります。
obp_helper -H を実行します。最初に download_helper がボードに読み込まれます。次に、ボード上のプロセッサのリセットモードが解除されて、download_helper の実行が可能になります。
センタープレーンとボードのドメインマスクレジスタを再構成し、ボードをターゲットのハードウェアドメインに配置します。
DR が、成功した処理や例外が発生した処理を含めて、これらの hpost(1M) および obp_helper(1M) の操作状況を表示します。
hpost(1M) および obp_helper(1M) が成功すると、オペレーティング環境はその旨の通知を受け、OBP にボードをプローブするように要求します。次に、オペレーティングシステムは OBP デバイスツリーを走査して、オペレーティングシステム構成にそのデバイスを追加しますが、この時にドライバは読み込みません。
Init Attach 操作が完了すると、ボード上にあるデバイスを確認できるように、OBP のボード構成が表示されることがあります。この後は、引き続き Complete Attach 操作を行うことも、現在の操作を中止することもできます。
操作を中止すると、DR はオペレーティング環境のデータ構造体からボード構成を削除し、domain_config(4) ファイルからボードを削除して、ボードがどのドメインにも属さない状態にしておきます。このボードは、ホットスワップによりシステムから取り外すことも、システムと接続せずに残しておき、後から接続することもできます。
DR は、Complete Attach 操作中に、新しいシステムボードがホストとなるリソースをオペレーティング環境が使用できるようにすることによって、接続操作の完了を試みます。ボード上の任意のデバイスの接続を妨げるような問題が発生すると、dr_daemon(1M) が、問題をシステムのメッセージバッファーに記録します。正常に接続されたデバイスを確認するには、ボードのドメイン構成を表示します。
ボードが正常に接続されたら、入出力デバイスを再構成することができます。詳細は、『Sun Enterprise 10000 DR 構成マニュアル』を参照してください。この操作は完了するのに数分かかります。
Hostview GUI (別の実行可能ファイル drview(1M) を内部で呼び出します) を使用して接続操作を行うと、接続プロセス中、以下のボタンがさまざまな場面で登場します。
init attach - 接続を開始します (「Init Attach 操作」を参照)。接続が正常に完了すると、このボタンの表示が complete に変わります。
complete - 接続を完了します (「Complete Attach 操作」を参照)。
reconfig - ドメインのデバイスディレクトリを自動的に再構成します。ボードを接続した後で、この再構成を実行するとよいでしょう (詳細については、『Sun Enterprise 10000 DR 構成マニュアル』を参照してください)。
abort - 接続を取り消します。このボタンは、Init Attach 操作が正常に完了した後で有効になります (「Init Attach 操作」を参照)。
dismiss - 現在行っている手順を終了しますが、ボードは現在の状態 (Present、Init Attach、In Use) のままになります。DR Attach ウィンドウは、接続の任意の時点で dismiss を選択することによって、消去することができます。dismiss ボタンは、接続のために SSP 上で行われているすべての処理を終了します。たとえば、dismiss をクリックしたときに hpost(1M) が実行中の場合は、hpost(1M) プロセスが終了します。dr_daemon(1M) への RPC によってホスト上で行われている処理は、dismiss では終了できません。RPC が開始されると、ホストは、呼び出したプログラムが RPC が終了するのを待っているかどうかに関係なく、RPC を完了します。ホストの dr_daemon(1M) は、接続の進行状況を追跡します。Init Attach の状態は、このプロセスが正常に完了した後も保持されます。ですから、ウィンドウを消しても、後で DR 操作に戻り、接続を中止することができます。
help - DR Attach 操作に関するオンライン情報を表示します。
以下の操作を実行する前に、「システムボードの接続」を必ずお読みください。
Hostview ウィンドウの View メニューから、接続するボードを表示可能なシステム画面を選択します。
Hostview から、接続するボードを表示する画面を選択し、次にボードを選択します。
Hostview から Configuration > Board > Attach を選択します。
attach - Board and Domain Selection ウィンドウが表示されます(図 2-1)。
上側の select ボタンをクリックします。
Board フィールドには情報が自動的に入力されます。ボードがドメインに属している場合は、同様に Domain にも自動的に情報が入力されます (手動でこのフィールドを編集することもできます)。
Hostview のメインウィンドウの View メニューから、ボードを接続するドメインを選択します。
下側の select ボタンをクリックします。
Target Domain フィールドに情報が自動的に入力されます (手動でこのフィールドを変更することもできます)。
execute ボタンをクリックします。
エラーが発生すると、Hostview のメインウィンドウにエラーメッセージが表示されます。エラーがなければ、Dynamic Reconfiguration ウィンドウが表示されます。このウィンドウには init attach ボタンが表示されます(図 2-2)。
init attach ボタンをクリックします。
init attach ボタンをクリックすると、ボード接続プロセスの最初の段階が開始されます。システムは最初に、ターゲットドメインのボードリストにシステムボードを追加することによって、SSP の domain.config(4) ファイルを更新します。次に、システムは hpost(1M) を使用してシステムボードのセルフテストを行います。セルフテスト完了後、センタープレーンおよびシステムボードハードウェアレジスタを変更して、ハードウェアドメインに組み込まれることによって、そのボードは実行中のターゲットドメインに認識されるようになります。最後に、init attach を完了するときに OBP は新しいボードをプローブして、そのボード上にある CPU、入出力およびメモリーを認識します。この段階が終了すると、ボタンの表示が complete に変化します。ただし、complete ボタンをクリックする前に、「ドメイン情報の表示」の手順に従ってドメイン情報を表示し、確認してから操作を続けてください。
通常、Init Attach 操作の完了までには、数分を要します。hpost(1M) コマンドの出力は、Dynamic Reconfiguration ウィンドウの Information 区画に表示されます。
Init Attach が失敗した場合は、Information 区画に出力された内容を見て、原因を解明してください。原因を把握してから、再度 Init Attach を選択します。
Init Attach の処理が成功すると、complete ボタンが有効になります。
complete ボタンをクリックします(図 2-3)。
通常、complete 操作が完了するのに約 1 分かかります。complete 操作が正常に実行されると、DR は以下のメッセージを表示します。
Board attachment completed successfully |
これで、オペレーティングシステムは、システムボードのリソース (プロセッサ、メモリー、および入出力デバイス) を使用することができます。
「ドメイン情報の表示」で説明するように、ボタン (CPU、Memory、Device など) を使用して、新たに接続したボードのシステム情報を表示することができます。
reconfig ボタンを使用する前に、『Sun Enterprise 10000 DR 構成マニュアル』を参照してください。
dismiss ボタンをクリックします。
DR Attach 操作が完了します。
以下の操作を実行する前に、「システムボードの接続」を必ずお読みください。ボードの接続プロセスは、Hostview を使用した場合も dr(1M) を使用した場合も似ています。基本的な概念はこの節では繰り返しません。dr(1M) アプリケーションでは、helpコマンドによって、クイックリファレンスガイドを利用することができます。
domain_switch(1M) コマンドを使用して、SUNW_HOSTNAME を適切なドメインに設定します。
% domain_switch ドメイン名 |
SSP ウィンドウで dr(1M) コマンドを実行し、dr(1M) プロンプトを表示します。
以下の例では、ターゲットドメインは xf3 です。
% dr Checking environment... Establishing Control Board Server connection... Initializing SSP SNMP MIB... Establishing communication with DR daemon... xf3: Domain Status - Summary BOARD #: 0 1 2 5 6 8 9 10 11 13 physically present. BOARD #: 4 7 being used by the domain. dr> |
目的のボードに対して、init_attach(1M) 操作を開始します。
この例では、ボード 6 がドメインxf3 に接続されます。
dr> init_attach 6 Initiate attaching board 6 to domain xf3. Adding board 6 to domain_config file. /opt/SUNWssp/bin/hpost -H40,28 Opening SNMP server library... Significant contents of /export/home/ssp/.postrc: blacklist_file ./bf redlist_file ./rf Reading centerplane asics to obtain bus configuration... Bus configuration established as 3F. phase cplane_isolate: CP domain cluster mask clear... ... phase final_config: Final configuration... Configuring in 3F, FOM = 2048.00: 4 procs, 4 SCards, 1024 MBytes. Creating OBP handoff structures... Configured in 3F with 4 processors, 4 SBus cards, 1024 MBytes memory. Interconnect frequency is 83.294 MHz, from SNMP MIB. Processor frequency is 166.631 MHz, from SNMP MIB. Boot processor is 6.0 = 24 POST (level=16, verbose=20, -H28,0040) execution time 3:07 hpost is complete. obp_helper -H -m24 Board debut complete. Reconfiguring domain mask registers. Board attachment initiated successfully. Ready to COMPLETE board attachment. |
接続操作を中止するか、完了します。
init_attach(1M) 操作が正常に完了すると、drshow(1M) の OBP 表示を使用してボードリソースの一覧を確認することができます。
dr> drshow ボード番号 OBP |
ボードの接続操作を中止する場合は、abort_attach(1M) コマンドを実行します。
dr> abort_attach ボード番号 |
ボードの接続操作を完了する場合は、complete_attach(1M) コマンドを使用します。
dr> complete_attach 6Completing attach for board 6. ...Checking IDN state of domain_name_a : UP Issuing IDN UNLINK (domain_name_a) Verifying IDN UNLINK... IDN (XM) UNLINK succeeded (domain_name) ...Checking IDN state of domain_name_a : UP ...Checking IDN state of domain_name_b : UP Initiating IDN LINK... IDN LINK succeeded (domain_name_a + domain_name_b) Board attachment completed successfully. dr> |
ボードが正常に接続されると、すべての drshow(1M) 表示が使用可能になります。
drshow(1M) を使用して、新たに接続されたボードの入出力情報を表示します。
dr> drshow 6 IO SBus Controllers and Devices for Board 6 ---------------------- Sbus 0 : Slot 0 : SUNW,pln0 ------------- device opens name usage ------ ----- ---- ----- ssd0 0 /dev/dsk/c1t0d0s0 ssd16 0 /dev/dsk/c1t1d0s0 ssd32 0 /dev/dsk/c1t2d0s0 ssd48 0 /dev/dsk/c1t3d0s0 ssd64 0 /dev/dsk/c1t4d0s0 ssd80 0 /dev/dsk/c1t5d0s0 ---------------------- Sbus 0 : Slot 1 : SUNW,pln2 ------------- device opens name usage ------ ----- ---- ----- ssd96 0 /dev/dsk/c2t0d0s0 ssd97 0 /dev/dsk/c2t0d1s0 ... |
exit と入力して、この dr(1M) セッションを終了します。
dr> exit % |
SSP のログインシェルプロンプトが再度表示されます。
この節では、DR Detach を実行した場合に発生する処理の概要を示します。GUI を使用した詳細な手順については、「Hostview を使用してボードを切り離す」を参照してください。または、「コマンド行インタフェース (CLI) を使用してボードを切り離す」を参照してください。
オペレーティング環境が現在使用しているシステムボードは、『Sun Enterprise 10000 DR 構成マニュアル』に記載されている条件を満たしていれば、切り離すことができます。適切なボードを選択したら、Drain および Complete Detach という 2 つの操作を実行して、ボードを切り離します。
Drain 操作の主な目的は、オペレーティング環境がボードのメモリーを空にするときの方法を決定し、必要なら、ボード上のページング不可能なメモリーのコピー先となるターゲットメモリー領域を選択することです。Drain 操作を要求したときに、適切なターゲットメモリー領域が使用できない場合、要求は拒否されます。この理由で Drain が拒否された場合は、ターゲットメモリーが使用可能になるまで再試行を続けてかまいません。詳細については、『Sun Enterprise 10000 DR 構成マニュアル』を参照してください。
Drain 操作が始まると、ボード上のページング可能なメモリーはディスクにフラッシュされ、ドメインが使用できなくなります。1 ページ分のメモリーに空きができると、そのページは今後使用できるようにロックされます。Drain は、ボード上の CPU および入出力リソースを使用しているプロセスに対して目に見えるような影響は与えません。ただし、ドメインが使用できるメモリーは減少します。
メモリーをドレインした後に、現在の作業負荷に対応できるだけの十分なメモリーとスワップ領域が、ドメイン内に残っている必要があります。
Drain 操作の実行中、Hostview や dr(1M) を使用して、ドレインするページがあと何枚残っているか、またボード上のデバイスの使用状況など、切り離しの進行状況を監視することができます。この情報を使用して、残りのボードデバイスを切り離すためのドメインの準備を行うことができます。
切り離し操作は、途中で取り消すことができます。取り消した場合、ボード上のメモリーが通常の用途に戻ります。Drain プロセスの途中または Drain 操作の完了後に、操作を取り消すこともできます。Drain 中にメモリーに極端な負荷がかかる場合は、ドレインされたページの割合がほとんど増加しないか全く増加しません。このような場合は、ドメインの作業負荷が減少するまで Drain を中止すると、メモリーの負担を減少させることができます。
Drain 操作は、すべてのメモリーページの使用が解放された時点で終了です。この後は、切り離し完了の操作を行います。
切り離し操作を完了するためには、その前に、すべてのボードリソース (プロセッサ、メモリー、および入出力デバイス) の使用を停止する必要があります。メモリー、プロセッサ、およびネットワークデバイスの使用は、DR によって自動的に停止させられますが、非ネットワーク入出力デバイスの使用は、ユーザー自身が手動で停止する必要があります。
切り離すボード上にあるコンポーネントを確認するには、dr(1M) コマンドのオプションの 1 つである drshow(1M)、または Hostview に表示されるウィンドウを使用します (Configuration メニューを選択し、Board プルダウンメニューから Detach メニュー項目を選択します)。またもう 1 つの選択肢として、ドメイン上で prtdiag(1M) コマンドを使用する方法もあります。この方法ではコンポーネントの特定に、より少ない情報を用います。
すべてのボードの使用を停止したら、Complete Detach 操作を実行することができます。この時点でまだ使用中のデバイスがある場合、切り離し操作は失敗し、使用中のデバイスが報告されます。問題が解決したら、Complete Detach 操作を再度実行してください。
切り離すボードにページング不可能なメモリーが含まれる場合、Complete Detach 操作は、休止に関する問題が原因となって失敗することがあります。詳細は、『Sun Enterprise 10000 DR 構成マニュアル』を参照してください。休止の問題が解決したら、Complete Detach 操作を再度実行することができます。
この時点で、切り離し操作を中止することができます。中止した場合、ボード上のメモリーは通常の用途に戻り、切り離されたボードデバイスが再接続されます。ボードが使用されないようにシステム構成を変更していた場合 (ファイルシステムのマウントを解除した場合や、ネットワークの設定を ifconfig コマンドで解除した場合) は、ユーザーが手動でこれらの変更を取り消し、デバイスを通常の稼動状態に戻してください。
ボードがオペレーティング環境から正常に切り離されると、次にこのボードはホストのハードウェアドメインから移動させられて、センタープレーンから切り離されます。さらに、SSP の domain_config(4) ファイルのボードのリストが自動的に更新されます。
これで、ボードを他のドメインへ接続したり、接続しないで残しておくことができます。
Hostview の detach ウィンドウでは、切り離し操作中、以下のボタンが表示されます。
表 2-1 Hostview のボタン
ボタン |
説明 |
---|---|
drain |
メモリーをドレインします (「Drain 操作」を参照)。ドレイン操作が終了すると、drain ボタンが complete ボタンに変わります。 |
complete |
ボードが完全にドレインされた後に、切り離し操作を完了します (「Complete Detach 操作」を参照)。 |
force |
ドメインを強制的に休止させることによって、detach 操作を完了できるようになります (『Sun Enterprise 10000 DR 構成マニュアル』を参照)。強制可能な休止状態があるために complete detach 操作が失敗した場合は、force ボタンが有効になります。 |
reconfig |
ドメインのデバイスディレクトリを自動的に再構成します。完全にボードを切り離した後で、reconfig を実行してください。reconfig を使用する場合は、細心の注意を払ってください (詳細は、『Sun Enterprise 10000 DR 構成マニュアル』を参照)。 |
abort |
DR 操作を取り消して、ボードを通常動作に戻します。このボタンは、ドレイン操作が開始されたときに有効になり、complete detach が開始されるまで有効です。メモリーのドレインを中止したり、切り離しを取り消すときに、この abort を選択します (「システムボードの切り離し」を参照)。 |
dismiss |
現在実行中の操作を取り消します。ボードの状態 (In Use、drain、Present) はそのままになります。dismiss を選択して、切り離し操作の任意の時点で DR Detach ウィンドウを消去することができます。dismiss は、切り離し操作のために現在 SSP 上で行われているすべての処理を終了します。ただし dismiss は、dr_daemon(1M) への RPC 呼び出しによってホスト上で実行されている処理は終了しません。RPC 呼び出しが開始されると、ホストは、Hostview が RPC 呼び出しが終了するのを待っているかどうかに関係なく、RPC 呼び出しを完了します。ホストの dr_daemon(1M) は、drain が開始した後の切り離し操作の進行状況を記録します。ですから、ウィンドウを消しても、後で切り離し操作を完了したり中止したりすることが可能です。 |
help |
DR 切り離し操作に関するオンライン情報を表示します。 |
以下の操作を実行する前に、「システムボードの切り離し」をお読みください。
Hostview ウィンドウの View メニューから、目的のボードが接続されているドメインを選択し、切り離すボードのアイコンをクリックします。
Hostview メニューから Configuration > Board > Detach を選択します。
detach - Board and Domain Selection ウィンドウが表示されます (図 2-4)。
select ボタンをクリックします。
Board および Source domain フィールドには情報が自動的に入力されます (手動でこれらのフィールドを変更することもできます)。
execute ボタンをクリックします。
ターゲットドメインが起動されていない場合は、単に SSP のドメイン再構成ファイルが操作されるだけです。ドメインが動作中の場合は、以下のウィンドウが表示されます (図 2-5)。
drain ボタンをクリックします。
Hostview がメモリーのドレインを開始します。メモリー情報が表示され、Drain 操作の進行状況を確認することができます。
DR Properties ウィンドウで Auto Update Domain Information Displays オプションを有効にすると、メモリードレインの状態表示が一定間隔で自動的に更新されます。「ドメイン情報の表示」を参照してください。
Drain 操作が失敗すると、Information 区画に原因が表示されます。原因が判明したら、問題を解決し、drain をもう 1 度選択します。
この後、すぐに次の手順に進んでかまいません。Drain の完了を待つ必要はありません。
ボード上でどのデバイスがアクティブであるかを判断するには、device ボタンをクリックします。
DR Device Configuration ウィンドウが表示されます。このウィンドウにはデバイスの使用状況のスナップショットが表示され、一定間隔で更新されます。
ボードに常駐する入出力デバイスの使用をすべて停止します。
詳細は、「Complete Detach 操作」を参照してください。
complete ボタンが表示された時点で、DR はメモリーのドレインを終了していますから、次の手順に進むことができます。
complete ボタンをクリックします。
この操作は、オペレーティング環境の休止が必要な場合は特に、完了するのに数分かかります。complete 操作が終了すれば、ボードデバイスがオペレーティングシステムから切り離されたことになります。
complete 操作が失敗した場合は、以下のような理由が考えられます。
ドメイン内のすべてのオンラインプロセッサが、切り離そうとするボード上にある。
切り離そうとするボードに、「デフォルトの」一連のプロセッサの最終プロセッサが含まれている。この場合は Detach 操作を再度試みる前に、別のシステムボードのプロセッサを追加してください。
切り離そうとするボード上に主ネットワークインタフェースがある。この場合は、これらのネットワークの使用をすべて手動で停止する必要があります (「Complete Detach 操作」を参照)。
切り離そうとするボード上にまだ使用中の入出力デバイスがある。Information 区画に、エラーが検出されたデバイスが表示されます (「Complete Detach 操作」を参照)。
オペレーティング環境の休止に失敗している。エラーの原因を突き止めて、問題を解決してください (『Sun Enterprise 10000 DR 構成マニュアル』を参照)。
障害の原因を取り除いたら、complete または force 処理を選択して、切り離し操作を完了します。問題がなければボードが切り離され、リセットされます。ボードが正常に切り離されると、以下のメッセージが表示されます。
Board detachment completed successfully. |
reconfig オプションを選択する前に、『Sun Enterprise 10000 DR 構成マニュアル』を参照してください。
これで、デバイスのディレクトリの再構成や、Detach ウィンドウの取り消しができる状態になります。ボードの電源を切り、ホットスワップによりボードを取り外す、またはそのボードを別のドメインと接続する、あるいはシステムと接続せずに残しておき、後から再接続するといった操作を行うことができます。
以下の操作を実行する前に、「システムボードの切り離し」を参照してください。ボードの切り離し処理は、Hostview を使用する場合も dr(1M) を使用する場合も、似ています。
domain_switch(1M) コマンドを使用して、SUNW_HOSTNAME を適切なドメインに設定します。
SSP ウィンドウで dr(1M) コマンドを使用して、dr(1M) プロンプトを表示します。
以下の例では、ターゲットドメインは xf3 です。
% dr Checking environment... Establishing Control Board Server connection... Initializing SSP SNMP MIB... Establishing communication with DR daemon... xf3: Domain Status - Summary BOARD #: 0 1 2 5 6 8 9 10 11 13 physically present. BOARD #: 4 7 being used by the domain. dr> |
drain(1M) を使用して、ボードをドレインします。
dr> drain 6 Removing board 6 from domain_config file. Start draining board 6 Board drain started. Retrieving Domain Info... Bound Processes for Board 6 cpu user sys procs --- ---- --- ----- 24 0 1 25 0 1 26 0 1 27 0 1 Active Devices for Board 6 device opens name usage ------ ----- ---- ----- ssd384 0 /dev/rdsk/c5t0d0s4 AP database Memory Drain for Board 6 - IN PROGRESS Reduction = 1024 MBytes Remaining in Domain = 1024 MBytes Percent Complete = 99% (5696 KBytes remaining) Drain operation started at Wed Oct 09 18:06:00 1996 Current time Wed Oct 09 18:06:34 1996 Memory Drain is in progress. When Drain has finished, you may COMPLETE the board detach. dr> |
drain(1M) コマンドによってドレイン操作が開始され、すぐにシェルプロンプトに戻ります。以下のコマンドを実行すると、ドレイン操作の進行状況を確認できます。
dr> drshow ボード番号 drain |
drain(1M) コマンドに wait オプションを付けてドレインを開始することもできます。この場合は、ドレインが完了するまでシェルプロンプトに戻りません。wait オプションについての詳細は、drain(1M) を参照してください。
Drain 操作が正常に完了したら、complete_detach(1M) を使用して切り離しを完了します。
dr> complete_detach 6 Completing detach of board 6 Operating System has detached the board. Reconfiguring domain mask registers. Board 6 placed into loopback. Board detachment completed successfully. dr> |
「Operating system failed to quiescent due to forcible conditions」というメッセージが表示されて Complete Detach が失敗し、かつ休止障害を発生させた根本的な原因が分かっている場合は、complete_detach に force オプションを付けて再試行してください (休止障害の原因解明に役立つコンソールメッセージが表示されます)。詳細は、complete_detach(1M) を参照してください。
Detach 操作を途中で中止する場合は、上記の complete_detach の代わりに abort_detach ボード番号 コマンドを使用します。
dr(1M) と Hostview のどちらを使っても、一時停止に対して危険なデバイスについての情報や、DR 操作で選択されたボードについての情報を表示することができます。dr(1M) の場合は、drshow(1M) コマンドを使ってこれらの情報にアクセスします。Hostview の場合は、attach ウィンドウまたは detach ウィンドウで、cpu、memory、device、obp、unsafe をクリックします。
ボード上のメモリーに Drain を実行する前に、そのドメイン情報を確認してください。
情報の内容は、dr(1M) でも Hostview でも同じです。cpu、memory、device の各画面は、ボードがオペレーティング環境に接続されている場合にだけ有効です。cpu、memory、device 画面が有効な場合、それらの画面には常に正確な情報が示されます。obp 画面には、OBP が認識している情報だけが表示されます。他の 3 つの画面ほど詳細な情報は表示されません。この節では、これらの画面の使用方法について説明します。
これらのボタンのいずれかをクリックすると、ウィンドウが表示されます。表示されたウィンドウは、そのウィンドウ内の dismiss ボタンをクリックしないかぎり画面に表示され続けます。
All ボタンをクリックすると、現在有効なウィンドウがすべて表示されます。
Dynamic Reconfiguration ウィンドウで、Properties ボタンをクリックします。
画面を定期的に更新させるには、Auto Update System Information Displays を On (デフォルト値) に設定します。
Update Interval の値 (秒単位) は、画面を更新する時間間隔を決定します。
Auto Update System Information Displays を Off に設定した場合は、画面は更新されません。各画面は、ボタンをクリックした時点でのスナップショットになります。
Save ボタンをクリックして、Hostview 画面更新の設定を保存します。
更新間隔を小さな値、たとえば 10 秒に設定し、情報ウィンドウを複数個表示すると、DR ウィンドウの応答速度が低下します。これは、device detail ウィンドウが表示されている場合に特に顕著です。情報ウィンドウが更新されるたびに、そのドメインで稼働している dr_daemon(1M) に RPC が発行されます。dr_daemon が RPC サーバーと対話を行い、RPC 要求が順次実行されます。
cpu ボタンをクリックします。DR CPU Configuration ウィンドウが表示されます (図 2-8)。
DR CPU Configuration ウィンドウには、選択したボード上の各プロセッサについての固有の情報が表示されます。
表 2-2 DR の CPU 構成情報
項目 |
説明 |
---|---|
CPU ID |
選択したボードの ID 番号が表示されます。 |
STATUS |
選択したボードの状態 (すなわち、ボードがオンラインであるかオフラインであるか) が表示されます。 |
Processor Set |
ID - そのプロセッサが属するプロセッサセットの ID 番号が表示されます。プロセッサがデフォルトのセットに属する場合は、ボックス内に「none」と表示されます。 COUNT - プロセッサセットに含まれる CPU の数を表示します。 |
Bound Threads |
ユーザーの数、システムの結合スレッドの数、および結合スレッドのプロセス ID が表示されます。通常、2 つのシステムスレッド、すなわちハートビートスレッドとプロセッサアイドルスレッドが、各 CPU に結合されます。オペレーティングシステムのデバイスドライバによっては、デバイスの機能を向上させるために、プロセッサにスレッドを結合させることもあります。pbind(1M) コマンドを使用して、プロセッサにスレッドを結合させることができます。 |
PROCS |
CPU に結合しているユーザープロセスのプロセス ID を表示します。 |
memory ボタンをクリックします。
3 種類のパネルで構成された DR Memory Configuration ウィンドウが表示されます (図 2-9)。
DR Memory Configuration ウィンドウは、3 つのパネルに分割されています。
表 2-3 DR のメモリー構成情報
System Memory Sizes (ドメインのメモリー情報) |
|
Current System: |
ドメイン内にあるすべてのボードのメモリー総容量 |
Attach Capacity: |
DR Attach 操作によって現在追加できるメモリーの容量 |
dr-max-mem: |
OBP 変数 dr-max-mem の現在の値。詳細は、『Sun Enterprise 10000 DR 構成マニュアル』を参照してください。 |
Memory Detach: |
|
Memory Configuration for Board 0 (ボードレベル情報) |
|
Memory Size (MB): |
選択したボードのメモリーの総容量 |
Interleave Board: |
選択したボードがインターリーブされているボード |
Physical Pages: |
そのボードのメモリーによって占有される最大物理ページおよび最小物理ページ (ボードはこの範囲中央にある小さなメモリー領域を使用しないことがあります。DR はインターリーブされたメモリーを搭載したボードを切り離すことはできません)。 |
Memory Drain 情報 |
|
Reduction: |
ボードが切り離されたときにドメインの使用対象外となるメモリーの容量 |
Remaining in System: |
ボードが切り離されたときのドメインのメモリー容量 |
Percent Complete: |
drain 操作の進行状況。各メモリーページをドレインするのに必要な時間は一定ではありません。他のページより長い時間かかるページもあります。 |
Drain Start Time: |
drain 操作を開始した時刻 |
Current Time: |
現在の時刻。Drain Start Time と比較して、drain 操作を継続した時間を計算することができます。 |
device ボタンをクリックします。
DR Device Configuration ウィンドウが表示されます ( 図 2-10)。
各スロットのコントローラまたはデバイスが表示されます。コントローラとデバイスの名前は、そのデバイス名とオペレーティング環境のインスタンス番号を連結したものです (例 : sd31)。
DR Device Configuration ウィンドウには、ボード上に物理的に存在するすべてのデバイスが表示されないこともあります。たとえば、ドライバが接続されていないコントローラは表示されません。正常にプローブされ特定されているボードに装着されているカードの一覧は、obp ボタンで表示される画面に示されます。
1 つまたは複数のコントローラを強調表示します。
Detail を選択します。
選択した各コントローラについて、以下のウィンドウが表示されます ( 図 2-11)。
各デバイスの現在の使用状況が表示されます。このウィンドウには、開いているデバイスの数とデバイスの一般的な名前 (たとえば、ディスクパーティション、メタデバイス、またはインタフェース名) が表示されます。この他、パーティションのマウントポイント、ネットワークインタフェースの構成、スワップ領域の使用状況、メタデバイスの使用状況も示されます。
Sun Solstice DiskSuiteTM データベース や Alternate Pathing (AP) データベースが使用しているディスクパーティションの使用状況や、Sun Enterprise Volume ManagerTM の使用状況などは、報告されない場合があります。
コントローラやネットワークインタフェースが AP データベースの一部である場合は、このウィンドウに、それがアクティブかどうか、AP 代替かどうかが示されます。アクティブな AP 代替の場合は、AP メタデバイスの使用状況が表示されます。
DR OBP Configuration ウィンドウには、OBP のデバイスツリーから得られたボード構成情報が表示されます。このウィンドウの情報は、この節で説明している他のウィンドウの情報ほど詳細なものではありません。たとえば、init attach 状態では、入出力アダプタだけが認識されます。それらのコントローラに接続されているデバイスも、メモリーのインターリーブ構成も認識されません。このウィンドウは通常、ボードが init attach 状態にある場合に使用します。
DR OBP Configuration ウィンドウが表示されます ( 図 2-12)。
unsafe ボタンをクリックします。
DR Unsafe Devices ウィンドウが表示されます (図 2-13)。
DR Unsafe Devices ウィンドウには、選択したシステムボードに常駐するものだけでなく、ドメイン全体の現在開いている一時停止に対して危険な装置が表示されます。この情報は、オペレーティング環境を休止しようとしたときに発生したエラーが、一時停止に対して危険な装置が開いていることに起因しているのかどうかを判断するのに役立ちます。