この章では、Sun EnterpriseTM 10000 システムで動作する Dynamic Reconfiguration (DR: 動的再構成) の DR モデル 3.0 について説明します。
DR モデル 3.0 は、基本的に、dcs(1M) (ドメイン構成サーバー) を使用して、ドメインの DR 操作を制御します。このモデルでは、addboard(1M)、deleteboard(1M)、moveboard(1M) などのDR の自動化 (ADR) コマンドを使用することができます。このモデルでは、showusage(1M) コマンドは使用できません。DR モデル 3.0 では、以下のコマンドを新規採用しています。
showdevices(1M) コマンドはデバイスの使用状態を表示します (詳細については、「デバイス情報の表示」を参照してください)
rcfgadm(1M) コマンドは、ドメイン上の接続点の状態を表示します。
cfgadm(1M) コマンドは、ドメイン上の動的に再構成可能なハードウェアリソースの状態をリストします (詳細については、「cfgadm_sbd(1M)」を参照してください)。
自動 DR 操作により、ユーザーが指示を与えなくても、アプリケーションは自動的に DR 操作を実行することができます。この自動操作は、DR 操作を向上させるフレームワークにより実現しています。このフレームワークでは、RCM (Reconfiguration Coordination Manager) と、sysevent と呼ばれるシステムイベントファシリティを採用しています。RCM は、アプリケーションごとに読み込み可能なモジュールに対して、コールバックを登録させることができます。このコールバックは、DR 操作、DR 操作中に発生したエラーからの回復、あるいは DR 操作後のクリーンアップといった動作を実行する前に準備処理を行います。アプリケーションは、sysevent ファシリティにより、各種通知システムイベントを登録することができます。自動 DR 用フレームワークは RCM およびシステムイベントファシリティとインタフェースして、リソースの構成を解除する前にアプリケーションに対して通知を行い、アプリケーションが使用しているリソースを自動的に解放させ、そのリソースがドメインに構成された時点で新しいリソースを捕捉させます。
自動 DR と DR の自動化 (ADR) は異なる機能です。
RCM についての詳細は、「Solaris 8 10/01 Update Collection - Japanese」の『Solaris 8 のシステム管理 (追補)』を参照してください。
DR 機能により、システムの動作を停止させることなく、システムボードをホットスワップすることができます。DR 操作を行って、故障したシステムボード上のリソースをドメインから構成を解除しますので、システムボードをシステムから取り外すことが可能です。Solaris オペレーティング環境が動作している状態で、修理済みのボードまたは交換用のボードをドメイン内に組み込むことができます。DR は、組み込まれたボードのリソースをドメインに構成します。
入出力デバイスを搭載したシステムボードを実装したり、取り外す場合は注意が必要です。ボードのデバイスをすべて閉じ、ファイルシステムをすべてマウント解除してからでないと、入出力デバイスを搭載したボードを取り外すことはできません。
入出力デバイスを実装したボードを一時的にドメインから削除し、再度、ドメインへ組み入れる場合、入出力デバイスを実装した他のボードをドメインへ追加する前ならば、最初のボードの再構成は不要です。このような場合、ボードのデバイスへのデバイスパスは変更されません。ただし、入出力デバイスを実装したボードを削除し、入出力デバイスを実装した別のボードを追加し、その後に最初のボードを再度組み込む場合は、最初のボードのデバイスへのパスが変更されてしまうため、再構成が必要です。
Sun Enterprise 10000 システムを複数のドメインに分け、そのドメイン内にシステムボード、入出力ボード、およびボードに接続する CPU、メモリーチップ、CompactPCI カードなどのコンポーネントを入れることができます。各ドメインはハードウェアパーティションと電気的に分離されていますので、いずれかのドメインで障害が発生しても、システム内の他のドメインに影響を与えないようにしています。
この節では、DR モデル 3.0 のコマンドの使用方法について説明します。以下の手順について説明します。
指定のドメインへのボードの接続、別のドメインへの移動、または指定ドメインからの削除といった操作を行う前に、domain_status(1M) コマンドを使用してこれらの操作に必要なドメイン名とボード番号を調べることができます。
domain_status(1M) コマンドを使用して、ドメイン情報を表示します。
% domain_status -m |
domain_status コマンドに-mオプションを指定して実行すると、以下の例に示すように、ドメイン名、稼動している DR モデル、ドメイン内のボード数が表示されます。
% domain_status -m DOMAIN TYPE PLATFORM DR-MODEL OS SYSBDS A Ultra-Enterprise-10000 all-A 2.0 5.8 2 B Ultra-Enterprise-10000 all-A 3.0 5.8 3 4 C Ultra-Enterprise-10000 all-A 2.0 5.7 5 6 |
DR 操作を行う前に showdevices(1M) コマンドを使用すると、デバイスを削除する場合に特に必要なデバイス情報を表示することができます。
showdevices(1M) コマンドを使用して、ドメインのデバイス情報を表示します。
% showdevices -v -d A |
上記のコマンドを実行すると、ドメイン A 内にあるすべての CPU に関するデバイス情報が表示されます。デバイスごとの情報を表示させる方法については、showdevices(1M) のマニュアルページを参照してください。
CPU ---- domain board id state speed ecache usage A C1 40 online 400 4 A C1 41 online 400 4 A C1 42 online 400 4 A C1 43 online 400 4 A C2 55 online 400 4 A C2 56 online 400 4 A C2 57 online 400 4 A C2 58 online 400 4 |
上記の showdevices(1M) コマンドから出力されるメモリーに関する表示例を以下に示します。
Memory drain in progress: ----------------- board perm base domain target deleted remaining domain board mem MB mem MB addr mem MB board MB MB A C1 2048 933 0x600000 4096 C2 250 1500 A C2 2048 0 0x200000 4096 |
上記の showdevices(1M) コマンドから出力される入出力デバイスに関する表示例を以下に示します。
IO Devices ---------- domain board device resource usage A IO1 sd0 A IO1 sd1 A IO1 sd2 A IO1 sd3 /dev/dsk/c0t3d0s0 mounted filesystem "/" A IO1 sd3 /dev/dsk/c0t3d0s1 dump device (swap) A IO1 sd3 /dev/dsk/c0t3d0s1 swap area A IO1 sd3 /dev/dsk/c0t3d0s3 mounted filesystem "/var" A IO1 sd3 /var/run mounted filesystem "/var/run" A IO1 sd4 A IO1 sd5 |
showdevices(1M) コマンドのオプションと引数の一覧については、このコマンドのマニュアルページを参照してください。
ボードをドメインへ接続すると、ボードの状態は接続が完了するまで数段階に変化します。まず、ボードはドメインに接続され、次に、Solaris オペレーティング環境の中へ構成されます。ボードが接続されると、物理ドメインに組み込まれたことになり、オペレーティングシステムがボードを使用できるようになります。
addboard(1M) コマンドを使用して、ボードをドメインへ接続します。
addboard(1M) コマンドを使用して、domain_id で指定したドメインへシステムボード 2 を接続する例を次に示します。 再試行が必要な場合に、再試行の間隔を 10 分間として 2 回行います。
% addboard -d domain_id -r 2 -t 600 SB2 |
ドメインからボードを切り離すと、そのボードがドメインから削除されます。
ドメインからボードを切り離す前に、ボード上のコンポーネントの使用状態を必ずチェックしてください。ボードが常時メモリーをホストしている場合は、そのボードをドメインから切り離す前に、同じドメイン内にある別のボードへそのメモリーを移します。同様に、使用中のデバイスがある場合は、ボードを削除する前に、システムがそのデバイスを使用しなくなるまで待つか、または解放したことを確認してください。
ボードを物理的にシステムから取り外す前に、必ず、power コマンドを使用してボードの電源を切断してください。deleteboard(1M) コマンドを実行しても、ボードの電源は切断されません。power コマンドについては、power(1M) のマニュアルページを参照してください。または、「システムボードを物理的に交換する」を参照してください。『Sun Enterprise 10000 Systems Service Manual』では、ボードを物理的に取り外して交換する方法を詳細に説明しています。
deleteboard(1M) コマンドを使用して、ドメインからボードを切り離します。
deleteboard(1M) コマンドにより、ドメインからシステムボード 2 を切り離す場合の例を次に示します。再試行が必要な場合に、再試行の間隔を 15 分間として 2 回行います。
% deleteboard -r 2 -t 900 SB2 |
あるドメインから別のドメインへボードを移動する操作は、まず、初めのドメインからボードを切り離し、次にターゲットドメインへそのボードを接続して構成するという操作を行うことになります。
ドメインからボードを移動する前に、必ず、ボード上のメモリーと、ボードに接続しているデバイスの使用状態をチェックしてください。ボードが常時メモリーをホストしている場合は、同じドメイン内にある別のボードへそのメモリーを移してから、ボードを別のドメインへ移動してください。同様に、使用中のデバイスがある場合は、システムがそのデバイスを使用しなくなるまで待ってから、ボードを移動してください。
moveboard(1M) コマンドを使用して、ボードをドメインから別のドメインへ移動します。
moveboard(1M) コマンドにより、現在のドメインから domain_id で指定したドメインへシステムボード 2 を移動する場合の例を次に示します。再試行が必要な場合に、再試行の間隔を 15 分間として 2 回行います。
% moveboard -d domain_id -r 2 -t 900 SB2 |
この節では、この章で説明したコマンドを使用して、ドメイン内にあるボードを物理的に交換する方法について説明します。
以下の手順では、システムボード 2 を現在のドメインから削除し、システムボード 3 と交換します。
ドメインからボードを切り離します。
% deleteboard -r 2 -t 900 SB2 |
システムボード 2 の電源を切断します。
power コマンドについては、power(1M) のマニュアルページを参照してください。
% power -off -sb 2 |
ボードを物理的に取り外して交換する方法についての詳細は、『Sun Enterprise 10000 Systems Service Manual』を参照してください。ここで説明している手順に従わないと、システムボードや他のコンポーネントに損傷を与えることがあります。
システムボード 2 を物理的に取り外し、システムボード 3 と交換します。
システムボード 3 の電源を投入します。
% power -on -sb 3 |
システムボード 3 をドメインへ接続します。
% addboard -r 2 -t 900 SB3 |