1


Sun Fire ミッドレンジシステムの DR の概要

Solaris 9 および Solaris 10 オペレーティングシステムでは DR の全機能がサポートされていますが、それ以前のバージョンの Solaris ソフトウェアの一部では、入出力ボードの再構成がサポートされていませんでした。Solaris 8 ソフトウェアでドメインでの DR の全機能をサポートするようになったのは、Solaris 8 2/02 ソフトウェアからです。Solaris 8 ソフトウェアを実行しているシステムで DR を有効にする方法についての詳細は、以下の Web サイトをご覧ください。

http://www.sun.com/servers/midrange/dr_sunfire



注 - DR 操作を実行するには、スーパーユーザーとしてアクセスする必要があります。




動的再構成 (DR)

DR ソフトウェアは、Solaris ソフトウェアの一部です。DR ソフトウェアにより、オペレーティングシステムの稼動中に、ドメインで実行中のユーザープロセスの中断を最小限に抑えながら、システムボードを動的に再構成し、安全に着脱することができます。

DR を使用すると、次の操作を実行できます。

コマンド行インタフェース

DR ソフトウェアには、構成管理プログラムである cfgadm コマンドを使用するコマンド行インタフェース (CLI) があります。DR エージェントには、Suntrademark Management Center グラフィカルユーザーインタフェースへの遠隔インタフェースも備わっています。

グラフィカルユーザーインタフェース

オプションの Sun Management Center (バージョン 3.0 以降) のソフトウェアは、cfgadm DR コマンド行インタフェース (CLI) のグラフィカルユーザーインタフェース (GUI) 版を提供するほか、ドメイン管理などの機能もあります。GUI の使用を希望する場合は、システムコントローラや DR ソフトウェアのコマンド行インタフェースではなく Sun Management Center ソフトウェアを使用してください。

Sun Management Center ソフトウェアを使用するには、システムコントローラボードをネットワークに接続する必要があります。ネットワークに接続すると、コマンド行インタフェースとグラフィカルユーザーインタフェースの両方を表示できます。Sun Management Center ソフトウェアの使用方法は、『Sun Management Center ユーザーマニュアル』および『Sun Management Center Sun Fire ミッドレンジシステムのための追補マニュアル』を参照してください。システムコントローラをシステムコントローラボードのネットワーク接続部に接続するには、ご使用のシステムの設置マニュアルを参照してください。


DR の概念

この節では、Sun Fire ミッドレンジシステムドメインに関する一般的な DR の概念について説明します。

ドメイン

Sun Fire ミッドレンジサーバーは、複数の動的システムドメイン (このマニュアルでは、ドメインと呼びます) に分割できます。これらのドメインは、ドメインに割り当てられるシステムボードスロットに対応しています。各ドメインは、ハードウェアパーティションに電気的に分離されるため、あるドメインで問題が発生しても、サーバーの他のドメインには影響しません。

ドメイン構成情報はシステムボードスロットを複数のドメインに論理的に分割する方法を規定したもので、SC 上に保持されています。ドメイン構成には空のスロットと占有状態のスロットが含まれます。

特定のドメインで使用可能なスロットの数は、システムコントローラで保持される使用可能構成要素リストによって指定されます。ドメインに割り当てられたスロットはそのドメインでは表示されますが、他のドメインからは使用できず、かつ表示されません。逆に言えば、スロットを他のドメインに割り当てて構成するには、あらかじめそのスロットを元のドメインから切り離して割り当て解除しておく必要があります。

論理ドメインとは、ドメインに割り当てられている一連のスロットをいいます。物理ドメインとは、物理的に相互接続されたボード群のことです。スロットは、物理ドメインに含まれていなくても論理ドメインのメンバーになれます。ドメインが起動したら、システムボードを論理ドメインに割り当てることができます。ただし、オペレーティングシステムから要求があるまでは、システムボードを物理ドメインに含めることはできません。ドメインに割り当てられていないシステムボードやスロットは、そのボードやスロットを使用可能構成要素リストに登録しているドメインで使用できます。ボードはプラットフォームコンソールからドメインに割り当てることができ、そのボードがドメインの使用可能構成要素リストに登録されていれば、ドメインコンソールから割り当てることもできます。ドメインの使用可能構成要素リストを変更できるのは、プラットフォームコンソールからだけです。

切り離し可能性

切り離し可能なデバイスは、次の条件を満たしている必要があります。

一部のボードは、その資源を移動できないために切り離すことができません。たとえば、ドメインに CPU ボードが 1 つしかない場合、その CPU ボードは切り離せません。起動ドライブにフェイルオーバー機能が実装されていない場合は、そのドライブに接続されている入出力ボードは切り離せません。

入出力ボードに複数のパスがない場合は、次の方法で対処できます。

休止

常時メモリー (OpenBoottrademark PROM またはカーネルメモリー) を搭載したシステムボードでの構成解除操作中、オペレーティングシステムは一時停止しますが、これはオペレーティングシステムの休止と呼ばれています。構成解除操作の重要な段階では、センタープレーンでのすべてのオペレーティングシステムとデバイスの動作を停止する必要があります。

ボードに常時メモリーが搭載されているかどうかを簡単に判定するには、スーパーユーザーで次のコマンドを実行します。

# cfgadm -av | grep permanent

システムボード 0 (ゼロ) を示す次のような出力が表示されます。

N0.SB0::memory connected configured ok base address 0x0, 4194304
 KBytes total, 668072 KBytes permanent

休止を実行するには、オペレーティングシステムがすべてのプロセス、CPU、およびデバイスの動作を一時的に中断する必要があります。オペレーティングシステムが休止できない場合は、以下のような理由が表示されます。

プロセスが中断できない状況は、一時的なことがよくあります。中断できなかった場合は、その理由を調べてください。オペレーティングシステムが一時停止できない状態になった (プロセスの中断に失敗した) 場合には、操作を再試行できます。

常時メモリーとは、Solaris のカーネルとそのデータが常駐する場所をいいます。他のボードに常駐するユーザープロセスはスワップデバイスにページングされることによってメモリーを解放できますが、これと同じ方法でカーネルをメモリーから解放することはできません。かわりに cfgadm は、コピーと名前の変更という方式を使用してメモリーを解放します。

コピーと名前の変更の操作では、まずすべての入出力操作と動作中のスレッドを一時停止してシステム上のすべての動作中のメモリーを停止します。この処置は、休止と呼ばれます。休止中、システムは停止されて、ネットワークパケットなどの外部イベントに応答しません。休止期間は、2 つの要因に依存します。それは、停止する必要がある入出力デバイスとスレッドの数、およびコピーする必要があるメモリーの量です。入出力デバイスを一時停止または一時停止解除する必要があるため、一般的には入出力デバイスの数によって必要な休止時間が決まります。通常、休止状態は 2 分以上続きます。

休止による影響は大きいため、cfgadm は、休止を行う前に確認を要求します。次のように入力するとします。

# cfgadm -c unconfigure N0.SB0

確認のために次のプロンプトが表示されます。

System may be temporarily suspended, proceed (yes/no)?

Sun Management Center を使用して DR 操作を実行する場合は、ポップアップウィンドウにこのプロンプトが表示されます。

休止の影響を確認してから Yes と入力し、作業を進めてください。

一時停止に対して安全なデバイスと一時停止に対して危険なデバイス

DR がオペレーティングシステムを一時停止する場合は、オペレーティングシステムに接続されているデバイスドライバもすべて一時停止する必要があります。ドライバを一時停止できない (または再開できない) 場合、DR 操作は失敗します。

一時停止に対して安全なデバイスは、オペレーティングシステムが休止状態にある間、メモリーへのアクセスもシステムへの割り込みも行いません。ドライバがオペレーティングシステムの休止 (一時停止/再開) をサポートするときは、「一時停止に対して安全な」ドライバです。また、一時停止に対して安全なドライバでは、一時停止要求が正常に完了すると、そのドライバが管理するデバイスは (一時停止要求が出されたときに開いても) メモリーへのアクセスを行いません。

一時停止に対して危険なデバイスでは、オペレーティングシステムが休止状態でも、メモリーへのアクセスやシステムへの割り込みが行われてしまいます。

接続点

接続点とは、ボードとそのスロットをまとめて表す用語です。DR では、スロット、ボード、および接続点の状態を表示できます。ボードの DR 定義には、当該ボードに接続されるデバイスも含まれます。したがって、「占有装置」という用語は、ボートとそのボードに接続されているデバイス全体を指しています。

接続点には、次に示す 2 つの形式があります。

ここで、N0 はノード 0 (ゼロ)、

SB はシステムボード、

IB は入出力ボード、

x はスロット番号です。システムボードのスロット番号は 0 〜 5、入出力ボードのスロット番号は 6 〜 9 の範囲の値です。

DR の操作

DR の操作は、大きく分けて次の 4 種類です。

操作

説明

接続 (Connect)

スロットはボードに電力を供給するとともに、ボードの温度の監視を開始する。入出力ボードの場合、接続操作は構成操作に含まれる。

構成 (Configure)

オペレーティングシステムはボードに機能上の役割を割り当てて、そのボードのデバイスドライバと接続デバイスのデバイスドライバをそれぞれ読み込む。

構成解除 (Unconfigure)

オペレーティングシステムからボードが論理的に切り離されて、関連するデバイスドライバがオフラインになる。環境の監視は続けられるが、ボード上のデバイスをシステム用に使用することはできない。

切り離し (Disconnect)

ボードの監視は停止されてスロットの電源は切断される。


システムボードが使用中の場合は、使用を停止してドメインから切り離した後、電力供給を停止してください。新しいシステムボードまたはアップグレードしたシステムボードを挿入して電源を投入したら、まずその接続点を接続して、オペレーティングシステムで使用できるよう構成します。

cfgadm(1M) コマンドは、1 つのコマンドで接続と構成 (または構成解除と切り離し) を実行できますが、必要に応じて、各操作 (接続、構成、構成解除、または切り離し) を個別に実行できます。

ホットプラグハードウェア

ホットプラグ対応のボードとモジュールには、ボードまたはモジュールに電力を供給してからデータピンに電流を通す特殊なコネクタがあります。ホットプラグコネクタがあるボードとデバイスは、システムの実行中に着脱することができます。

Sun Fire ミッドレンジサーバーで使用される入出力ボードと CPU/メモリーボードは、ホットプラグデバイスです。周辺装置用電源などの一部のデバイスはホットプラグモジュールではないため、システムの実行中には取り外せません。

条件と状態

状態とは、受容体 (スロット) または占有装置 (ボード) のどちらかの動作状態をいいます。条件とは、接続点の動作状態をいいます。

ドメインからボードまたはコンポーネントに対して DR 操作を実行する場合は、まず状態と条件を判断する必要があります。cfgadm(1M) コマンドに -la オプションを付けて使用すると、各コンポーネントのタイプ、状態、および条件と、ドメイン内の各ボードスロットの状態と条件を表示できます。コンポーネントタイプの一覧については、コンポーネントタイプを参照してください。


ボードの状態、条件、およびクラス

この節では、システムボード (システムスロットともいいます) の状態、条件、およびクラスについて説明します。

ボード受容体の状態

ボードは、空の状態、切り離された状態、または接続された状態という 3 つの受容体の状態のいずれかになります。ボードを挿入すると、受容体の状態は空の状態から切り離された状態になります。ボードを取り外すと、受容体の状態は切り離された状態から空の状態に変わります。



caution icon

注意 - 接続された状態にあるボード、または電源投入されてかつ切り離された状態にあるボードを物理的に取り外すと、オペレーティングシステムがクラッシュして、システムボードに永続的な損傷が生じるおそれがあります。



名前

説明

empty

ボードは存在しない。

disconnected

ボードはシステムバスから切り離された状態である。ボードは、電源を切断しなくても切り離された状態になる。ただし、ボードをスロットから取り出すには、ボードの電源を切断して切り離された状態にする必要がある。

connected

ボードは電源投入されてシステムバスに接続された状態である。ボード上のコンポーネントは、接続された状態になって初めて表示される。


ボード占有装置の状態

ボードは、構成された状態または構成解除された状態という占有装置の状態のいずれかになります。切り離されたボードの占有装置の状態は常に構成解除された状態です。

名前

説明

configured

ボードの少なくとも 1 つのコンポーネントが構成された状態である。

unconfigured

ボードのすべてのコンポーネントが構成解除された状態である。


ボードの条件

ボードは、unknown、ok、failed、または unusable の 4 つの条件のいずれかになります。

名前

説明

unknown

ボードはテストされていない。

ok

ボードは動作する。

failed

ボードはテストに失敗した。

unusable

ボードスロットは使用できない。


ボードのクラス

cfgadm コマンドは、Sun Fire ミッドレンジサーバーのシステムボードをクラス "sbd" として示し、CompactPCI (cPCI) カードをクラス "pci" として示します。

接続点に関連するクラスを表示するには、スーパーユーザーとして次のコマンドを実行してください。

# cfgadm -s "cols=ap_id:class"

動的接続点とそのクラスも一覧表示するには、前述の cfgadm コマンドに -a オプションを引数として追加してください。


コンポーネントの状態、条件、および種類

この節では、コンポーネントの状態と条件、およびその種類について説明します。

コンポーネント受容体の状態

コンポーネントは、個々に接続したり切り離したりすることはできません。したがって、コンポーネントの状態は接続された状態だけです。

コンポーネント占有装置の状態

コンポーネントは、構成された状態または構成解除された状態のいずれかの占有装置の状態になります。

名前

説明

configured

コンポーネントは、Solaris ソフトウェアで使用できる。

unconfigured

コンポーネントは、Solaris ソフトウェアで使用できない。


コンポーネントの条件

コンポーネントは、unknown、ok、または failed の 3 つの条件のいずれかになります。

名前

説明

unknown

コンポーネントはテストされていない。

ok

コンポーネントは動作する。

failed

コンポーネントはテストに失敗した。


コンポーネントタイプ

DR を使用すると、いくつかのタイプのコンポーネントを構成または構成解除できます。

名前

説明

cpu

個別の CPU

memory

ボード上のすべてのメモリー

pci

任意の入出力デバイス、コントローラ、またはバス



入出力ボードでの DR

入出力デバイスを搭載したシステムボードを追加または削除するときは、注意が必要です。入出力デバイスを搭載したボードを削除するには、まずそのすべてのデバイスを閉じてから、すべてのファイルシステムをマウント解除する必要があります。

入出力デバイスを搭載したボードをドメインから一時的に削除して、入出力デバイスを搭載した他のボードを追加または削除する前に再び追加する場合には、再構成は不要であり、実行の必要はありません。この場合、ボードデバイスへのデバイスパスは変更されません。

入出力 (IBx) ボードで DR 操作を実行するには、まず次のコマンドを入力して、vold デーモンを停止してください。

# sh /etc/init.d/volmgt stop

DR 操作が正常に終了したら、次のコマンドを入力して、vold デーモンを再開します。

# sh /etc/init.d/volmgt start

Sun Fire ミッドレンジシステムの DR は、SAI/P (BugID 4466378) と HIPPI/P のいずれもサポートしません。これまでのリリースでは SunHSI/P ドライバをサポートしていませんでしたが、サポートを妨げていたバグ 4496362 はパッチ 106922 (2.0) と 109715 (3.0) で修正されました。詳細については、SunSolve を参照してください。

devfsadm(1M) コマンドを実行して、何か変更が加えられていないか (特に PCI から cPCI への変更) 確認する必要があります。

CompactPCI に固有の制限事項

以下の制限事項は、CompactPCI アセンブリ関連の再構成に対して適用されます。

cPCI カードを構成解除すると、自動的に切り離しも行われます。自動構成機能が有効になっている場合、cPCI カードを接続すると構成も行われます。自動構成機能が無効になっている場合には、手動で構成する必要があります。

入出力デバイスに関する問題の解決

すべての入出力デバイスは構成解除する前に、閉じる必要があります。入出力デバイスで問題が発生した場合は、以下のリストが問題の解決に役立ちます。



注 - ndd(1M) コマンドを使用してネットワークドライバの構成パラメタを構成した場合、そのパラメタは DR 操作後、存続しないことがあります。/etc/system ファイルまたは driver.conf ファイルを特定のドライバに使用して、パラメタを永久設定してください。




常時メモリーと非常時メモリー

ボードを削除するには、あらかじめオペレーティングシステムでボード上のメモリーを無効にする必要があります。ボードの無効化とは、非常時メモリーの内容をスワップ空間にフラッシュし、常時メモリーの内容 (つまり、カーネルと OpenBoottrademark PROM ソフトウェア) を別のメモリーボードにコピーすることです。

常時メモリーを再配置するには、通常は再配置するドメインでのみ、オペレーティングシステムを一時的に休止し、すべての活動を一時停止する必要があります。休止期間は、ドメインの入出力構成と実行中の作業負荷によって異なります。

オペレーティングシステムは常時メモリーのあるボードを切り離すときにのみ休止されるため、常時メモリーの存在する場所を把握しておき、ドメインの操作に重大な影響を与えないようにする必要があります。常時メモリーの容量を表示するには、-av オプションを付けて cfgadm(1M) コマンドを実行します。常時メモリーが搭載されているボードを無効にする場合、オペレーティングシステムは十分な容量の使用可能メモリーブロック (ターゲットメモリー) を見つけ出して、常時メモリー (ソースメモリー) の現在の内容をコピーする必要があります。

ターゲットメモリーの制約

DR でシステムボードの常時メモリーを別のシステムボードに再構成することができるのは、ターゲットボードにソースボード以上のメモリー領域がある場合だけです。ターゲットボードのメモリーが足りない場合は、DR による再構成は許可されません。ターゲットボードのメモリーの方が多い場合は、余分なメモリーは使用可能メモリーのプールに追加されます。


動的再構成の概念図

DR では、システムを停止せずに、システムボードの切り離し、再取り付けが可能です。DR を使用すれば、システムを稼動させたまま、システム資源を追加あるいは削除できます。

システム資源の再構成の一例として、次の図に示す Sun Fire システムの構成を考えてみましょう。ドメイン A には、システムボード 0 と 2、入出力ボード 7 が含まれています。ドメイン B には、システムボード 1 と 3、入出力ボード 8 が含まれています。



注 - DR 操作を実行するときは、後述する 制限事項で規定されている制約にシステムが適合していることを確認してください。



図 1-1 再構成前のドメインの例

システムボード 1 をドメイン B からドメイン A に再割り当てするには、Sun Management Center ソフトウェアの GUI を使います。または、各ドメインの CLIで、次の手順を手動で実行することもできます。

1. スーパーユーザーとして、ドメイン B で次のコマンドをコマンド行に入力して、システムボード 1 を切り離します。

# cfgadm -c disconnect -o unassign N0.SB1

2. ドメイン A で次のコマンドをコマンド行に入力して、ドメイン A にシステムボード 1 を割り当て、接続し、構成します。

# cfgadm -c configure N0.SB1

次のシステム構成は上記操作の結果です。ボードの接続方法だけが変更されて、キャビネット内のボードの物理的配置は変わっていないことがわかります。

図 1-2 構成後のドメインの例


制限事項

メモリーのインタリーブ

システムメモリーが複数の CPU/メモリーボード上でインタリーブされている場合は、システムボードを動的に再構成することはできません。



注 - メモリーのインタリーブについての詳細は、setupdomain コマンドの interleave-scope パラメタを参照してください。これについては、『Sun Fire ミッドレンジシステムプラットフォーム管理ガイド』と『Sun Fire ミッドレンジシステムコントローラコマンドリファレンスマニュアル』の両方に記載されています。



逆にいえば、CompactPCI カードと入出力ボードは、メモリーがインタリーブされているかどうかに関係なく、動的に再構成できます。