ここでは、Solaris 10 ソフトウェアを実行する次のようなミッドレンジサーバーでの動的再構成 (DR) 機能について、最新情報を提供します。
Sun Enterprise 6x00
Sun Enterprise 5x00
Sun Enterprise 4x00
Sun Enterprise 3x00
Sun Enterprise サーバーの DR の詳細については、『Sun Enterprise 6x00、5x00、4x00、3x00 システム Dynamic Reconfiguration ユーザーマニュアル』を参照してください。Solaris 10 リリースは、上記のリストに示したシステムのすべての CPU/メモリーボードとほとんどの入出力ボードをサポートしています。
DR を実行する前に、システムが動的再構成をサポートしていることを確認してください。システムの設計が古い場合は、コンソールまたはコンソールログに次のようなメッセージが表示されます。このようなシステムは動的再構成をサポートしていません。
Hot Plug not supported in this system |
次の入出力ボードは現在サポートされていません。
タイプ 2 (グラフィックス)
タイプ 3 (PCI)
タイプ 5 (グラフィックスと SOC+)
ここでは、DR に関する一般的なソフトウェア情報について説明します。
動的再構成を有効にするには、/etc/system ファイルで 2 つの変数を設定します。また、CPU/メモリーボードの取り外しを有効にするために、もう 1 つの変数を設定する必要があります。次の手順を実行します。
スーパーユーザーとしてログインします。
/etc/system ファイルを編集して、次の行を追加します。
set pln:pln_enable_detach_suspend=1 set soc:soc_enable_detach_suspend=1 |
CPU/メモリーボードの取り外しを有効にするには、次の行をファイルに追加します。
set kernel_cage_enable=1 |
この変数の設定により、メモリーの構成解除が可能になります。
変更を適用するために、システムをリブートします。
次のコマンドを使用して、休止テストを開始できます。
# cfgadm -x quiesce-test sysctr10:slot number |
システムの規模が大きい場合は、休止テストの実行に 1 分近くかかる場合もあります。この間、cfgadm が互換性のないドライバを検出しなかった場合はメッセージはまったく表示されませんが、これは正常な動作です。
使用不可ボードリストに登録されているボードに接続処理を実行しようとすると、次のエラーメッセージが出力されることがあります。
# cfgadm -c connect sysctrl0:slotnumber cfgadm: Hardware specific failure: connect failed: board is disabled: must override with [-f][-o enable-at-boot] |
リストへの登録を無効にして使用可能な状態にするには、2 つの方法があります。
強制フラグ (-f) を使用する
# cfgadm -f -c connect sysctrl0:slot number |
使用可能設定オプション (-o enable-at-boot) を使用する
# cfgadm -o enable-at-boot -c connect sysctrl0:slot number |
使用不可ボードリストからすべてのボードを削除するには、コマンドを入力するプロンプトに応じて、次のいずれかの手順を実行します。
スーパーユーザーのプロンプトからは、次のように入力します。
# eeprom disabled-board-list= |
OpenBoot PROM プロンプトからは、次のように入力します。
OK set-default disabled-board-list |
disabled-board-list 変数の設定については、『特記事項: Sun Enterprise 6x00、5x00、4x00、3x00 システム』の「固有の NVRAM 変数」の節を参照してください。このマニュアルは、このリリースのマニュアルセットに含まれています。
OpenBoot PROM コマンドの disabled-memory-list 変数の設定については、このリリースで公開されています。Solaris Sun ハードウェアマニュアルの『特記事項: Sun Enterprise 6x00、5x00、4x00、3x00 システム』の「固有の NVRAM 変数」を参照してください。
切り離し危険ドライバの読み込みを解除するには、modinfo コマンドを使用してドライバのモジュール ID を確認し、modunload コマンドでそのモジュール ID を指定します。
DR 機能を利用してボードに接続処理を実行しているときに次のようなメッセージが表示された場合は、ボードのセルフテストでエラーが発生しています。すぐにシステムからボードを取り外してください。
cfgadm: Hardware specific failure: connect failed: firmware operation error |
ボードを取り外すことで、システムのリブート時に再構成エラーが起こるのを回避できます。
セルフテストに失敗した状態では、それ以上操作を実行できません。したがって、失敗した操作をすぐに実行し直す場合は、ボードをいったん取り外して操作可能な状態に戻してから、取り付け直してください。
次の情報は随時変更されることがあります。
プロセスによってネットワークデバイスが開いた状態に保持されていると、そのデバイスが関連する DR 操作はすべて失敗します。参照カウントを保持しているデーモンやプロセスによって、DR 操作が中止されます。
回避方法: スーパーユーザーとして次の手順を実行します。
/rplboot ディレクトリを削除するか、またはディレクトリ名を変更します。
NFS サービスを停止します。
# sh /etc/init.d/nfs.server stop |
ブートサーバーサービスを停止します。
# sh /etc/init.d/boot.server stop |
DR による切り離し操作を実行します。
NFS サービスを再起動します。
# sh /etc/init.d/nfs.server start |
ブートサーバーサービスを再起動します。
# sh /etc/init.d/boot.server start |
Sun Enterprise 5x500 サーバーに対して不正なリセット操作が実行されると、メモリーが不適切にインタリーブされた状態になり、以降の DR 操作は失敗します。この問題は、メモリーインタリーブの設定が min になっているシステムでのみ発生します。
回避方法: 次のいずれかを選択してください。
すでに問題が発生している場合は、OK プロンプトから手動でシステムをリセットします。
問題が発生する前にそれを回避するには、NVRAM の memory-interleave 変数を max に設定します。
2 番目の方法を使用すると、システムがブートされるたびにメモリーがインタリーブされるようになります。ただし、インタリーブ方式のメモリーを搭載したメモリーボードを動的に構成解除することはできないので、必ずしも推奨される方法ではありません。「インタリーブ方式のメモリーを搭載した CPU/メモリーボードを構成解除できない (4210234)」を参照してください。
メモリーモジュール付き CPU ボードまたはメモリーボードに対して構成解除および切り離し操作を実行するには、まずメモリーを構成解除する必要があります。ただし現在のところ、ボード上のメモリーがほかのボード上のメモリーとインタリーブされている場合は、メモリーを動的に構成解除することはできません。
システムでインタリーブ方式のメモリーを使用しているかどうかは、prtdiag コマンドまたは cfgadm コマンドで確認できます。
回避方法: システムを停止してからボードの追加、交換を行い、その後リブートします。CPU/メモリーボードで DR 機能を利用できるようにするには、NVRAM の memory-interleave 変数を min に設定します。インタリーブ方式のメモリーについては、「重大なリセット操作を実行後、メモリーが不適切にインタリーブされる (4156075)」も参照してください。
メモリーモジュール付き CPU ボードまたはメモリーボードに対して構成解除および切り離し操作を実行するには、まずメモリーを構成解除する必要があります。ただし現在のところ、再配置不可能なメモリー (固定メモリー) もあります。
ボードに固定メモリーが搭載されている場合は、cfgadm コマンドによる状態表示では「permanent」と表示されます。
# cfgadm -s cols=ap_id:type:info Ap_Id Type Information ac0:bank0 memory slot3 64Mb base 0x0 permanent ac0:bank1 memory slot3 empty ac1:bank0 memory slot5 empty ac1:bank1 memory slot5 64Mb base 0x40000000 |
上の例では、スロット 3 のボードに固定メモリーが搭載されているので、このボードを取り外すことはできません。
回避方法: システムを停止してからボードの追加、交換を行い、その後リブートします。
あるボードに対して cfgadm コマンドを実行しているときに、同時に別のボードに対して cfgadm コマンドによる切り離し操作を実行しようとすると失敗します。次のエラーメッセージが表示されます。
cfgadm: Hardware specific failure: disconnect failed: nexus error during detach:address |
回避方法: 一度に実行する cfgadm 操作は 1 つだけにします。1 枚目のボードに対して cfgadm 操作を実行しているときは、その操作が終了してから 2 枚目のボードに対する切り離し操作を実行してください。