Solaris 10 11/06 ご使用にあたって

Sun Enterprise ミッドレンジシステムでの動的再構成

ここでは、Solaris 10 ソフトウェアを実行する次のようなミッドレンジサーバーでの動的再構成 (DR) 機能について、最新情報を提供します。

Sun Enterprise サーバーの DR の詳細については、『Sun Enterprise 6x00、5x00、4x00、3x00 システム Dynamic Reconfiguration ユーザーマニュアル』を参照してください。Solaris 10 リリースは、上記のリストに示したシステムのすべての CPU/メモリーボードとほとんどの入出力ボードをサポートしています。

サポートするハードウェア

DR を実行する前に、システムが動的再構成をサポートしていることを確認してください。システムの設計が古い場合は、コンソールまたはコンソールログに次のようなメッセージが表示されます。このようなシステムは動的再構成をサポートしていません。


Hot Plug not supported in this system

次の入出力ボードは現在サポートされていません。

ソフトウェアに関する注意事項

ここでは、DR に関する一般的なソフトウェア情報について説明します。

動的再構成を有効にする

動的再構成を有効にするには、/etc/system ファイルで 2 つの変数を設定します。また、CPU/メモリーボードの取り外しを有効にするために、もう 1 つの変数を設定する必要があります。次の手順を実行します。

  1. スーパーユーザーとしてログインします。

  2. /etc/system ファイルを編集して、次の行を追加します。


    set pln:pln_enable_detach_suspend=1
    set soc:soc_enable_detach_suspend=1
    
  3. CPU/メモリーボードの取り外しを有効にするには、次の行をファイルに追加します。


    set kernel_cage_enable=1
    

    この変数の設定により、メモリーの構成解除が可能になります。

  4. 変更を適用するために、システムをリブートします。

休止テスト

次のコマンドを使用して、休止テストを開始できます。


 # cfgadm -x quiesce-test sysctr10:slot number

システムの規模が大きい場合は、休止テストの実行に 1 分近くかかる場合もあります。この間、cfgadm が互換性のないドライバを検出しなかった場合はメッセージはまったく表示されませんが、これは正常な動作です。

使用不可ボードリスト

使用不可ボードリストに登録されているボードに接続処理を実行しようとすると、次のエラーメッセージが出力されることがあります。


# cfgadm -c connect sysctrl0:slotnumber







cfgadm: Hardware specific failure: connect failed:
board is disabled: must override with [-f][-o enable-at-boot]

リストへの登録を無効にして使用可能な状態にするには、2 つの方法があります。

使用不可ボードリストからすべてのボードを削除するには、コマンドを入力するプロンプトに応じて、次のいずれかの手順を実行します。

disabled-board-list 変数の設定については、『特記事項: Sun Enterprise 6x00、5x00、4x00、3x00 システム』の「固有の NVRAM 変数」の節を参照してください。このマニュアルは、このリリースのマニュアルセットに含まれています。

使用不可メモリーリスト

OpenBoot PROM コマンドの disabled-memory-list 変数の設定については、このリリースで公開されています。Solaris Sun ハードウェアマニュアルの『特記事項: Sun Enterprise 6x00、5x00、4x00、3x00 システム』の「固有の NVRAM 変数」を参照してください。

切り離し危険ドライバの読み込み解除

切り離し危険ドライバの読み込みを解除するには、modinfo コマンドを使用してドライバのモジュール ID を確認し、modunload コマンドでそのモジュール ID を指定します。

接続処理中のセルフテストの失敗

DR 機能を利用してボードに接続処理を実行しているときに次のようなメッセージが表示された場合は、ボードのセルフテストでエラーが発生しています。すぐにシステムからボードを取り外してください。


cfgadm: Hardware specific failure: connect failed: firmware operation error

ボードを取り外すことで、システムのリブート時に再構成エラーが起こるのを回避できます。

セルフテストに失敗した状態では、それ以上操作を実行できません。したがって、失敗した操作をすぐに実行し直す場合は、ボードをいったん取り外して操作可能な状態に戻してから、取り付け直してください。

既知の障害

次の情報は随時変更されることがあります。

プログラムでネットワークデバイスが開いた状態に保持されていると、デバイスの取り外しが失敗する (5054195)

プロセスによってネットワークデバイスが開いた状態に保持されていると、そのデバイスが関連する DR 操作はすべて失敗します。参照カウントを保持しているデーモンやプロセスによって、DR 操作が中止されます。

回避方法: スーパーユーザーとして次の手順を実行します。

  1. /rplboot ディレクトリを削除するか、またはディレクトリ名を変更します。

  2. NFS サービスを停止します。


    # sh /etc/init.d/nfs.server stop
    
  3. ブートサーバーサービスを停止します。


    # sh /etc/init.d/boot.server stop
    
  4. DR による切り離し操作を実行します。

  5. NFS サービスを再起動します。


    # sh /etc/init.d/nfs.server start
    
  6. ブートサーバーサービスを再起動します。


    # sh /etc/init.d/boot.server start
    

重大なリセット操作を実行後、メモリーが不適切にインタリーブされる (4156075)

Sun Enterprise 5x500 サーバーに対して不正なリセット操作が実行されると、メモリーが不適切にインタリーブされた状態になり、以降の DR 操作は失敗します。この問題は、メモリーインタリーブの設定が min になっているシステムでのみ発生します。

回避方法: 次のいずれかを選択してください。

インタリーブ方式のメモリーを搭載した CPU/メモリーボードを構成解除できない (4210234)

メモリーモジュール付き CPU ボードまたはメモリーボードに対して構成解除および切り離し操作を実行するには、まずメモリーを構成解除する必要があります。ただし現在のところ、ボード上のメモリーがほかのボード上のメモリーとインタリーブされている場合は、メモリーを動的に構成解除することはできません。

システムでインタリーブ方式のメモリーを使用しているかどうかは、prtdiag コマンドまたは cfgadm コマンドで確認できます。

回避方法: システムを停止してからボードの追加、交換を行い、その後リブートします。CPU/メモリーボードで DR 機能を利用できるようにするには、NVRAM の memory-interleave 変数を min に設定します。インタリーブ方式のメモリーについては、「重大なリセット操作を実行後、メモリーが不適切にインタリーブされる (4156075)」も参照してください。

固定メモリーを搭載した CPU/メモリーボードを構成解除できない (4210280)

メモリーモジュール付き CPU ボードまたはメモリーボードに対して構成解除および切り離し操作を実行するには、まずメモリーを構成解除する必要があります。ただし現在のところ、再配置不可能なメモリー (固定メモリー) もあります。

ボードに固定メモリーが搭載されている場合は、cfgadm コマンドによる状態表示では「permanent」と表示されます。


# cfgadm -s cols=ap_id:type:info
Ap_Id Type Information
ac0:bank0 memory slot3 64Mb base 0x0 permanent
ac0:bank1 memory slot3 empty
ac1:bank0 memory slot5 empty
ac1:bank1 memory slot5 64Mb base 0x40000000

上の例では、スロット 3 のボードに固定メモリーが搭載されているので、このボードを取り外すことはできません。

回避方法: システムを停止してからボードの追加、交換を行い、その後リブートします。

cfgadm コマンドを実行中、同時に別のボードに対して cfgadm による切り離し操作を実行できない (4220105)

あるボードに対して cfgadm コマンドを実行しているときに、同時に別のボードに対して cfgadm コマンドによる切り離し操作を実行しようとすると失敗します。次のエラーメッセージが表示されます。


cfgadm: Hardware specific failure: 
disconnect failed: nexus error during detach:address

回避方法: 一度に実行する cfgadm 操作は 1 つだけにします。1 枚目のボードに対して cfgadm 操作を実行しているときは、その操作が終了してから 2 枚目のボードに対する切り離し操作を実行してください。