Oracle® VM Server for SPARC 3.2 リリースノート

印刷ビューの終了

更新: 2015 年 5 月
 
 

Oracle VM Server for SPARC ソフトウェアに影響するバグ

このセクションでは、このバージョンのソフトウェアを使用するときに発生する可能性があるバグの概要について説明します。最新のバグを最初に説明します。回避方法および回復手順がある場合は、指定しています。


注 - このセクションで説明されているバグには、Oracle VM Server for SPARC 3.1 リリース以降に修正されたものもあります。これらのバグの記事は、引き続き Oracle VM Server for SPARC 3.1 リリースを実行しているユーザーのために残されています。

Oracle VM Server for SPARC 3.2 ソフトウェアに影響するバグ

ldm remove-io 操作中に rcm_daemon によってメッセージが発行されることがある

バグ ID 20619894: system/management/hwmgmtd パッケージがインストールされていない場合は、動的バスの削除操作により rcm_daemon でコンソール上に次のメッセージが出力されます。

rcm_daemon[839]: rcm script ORCL,pcie_rc_rcm.pl: svcs: Pattern 'sp/management'
doesn't match any instances

回避方法: このメッセージは無視しても安全です。

電源管理ポリシーが elastic に設定されている場合は復旧モードがハングすることがある

バグ ID 20570207: 電源管理ポリシーが elastic に設定されている場合は、リソースの障害または欠落が検出されたあと、Logical Domains Manager がドメインを復旧中に primary ドメインがハングすることがあります。

回復方法: ポリシーを disabled に変更してから、システムの電源を投入して復旧モードを再開してください。

遅延再構成中に Fujitsu M10 サーバー ソケットコマンドを使用した場合の予期しない動作

バグ ID 20432421: 遅延構成中に grow-socket または shrink-socket コマンドを使用して仮想 CPU またはコアを変更すると、予期しない動作が発生することがあります。primary ドメインに属するメモリーは再割り当てされるため、指定されたソケット内のメモリーのみがドメインにバインドされます。

回避方法: shrink-socket および grow-socket コマンドを使用して仮想 CPU またはコアを変更するのは、遅延再構成中ではないときだけにしてください。

factory-default に戻したあとで、システムが以前のアクティブな構成でブートしたデバイスとは異なるデバイスからブートすると、復旧が失敗する

バグ ID 20425271: factory-default に戻したあとで復旧をトリガーしているときに、システムが以前のアクティブな構成でブートしたデバイスとは異なるデバイスからブートすると、復旧モードが失敗します。この障害は、アクティブな構成が factory-default ブートデバイス以外のブートデバイスを使用する場合に発生することがあります。

回避方法: 新しい構成を SP に保存するときに、次の手順を実行します。

  1. primary ドメインのブートデバイスへのフル PCI パスを特定します。

    手順 4 の ldm set-var コマンドでこのパスを使用します。

  2. 現在設定されている boot-device プロパティーを primary ドメインから削除します。

    この手順は、boot-device プロパティーに値が設定されている場合のみ実行する必要があります。プロパティーに値が設定されていない場合は、boot-device プロパティーを削除しようとすると boot-device not found というメッセージが表示されます。

    primary# ldm rm-var boot-device primary
  3. 現在の構成を SP に保存します。

    primary# ldm add-spconfig config-name
  4. primary ドメインに boot-device プロパティーを明示的に設定します。

    primary# ldm set-var boot-device=value primary

    説明されているとおりに構成を SP に保存したあとで boot-device プロパティーを設定した場合は、復旧モードがトリガーされたときに、指定したブートデバイスがブートされます。

回復方法: 説明されているとおりに復旧モードがすでに失敗している場合は、次の手順を実行します。

  1. ブートデバイスを、最後に実行する構成で使用されるデバイスに明示的に設定します。

    primary# ldm set-var boot-device=value primary
  2. primary ドメインをリブートします。

    primary# reboot

    リブートにより復旧を続行できます。

ldm list-rsrc-group によって PCIe バス情報が間違ったリソースグループの下に誤って表示される

バグ ID 20426593: リソースグループ名の数値の接尾辞に複数の数字が含まれている場合、ldm list-rsrc-group によって、I/O リソース情報が間違ったリソースグループの下に表示されることがあります。

次の例では、ldm list-rsrc-group コマンドによって、/SYS/CMIOU10 の PCIe バス情報が、誤って /SYS/CMIOU1 リソースグループの下に表示されています。

primary# ldm list-io
NAME                  TYPE   BUS      DOMAIN    STATUS
----                  ----   ---      ------    ------
..
/SYS/CMIOU10/PCIE2     PCIE   pci_50   primary   OCC
/SYS/CMIOU10/PCIE3     PCIE   pci_51   primary   OCC
/SYS/CMIOU10/PCIE1     PCIE   pci_53   primary   OCC
..
.
primary# ldm list-rsrc-group -l -o io /SYS/CMIOU1
NAME
/SYS/CMIOU1

IO
    DEVICE           PSEUDONYM        BOUND
    pci@305          pci_5            alt-root
    pci@306          pci_6            primary
    pci@308          pci_8            alt-root
    pci@309          pci_9            primary
    pci@332          pci_50           primary
    pci@333          pci_51           primary
    pci@335          pci_53           primary

PCIe バス pci_50pci_51、および pci_53 は、/SYS/CMIOU10 リソースグループではなく、誤って /SYS/CMIOU1 リソースグループの下に表示されています。

回避方法: I/O 名から PCIe バスの正しいリソースグループ名を取得するには、ldm list-io -l コマンドを実行します。たとえば、I/O 名が /SYS/CMIOU10/PCIE2 の PCIe バスは、/SYS/CMIOU1 ではなく /SYS/CMIOU10 に属しているはずです。

サービスドメインで仮想ディスクバックエンドを使用できない場合、復旧モードでゲストドメインが復旧されない

バグ ID 20321459: 仮想ディスクバックエンドが見つからず、検証できない場合、Logical Domains Manager はバックエンドに割り当てられているゲストドメインを復旧しません。これはマルチパスが構成されている場合も当てはまります。

回避方法: 次の手順を実行します。

  1. 一時的にデバイス検証を無効にします。

    primary# svccfg -s ldmd setprop ldmd/device_validation integer: 0
    primary# svcadm refresh ldmd
    primary# svcadm restart ldmd
  2. バックエンドが欠落しているゲストドメインを手動で復旧します。

    デバイス検証を無効にすると、バックエンドまたは関連する物理ネットワークデバイスが存在しない場合でも、Logical Domains Manager によりゲストドメインに仮想デバイスが追加されます。したがって、ドメイン構成を復旧したあとは、必ずデバイス検証を再度有効にしてください。

    primary# svccfg -s ldmd setprop ldmd/device_validation integer: -1
    primary# svcadm refresh ldmd
    primary# svcadm restart ldmd
ldm bind コマンドが Invalid response エラーを発行する

バグ ID 20307560: 任意の数の仮想 CPU と任意の量のメモリーを使用するゲストドメインを作成し、ldm bind コマンドを実行すると、このコマンドにより Invalid response エラーが発行されることがあります。このエラーは、ゲストドメインを作成して ldm bind コマンドを実行する前に、primary ドメインにすべてのリソースがある場合に発生することがあります。

回避方法: primary ドメインから一部のメモリーを削除してから、ldm bind コマンドを実行してください。

遅延再構成中に物理機能または仮想機能が INV 状態から抜け出せなくなり、Logical Domains Manager が再起動される

バグ ID 20257979: 物理機能から仮想機能を作成する方法の 1 つは、物理機能を所有するルートドメインを遅延再構成内に配置することです。遅延再構成中に、ldm create-vf コマンドを使用して 1 つまたは複数の仮想機能を作成できます。

通常は、ldm list-io コマンドで、物理機能とその子の仮想機能がクリーンな状態であることが示されます。ただし、ルートドメインがリブートされる前に ldmd サービスが再起動された場合、または遅延再構成が取り消された場合は、物理機能とその仮想機能に INV 状態というマークが付けられます。

同じ問題が、遅延再構成中に仮想機能が破棄された場合に発生します。仮想機能を破棄し、Logical Domains Manager を再起動してから、ldm list-io を実行すると、出力にそのルートドメインの物理機能が表示されません。

回避方法: 次のいずれかを実行してください。

  • 遅延再構成を取り消します。

    ldm list-io コマンドを次に実行したときは、物理機能とその既存の仮想機能のすべてが有効な状態になります。

  • 遅延再構成中だったルートドメインをリブートします。

    ルートドメインが遅延再構成中に実行した変更は、ゲストドメインの OS 内に存在することに留意してください。

パワーキャップが制限より低いときに CPU が再開されない

バグ ID 20187197: パワーキャッピングが有効になっている場合は、最低の電力状態を設定できないことがあります。電力状態は低下しても、最低の状態ではありませんでした。この問題が発生した場合は、最高の電力状態の原因となる高い電力の制限を設定したあとに、最高の電力状態が再開された可能性があります。

この状況は、システムの最小の電力制限に近い新しいパワーキャップ制限を設定した場合、または実際の電力 (パワーキャップされていないとき) と新しい制限の差異によって最低の電力状態が使用される場合に発生します。

回避方法: 次のいずれかの手順を実行します。

  • パワーキャップを無効にする

  • システムの最小の電力制限に対して大きくない、または近いパワーキャップ制限を設定する

I/O ドメイン上の ixgbevf ノードが、ipadm コマンドでは無効になっていると報告され、ifconfig コマンドでは存在しないと報告される

バグ ID 20004281: primary ドメインの電源を再投入したときに、I/O ドメイン上の ixgbevf ノードが、ipadm コマンドでは無効になっていると報告され、ifconfig コマンドでは存在しないと報告されることがあります。

回避方法: IP インタフェースを再度有効にします。

# svcadm restart network/physical:default
I/O ドメインへの直接 I/O を使用して割り当てられている場合に HGXE インタフェースを使用できない

バグ ID 19943809: カードが直接 I/O 機能を使用して割り当てられている場合、hxge ドライバはI/O ドメイン内のインタフェースを使用できません。

システムログファイルに次の警告が発行されます。

WARNING: hxge0 : <== hxge_setup_mutexes: failed 0x1

回避方法: /etc/system に次の行を追加し、リブートします。

set px:px_force_intx_support=1
ldm add-spconfig 操作が完了していない場合にゲストドメイン eeprom のアップデートが失われる

バグ ID 19932842: 次のコマンドのいずれかが完了する前に eeprom または OBP コマンドを使用した場合、ゲストドメインから OBP 変数を設定しようとすると失敗することがあります。

  • ldm add-spconfig

  • ldm remove-spconfig

  • ldm set-spconfig

  • ldm bind

この問題は、これらのコマンドの完了に 15 秒を超える時間がかかる場合に発生する可能性があります。

# /usr/sbin/eeprom boot-file\=-k
promif_ldom_setprop: promif_ldom_setprop: ds response timeout
eeprom: OPROMSETOPT: Invalid argument
boot-file: invalid property

回復方法: ldm 操作の完了後に eeprom または OBP コマンドを再試行してください。

回避方法: 影響を受けるゲストドメインで eeprom または OBP コマンドを再試行してください。この問題は primary ドメインで ldm set-var コマンドを使用することで回避できる場合があります。

仮想ネットワークデバイスが 1000 を超えるゲストドメインをリブートするとパニックを起こす

バグ ID 19449221: 1 つのドメインは 999 未満の仮想ネットワークデバイス (vnet) で構成できます。

回避方法: ドメイン上の vnet の数を 999 に制限してください。

Oracle VM Server for SPARC が解放された MAC アドレスを追跡しなくなった

バグ ID 19078763: Oracle VM Server for SPARC は解放された MAC アドレスを追跡しなくなりました。MAC アドレスは、アドレスをランダムに選択してから、アドレスがローカルネットワーク上の論理ドメインで使用されていないことを確認することで割り当てられるようになりました。

Sun Storage 16 Gb Fibre Channel Universal HBA ファームウェアが帯域幅制御をサポートしていない

バグ ID 18083904: Sun Storage 16 Gb Fibre Channel Universal HBA、Emulex 用のファームウェアが帯域幅制御の設定をサポートしていません。この HBA ファームウェアは、bw-percent プロパティーに指定したすべての値を無視します。

回避方法: ありません。

ルートドメインのファイバチャネル仮想機能のデバイスパスが正しくない

バグ ID 18001028: ルートドメインで、ファイバチャネル仮想機能の Oracle Solaris デバイスパスが正しくありません。

たとえば、パス名が pci@380/pci@1/pci@0/pci@6/SUNW,emlxs@0,2 であるべきところを、間違って pci@380/pci@1/pci@0/pci@6/fibre-channel@0,2 になっています。

ldm list-io -l 出力には、ファイバチャネル仮想機能の正しいデバイスパスが表示されます。

回避方法: ありません。

FMA が障害のあるメモリーを検出する際に問題が発生することがある

バグ ID 17576087: 障害のあるメモリーの交換後に、保存された構成でシステムの電源を再投入しても、メモリーが復元されない可能性があります。

回避方法: 障害のあるメモリーを交換したら、factory-default 構成でシステムの電源を再投入します。次に、使用する構成でシステムの電源を再投入します。

仮想ネットワークデバイスまたは SR-IOV 仮想機能の上部にあるゲストドメインで DLMP が機能しない

ゲストドメインの SR-IOV NIC 仮想機能または仮想ネットワークデバイスで、DLMP アグリゲーションを構成できません。

EFI GPT ディスクラベルを使用して単一スライスの仮想ディスクに Oracle Solaris 11.1 OS をインストールできない

バグ ID 17422973: 少なくともバージョン 8.4.0 のシステムファームウェアが実行されている SPARC T4 サーバー、少なくともバージョン 9.1.0 のシステムファームウェアが実行されている SPARC T5、SPARC M5、または SPARC M6 サーバー、および少なくとも XCP バージョン 2230 が実行されている Fujitsu M10 サーバー で、単一スライスのディスクへの Oracle Solaris 11.1 OS のインストールが次のエラーを表示して失敗することがあります。

cannot label 'c1d0': try using fdisk(1M) and then provide a specific slice
Unable to build pool from specified devices: invalid vdev configuration

回避方法: ディスクに SMI ラベルを付け直します。

仮想機能または PCIe デバイスの削除後に自動保存構成が更新されない

バグ ID 17051532: PCIe デバイスまたは仮想機能がゲストドメインから削除されたときに、自動保存構成が更新されません。この問題により、自動保存復旧を実行したあと (つまり autorecovery_policy=3 のとき) に、そのデバイスまたは仮想機能がゲストドメインに再表示される可能性があります。また、自動保存を更新させる別の ldm コマンドを実行しない場合は、この問題によって ldm add-spconfig -r コマンドが失敗して「Autosave configuration config-name is invalid」というメッセージが表示されることもあります。

回避方法: 次のいずれかを実行してください。

  • PCIe デバイスまたは仮想機能を削除したあとで、新しい構成を保存します。

    primary# ldm add-config new-config-name
  • PCIe デバイスまたは仮想機能の削除後に、保存された構成を削除してから再作成することで、構成をリフレッシュします。

    primary# ldm rm-config config-name
    primary# ldm add-config config-name

    このバグによって ldm add-config -r config-name コマンドが正しく機能できないことに注意してください。

  • 自動保存の更新を発生させる別の ldm コマンド (ldm set-vcpuldm bindldm unbind など) を実行します。

lgrp_lineage_add(mutex_enter: bad mutex, lp=10351178) 時にゲストドメインがパニックになる

バグ ID 17020950: ファームウェアバージョン 8.3 を使用してバインドされたアクティブなドメインを SPARC T4 プラットフォームから SPARC T5、SPARC M5、または SPARC M6 プラットフォームに移行したあとで、メモリー動的再構成を実行すると、ゲストドメインでパニックが発生する可能性があります。

回避方法: 移行を実行する前に、SPARC T4 システムをバージョン 8.4 のシステムファームウェアで更新します。次に、そのドメインを再バインドします。

primary ドメインのリブート後にゲストドメインが移行状態になる

バグ ID 17020481: primary ドメインのリブート後にゲストドメインが移行状態 (t) になります。この問題は、システム上に多数の仮想機能が構成されている場合に発生します。

回避方法: この問題を回避するには、OBP のディスクブートコマンドを数回再試行して、ネットワークからブートしないようにします。

    各ドメインで次の手順を実行します。

  1. ドメインのコンソールにアクセスします。

    primary# telnet localhost 5000
  2. boot-device プロパティーを設定します。

    ok> setenv boot-device disk disk disk disk disk disk disk disk disk disk net

    boot-device プロパティーの値として指定する disk エントリの数は、システム上に構成されている仮想機能の数によって異なります。小規模なシステムでは、プロパティー値に含める disk インスタンスを少なくできる可能性があります。

  3. printenv を使用して boot-device プロパティーが正しく設定されていることを確認します。

    ok> printenv
  4. primary ドメインのコンソールに戻ります。

  5. システム上のドメインごとに、手順 1-4 を繰り返します。

  6. primary ドメインをリブートします。

    primary# shutdown -i6 -g0 -y
復旧モードでは primary 以外のルートドメインでの PCIe スロットの削除をサポートするべきである

バグ ID 16713362: 復旧操作中に primary 以外のルートドメインから PCIe スロットを現時点で削除することはできません。PCIe スロットは、primary 以外のルートドメインに割り当てられたままです。

回避方法: PCIe スロットを primary 以外のルートドメインから手動で削除し、復旧操作が完了したあとで適切な I/O ドメインに割り当てる必要があります。

PCIe スロットを primary 以外のルートドメインから削除する方法については、Oracle VM Server for SPARC 3.2 管理ガイド のprimary 以外のルートドメインの概要を参照してください。

primary 以外のルートドメインに所有されている PCIe スロットを使用する I/O ドメインの修復は、I/O ドメインの構成によって異なります。

  • I/O ドメインが PCIe スロットのみを使用し、使用できる PCIe スロットが 1 つもない場合、I/O ドメインは修復されず、バインド解除された状態のまま残され、PCIe スロットは退避済みとしてマークされます。

  • I/O ドメインが SR-IOV 仮想機能と PCIe スロットを使用する場合、そのドメインは修復され、使用できない PCIe スロットは退避済みとしてマークされます。

PCIe スロットを primary 以外のルートドメインから手動で削除したあとに、それらの PCIe スロットを I/O ドメインに追加するには、ldm add-io コマンドを使用します。

ldm list が物理 I/O デバイスの evacuated プロパティーを表示しない

バグ ID 16617981: ldm list の出力に、物理 I/O デバイスの evacuated プロパティーが表示されません。

回避方法: いずれかの ldm list コマンドで –p オプションを使用して、物理 I/O デバイスの evacuated プロパティーを表示します。

send_mondo_set: timeout 負荷がかかった後に、ゲストドメインで ldm stop コマンドを使用すると、パニックが発生する

バグ ID 16486383: この問題は、PCI カードが物理的に存在する /SYS/DCU からコアが割り当てられていないゲストドメインに、PCI デバイスまたはバスを直接割り当てた場合に発生することがあります。ハイパーバイザは、ゲストドメインの代わりに PCI デバイスをリセットするため、各ゲストドメインのリブート時に、PCI デバイスに接続されている DCU 上にコアがあるドメインがパニックを起こす可能性があります。非 DCU ローカルゲストに割り当てられている PCI デバイスが多いほど、パニックの可能性が大きくなります。

回避方法: 次のいずれかを実行してください。

  • PCI デバイスをゲストドメインに割り当てる場合、カードがコアと同じ DCU に物理的に存在することを確認してください。

  • 柔軟な物理的カードの配置のため、手動でコアを割り当てます。

    たとえば、IOU0 上の PCI デバイス (pci_0 から pci_15) の場合、0 から 127 の間のコアを選択し、それをドメインに割り当てます。

    # ldm add-core cid=16 domain-name

    システムコアを表示するには、次のコマンドを使用します。

    # ldm ls-devices -a core

    IOU1 上の PCI デバイス (pci_16 から pci_31) の場合は、128 から 255 の間のコアを選択します。IOU2 上の PCI デバイス (pci_32 から pci_47) の場合は、256 から 383 の間のコアを選択します。IOU3 上の PCI デバイス (pci_48 から pci_63) の場合は、384 から 511 の間のコアを選択します。

PCIe デバイス下のサブデバイスが割り当てられていない名前に戻る

バグ ID 16299053: PCIe デバイスを無効にすると、予期しない動作が発生することがあります。無効にした PCIe デバイスがまだドメインによって所有されている間に、その PCIe デバイス下にあるサブデバイスが、割り当てられていない名前に戻ります。

回避方法: ILOM 上の PCIe スロットを無効にしようとする場合、PCIe スロットが、直接 I/O (DIO) 機能を使用して、ドメインに割り当てられていないことを確認します。つまり、まず、ILOM 上のスロットを無効にする前に、PCIe スロットが対応するルートドメインに割り当てられていることを確認します。

PCIe スロットが DIO によってドメインに割り当てられている間に、ILOM 上の PCIe スロットを無効にする場合は、正しい動作のために、そのドメインを停止してから、ルートドメインにデバイスを再割り当てします。

WARNING: ddi_intr_alloc: cannot fit into interrupt pool」が、I/O デバイスドライバの接続中に、供給された割り込み数が使い果たされたことを示している

バグ ID 16284767: Oracle Solaris コンソール上のこの警告は、I/O デバイスドライバの接続中に、供給された割り込み数が使い果たされたことを示しています。

WARNING: ddi_intr_alloc: cannot fit into interrupt pool

ハードウェアが提供する割り込み数には限りがあるため、Oracle Solaris では各デバイスで使用できる数を制限しています。デフォルトの制限は一般的なシステム構成のニーズに合うように考案されていますが、特定のシステム構成ではこの制限に調整が必要になることがあります。

特に、システムが複数の論理ドメインにパーティション化されている場合や、任意のゲストドメインに割り当てられる I/O デバイスの数が多すぎる場合は、この制限に調整が必要になることがあります。Oracle VM Server for SPARC では、全割り込み数を小さいセットに分けて、ゲストドメインに提供します。1 つのゲストドメインに割り当てられる I/O デバイスの数があまりにも多い場合は、その供給量が少なすぎて、各デバイスにデフォルトの割り込み制限を提供できないことがあります。そのため、すべてのドライバを完全に接続する前にその供給量が使い果たされてしまいます。

ドライバの中には、その割り込み数を Oracle Solaris で自動的に調整できるようにするオプションのコールバックルーチンを提供するものもあります。このようなドライバにはデフォルトの制限が適用されません。

回避方法: ::irmpools および ::irmreqs MDB マクロを使用して、使用される割り込みを調べます。::irmpools マクロは、プールに分けられた割り込みの総供給量を表示します。::irmreqs マクロは、各プールにマップされているデバイスを表示します。デバイスごとに、::irmreqs は、オプションのコールバックルーチンによってデフォルトの制限が強制されるかどうか、各ドライバがリクエストした割り込みの数、および各ドライバに提供される割り込みの数を表示します。

これらのマクロでは、接続に失敗したドライバに関する情報は表示されません。ただし、表示される情報は、デフォルトの制限をどの程度まで調整できるかを予測するのに役立ちます。コールバックルーチンを提供せずに複数の割り込みを使用するデバイスは、デフォルトの制限を調整して、使用する割り込み数を少なくせざるをえない場合があります。そのようなデバイスで使用される量を下回ってデフォルトの制限を減らすと、ほかのデバイスで使用できるように割り込みが解放されます。

デフォルトの制限を調整するには、/etc/system ファイル内の ddi_msix_alloc_limit プロパティーを 1-8 の値に設定します。次に、その変更が反映されるようにシステムをリブートします。

パフォーマンスを最大にするには、開始時に大きな値を割り当て、システムが警告なしで正常にブートするまで、それらの値を少しずつ減らします。::irmpools および ::irmreqs マクロを使用して、接続されているすべてのドライバに対する調整の影響を評価します。

たとえば、ゲストドメインで Oracle Solaris OS のブート中に次の警告が出されるとします。

WARNING: emlxs3: interrupt pool too full.
WARNING: ddi_intr_alloc: cannot fit into interrupt pool

::irmpools および ::irmreqs マクロは次の情報を表示します。

# echo "::irmpools" | mdb -k
ADDR             OWNER   TYPE   SIZE  REQUESTED  RESERVED
00000400016be970 px#0    MSI/X  36    36         36

# echo "00000400016be970::irmreqs" | mdb -k
ADDR             OWNER   TYPE   CALLBACK NINTRS NREQ NAVAIL
00001000143acaa8 emlxs#0 MSI-X  No       32     8    8
00001000170199f8 emlxs#1 MSI-X  No       32     8    8
000010001400ca28 emlxs#2 MSI-X  No       32     8    8
0000100016151328 igb#3   MSI-X  No       10     3    3
0000100019549d30 igb#2   MSI-X  No       10     3    3
0000040000e0f878 igb#1   MSI-X  No       10     3    3
000010001955a5c8 igb#0   MSI-X  No       10     3    3

この例に示されるデフォルトの制限は 1 デバイスにつき 8 回の割り込みですが、これはシステムへの最後の emlxs3 デバイスの接続を受け入れるのに十分な割り込み数ではありません。emlxs のすべてのインスタンスが同じように動作すると考えれば、emlxs3 はおそらく 8 回の割り込みをリクエストしています。

36 回の割り込みの総プールサイズから、すべての igb デバイスで使用された 12 回の割り込みを引くことにより、24 回の割り込みを emlxs デバイスに使用できます。24 回の割り込みを 4 で割ると、1 デバイスにつき 6 回の割り込みによって、すべての emlxs デバイスが同じパフォーマンスで接続できることになります。そのため、次の調整が /etc/system ファイルに追加されます。

set ddi_msix_alloc_limit = 6

システムが警告なしで正常にブートすると、::irmpools および ::irmreqs マクロは次の更新された情報を表示します。

# echo "::irmpools" | mdb -k
ADDR             OWNER   TYPE   SIZE  REQUESTED  RESERVED
00000400018ca868 px#0    MSI/X  36    36         36
 
# echo "00000400018ca868::irmreqs" | mdb -k
ADDR             OWNER   TYPE   CALLBACK NINTRS NREQ NAVAIL
0000100016143218 emlxs#0 MSI-X  No       32     8    6
0000100014269920 emlxs#1 MSI-X  No       32     8    6
000010001540be30 emlxs#2 MSI-X  No       32     8    6
00001000140cbe10 emlxs#3 MSI-X  No       32     8    6
00001000141210c0 igb#3   MSI-X  No       10     3    3
0000100017549d38 igb#2   MSI-X  No       10     3    3
0000040001ceac40 igb#1   MSI-X  No       10     3    3
000010001acc3480 igb#0   MSI-X  No       10     3    3
SPARC M5-32 および SPARC M6-32: 複数の直接 I/O パス経由でアクセスできるディスクの問題

バグ ID 16232834: ldm add-vcpu コマンドを使用して、CPU をドメインに割り当てると、Oracle Solaris OS が次のメッセージを表示してパニックを起こすことがあります。

panic[cpu16]/thread=c4012102c860: mpo_cpu_add: Cannot read MD

    このパニックは、次の条件が存在する場合に発生します。

  • ホストに追加の DCU が割り当てられている

  • ホストが、ホストに割り当てられているすべてのハードウェアを含まない、以前に保存された SP 構成を使用して起動されている

ldm add-vcpu 操作のターゲットドメインはパニックを起こしたドメインです。ドメインは、リブート時に、追加の CPU で回復します。

回避方法: ホストに割り当てられているハードウェアリソースより少ないリソースで生成された構成を使用しないでください。

問題を避けるには、問題の説明に示しているように、CPU を追加しないでください。または、次の手順を実行します。

  1. DCU の追加後に、新しい SP 構成を生成します。

    たとえば、次のコマンドは、new-config-more-dcus という構成を作成します。

    primary# ldm add-config new-config-more-dcus
  2. ドメインをシャットダウンします。

  3. ホストを停止します。

    -> stop /HOST
  4. ホストを起動します。

    -> start /HOST
ixgbevf primary ドメインのリブート時に、SR-IOV ドメイン内のデバイスが無効になることがある

バグ ID 16224353: primary ドメインのリブート後、primary ドメイン内の ixgbevf インスタンスが動作しないことがあります。

回避方法: ありません。

Oracle Solaris 10 1/13 primary ドメインのリブートで、IP アドレスが仮想機能インタフェースに自動的に組み込まれず、割り当てられないことがある

バグ ID 16219069: Oracle Solaris 10 1/13 OS を実行する primary ドメインで、/etc/hostname.vf-interface ファイルに基づいて、仮想機能インタフェースに IP アドレスが自動的に組み込まれず、割り当てられないことがあります。

この問題は、primary ドメインで Oracle Solaris 10 1/13 OS を 実行する SPARC T3、SPARC T4、または SPARC T5 システムをブートまたはリブートした場合に発生します。この問題は、オンボード物理機能とアドイン物理機能の両方で作成された仮想機能に影響します。この問題は、Logical Domains ゲストドメインイメージをブートした場合には発生しません。

Oracle Solaris 10 のみ: mutex_enter: bad mutex primary ドメインのリブートまたはシャットダウン時のパニック

 

バグ ID 16080855: primary ドメインのリブートまたはシャットダウン時に、primary ドメインで、次のようなパニックメッセージを表示して、カーネルのパニックが発生することがあります。

panic[cpu2]/thread=c40043b818a0: mutex_enter: bad mutex, lp=c4005fa01c88
owner=c4005f70aa80 thread=c40043b818a0

000002a1075c3630 ldc:ldc_mem_rdwr_cookie+20 (c4005fa01c80,
c4004e2c2000,2a1075c37c8, 6c80000, 1, 0)
%l0-3: 00000000001356a4 0000000000136800 0000000000000380
00000000000002ff
%l4-7: 00000000001ad3f8 0000000000000004 00000000ffbffb9c
0000c4005fa01c88
000002a1075c3710 vldc:i_vldc_ioctl_write_cookie+a4 (c4004c400030,
380,ffbff898, 100003, 0, 70233400)
%l0-3: 0000000006c80000 0000000000156dc8 0000000000000380
0000000000100003
%l4-7: 00000000702337b0 000002a1075c37c8 0000000000040000
0000000000000000
000002a1075c37f0 vldc:vldc_ioctl+1a4 (3101, c4004c400030,
ffbff898,c4004c400000, c4004c438030, 0)
%l0-3: 0000000000100003 0000000000000000 000000007b340400
0000c4004c438030
%l4-7: 0000c4004c400030 0000000000000000 0000000000000000
0000000000000000
000002a1075c38a0 genunix:fop_ioctl+d0 (c4004d327800, 0, ffbff898,
100003,c4004384f718, 2a1075c3acc)
%l0-3: 0000000000003103 0000000000100003 000000000133ce94
0000c4002352a480
%l4-7: 0000000000000000 0000000000000002 00000000000000c0
0000000000000000
000002a1075c3970 genunix:ioctl+16c (3, 3103, ffbff898, 3, 134d50, 0)
%l0-3: 0000c40040e00a50 000000000000c6d3 0000000000000003
0000030000002000
%l4-7: 0000000000000003 0000000000000004 0000000000000000
0000000000000000

回復方法: primary ドメインのリブートを許可します。primary ドメインが、クラッシュ後にリブートしないように構成されている場合は、primary ドメインを手動でブートします。

SPARC M5-32 および SPARC M6-32: LSI-SAS コントローラが SR-IOV によって誤ってエクスポートされる

バグ ID 16071170: SPARC M5-32 または SPARC M6-32 システムで、内部 SAS コントローラが、SR-IOV をサポートしていなくても、SR-IOV 対応コントローラとしてエクスポートされます。

これらのカードに物理機能を作成しようとすると、Oracle VM Server for SPARC ログに、次のメッセージが表示されます。

Dec 11 04:27:54 warning: Dropping pf
pci@d00/pci@1/pci@0/pci@0/pci@0/pci@4/LSI,sas@0: no IOV capable driver
Dec 11 04:27:54 warning: Dropping pf
pci@d80/pci@1/pci@0/pci@c/pci@0/pci@4/LSI,sas@0: no IOV capable driver
Dec 11 04:27:54 warning: Dropping pf
pci@c00/pci@1/pci@0/pci@c/pci@0/pci@4/LSI,sas@0: no IOV capable driver
Dec 11 04:27:54 warning: Dropping pf
pci@e00/pci@1/pci@0/pci@0/pci@0/pci@4/LSI,sas@0: no IOV capable driver

システムには、SPARC M5-32 および SPARC M6-32 アセンブリの IOU 1 つにつき、4 つの LSI SAS コントローラポートがあります。各ポートでこのエラーが報告されます。

回避方法: このメッセージは無視してかまいません。これらのメッセージは、システムの LSI-SAS コントローラデバイスが SR-IOV に対応できることを示していますが、このハードウェアでは SR-IOV のサポートが可能ではありません。

SPARC T5-8: 稼働時間データに、一部の ldm list コマンドの値が 0 と表示される

バグ ID 16068376: 約 128 個のドメインを含む T5-8 で、ldm list などの一部の ldm コマンドに、すべてのドメインの稼働時間として 0 秒が表示されることがあります。

回避方法: ドメインにログインし、uptime コマンドを使用してドメインの稼働時間を調べます。

ldm が障害のあるコアをゲストドメインから退避できない

バグ ID 15962837: チップレベルの障害が発生すると、コアの退避が完了しません。コアの障害があとに続く退避は予想どおりに機能しますが、CMP ノード全体のリタイアを試みるときは、チップレベルの障害は退避を完了しません。

回避方法: ありません。チップレベルの障害を診断したら、チップの交換をスケジュールしてください。

Oracle Solaris 10: メモリーを 4G バイト未満に減らすと、メモリーの DR 操作がハングアップする

バグ ID 15942036: メモリーの DR 操作を実行してメモリーを 4G バイト未満に減らすと、その操作が永久にハングアップする可能性があります。そのドメインに対して ldm cancel-op memdr コマンドを発行すると、間違ったメッセージが表示されます。

The memory removal operation has completed. You cannot cancel this operation.

そのメッセージにもかかわらず、メモリーの DR 操作はハングアップし、そのゲストドメインに対して他の ldmd 操作を実行できない可能性があります。

回避方法: どのドメインでもメモリーを 4G バイト未満に減らさないようにしてください。すでにこの状態にある場合は、ldm stop -f コマンドを発行するか、ドメインにログインして、それをリブートします。

きわめて多数の仮想 CPU の CPU DR が失敗したように見える

 

バグ ID 15826354: きわめて多数の CPU の CPU 動的再構成 (DR) によって ldmd デーモンが失敗を返します。ldmd はタイムアウトしますが、バックグラウンドで DR 処理が続行し、最終的に成功します。それにもかかわらず、ldmd は結果のドメインと連携しなくなり、後続の DR 処理が許可されないことがあります。

例:

# ldm ls
NAME             STATE      FLAGS   CONS    VCPU  MEMORY   UTIL  NORM  UPTIME
primary          active     -n-cv-  UART    7     20G      2.7%  0.4%  1h 41m
ldg0             active     -n----  5000    761   16G       75%   51%  6m

# ldm rm-vcpu 760 ldg0
Request to remove cpu(s) sent, but no valid response received
VCPU(s) will remain allocated to the domain, but might
not be available to the guest OS
Resource removal failed
 
# ldm set-vcpu 1 ldg0
Busy executing earlier command; please try again later.
Unable to remove the requested VCPUs from domain ldg0
Resource modification failed
 
# ldm ls
NAME             STATE      FLAGS   CONS    VCPU  MEMORY   UTIL  NORM  UPTIME
primary          active     -n-cv-  UART    7     20G      0.9%  0.1%  1h 45m
ldg0             active     -n----  5000    761   16G      100%  0.0%  10m

回避方法: 数分間待ってから、ldm set-vcpu コマンドを再度実行します。

# ldm set-vcpu 1 ldg0
# ldm ls
NAME             STATE      FLAGS   CONS    VCPU  MEMORY   UTIL  NORM  UPTIME
primary          active     -n-cv-  UART    7     20G      0.9%  0.1%  1h 50m
ldg0             active     -n----  5000    1     16G       52%  0.0%  15m

760 は推奨される最大数を超えていることに注意してください。

SPARC T4-4: ゲストドメインをバインドできない

 

バグ ID 15825330: プロセッサボードが 1 つのみの一部の SPARC T4-4 構成で、Oracle VM Server for SPARC が起動時にハングアップしたように見えます。

回避方法: 常にプロセッサボードがプロセッサ 0 および 1 用のスロットを占有していることを確認してください。そのような構成でシステムを再起動すると、Oracle VM Server for SPARC ソフトウェアを起動できるようになります。

threading プロパティーの値を max-throughput から max-ipc に変更するとゲストドメインでパニックが発生する

バグ ID 15821246: Oracle Solaris 11.1 OS が実行されているシステムで、移行されたドメインに対する threading プロパティーの値を max-ipc から max-throughput に変更すると、ゲストドメインでパニックが発生することがあります。

回避方法: 移行されたゲストドメインがリブートするまで、そのゲストドメインの threading ステータスは変更しないでください。

2 つのアクティブな直接 I/O ドメインを持つ制御ドメインをリブートするとハングアップする

バグ ID 15820741: 直接 I/O が構成されている 2 つのドメインを持つ Oracle Solaris 11.1 システムでは、制御ドメインのリブート時にハングアップすることがあります。

回復方法: リブート時のハングアップから回復するには、SP で次のコマンドを発行して制御ドメインをリセットします。

-> reset -f /HOST/domain/control
メモリーの DR 追加が部分的に成功したときにエラーメッセージが表示されない

バグ ID 15812823: 空きメモリーが少ない状況では、サイズが原因で、必ずしもすべてのメモリーブロックがメモリーの DR 操作の一部として使用されないことがあります。ただし、このようなメモリーブロックは空きメモリー量に含まれます。こうした状況では、予想よりも少ない量のメモリーがドメインに追加される可能性があります。この状況が発生しても、エラーメッセージは表示されません。

回避方法: ありません。

PCIe 仮想機能が割り当てられたドメインの XML ファイルからの再作成が失敗する

バグ ID 15783851: 仮想機能の制約を間違って表している XML ファイルから構成を再作成するしようとすると、問題が発生することがあります。

この問題は、ldm list-constraints -x コマンドを使用して、PCIe 仮想機能が割り当てられたドメインの構成を保存した場合に発生します。

ldm add-domain -i コマンドを使用してあとでドメインを再作成すると、元の仮想機能が存在しないため、ドメインのバインドの試行が失敗し、次のエラーメッセージが表示されます。

No free matching PCIe device...

ldm add-domain コマンドによって仮想機能が PCIe デバイスとして誤って分類されているため、欠落している仮想機能を作成しても、ドメインのバインドの別の試行が失敗し、同じエラーメッセージが表示されます。

回避方法: 次の手順を実行します。

  1. ldm list-io コマンドを使用して、仮想機能に関する情報を保存します。

  2. ldm rm-dom コマンドを使用して、影響を受けた各ドメインを破棄します。

  3. ldm create-vf コマンドを使用して、必要なすべての仮想機能を作成します。

  4. ldm コマンドを使用してドメインを再構築します。

ldm add-io コマンドを使用して各仮想機能を追加すると、仮想機能デバイスとして正しく分類されるため、ドメインをバインドできます。

仮想機能を使用するドメイン構成の再構築については、ldm init-system コマンドで、物理的な I/O 変更が行われたドメイン構成が正しく復元されないことがあるを参照してください。

制御ドメインをコア全体の使用から部分的なコアの使用に変更すると、正しくないエラーメッセージが発行される

バグ ID 15783608: 制御ドメインを、物理的に制約されたコアの使用から制約のない CPU リソースの使用に変更すると、次の無関係なメッセージが表示されることがあります。

Whole-core partitioning has been removed from domain primary,because
dynamic reconfiguration has failed and the domain is now configured
with a partial CPU core.

回避方法: このメッセージは無視できます。

ldm init-system コマンドで、物理的な I/O 変更が行われたドメイン構成が正しく復元されないことがある

バグ ID 15783031: ldm init-system コマンドを使用して、直接 I/O または SR-IOV 操作を使用したドメイン構成を復元すると、問題が発生することがあります。

    問題が発生するのは、復元される構成で次の操作が 1 つ以上実行された場合です。

  • primary ドメインによってまだ所有されているバスからスロットが取り外されました。

  • primary ドメインによって所有されている物理機能から仮想機能が作成されました。

  • 仮想機能が primary ドメインまたはほかのゲストドメイン、あるいはその両方に割り当てられました。

  • ルートコンプレックスが primary ドメインから削除され、ゲストドメインに割り当てられました。そのルートコンプレックスは、このあとの I/O 仮想化操作の基礎として使用されます。

    つまり、primary 以外のルートドメインを作成し、以前の操作をすべて実行しました。

システムが、以前のアクションが 1 つも行われていない状態のままであるようにするには、ldm init-system コマンドを使用して、物理的な I/O 変更が行われたドメインを復元する方法を参照してください。

多数のドメインを同時に変更しようとすると、Logical Domains Manager がクラッシュして再起動する場合がある

バグ ID 15782994: 多数のドメインの構成に影響を与える操作を試みると、Logical Domains Manager がクラッシュして再起動する場合があります。この問題は、仮想ネットワーク構成に関連した何らかの設定を変更しようとした場合、および同じ仮想スイッチ内の多数の仮想ネットワークデバイスが多数のドメインにわたって存在する場合に発生することがあります。この問題は通常、同じ仮想スイッチに接続された仮想ネットワークデバイスを含むドメインが約 90 以上存在し、かつ inter-vnet-link プロパティーが有効になっている (デフォルトの動作) 場合に発生します。この現象は、ldmd ログファイルや、/var/opt/SUNWldm ディレクトリ内の core ファイルにある次のメッセージを見つけることによって確認します。

Frag alloc for 'domain-name'/MD memory of size 0x80000 failed

回避方法: 同じ仮想スイッチに接続された多数の仮想ネットワークデバイスを作成することを避けてください。そのような作成を意図的に行う場合は、仮想スイッチ上で inter-vnet-link プロパティーを off に設定します。このオプションによって、ゲストドメイン間のネットワークパフォーマンスに悪影響が発生する可能性があることに注意してください。

制御ドメインにはシステム内の最小番号コアが必要である

バグ ID 15778392: 制御ドメインには、システム内の最小番号コアが必要です。そのため、コア ID 0 が最小番号コアである場合、制御ドメインにコア全体の制約を適用しようとすると、そのコアをほかのどのドメインとも共有することができません。

たとえば、システム内の最小番号コアがコア ID 0 である場合、制御ドメインは次の出力のようになるはずです。

# ldm ls -o cpu primary
NAME
primary

VCPU
VID    PID    CID    UTIL STRAND
0      0      0      0.4%   100%
1      1      0      0.2%   100%
2      2      0      0.1%   100%
3      3      0      0.2%   100%
4      4      0      0.3%   100%
5      5      0      0.2%   100%
6      6      0      0.1%   100%
7      7      0      0.1%   100%
Oracle Solaris 11: DRM の横取りによって Oracle Solaris の DR の失敗および再試行が報告される

バグ ID 15775668: 高い優先順位ポリシーを持つドメインは、より低い優先順位ポリシーを持つドメインから仮想 CPU リソースを横取りできます。この「横取り」処理の進行中、ldmd ログに 10 秒ごとに次の警告メッセージが表示されることがあります。

warning: Unable to unconfigure CPUs out of guest domain-name

回避方法: これらの誤解を招くようなメッセージは無視できます。

ドメインに割り当てることのできる仮想機能の最大数の制限

バグ ID 15775637: I/O ドメインには、ルートコンプレックスあたりに使用できる割り込みリソースの数に関する制限があります。

SPARC T3 および SPARC T4 システムでは、この制限は約 63 MSI/X ベクトルです。各 igb 仮想機能は、3 つの割り込みを使用します。ixgbe 仮想機能は、2 つの割り込みを使用します。

あるドメインに多数の仮想機能を割り当てると、そのドメインの、これらのデバイスをサポートするためのシステムリソースが不足します。次のようなメッセージが表示されることがあります。

WARNING: ixgbevf32: interrupt pool too full.
WARNING: ddi_intr_alloc: cannot fit into interrupt pool
ゲストドメインのコンソールのバインド中に、そのコンソールへの接続が試みられると、入力がブロックされることがある

バグ ID 15771384: ドメインのゲストコンソールが、そのバインド前やバインド中にそのコンソールへの接続が繰り返し試みられた場合に休止することがあります。たとえば、ドメインがそのマシン上に移行されているときに、自動スクリプトを使用してそのコンソールをグラブする場合にこれが発生する可能性があります。

回避方法: コンソールの休止を解除するには、ドメインのコンソール端末集配信装置をホストするドメイン (通常は制御ドメイン) で次のコマンドを実行します。

primary# svcadm disable vntsd
primary# svcadm enable vntsd
すべての仮想機能を破棄してスロットをルートドメインに戻しても、ルートコンプレックスリソースが回復されない

バグ ID 15765858: すべての仮想機能を破棄してスロットをルートドメインに戻しても、ルートコンプレックスのリソースが回復されません。

回避方法: 特定の PCIe バスに対する iov オプションを off に設定してください。

primary# ldm start-reconf primary
primary# ldm set-io iov=off pci_0
PCIe から PCI へのブリッジを備えた PCIe カードの ldm remove-io は、拒否されるべきである

バグ ID 15761509: このサポートドキュメントに記載された、直接 I/O (DIO) 機能をサポートする PCIe カードのみを使用してください。

回避方法: ldm add-io コマンドを使用して primary ドメインにカードをふたたび追加します。

ldm start コマンドの直後に ldm stop コマンドを発行すると、コマンドが失敗する可能性がある

バグ ID 15759601: ldm start コマンドの直後に ldm stop コマンドを発行すると、ldm stop コマンドが次のエラーで失敗する可能性があります。

LDom domain-name stop notification failed

回避方法: ldm stop コマンドをもう一度発行します。

init-system が、保存した XML ファイルからゲストドメインに対する名前付きコアの制約を復元しない

バグ ID 15758883: ldm init-system コマンドを使用しても、保存した XML ファイルからゲストドメインに対する名前付き CPU コアの制約を復元できません。

回避方法: 次の手順を実行します。

  1. primary ドメイン用の XML ファイルを作成します。

    # ldm ls-constraints -x primary > primary.xml
  2. ゲストドメイン (複数可) 用の XML ファイルを作成します。

    # ldm ls-constraints -x domain-name[,domain-name][,...] > guest.xml
  3. システムの電源を再投入し、出荷時のデフォルト構成でブートします。

  4. XML 構成を primary ドメインに適用します。

    # ldm init-system -r -i primary.xml
  5. XML 構成をゲストドメイン (複数可) に適用します。

    # ldm init-system -f -i guest.xml
非常に多数の仮想機能が割り当てられた primary ドメインをリブートすると、システムでパニックが発生する

バグ ID 15750727: 非常に多数の仮想機能が割り当てられた primary ドメインをリブートすると、システムでパニックが発生することがあります。

回避方法: 次のいずれかを実行してください。

  • 仮想機能の数を減らすことで、失敗する仮想機能の数を減らします。この変更によってチップの応答性を維持できる可能性があります。

  • システムのすべての ixgbe 仮想機能に対して割り込みリソース管理 (IRM) プールがデフォルトで 1 つしか作成されないため、ixgbe 仮想機能用の IRM プールをより多く作成します。

部分的なコアを持つ primary でコア全体の DR 移行が許可されない

バグ ID 15748348: primary ドメインが別のドメインと最小番号の物理コア (通常は 0) を共有している場合、primary ドメインでコア全体の制約を設定する試みが失敗します。

回避方法: 次の手順を実行します。

  1. ドメインで共有されている、最小番号のバインドされたコアを判定します。

    # ldm list -o cpu
  2. primary ドメイン以外のすべてのドメインで、最小番号コアのすべての CPU スレッドのバインドを解除します。

    結果として、最小番号コアの CPU スレッドは共有されず、primary ドメインに自由にバインドできるようになります。

  3. 次のいずれかを実行して、コア全体の制約を設定します。

    • CPU スレッドを primary ドメインにバインドし、ldm set-vcpu -c コマンドを使用してコア全体の制約を設定します。

    • ldm set-core コマンドを使用して、CPU スレッドのバインドとコア全体の制約の設定を一度に行います。

ブート後に ldm list-io コマンドで UNK または INV 状態が表示される

バグ ID 15738561: primary ドメインがブートされた直後に ldm list-io コマンドを実行すると、PCIe スロットや SR-IOV 仮想機能で UNK または INV 状態が表示される可能性があります。この問題の原因は、Oracle Solaris OS からの Logical Domains エージェント応答の遅延にあります。

この問題は、いくつかのシステムでのみ報告されています。

回避方法: Logical Domains エージェントから情報が受信されると、PCIe スロットや仮想機能のステータスが自動的に更新されます。

ドメインから多数の CPU を削除すると失敗することがある

    次のバグは、ドメインから多数の CPU を削除する際に発生する可能性のある障害について説明しています。

  • 制御ドメイン。

    バグ ID 15677358: 100 を超える CPU を制御ドメイン (primary ドメインとも呼ばれる) から削除する場合は、動的再構成ではなく遅延再構成を使用します。次の手順を実行します。

    1. ldm start-reconf primary コマンドを使用して、制御ドメインを遅延再構成モードにします。

    2. 必要な数の CPU リソースを削除します。

      CPU リソースの削除中に何らかの間違いをおかした場合は、制御ドメインがまだ遅延構成状態になっている間に CPU を削除する別のリクエストを試みないでください。そうした場合、コマンドが失敗します (Oracle VM Server for SPARC 3.2 管理ガイド の遅延再構成中に実行を許可される CPU 構成操作は 1 つだけであるを参照)。代わりに、ldm cancel-reconf コマンドを使用して遅延構成処理を取り消し、最初からやり直します。

    3. 制御ドメインをリブートします。

  • ゲストドメイン。

    バグ ID 15726205: ゲストドメインから多数の CPU を削除しようとすると、次のエラーメッセージが表示される可能性があります。

    Request to remove cpu(s) sent, but no valid response received
    VCPU(s) will remain allocated to the domain, but might
    not be available to the guest OS
    Resource modification failed

    回避方法: ゲストドメインから 100 個を超える CPU を削除する場合、事前にドメインを停止します。

Oracle Solaris のホットプラグ操作を使用して PCIe エンドポイントデバイスをホットリムーブできない

バグ ID 15721872: ldm rm-io コマンドを使用して PCIe エンドポイントデバイスを primary ドメインから削除したあとで、Oracle Solaris のホットプラグ操作を使用してそのデバイスをホットリムーブすることができません。PCIe エンドポイントデバイスの置換や削除を行う方法については、Oracle VM Server for SPARC 3.2 管理ガイド のPCIe ハードウェアの変更を参照してください。

システムログサービスがオンラインにならない場合、Logical Domains エージェントサービスもオンラインにならない

バグ ID 15707426: システムログサービス svc:/system/system-log が起動に失敗してオンラインにならない場合、Logical Domains エージェントサービスもオンラインになりません。Logical Domains エージェントサービスがオンラインではない場合、virtinfoldm add-vswldm add-vdsdevldm list-io commands の各コマンドが予想したとおりに動作しない場合があります。

回避方法: svc:/ldoms/agents:default サービスが有効化され、オンラインになっていることを確認します。

# svcs -l svc:/ldoms/agents:default

svc:/ldoms/agents:default サービスがオフラインの場合は、サービスが有効化されていることと、依存するすべてのサービスがオンラインであることを確認します。

DRM および ldm list 出力に、ゲストドメイン内の実際の仮想 CPU の数とは異なる数が表示される

バグ ID 15702475: CPU の数が大幅に削減されたあとにロードされたドメインの DRM ポリシーの期限が切れると、Oracle VM Server for SPARC ログに No response メッセージが表示されることがあります。ldm list 出力には、psrinfo 出力に示されている数よりも多くの CPU リソースがドメインに割り当てられていることが示されています。

回避方法: ldm set-vcpu コマンドを使用して、ドメイン上の CPU の数を psrinfo 出力に示されている数にリセットします。

DR 中に仮想 CPU タイムアウトエラーが発生する

バグ ID 15701258: 100 を超える仮想 CPU といくつかの暗号化装置を持つゲストドメインで ldm set-vcpu 1 コマンドを実行すると、仮想 CPU の削除に失敗します。仮想 CPU は DR タイムアウトエラーが原因で削除されません。暗号化装置は正常に削除されます。

回避方法: ldm rm-vcpu コマンドを使用して、ゲストドメインから仮想 CPU を 1 つを残してすべて削除します。1 回につき 100 を超える仮想 CPU を削除しないでください。

pkgadd/var/svc/manifest/platform/sun4v/ldmd.xml での ACL エントリの設定に失敗する

バグ ID 15668881: pkgadd コマンドを使用して、Sun ZFS ストレージアプライアンスから NFS 経由でエクスポートされたディレクトリから SUNWldm.v パッケージをインストールすると、次のエラーメッセージが表示される場合があります。

cp: failed to set acl entries on /var/svc/manifest/platform/sun4v/ldmd.xml

回避方法: このメッセージは無視してください。

SPARC T3-1: 複数の直接 I/O パス経由でアクセスできるディスクの問題

バグ ID 15668368: SPARC T3-1 システムには、デュアルポートディスクをインストールできます。このディスクには、2 つの異なる直接 I/O デバイスからアクセスできます。この 2 つの直接 I/O デバイスをそれぞれ異なるドメインに割り当てると、ディスクが両方のドメインで使用されることになり、ディスクの実際の使用状態によっては他方のドメインに影響を及ぼすことがあります。

回避方法: 同じディスクセットにアクセスする複数の直接 I/O デバイスを、それぞれ異なる I/O ドメインに割り当てないでください。SPARC T3-1 システムにデュアルポートディスクがあるかどうかを調べるには、次のコマンドを SP で実行します。

-> show /SYS/SASBP

出力の fru_description の値が次のとおりならば、対応するシステムにデュアルポートディスクがあります。

fru_description = BD,SAS2,16DSK,LOUISE

システムにデュアルディスクが存在している場合は、次に示す直接 I/O デバイスが両方とも同じドメインに割り当てられていることを確認します。

pci@400/pci@1/pci@0/pci@4  /SYS/MB/SASHBA0
pci@400/pci@2/pci@0/pci@4  /SYS/MB/SASHBA1
Oracle Solaris 10 を実行するゲストドメイン: 複数の NIU nxge インスタンスが plumb されているときにメモリー DR 削除処理を実行すると、無限にハングアップして完了しないことがある

バグ ID 15667770: 1 つのドメインで複数の NIU nxge インスタンスが plumb されていると、ドメインからメモリーを削除する場合に使用する ldm rm-mem および ldm set-mem コマンドが、いつまでも完了しない可能性があります。メモリー削除処理中に問題が発生したかどうかを確認するには、ldm list -o status コマンドで処理の進行状況をモニターします。完了率が変わらない状態が何分間も続いているときは、この問題が発生している可能性があります。

回避方法: ldm rm-mem または ldm set-mem コマンドを取り消し、十分な量のメモリーが削除されたかどうかをチェックします。削除されていない場合は、もう一度メモリー削除コマンドを実行するときに削除するメモリーの量を小さくすると、正常に完了する可能性があります。

    この問題が primary ドメインで発生した場合は、次を行なってください。

  1. primary ドメインで遅延再構成処理を開始します。

    # ldm start-reconf primary
  2. 必要な量のメモリーをこのドメインに割り当てます。

  3. primary ドメインをリブートします。

この問題がその他のドメインで発生した場合は、そのドメインを停止してから、ドメインに割り当てるメモリー量を調節します。

マスター - スレーブ関係にあるドメインで ldm stop -a コマンドを実行すると、スレーブに stopping フラグが設定されたままになる

バグ ID 15664666: リセット依存関係が作成されているときに、ldm stop -a コマンドを実行すると、リセット依存関係にあるドメインが単に停止するのではなく、再起動されることがあります。

回避方法: まず、ldm stop コマンドをマスタードメインに発行します。次に、ldm stop コマンドをスレーブドメインに発行します。スレーブドメインの初回の停止に失敗した場合は、ldm stop -f コマンドをスレーブドメインに対して実行します。

使用中の MAC アドレスがふたたび割り当て可能になる

バグ ID 15655199: 使用中の MAC アドレスが検出されず、誤ってふたたび割り当てられることがあります。

回避方法: 使用中の MAC アドレスをふたたび割り当てることができないように手動で確認してください。

ldmconfig が SP 上にドメイン構成を作成できない

バグ ID 15654965: ldmconfig スクリプトが、格納されたドメイン構成をサービスプロセッサ (Service Processor、SP) 上に正しく作成できません。

    回避方法: ldmconfig スクリプトが完了してドメインがリブートしたあと、システムの電源を再投入しないでください。代わりに、次の手順を手動で実行してください。

  1. SP に構成を追加します。

    # ldm add-spconfig new-config-name
  2. primary-with-clients 構成を SP から削除します。

    # ldm rm-spconfig primary-with-clients
  3. システムの電源を再投入します。

システムの電源を再投入する前にこれらの手順を実行しなかった場合、primary-with-client 構成の存在により、ドメインが非アクティブになります。この場合、各ドメインを手動でバインドしてから、ldm start -a コマンドを実行してそれらのドメインを起動する必要があります。ゲストのブート後にこの処理を繰り返すと、電源の再投入後にゲストドメインが自動的にブートするようになります。

仮想ネットワークデバイスの MTU 値の動的再構成が失敗することがある

バグ ID 15631119: 制御ドメインの仮想ネットワークデバイスの最大伝送単位 (Maximum Transmission Unit、MTU) を変更すると、遅延再構成処理が起動されます。そのあとで遅延再構成をキャンセルしても、デバイスの MTU 値は元の値に復元されません。

回復方法: ldm set-vnet コマンドを再実行して MTU を元の値に設定します。MTU の設定を変更すると、制御ドメインが遅延再構成モードになりますが、このモードをキャンセルする必要があります。これで、MTU 値は元の正しい MTU 値になります。

# ldm set-vnet mtu=orig-value vnet1 primary
# ldm cancel-op reconf primary
ドメインからすべての暗号化装置を動的に削除すると、SSH が終了する

バグ ID 15600969: 動作中のドメインからすべてのハードウェア暗号化装置を動的に削除すると、暗号化フレームワークがソフトウェア暗号化プロバイダへのシームレスな切り替えに失敗し、すべての ssh 接続が強制終了します。

回復方法: ドメインからすべての暗号化装置を削除したあと、ssh 接続を再確立します。

回避方法: サーバー側の /etc/ssh/sshd_config ファイルに UseOpenSSLEngine=no を設定し、svcadm restart ssh コマンドを実行します。

ssh 接続にはハードウェア暗号化装置が使用されなくなるので、パフォーマンスの向上というメリットはなくなりますが、暗号化装置が削除されても ssh 接続は切断されません。

ldm list-io -l 出力で PCI Express Dual 10-Gigabit Ethernet Fiber カードに 4 つのサブデバイスが表示される

バグ ID 15597025: PCI Express Dual 10-Gigabit Ethernet Fiber カード (X1027A-Z) が搭載されたシステム上で ldm ls-io -l コマンドを実行すると、次のような出力が表示される場合があります。

primary# ldm ls-io -l
...
pci@500/pci@0/pci@c PCIE5 OCC primary
network@0
network@0,1
ethernet
ethernet

この出力には 4 つのサブデバイスが表示されていますが、この Ethernet カードにはポートが 2 個しかありません。これは、このカードには 4 つの PCI 機能があるために発生します。4 つの機能のうち 2 つは内部で無効になっており、ldm ls-io -l 出力では ethernet として表示されます。

回避方法: ldm ls-io -l 出力の ethernet エントリは無視してかまいません。

いくつかのドメインがブート中の場合、ldm コマンドの応答が遅くなる

バグ ID 15572184: いくつかのドメインがブート中だと ldm コマンドの応答が遅くなることがあります。この段階で ldm コマンドを実行すると、コマンドがハングアップしているように見える可能性があります。ldm コマンドは、期待されるタスクを実行したあとでリターンします。コマンドがリターンしたら、システムは通常どおり ldm コマンドに応答するはずです。

回避方法: 多数のドメインを同時にブートしないようにします。ただし、いくつかのドメインを同時にブートする必要がある場合、システムが通常の状態に戻るまで新しい ldm コマンドを実行しないようにします。たとえば、Sun SPARC Enterprise T5140 および T5240 サーバーでは約 2 分間、Sun SPARC Enterprise T5440 サーバーまたは Sun Netra T5440 サーバーでは約 4 分間待機します。

Oracle Solaris 11: 自動ネットワークインタフェースで構成されたゾーンの起動に失敗することがある

バグ ID 15560811: Oracle Solaris 11 では、Logical Domains 仮想ネットワークデバイスのみを含むドメインで、自動ネットワークインタフェース (anet) で構成されたゾーンが起動に失敗することがあります。

  • 回避方法 1: 1 つ以上の物理ネットワークデバイスをゲストドメインに割り当てます。物理 NIC をドメインに割り当てるには、PCIe バス割り当て、直接 I/O (DIO)、または SR-IOV 機能を使用します。

  • 回避方法 2: ゾーンの構成要件が、ゾーン間通信をドメイン内でのみ行わせることである場合、etherstub デバイスを作成します。ゾーン構成内で etherstub デバイスを「下位リンク」として使用し、etherstub デバイス上で仮想 NIC が作成されるようにします。

  • 回避方法 3: 排他的リンク割り当てを使用して、Logical Domains 仮想ネットワークデバイスをゾーンに割り当てます。仮想ネットワークデバイスを必要に応じてドメインに割り当てます。多数の仮想ネットワークデバイスを作成できるように、inter-vnet リンクを無効にすることを選択することもできます。

Oracle Solaris 10: 制御ドメインで仮想ネットワークデバイスが適切に作成されない

バグ ID 15560201: 仮想ネットワークまたは仮想ディスクデバイスをドメインに追加したあと、ifconfig でデバイスが存在しないと表示されることがあります。この状態は、/devices エントリが作成されていないために発生することがあります。

この問題は通常操作時には発生しませんが、仮想ネットワークデバイスのインスタンス番号が /etc/path_to_inst ファイルに示されているインスタンス番号と一致しない場合にこのエラーが発生することがあります。

例:

# ifconfig vnet0 plumb
ifconfig: plumb: vnet0: no such interface

仮想デバイスのインスタンス番号は、ldm list の出力内の「DEVICE」列の下に表示されます。

# ldm list -o network primary
NAME             
primary          

MAC
 00:14:4f:86:6a:64

VSW
 NAME         MAC               NET-DEV DEVICE   DEFAULT-VLAN-ID PVID VID MTU  MODE  
 primary-vsw0 00:14:4f:f9:86:f3 nxge0   switch@0 1               1        1500        

NETWORK
 NAME   SERVICE              DEVICE    MAC               MODE PVID VID MTU  
 vnet1  primary-vsw0@primary network@0 00:14:4f:f8:76:6d      1        1500

このインスタンス番号 (ここに示す vnet および vsw の場合は両方とも 0) と path_to_inst ファイルのインスタンス番号が確実に一致するように、両方の番号を比較できます。

# egrep '(vnet|vsw)' /etc/path_to_inst
"/virtual-devices@100/channel-devices@200/virtual-network-switch@0" 0 "vsw"
"/virtual-devices@100/channel-devices@200/network@0" 0 "vnet"

回避方法: インスタンス番号が一致していない場合、その仮想ネットワークまたは仮想スイッチデバイスを削除します。次に、id プロパティーを設定することで必要なインスタンス番号を明示的に指定し、それらをふたたび追加します。

/etc/path_to_inst ファイルを手動で編集することもできます。path_to_inst(4) のマニュアルページを参照してください。


Caution

注意  - /etc/path_to_inst への変更を安易に行わないようにしてください。


Logical Domains が構成されている場合に、新しく追加した NIU/XAUI アダプタがホスト OS に表示されない

バグ ID 15555509: システムに Logical Domains が構成されている場合に別の XAUI ネットワークカードを追加すると、マシンの電源を再投入してもそのカードは表示されません。

回復方法: 新しく追加した XAUI が制御ドメインに表示されるようにするには、次の手順を実行します。

  1. 制御ドメインにダミー変数を設定し、クリアーします。

    次のコマンドでは、fix-xaui というダミー変数を使用しています。

    # ldm set-var fix-xaui=yes primary
    # ldm rm-var fix-xaui primary
  2. 変更した構成を SP に保存し、現在の構成を置き換えます。

    次のコマンドでは構成名 config1 を使用しています。

    # ldm rm-spconfig config1
    # ldm add-spconfig config1
  3. 制御ドメインの再構成リブートを実行します。

    # reboot -- -r

    この時点で、新しく使用可能になったネットワークを Logical Domains 用に構成できます。

e1000g からのブート時に I/O ドメインまたはゲストドメインでパニックが発生する

バグ ID 15543982: Sun Fire T5240 などのシステムでは、専用 PCI-E ルートコンプレックスで最大 2 つのドメインを構成できます。このようなシステムには、2 つの UltraSPARC T2 Plus CPU と 2 つの I/O ルートコンプレックスが装備されています。

pci@500pci@400 が、システムの 2 つのルートコンプレックスです。primary ドメインには、少なくとも 1 つのルートコンプレックスが必ず含まれます。2 つ目のドメインは、割り当てまたはバインドされていないルートコンプレックスを使用して構成できます。

    pci@400 ファブリック (またはリーフ) には、オンボード e1000g ネットワークカードが備わっています。次の状況では、ドメインでパニックが発生する場合があります。

  • システムが pci@500 を含む primary ドメインと pci@400 を含む 2 つ目のドメインで構成されている場合


    注 - 一部のブレードでは、primary ドメイン (システムディスク) がデフォルトで pci@400 バス上にあります。
  • 2 つ目のドメインのブートに、pci@400 ファブリック上の e1000g デバイスが使用される

次のネットワークデバイスが primary 以外のドメインに構成されている場合、これらのデバイスを避けてください。

/pci@400/pci@0/pci@c/network@0,1
/pci@400/pci@0/pci@c/network@0

これらの条件に該当する場合、PCI-E の致命的エラーが発生し、そのドメインでパニックが発生します。

このような構成を避けるか、またはこのような構成を使用している場合は、示されているデバイスからブートしないでください。

マシンがネットワーク接続されていない場合に NIS クライアントが実行されていると、Logical Domains Manager が起動しない

バグ ID 15518409: マシンにネットワークが構成されていない場合にネットワーク情報サービス (Network Information Service、NIS) クライアントが実行されていると、Logical Domains Manager が起動しません。

回避方法: ネットワークに接続されていないマシン上の NIS クライアントを無効にします。

# svcadm disable nis/client
Logical Domains システムから uadmin 1 0 コマンドを実行すると、システムが OK プロンプトに戻らないことがある

バグ ID 15511551: Logical Domains システムのコマンド行から uadmin 1 0 コマンドを実行すると、それ以降のリセットでシステムが ok プロンプトに戻らない場合があります。この誤った動作は、Logical Domains 変数 auto-reboot?true に設定されている場合にのみ発生します。auto-reboot?false に設定されている場合は、期待どおりに動作します。

回避方法: 代わりに次のコマンドを使用します。

uadmin 2 0

または、常に auto-reboot?false に設定して実行するようにします。

Logical Domains Manager によるドメインの停止に 15 分以上かかることがある

バグ ID 15505014: CPU が 1 つのみでメモリーが大容量の構成では、ドメインの停止またはメモリーのスクラブに 15 分以上かかることがあります。停止の際、ドメインの CPU はそのドメインが所有するすべてのメモリーをスクラブするために使用されます。CPU が 1 つのみでメモリーが 512G バイトのドメインのように不均衡な構成では、スクラブの完了までに非常に長い時間がかかる場合があります。スクラブ時間が長くなると、ドメインの停止に必要な時間も長くなります。

回避方法: 大容量メモリー構成 (100G バイトを超えるもの) では必ず、少なくとも 1 つのコアが存在するようにします。

SC または SP のリセット後、scadm コマンドがハングアップすることがある

 

バグ ID 15469227: SC リセットのあとに、少なくとも Oracle Solaris 10 5/08 OS が動作している制御ドメイン上で scadm コマンドがハングアップすることがあります。SC のリセット後、システムは適切に接続を再確立できません。

回復方法: ホストをリブートして SC との接続を再確立します。

共通コンソールグループ内で複数ドメインを同時にネットインストールすると失敗する

バグ ID 15453968: 共通のコンソールグループを持つシステムで、複数のゲストドメインのネットインストールを同時に実行すると失敗します。

回避方法: それぞれ固有のコンソールグループを持つゲストドメインでのみネットインストールを実行してください。この障害は、ネットインストールを行う複数のドメイン間で共有される、共通のコンソールグループを使用するドメインでのみ発生します。

DHCP を使用している同一ネットワーク上で、ゲストドメインに構成された仮想ネットワークが多すぎると、ゲストドメインが応答しなくなることがある

バグ ID 15422900: 動的ホスト構成プロトコル (Dynamic Host Configuration Protocol、DHCP) を使用している同一ネットワーク上で、ゲストドメインに 5 つ以上の仮想ネットワーク (vnet) を構成すると、ネットワークトラフィックの実行中に、ゲストドメインが最終的に応答しなくなることがあります。

回避方法: インタフェースが 8 個ある場合、ip_ire_min_bucket_cntip_ire_max_bucket_cnt を 32 などの大きな値に設定します。

回復方法: 問題のゲストドメイン (domain-name) 上で、ldm stop-domain domain-name コマンドを発行したあと、ldm start-domain domain-name コマンドを発行します。

Logical Domains Manager の実行中に、eeprom コマンドによって、OpenBoot PROM 変数を変更できない

バグ ID 15387338: この問題の概要はOracle VM Server for SPARC 3.2 管理ガイド のLogical Domains 変数の永続性で説明していますが、制御ドメインにのみ影響します。

Logical Domains 実行中にセキュリティーキーを設定できない

バグ ID 15370442: Logical Domains 環境では、広域ネットワーク (WAN) ブートキーの設定または削除を Oracle Solaris OS 内から、ickey(1M) コマンドを使用して行うことはサポートされていません。ickey 操作はすべて失敗し、次のようなエラーが表示されます。

ickey: setkey: ioctl: I/O error

また、制御ドメイン以外の論理ドメインで OpenBoot ファームウェアを使用して設定された WAN ブートキーは、ドメインをリブートすると記憶されていません。これらのドメインでは、OpenBoot ファームウェアで設定したキーは 1 回の使用にのみ有効です。

ldm stop-domain コマンドの動作がわかりにくいことがある

バグ ID 15368170: ldm stop-domain コマンドの動作がわかりにくい場合があります。

# ldm stop-domain -f domain-name

ドメインにカーネルモジュールデバッガ kmdb(1) のプロンプトが表示されている場合、ldm stop-domain コマンドが失敗し、次のエラーメッセージが表示されます。

LDom <domain-name> stop notification failed