このセクションでは、このバージョンのソフトウェアを使用するときに発生する可能性があるバグの概要について説明します。最新のバグを最初に説明します。回避方法および回復手順がある場合は、指定しています。
バグ ID 20619894: system/management/hwmgmtd パッケージがインストールされていない場合は、動的バスの削除操作により rcm_daemon でコンソール上に次のメッセージが出力されます。
rcm_daemon[839]: rcm script ORCL,pcie_rc_rcm.pl: svcs: Pattern 'sp/management' doesn't match any instances
回避方法: このメッセージは無視しても安全です。
バグ ID 20570207: 電源管理ポリシーが elastic に設定されている場合は、リソースの障害または欠落が検出されたあと、Logical Domains Manager がドメインを復旧中に primary ドメインがハングすることがあります。
回復方法: ポリシーを disabled に変更してから、システムの電源を投入して復旧モードを再開してください。
バグ ID 20432421: 遅延構成中に grow-socket または shrink-socket コマンドを使用して仮想 CPU またはコアを変更すると、予期しない動作が発生することがあります。primary ドメインに属するメモリーは再割り当てされるため、指定されたソケット内のメモリーのみがドメインにバインドされます。
回避方法: shrink-socket および grow-socket コマンドを使用して仮想 CPU またはコアを変更するのは、遅延再構成中ではないときだけにしてください。
バグ ID 20425271: factory-default に戻したあとで復旧をトリガーしているときに、システムが以前のアクティブな構成でブートしたデバイスとは異なるデバイスからブートすると、復旧モードが失敗します。この障害は、アクティブな構成が factory-default ブートデバイス以外のブートデバイスを使用する場合に発生することがあります。
回避方法: 新しい構成を SP に保存するときに、次の手順を実行します。
primary ドメインのブートデバイスへのフル PCI パスを特定します。
手順 4 の ldm set-var コマンドでこのパスを使用します。
現在設定されている boot-device プロパティーを primary ドメインから削除します。
この手順は、boot-device プロパティーに値が設定されている場合のみ実行する必要があります。プロパティーに値が設定されていない場合は、boot-device プロパティーを削除しようとすると boot-device not found というメッセージが表示されます。
primary# ldm rm-var boot-device primary
現在の構成を SP に保存します。
primary# ldm add-spconfig config-name
primary ドメインに boot-device プロパティーを明示的に設定します。
primary# ldm set-var boot-device=value primary
説明されているとおりに構成を SP に保存したあとで boot-device プロパティーを設定した場合は、復旧モードがトリガーされたときに、指定したブートデバイスがブートされます。
回復方法: 説明されているとおりに復旧モードがすでに失敗している場合は、次の手順を実行します。
ブートデバイスを、最後に実行する構成で使用されるデバイスに明示的に設定します。
primary# ldm set-var boot-device=value primary
primary ドメインをリブートします。
primary# reboot
リブートにより復旧を続行できます。
バグ ID 20426593: リソースグループ名の数値の接尾辞に複数の数字が含まれている場合、ldm list-rsrc-group によって、I/O リソース情報が間違ったリソースグループの下に表示されることがあります。
次の例では、ldm list-rsrc-group コマンドによって、/SYS/CMIOU10 の PCIe バス情報が、誤って /SYS/CMIOU1 リソースグループの下に表示されています。
primary# ldm list-io NAME TYPE BUS DOMAIN STATUS ---- ---- --- ------ ------ .. /SYS/CMIOU10/PCIE2 PCIE pci_50 primary OCC /SYS/CMIOU10/PCIE3 PCIE pci_51 primary OCC /SYS/CMIOU10/PCIE1 PCIE pci_53 primary OCC .. . primary# ldm list-rsrc-group -l -o io /SYS/CMIOU1 NAME /SYS/CMIOU1 IO DEVICE PSEUDONYM BOUND pci@305 pci_5 alt-root pci@306 pci_6 primary pci@308 pci_8 alt-root pci@309 pci_9 primary pci@332 pci_50 primary pci@333 pci_51 primary pci@335 pci_53 primary
PCIe バス pci_50、pci_51、および pci_53 は、/SYS/CMIOU10 リソースグループではなく、誤って /SYS/CMIOU1 リソースグループの下に表示されています。
回避方法: I/O 名から PCIe バスの正しいリソースグループ名を取得するには、ldm list-io -l コマンドを実行します。たとえば、I/O 名が /SYS/CMIOU10/PCIE2 の PCIe バスは、/SYS/CMIOU1 ではなく /SYS/CMIOU10 に属しているはずです。
バグ ID 20321459: 仮想ディスクバックエンドが見つからず、検証できない場合、Logical Domains Manager はバックエンドに割り当てられているゲストドメインを復旧しません。これはマルチパスが構成されている場合も当てはまります。
回避方法: 次の手順を実行します。
一時的にデバイス検証を無効にします。
primary# svccfg -s ldmd setprop ldmd/device_validation integer: 0 primary# svcadm refresh ldmd primary# svcadm restart ldmd
バックエンドが欠落しているゲストドメインを手動で復旧します。
デバイス検証を無効にすると、バックエンドまたは関連する物理ネットワークデバイスが存在しない場合でも、Logical Domains Manager によりゲストドメインに仮想デバイスが追加されます。したがって、ドメイン構成を復旧したあとは、必ずデバイス検証を再度有効にしてください。
primary# svccfg -s ldmd setprop ldmd/device_validation integer: -1 primary# svcadm refresh ldmd primary# svcadm restart ldmd
バグ ID 20307560: 任意の数の仮想 CPU と任意の量のメモリーを使用するゲストドメインを作成し、ldm bind コマンドを実行すると、このコマンドにより Invalid response エラーが発行されることがあります。このエラーは、ゲストドメインを作成して ldm bind コマンドを実行する前に、primary ドメインにすべてのリソースがある場合に発生することがあります。
回避方法: primary ドメインから一部のメモリーを削除してから、ldm bind コマンドを実行してください。
バグ ID 20257979: 物理機能から仮想機能を作成する方法の 1 つは、物理機能を所有するルートドメインを遅延再構成内に配置することです。遅延再構成中に、ldm create-vf コマンドを使用して 1 つまたは複数の仮想機能を作成できます。
通常は、ldm list-io コマンドで、物理機能とその子の仮想機能がクリーンな状態であることが示されます。ただし、ルートドメインがリブートされる前に ldmd サービスが再起動された場合、または遅延再構成が取り消された場合は、物理機能とその仮想機能に INV 状態というマークが付けられます。
同じ問題が、遅延再構成中に仮想機能が破棄された場合に発生します。仮想機能を破棄し、Logical Domains Manager を再起動してから、ldm list-io を実行すると、出力にそのルートドメインの物理機能が表示されません。
回避方法: 次のいずれかを実行してください。
遅延再構成を取り消します。
ldm list-io コマンドを次に実行したときは、物理機能とその既存の仮想機能のすべてが有効な状態になります。
遅延再構成中だったルートドメインをリブートします。
ルートドメインが遅延再構成中に実行した変更は、ゲストドメインの OS 内に存在することに留意してください。
バグ ID 20187197: パワーキャッピングが有効になっている場合は、最低の電力状態を設定できないことがあります。電力状態は低下しても、最低の状態ではありませんでした。この問題が発生した場合は、最高の電力状態の原因となる高い電力の制限を設定したあとに、最高の電力状態が再開された可能性があります。
この状況は、システムの最小の電力制限に近い新しいパワーキャップ制限を設定した場合、または実際の電力 (パワーキャップされていないとき) と新しい制限の差異によって最低の電力状態が使用される場合に発生します。
回避方法: 次のいずれかの手順を実行します。
パワーキャップを無効にする
システムの最小の電力制限に対して大きくない、または近いパワーキャップ制限を設定する
バグ ID 20004281: primary ドメインの電源を再投入したときに、I/O ドメイン上の ixgbevf ノードが、ipadm コマンドでは無効になっていると報告され、ifconfig コマンドでは存在しないと報告されることがあります。
回避方法: IP インタフェースを再度有効にします。
# svcadm restart network/physical:default
バグ ID 19943809: カードが直接 I/O 機能を使用して割り当てられている場合、hxge ドライバはI/O ドメイン内のインタフェースを使用できません。
システムログファイルに次の警告が発行されます。
WARNING: hxge0 : <== hxge_setup_mutexes: failed 0x1
回避方法: /etc/system に次の行を追加し、リブートします。
set px:px_force_intx_support=1
バグ ID 19932842: 次のコマンドのいずれかが完了する前に eeprom または OBP コマンドを使用した場合、ゲストドメインから OBP 変数を設定しようとすると失敗することがあります。
ldm add-spconfig
ldm remove-spconfig
ldm set-spconfig
ldm bind
この問題は、これらのコマンドの完了に 15 秒を超える時間がかかる場合に発生する可能性があります。
# /usr/sbin/eeprom boot-file\=-k promif_ldom_setprop: promif_ldom_setprop: ds response timeout eeprom: OPROMSETOPT: Invalid argument boot-file: invalid property
回復方法: ldm 操作の完了後に eeprom または OBP コマンドを再試行してください。
回避方法: 影響を受けるゲストドメインで eeprom または OBP コマンドを再試行してください。この問題は primary ドメインで ldm set-var コマンドを使用することで回避できる場合があります。
バグ ID 19449221: 1 つのドメインは 999 未満の仮想ネットワークデバイス (vnet) で構成できます。
回避方法: ドメイン上の vnet の数を 999 に制限してください。
バグ ID 19078763: Oracle VM Server for SPARC は解放された MAC アドレスを追跡しなくなりました。MAC アドレスは、アドレスをランダムに選択してから、アドレスがローカルネットワーク上の論理ドメインで使用されていないことを確認することで割り当てられるようになりました。
バグ ID 18083904: Sun Storage 16 Gb Fibre Channel Universal HBA、Emulex 用のファームウェアが帯域幅制御の設定をサポートしていません。この HBA ファームウェアは、bw-percent プロパティーに指定したすべての値を無視します。
回避方法: ありません。
バグ ID 18001028: ルートドメインで、ファイバチャネル仮想機能の Oracle Solaris デバイスパスが正しくありません。
たとえば、パス名が pci@380/pci@1/pci@0/pci@6/SUNW,emlxs@0,2 であるべきところを、間違って pci@380/pci@1/pci@0/pci@6/fibre-channel@0,2 になっています。
ldm list-io -l 出力には、ファイバチャネル仮想機能の正しいデバイスパスが表示されます。
回避方法: ありません。
バグ ID 17576087: 障害のあるメモリーの交換後に、保存された構成でシステムの電源を再投入しても、メモリーが復元されない可能性があります。
回避方法: 障害のあるメモリーを交換したら、factory-default 構成でシステムの電源を再投入します。次に、使用する構成でシステムの電源を再投入します。
ゲストドメインの SR-IOV NIC 仮想機能または仮想ネットワークデバイスで、DLMP アグリゲーションを構成できません。
バグ ID 17422973: 少なくともバージョン 8.4.0 のシステムファームウェアが実行されている SPARC T4 サーバー、少なくともバージョン 9.1.0 のシステムファームウェアが実行されている SPARC T5、SPARC M5、または SPARC M6 サーバー、および少なくとも XCP バージョン 2230 が実行されている Fujitsu M10 サーバー で、単一スライスのディスクへの Oracle Solaris 11.1 OS のインストールが次のエラーを表示して失敗することがあります。
cannot label 'c1d0': try using fdisk(1M) and then provide a specific slice Unable to build pool from specified devices: invalid vdev configuration
回避方法: ディスクに SMI ラベルを付け直します。
バグ ID 17051532: PCIe デバイスまたは仮想機能がゲストドメインから削除されたときに、自動保存構成が更新されません。この問題により、自動保存復旧を実行したあと (つまり autorecovery_policy=3 のとき) に、そのデバイスまたは仮想機能がゲストドメインに再表示される可能性があります。また、自動保存を更新させる別の ldm コマンドを実行しない場合は、この問題によって ldm add-spconfig -r コマンドが失敗して「Autosave configuration config-name is invalid」というメッセージが表示されることもあります。
回避方法: 次のいずれかを実行してください。
PCIe デバイスまたは仮想機能を削除したあとで、新しい構成を保存します。
primary# ldm add-config new-config-name
PCIe デバイスまたは仮想機能の削除後に、保存された構成を削除してから再作成することで、構成をリフレッシュします。
primary# ldm rm-config config-name primary# ldm add-config config-name
このバグによって ldm add-config -r config-name コマンドが正しく機能できないことに注意してください。
自動保存の更新を発生させる別の ldm コマンド (ldm set-vcpu、ldm bind、ldm unbind など) を実行します。
バグ ID 17020950: ファームウェアバージョン 8.3 を使用してバインドされたアクティブなドメインを SPARC T4 プラットフォームから SPARC T5、SPARC M5、または SPARC M6 プラットフォームに移行したあとで、メモリー動的再構成を実行すると、ゲストドメインでパニックが発生する可能性があります。
回避方法: 移行を実行する前に、SPARC T4 システムをバージョン 8.4 のシステムファームウェアで更新します。次に、そのドメインを再バインドします。
バグ ID 17020481: primary ドメインのリブート後にゲストドメインが移行状態 (t) になります。この問題は、システム上に多数の仮想機能が構成されている場合に発生します。
回避方法: この問題を回避するには、OBP のディスクブートコマンドを数回再試行して、ネットワークからブートしないようにします。
各ドメインで次の手順を実行します。
ドメインのコンソールにアクセスします。
primary# telnet localhost 5000
boot-device プロパティーを設定します。
ok> setenv boot-device disk disk disk disk disk disk disk disk disk disk net
boot-device プロパティーの値として指定する disk エントリの数は、システム上に構成されている仮想機能の数によって異なります。小規模なシステムでは、プロパティー値に含める disk インスタンスを少なくできる可能性があります。
printenv を使用して boot-device プロパティーが正しく設定されていることを確認します。
ok> printenv
primary ドメインのコンソールに戻ります。
システム上のドメインごとに、手順 1-4 を繰り返します。
primary ドメインをリブートします。
primary# shutdown -i6 -g0 -y
バグ ID 16713362: 復旧操作中に primary 以外のルートドメインから PCIe スロットを現時点で削除することはできません。PCIe スロットは、primary 以外のルートドメインに割り当てられたままです。
回避方法: PCIe スロットを primary 以外のルートドメインから手動で削除し、復旧操作が完了したあとで適切な I/O ドメインに割り当てる必要があります。
PCIe スロットを primary 以外のルートドメインから削除する方法については、Oracle VM Server for SPARC 3.2 管理ガイド のprimary 以外のルートドメインの概要を参照してください。
primary 以外のルートドメインに所有されている PCIe スロットを使用する I/O ドメインの修復は、I/O ドメインの構成によって異なります。
I/O ドメインが PCIe スロットのみを使用し、使用できる PCIe スロットが 1 つもない場合、I/O ドメインは修復されず、バインド解除された状態のまま残され、PCIe スロットは退避済みとしてマークされます。
I/O ドメインが SR-IOV 仮想機能と PCIe スロットを使用する場合、そのドメインは修復され、使用できない PCIe スロットは退避済みとしてマークされます。
PCIe スロットを primary 以外のルートドメインから手動で削除したあとに、それらの PCIe スロットを I/O ドメインに追加するには、ldm add-io コマンドを使用します。
バグ ID 16617981: ldm list の出力に、物理 I/O デバイスの evacuated プロパティーが表示されません。
回避方法: いずれかの ldm list コマンドで –p オプションを使用して、物理 I/O デバイスの evacuated プロパティーを表示します。
バグ ID 16486383: この問題は、PCI カードが物理的に存在する /SYS/DCU からコアが割り当てられていないゲストドメインに、PCI デバイスまたはバスを直接割り当てた場合に発生することがあります。ハイパーバイザは、ゲストドメインの代わりに PCI デバイスをリセットするため、各ゲストドメインのリブート時に、PCI デバイスに接続されている DCU 上にコアがあるドメインがパニックを起こす可能性があります。非 DCU ローカルゲストに割り当てられている PCI デバイスが多いほど、パニックの可能性が大きくなります。
回避方法: 次のいずれかを実行してください。
PCI デバイスをゲストドメインに割り当てる場合、カードがコアと同じ DCU に物理的に存在することを確認してください。
柔軟な物理的カードの配置のため、手動でコアを割り当てます。
たとえば、IOU0 上の PCI デバイス (pci_0 から pci_15) の場合、0 から 127 の間のコアを選択し、それをドメインに割り当てます。
# ldm add-core cid=16 domain-name
システムコアを表示するには、次のコマンドを使用します。
# ldm ls-devices -a core
IOU1 上の PCI デバイス (pci_16 から pci_31) の場合は、128 から 255 の間のコアを選択します。IOU2 上の PCI デバイス (pci_32 から pci_47) の場合は、256 から 383 の間のコアを選択します。IOU3 上の PCI デバイス (pci_48 から pci_63) の場合は、384 から 511 の間のコアを選択します。
バグ ID 16299053: PCIe デバイスを無効にすると、予期しない動作が発生することがあります。無効にした PCIe デバイスがまだドメインによって所有されている間に、その PCIe デバイス下にあるサブデバイスが、割り当てられていない名前に戻ります。
回避方法: ILOM 上の PCIe スロットを無効にしようとする場合、PCIe スロットが、直接 I/O (DIO) 機能を使用して、ドメインに割り当てられていないことを確認します。つまり、まず、ILOM 上のスロットを無効にする前に、PCIe スロットが対応するルートドメインに割り当てられていることを確認します。
PCIe スロットが DIO によってドメインに割り当てられている間に、ILOM 上の PCIe スロットを無効にする場合は、正しい動作のために、そのドメインを停止してから、ルートドメインにデバイスを再割り当てします。
バグ ID 16284767: Oracle Solaris コンソール上のこの警告は、I/O デバイスドライバの接続中に、供給された割り込み数が使い果たされたことを示しています。
WARNING: ddi_intr_alloc: cannot fit into interrupt pool
ハードウェアが提供する割り込み数には限りがあるため、Oracle Solaris では各デバイスで使用できる数を制限しています。デフォルトの制限は一般的なシステム構成のニーズに合うように考案されていますが、特定のシステム構成ではこの制限に調整が必要になることがあります。
特に、システムが複数の論理ドメインにパーティション化されている場合や、任意のゲストドメインに割り当てられる I/O デバイスの数が多すぎる場合は、この制限に調整が必要になることがあります。Oracle VM Server for SPARC では、全割り込み数を小さいセットに分けて、ゲストドメインに提供します。1 つのゲストドメインに割り当てられる I/O デバイスの数があまりにも多い場合は、その供給量が少なすぎて、各デバイスにデフォルトの割り込み制限を提供できないことがあります。そのため、すべてのドライバを完全に接続する前にその供給量が使い果たされてしまいます。
ドライバの中には、その割り込み数を Oracle Solaris で自動的に調整できるようにするオプションのコールバックルーチンを提供するものもあります。このようなドライバにはデフォルトの制限が適用されません。
回避方法: ::irmpools および ::irmreqs MDB マクロを使用して、使用される割り込みを調べます。::irmpools マクロは、プールに分けられた割り込みの総供給量を表示します。::irmreqs マクロは、各プールにマップされているデバイスを表示します。デバイスごとに、::irmreqs は、オプションのコールバックルーチンによってデフォルトの制限が強制されるかどうか、各ドライバがリクエストした割り込みの数、および各ドライバに提供される割り込みの数を表示します。
これらのマクロでは、接続に失敗したドライバに関する情報は表示されません。ただし、表示される情報は、デフォルトの制限をどの程度まで調整できるかを予測するのに役立ちます。コールバックルーチンを提供せずに複数の割り込みを使用するデバイスは、デフォルトの制限を調整して、使用する割り込み数を少なくせざるをえない場合があります。そのようなデバイスで使用される量を下回ってデフォルトの制限を減らすと、ほかのデバイスで使用できるように割り込みが解放されます。
デフォルトの制限を調整するには、/etc/system ファイル内の ddi_msix_alloc_limit プロパティーを 1-8 の値に設定します。次に、その変更が反映されるようにシステムをリブートします。
パフォーマンスを最大にするには、開始時に大きな値を割り当て、システムが警告なしで正常にブートするまで、それらの値を少しずつ減らします。::irmpools および ::irmreqs マクロを使用して、接続されているすべてのドライバに対する調整の影響を評価します。
たとえば、ゲストドメインで Oracle Solaris OS のブート中に次の警告が出されるとします。
WARNING: emlxs3: interrupt pool too full. WARNING: ddi_intr_alloc: cannot fit into interrupt pool
::irmpools および ::irmreqs マクロは次の情報を表示します。
# echo "::irmpools" | mdb -k ADDR OWNER TYPE SIZE REQUESTED RESERVED 00000400016be970 px#0 MSI/X 36 36 36 # echo "00000400016be970::irmreqs" | mdb -k ADDR OWNER TYPE CALLBACK NINTRS NREQ NAVAIL 00001000143acaa8 emlxs#0 MSI-X No 32 8 8 00001000170199f8 emlxs#1 MSI-X No 32 8 8 000010001400ca28 emlxs#2 MSI-X No 32 8 8 0000100016151328 igb#3 MSI-X No 10 3 3 0000100019549d30 igb#2 MSI-X No 10 3 3 0000040000e0f878 igb#1 MSI-X No 10 3 3 000010001955a5c8 igb#0 MSI-X No 10 3 3
この例に示されるデフォルトの制限は 1 デバイスにつき 8 回の割り込みですが、これはシステムへの最後の emlxs3 デバイスの接続を受け入れるのに十分な割り込み数ではありません。emlxs のすべてのインスタンスが同じように動作すると考えれば、emlxs3 はおそらく 8 回の割り込みをリクエストしています。
36 回の割り込みの総プールサイズから、すべての igb デバイスで使用された 12 回の割り込みを引くことにより、24 回の割り込みを emlxs デバイスに使用できます。24 回の割り込みを 4 で割ると、1 デバイスにつき 6 回の割り込みによって、すべての emlxs デバイスが同じパフォーマンスで接続できることになります。そのため、次の調整が /etc/system ファイルに追加されます。
set ddi_msix_alloc_limit = 6
システムが警告なしで正常にブートすると、::irmpools および ::irmreqs マクロは次の更新された情報を表示します。
# echo "::irmpools" | mdb -k ADDR OWNER TYPE SIZE REQUESTED RESERVED 00000400018ca868 px#0 MSI/X 36 36 36 # echo "00000400018ca868::irmreqs" | mdb -k ADDR OWNER TYPE CALLBACK NINTRS NREQ NAVAIL 0000100016143218 emlxs#0 MSI-X No 32 8 6 0000100014269920 emlxs#1 MSI-X No 32 8 6 000010001540be30 emlxs#2 MSI-X No 32 8 6 00001000140cbe10 emlxs#3 MSI-X No 32 8 6 00001000141210c0 igb#3 MSI-X No 10 3 3 0000100017549d38 igb#2 MSI-X No 10 3 3 0000040001ceac40 igb#1 MSI-X No 10 3 3 000010001acc3480 igb#0 MSI-X No 10 3 3
バグ ID 16232834: ldm add-vcpu コマンドを使用して、CPU をドメインに割り当てると、Oracle Solaris OS が次のメッセージを表示してパニックを起こすことがあります。
panic[cpu16]/thread=c4012102c860: mpo_cpu_add: Cannot read MD
このパニックは、次の条件が存在する場合に発生します。
ホストに追加の DCU が割り当てられている
ホストが、ホストに割り当てられているすべてのハードウェアを含まない、以前に保存された SP 構成を使用して起動されている
ldm add-vcpu 操作のターゲットドメインはパニックを起こしたドメインです。ドメインは、リブート時に、追加の CPU で回復します。
回避方法: ホストに割り当てられているハードウェアリソースより少ないリソースで生成された構成を使用しないでください。
問題を避けるには、問題の説明に示しているように、CPU を追加しないでください。または、次の手順を実行します。
DCU の追加後に、新しい SP 構成を生成します。
たとえば、次のコマンドは、new-config-more-dcus という構成を作成します。
primary# ldm add-config new-config-more-dcus
ドメインをシャットダウンします。
ホストを停止します。
-> stop /HOST
ホストを起動します。
-> start /HOST
バグ ID 16224353: primary ドメインのリブート後、primary ドメイン内の ixgbevf インスタンスが動作しないことがあります。
回避方法: ありません。
バグ ID 16219069: Oracle Solaris 10 1/13 OS を実行する primary ドメインで、/etc/hostname.vf-interface ファイルに基づいて、仮想機能インタフェースに IP アドレスが自動的に組み込まれず、割り当てられないことがあります。
この問題は、primary ドメインで Oracle Solaris 10 1/13 OS を 実行する SPARC T3、SPARC T4、または SPARC T5 システムをブートまたはリブートした場合に発生します。この問題は、オンボード物理機能とアドイン物理機能の両方で作成された仮想機能に影響します。この問題は、Logical Domains ゲストドメインイメージをブートした場合には発生しません。
バグ ID 16080855: primary ドメインのリブートまたはシャットダウン時に、primary ドメインで、次のようなパニックメッセージを表示して、カーネルのパニックが発生することがあります。
panic[cpu2]/thread=c40043b818a0: mutex_enter: bad mutex, lp=c4005fa01c88 owner=c4005f70aa80 thread=c40043b818a0 000002a1075c3630 ldc:ldc_mem_rdwr_cookie+20 (c4005fa01c80, c4004e2c2000,2a1075c37c8, 6c80000, 1, 0) %l0-3: 00000000001356a4 0000000000136800 0000000000000380 00000000000002ff %l4-7: 00000000001ad3f8 0000000000000004 00000000ffbffb9c 0000c4005fa01c88 000002a1075c3710 vldc:i_vldc_ioctl_write_cookie+a4 (c4004c400030, 380,ffbff898, 100003, 0, 70233400) %l0-3: 0000000006c80000 0000000000156dc8 0000000000000380 0000000000100003 %l4-7: 00000000702337b0 000002a1075c37c8 0000000000040000 0000000000000000 000002a1075c37f0 vldc:vldc_ioctl+1a4 (3101, c4004c400030, ffbff898,c4004c400000, c4004c438030, 0) %l0-3: 0000000000100003 0000000000000000 000000007b340400 0000c4004c438030 %l4-7: 0000c4004c400030 0000000000000000 0000000000000000 0000000000000000 000002a1075c38a0 genunix:fop_ioctl+d0 (c4004d327800, 0, ffbff898, 100003,c4004384f718, 2a1075c3acc) %l0-3: 0000000000003103 0000000000100003 000000000133ce94 0000c4002352a480 %l4-7: 0000000000000000 0000000000000002 00000000000000c0 0000000000000000 000002a1075c3970 genunix:ioctl+16c (3, 3103, ffbff898, 3, 134d50, 0) %l0-3: 0000c40040e00a50 000000000000c6d3 0000000000000003 0000030000002000 %l4-7: 0000000000000003 0000000000000004 0000000000000000 0000000000000000
回復方法: primary ドメインのリブートを許可します。primary ドメインが、クラッシュ後にリブートしないように構成されている場合は、primary ドメインを手動でブートします。
バグ ID 16071170: SPARC M5-32 または SPARC M6-32 システムで、内部 SAS コントローラが、SR-IOV をサポートしていなくても、SR-IOV 対応コントローラとしてエクスポートされます。
これらのカードに物理機能を作成しようとすると、Oracle VM Server for SPARC ログに、次のメッセージが表示されます。
Dec 11 04:27:54 warning: Dropping pf pci@d00/pci@1/pci@0/pci@0/pci@0/pci@4/LSI,sas@0: no IOV capable driver Dec 11 04:27:54 warning: Dropping pf pci@d80/pci@1/pci@0/pci@c/pci@0/pci@4/LSI,sas@0: no IOV capable driver Dec 11 04:27:54 warning: Dropping pf pci@c00/pci@1/pci@0/pci@c/pci@0/pci@4/LSI,sas@0: no IOV capable driver Dec 11 04:27:54 warning: Dropping pf pci@e00/pci@1/pci@0/pci@0/pci@0/pci@4/LSI,sas@0: no IOV capable driver
システムには、SPARC M5-32 および SPARC M6-32 アセンブリの IOU 1 つにつき、4 つの LSI SAS コントローラポートがあります。各ポートでこのエラーが報告されます。
回避方法: このメッセージは無視してかまいません。これらのメッセージは、システムの LSI-SAS コントローラデバイスが SR-IOV に対応できることを示していますが、このハードウェアでは SR-IOV のサポートが可能ではありません。
バグ ID 16068376: 約 128 個のドメインを含む T5-8 で、ldm list などの一部の ldm コマンドに、すべてのドメインの稼働時間として 0 秒が表示されることがあります。
回避方法: ドメインにログインし、uptime コマンドを使用してドメインの稼働時間を調べます。
バグ ID 15962837: チップレベルの障害が発生すると、コアの退避が完了しません。コアの障害があとに続く退避は予想どおりに機能しますが、CMP ノード全体のリタイアを試みるときは、チップレベルの障害は退避を完了しません。
回避方法: ありません。チップレベルの障害を診断したら、チップの交換をスケジュールしてください。
バグ ID 15942036: メモリーの DR 操作を実行してメモリーを 4G バイト未満に減らすと、その操作が永久にハングアップする可能性があります。そのドメインに対して ldm cancel-op memdr コマンドを発行すると、間違ったメッセージが表示されます。
The memory removal operation has completed. You cannot cancel this operation.
そのメッセージにもかかわらず、メモリーの DR 操作はハングアップし、そのゲストドメインに対して他の ldmd 操作を実行できない可能性があります。
回避方法: どのドメインでもメモリーを 4G バイト未満に減らさないようにしてください。すでにこの状態にある場合は、ldm stop -f コマンドを発行するか、ドメインにログインして、それをリブートします。
バグ ID 15826354: きわめて多数の CPU の CPU 動的再構成 (DR) によって ldmd デーモンが失敗を返します。ldmd はタイムアウトしますが、バックグラウンドで DR 処理が続行し、最終的に成功します。それにもかかわらず、ldmd は結果のドメインと連携しなくなり、後続の DR 処理が許可されないことがあります。
例:
# ldm ls NAME STATE FLAGS CONS VCPU MEMORY UTIL NORM UPTIME primary active -n-cv- UART 7 20G 2.7% 0.4% 1h 41m ldg0 active -n---- 5000 761 16G 75% 51% 6m # ldm rm-vcpu 760 ldg0 Request to remove cpu(s) sent, but no valid response received VCPU(s) will remain allocated to the domain, but might not be available to the guest OS Resource removal failed # ldm set-vcpu 1 ldg0 Busy executing earlier command; please try again later. Unable to remove the requested VCPUs from domain ldg0 Resource modification failed # ldm ls NAME STATE FLAGS CONS VCPU MEMORY UTIL NORM UPTIME primary active -n-cv- UART 7 20G 0.9% 0.1% 1h 45m ldg0 active -n---- 5000 761 16G 100% 0.0% 10m
回避方法: 数分間待ってから、ldm set-vcpu コマンドを再度実行します。
# ldm set-vcpu 1 ldg0 # ldm ls NAME STATE FLAGS CONS VCPU MEMORY UTIL NORM UPTIME primary active -n-cv- UART 7 20G 0.9% 0.1% 1h 50m ldg0 active -n---- 5000 1 16G 52% 0.0% 15m
760 は推奨される最大数を超えていることに注意してください。
バグ ID 15825330: プロセッサボードが 1 つのみの一部の SPARC T4-4 構成で、Oracle VM Server for SPARC が起動時にハングアップしたように見えます。
回避方法: 常にプロセッサボードがプロセッサ 0 および 1 用のスロットを占有していることを確認してください。そのような構成でシステムを再起動すると、Oracle VM Server for SPARC ソフトウェアを起動できるようになります。
バグ ID 15821246: Oracle Solaris 11.1 OS が実行されているシステムで、移行されたドメインに対する threading プロパティーの値を max-ipc から max-throughput に変更すると、ゲストドメインでパニックが発生することがあります。
回避方法: 移行されたゲストドメインがリブートするまで、そのゲストドメインの threading ステータスは変更しないでください。
バグ ID 15820741: 直接 I/O が構成されている 2 つのドメインを持つ Oracle Solaris 11.1 システムでは、制御ドメインのリブート時にハングアップすることがあります。
回復方法: リブート時のハングアップから回復するには、SP で次のコマンドを発行して制御ドメインをリセットします。
-> reset -f /HOST/domain/control
バグ ID 15812823: 空きメモリーが少ない状況では、サイズが原因で、必ずしもすべてのメモリーブロックがメモリーの DR 操作の一部として使用されないことがあります。ただし、このようなメモリーブロックは空きメモリー量に含まれます。こうした状況では、予想よりも少ない量のメモリーがドメインに追加される可能性があります。この状況が発生しても、エラーメッセージは表示されません。
回避方法: ありません。
バグ ID 15783851: 仮想機能の制約を間違って表している XML ファイルから構成を再作成するしようとすると、問題が発生することがあります。
この問題は、ldm list-constraints -x コマンドを使用して、PCIe 仮想機能が割り当てられたドメインの構成を保存した場合に発生します。
ldm add-domain -i コマンドを使用してあとでドメインを再作成すると、元の仮想機能が存在しないため、ドメインのバインドの試行が失敗し、次のエラーメッセージが表示されます。
No free matching PCIe device...
ldm add-domain コマンドによって仮想機能が PCIe デバイスとして誤って分類されているため、欠落している仮想機能を作成しても、ドメインのバインドの別の試行が失敗し、同じエラーメッセージが表示されます。
回避方法: 次の手順を実行します。
ldm list-io コマンドを使用して、仮想機能に関する情報を保存します。
ldm rm-dom コマンドを使用して、影響を受けた各ドメインを破棄します。
ldm create-vf コマンドを使用して、必要なすべての仮想機能を作成します。
ldm コマンドを使用してドメインを再構築します。
ldm add-io コマンドを使用して各仮想機能を追加すると、仮想機能デバイスとして正しく分類されるため、ドメインをバインドできます。
仮想機能を使用するドメイン構成の再構築については、ldm init-system コマンドで、物理的な I/O 変更が行われたドメイン構成が正しく復元されないことがあるを参照してください。
バグ ID 15783608: 制御ドメインを、物理的に制約されたコアの使用から制約のない CPU リソースの使用に変更すると、次の無関係なメッセージが表示されることがあります。
Whole-core partitioning has been removed from domain primary,because dynamic reconfiguration has failed and the domain is now configured with a partial CPU core.
回避方法: このメッセージは無視できます。
バグ ID 15783031: ldm init-system コマンドを使用して、直接 I/O または SR-IOV 操作を使用したドメイン構成を復元すると、問題が発生することがあります。
問題が発生するのは、復元される構成で次の操作が 1 つ以上実行された場合です。
primary ドメインによってまだ所有されているバスからスロットが取り外されました。
primary ドメインによって所有されている物理機能から仮想機能が作成されました。
仮想機能が primary ドメインまたはほかのゲストドメイン、あるいはその両方に割り当てられました。
ルートコンプレックスが primary ドメインから削除され、ゲストドメインに割り当てられました。そのルートコンプレックスは、このあとの I/O 仮想化操作の基礎として使用されます。
つまり、primary 以外のルートドメインを作成し、以前の操作をすべて実行しました。
システムが、以前のアクションが 1 つも行われていない状態のままであるようにするには、ldm init-system コマンドを使用して、物理的な I/O 変更が行われたドメインを復元する方法を参照してください。
バグ ID 15782994: 多数のドメインの構成に影響を与える操作を試みると、Logical Domains Manager がクラッシュして再起動する場合があります。この問題は、仮想ネットワーク構成に関連した何らかの設定を変更しようとした場合、および同じ仮想スイッチ内の多数の仮想ネットワークデバイスが多数のドメインにわたって存在する場合に発生することがあります。この問題は通常、同じ仮想スイッチに接続された仮想ネットワークデバイスを含むドメインが約 90 以上存在し、かつ inter-vnet-link プロパティーが有効になっている (デフォルトの動作) 場合に発生します。この現象は、ldmd ログファイルや、/var/opt/SUNWldm ディレクトリ内の core ファイルにある次のメッセージを見つけることによって確認します。
Frag alloc for 'domain-name'/MD memory of size 0x80000 failed
回避方法: 同じ仮想スイッチに接続された多数の仮想ネットワークデバイスを作成することを避けてください。そのような作成を意図的に行う場合は、仮想スイッチ上で inter-vnet-link プロパティーを off に設定します。このオプションによって、ゲストドメイン間のネットワークパフォーマンスに悪影響が発生する可能性があることに注意してください。
バグ ID 15778392: 制御ドメインには、システム内の最小番号コアが必要です。そのため、コア ID 0 が最小番号コアである場合、制御ドメインにコア全体の制約を適用しようとすると、そのコアをほかのどのドメインとも共有することができません。
たとえば、システム内の最小番号コアがコア ID 0 である場合、制御ドメインは次の出力のようになるはずです。
# ldm ls -o cpu primary NAME primary VCPU VID PID CID UTIL STRAND 0 0 0 0.4% 100% 1 1 0 0.2% 100% 2 2 0 0.1% 100% 3 3 0 0.2% 100% 4 4 0 0.3% 100% 5 5 0 0.2% 100% 6 6 0 0.1% 100% 7 7 0 0.1% 100%
バグ ID 15775668: 高い優先順位ポリシーを持つドメインは、より低い優先順位ポリシーを持つドメインから仮想 CPU リソースを横取りできます。この「横取り」処理の進行中、ldmd ログに 10 秒ごとに次の警告メッセージが表示されることがあります。
warning: Unable to unconfigure CPUs out of guest domain-name
回避方法: これらの誤解を招くようなメッセージは無視できます。
バグ ID 15775637: I/O ドメインには、ルートコンプレックスあたりに使用できる割り込みリソースの数に関する制限があります。
SPARC T3 および SPARC T4 システムでは、この制限は約 63 MSI/X ベクトルです。各 igb 仮想機能は、3 つの割り込みを使用します。ixgbe 仮想機能は、2 つの割り込みを使用します。
あるドメインに多数の仮想機能を割り当てると、そのドメインの、これらのデバイスをサポートするためのシステムリソースが不足します。次のようなメッセージが表示されることがあります。
WARNING: ixgbevf32: interrupt pool too full. WARNING: ddi_intr_alloc: cannot fit into interrupt pool
バグ ID 15771384: ドメインのゲストコンソールが、そのバインド前やバインド中にそのコンソールへの接続が繰り返し試みられた場合に休止することがあります。たとえば、ドメインがそのマシン上に移行されているときに、自動スクリプトを使用してそのコンソールをグラブする場合にこれが発生する可能性があります。
回避方法: コンソールの休止を解除するには、ドメインのコンソール端末集配信装置をホストするドメイン (通常は制御ドメイン) で次のコマンドを実行します。
primary# svcadm disable vntsd primary# svcadm enable vntsd
バグ ID 15765858: すべての仮想機能を破棄してスロットをルートドメインに戻しても、ルートコンプレックスのリソースが回復されません。
回避方法: 特定の PCIe バスに対する iov オプションを off に設定してください。
primary# ldm start-reconf primary primary# ldm set-io iov=off pci_0
バグ ID 15761509: このサポートドキュメントに記載された、直接 I/O (DIO) 機能をサポートする PCIe カードのみを使用してください。
回避方法: ldm add-io コマンドを使用して primary ドメインにカードをふたたび追加します。
バグ ID 15759601: ldm start コマンドの直後に ldm stop コマンドを発行すると、ldm stop コマンドが次のエラーで失敗する可能性があります。
LDom domain-name stop notification failed
回避方法: ldm stop コマンドをもう一度発行します。
バグ ID 15758883: ldm init-system コマンドを使用しても、保存した XML ファイルからゲストドメインに対する名前付き CPU コアの制約を復元できません。
回避方法: 次の手順を実行します。
primary ドメイン用の XML ファイルを作成します。
# ldm ls-constraints -x primary > primary.xml
ゲストドメイン (複数可) 用の XML ファイルを作成します。
# ldm ls-constraints -x domain-name[,domain-name][,...] > guest.xml
システムの電源を再投入し、出荷時のデフォルト構成でブートします。
XML 構成を primary ドメインに適用します。
# ldm init-system -r -i primary.xml
XML 構成をゲストドメイン (複数可) に適用します。
# ldm init-system -f -i guest.xml
バグ ID 15750727: 非常に多数の仮想機能が割り当てられた primary ドメインをリブートすると、システムでパニックが発生することがあります。
回避方法: 次のいずれかを実行してください。
仮想機能の数を減らすことで、失敗する仮想機能の数を減らします。この変更によってチップの応答性を維持できる可能性があります。
システムのすべての ixgbe 仮想機能に対して割り込みリソース管理 (IRM) プールがデフォルトで 1 つしか作成されないため、ixgbe 仮想機能用の IRM プールをより多く作成します。
バグ ID 15748348: primary ドメインが別のドメインと最小番号の物理コア (通常は 0) を共有している場合、primary ドメインでコア全体の制約を設定する試みが失敗します。
回避方法: 次の手順を実行します。
ドメインで共有されている、最小番号のバインドされたコアを判定します。
# ldm list -o cpu
primary ドメイン以外のすべてのドメインで、最小番号コアのすべての CPU スレッドのバインドを解除します。
結果として、最小番号コアの CPU スレッドは共有されず、primary ドメインに自由にバインドできるようになります。
次のいずれかを実行して、コア全体の制約を設定します。
CPU スレッドを primary ドメインにバインドし、ldm set-vcpu -c コマンドを使用してコア全体の制約を設定します。
ldm set-core コマンドを使用して、CPU スレッドのバインドとコア全体の制約の設定を一度に行います。
バグ ID 15738561: primary ドメインがブートされた直後に ldm list-io コマンドを実行すると、PCIe スロットや SR-IOV 仮想機能で UNK または INV 状態が表示される可能性があります。この問題の原因は、Oracle Solaris OS からの Logical Domains エージェント応答の遅延にあります。
この問題は、いくつかのシステムでのみ報告されています。
回避方法: Logical Domains エージェントから情報が受信されると、PCIe スロットや仮想機能のステータスが自動的に更新されます。
次のバグは、ドメインから多数の CPU を削除する際に発生する可能性のある障害について説明しています。
制御ドメイン。
バグ ID 15677358: 100 を超える CPU を制御ドメイン (primary ドメインとも呼ばれる) から削除する場合は、動的再構成ではなく遅延再構成を使用します。次の手順を実行します。
ldm start-reconf primary コマンドを使用して、制御ドメインを遅延再構成モードにします。
必要な数の CPU リソースを削除します。
CPU リソースの削除中に何らかの間違いをおかした場合は、制御ドメインがまだ遅延構成状態になっている間に CPU を削除する別のリクエストを試みないでください。そうした場合、コマンドが失敗します (Oracle VM Server for SPARC 3.2 管理ガイド の遅延再構成中に実行を許可される CPU 構成操作は 1 つだけであるを参照)。代わりに、ldm cancel-reconf コマンドを使用して遅延構成処理を取り消し、最初からやり直します。
制御ドメインをリブートします。
ゲストドメイン。
バグ ID 15726205: ゲストドメインから多数の CPU を削除しようとすると、次のエラーメッセージが表示される可能性があります。
Request to remove cpu(s) sent, but no valid response received VCPU(s) will remain allocated to the domain, but might not be available to the guest OS Resource modification failed
回避方法: ゲストドメインから 100 個を超える CPU を削除する場合、事前にドメインを停止します。
バグ ID 15721872: ldm rm-io コマンドを使用して PCIe エンドポイントデバイスを primary ドメインから削除したあとで、Oracle Solaris のホットプラグ操作を使用してそのデバイスをホットリムーブすることができません。PCIe エンドポイントデバイスの置換や削除を行う方法については、Oracle VM Server for SPARC 3.2 管理ガイド のPCIe ハードウェアの変更を参照してください。
バグ ID 15707426: システムログサービス svc:/system/system-log が起動に失敗してオンラインにならない場合、Logical Domains エージェントサービスもオンラインになりません。Logical Domains エージェントサービスがオンラインではない場合、virtinfo、ldm add-vsw、ldm add-vdsdev、ldm list-io commands の各コマンドが予想したとおりに動作しない場合があります。
回避方法: svc:/ldoms/agents:default サービスが有効化され、オンラインになっていることを確認します。
# svcs -l svc:/ldoms/agents:default
svc:/ldoms/agents:default サービスがオフラインの場合は、サービスが有効化されていることと、依存するすべてのサービスがオンラインであることを確認します。
バグ ID 15702475: CPU の数が大幅に削減されたあとにロードされたドメインの DRM ポリシーの期限が切れると、Oracle VM Server for SPARC ログに No response メッセージが表示されることがあります。ldm list 出力には、psrinfo 出力に示されている数よりも多くの CPU リソースがドメインに割り当てられていることが示されています。
回避方法: ldm set-vcpu コマンドを使用して、ドメイン上の CPU の数を psrinfo 出力に示されている数にリセットします。
バグ ID 15701258: 100 を超える仮想 CPU といくつかの暗号化装置を持つゲストドメインで ldm set-vcpu 1 コマンドを実行すると、仮想 CPU の削除に失敗します。仮想 CPU は DR タイムアウトエラーが原因で削除されません。暗号化装置は正常に削除されます。
回避方法: ldm rm-vcpu コマンドを使用して、ゲストドメインから仮想 CPU を 1 つを残してすべて削除します。1 回につき 100 を超える仮想 CPU を削除しないでください。
バグ ID 15668881: pkgadd コマンドを使用して、Sun ZFS ストレージアプライアンスから NFS 経由でエクスポートされたディレクトリから SUNWldm.v パッケージをインストールすると、次のエラーメッセージが表示される場合があります。
cp: failed to set acl entries on /var/svc/manifest/platform/sun4v/ldmd.xml
回避方法: このメッセージは無視してください。
バグ ID 15668368: SPARC T3-1 システムには、デュアルポートディスクをインストールできます。このディスクには、2 つの異なる直接 I/O デバイスからアクセスできます。この 2 つの直接 I/O デバイスをそれぞれ異なるドメインに割り当てると、ディスクが両方のドメインで使用されることになり、ディスクの実際の使用状態によっては他方のドメインに影響を及ぼすことがあります。
回避方法: 同じディスクセットにアクセスする複数の直接 I/O デバイスを、それぞれ異なる I/O ドメインに割り当てないでください。SPARC T3-1 システムにデュアルポートディスクがあるかどうかを調べるには、次のコマンドを SP で実行します。
-> show /SYS/SASBP
出力の fru_description の値が次のとおりならば、対応するシステムにデュアルポートディスクがあります。
fru_description = BD,SAS2,16DSK,LOUISE
システムにデュアルディスクが存在している場合は、次に示す直接 I/O デバイスが両方とも同じドメインに割り当てられていることを確認します。
pci@400/pci@1/pci@0/pci@4 /SYS/MB/SASHBA0 pci@400/pci@2/pci@0/pci@4 /SYS/MB/SASHBA1
バグ ID 15667770: 1 つのドメインで複数の NIU nxge インスタンスが plumb されていると、ドメインからメモリーを削除する場合に使用する ldm rm-mem および ldm set-mem コマンドが、いつまでも完了しない可能性があります。メモリー削除処理中に問題が発生したかどうかを確認するには、ldm list -o status コマンドで処理の進行状況をモニターします。完了率が変わらない状態が何分間も続いているときは、この問題が発生している可能性があります。
回避方法: ldm rm-mem または ldm set-mem コマンドを取り消し、十分な量のメモリーが削除されたかどうかをチェックします。削除されていない場合は、もう一度メモリー削除コマンドを実行するときに削除するメモリーの量を小さくすると、正常に完了する可能性があります。
この問題が primary ドメインで発生した場合は、次を行なってください。
primary ドメインで遅延再構成処理を開始します。
# ldm start-reconf primary
必要な量のメモリーをこのドメインに割り当てます。
primary ドメインをリブートします。
この問題がその他のドメインで発生した場合は、そのドメインを停止してから、ドメインに割り当てるメモリー量を調節します。
バグ ID 15664666: リセット依存関係が作成されているときに、ldm stop -a コマンドを実行すると、リセット依存関係にあるドメインが単に停止するのではなく、再起動されることがあります。
回避方法: まず、ldm stop コマンドをマスタードメインに発行します。次に、ldm stop コマンドをスレーブドメインに発行します。スレーブドメインの初回の停止に失敗した場合は、ldm stop -f コマンドをスレーブドメインに対して実行します。
バグ ID 15655199: 使用中の MAC アドレスが検出されず、誤ってふたたび割り当てられることがあります。
回避方法: 使用中の MAC アドレスをふたたび割り当てることができないように手動で確認してください。
バグ ID 15654965: ldmconfig スクリプトが、格納されたドメイン構成をサービスプロセッサ (Service Processor、SP) 上に正しく作成できません。
回避方法: ldmconfig スクリプトが完了してドメインがリブートしたあと、システムの電源を再投入しないでください。代わりに、次の手順を手動で実行してください。
SP に構成を追加します。
# ldm add-spconfig new-config-name
primary-with-clients 構成を SP から削除します。
# ldm rm-spconfig primary-with-clients
システムの電源を再投入します。
システムの電源を再投入する前にこれらの手順を実行しなかった場合、primary-with-client 構成の存在により、ドメインが非アクティブになります。この場合、各ドメインを手動でバインドしてから、ldm start -a コマンドを実行してそれらのドメインを起動する必要があります。ゲストのブート後にこの処理を繰り返すと、電源の再投入後にゲストドメインが自動的にブートするようになります。
バグ ID 15631119: 制御ドメインの仮想ネットワークデバイスの最大伝送単位 (Maximum Transmission Unit、MTU) を変更すると、遅延再構成処理が起動されます。そのあとで遅延再構成をキャンセルしても、デバイスの MTU 値は元の値に復元されません。
回復方法: ldm set-vnet コマンドを再実行して MTU を元の値に設定します。MTU の設定を変更すると、制御ドメインが遅延再構成モードになりますが、このモードをキャンセルする必要があります。これで、MTU 値は元の正しい MTU 値になります。
# ldm set-vnet mtu=orig-value vnet1 primary # ldm cancel-op reconf primary
バグ ID 15600969: 動作中のドメインからすべてのハードウェア暗号化装置を動的に削除すると、暗号化フレームワークがソフトウェア暗号化プロバイダへのシームレスな切り替えに失敗し、すべての ssh 接続が強制終了します。
回復方法: ドメインからすべての暗号化装置を削除したあと、ssh 接続を再確立します。
回避方法: サーバー側の /etc/ssh/sshd_config ファイルに UseOpenSSLEngine=no を設定し、svcadm restart ssh コマンドを実行します。
ssh 接続にはハードウェア暗号化装置が使用されなくなるので、パフォーマンスの向上というメリットはなくなりますが、暗号化装置が削除されても ssh 接続は切断されません。
バグ ID 15597025: PCI Express Dual 10-Gigabit Ethernet Fiber カード (X1027A-Z) が搭載されたシステム上で ldm ls-io -l コマンドを実行すると、次のような出力が表示される場合があります。
primary# ldm ls-io -l ... pci@500/pci@0/pci@c PCIE5 OCC primary network@0 network@0,1 ethernet ethernet
この出力には 4 つのサブデバイスが表示されていますが、この Ethernet カードにはポートが 2 個しかありません。これは、このカードには 4 つの PCI 機能があるために発生します。4 つの機能のうち 2 つは内部で無効になっており、ldm ls-io -l 出力では ethernet として表示されます。
回避方法: ldm ls-io -l 出力の ethernet エントリは無視してかまいません。
バグ ID 15572184: いくつかのドメインがブート中だと ldm コマンドの応答が遅くなることがあります。この段階で ldm コマンドを実行すると、コマンドがハングアップしているように見える可能性があります。ldm コマンドは、期待されるタスクを実行したあとでリターンします。コマンドがリターンしたら、システムは通常どおり ldm コマンドに応答するはずです。
回避方法: 多数のドメインを同時にブートしないようにします。ただし、いくつかのドメインを同時にブートする必要がある場合、システムが通常の状態に戻るまで新しい ldm コマンドを実行しないようにします。たとえば、Sun SPARC Enterprise T5140 および T5240 サーバーでは約 2 分間、Sun SPARC Enterprise T5440 サーバーまたは Sun Netra T5440 サーバーでは約 4 分間待機します。
バグ ID 15560811: Oracle Solaris 11 では、Logical Domains 仮想ネットワークデバイスのみを含むドメインで、自動ネットワークインタフェース (anet) で構成されたゾーンが起動に失敗することがあります。
回避方法 1: 1 つ以上の物理ネットワークデバイスをゲストドメインに割り当てます。物理 NIC をドメインに割り当てるには、PCIe バス割り当て、直接 I/O (DIO)、または SR-IOV 機能を使用します。
回避方法 2: ゾーンの構成要件が、ゾーン間通信をドメイン内でのみ行わせることである場合、etherstub デバイスを作成します。ゾーン構成内で etherstub デバイスを「下位リンク」として使用し、etherstub デバイス上で仮想 NIC が作成されるようにします。
回避方法 3: 排他的リンク割り当てを使用して、Logical Domains 仮想ネットワークデバイスをゾーンに割り当てます。仮想ネットワークデバイスを必要に応じてドメインに割り当てます。多数の仮想ネットワークデバイスを作成できるように、inter-vnet リンクを無効にすることを選択することもできます。
バグ ID 15560201: 仮想ネットワークまたは仮想ディスクデバイスをドメインに追加したあと、ifconfig でデバイスが存在しないと表示されることがあります。この状態は、/devices エントリが作成されていないために発生することがあります。
この問題は通常操作時には発生しませんが、仮想ネットワークデバイスのインスタンス番号が /etc/path_to_inst ファイルに示されているインスタンス番号と一致しない場合にこのエラーが発生することがあります。
例:
# ifconfig vnet0 plumb ifconfig: plumb: vnet0: no such interface
仮想デバイスのインスタンス番号は、ldm list の出力内の「DEVICE」列の下に表示されます。
# ldm list -o network primary NAME primary MAC 00:14:4f:86:6a:64 VSW NAME MAC NET-DEV DEVICE DEFAULT-VLAN-ID PVID VID MTU MODE primary-vsw0 00:14:4f:f9:86:f3 nxge0 switch@0 1 1 1500 NETWORK NAME SERVICE DEVICE MAC MODE PVID VID MTU vnet1 primary-vsw0@primary network@0 00:14:4f:f8:76:6d 1 1500
このインスタンス番号 (ここに示す vnet および vsw の場合は両方とも 0) と path_to_inst ファイルのインスタンス番号が確実に一致するように、両方の番号を比較できます。
# egrep '(vnet|vsw)' /etc/path_to_inst "/virtual-devices@100/channel-devices@200/virtual-network-switch@0" 0 "vsw" "/virtual-devices@100/channel-devices@200/network@0" 0 "vnet"
回避方法: インスタンス番号が一致していない場合、その仮想ネットワークまたは仮想スイッチデバイスを削除します。次に、id プロパティーを設定することで必要なインスタンス番号を明示的に指定し、それらをふたたび追加します。
/etc/path_to_inst ファイルを手動で編集することもできます。path_to_inst(4) のマニュアルページを参照してください。
注意 - /etc/path_to_inst への変更を安易に行わないようにしてください。 |
バグ ID 15555509: システムに Logical Domains が構成されている場合に別の XAUI ネットワークカードを追加すると、マシンの電源を再投入してもそのカードは表示されません。
回復方法: 新しく追加した XAUI が制御ドメインに表示されるようにするには、次の手順を実行します。
制御ドメインにダミー変数を設定し、クリアーします。
次のコマンドでは、fix-xaui というダミー変数を使用しています。
# ldm set-var fix-xaui=yes primary # ldm rm-var fix-xaui primary
変更した構成を SP に保存し、現在の構成を置き換えます。
次のコマンドでは構成名 config1 を使用しています。
# ldm rm-spconfig config1 # ldm add-spconfig config1
制御ドメインの再構成リブートを実行します。
# reboot -- -r
この時点で、新しく使用可能になったネットワークを Logical Domains 用に構成できます。
バグ ID 15543982: Sun Fire T5240 などのシステムでは、専用 PCI-E ルートコンプレックスで最大 2 つのドメインを構成できます。このようなシステムには、2 つの UltraSPARC T2 Plus CPU と 2 つの I/O ルートコンプレックスが装備されています。
pci@500 と pci@400 が、システムの 2 つのルートコンプレックスです。primary ドメインには、少なくとも 1 つのルートコンプレックスが必ず含まれます。2 つ目のドメインは、割り当てまたはバインドされていないルートコンプレックスを使用して構成できます。
pci@400 ファブリック (またはリーフ) には、オンボード e1000g ネットワークカードが備わっています。次の状況では、ドメインでパニックが発生する場合があります。
システムが pci@500 を含む primary ドメインと pci@400 を含む 2 つ目のドメインで構成されている場合
2 つ目のドメインのブートに、pci@400 ファブリック上の e1000g デバイスが使用される
次のネットワークデバイスが primary 以外のドメインに構成されている場合、これらのデバイスを避けてください。
/pci@400/pci@0/pci@c/network@0,1 /pci@400/pci@0/pci@c/network@0
これらの条件に該当する場合、PCI-E の致命的エラーが発生し、そのドメインでパニックが発生します。
このような構成を避けるか、またはこのような構成を使用している場合は、示されているデバイスからブートしないでください。
バグ ID 15518409: マシンにネットワークが構成されていない場合にネットワーク情報サービス (Network Information Service、NIS) クライアントが実行されていると、Logical Domains Manager が起動しません。
回避方法: ネットワークに接続されていないマシン上の NIS クライアントを無効にします。
# svcadm disable nis/client
バグ ID 15511551: Logical Domains システムのコマンド行から uadmin 1 0 コマンドを実行すると、それ以降のリセットでシステムが ok プロンプトに戻らない場合があります。この誤った動作は、Logical Domains 変数 auto-reboot? が true に設定されている場合にのみ発生します。auto-reboot? が false に設定されている場合は、期待どおりに動作します。
回避方法: 代わりに次のコマンドを使用します。
uadmin 2 0
または、常に auto-reboot? を false に設定して実行するようにします。
バグ ID 15505014: CPU が 1 つのみでメモリーが大容量の構成では、ドメインの停止またはメモリーのスクラブに 15 分以上かかることがあります。停止の際、ドメインの CPU はそのドメインが所有するすべてのメモリーをスクラブするために使用されます。CPU が 1 つのみでメモリーが 512G バイトのドメインのように不均衡な構成では、スクラブの完了までに非常に長い時間がかかる場合があります。スクラブ時間が長くなると、ドメインの停止に必要な時間も長くなります。
回避方法: 大容量メモリー構成 (100G バイトを超えるもの) では必ず、少なくとも 1 つのコアが存在するようにします。
バグ ID 15469227: SC リセットのあとに、少なくとも Oracle Solaris 10 5/08 OS が動作している制御ドメイン上で scadm コマンドがハングアップすることがあります。SC のリセット後、システムは適切に接続を再確立できません。
回復方法: ホストをリブートして SC との接続を再確立します。
バグ ID 15453968: 共通のコンソールグループを持つシステムで、複数のゲストドメインのネットインストールを同時に実行すると失敗します。
回避方法: それぞれ固有のコンソールグループを持つゲストドメインでのみネットインストールを実行してください。この障害は、ネットインストールを行う複数のドメイン間で共有される、共通のコンソールグループを使用するドメインでのみ発生します。
バグ ID 15422900: 動的ホスト構成プロトコル (Dynamic Host Configuration Protocol、DHCP) を使用している同一ネットワーク上で、ゲストドメインに 5 つ以上の仮想ネットワーク (vnet) を構成すると、ネットワークトラフィックの実行中に、ゲストドメインが最終的に応答しなくなることがあります。
回避方法: インタフェースが 8 個ある場合、ip_ire_min_bucket_cnt と ip_ire_max_bucket_cnt を 32 などの大きな値に設定します。
回復方法: 問題のゲストドメイン (domain-name) 上で、ldm stop-domain domain-name コマンドを発行したあと、ldm start-domain domain-name コマンドを発行します。
バグ ID 15387338: この問題の概要はOracle VM Server for SPARC 3.2 管理ガイド のLogical Domains 変数の永続性で説明していますが、制御ドメインにのみ影響します。
バグ ID 15370442: Logical Domains 環境では、広域ネットワーク (WAN) ブートキーの設定または削除を Oracle Solaris OS 内から、ickey(1M) コマンドを使用して行うことはサポートされていません。ickey 操作はすべて失敗し、次のようなエラーが表示されます。
ickey: setkey: ioctl: I/O error
また、制御ドメイン以外の論理ドメインで OpenBoot ファームウェアを使用して設定された WAN ブートキーは、ドメインをリブートすると記憶されていません。これらのドメインでは、OpenBoot ファームウェアで設定したキーは 1 回の使用にのみ有効です。
バグ ID 15368170: ldm stop-domain コマンドの動作がわかりにくい場合があります。
# ldm stop-domain -f domain-name
ドメインにカーネルモジュールデバッガ kmdb(1) のプロンプトが表示されている場合、ldm stop-domain コマンドが失敗し、次のエラーメッセージが表示されます。
LDom <domain-name> stop notification failed