第 1 章 Oracle VM Server for SPARC 3.1.1.2、3.1.1.1、3.1.1、および 3.1 リリースノート
Oracle VM Server for SPARC 3.1.1.2 保守更新
Oracle VM Server for SPARC 3.1.1.1 保守更新
Oracle VM Server for SPARC 3.1.1.1 保守更新の新機能
Oracle VM Server for SPARC 3.1.1 リリースの新機能
Oracle VM Server for SPARC 3.1 リリースの新機能
Oracle VM Server for SPARC 3.1.1.1 保守更新用の必須の Oracle Solaris OS バージョン
Oracle VM Server for SPARC 3.1.1 用の必須の Oracle Solaris OS バージョン
Oracle VM Server for SPARC 3.1 用の必須の Oracle Solaris OS バージョン
Oracle VM Server for SPARC の最新の機能を有効にするための必須ソフトウェア
PCIe SR-IOV のハードウェアおよびソフトウェア要件
primary 以外のルートドメインのハードウェアおよびソフトウェア要件
Oracle VM Server for SPARC ソフトウェアの場所
Oracle VM Server for SPARC ソフトウェアとともに使用できるソフトウェア
Oracle VM Server for SPARC と相互作用するシステムコントローラソフトウェア
現在の Oracle VM Server for SPARC ソフトウェアへのアップグレード
Oracle VM Server for SPARC 3.1.1.1 ソフトウェアへのアップグレード
Oracle VM Server for SPARC 3.1.1 ソフトウェアへのアップグレード
Oracle VM Server for SPARC 3.1 ソフトウェアへのアップグレード
非推奨となった Oracle VM Server for SPARC 機能
ドメインが相互にサービスを提供し合っている場合にそれらをバインド解除できない
ゲストドメインで CPU の割り当て数が 1024 を超えると Oracle Solaris 10 OS を実行できない
2 つのドメインが相互にサービスを提供し合う構成の作成を避ける
Oracle Solaris 10 5/08 OS より古い Oracle Solaris 10 OS からのアップグレード
サービスプロセッサとシステムコントローラは読み替え可能な用語
特定の条件で、ゲストドメインの Solaris Volume Manager 構成またはメタデバイスが失われることがある
ゲストドメインの Solaris Volume Manager 構成またはメタデバイスの検索方法
Oracle VM Server for SPARC システムの正常な停止と電源の再投入
リクエストされたメモリーサイズが割り当てられたメモリーサイズと異なる場合がある
Oracle Sun SNMP Management Agent は複数ドメインをサポートしない
ldmp2v convert コマンド: ブート中の VxVM 警告メッセージ
ソフトウェアのライセンスに対するオラクルのハードパーティション分割の要件
ldmp2v prepare -R の使用時にアップグレードオプションが提供されない
動的に追加されたメモリーのブロックがブロック全体でしか動的に削除できないことがある
ldmp2v コマンド: ufsdump のアーカイブ方法が使用されなくなった
遅延再構成中に実行を許可される CPU 構成操作は 1 つだけである
1 つのネットワークアダプタに複数の仮想スイッチが割り当てられている場合に Oracle VM Server for SPARC 3.1 の ldmd デーモンが起動しない
仮想 CPU が 1 つしか割り当てられていないドメインで、ライブ移行中にパニックが発生する可能性がある
Oracle VM Server for SPARC MIB の問題
snmptable コマンドがバージョン 2 またはバージョン 3 のオプションで動作しない
SR-IOV 仮想機能がゲストドメインに割り当てられた Oracle Solaris 10 ルートドメインをリブートするときに、まれに不正なトラップパニックが発生する
SR-IOV 仮想機能の破棄後に prtdiag によって Oracle Solaris 10 ルートドメインでパニックが発生することがある
I/O ドメインの停止または起動時に制御ドメインがハングアップする
ファイバチャネル仮想機能の作成時に警告がコンソールに表示される
Fujitsu M10 システムには異なる SR-IOV 機能の制限がある
InfiniBand SR-IOV 操作で誤解を招くようなメッセージが表示される
Oracle VM Server for SPARC ソフトウェアに影響するバグ
Oracle VM Server for SPARC 3.1.1.2 ソフトウェアに影響するバグ
部分的なコアの primary ドメインにコア全体の制約を適用すると、システムがクラッシュする
ゲストドメインの移行後に format コマンドがハングアップしたり、ゲストドメインのコンソールが入力を受け入れなかったりする
カーネルゾーンによってゲストドメインのライブ移行がブロックされる
Oracle VM Server for SPARC 3.1.1.1 ソフトウェアに影響するバグ
仮想スイッチの net-dev がないとき、保守モードの復旧モードが ldmd で失敗する
SPARC M5 または SPARC T5 システムへの移行でパニックが発生して「suspend: get stick freq failed」が表示されることがある
Logical Domains Manager で循環依存関係の作成が禁止されない
Oracle VM Server for SPARC 3.1.1 ソフトウェアに影響するバグ
LDC の数が非常に多いと、ゲストドメインで Oracle Solaris の問題が発生する場合がある
ファイバチャネル物理機能が FMA によって障害検出され、無効になる
仮想ネットワークデバイスが多数存在する場合に仮想ネットワークでの LDC ハンドシェークの問題が発生する
Sun Storage 16 Gb Fibre Channel Universal HBA ファームウェアが帯域幅制御をサポートしていない
CPU 間移行の実行後にメモリーを追加すると、ゲストドメインでパニックが発生することがある
ルートドメインのファイバチャネル仮想機能のデバイスパスが正しくない
バインド中またはバインド解除中の状態にあるドメインのバインドを試みると、ldmd でコアダンプが発生する
Oracle VM Server for SPARC 3.1 ソフトウェアに影響するバグ
FMA が障害のあるメモリーを検出する際に問題が発生することがある
virtual-channel@0:hvctl の作成の遅れから ldmd サービスが起動に失敗する
遅延再構成で CPU を割り当てる前にメモリーを割り当てると、制御ドメインへのアフィニティーが不足する
EFI GPT ディスクラベルを使用して単一スライスの仮想ディスクに Oracle Solaris 11.1 OS をインストールできない
移行後に起動またはリブートしたあとでドメインがブート時にパニックになることがある
事前に割り当てられたマシン記述バッファーのサイズが移行時に使用される
コアの再マップ操作の成功後、ゲストドメインの仮想 CPU をサイズ変更する試みが失敗することがある
Oracle Solaris 10: failure-policy=reset のときに primary のリブートで primary 以外のルートドメインがブート時にハングアップする
仮想ネットワークのハングアップによってドメインの移行が妨げられる
ldmpower の出力にタイムスタンプが含まれていないことがある
mac_do_softlso が LSO パケットを取りこぼす
移行エラー: shutdown-group: 0 が無効です
仮想機能または PCIe デバイスの削除後に自動保存構成が更新されない
ldmp2v convert コマンドのエラーによってアップグレードがループする
システムファームウェア 8.3 が実行されている SPARC T4 システムから SPARC T5、SPARC M5、または SPARC M6 システムへのドメインの移行が誤って許可されている
lgrp_lineage_add(mutex_enter: bad mutex, lp=10351178) 時にゲストドメインがパニックになる
primary ドメインのリブート後にゲストドメインが移行状態になる
仮想ネットワークデバイスドライバが TxDring モードで動作すると、パニックが発生することがまれにある
仮想 CPU が 1 つしか割り当てられていないドメインで、ライブ移行中にパニックが発生する可能性がある
復旧モードでは primary 以外のルートドメインでの PCIe スロットの削除をサポートするべきである
ldm list が物理 I/O デバイスの evacuated プロパティーを表示しない
send_mondo_set: timeout 負荷がかかった後に、ゲストドメインで ldm stop コマンドを使用すると、パニックが発生する
PCIe デバイス下のサブデバイスが割り当てられていない名前に戻る
SPARC M5-32 および SPARC M6-32: panic: mpo_cpu_add: Cannot read MD
SPARC M5-32 および SPARC M6-32: 複数の直接 I/O パス経由でアクセスできるディスクの問題
ixgbevf primary ドメインのリブート時に、SR-IOV ドメイン内のデバイスが無効になることがある
Oracle Solaris 10 1/13 primary ドメインのリブートで、IP アドレスが仮想機能インタフェースに自動的に組み込まれず、割り当てられないことがある
Oracle Solaris 10 のみ: mutex_enter: bad mutex primary ドメインのリブートまたはシャットダウン時のパニック
SPARC M5-32 および SPARC M6-32: LSI-SAS コントローラが SR-IOV によって誤ってエクスポートされる
SPARC T5-8: 稼働時間データに、一部の ldm list コマンドの値が 0 と表示される
SPARC T5-1B システムの primary ドメインで、sxge 仮想機能にジャンボ MTU を設定できない
ldmd は sxge デバイスに mac-addr および alt-mac-addrs プロパティー値を設定できない
SPARC T5-1B システム上の sxge デバイスの ldm list-io -d 出力に 2 つのプロパティーが不足している
メモリーを 4G バイト未満に減らすと、メモリーの DR 操作がハングアップする
きわめて多数の仮想 CPU の CPU DR が失敗したように見える
HIO 仮想ネットワークを持つ cpu-arch=generic が指定されたゲストドメインを移行すると、ドメインが中断されるまでの待機中にタイムアウトする
threading プロパティーの値を max-throughput から max-ipc に変更するとゲストドメインでパニックが発生する
2 つのアクティブな直接 I/O ドメインを持つ制御ドメインをリブートするとハングアップする
メモリーの DR 追加が部分的に成功したときにエラーメッセージが表示されない
ハイブリッド I/O および仮想 I/O ネットワークデバイスのあるゲストドメインのバインド解除または移行時に、primary ドメインまたはゲストドメインでパニックが発生する
PCIe 仮想機能が割り当てられたドメインの XML ファイルからの再作成が失敗する
制御ドメインをコア全体の使用から部分的なコアの使用に変更すると、正しくないエラーメッセージが発行される
ldm init-system コマンドで、物理的な I/O 変更が行われたドメイン構成が正しく復元されないことがある
多数のドメインを同時に変更しようとすると、Logical Domains Manager がクラッシュして再起動する場合がある
ldm list -o コマンドが format の省略形を受け入れなくなった
移行を取り消したあと、ターゲットシステム上で実行されている ldm コマンドが応答しない
一部の Emulex カードが、I/O ドメインに割り当てられると機能しない
SPARC T4 システムへの移行時、cputrack コマンドの実行中にゲストドメインでパニックが発生する
Oracle Solaris 11: DRM の横取りによって Oracle Solaris の DR の失敗および再試行が報告される
CPU 間の移行を使用するゲストドメインが、移行の完了後、ランダムな稼働時間を報告する
Oracle Solaris 10:Intel デュアルポート Ethernet Controller X540 カードでのブート時に ixgbe ドライバによるパニックが発生する可能性がある
SPARC T4 システムでゲストドメインのコンソールがランダムにハングアップする
すべての仮想機能を破棄してスロットをルートドメインに戻しても、ルートコンプレックスリソースが回復されない
PCIe から PCI へのブリッジを備えた PCIe カードの ldm remove-io は、拒否されるべきである
ldm start コマンドの直後に ldm stop コマンドを発行すると、コマンドが失敗する可能性がある
init-system が、保存した XML ファイルからゲストドメインに対する名前付きコアの制約を復元しない
非常に多数の仮想機能が割り当てられた primary ドメインをリブートすると、システムでパニックが発生する
部分的なコアを持つ primary でコア全体の DR 移行が許可されない
ブート後に ldm list-io コマンドで UNK または INV 状態が表示される
SPARC T4-4 システムで非常に大容量のメモリーのドメインを移行すると、ターゲットシステムのドメインでパニックが発生する
Oracle Solaris のホットプラグ操作を使用して PCIe エンドポイントデバイスをホットリムーブできない
ハイブリッド I/O および仮想 I/O の仮想ネットワークデバイスを持つゲストドメインの移行時に、nxge パニックが発生する
移行に含まれる共有 NFS リソースが見つからない場合、すべての ldm コマンドがハングアップする
システムログサービスがオンラインにならない場合、Logical Domains エージェントサービスもオンラインにならない
移行中にカーネルのデッドロックによってマシンがハングアップする
DRM および ldm list 出力に、ゲストドメイン内の実際の仮想 CPU の数とは異なる数が表示される
ターゲットマシン上の非アクティブなマスタードメインに依存するドメインのライブ移行を行うと ldmd で障害が発生し、セグメント例外が生成される
ポリシーが削除された場合やポリシーの期限が切れた場合に、移行されたドメインで DRM が仮想 CPU の数をデフォルトに戻すことができない
システムの MAC アドレスが別の MAC アドレスと重複している場合、移行の失敗理由が報告されない
移行処理を「反対方向」に同時に実行すると、ldm がハングアップすることがある
エラスティックポリシーが設定され、Oracle Solaris 10 8/11 OS を実行しているシステムが、ハングアップすることがある
pkgadd が /var/svc/manifest/platform/sun4v/ldmd.xml での ACL エントリの設定に失敗する
SPARC T3-1: 複数の直接 I/O パス経由でアクセスできるディスクの問題
複数の NIU nxge インスタンスが plumb されているときにメモリー DR 削除処理を実行すると、無限にハングアップして完了しないことがある
マスター - スレーブ関係にあるドメインで ldm stop -a コマンドを実行すると、スレーブに stopping フラグが設定されたままになる
有効なデフォルト DRM ポリシーがあるドメインをマイグレートすると、使用可能な CPU がすべてターゲットドメインに割り当てられる
ldmconfig が SP 上にドメイン構成を作成できない
非協調的 Oracle Solaris ドメイン移行が cpu0 がオフラインの場合にブロックされることがある
仮想ネットワークデバイスの MTU 値の動的再構成が失敗することがある
ターゲット OS が暗号化装置の DR をサポートしていない場合、MAU を持つ移行したドメインに CPU が 1 つしか含まれない
実アドレスメモリーのバインドが失敗したときの移行失敗メッセージがわかりにくい
ドメインからすべての暗号化装置を動的に削除すると、SSH が終了する
ldm list-io -l 出力で PCI Express Dual 10-Gigabit Ethernet Fiber カードに 4 つのサブデバイスが表示される
ディスクの高可用性を実現するために、Logical Domainsの mpgroup を MPxIO ストレージアレイ構成で使用する
いくつかのドメインがブート中の場合、ldm コマンドの応答が遅くなる
Oracle Solaris 11: 自動ネットワークインタフェースで構成されたゾーンの起動に失敗することがある
Oracle Solaris 10: 制御ドメインで仮想ネットワークデバイスが適切に作成されない
Logical Domains が構成されている場合に、新しく追加した NIU/XAUI アダプタがホスト OS に表示されない
e1000g からのブート時に I/O ドメインまたはゲストドメインでパニックが発生する
明示的なコンソールグループおよびポートのバインドが移行されない
ターゲットのvdsdev のバックエンドが異なっていても移行が失敗しない
ターゲットに使用可能なメモリーが十分にある場合でも、移行でメモリーのバインドに失敗することがある
マシンがネットワーク接続されていない場合に NIS クライアントが実行されていると、Logical Domains Manager が起動しない
移行されたドメインが、すでにブートされているにもかかわらず Logical Domains Manager には「移行」状態と表示される
vntsd を再起動しないかぎり、移行したドメインのコンソールに接続できない
Logical Domains システムから uadmin 1 0 コマンドを実行すると、システムが OK プロンプトに戻らないことがある
Logical Domains Manager によるドメインの停止に 15 分以上かかることがある
SC または SP のリセット後、scadm コマンドがハングアップすることがある
共通コンソールグループ内で複数ドメインを同時にネットインストールすると失敗する
DHCP を使用している同一ネットワーク上で、ゲストドメインに構成された仮想ネットワークが多すぎると、ゲストドメインが応答しなくなることがある
Logical Domains Manager の実行中に、eeprom コマンドによって、OpenBoot PROM 変数を変更できない
ldm1M のマニュアルページ: mblock プロパティーの使用制限を記述する
ldm1M のマニュアルページ: ldm list -o status コマンドの説明を改善する
ldm1M のマニュアルページ: ldm add-spconfig -r のみが手動復旧を実行する
Oracle VM Server for SPARC 3.1 管理ガイドのファイバチャネル SR-IOV OS の要件が正しくない
Oracle VM Server for SPARC 3.1.1.2 リリースで解決済みの問題
Oracle VM Server for SPARC 3.1.1.1 リリースで解決済みの問題
Oracle VM Server for SPARC 3.1.1 リリースで解決済みの問題
以降のセクションでは、各バージョンの Oracle VM Server for SPARC 3.1 ソフトウェアの使用時に見つかる可能性のあるバグについて要約します。各セクションでは、そのリリースで見つかったバグの一覧を示します。これらのバグは、Oracle VM Server for SPARC 3.1 リリースのいずれかまたはすべてで見つかる可能性があります。最新のバグを最初に説明します。回避方法および回復手順がある場合は、指定しています。
バグ ID 19456310: 動的再構成を使用して primary ドメインにコア全体の制約を適用しているときに、部分的なコアを削除すると、OS のパニックやシステムの電源再投入が発生します。
コアを別のドメインと共有している場合やコア内の空きストランドのいずれかに障害が発生している場合は、部分的なコアが削除されます。
回避方法: 遅延再構成を使用して、部分的なコアが含まれる primary ドメインにコア全体の制約を適用してください。
primary ドメインにコア全体の制約が含まれていないことを確認します。
primary# ldm list -o resmgmt primary
primary ドメインに部分的なコアが含まれていることを確認します。
primary# ldm list -o core primary
primary ドメインの遅延再構成を開始します。
primary# ldm start-reconf primary
コア全体の制約を適用します。
たとえば、次のコマンドは primary ドメインに 2 つのコア全体を割り当てます。
primary# ldm set-core 2 primary
primary ドメインをリブートします。
システムでシステムファームウェアバージョン 8.5.1.b、9.2.1.b、または 9.2.1.c が実行されている場合は、次のバグが発生する可能性があります。詳細は、「Sun システムファームウェア 8.5.1.b および 9.2.1.B/C が実行されている SPARC T4/T5/M5/M6 シリーズサーバー上で Oracle Virtual Machine (OVM) Server for SPARC のゲストドメインがコンソール入力を受け入れないことがある (Doc ID 1946535.1)」を参照してください。
バグ ID: 19430884 2 つのサービスドメインから 108 台の仮想ディスクで構成されたゲストドメインが移行されます。移行が正常に完了したあとに、ディスクが使用可能かつアクセス可能になった場合でも、format コマンドがハングアップします。
回避方法: システムをリブートします。
バグ ID 19388985: ゲストドメインのコンソールへの接続の試みには成功しましたが、コンソールが入力を受け入れません。この状況は、ゲストドメインの停止と起動、primary ドメインのリブート、およびゲストドメインのバインドと起動の直後に断続的に発生します。
回避方法: ゲストドメインをバインド解除してから再バインドすることは避けてください。
回復方法: ゲストドメインの構成を保存してから、電源再投入を実行してください。
バグ ID 18289196: SPARC システムにおいて、Oracle VM Server for SPARC ドメイン内で実行中のカーネルゾーンによってゲストドメインのライブ移行がブロックされます。次のエラーメッセージが表示されます。
Live migration failed because Kernel Zones are active. Stop Kernel Zones and retry.
回避方法: 次のいずれかを選択してください。
カーネルゾーンの実行を停止します。
# zoneadm -z zonename shutdown
カーネルゾーンを中断します。
# zoneadm -z zonename suspend
バグ ID 19454837: 特定のバージョンの SPARC システムファームウェアを実行しているシステム上でのドメインのライブ移行が、次のエラーメッセージで失敗することがあります。
system1 # ldm migrate ldg1 system2 Target Password: Unable to restore ldc resource state on target Domain Migration of LDom ldg1 failed
このエラーメッセージは、すべてのドメイン状態をターゲットマシンに転送したあと、ただし、ソースマシン上の移行されるドメインを中断しようとする前に発生します。移行されるドメインは、ソースシステム上で引き続き実行されます。
影響を受けるシステムファームウェアバージョンを次に示します。
SPARC T5、SPARC M5、SPARC M6 – システムファームウェアバージョン 9.2.1
SPARC T4 – システムファームウェアバージョン 8.5.1
軽減方法: 新しい増加した LDC の制限を利用するか、またはライブ移行機能の使用をやめないかぎり、少なくともバージョン 8.6 および 9.3 がリリースされるまでは、システムのシステムファームウェアバージョン 8.5.1 または 9.2.1 への更新を避けてください。
回復方法: ドメインのライブ移行を許可するには、ソースマシンの電源を再投入します。
回避方法: ありません。
バグ ID 18770805: 仮想スイッチの net-dev に誤りがあって検証できない場合は、復旧操作が失敗し、ldmd デーモンでコアダンプが発生します。
回復方法: 復旧モードを無効にし、構成を手動で復旧します。
バグ ID 16934400: ゲストドメインを SPARC M5 または SPARC T5 システムに移行すると、ゲストドメイン上の OS でパニックが発生して「suspend: get stick freq failed」というメッセージが表示されることがあります。
回避方法: 移行されるゲストドメインの /etc/system ファイルに次の行を追加します。
set migmd_buf_addl_size = 0x100000
ゲストドメインをリブートして、変更を有効にします。
バグ ID 15751041: Logical Domains Manager では、2 つのドメインが互いにサービスを提供する循環構成を作成できます。このような構成は、一方のドメインが他方のドメインを停止させる単一点障害停止状態を作り出すため、お勧めできません。さらに、循環依存関係では、影響を受けるドメインをバインド解除できなくなります。
回避方法: 循環依存関係構成のためにドメインをバインド解除できない場合は、循環依存関係の原因となっているデバイスを削除してから、再度バインド解除操作を試みてください。
バグ ID 19480835: 次の Sun システムファームウェアバージョンでは、ゲストドメインあたりの論理ドメインチャネル (LDC) の最大数が増えます。
SPARC T5、SPARC M5、SPARC M6 – 9.2.1
SPARC T4 – 8.5.1
このようにゲストドメインあたりの LDC の数を増やすには、少なくとも Logical Domains Manager 3.1.1.1 を実行している必要があります。
Logical Domains Manager の 3.1.1 以前のバージョンを使用している場合の潜在的な問題を回避するために、ゲストドメインあたりの LDC の数を、以前のシステムファームウェアバージョンでサポートされている 768 を超えて増やさないでください。たとえば、少なくとも Logical Domains Manager 3.1.1.1 をインストールするまでは、多数の仮想ディスクや仮想ネットワークインタフェースを追加しないでください。
3.1.1 以前の Oracle VM Server for SPARC バージョンでドメインあたり 768 個の LDC の制限を超えると、次の現象が発生することがあります。
OBP での辞書のオーバーフロー:
Dictionary overflow - here f21ffe58 limit f2200000 Dictionary overflow - here f21ffe70 limit f2200000 WARNING: /virtual-devices@100/channel-devices@200/disk@5b2: Problem creating devalias for virtual device node Dictionary overflow - here f21ffe70 limit f2200000 Dictionary overflow - here f21ffe70 limit f2200000 Dictionary overflow - here f21ffe70 limit f2200000 Stack Underflow ok
vmem_xalloc のパニック:
panic[cpu6]/thread=2a10020fc80: vmem_xalloc(1a04610, 29360128, 29360128, 0, 0, 0, 0, 1): parameters inconsistent or invalid 000002a10020f000 genunix:vmem_xalloc+850 (1a04610, 1c00000, 0, 0, 1bfffff, 0) %l0-3: 0000000000001fff 0000000000002000 0000000000420000 0000000000000010 %l4-7: 0000000001c00000 0000000000000008 0000000001c00000 0000000000000000 000002a10020f180 unix:contig_vmem_xalloc_aligned_wrapper+24 (1a04610, 1c00000, 1, 0, 1000000, 1) %l0-3: 000002a10020f9a4 0000000000000008 0000000001a4bd90 0000000000000018 %l4-7: 0000000000000002 ffffffffffffffff 000000000136efe8 00000000013722c0 000002a10020f240 genunix:vmem_xalloc+5c8 (300150c2d98, 1c00000, 0, 0, 80000, 0) %l0-3: 00000300150c2ff0 ffffffffffffffff 00000300150c39e0 ffffffffff000000 %l4-7: 0000000000000000 ffffffffffffffff 0000000001000000 0000000000000004 000002a10020f3c0 unix:contig_mem_span_alloc+24 (300150c2d98, 1000000, 1, 1, cd4000, 3) %l0-3: 00000000000f4000 0000000000000000 0000000000000000 0000000001921897 %l4-7: 0000000000000006 00000000fe53dce8 00000000fee3a844 000000007ffffa4c 000002a10020f490 genunix:vmem_xalloc+5c8 (300150c4000, cd4000, 0, 0, 80000, 0) %l0-3: 00000300150c4258 ffffffffffffffff 00000300150c4c48 ffffffffffffe000 %l4-7: 0000000000000000 ffffffffffffffff 0000000000002000 0000000000000003 000002a10020f610 unix:contig_mem_alloc_align+28 (cd4000, 2000, 600957feaf8, 1, 600957feaf8, 18e3000) %l0-3: 0000000000000001 0000000000003000 00000300051c01d8 0000000000000000 %l4-7: 0000000000002000 0000000001a29e20 00000300051c01b0 00000300051c0380 000002a10020f6d0 unix:mach_descrip_buf_alloc+8 (cd4000, 2000, 4, 1, 2a10020f838, 10448d0) %l0-3: 0000000000000000 0000000000003000 00000300002141d8 0000000000000000 %l4-7: 0000000000000001 0000000000000100 00000300002141b0 0000030000214380 000002a10020f780 unix:mach_descrip_update+84 (1864c00, 1c00, cd4000, 18e31d8, 0, 0) %l0-3: 0000000001864c58 000002a10020f830 0000000000002000 ffffffffffffe000 %l4-7: 000002a10020f838 0000000000cd27b0 0000000001864c30 00000600957feaf8 000002a10020f840 platsvc:ps_md_data_handler+30 (1a4bcc0, 3003a822be0, 8, 18, 10, 1) %l0-3: 0000000000001d03 0000000000420000 0000000000420000 0000000000000010 %l4-7: 000003003a822bd8 0000000000000008 0000000000000008 000003000d9bb940 000002a10020f900 ds:ds_dispatch_event+30 (6009fef4df8, 1372000, 48, 9, 9, 3003a822bd0) %l0-3: 000002a10020f9a4 0000000000000008 0000000001a4bd90 0000000000000018 %l4-7: 0000000000000002 ffffffffffffffff 000000000136efe8 00000000013722c0 000002a10020f9b0 genunix:taskq_thread+3cc (600957fd390, 600957fd328, 260fe5123efd, 600957fd35a, 260fe5124083, 600957fd35c) %l0-3: 00000600957feaf8 00000600957fd358 0000000000000001 0000000000080000 %l4-7: 00000600957fd348 0000000000010000 00000000fffeffff 00000600957fd350
バグ ID 18168525 および 18156291: ファイバチャネル PCIe カードは、NPIV をサポートし、その PCIe カードと互換性のあるファイバチャネルスイッチに接続する必要があります。この構成を使用しない場合、format コマンドを使用したり、仮想機能を作成または破棄したりすると、物理機能が FMA によって障害検出され、無効になる可能性があります。この障害が発生した場合は、次のようなメッセージが表示されます。
SUNW-MSG-ID: PCIEX-8000-0A, TYPE: Fault, VER: 1, SEVERITY: Critical EVENT-TIME: event-time PLATFORM: platform-type SOURCE: eft, REV: 1.16 EVENT-ID: event-ID DESC: A problem was detected for a PCIEX device. AUTO_RESPONSE: One or more device instances may be disabled IMPACT: Loss of services provided by the device instances associated with this fault REC-ACTION: Use 'fmadm faulty' to provide a more detailed view of this event. Please refer to the associated reference document at http://support.oracle.com/msg/PCIEX-8000-0A for the latest service procedures and policies regarding this diagnosis.
回避方法: そのカードが FMA によって障害検出された場合は、まずその接続をチェックして、カードがストレージに直接接続されていないことを確認します。次に、使用している構成に対応する手順を実行します。
カードがストレージに直接接続されている – ファイバチャネル PCIe カードを正しく構成します。そのためには、NPIV をサポートし、その PCIe カードと互換性のあるファイバチャネルスイッチにそれを接続します。次に、fmadm repair コマンドを実行して FMA 診断をオーバーライドします。
カードがストレージに直接接続されていない – カードを交換します。
バグ ID 18166010: 多数の仮想ネットワークデバイスが配備に含まれている場合に、仮想ネットワークでの LDC ハンドシェークの問題が発生することがあります。
回避方法: 次の手順を実行します。
次のエントリを /etc/system ファイルに追加することにより、仮想ネットワークデバイスを持つすべてのドメインでハンドシェークの再試行回数を増やします。
set vnet:vgen_ldc_max_resets = 25
変更を有効にするために、/etc/system ファイルを更新したドメインをリブートする必要があります。/etc/system のチューニング可能値については、system(4) のマニュアルページを参照してください。
1 つの仮想スイッチで多数の仮想ネットワークデバイスが必要な場合は inter-vnet リンクを無効にします。
ある特定の仮想スイッチを使用する仮想ネットワークデバイスが 9 個以上ある場合は、inter-vnet-link プロパティーを off に設定します。inter-vnet-link プロパティーを無効にすると、inter-vnet 通信に N2 個のチャネルが使用されなくなります。この変更によって、inter-vnet 通信のパフォーマンスが悪影響を受ける可能性があります。そのため、ゲスト間のパフォーマンスが配備に重要である場合は、inter-vnet 通信を必要とする仮想ネットワークデバイスのみを使用する別個のシステム - プライベート仮想スイッチを (net-dev デバイスを指定せずに) 作成します。
配備に高パフォーマンスのゲスト間通信が必要ない場合は、特定の仮想スイッチを使用する仮想ネットワークデバイスが少数であっても、inter-vnet-link プロパティーを off に設定します。
primary# ldm set-vsw inter-vnet-link=off vsw0
この回避方法で問題が解決しない場合は、最後の手段として、仮想ネットワークおよび仮想スイッチデバイスを持つすべてのドメインで /etc/system ファイルに次の変更を加えます。
この方法で /etc/system ファイルを更新すると、ゲスト間通信のパフォーマンスに悪影響を及ぼす可能性があります。
仮想ネットワークデバイスを持つドメインの /etc/system ファイルに次のエントリを追加します。
set vnet:vnet_num_descriptors = 512
仮想スイッチデバイスを持つドメインの /etc/system ファイルに次のエントリを追加します。
set vsw:vsw_num_descriptors = 512
これらの設定を有効にするために、システムをリブートします。
バグ ID 18083904: Sun Storage 16 Gb Fibre Channel Universal HBA、Emulex 用のファームウェアが帯域幅制御の設定をサポートしていません。この HBA ファームウェアは、bw-percent プロパティーに指定したすべての値を無視します。
回避方法: ありません。
バグ ID 18032944: SPARC T5、SPARC M5、または SPARC M6 マシンから、別の CPU タイプが動作しているプラットフォームへのドメインの CPU 間ライブ移行は正常に実行されます。ただし、そのあとにゲストドメインのメモリーサイズを増やすための動的再構成操作を実行すると、次のようなパニックが発生する可能性があります。
panic[cpu0]/thread=2a1003c9c60: kphysm_add_memory_dynamic(1018000, 200000): range has 2097152 pages, but memgr p_walk_pfnrange only reported 0 000002a1003c9500 genunix:kphysm_add_memory_dynamic+254 (1018000, 200000, 12e8000, 3, 1218000, 0) vpanic(12e8220, 1018000, 200000, 200000, 0, 2a1003c95c8) kphysm_add_memory_dynamic+0x254(1018000, 200000, 12e8000, 3, 1218000, 0) dr_mem_configure+0x94(1018000, 2a1003c97b4, fffffff, 2430000000, 1068ac00, 1068ac00) dr_mem_list_wrk+0x15c(4c01b3382b8, 0, 20, 4c014ba27c8, 1, 1) dr_mem_data_handler+0xa8(0, 4c01b3382b8, 20, 2a1003c9890, 7bac0644, 16) ds_dispatch_event+0x2c(4c01ee33478, 7bf888b8, 48, 7bf88800, 9, 9) taskq_thread+0x3a8(95af9e15e84, 4c010a5caf0, 95af9e15f74, 4c010a5cb22, 4c010a5cb24, 4c01e24d688) thread_start+4(4c010a5caf0, 0, 0, 0, 0, 0)
このパニックが発生するのは、ターゲットシステムが次のいずれかである場合です。
ソケット 0 が無効になっている SPARC T シリーズシステム
ソケット 0 が無効になっている SPARC M シリーズシステム
DCU0 が含まれていない、SPARC M シリーズシステム上の物理ドメイン
この状況は、同じ CPU タイプ、または cpu-arch=native になっているドメインを持つシステム間の移行には影響しません。
回避方法: これらの構成のいずれかを含むシステムからドメインを移行したあと、動的再構成によるメモリーの追加を試みる前に、ゲストドメインをリブートする必要があります。
バグ ID 18001028: ルートドメインで、ファイバチャネル仮想機能の Oracle Solaris デバイスパスが正しくありません。
たとえば、パス名が pci@380/pci@1/pci@0/pci@6/SUNW,emlxs@0,2 であるべきところを、間違って pci@380/pci@1/pci@0/pci@6/fibre-channel@0,2 になっています。
ldm list-io -l 出力には、ファイバチャネル仮想機能の正しいデバイスパスが表示されます。
回避方法: ありません。
バグ ID 17796639: Oracle Enterprise Manager Ops Center 12c Release 1 Update 4 (12.1.4.0.0) の実行時に、バインド中またはバインド解除中の状態にあるドメインに対してバインド、バインド解除、起動、または停止操作を試みると、ldmd サービスでコアダンプが発生することがあり、そのドメインは保守モードになります。
回復方法: ldmd サービスでコアダンプがすでに発生してしまった場合は、システムの電源を再投入して ldmd サービスを再度オンラインにします。
回避方法: ドメインがバインド中またはバインド解除中の状態であるかどうかを判断するには、ldm list コマンドを実行します。その場合は、プロセスが完了し、ドメインがバインド済みまたは非アクティブの状態になるまで待ちます。
バグ ID 17663828 および 17576087: FMA が極端に小範囲のメモリーをシステムの総メモリー容量のパーセンテージとして分離しようとすると、Logical Domains Manager が間違って非常に広範囲のメモリーを、ブラックリストに登録されているものとしてマークする可能性があります。
このエラーは、使用可能なメモリー容量に大きな影響を与える可能性があり、それによって次の問題が発生することがあります。
間違って削除されたメモリーが多すぎるために、影響を受けたゲストドメインをリブートしてもそのドメインが起動しない可能性があります。
ブラックリストのリクエストがバインドされていないメモリーに適用される場合に、非常に広範囲のメモリーがゲストドメインへの割り当てに使用できない可能性があります。そのため、システムメモリーの大部分を使用しようとした場合は、ゲストドメインを作成できない可能性があります。
ブラックリストに登録されたメモリーブロックが内部的に正しくマークされていない可能性があるため、障害のあるメモリーが修復される前に Logical Domains Manager を再起動すると、クラッシュすることがあります。
障害のあるメモリーの交換後に、保存された構成でシステムの電源を再投入しても、メモリーが復元されない可能性があります。
回避方法: かなり大量のメモリーが ldm list-devices -a memory 出力に表示されなくなった場合は、Oracle サービスに問い合わせて、交換する必要のある DIMM を確認および識別します。
障害のあるメモリーを交換したら、factory-default 構成でシステムの電源を再投入します。次に、使用する構成でシステムの電源を再投入します。
バグ ID 17627526: システムのブート中に、ldmd デーモンがハイパーバイザとの通信に使用するデバイスが SMF サービス svc:/ldoms/ldmd:default の起動時までに作成されないという競合状態が発生することがときどきあります。この動作によって、ldmd SMF サービスが保守モードになります。
次のエラーメッセージが ldmd SMF ログに表示されます。
ldmd cannot communicate with the hypervisor as the required device does not exist: /devices/virtual-devices@100/channel-devices@200/virtual-channel@0:hvctl
この問題が発生する可能性があるのは、制御ドメインで次のいずれかの OS バージョンが実行されている場合です。
少なくとも Oracle Solaris 11.1.12.3.0
少なくとも Oracle Solaris 10 1/13 およびパッチ ID 150840-01
回復方法: /devices/virtual-devices@100/channel-devices@200/virtual-channel@0:hvctl デバイスが存在することを確認してから、svcadm clear ldmd コマンドを実行します。
バグ ID 17606070: 遅延再構成中に primary ドメインに CPU を割り当てる前にメモリーを割り当てた場合、追加の ldm set-vcpu または ldm set-core コマンドを実行したとしても、ldm set-memory コマンドの発行時点で、そのメモリーには割り当てられている CPU へのアフィニティーが設定されます。たとえば、次のコマンドは、primary ドメインに割り当てられた 16G バイトのメモリーが、その後 ldm set-core コマンドによって割り当てられた 8 つのコアへのアフィニティーを持たないことがあるという状況を生み出す可能性があります。
primary# ldm start-reconf primary primary# ldm set-mem 16G primary primary# ldm set-core 8 primary primary# reboot
回避方法: 必ずそれらのコアを primary ドメインに割り当ててから、メモリーを割り当てるようにします。たとえば、次のコマンドでは、最初に 8 つのコアを primary ドメインに割り当て、次に 16G バイトのメモリーを割り当てています。
primary# ldm start-reconf primary primary# ldm set-core 8 primary primary# ldm set-mem 16G primary primary# reboot
バグ ID 17422973: 少なくともバージョン 8.4.0 のシステムファームウェアが実行されている SPARC T4 サーバー、少なくともバージョン 9.1.0 のシステムファームウェアが実行されている SPARC T5、SPARC M5、または SPARC M6 サーバー、または少なくとも XCP バージョン 2230 が実行されている Fujitsu M10 システム で、単一スライスのディスクへの Oracle Solaris 11.1 OS のインストールが次のエラーを表示して失敗することがあります。
cannot label 'c1d0': try using fdisk(1M) and then provide a specific slice Unable to build pool from specified devices: invalid vdev configuration
回避方法: ディスクに SMI ラベルを付け直します。
バグ ID 17285811: 以前に移行されたゲストドメインが、カーネルパニックのせいで、そのあとのリブートまたはドメイン起動操作時にリブートに失敗することがあります。このパニックはドメインのブート時に発生します。次のメッセージのようなパニックエラーメッセージが表示されます。
panic[cpu0]/thread=10012000: tilelet_assign_cb: assigning pfns [50000, c0000) to mgid 1, mnodeid 1: pachunk 1 already assigned to mgid 0, mnodeid 0
回避方法: このドメインをリブートしないでください。最初にドメインを停止およびバインド解除してから、再度ドメインをバインドして起動します。例:
primary# ldm stop domain primary# ldm unbind domain primary# ldm bind domain primary# ldm start domain
回復方法: 問題が発生したら、ドメインを停止およびバインド解除してから、再度ドメインをバインドして起動します。
バグ ID 17285745: ゲストドメインを SPARC T5、SPARC M5、または SPARC M6 システムに移行すると、そのゲストドメインでカーネルパニックが発生して「suspend: get stick freq failed」というメッセージが表示されることがあります。
回避方法: 移行されるゲストドメインの /etc/system ファイルに次の設定を追加します。次に、そのゲストドメインをリブートします。
set migmd_buf_addl_size = 0x100000
バグ ID 17245915: FMA によって障害のあるコアが検出されると、Logical Domains Manager では、ターゲットとして使用できるコアが存在する場合に、コアの再マップ操作を実行して、障害のあるコアを退避しようとします。コアの再マップ操作が成功し、障害のあるコアが交換されたあとで、ldm add-vcpu コマンドを使ってゲストドメインの仮想 CPU のサイズ変更を試みると、「Invalid response」というエラーメッセージで失敗することがあります。
この失敗は一時的なもので、システム構成によって異なります。
回避方法: ありません。
回復方法: 次の手順を実行して CPU をゲストドメインに追加します。
ゲストドメインをバインド解除します。
すべての仮想 CPU を削除します。
仮想 CPU を再度追加します。
ゲストドメインをバインドします。
ブラックリストに載っている CPU リソースが修復されると、DR を確実に使用して CPU を追加する機能が完全に復元されます。
バグ ID 17232035: マスタードメインで failure-policy=reset のときにスレーブドメインがブート時にハングアップすることがあります。この問題は、failure-policy プロパティーの別の設定では再現できません。
回復方法: このルートドメインに関連付けられている I/O ドメインを停止し、primary 以外のルートドメインを起動します。
回避方法: failure-policy プロパティーを reset 以外の値に設定します。
バグ ID 17191488: SPARC T5-8 システムから SPARC T4-4 システムへのドメインの移行を試みると、次のエラーが発生します。
primary# ldm migrate ldg1 system2 Target Password: Timeout waiting for domain ldg1 to suspend Domain Migration of LDom ldg1 failed
回避方法: この問題を回避するには、extended-mapin-space=on を設定します。
primary# ldm set-domain extended-mapin-space=on ldom
バグ ID 17188920: –-suppress および –-timestamp オプションがタイムスタンプ値を適切に表示しません。
回避方法: –-suppress および –-timestamp オプションの使用時に –r オプションを含めて、適切な出力を表示します。
バグ ID 17182503: mac_do_softlso() が、vnet_vlan_insert_tag() および vnet_vlan_remove_tag() 関数によって生成される LSO パケットを取りこぼします。
回避方法: VLAN タグ付きの LSO パケットでこの問題を回避するには、それをサポートしているすべてのドメインで仮想ネットワークの LSO 機能を無効にします。
/etc/system ファイルに次の行を追加します。
set vnet_enable_lso = 0 set vsw_enable_lso = 0
リブートします。
mdb -k コマンドを使用して、変更内容を確認します。
# mdb -k > vnet_enable_lso/D vnet_enable_lso: vnet_enable_lso:0 > vsw_enable_lso/D vsw_enable_lso: vsw_enable_lso: 0
バグ ID 17088083: 仮想 CPU が 9 つ以上存在するドメインの移行では、そのドメインの最上位のプロセッサグループ ID が 64 ユニットを超えて増加すると、メモリー破壊が発生することがあります。たとえば、そのドメインの移行前の最上位のプロセッサグループ ID は 63 で、移行後のそれは 64 です。
ドメイン内のプロセッサグループ ID を調べるには、pginfo コマンドを使用します。ドメイン内で、次のコマンドを実行すると、最上位のプロセッサグループ ID が出力されます。
# pginfo -I|tr ' ' '\n'|sort -n|tail -1
回避方法: 移行を実行する前に、ドメイン内の仮想 CPU の数を減らします。移行が完了したあとで、ドメイン内の仮想 CPU の数を元の値に戻すことができます。
バグ ID 17051532: PCIe デバイスまたは仮想機能がゲストドメインから削除されたときに、自動保存構成が更新されません。この問題により、自動保存復旧を実行したあと (つまり autorecovery_policy=3 のとき) に、そのデバイスまたは仮想機能がゲストドメインに再表示される可能性があります。また、自動保存を更新させる別の ldm コマンドを実行しない場合は、この問題によって ldm add-spconfig -r コマンドが失敗して「Autosave configuration config-name is invalid」というメッセージが表示されることもあります。
回避方法: 次のいずれかを実行してください。
PCIe デバイスまたは仮想機能を削除したあとで、新しい構成を保存します。
primary# ldm add-config new-config-name
PCIe デバイスまたは仮想機能の削除後に、保存された構成を削除してから再作成することで、構成をリフレッシュします。
primary# ldm rm-config config-name primary# ldm add-config config-name
このバグによって ldm add-config -r config-name コマンドが正しく機能できないことに注意してください。
自動保存の更新を発生させる別の ldm コマンド (ldm set-vcpu、ldm bind、ldm unbind など) を実行します。
バグ ID 17026219: ldmp2v convert コマンドの実行中にエラーが発生した場合は、ゲストの boot-device プロパティーがゲストのブートディスクに設定されていないことがあります。このエラーにより、Oracle Solaris のアップグレードが終了したあとで、ゲストドメインが Oracle Solaris のインストールイメージから再度ブートされます。
回避方法: 制御ドメイン内からゲストドメインの boot-device プロパティーを変更します。Oracle Solaris インストーラを再入力する際にこの変更を行なってから、Oracle Solaris のアップグレードを再実行します。そして、アップグレードの完了後、アップグレード済みのブートディスクからゲストドメインがリブートします。
ブートデバイスを設定するには、制御ドメインで次のコマンドを実行します。このコマンドは、元の物理システムのルート (/) ファイルシステムがブートディスクのスライス 0 に置かれていることを前提としています。元のシステムが別のスライスからブートされた場合は、それに合わせてコロンのあとの文字を調整します。たとえば、スライス 0 には a、スライス 1 には b (以下同様) を使用します。
primary# ldm set-variable boot-device=disk0:a domain-name
バグ ID 17027275: システムファームウェア 8.3 が実行されている SPARC T4 システム間のドメインの移行は、SPARC T5、SPARC M5、および SPARC M6 システムに許可されるべきではありません。移行は成功しますが、そのあとのメモリー DR 操作によってパニックが発生します。
回避方法: SPARC T4 システム上のシステムファームウェアをバージョン 8.4 に更新します。lgrp_lineage_add(mutex_enter: bad mutex, lp=10351178) 時にゲストドメインがパニックになるの回避方法を参照してください。
バグ ID 17020950: ファームウェアバージョン 8.3 を使用してバインドされたアクティブなドメインを SPARC T4 プラットフォームから SPARC T5、SPARC M5、または SPARC M6 プラットフォームに移行したあとで、メモリー動的再構成を実行すると、ゲストドメインでパニックが発生する可能性があります。
回避方法: 移行を実行する前に、SPARC T4 システムをバージョン 8.4 のシステムファームウェアで更新します。次に、そのドメインを再バインドします。
バグ ID 17020481: primary ドメインのリブート後にゲストドメインが移行状態 (t) になります。この問題は、システム上に多数の仮想機能が構成されている場合に発生します。
回避方法: この問題を回避するには、OBP のディスクブートコマンドを数回再試行して、ネットワークからブートしないようにします。
各ドメインで次の手順を実行します。
ドメインのコンソールにアクセスします。
primary# telnet localhost domain-name
boot-device プロパティーを設定します。
ok> setenv boot-device disk disk disk disk disk disk disk disk disk disk net
boot-device プロパティーの値として指定する disk エントリの数は、システム上に構成されている仮想機能の数によって異なります。小規模なシステムでは、プロパティー値に含める disk インスタンスを少なくできる可能性があります。
printenv を使用して boot-device プロパティーが正しく設定されていることを確認します。
ok> printenv
primary ドメインのコンソールに戻ります。
システム上のドメインごとに、手順 1-4 を繰り返します。
primary ドメインをリブートします。
primary# shutdown -i6 -g0 -y
バグ ID 16991255: 仮想ネットワークデバイスドライバが TxDring モードで動作すると、パニックが発生することがまれにあります。
回避方法: このパニックを回避するには、extended-mapin-space プロパティーの値を on に設定します。
primary# ldm set-domain extended-mapin-space=on ldom
バグ ID 16895816: 仮想 CPU が 1 つしか割り当てられていないドメインの移行を行うと、ゲストドメインの pg_cmt_cpu_fini() 関数でパニックが発生することがあります。
回避方法: 移行する前に、少なくとも 2 つの仮想 CPU をゲストドメインに割り当てます。たとえば、ldm add-vcpu 2 domain-name コマンドを使用して、domain-name ゲストドメインに割り当てられている仮想 CPU の数を増やします。
バグ ID 16864417: SPARC T5、SPARC M5、または SPARC M6 マシンと UltraSPARC T2 または SPARC T3 マシンの間で移行を試みたときに、ldm migrate -n コマンドが失敗を報告しません。
回避方法: ありません。
バグ ID 16713362: 復旧操作中に primary 以外のルートドメインから PCIe スロットを現時点で削除することはできません。PCIe スロットは、primary 以外のルートドメインに割り当てられたままです。
回避方法: PCIe スロットを primary 以外のルートドメインから手動で削除し、復旧操作が完了したあとで適切な I/O ドメインに割り当てる必要があります。
PCIe スロットを primary 以外のルートドメインから削除する方法については、Oracle VM Server for SPARC 3.1 管理ガイド のprimary 以外のルートドメインの使用を参照してください。
primary 以外のルートドメインに所有されている PCIe スロットを使用する I/O ドメインの修復は、I/O ドメインの構成によって異なります。
I/O ドメインが PCIe スロットのみを使用し、使用できる PCIe スロットが 1 つもない場合、I/O ドメインは修復されず、バインド解除された状態のまま残され、PCIe スロットは退避済みとしてマークされます。
I/O ドメインが SR-IOV 仮想機能と PCIe スロットを使用する場合、そのドメインは修復され、使用できない PCIe スロットは退避済みとしてマークされます。
PCIe スロットを primary 以外のルートドメインから手動で削除したあとに、それらの PCIe スロットを I/O ドメインに追加するには、ldm add-io コマンドを使用します。
バグ ID 16617981: ldm list の出力に、物理 I/O デバイスの evacuated プロパティーが表示されません。
回避方法: いずれかの ldm list コマンドで –p オプションを使用して、物理 I/O デバイスの evacuated プロパティーを表示します。
バグ ID 16494899: ドメインの移行が拒否されて、次のメッセージが ldmd SMF ログに出力されることがまれにあります。
Mar 08 17:42:12 warning: Received invalid physical address during migration of domain rztcrmdev2: base RA: 0x400000000, offset: 0x1ffff0000, PA: 0x87fff0000 size: 0x1001a
ドメインがソースシステムで中断される前に移行が失敗するため、サービスの損失はありません。
この障害は、移行が拒否される原因となる次の状況が生じた場合に発生します。
ドメイン内の最後のメモリーチャンクのメモリー内容が、そのメモリーチャンクよりも大きいサイズに圧縮されます
ldmd デーモンが、データがターゲット上のドメインの外側にあるメモリーに書き込まれたと誤って判断します
ほとんどのチャンクはより小さいサイズに圧縮されるため、障害モードはドメインのワークロードと正確なメモリー内容によって決まります。
回復方法: この問題について保証されている回避方法はありませんが、そのあとの移行の実行は、ワークロードが変わり、そのためにメモリー内容が変わった場合に機能する可能性があります。また、動的再構成を使用して、ドメインのメモリーサイズを変更してみることもできます。
バグ ID 16486383: この問題は、PCI カードが物理的に存在する /SYS/DCU からコアが割り当てられていないゲストドメインに、PCI デバイスまたはバスを直接割り当てた場合に発生することがあります。ハイパーバイザは、ゲストドメインの代わりに PCI デバイスをリセットするため、各ゲストドメインのリブート時に、PCI デバイスに接続されている DCU 上にコアがあるドメインがパニックを起こす可能性があります。非 DCU ローカルゲストに割り当てられている PCI デバイスが多いほど、パニックの可能性が大きくなります。
回避方法: 次のいずれかを実行してください。
PCI デバイスをゲストドメインに割り当てる場合、カードがコアと同じ DCU に物理的に存在することを確認してください。
柔軟な物理的カードの配置のため、手動でコアを割り当てます。
たとえば、IOU0 上の PCI デバイス (pci_0 から pci_15) の場合、0 から 127 の間のコアを選択し、それをドメインに割り当てます。
# ldm add-core cid=16 domain
システムコアを表示するには、次のコマンドを使用します。
# ldm ls-devices -a core
IOU1 上の PCI デバイス (pci_16 から pci_31) の場合は、128 から 255 の間のコアを選択します。IOU2 上の PCI デバイス (pci_32 から pci_47) の場合は、256 から 383 の間のコアを選択します。IOU3 上の PCI デバイス (pci_48 から pci_63) の場合は、384 から 511 の間のコアを選択します。
バグ ID 16299053: PCIe デバイスを無効にすると、予期しない動作が発生することがあります。無効にした PCIe デバイスがまだドメインによって所有されている間に、その PCIe デバイス下にあるサブデバイスが、割り当てられていない名前に戻ります。
回避方法: ILOM 上の PCIe スロットを無効にしようとする場合、PCIe スロットが、直接 I/O (DIO) 機能を使用して、ドメインに割り当てられていないことを確認します。つまり、まず、ILOM 上のスロットを無効にする前に、PCIe スロットが対応するルートドメインに割り当てられていることを確認します。
PCIe スロットが DIO によってドメインに割り当てられている間に、ILOM 上の PCIe スロットを無効にする場合は、正しい動作のために、そのドメインを停止してから、ルートドメインにデバイスを再割り当てします。
バグ ID 16284767: Oracle Solaris コンソール上のこの警告は、I/O デバイスドライバの接続中に、供給された割り込み数が使い果たされたことを示しています。
WARNING: ddi_intr_alloc: cannot fit into interrupt pool
ハードウェアが提供する割り込み数には限りがあるため、Oracle Solaris では各デバイスで使用できる数を制限しています。デフォルトの制限は一般的なシステム構成のニーズに合うように考案されていますが、特定のシステム構成ではこの制限に調整が必要になることがあります。
特に、システムが複数の論理ドメインにパーティション化されている場合や、任意のゲストドメインに割り当てられる I/O デバイスの数が多すぎる場合は、この制限に調整が必要になることがあります。Oracle VM Server for SPARC では、全割り込み数を小さいセットに分けて、ゲストドメインに提供します。1 つのゲストドメインに割り当てられる I/O デバイスの数があまりにも多い場合は、その供給量が少なすぎて、各デバイスにデフォルトの割り込み制限を提供できないことがあります。そのため、すべてのドライバを完全に接続する前にその供給量が使い果たされてしまいます。
ドライバの中には、その割り込み数を Oracle Solaris で自動的に調整できるようにするオプションのコールバックルーチンを提供するものもあります。このようなドライバにはデフォルトの制限が適用されません。
回避方法: ::irmpools および ::irmreqs MDB マクロを使用して、使用される割り込みを調べます。::irmpools マクロは、プールに分けられた割り込みの総供給量を表示します。::irmreqs マクロは、各プールにマップされているデバイスを表示します。デバイスごとに、::irmreqs は、オプションのコールバックルーチンによってデフォルトの制限が強制されるかどうか、各ドライバがリクエストした割り込みの数、および各ドライバに提供される割り込みの数を表示します。
これらのマクロでは、接続に失敗したドライバに関する情報は表示されません。ただし、表示される情報は、デフォルトの制限をどの程度まで調整できるかを予測するのに役立ちます。コールバックルーチンを提供せずに複数の割り込みを使用するデバイスは、デフォルトの制限を調整して、使用する割り込み数を少なくせざるをえない場合があります。そのようなデバイスで使用される量を下回ってデフォルトの制限を減らすと、ほかのデバイスで使用できるように割り込みが解放されます。
デフォルトの制限を調整するには、/etc/system ファイル内の ddi_msix_alloc_limit プロパティーを 1-8 の値に設定します。次に、その変更が反映されるようにシステムをリブートします。
パフォーマンスを最大にするには、開始時に大きな値を割り当て、システムが警告なしで正常にブートするまで、それらの値を少しずつ減らします。::irmpools および ::irmreqs マクロを使用して、接続されているすべてのドライバに対する調整の影響を評価します。
たとえば、ゲストドメインで Oracle Solaris OS のブート中に次の警告が出されるとします。
WARNING: emlxs3: interrupt pool too full. WARNING: ddi_intr_alloc: cannot fit into interrupt pool
::irmpools および ::irmreqs マクロは次の情報を表示します。
# echo "::irmpools" | mdb -k ADDR OWNER TYPE SIZE REQUESTED RESERVED 00000400016be970 px#0 MSI/X 36 36 36 # echo "00000400016be970::irmreqs" | mdb -k ADDR OWNER TYPE CALLBACK NINTRS NREQ NAVAIL 00001000143acaa8 emlxs#0 MSI-X No 32 8 8 00001000170199f8 emlxs#1 MSI-X No 32 8 8 000010001400ca28 emlxs#2 MSI-X No 32 8 8 0000100016151328 igb#3 MSI-X No 10 3 3 0000100019549d30 igb#2 MSI-X No 10 3 3 0000040000e0f878 igb#1 MSI-X No 10 3 3 000010001955a5c8 igb#0 MSI-X No 10 3 3
この例に示されるデフォルトの制限は 1 デバイスにつき 8 回の割り込みですが、これはシステムへの最後の emlxs3 デバイスの接続を受け入れるのに十分な割り込み数ではありません。emlxs のすべてのインスタンスが同じように動作すると考えれば、emlxs3 はおそらく 8 回の割り込みをリクエストしています。
36 回の割り込みの総プールサイズから、すべての igb デバイスで使用された 12 回の割り込みを引くことにより、24 回の割り込みを emlxs デバイスに使用できます。24 回の割り込みを 4 で割ると、1 デバイスにつき 6 回の割り込みによって、すべての emlxs デバイスが同じパフォーマンスで接続できることになります。そのため、次の調整が /etc/system ファイルに追加されます。
set ddi_msix_alloc_limit = 6
システムが警告なしで正常にブートすると、::irmpools および ::irmreqs マクロは次の更新された情報を表示します。
# echo "::irmpools" | mdb -k ADDR OWNER TYPE SIZE REQUESTED RESERVED 00000400018ca868 px#0 MSI/X 36 36 36 # echo "00000400018ca868::irmreqs" | mdb -k ADDR OWNER TYPE CALLBACK NINTRS NREQ NAVAIL 0000100016143218 emlxs#0 MSI-X No 32 8 6 0000100014269920 emlxs#1 MSI-X No 32 8 6 000010001540be30 emlxs#2 MSI-X No 32 8 6 00001000140cbe10 emlxs#3 MSI-X No 32 8 6 00001000141210c0 igb#3 MSI-X No 10 3 3 0000100017549d38 igb#2 MSI-X No 10 3 3 0000040001ceac40 igb#1 MSI-X No 10 3 3 000010001acc3480 igb#0 MSI-X No 10 3 3
バグ ID 16238762: 2.4T バイト以上のメモリーを搭載する SPARC M5-32 または SPARC M6-32 で、primary ドメイン内の CPU の数を 6 から 1056 CPU に設定しようとすると、カーネルが次のメッセージを表示してパニックを起こします。
mpo_cpu_add: Cannot read MD
次の手順によってパニックが発生します。
ホストに割り当てられている DCU によって電源を投入します。
たとえば、DCU0 を HOST0 に割り当てます。
ゲストドメインを作成します。
構成を SP に保存します。
ホストの電源を切ります。
別の DCU をホストに割り当てます。
たとえば、DCU1 を HOST0 に割り当てます。
ホストの電源を入れます。
ファームウェアによって、構成が「ブート可能」であることが検証されます。この検証により、構成の作成時に存在していたすべての CPU、メモリー、および I/O がまだ存在していることが確認されます。ファームウェアは、システム全体の構成を記述する新しい PRI も生成します。
構成は正常に電源投入し、ゲストドメインがブートします。
既存のドメインに CPU を動的に追加してみます。
正しい待機時間情報を反映する新しいマシン記述が生成されますが、Oracle Solaris OS ではその新しい情報を解析できず、パニックが発生します。
回避方法: パニックを避けるには、問題の説明にある手順を実行しないでください。
すでにこれらの手順を実行し、パニックが発生している場合は、次の手順を実行します。
小さな物理ドメインから、保存した構成をブートした後に、アクションを実行します。たとえば、アクティブな各ドメインから CPU を削除します。
ドメインをリブートします。
ドメインのバインドを解除します。
バインドされているドメインを再バインドします。
新しい構成を SP に保存します。
バグ ID 16232834: ldm add-vcpu コマンドを使用して、CPU をドメインに割り当てると、Oracle Solaris OS が次のメッセージを表示してパニックを起こすことがあります。
panic[cpu16]/thread=c4012102c860: mpo_cpu_add: Cannot read MD
このパニックは、次の条件が存在する場合に発生します。
ホストに追加の DCU が割り当てられている
ホストが、ホストに割り当てられているすべてのハードウェアを含まない、以前に保存された SP 構成を使用して起動されている
ldm add-vcpu 操作のターゲットドメインはパニックを起こしたドメインです。ドメインは、リブート時に、追加の CPU で回復します。
回避方法: ホストに割り当てられているハードウェアリソースより少ないリソースで生成された構成を使用しないでください。
問題を避けるには、問題の説明に示しているように、CPU を追加しないでください。または、次の手順を実行します。
DCU の追加後に、新しい SP 構成を生成します。
たとえば、次のコマンドは、new-config-more-dcus という構成を作成します。
primary# ldm add-config new-config-more-dcus
ドメインをシャットダウンします。
ホストを停止します。
-> stop /HOST
ホストを起動します。
-> start /HOST
バグ ID 16224353: primary ドメインのリブート後、primary ドメイン内の ixgbevf インスタンスが動作しないことがあります。
回避方法: ありません。
バグ ID 16219069: Oracle Solaris 10 1/13 OS を実行する primary ドメインで、/etc/hostname.vf-interface ファイルに基づいて、仮想機能インタフェースに IP アドレスが自動的に組み込まれず、割り当てられないことがあります。
この問題は、primary ドメインで Oracle Solaris 10 1/13 OS を 実行する SPARC T3、SPARC T4、または SPARC T5 システムをブートまたはリブートした場合に発生します。この問題は、オンボード物理機能とアドイン物理機能の両方で作成された仮想機能に影響します。この問題は、Logical Domains ゲストドメインイメージをブートした場合には発生しません。
バグ ID 16080855: primary ドメインのリブートまたはシャットダウン時に、primary ドメインで、次のようなパニックメッセージを表示して、カーネルのパニックが発生することがあります。
panic[cpu2]/thread=c40043b818a0: mutex_enter: bad mutex, lp=c4005fa01c88 owner=c4005f70aa80 thread=c40043b818a0 000002a1075c3630 ldc:ldc_mem_rdwr_cookie+20 (c4005fa01c80, c4004e2c2000,2a1075c37c8, 6c80000, 1, 0) %l0-3: 00000000001356a4 0000000000136800 0000000000000380 00000000000002ff %l4-7: 00000000001ad3f8 0000000000000004 00000000ffbffb9c 0000c4005fa01c88 000002a1075c3710 vldc:i_vldc_ioctl_write_cookie+a4 (c4004c400030, 380,ffbff898, 100003, 0, 70233400) %l0-3: 0000000006c80000 0000000000156dc8 0000000000000380 0000000000100003 %l4-7: 00000000702337b0 000002a1075c37c8 0000000000040000 0000000000000000 000002a1075c37f0 vldc:vldc_ioctl+1a4 (3101, c4004c400030, ffbff898,c4004c400000, c4004c438030, 0) %l0-3: 0000000000100003 0000000000000000 000000007b340400 0000c4004c438030 %l4-7: 0000c4004c400030 0000000000000000 0000000000000000 0000000000000000 000002a1075c38a0 genunix:fop_ioctl+d0 (c4004d327800, 0, ffbff898, 100003,c4004384f718, 2a1075c3acc) %l0-3: 0000000000003103 0000000000100003 000000000133ce94 0000c4002352a480 %l4-7: 0000000000000000 0000000000000002 00000000000000c0 0000000000000000 000002a1075c3970 genunix:ioctl+16c (3, 3103, ffbff898, 3, 134d50, 0) %l0-3: 0000c40040e00a50 000000000000c6d3 0000000000000003 0000030000002000 %l4-7: 0000000000000003 0000000000000004 0000000000000000 0000000000000000
回復方法: primary ドメインのリブートを許可します。primary ドメインが、クラッシュ後にリブートしないように構成されている場合は、primary ドメインを手動でブートします。
バグ ID 16071170: SPARC M5-32 または SPARC M6-32 システムで、内部 SAS コントローラが、SR-IOV をサポートしていなくても、SR-IOV 対応コントローラとしてエクスポートされます。
これらのカードに物理機能を作成しようとすると、Oracle VM Server for SPARC ログに、次のメッセージが表示されます。
Dec 11 04:27:54 warning: Dropping pf pci@d00/pci@1/pci@0/pci@0/pci@0/pci@4/LSI,sas@0: no IOV capable driver Dec 11 04:27:54 warning: Dropping pf pci@d80/pci@1/pci@0/pci@c/pci@0/pci@4/LSI,sas@0: no IOV capable driver Dec 11 04:27:54 warning: Dropping pf pci@c00/pci@1/pci@0/pci@c/pci@0/pci@4/LSI,sas@0: no IOV capable driver Dec 11 04:27:54 warning: Dropping pf pci@e00/pci@1/pci@0/pci@0/pci@0/pci@4/LSI,sas@0: no IOV capable driver
システムには、SPARC M5-32 および SPARC M6-32 アセンブリの IOU 1 つにつき、4 つの LSI SAS コントローラポートがあります。各ポートでこのエラーが報告されます。
回避方法: このメッセージは無視してかまいません。これらのメッセージは、システムの LSI-SAS コントローラデバイスが SR-IOV に対応できることを示していますが、このハードウェアでは SR-IOV のサポートが可能ではありません。
バグ ID 16068376: 約 128 個のドメインを含む T5-8 で、ldm list などの一部の ldm コマンドに、すべてのドメインの稼働時間として 0 秒が表示されることがあります。
回避方法: ドメインにログインし、uptime コマンドを使用してドメインの稼働時間を調べます。
バグ ID 16059331: sxge ドライバは、primary ドメイン上のその仮想機能にジャンボ MTU を正しく設定できません。
回避方法: /kernel/drv/sxge.conf ファイルを手動で変更して、ゲストドメインの sxge 仮想機能インタフェースにジャンボ MTU を設定します。
バグ ID 15974640: ldm コマンドは、sxge デバイスに、mac-addr および alt-mac-addrs プロパティー値を正しく設定できません。その結果、ldmd デーモンが MAC アドレスの不整合を報告します。さらに、VNIC MAC アドレスに基づいたリンクアグリゲーションも失敗します。
バグ ID 15974547: sxge がある SPARC T5-1B システムで実行すると、ldm list-io -d PF-device の出力に、max-vlans または max-vf-mtu プロパティーが表示されません。これらのプロパティーは、ixgbe のある SPARC T5-1B システムと非ブレードシステムに存在します。
max-vlans プロパティー値がありません。sxge デバイスはハードウェア VLAN のタグ付けをサポートしていないため、値は 0 になるはずです。max-vf-mtu プロパティー値は 1500 で修正され、物理機能ドライバが仮想機能にジャンボ MTU を設定しないようにします。
バグ ID 15962837: チップレベルの障害が発生すると、コアの退避が完了しません。コアの障害があとに続く退避は予想どおりに機能しますが、CMP ノード全体のリタイアを試みるときは、チップレベルの障害は退避を完了しません。
回避方法: ありません。チップレベルの障害を診断したら、チップの交換をスケジュールしてください。
バグ ID 15942036: メモリーの DR 操作を実行してメモリーを 4G バイト未満に減らすと、その操作が永久にハングアップする可能性があります。そのドメインに対して ldm cancel-op memdr コマンドを発行すると、間違ったメッセージが表示されます。
The memory removal operation has completed. You cannot cancel this operation.
そのメッセージにもかかわらず、メモリーの DR 操作はハングアップし、そのゲストドメインに対して他の ldmd 操作を実行できない可能性があります。
回避方法: どのドメインでもメモリーを 4G バイト未満に減らさないようにしてください。すでにこの状態にある場合は、ldm stop -f コマンドを発行するか、ドメインにログインして、それをリブートします。
バグ ID 15826354: きわめて多数の CPU の CPU 動的再構成 (DR) によって ldmd デーモンが失敗を返します。ldmd はタイムアウトしますが、バックグラウンドで DR 処理が続行し、最終的に成功します。それにもかかわらず、ldmd は結果のドメインと連携しなくなり、後続の DR 処理が許可されないことがあります。
例:
# ldm ls NAME STATE FLAGS CONS VCPU MEMORY UTIL NORM UPTIME primary active -n-cv- UART 7 20G 2.7% 0.4% 1h 41m ldg0 active -n---- 5000 761 16G 75% 51% 6m # ldm rm-vcpu 760 ldg0 Request to remove cpu(s) sent, but no valid response received VCPU(s) will remain allocated to the domain, but might not be available to the guest OS Resource removal failed # ldm set-vcpu 1 ldg0 Busy executing earlier command; please try again later. Unable to remove the requested VCPUs from domain ldg0 Resource modification failed # ldm ls NAME STATE FLAGS CONS VCPU MEMORY UTIL NORM UPTIME primary active -n-cv- UART 7 20G 0.9% 0.1% 1h 45m ldg0 active -n---- 5000 761 16G 100% 0.0% 10m
回避方法: 数分間待ってから、ldm set-vcpu コマンドを再度実行します。
# ldm set-vcpu 1 ldg0 # ldm ls NAME STATE FLAGS CONS VCPU MEMORY UTIL NORM UPTIME primary active -n-cv- UART 7 20G 0.9% 0.1% 1h 50m ldg0 active -n---- 5000 1 16G 52% 0.0% 15m
760 は推奨される最大数を超えていることに注意してください。
バグ ID 15825538: ハイブリッドネットワーク I/O インタフェース (mode=hybrid) と CPU 間の移行 (cpu-arch=generic) の両方が有効になるように構成されている論理ドメインでは、セキュアなライブ移行が実行された場合に (ldm migrate)、移行がタイムアウトし、ドメインが中断状態のままになることがあります。
回復方法: 論理ドメインを再起動します。
回避方法: セキュアな CPU 間のライブ移行では、ハイブリッド I/O 仮想ネットワークデバイスを使用しないでください。
バグ ID 15825330: プロセッサボードが 1 つのみの一部の SPARC T4-4 構成で、Oracle VM Server for SPARC が起動時にハングアップしたように見えます。
回避方法: 常にプロセッサボードがプロセッサ 0 および 1 用のスロットを占有していることを確認してください。そのような構成でシステムを再起動すると、Oracle VM Server for SPARC ソフトウェアを起動できるようになります。
バグ ID 15821246: Oracle Solaris 11.1 OS が実行されているシステムで、移行されたドメインに対する threading プロパティーの値を max-ipc から max-throughput に変更すると、ゲストドメインでパニックが発生することがあります。
回避方法: 移行されたゲストドメインがリブートするまで、そのゲストドメインの threading ステータスは変更しないでください。
バグ ID 15820741: 直接 I/O が構成されている 2 つのドメインを持つ Oracle Solaris 11.1 システムでは、制御ドメインのリブート時にハングアップすることがあります。
回復方法: リブート時のハングアップから回復するには、SP で次のコマンドを発行して制御ドメインをリセットします。
-> reset -f /HOST/domain/control
バグ ID 15812823: 空きメモリーが少ない状況では、サイズが原因で、必ずしもすべてのメモリーブロックがメモリーの DR 操作の一部として使用されないことがあります。ただし、このようなメモリーブロックは空きメモリー量に含まれます。こうした状況では、予想よりも少ない量のメモリーがドメインに追加される可能性があります。この状況が発生しても、エラーメッセージは表示されません。
回避方法: ありません。
バグ ID 15803617: primary ドメインまたはアクティブなゲストドメインで、ドメインがハイブリッド I/O 仮想ネットワークデバイスで構成されている場合、バインド解除操作またはライブ移行操作時にパニックが発生することがあります。
回復方法: 影響のあるドメインを再起動します。
回避方法: ハイブリッド I/O 仮想ネットワークデバイスを使用しないでください。
バグ ID 15783851: 仮想機能の制約を間違って表している XML ファイルから構成を再作成するしようとすると、問題が発生することがあります。
この問題は、ldm list-constraints -x コマンドを使用して、PCIe 仮想機能が割り当てられたドメインの構成を保存した場合に発生します。
ldm add-domain -i コマンドを使用してあとでドメインを再作成すると、元の仮想機能が存在しないため、ドメインのバインドの試行が失敗し、次のエラーメッセージが表示されます。
No free matching PCIe device...
ldm add-domain コマンドによって仮想機能が PCIe デバイスとして誤って分類されているため、欠落している仮想機能を作成しても、ドメインのバインドの別の試行が失敗し、同じエラーメッセージが表示されます。
回避方法: 次の手順を実行します。
ldm list-io コマンドを使用して、仮想機能に関する情報を保存します。
ldm rm-dom コマンドを使用して、影響を受けた各ドメインを破棄します。
ldm create-vf コマンドを使用して、必要なすべての仮想機能を作成します。
ldm コマンドを使用してドメインを再構築します。
ldm add-io コマンドを使用して各仮想機能を追加すると、仮想機能デバイスとして正しく分類されるため、ドメインをバインドできます。
仮想機能を使用するドメイン構成の再構築については、ldm init-system コマンドで、物理的な I/O 変更が行われたドメイン構成が正しく復元されないことがあるを参照してください。
バグ ID 15783608: 制御ドメインを、物理的に制約されたコアの使用から制約のない CPU リソースの使用に変更すると、次の無関係なメッセージが表示されることがあります。
Whole-core partitioning has been removed from domain primary,because dynamic reconfiguration has failed and the domain is now configured with a partial CPU core.
回避方法: このメッセージは無視できます。
バグ ID 15783031: ldm init-system コマンドを使用して、直接 I/O または SR-IOV 操作を使用したドメイン構成を復元すると、問題が発生することがあります。
問題が発生するのは、復元される構成で次の操作が 1 つ以上実行された場合です。
primary ドメインによってまだ所有されているバスからスロットが取り外されました。
primary ドメインによって所有されている物理機能から仮想機能が作成されました。
仮想機能が primary ドメインまたはほかのゲストドメイン、あるいはその両方に割り当てられました。
ルートコンプレックスが primary ドメインから削除され、ゲストドメインに割り当てられました。そのルートコンプレックスは、このあとの I/O 仮想化操作の基礎として使用されます。
つまり、primary 以外のルートドメインを作成し、以前の操作をすべて実行しました。
システムが、以前のアクションが 1 つも行われていない状態のままであるようにするには、ldm init-system コマンドを使用して、物理的な I/O 変更が行われたドメインを復元する方法を参照してください。
バグ ID 15782994: 多数のドメインの構成に影響を与える操作を試みると、Logical Domains Manager がクラッシュして再起動する場合があります。この問題は、仮想ネットワーク構成に関連した何らかの設定を変更しようとした場合、および同じ仮想スイッチ内の多数の仮想ネットワークデバイスが多数のドメインにわたって存在する場合に発生することがあります。この問題は通常、同じ仮想スイッチに接続された仮想ネットワークデバイスを含むドメインが約 90 以上存在し、かつ inter-vnet-link プロパティーが有効になっている (デフォルトの動作) 場合に発生します。この現象は、ldmd ログファイルや、/var/opt/SUNWldm ディレクトリ内の core ファイルにある次のメッセージを見つけることによって確認します。
Frag alloc for 'domain-name'/MD memory of size 0x80000 failed
回避方法: 同じ仮想スイッチに接続された多数の仮想ネットワークデバイスを作成することを避けてください。そのような作成を意図的に行う場合は、仮想スイッチ上で inter-vnet-link プロパティーを off に設定します。このオプションによって、ゲストドメイン間のネットワークパフォーマンスに悪影響が発生する可能性があることに注意してください。
バグ ID 15781142: ldm list -o format コマンドが format の省略形を受け入れなくなりました。
Oracle VM Server for SPARC 3.0 ソフトウェアでは ldm list -o net コマンドを使用してネットワークに関する情報を表示できましたが、そのような省略形は Oracle VM Server for SPARC 3.1 ソフトウェアから削除されました。Oracle VM Server for SPARC 3.1 では、そのコマンドでフルバージョンの format を使用する必要があります (ldm list -o network)。
回避方法: ldm(1M) のマニュアルページに指定されている形式名を使用します。
バグ ID 15778392: 制御ドメインには、システム内の最小番号コアが必要です。そのため、コア ID 0 が最小番号コアである場合、制御ドメインにコア全体の制約を適用しようとすると、そのコアをほかのどのドメインとも共有することができません。
たとえば、システム内の最小番号コアがコア ID 0 である場合、制御ドメインは次の出力のようになるはずです。
# ldm ls -o cpu primary NAME primary VCPU VID PID CID UTIL STRAND 0 0 0 0.4% 100% 1 1 0 0.2% 100% 2 2 0 0.1% 100% 3 3 0 0.2% 100% 4 4 0 0.3% 100% 5 5 0 0.2% 100% 6 6 0 0.1% 100% 7 7 0 0.1% 100%
バグ ID 15776752: ライブ移行を取り消した場合、ターゲット上で作成されたドメインインスタンスのメモリーの内容をハイパーバイザが「スクラブする」必要があります。このスクラブ処理はセキュリティー上の理由から実行され、この処理を完了してからでないと、そのメモリーを空きメモリーのプールに返すことができません。このスクラブの進行中に、ldm コマンドが応答しなくなります。その結果、Logical Domains Manager がハングアップしているように見えます。
回復方法: ほかの ldm コマンドを実行しようとする前に、このスクラブリクエストが終了するまで待つ必要があります。この処理には長い時間がかかることがあります。たとえば、500G バイトのメモリーを備えたゲストドメインでは、この処理の完了に SPARC T4 サーバー上では最大 7 分、SPARC T3 サーバー上では最大 25 分かかることがあります。
バグ ID 15776319: 制御ドメインおよび I/O ドメイン上で Oracle Solaris OS が実行されているシステムでは、I/O ドメインに割り当てられた一部の Emulex カードが、割り込みを受信しないために正しく機能しません。ただし、制御ドメインに割り当てられると、同じカードが正しく機能します。
この問題は、次の Emulex カードで発生します。
Emulex 2-Gigabit/Sec PCI Express Single and Dual FC Host Adapter (SG-XPCIE1(2)FC-EM2)
Emulex 4-Gigabit/Sec PCI Express Single and Dual FC Host Adapter (SG-XPCIE2FC-EB4-N)
Emulex 4-Gigabit/Sec PCI Express Single and Dual FC Host Adapter (SG-XPCIE1(2)FC-EM4)
Emulex 8-Gigabit/Sec PCI Express Single and Dual FC Host Adapter (SG-XPCIE1(2)FC-EM8-Z)
Emulex 8-Gigabit/Sec PCI Express Single and Dual FC Host Adapter (SG-XPCIE1(2)FC-EM8-N)
回避方法: ありません。
バグ ID 15776123: ゲストドメインを SPARC T4 システムに移行中にそのドメインで cputrack コマンドが実行されている場合、移行が完了したあと、ターゲットマシン上のゲストドメインでパニックが発生することがあります。
回避方法: SPARC T4 システムへのゲストドメインの移行中に cputrack コマンドを実行しないでください。
バグ ID 15775668: 高い優先順位ポリシーを持つドメインは、より低い優先順位ポリシーを持つドメインから仮想 CPU リソースを横取りできます。この「横取り」処理の進行中、ldmd ログに 10 秒ごとに次の警告メッセージが表示されることがあります。
warning: Unable to unconfigure CPUs out of guest domain-name
回避方法: これらの誤解を招くようなメッセージは無視できます。
バグ ID 15775637: I/O ドメインには、ルートコンプレックスあたりに使用できる割り込みリソースの数に関する制限があります。
SPARC T3 および SPARC T4 システムでは、この制限は約 63 MSI/X ベクトルです。各 igb 仮想機能は、3 つの割り込みを使用します。ixgbe 仮想機能は、2 つの割り込みを使用します。
あるドメインに多数の仮想機能を割り当てると、そのドメインの、これらのデバイスをサポートするためのシステムリソースが不足します。次のようなメッセージが表示されることがあります。
WARNING: ixgbevf32: interrupt pool too full. WARNING: ddi_intr_alloc: cannot fit into interrupt pool
バグ ID 15775055: CPU 周波数が異なる 2 台のマシン間でドメインが移行されたあと、ldm list コマンドによる稼働時間レポートが正しくないことがあります。これらの正しくない結果は、稼働時間が、そのドメインが実行されているマシンの STICK 周波数に基づいて計算されるために発生します。ソースマシンとターゲットマシンの間で STICK 周波数が異なる場合は、稼働時間が間違ってスケーリングされて表示されます。
ゲストドメイン自体によって報告および表示される稼働時間は正確です。また、ゲストドメイン内の Oracle Solaris OS によって実行されるアカウンティングもすべて正確です。
バグ ID 15773603: Intel デュアルポート Ethernet Controller X540 カードでのブート時に、Oracle Solaris 10 ixgbe ドライバに起因するシステムパニックが発生する可能性があります。このパニックが発生するのは、このドライバが、ほかのドライバの接続を妨げる優先度の高いタイマーを持っているからです。
回避方法: システムをリブートします。
バグ ID 15771384: ドメインのゲストコンソールが、そのバインド前やバインド中にそのコンソールへの接続が繰り返し試みられた場合に休止することがあります。たとえば、ドメインがそのマシン上に移行されているときに、自動スクリプトを使用してそのコンソールをグラブする場合にこれが発生する可能性があります。
回避方法: コンソールの休止を解除するには、ドメインのコンソール端末集配信装置をホストするドメイン (通常は制御ドメイン) で次のコマンドを実行します。
primary# svcadm disable vntsd primary# svcadm enable vntsd
バグ ID 15765858: すべての仮想機能を破棄してスロットをルートドメインに戻しても、ルートコンプレックスのリソースが回復されません。
回避方法: 特定の PCIe バスに対する iov オプションを off に設定してください。
primary# ldm start-reconf primary primary# ldm set-io iov=off pci_0
バグ ID 15761509: このサポートドキュメントに記載された、直接 I/O (DIO) 機能をサポートする PCIe カードのみを使用してください。
回避方法: ldm add-io コマンドを使用して primary ドメインにカードをふたたび追加します。
バグ ID 15759601: ldm start コマンドの直後に ldm stop コマンドを発行すると、ldm stop コマンドが次のエラーで失敗する可能性があります。
LDom domain stop notification failed
回避方法: ldm stop コマンドをもう一度発行します。
バグ ID 15758883: ldm init-system コマンドを使用しても、保存した XML ファイルからゲストドメインに対する名前付き CPU コアの制約を復元できません。
回避方法: 次の手順を実行します。
primary ドメイン用の XML ファイルを作成します。
# ldm ls-constraints -x primary > primary.xml
ゲストドメイン (複数可) 用の XML ファイルを作成します。
# ldm ls-constraints -x ldom[,ldom][,...] > guest.xml
システムの電源を再投入し、出荷時のデフォルト構成でブートします。
XML 構成を primary ドメインに適用します。
# ldm init-system -r -i primary.xml
リブートします。
XML 構成をゲストドメイン (複数可) に適用します。
# ldm init-system -f -i guest.xml
バグ ID 15750727: 非常に多数の仮想機能が割り当てられた primary ドメインをリブートすると、システムでパニックが発生することがあります。
回避方法: 次のいずれかを実行してください。
仮想機能の数を減らすことで、失敗する仮想機能の数を減らします。この変更によってチップの応答性を維持できる可能性があります。
システムのすべての ixgbe 仮想機能に対して割り込みリソース管理 (IRM) プールがデフォルトで 1 つしか作成されないため、ixgbe 仮想機能用の IRM プールをより多く作成します。
バグ ID 15748348: primary ドメインが別のドメインと最小番号の物理コア (通常は 0) を共有している場合、primary ドメインでコア全体の制約を設定する試みが失敗します。
回避方法: 次の手順を実行します。
ドメインで共有されている、最小番号のバインドされたコアを判定します。
# ldm list -o cpu
primary ドメイン以外のすべてのドメインで、最小番号コアのすべての CPU スレッドのバインドを解除します。
結果として、最小番号コアの CPU スレッドは共有されず、primary ドメインに自由にバインドできるようになります。
次のいずれかを実行して、コア全体の制約を設定します。
CPU スレッドを primary ドメインにバインドし、ldm set-vcpu -c コマンドを使用してコア全体の制約を設定します。
ldm set-core コマンドを使用して、CPU スレッドのバインドとコア全体の制約の設定を一度に行います。
バグ ID 15738561: primary ドメインがブートされた直後に ldm list-io コマンドを実行すると、PCIe スロットや SR-IOV 仮想機能で UNK または INV 状態が表示される可能性があります。この問題の原因は、Oracle Solaris OS からの Logical Domains エージェント応答の遅延にあります。
この問題は、いくつかのシステムでのみ報告されています。
回避方法: Logical Domains エージェントから情報が受信されると、PCIe スロットや仮想機能のステータスが自動的に更新されます。
バグ ID 15731303: 500G バイトを超えるメモリーが搭載されたドメインは移行しないでください。ドメインのメモリー構成を確認するには、ldm list -o mem コマンドを使用します。合計 500G バイトを超える複数のメモリーブロックを含む一部のメモリー構成では、次のようなスタックでパニックが発生する可能性があります。
panic[cpu21]/thread=2a100a5dca0: BAD TRAP: type=30 rp=2a100a5c930 addr=6f696e740a232000 mmu_fsr=10009 sched:data access exception: MMU sfsr=10009: Data or instruction address out of range context 0x1 pid=0, pc=0x1076e2c, sp=0x2a100a5c1d1, tstate=0x4480001607, context=0x0 g1-g7: 80000001, 0, 80a5dca0, 0, 0, 0, 2a100a5dca0 000002a100a5c650 unix:die+9c (30, 2a100a5c930, 6f696e740a232000, 10009, 2a100a5c710, 10000) 000002a100a5c730 unix:trap+75c (2a100a5c930, 0, 0, 10009, 30027b44000, 2a100a5dca0) 000002a100a5c880 unix:ktl0+64 (7022d6dba40, 0, 1, 2, 2, 18a8800) 000002a100a5c9d0 unix:page_trylock+38 (6f696e740a232020, 1, 6f69639927eda164, 7022d6dba40, 13, 1913800) 000002a100a5ca80 unix:page_trylock_cons+c (6f696e740a232020, 1, 1, 5, 7000e697c00, 6f696e740a232020) 000002a100a5cb30 unix:page_get_mnode_freelist+19c (701ee696d00, 12, 1, 0, 19, 3) 000002a100a5cc80 unix:page_get_cachelist+318 (12, 1849fe0, ffffffffffffffff, 3, 0, 1) 000002a100a5cd70 unix:page_create_va+284 (192aec0, 300ddbc6000, 0, 0, 2a100a5cf00, 300ddbc6000) 000002a100a5ce50 unix:segkmem_page_create+84 (18a8400, 2000, 1, 198e0d0, 1000, 11) 000002a100a5cf60 unix:segkmem_xalloc+b0 (30000002d98, 0, 2000, 300ddbc6000, 0, 107e290) 000002a100a5d020 unix:segkmem_alloc_vn+c0 (30000002d98, 2000, 107e000, 198e0d0, 30000000000, 18a8800) 000002a100a5d0e0 genunix:vmem_xalloc+5c8 (30000004000, 2000, 0, 0, 80000, 0) 000002a100a5d260 genunix:vmem_alloc+1d4 (30000004000, 2000, 1, 2000, 30000004020, 1) 000002a100a5d320 genunix:kmem_slab_create+44 (30000056008, 1, 300ddbc4000, 18a6840, 30000056200, 30000004000) 000002a100a5d3f0 genunix:kmem_slab_alloc+30 (30000056008, 1, ffffffffffffffff, 0, 300000560e0, 30000056148) 000002a100a5d4a0 genunix:kmem_cache_alloc+2dc (30000056008, 1, 0, b9, fffffffffffffffe, 2006) 000002a100a5d550 genunix:kmem_cpucache_magazine_alloc+64 (3000245a740, 3000245a008, 7, 6028f283750, 3000245a1d8, 193a880) 000002a100a5d600 genunix:kmem_cache_free+180 (3000245a008, 6028f2901c0, 7, 7, 7, 3000245a740) 000002a100a5d6b0 ldc:vio_destroy_mblks+c0 (6028efe8988, 800, 0, 200, 19de0c0, 0) 000002a100a5d760 ldc:vio_destroy_multipools+30 (6028f1542b0, 2a100a5d8c8, 40, 0, 10, 30000282240) 000002a100a5d810 vnet:vgen_unmap_rx_dring+18 (6028f154040, 0, 6028f1a3cc0, a00, 200, 6028f1abc00) 000002a100a5d8d0 vnet:vgen_process_reset+254 (1, 6028f154048, 6028f154068, 6028f154060, 6028f154050, 6028f154058) 000002a100a5d9b0 genunix:taskq_thread+3b8 (6028ed73908, 6028ed738a0, 18a6840, 6028ed738d2, e4f746ec17d8, 6028ed738d4)
回避方法: 500G バイトを超えるメモリーを含むドメインの移行は実行しないでください。
バグ ID 15726205: ゲストドメインから多数の CPU を削除しようとすると、次のエラーメッセージが表示される可能性があります。
Request to remove cpu(s) sent, but no valid response received VCPU(s) will remain allocated to the domain, but might not be available to the guest OS Resource modification failed
回避方法: ゲストドメインから 100 個を超える CPU を削除する場合、事前にドメインを停止します。
バグ ID 15721872: ldm rm-io コマンドを使用して PCIe エンドポイントデバイスを primary ドメインから削除したあとで、Oracle Solaris のホットプラグ操作を使用してそのデバイスをホットリムーブすることができません。PCIe エンドポイントデバイスの置換や削除を行う方法については、Oracle VM Server for SPARC 3.1 管理ガイド のPCIe ハードウェアの変更を参照してください。
バグ ID 15710957: ハイブリッド I/O 構成が含まれた高負荷のゲストドメインを移行しようとすると、nxge パニックが発生することがあります。
回避方法: primary ドメイン、およびそのドメインのハイブリッド I/O 構成の一部であるサービスドメイン上で、/etc/system ファイルに次の行を追加します。
set vsw:vsw_hio_max_cleanup_retries = 0x200
バグ ID 15708982: 開始された移行や進行中の移行、またはすべての ldm コマンドがいつまでもハングアップします。この状況は、移行するドメインが別のシステムの共有ファイルシステムを使用し、そのファイルシステムが共有されなくなった場合に発生します。
回避方法: 共有ファイルシステムをふたたびアクセス可能にします。
バグ ID 15707426: システムログサービス svc:/system/system-log が起動に失敗してオンラインにならない場合、Logical Domains エージェントサービスもオンラインになりません。Logical Domains エージェントサービスがオンラインではない場合、virtinfo、ldm add-vsw、ldm add-vdsdev、ldm list-io commands の各コマンドが予想したとおりに動作しない場合があります。
回避方法: svc:/ldoms/agents:default サービスが有効化され、オンラインになっていることを確認します。
# svcs -l svc:/ldoms/agents:default
svc:/ldoms/agents:default サービスがオフラインの場合は、サービスが有効化されていることと、依存するすべてのサービスがオンラインであることを確認します。
バグ ID 15704500: アクティブなゲストドメインの移行がハングアップし、ソースマシンが応答しなくなることがあります。この問題が発生した場合、次のメッセージがコンソールと /var/adm/messages ファイルに書き込まれます。
vcc: i_vcc_ldc_fini: cannot close channel 15 vcc: [ID 815110 kern.notice] i_vcc_ldc_fini: cannot close channel 15
表示されるチャネル番号は Oracle Solaris 内部チャネル番号であり、警告メッセージごとに異なる可能性があります。
回避方法: ドメインを移行する前に、ゲストドメインのコンソールの接続を切断します。
回復方法: ソースマシンの電源を再投入します。
バグ ID 15702475: CPU の数が大幅に削減されたあとにロードされたドメインの DRM ポリシーの期限が切れると、Oracle VM Server for SPARC ログに No response メッセージが表示されることがあります。ldm list 出力には、psrinfo 出力に示されている数よりも多くの CPU リソースがドメインに割り当てられていることが示されています。
回避方法: ldm set-vcpu コマンドを使用して、ドメイン上の CPU の数を psrinfo 出力に示されている数にリセットします。
バグ ID 15701865: ターゲットマシン上の非アクティブなドメインに依存するドメインのライブ移行を試みると、ldmd デーモンで障害が発生してセグメント例外が生成され、ターゲットマシン上のドメインが再起動されます。それでも移行を実行できますが、それはライブ移行ではありません。
回避方法: ライブ移行を試みる前に、次のいずれかのアクションを実行してください。
移行するドメインからゲスト依存関係を削除します。
ターゲットマシン上のマスタードメインを起動します。
バグ ID 15701853: DRM ポリシーが有効な間にドメイン移行を実行し、その後、DRM ポリシーの期限が切れた場合、または移行されたドメインから DRM ポリシーが削除された場合、DRM はドメイン上の仮想 CPU の数を元の数に戻すことができません。
回避方法: DRM ポリシーがアクティブな間にドメインを移行し、その後 DRM ポリシーが削除された場合や DRM ポリシーの期限が切れた場合は、仮想 CPU の数をリセットします。ldm set-vcpu コマンドを使用し、ドメイン上の仮想 CPU の数を元の数に設定します。
バグ ID 15701258: 100 を超える仮想 CPU といくつかの暗号化装置を持つゲストドメインで ldm set-vcpu 1 コマンドを実行すると、仮想 CPU の削除に失敗します。仮想 CPU は DR タイムアウトエラーが原因で削除されません。暗号化装置は正常に削除されます。
回避方法: ldm rm-vcpu コマンドを使用して、ゲストドメインから仮想 CPU を 1 つを残してすべて削除します。1 回につき 100 を超える仮想 CPU を削除しないでください。
バグ ID 15699763: ドメインに重複する MAC アドレスが含まれている場合、そのドメインを移行できません。通常、この理由によって移行に失敗すると、失敗メッセージには MAC アドレスの重複が示されます。しかし、この失敗メッセージが、MAC アドレスの重複を報告しないことがまれにあります。
# ldm migrate ldg2 system2 Target Password: Domain Migration of LDom ldg2 failed
回避方法: ターゲットマシンの MAC アドレスが一意であることを確認します。
バグ ID 15696986: 2 つの ldm migrate コマンドを「反対方向」に同時に実行すると、その 2 つのコマンドがハングアップして完了できなくなる場合があります。反対方向の状況は、マシン A からマシン B への移行と、マシン B からマシン A への移行を同時に開始した場合に発生します。
ハングアップは、移行プロセスが –n を使用して予行演習として開始された場合でも発生します。この問題が発生した場合は、ほかの ldm コマンドもすべてハングアップする可能性があります。
回避方法: ありません。
バグ ID 15677358: 100 を超える CPU を制御ドメイン (primary ドメインとも呼ばれる) から削除する場合は、動的再構成ではなく遅延再構成を使用します。次の手順を実行します。
ldm start-reconf primary コマンドを使用して、制御ドメインを遅延再構成モードにします。
必要な数の CPU リソースを削除します。
CPU リソースの削除中に何らかの間違いをおかした場合は、制御ドメインがまだ遅延構成状態になっている間に CPU を削除する別のリクエストを試みないでください。そうした場合、コマンドが失敗します (遅延再構成中に実行を許可される CPU 構成操作は 1 つだけであるを参照)。代わりに、ldm cancel-reconf コマンドを使用して遅延構成処理を取り消し、最初からやり直します。
制御ドメインをリブートします。
バグ ID 15672651 および 15731467: 次の条件が満たされていると、ログイン時またはコマンド実行中に OS がハングすることがあります。
Oracle Solaris 10 8/11 OS が SPARC sun4v システムで実行されている
Power Management (PM) エラスティックポリシーが、システムの ILOM サービスプロセッサで設定されている
回避方法: パッチ ID 147149-01 を適用します。
バグ ID 15668881: pkgadd コマンドを使用して、Sun ZFS ストレージアプライアンスから NFS 経由でエクスポートされたディレクトリから SUNWldm.v パッケージをインストールすると、次のエラーメッセージが表示される場合があります。
cp: failed to set acl entries on /var/svc/manifest/platform/sun4v/ldmd.xml
回避方法: このメッセージは無視してください。
バグ ID 15668368: SPARC T3-1 システムには、デュアルポートディスクをインストールできます。このディスクには、2 つの異なる直接 I/O デバイスからアクセスできます。この 2 つの直接 I/O デバイスをそれぞれ異なるドメインに割り当てると、ディスクが両方のドメインで使用されることになり、ディスクの実際の使用状態によっては他方のドメインに影響を及ぼすことがあります。
回避方法: 同じディスクセットにアクセスする複数の直接 I/O デバイスを、それぞれ異なる I/O ドメインに割り当てないでください。SPARC T3-1 システムにデュアルポートディスクがあるかどうかを調べるには、次のコマンドを SP で実行します。
-> show /SYS/SASBP
出力の fru_description の値が次のとおりならば、対応するシステムにデュアルポートディスクがあります。
fru_description = BD,SAS2,16DSK,LOUISE
システムにデュアルディスクが存在している場合は、次に示す直接 I/O デバイスが両方とも同じドメインに割り当てられていることを確認します。
pci@400/pci@1/pci@0/pci@4 /SYS/MB/SASHBA0 pci@400/pci@2/pci@0/pci@4 /SYS/MB/SASHBA1
バグ ID 15667770: 1 つのドメインで複数の NIU nxge インスタンスが plumb されていると、ドメインからメモリーを削除する場合に使用する ldm rm-mem および ldm set-mem コマンドが、いつまでも完了しない可能性があります。メモリー削除処理中に問題が発生したかどうかを確認するには、ldm list -o status コマンドで処理の進行状況をモニターします。完了率が変わらない状態が何分間も続いているときは、この問題が発生している可能性があります。
回避方法: ldm rm-mem または ldm set-mem コマンドを取り消し、十分な量のメモリーが削除されたかどうかをチェックします。削除されていない場合は、もう一度メモリー削除コマンドを実行するときに削除するメモリーの量を小さくすると、正常に完了する可能性があります。
この問題が primary ドメインで発生した場合は、次を行なってください。
primary ドメインで遅延再構成処理を開始します。
# ldm start-reconf primary
必要な量のメモリーをこのドメインに割り当てます。
primary ドメインをリブートします。
この問題がその他のドメインで発生した場合は、そのドメインを停止してから、ドメインに割り当てるメモリー量を調節します。
バグ ID 15664666: リセット依存関係が作成されているときに、ldm stop -a コマンドを実行すると、リセット依存関係にあるドメインが単に停止するのではなく、再起動されることがあります。
回避方法: まず、ldm stop コマンドをマスタードメインに発行します。次に、ldm stop コマンドをスレーブドメインに発行します。スレーブドメインの初回の停止に失敗した場合は、ldm stop -f コマンドをスレーブドメインに対して実行します。
バグ ID 15655513: アクティブなドメインの移行後、マイグレートしたドメインの CPU 利用率が短時間で劇的に増加することがあります。移行の時点で動的リソース管理 (Dynamic Resource Managment、DRM) ポリシーがドメインに対して有効化されている場合は、Logical Domains Manager によって CPU の追加が開始されることがあります。特に、ポリシーの追加時にプロパティー vcpu-max および attack が指定されていなかった場合は、デフォルト値 unlimited が有効になるため、ターゲットマシンのバインドされていない CPU がすべて、マイグレートされたドメインに追加されます。
回復方法: 回復させる必要はありません。CPU 利用率が、DRM ポリシーで指定された上限を下回ると、Logical Domains Manager によって自動的に CPU が削除されます。
バグ ID 15655199: 使用中の MAC アドレスが検出されず、誤ってふたたび割り当てられることがあります。
回避方法: 使用中の MAC アドレスをふたたび割り当てることができないように手動で確認してください。
バグ ID 15654965: ldmconfig スクリプトが、格納されたドメイン構成をサービスプロセッサ (Service Processor、SP) 上に正しく作成できません。
回避方法: ldmconfig スクリプトが完了してドメインがリブートしたあと、システムの電源を再投入しないでください。代わりに、次の手順を手動で実行してください。
SP に構成を追加します。
# ldm add-spconfig new-config-name
primary-with-clients 構成を SP から削除します。
# ldm rm-spconfig primary-with-clients
システムの電源を再投入します。
システムの電源を再投入する前にこれらの手順を実行しなかった場合、primary-with-client 構成の存在により、ドメインが非アクティブになります。この場合、各ドメインを手動でバインドしてから、ldm start -a コマンドを実行してそれらのドメインを起動する必要があります。ゲストのブート後にこの処理を繰り返すと、電源の再投入後にゲストドメインが自動的にブートするようになります。
バグ ID 15653424: アクティブドメインの移行時に、ドメインで実行されているリリースが Oracle Solaris 10 10/09 OS のリリースよりも古く、かつドメイン内の最小番号の CPU が offline 状態の場合に、移行に失敗することがあります。この操作に失敗するのは、Logical Domains Manager が CPU DR を使用してドメインの CPU を 1 つだけに減らしたときです。このときに、Logical Domains Manager はドメイン内の最小番号の CPU を除いてすべて削除しようとしますが、最小番号の CPU がオフラインのため、処理が失敗します。
回避方法: 移行を実行する前に、ドメイン内の最小番号の CPU が online 状態になっていることを確認してください。
バグ ID 15646293: Oracle Solaris 10 9/10 ドメインが移行操作の中で一時停止状態にされたあとで、メモリー動的再構成 (Dynamic Reconfiguration、DR) が無効になります。このアクションは、移行に成功した場合だけでなく、移行がキャンセルされて、ドメインがソースマシン上に残っている場合にも行われます。
バグ ID 15631119: 制御ドメインの仮想ネットワークデバイスの最大伝送単位 (Maximum Transmission Unit、MTU) を変更すると、遅延再構成処理が起動されます。そのあとで遅延再構成をキャンセルしても、デバイスの MTU 値は元の値に復元されません。
回復方法: ldm set-vnet コマンドを再実行して MTU を元の値に設定します。MTU の設定を変更すると、制御ドメインが遅延再構成モードになりますが、このモードをキャンセルする必要があります。これで、MTU 値は元の正しい MTU 値になります。
# ldm set-vnet mtu=orig-value vnet1 primary # ldm cancel-op reconf primary
バグ ID 15606220: Logical Domains 1.3 リリース以降では、ドメインに暗号化装置がバインドされていてもドメインを移行できます。
次の場合には、移行の完了後、ターゲットマシンに 1 つの CPU しか含まれません。
ターゲットマシンで Logical Domains 1.2 が実行されている
ターゲットマシン上の制御ドメインが実行している Oracle Solaris OS のバージョンが、暗号化装置の DR をサポートしていない
暗号化装置が含まれるドメインを移行した
移行の完了後、ターゲットドメインは正常に再開され運用されますが、CPU が 1 つのみの縮退状態になります。
回避方法: 移行前に、Logical Domains 1.3 を実行しているソースマシンから暗号化装置を削除します。
軽減方法: この問題を回避するには、次の手順のいずれかまたは両方を実行します。
ターゲットマシンに最新の Oracle VM Server for SPARC ソフトウェアをインストールします。
ターゲットマシンの制御ドメインにパッチ ID 142245-01 をインストールするか、または Oracle Solaris 10 10/09 以降の OS にアップグレードします。
バグ ID 15605806: 特定の状況では、移行が失敗して次のエラーメッセージが表示され、ソースドメインに必要なメモリーをバインドできなかったことが ldmd で報告される場合があります。この状況は、ターゲットマシンで使用可能なメモリーの合計容量がソースドメインで使用されているメモリー容量 (ldm ls-devices -a mem で確認) より多い場合でも発生することがあります。
Unable to bind 29952M memory region at real address 0x8000000 Domain Migration of LDom ldg0 failed
原因: この障害は、ターゲットマシン上の実アドレス (Real Address、RA) と物理アドレス (Physical Address、PA) の間の一致要件を満たすことができないために発生します。
回避方法: ドメインを停止し、コールド移行として移行を実行します。ゲストドメイン上のメモリーのサイズを 128M バイト削減し、ドメインの動作中に移行が続行されるようにすることもできます。
バグ ID 15600969: 動作中のドメインからすべてのハードウェア暗号化装置を動的に削除すると、暗号化フレームワークがソフトウェア暗号化プロバイダへのシームレスな切り替えに失敗し、すべての ssh 接続が強制終了します。
回復方法: ドメインからすべての暗号化装置を削除したあと、ssh 接続を再確立します。
回避方法: サーバー側の /etc/ssh/sshd_config ファイルに UseOpenSSLEngine=no を設定し、svcadm restart ssh コマンドを実行します。
ssh 接続にはハードウェア暗号化装置が使用されなくなるので、パフォーマンスの向上というメリットはなくなりますが、暗号化装置が削除されても ssh 接続は切断されません。
バグ ID 15597025: PCI Express Dual 10-Gigabit Ethernet Fiber カード (X1027A-Z) が搭載されたシステム上で ldm ls-io -l コマンドを実行すると、次のような出力が表示される場合があります。
primary# ldm ls-io -l ... pci@500/pci@0/pci@c PCIE5 OCC primary network@0 network@0,1 ethernet ethernet
この出力には 4 つのサブデバイスが表示されていますが、この Ethernet カードにはポートが 2 個しかありません。これは、このカードには 4 つの PCI 機能があるために発生します。4 つの機能のうち 2 つは内部で無効になっており、ldm ls-io -l 出力では ethernet として表示されます。
回避方法: ldm ls-io -l 出力の ethernet エントリは無視してかまいません。
バグ ID 15591769: LUN の作成時に、同じ mpgroup を使用して、プライマリドメインと代替ドメインの両方の仮想ディスクサービスにそれを追加できます。LUN へのアクセス時に最初に使用するドメインを指定するには、その仮想ディスクサービスデバイスを最初に追加します。
primary-vds0 からの LUN を最初に使用するには、次のコマンドを実行します。
primary# ldm add-vdsdev mpgroup=ha lun1@primary-vds0 primary# ldm add-vdsdev mpgoup=ha lun1@alternate-vds0 primary# ldm add-vdisk disk1 lun1@primary-vds0 gd0
alternate-vds0 からの LUN を最初に使用するには、次のコマンドを実行します。
primary# ldm add-vdsdev mpgroup=ha lun1@alternate-vds0 primary# ldm add-vdsdev mpgoup=ha lun1@primary-vds0 primary# ldm add-vdisk disk1 lun1@alternate-vds0 gd0
バグ ID 15572184: いくつかのドメインがブート中だと ldm コマンドの応答が遅くなることがあります。この段階で ldm コマンドを実行すると、コマンドがハングアップしているように見える可能性があります。ldm コマンドは、期待されるタスクを実行したあとでリターンします。コマンドがリターンしたら、システムは通常どおり ldm コマンドに応答するはずです。
回避方法: 多数のドメインを同時にブートしないようにします。ただし、いくつかのドメインを同時にブートする必要がある場合、システムが通常の状態に戻るまで新しい ldm コマンドを実行しないようにします。たとえば、Sun SPARC Enterprise T5140 および T5240 サーバーでは約 2 分間、Sun SPARC Enterprise T5440 サーバーまたは Sun Netra T5440 サーバーでは約 4 分間待機します。
バグ ID 15560811: Oracle Solaris 11 では、Logical Domains 仮想ネットワークデバイスのみを含むドメインで、自動ネットワークインタフェース (anet) で構成されたゾーンが起動に失敗することがあります。
回避方法 1: 1 つ以上の物理ネットワークデバイスをゲストドメインに割り当てます。物理 NIC をドメインに割り当てるには、PCIe バス割り当て、直接 I/O (DIO)、または SR-IOV 機能を使用します。
回避方法 2: ゾーンの構成要件が、ゾーン間通信をドメイン内でのみ行わせることである場合、etherstub デバイスを作成します。ゾーン構成内で etherstub デバイスを「下位リンク」として使用し、etherstub デバイス上で仮想 NIC が作成されるようにします。
回避方法 3: 排他的リンク割り当てを使用して、Logical Domains 仮想ネットワークデバイスをゾーンに割り当てます。仮想ネットワークデバイスを必要に応じてドメインに割り当てます。多数の仮想ネットワークデバイスを作成できるように、inter-vnet リンクを無効にすることを選択することもできます。
バグ ID 15560201: 仮想ネットワークまたは仮想ディスクデバイスをドメインに追加したあと、ifconfig でデバイスが存在しないと表示されることがあります。この状態は、/devices エントリが作成されていないために発生することがあります。
この問題は通常操作時には発生しませんが、仮想ネットワークデバイスのインスタンス番号が /etc/path_to_inst ファイルに示されているインスタンス番号と一致しない場合にこのエラーが発生することがあります。
例:
# ifconfig vnet0 plumb ifconfig: plumb: vnet0: no such interface
仮想デバイスのインスタンス番号は、ldm list の出力内の「DEVICE」列の下に表示されます。
# ldm list -o network primary NAME primary MAC 00:14:4f:86:6a:64 VSW NAME MAC NET-DEV DEVICE DEFAULT-VLAN-ID PVID VID MTU MODE primary-vsw0 00:14:4f:f9:86:f3 nxge0 switch@0 1 1 1500 NETWORK NAME SERVICE DEVICE MAC MODE PVID VID MTU vnet1 primary-vsw0@primary network@0 00:14:4f:f8:76:6d 1 1500
このインスタンス番号 (ここに示す vnet および vsw の場合は両方とも 0) と path_to_inst ファイルのインスタンス番号が確実に一致するように、両方の番号を比較できます。
# egrep '(vnet|vsw)' /etc/path_to_inst "/virtual-devices@100/channel-devices@200/virtual-network-switch@0" 0 "vsw" "/virtual-devices@100/channel-devices@200/network@0" 0 "vnet"
回避方法: インスタンス番号が一致していない場合、その仮想ネットワークまたは仮想スイッチデバイスを削除します。次に、id プロパティーを設定することで必要なインスタンス番号を明示的に指定し、それらをふたたび追加します。
/etc/path_to_inst ファイルを手動で編集することもできます。path_to_inst(4) のマニュアルページを参照してください。
注意 - /etc/path_to_inst への変更を安易に行わないようにしてください。 |
バグ ID 15555509: システムに Logical Domains が構成されている場合に別の XAUI ネットワークカードを追加すると、マシンの電源を再投入してもそのカードは表示されません。
回復方法: 新しく追加した XAUI が制御ドメインに表示されるようにするには、次の手順を実行します。
制御ドメインにダミー変数を設定し、クリアーします。
次のコマンドでは、fix-xaui というダミー変数を使用しています。
# ldm set-var fix-xaui=yes primary # ldm rm-var fix-xaui primary
変更した構成を SP に保存し、現在の構成を置き換えます。
次のコマンドでは構成名 config1 を使用しています。
# ldm rm-spconfig config1 # ldm add-spconfig config1
制御ドメインの再構成リブートを実行します。
# reboot -- -r
この時点で、新しく使用可能になったネットワークを Logical Domains 用に構成できます。
バグ ID 15543982: Sun Fire T5240 などのシステムでは、専用 PCI-E ルートコンプレックスで最大 2 つのドメインを構成できます。このようなシステムには、2 つの UltraSPARC T2 Plus CPU と 2 つの I/O ルートコンプレックスが装備されています。
pci@500 と pci@400 が、システムの 2 つのルートコンプレックスです。primary ドメインには、少なくとも 1 つのルートコンプレックスが必ず含まれます。2 つ目のドメインは、割り当てまたはバインドされていないルートコンプレックスを使用して構成できます。
pci@400 ファブリック (またはリーフ) には、オンボード e1000g ネットワークカードが備わっています。次の状況では、ドメインでパニックが発生する場合があります。
システムが pci@500 を含む primary ドメインと pci@400 を含む 2 つ目のドメインで構成されている場合
2 つ目のドメインのブートに、pci@400 ファブリック上の e1000g デバイスが使用される
次のネットワークデバイスが primary 以外のドメインに構成されている場合、これらのデバイスを避けてください。
/pci@400/pci@0/pci@c/network@0,1 /pci@400/pci@0/pci@c/network@0
これらの条件に該当する場合、PCI-E の致命的エラーが発生し、そのドメインでパニックが発生します。
このような構成を避けるか、またはこのような構成を使用している場合は、示されているデバイスからブートしないでください。
バグ ID 15527921: 移行中、明示的に割り当てられたコンソールグループおよびポートはすべて無視され、デフォルトのプロパティーを持つコンソールがターゲットドメインに作成されます。このコンソールは、コンソールグループとしてターゲットドメイン名を使用し、制御ドメインの最初の仮想コンソール端末集配信装置 (vcc) デバイスの使用可能ポートを使用して作成されます。デフォルトのグループ名と競合する場合、移行は失敗します。
回復方法: 移行後に明示的なコンソールプロパティーを復元するには、ターゲットドメインのバインドを解除し、ldm set-vcons コマンドを使用して目的のプロパティーを手動で設定します。
バグ ID 15523133: ターゲットマシンの仮想ディスクが指しているディスクバックエンドがソースマシンで使用されているものとは異なる場合は、移行されたドメインがそのディスクバックエンドを使用して仮想ディスクにアクセスすることはできません。そのドメインの仮想ディスクにアクセスすると、ハングアップする可能性があります。
現時点では、Logical Domains Manager が確認するのは仮想ディスクのボリューム名がソースマシンとターゲットマシンで一致しているかどうかだけです。このときに、ディスクのバックエンドが一致していなくてもエラーメッセージは表示されません。
回避方法: 移行されたドメインを受け取るようにターゲットドメインを構成するときに、ディスクボリューム (vdsdev) が、ソースドメインで使用されているディスクバックエンドと一致していることを確認します。
回復方法: ターゲットマシン上の仮想ディスクデバイスが誤ったディスクバックエンドを指していることがわかった場合は、次のいずれかの処理を実行します。
ドメインを移行し、vdsdev を修正します。
ドメインを移行してソースマシンに戻します。
ターゲットの vdsdev が正しいディスクバックエンドを指すように修正します。
ドメインをターゲットマシンに再度移行します。
ターゲットでドメインを停止し、バインドを解除して、vdsdev を修正します。OS で仮想 I/O 動的再構成がサポートされていて、誤った仮想ディスクがドメインで使用中でない場合 (つまり、ブートディスクではなくアンマウントされている場合) は、次の手順を実行します。
ldm rm-vdisk コマンドを使用してディスクを削除します。
vdsdev を修正します。
ldm add-vdisk コマンドを使用して仮想ディスクをふたたび追加します。
バグ ID 15523120: 特定の状況では、移行が失敗し、ソースドメインに必要なメモリーをバインドできなかったことが ldmd で報告される場合があります。この状況は、ターゲットマシンで使用可能なメモリーの合計容量がソースドメインで使用されているメモリー容量より多い場合でも発生することがあります。
この障害は、ソースドメインで使用されている特定のメモリー範囲を移行するには、ターゲットでもそれに対応するメモリー範囲が使用可能である必要があるために発生します。ソースのメモリー範囲に対応するメモリー範囲が見つからない場合、移行は続行できません。
回復方法: この状況が発生した場合は、ターゲットマシンのメモリー使用量を変更すると、ドメインを移行できるようになることがあります。この操作を行うには、ターゲットでバインドされている、またはアクティブな論理ドメインのバインドを解除します。
使用可能なメモリーとその使用状況を確認するには、ldm list-devices -a mem コマンドを使用してください。また、別のドメインへのメモリーの割り当て量を減らす必要があることもあります。
バグ ID 15518409: マシンにネットワークが構成されていない場合にネットワーク情報サービス (Network Information Service、NIS) クライアントが実行されていると、Logical Domains Manager が起動しません。
回避方法: ネットワークに接続されていないマシン上の NIS クライアントを無効にします。
# svcadm disable nis/client
バグ ID 15516245: アクティブな論理ドメインが、ブートしてから長時間が経過していたり、ドメイン移行の完了後であるにもかかわらず、通常の状態ではなく移行状態として表示されることがあります。この不具合が問題を引き起こすことはなく、ドメインは正常に動作しています。設定されているフラグを確認するには、ldm list -l -p コマンド出力の flags フィールドを確認するか、あるいは ldm list コマンドの FLAGS フィールドを確認します。このフィールドには、通常の場合は -n----、移行の場合は -t---- と表示されます。
回復方法: 次回のリブート後に、ドメインの正しい状態が表示されます。
バグ ID 15513998: ドメインの移行後、そのドメインのコンソールに接続できない場合があります。
回避方法: コンソールに接続できるようにするには、vntsd SMF サービスを再起動します。
# svcadm restart vntsd
バグ ID 15511551: Logical Domains システムのコマンド行から uadmin 1 0 コマンドを実行すると、それ以降のリセットでシステムが ok プロンプトに戻らない場合があります。この誤った動作は、Logical Domains 変数 auto-reboot? が true に設定されている場合にのみ発生します。auto-reboot? が false に設定されている場合は、期待どおりに動作します。
回避方法: 代わりに次のコマンドを使用します。
uadmin 2 0
または、常に auto-reboot? を false に設定して実行するようにします。
バグ ID 15505014: CPU が 1 つのみでメモリーが大容量の構成では、ドメインの停止またはメモリーのスクラブに 15 分以上かかることがあります。停止の際、ドメインの CPU はそのドメインが所有するすべてのメモリーをスクラブするために使用されます。CPU が 1 つのみでメモリーが 512G バイトのドメインのように不均衡な構成では、スクラブの完了までに非常に長い時間がかかる場合があります。スクラブ時間が長くなると、ドメインの停止に必要な時間も長くなります。
回避方法: 大容量メモリー構成 (100G バイトを超えるもの) では必ず、少なくとも 1 つのコアが存在するようにします。
バグ ID 15469227: SC リセットのあとに、少なくとも Oracle Solaris 10 5/08 OS が動作している制御ドメイン上で scadm コマンドがハングアップすることがあります。SC のリセット後、システムは適切に接続を再確立できません。
回復方法: ホストをリブートして SC との接続を再確立します。
バグ ID 15453968: 共通のコンソールグループを持つシステムで、複数のゲストドメインのネットインストールを同時に実行すると失敗します。
回避方法: それぞれ固有のコンソールグループを持つゲストドメインでのみネットインストールを実行してください。この障害は、ネットインストールを行う複数のドメイン間で共有される、共通のコンソールグループを使用するドメインでのみ発生します。
バグ ID 15422900: 動的ホスト構成プロトコル (Dynamic Host Configuration Protocol、DHCP) を使用している同一ネットワーク上で、ゲストドメインに 5 つ以上の仮想ネットワーク (vnet) を構成すると、ネットワークトラフィックの実行中に、ゲストドメインが最終的に応答しなくなることがあります。
回避方法: インタフェースが 8 個ある場合、ip_ire_min_bucket_cnt と ip_ire_max_bucket_cnt を 32 などの大きな値に設定します。
回復方法: 問題のゲストドメイン (ldom) 上で、ldm stop-domain ldom コマンドを発行したあと、ldm start-domain ldom コマンドを発行します。
バグ ID 15387338: この問題の概要はLogical Domains 変数の永続性で説明していますが、この問題は制御ドメインにのみ影響します。
バグ ID 15370442: Logical Domains 環境では、広域ネットワーク (WAN) ブートキーの設定または削除を Oracle Solaris OS 内から、ickey(1M) コマンドを使用して行うことはサポートされていません。ickey 操作はすべて失敗し、次のようなエラーが表示されます。
ickey: setkey: ioctl: I/O error
また、制御ドメイン以外の論理ドメインで OpenBoot ファームウェアを使用して設定された WAN ブートキーは、ドメインをリブートすると記憶されていません。これらのドメインでは、OpenBoot ファームウェアで設定したキーは 1 回の使用にのみ有効です。
バグ ID 15368170: ldm stop-domain コマンドの動作がわかりにくい場合があります。
# ldm stop-domain -f ldom
ドメインにカーネルモジュールデバッガ kmdb(1) のプロンプトが表示されている場合、ldm stop-domain コマンドが失敗し、次のエラーメッセージが表示されます。
LDom <domain-name> stop notification failed