バグ ID 20731016: ldm remove-io コマンドを使用して最後の SR-IOV 仮想機能を I/O ドメインから削除するときに、コマンドがタイムアウトを報告して仮想機能の削除に失敗する場合があります。
回避方法: この問題が発生した場合は、次の手順を実行します。
system/management/hwmgmtd パッケージがシステムにインストールされていることを確認します。
# pkg info system/management/hwmgmtd
svc:/system/sp/management サービスを無効にします。
# svcadm disable -st svc:/system/sp/management
ldm remove-io コマンドを再試行します。
SR-IOV 仮想機能が正常に削除されたら、svc:/system/sp/management サービスを有効にします。
# svcadm enable svc:/system/sp/management
バグ ID 18323562: リブート時に Oracle Solaris 10 ルートドメインでパニックが発生する可能性があります。Oracle Solaris 10 ルートドメインには少なくとも 2 つの PCIe バスがあり、異なるバス内の物理機能からの仮想機能はゲストドメインに割り当てられます。つまり、ゲストドメインで異なるバスからのイベントを並列で受け取った場合、ルートドメインでパニックが発生することがあります。このパニックが起こることはまれです。
panic[cpu3]/thread=2a100365c80: BAD TRAP: type=31 rp=2a1003652b0 addr=2000 mmu_fsr=0 occurred in module "pcie" due to an illegal access to a user address
回避方法: ありません。
バグ ID 18323370: 仮想機能を破棄して prtdiag コマンドを実行すると、Oracle Solaris 10 ルートドメインでパニックが発生することがあります。
破棄されたばかりの仮想機能デバイスノードにアクセスしようとすると、prtdiag コマンドによってパニックが発生することがあります。
panic[cpu31]/thread=2a10140bc80: Fatal error has occured in: PCIe fabric.(0x1)(0x43)
また、prtdiag コマンドは次のようなメッセージを出力します。
DEV_GET failed -1 Invalid argument 4.0.2 offset 0xff /SYS/PCI-EM4 PCIE fibre-channel-pciex10df,e200 -- /pci@600/pci@1/pci@0/pci@4/fibre-channel@0,2
これらのメッセージは、prtdiag コマンドが破棄された仮想機能デバイスノードにアクセスしようとしたために発生します。ノードは引き続き picl ツリーには表示されますが、実際のデバイスツリーには表示されません。
回避方法: パニックを避けるには、Oracle Solaris 10 ルートドメインの /etc/system ファイルに次の行を追加します。
set px:pxtool_cfg_delay_usec=25000
また、「Invalid argument」メッセージを回避するために picl デーモンをリフレッシュします。
# svcadm refresh picl
バグ ID 18168525 および 18156291: ファイバチャネル PCIe カードは、NPIV をサポートし、その PCIe カードと互換性のあるファイバチャネルスイッチに接続する必要があります。この構成を使用しない場合、format コマンドを使用したり、仮想機能を作成または破棄したりすると、物理機能が FMA によって障害検出され、無効になる可能性があります。この障害が発生した場合は、次のようなメッセージが表示されます。
SUNW-MSG-ID: PCIEX-8000-0A, TYPE: Fault, VER: 1, SEVERITY: Critical EVENT-TIME: event-time PLATFORM: platform-type SOURCE: eft, REV: 1.16 EVENT-ID: event-ID DESC: A problem was detected for a PCIEX device. AUTO_RESPONSE: One or more device instances may be disabled IMPACT: Loss of services provided by the device instances associated with this fault REC-ACTION: Use 'fmadm faulty' to provide a more detailed view of this event. Please refer to the associated reference document at http://support.oracle.com/msg/PCIEX-8000-0A for the latest service procedures and policies regarding this diagnosis.
回避方法: そのカードが FMA によって障害検出された場合は、まずその接続をチェックして、カードがストレージに直接接続されていないことを確認します。次に、使用している構成に対応する手順を実行します。
カードがストレージに直接接続されている – ファイバチャネル PCIe カードを正しく構成します。そのためには、NPIV をサポートし、その PCIe カードと互換性のあるファイバチャネルスイッチにそれを接続します。次に、fmadm repair コマンドを実行して FMA 診断をオーバーライドします。
カードがストレージに直接接続されていない – カードを交換します。
バグ ID 18030411: I/O ドメインを頻繁かつ立て続けに停止および起動すると、primary ドメインがハングアップする可能性があります。この動作の結果として、InfiniBand HCA が応答しなくなり、primary ドメインがハングアップします。
この問題が発生した場合は、次のようなメッセージがコンソール上または messages ファイルに表示されることがあります。
VF3: PF has failed Mcxnex: HW2SW_MPT command @ failed: 0000ffff Hermon: MAD_IFC (port 01) command failed: 0000ffff WARNING: mcxnex0: Device Error: HCR Timeout waiting for command go bit
回復方法: この問題を回避するには、I/O ドメインの不必要な停止や起動を行わないでください。代わりに、I/O ドメインの正常なシャットダウンを行なってください。
回避方法: このような理由で primary ドメインがハングアップした場合は、次のいずれかの方法でシステムをリセットします。
そのドメインのリブートを実行します。
primary# ldm stop -r domain-name
SP でリセットを実行します。
-> reset /SYS
バグ ID 17623156: ファイバチャネル仮想機能を作成するときに、次の警告が表示されることがあります。
WARNING: kmem_cache_destroy: 'px0_emlxs3_3_cache2' (3000383e030) not empty WARNING: vmem_destroy('px0_emlxs3_3_vmem_top'): leaked 262144 identifiers
これらのメッセージは、通常のシステム操作には影響しないため、無視してかまいません。
回避方法: ありません。
バグ ID 16397888: 仮想機能を追加または破棄したあと、ファイバチャネル物理機能からさらなる仮想機能の追加または破棄を試せるようになるまで最大 5 分かかることがあります。
5 分経過する前にこれらの操作の実行を試みると、操作は失敗して、次のようなメッセージが表示されます。
The attempt to offline the pf /SYS/PCI-EM4/IOVFC.PF0 in domain primary failed. Error message from svc:/ldoms/agents in domain primary: CMD_OFFLINE Failed. ERROR: devices or resources are busy.
回避方法: 5 分間待ってから、ファイバチャネル物理機能に対する新たな IOV 操作を試みてください。
必要なすべての構成オプションを 1 つのコマンドで実行するには、ldm create-vf -n max または ldm destroy-vf -n max コマンドを使用します。
Fujitsu M10 サーバーでは、特定の PCIe バスの PCIe エンドポイントデバイスおよび SR-IOV 仮想機能を、最大 24 個のドメインに割り当てることができます。サポートされている SPARC T シリーズおよび SPARC M シリーズのプラットフォームでは、この最大値は 15 です。
注意 - 使用している Oracle VM Server for SPARC 3.1 環境に InfiniBand SR-IOV を配備する前に、このセクションを確認してください。 |
このセクションでは、初期リリースの Oracle VM Server for SPARC 3.1 に含まれている InfiniBand SR-IOV 機能の既知の問題について説明します。
InfiniBand 仮想機能が割り当てられている Oracle Solaris 11.1.10.5.0 I/O ドメインのリブートによって、対応するルートドメインがパニックになることがときどきあります。バグ ID 17336355 を参照してください。
InfiniBand 仮想機能が割り当てられている Oracle Solaris 10 1/13 I/O ドメインがリブート中にパニックになることがときどきあります。この I/O ドメインでは、Oracle Solaris 10 1/13 OS と必須パッチが実行されています。バグ ID 17382933、17361763、17329218、および 17336035 を参照してください。
バグ ID 16979993: InfiniBand デバイスで動的 SR-IOV 操作の使用を試みると、紛らわしい不適切なエラーメッセージが表示されます。
動的 SR-IOV は InfiniBand デバイスでサポートされていません。
回避方法: 次のいずれかの手順を実行して、InfiniBand 仮想機能を管理します。