Oracle® VM Server for SPARC 3.2 リリースノート

印刷ビューの終了

更新: 2015 年 5 月
 
 

SR-IOV の問題

ldm remove-io コマンドが最後の SR-IOV 仮想機能を I/O ドメインから削除するときにタイムアウトを報告して失敗する

バグ ID 20731016: ldm remove-io コマンドを使用して最後の SR-IOV 仮想機能を I/O ドメインから削除するときに、コマンドがタイムアウトを報告して仮想機能の削除に失敗する場合があります。

回避方法: この問題が発生した場合は、次の手順を実行します。

  1. system/management/hwmgmtd パッケージがシステムにインストールされていることを確認します。

    # pkg info system/management/hwmgmtd
  2. svc:/system/sp/management サービスを無効にします。

    # svcadm disable -st svc:/system/sp/management
  3. ldm remove-io コマンドを再試行します。

  4. SR-IOV 仮想機能が正常に削除されたら、svc:/system/sp/management サービスを有効にします。

    # svcadm enable svc:/system/sp/management

SR-IOV 仮想機能がゲストドメインに割り当てられた Oracle Solaris 10 ルートドメインをリブートするときに、まれに不正なトラップパニックが発生する

バグ ID 18323562: リブート時に Oracle Solaris 10 ルートドメインでパニックが発生する可能性があります。Oracle Solaris 10 ルートドメインには少なくとも 2 つの PCIe バスがあり、異なるバス内の物理機能からの仮想機能はゲストドメインに割り当てられます。つまり、ゲストドメインで異なるバスからのイベントを並列で受け取った場合、ルートドメインでパニックが発生することがあります。このパニックが起こることはまれです。

panic[cpu3]/thread=2a100365c80: BAD TRAP: type=31 rp=2a1003652b0 addr=2000
mmu_fsr=0 occurred in module "pcie" due to an illegal access to a user
address

回避方法: ありません。

SR-IOV 仮想機能の破棄後に prtdiag によって Oracle Solaris 10 ルートドメインでパニックが発生することがある

バグ ID 18323370: 仮想機能を破棄して prtdiag コマンドを実行すると、Oracle Solaris 10 ルートドメインでパニックが発生することがあります。

破棄されたばかりの仮想機能デバイスノードにアクセスしようとすると、prtdiag コマンドによってパニックが発生することがあります。

panic[cpu31]/thread=2a10140bc80: Fatal error has occured in: PCIe
fabric.(0x1)(0x43)

また、prtdiag コマンドは次のようなメッセージを出力します。

DEV_GET failed -1 Invalid argument  4.0.2 offset 0xff
/SYS/PCI-EM4      PCIE  fibre-channel-pciex10df,e200                   --
                     /pci@600/pci@1/pci@0/pci@4/fibre-channel@0,2

これらのメッセージは、prtdiag コマンドが破棄された仮想機能デバイスノードにアクセスしようとしたために発生します。ノードは引き続き picl ツリーには表示されますが、実際のデバイスツリーには表示されません。

回避方法: パニックを避けるには、Oracle Solaris 10 ルートドメインの /etc/system ファイルに次の行を追加します。

set px:pxtool_cfg_delay_usec=25000

また、「Invalid argument」メッセージを回避するために picl デーモンをリフレッシュします。

# svcadm refresh picl

ファイバチャネル物理機能が FMA によって障害検出され、無効になる

バグ ID 18168525 および 18156291: ファイバチャネル PCIe カードは、NPIV をサポートし、その PCIe カードと互換性のあるファイバチャネルスイッチに接続する必要があります。この構成を使用しない場合、format コマンドを使用したり、仮想機能を作成または破棄したりすると、物理機能が FMA によって障害検出され、無効になる可能性があります。この障害が発生した場合は、次のようなメッセージが表示されます。

SUNW-MSG-ID: PCIEX-8000-0A, TYPE: Fault, VER: 1, SEVERITY: Critical
EVENT-TIME: event-time
PLATFORM: platform-type
SOURCE: eft, REV: 1.16
EVENT-ID: event-ID
DESC: A problem was detected for a PCIEX device.
AUTO_RESPONSE: One or more device instances may be disabled
IMPACT: Loss of services provided by the device instances associated with
this fault
REC-ACTION: Use 'fmadm faulty' to provide a more detailed view of this event.
Please refer to the associated reference document at
http://support.oracle.com/msg/PCIEX-8000-0A for the latest service procedures
and policies regarding this diagnosis.

回避方法: そのカードが FMA によって障害検出された場合は、まずその接続をチェックして、カードがストレージに直接接続されていないことを確認します。次に、使用している構成に対応する手順を実行します。

  • カードがストレージに直接接続されている – ファイバチャネル PCIe カードを正しく構成します。そのためには、NPIV をサポートし、その PCIe カードと互換性のあるファイバチャネルスイッチにそれを接続します。次に、fmadm repair コマンドを実行して FMA 診断をオーバーライドします。

  • カードがストレージに直接接続されていない – カードを交換します。

I/O ドメインの停止または起動時に制御ドメインがハングアップする

 

バグ ID 18030411: I/O ドメインを頻繁かつ立て続けに停止および起動すると、primary ドメインがハングアップする可能性があります。この動作の結果として、InfiniBand HCA が応答しなくなり、primary ドメインがハングアップします。

この問題が発生した場合は、次のようなメッセージがコンソール上または messages ファイルに表示されることがあります。

VF3: PF has failed

Mcxnex: HW2SW_MPT command @ failed: 0000ffff

Hermon: MAD_IFC (port 01) command failed: 0000ffff

WARNING: mcxnex0: Device Error: HCR Timeout waiting for command go bit

回復方法: この問題を回避するには、I/O ドメインの不必要な停止や起動を行わないでください。代わりに、I/O ドメインの正常なシャットダウンを行なってください。

回避方法: このような理由で primary ドメインがハングアップした場合は、次のいずれかの方法でシステムをリセットします。

  • そのドメインのリブートを実行します。

    primary# ldm stop -r domain-name
  • SP でリセットを実行します。

    -> reset /SYS

ファイバチャネル仮想機能の作成時に警告がコンソールに表示される

バグ ID 17623156: ファイバチャネル仮想機能を作成するときに、次の警告が表示されることがあります。

WARNING: kmem_cache_destroy: 'px0_emlxs3_3_cache2'
  (3000383e030) not empty
WARNING: vmem_destroy('px0_emlxs3_3_vmem_top'):
  leaked 262144 identifiers

これらのメッセージは、通常のシステム操作には影響しないため、無視してかまいません。

回避方法: ありません。

ファイバチャネル物理機能の構成変更が完了するのに数分かかる

バグ ID 16397888: 仮想機能を追加または破棄したあと、ファイバチャネル物理機能からさらなる仮想機能の追加または破棄を試せるようになるまで最大 5 分かかることがあります。

5 分経過する前にこれらの操作の実行を試みると、操作は失敗して、次のようなメッセージが表示されます。

The attempt to offline the pf /SYS/PCI-EM4/IOVFC.PF0 in domain
primary failed.
Error message from svc:/ldoms/agents in domain primary:
CMD_OFFLINE Failed. ERROR: devices or resources are busy.

回避方法: 5 分間待ってから、ファイバチャネル物理機能に対する新たな IOV 操作を試みてください。

必要なすべての構成オプションを 1 つのコマンドで実行するには、ldm create-vf -n max または ldm destroy-vf -n max コマンドを使用します。

Fujitsu M10 サーバーには異なる SR-IOV 機能の制限がある

Fujitsu M10 サーバーでは、特定の PCIe バスの PCIe エンドポイントデバイスおよび SR-IOV 仮想機能を、最大 24 個のドメインに割り当てることができます。サポートされている SPARC T シリーズおよび SPARC M シリーズのプラットフォームでは、この最大値は 15 です。

InfiniBand SR-IOV の問題


Caution

注意  - 使用している Oracle VM Server for SPARC 3.1 環境に InfiniBand SR-IOV を配備する前に、このセクションを確認してください。


    このセクションでは、初期リリースの Oracle VM Server for SPARC 3.1 に含まれている InfiniBand SR-IOV 機能の既知の問題について説明します。

  • InfiniBand 仮想機能が割り当てられている Oracle Solaris 11.1.10.5.0 I/O ドメインのリブートによって、対応するルートドメインがパニックになることがときどきあります。バグ ID 17336355 を参照してください。

  • InfiniBand 仮想機能が割り当てられている Oracle Solaris 10 1/13 I/O ドメインがリブート中にパニックになることがときどきあります。この I/O ドメインでは、Oracle Solaris 10 1/13 OS と必須パッチが実行されています。バグ ID 17382933、17361763、17329218、および 17336035 を参照してください。

InfiniBand SR-IOV 操作で誤解を招くようなメッセージが表示される

バグ ID 16979993: InfiniBand デバイスで動的 SR-IOV 操作の使用を試みると、紛らわしい不適切なエラーメッセージが表示されます。

動的 SR-IOV は InfiniBand デバイスでサポートされていません。

回避方法: 次のいずれかの手順を実行して、InfiniBand 仮想機能を管理します。