Oracle® VM Server for SPARC 3.2 릴리스 노트

인쇄 보기 종료

업데이트 날짜: 2015년 5월
 
 

SR-IOV 문제

ldm remove-io 명령에 시간 초과가 보고되고 I/O 도메인에서 마지막 SR-IOV 가상 기능을 제거하지 못함

버그 ID 20731016: ldm remove-io 명령을 사용하여 I/O 도메인에서 마지막 SR-IOV 가상 기능을 제거할 때 명령에 시간 초과가 보고되고 가상 기능을 제거하지 못할 수 있습니다.

임시해결책: 이 문제가 발생하면 다음 단계를 수행합니다.

  1. system/management/hwmgmtd 패키지가 시스템에 설치되었는지 확인합니다.

    # pkg info system/management/hwmgmtd
  2. svc:/system/sp/management 서비스를 사용 안함으로 설정합니다.

    # svcadm disable -st svc:/system/sp/management
  3. ldm remove-io 명령을 재시도합니다.

  4. SR-IOV 가상 기능이 성공적으로 제거되면 svc:/system/sp/management 서비스를 사용으로 설정합니다.

    # svcadm enable svc:/system/sp/management

SR-IOV 가상 기능이 게스트 도메인에 지정된 Oracle Solaris 10 루트 도메인을 재부트할 때 잘못된 트랩 패닉이 발생함

버그 ID 18323562: 재부트할 때 Oracle Solaris 10 루트 도메인에 패닉이 발생할 수 있습니다. Oracle Solaris 10 루트 도메인에는 최소한 2개의 PCIe 버스가 포함되며 다른 여러 버스에 있는 물리적 기능으로부터 가상 기능이 게스트 도메인에 지정됩니다. 즉, 게스트 도메인에서 여러 다른 버스의 이벤트가 병렬로 수신되면 루트 도메인에 패닉이 발생할 수 있습니다. 이러한 패닉은 드물게 발생합니다.

panic[cpu3]/thread=2a100365c80: BAD TRAP: type=31 rp=2a1003652b0 addr=2000
mmu_fsr=0 occurred in module "pcie" due to an illegal access to a user
address

임시해결책: 없음.

SR-IOV 가상 기능을 삭제한 후 prtdiag를 실행할 때 Oracle Solaris 10 루트 도메인에 패닉이 발생할 수 있음

버그 ID 18323370: 가상 기능을 삭제한 후 prtdiag 명령을 실행하면 Oracle Solaris 10 루트 도메인에 패닉이 발생할 수 있습니다.

prtdiag 명령을 실행하면 바로 전에 삭제된 가상 기능 장치 노드에 액세스하려고 시도할 때 패닉이 발생할 수 있습니다.

panic[cpu31]/thread=2a10140bc80: Fatal error has occured in: PCIe
fabric.(0x1)(0x43)

그리고 prtdiag 명령이 다음과 같은 메시지를 출력합니다.

DEV_GET failed -1 Invalid argument  4.0.2 offset 0xff
/SYS/PCI-EM4      PCIE  fibre-channel-pciex10df,e200                   --
                     /pci@600/pci@1/pci@0/pci@4/fibre-channel@0,2

이러한 메시지는 prtdiag 명령이 이미 삭제된 가상 기능 장치 노드에 액세스하려고 시도하기 때문에 발생합니다. 노드가 picl 트리에 여전히 표시되지만 실제 장치 트리에 존재하지 않습니다.

임시해결책: 패닉을 방지하려면 Oracle Solaris 10 루트 도메인에서 /etc/system 파일에 다음 행을 추가합니다.

set px:pxtool_cfg_delay_usec=25000

또한 Invalid argument 메시지가 발생하지 않도록 picl 데몬을 새로 고칩니다.

# svcadm refresh picl

광 섬유 채널 물리적 기능이 FMA에 의해 결함 발생 및 사용 안함으로 설정됨

버그 ID 18168525 및 18156291: 광 섬유 채널 PCIe 카드는 NPIV를 지원하고 PCIe 카드와 호환되는 광 섬유 채널 스위치에 연결해야 합니다. 이 구성을 사용하지 않을 경우 format 명령을 사용하거나 가상 기능을 만들거나 삭제하면 물리적 기능이 FMA에 의해 결함이 발생하고 사용 안함으로 설정될 수 있습니다. 이 결함이 발생할 경우 다음과 유사한 메시지가 나타납니다.

SUNW-MSG-ID: PCIEX-8000-0A, TYPE: Fault, VER: 1, SEVERITY: Critical
EVENT-TIME: event-time
PLATFORM: platform-type
SOURCE: eft, REV: 1.16
EVENT-ID: event-ID
DESC: A problem was detected for a PCIEX device.
AUTO_RESPONSE: One or more device instances may be disabled
IMPACT: Loss of services provided by the device instances associated with
this fault
REC-ACTION: Use 'fmadm faulty' to provide a more detailed view of this event.
Please refer to the associated reference document at
http://support.oracle.com/msg/PCIEX-8000-0A for the latest service procedures
and policies regarding this diagnosis.

임시해결책: 카드가 FMA에 의해 결함이 발생한 경우 먼저 연결을 확인하고 카드가 스토리지에 직접 연결되었는지 확인하십시오. 그런 다음 구성과 일치하는 단계를 수행하십시오.

  • 카드가 스토리지에 직접 연결된 경우 – NPIV를 지원하고 PCIe 카드와 호환되는 광 섬유 채널 스위치에 연결하여 광 섬유 채널 PCIe 카드를 올바르게 구성합니다. 그런 다음 fmadm repair 명령을 실행하여 FMA 진단을 무효화합니다.

  • 카드가 스토리지에 직접 연결되지 않은 경우 – 카드를 교체합니다.

I/O 도메인을 중지하거나 시작할 때 컨트롤 도메인 멈춤

 

버그 ID 18030411: I/O 도메인을 자주 그리고 빠르게 연속으로 중지하고 시작할 경우 primary 도메인이 멈출 수 있습니다. 이 동작으로 인해 InfiniBand HCA가 응답을 중지하고 primary 도메인이 멈추게 됩니다.

이 문제가 발생하는 경우 콘솔 또는 messages 파일에서 다음과 유사한 메시지를 볼 수 있습니다.

VF3: PF has failed

Mcxnex: HW2SW_MPT command @ failed: 0000ffff

Hermon: MAD_IFC (port 01) command failed: 0000ffff

WARNING: mcxnex0: Device Error: HCR Timeout waiting for command go bit

복구: 이 문제를 피하려면 I/O 도메인의 불필요한 중지 및 시작 작업을 수행하지 마십시오. 대신 I/O 도메인의 정상적인 종료를 수행하십시오.

임시해결책: primary 도메인이 이러한 이유로 멈출 경우 다음 중 하나의 방법으로 시스템을 재설정하십시오.

  • 도메인 재부트 수행

    primary# ldm stop -r domain-name
  • SP에서 재설정 수행

    -> reset /SYS

광 섬유 채널 가상 기능을 만들 때 콘솔에 경고가 나타남

버그 ID 17623156: 광 섬유 채널 가상 기능을 만들 때 다음 경고를 볼 수 있습니다.

WARNING: kmem_cache_destroy: 'px0_emlxs3_3_cache2'
  (3000383e030) not empty
WARNING: vmem_destroy('px0_emlxs3_3_vmem_top'):
  leaked 262144 identifiers

이러한 메시지는 시스템의 정상적인 작동에 영향을 미치지 않으며 무시할 수 있습니다.

임시해결책: 없음.

광 섬유 채널 물리적 기능 구성 변경을 완료하려면 수 분이 필요함

버그 ID 16397888: 가상 기능을 추가하거나 삭제한 후 광 섬유 채널 물리적 기능에서 다른 가상 기능을 추가하거나 삭제를 시도하려면 최대 5분이 소요될 수 있습니다.

5분이 경과하기 전에 이러한 작업을 수행하려고 시도할 경우 다음과 유사한 메시지와 함께 작업을 실패합니다.

The attempt to offline the pf /SYS/PCI-EM4/IOVFC.PF0 in domain
primary failed.
Error message from svc:/ldoms/agents in domain primary:
CMD_OFFLINE Failed. ERROR: devices or resources are busy.

임시해결책: 광 섬유 채널 물리적 기능에서 다른 IOV 작업을 시도하기 전에 5분을 기다리십시오.

단일 명령으로 모든 필요한 구성 옵션을 수행하려면 ldm create-vf -n max 또는 ldm destroy-vf -n max 명령을 사용하십시오.

Fujitsu M10 서버에 서로 다른 SR-IOV 기능 제한 사항이 있음

Fujitsu M10 서버에서는 특정 PCIe 버스의 PCIe 끝점 장치 및 SR-IOV 가상 기능을 최대 24개의 도메인에 지정할 수 있습니다. 지원되는 SPARC T-Series 및 SPARC M-Series 플랫폼의 경우 최대값은 15개 도메인입니다.

InfiniBand SR-IOV 문제


Caution

주의  - InfiniBand SR-IOV를 Oracle VM Server for SPARC 3.1 환경에 배치하기 전에 이 절의 내용을 읽어보십시오.


    이 절에서는 Oracle VM Server for SPARC 3.1 초기 릴리스의 InfiniBand SR-IOV 기능에 대한 알려진 문제에 대해 설명합니다.

  • InfiniBand 가상 기능이 지정된 Oracle Solaris 11.1.10.5.0 I/O 도메인을 재부트할 경우 해당 루트 도메인에서 가끔씩 패닉이 발생합니다. 버그 ID 17336355를 참조하십시오.

  • InfiniBand 가상 기능이 지정된 Oracle Solaris 10 1/13 I/O 도메인에서 가끔씩 재부트 중 패닉이 발생합니다. I/O 도메인에서는 Oracle Solaris 10 1/13 OS와 필수 패치가 실행됩니다. 버그 ID 17382933, 17361763, 17329218 및 17336035를 참조하십시오.

InfiniBand SR-IOV 작업에 잘못된 메시지가 표시됨

버그 ID 16979993: InfiniBand 장치에서 동적 SR-IOV 작업을 사용하려고 시도하면 혼동스럽고 부적절한 오류 메시지가 표시됩니다.

동적 SR-IOV는 InfiniBand 장치에 지원되지 않습니다.

임시해결책: 다음 절차 중 하나를 수행하여 InfiniBand 가상 기능을 관리합니다.